数据集:
persiannlp/parsinlu_entailment
语言:
计算机处理:
monolingual大小:
1K<n<10K语言创建人:
expert-generated批注创建人:
expert-generated源数据集:
extended|translated|mnli预印本库:
arxiv:2012.06154许可:
波斯文本蕴含任务(判断sent1是否蕴含sent2)。这些问题部分翻译自SNLI数据集,部分由专家标注者生成。
[需要更多信息]
文本数据集为波斯文(fa)。
以下是数据集中的一个示例:
{
"sent1": "سالها است که کنگره در تلاش است تا اثربخشی مدیریت اطلاعات و فناوری را در دولت فدرال افزایش دهد.",
"sent2": "کنگره بودجه ویژه ای برای مدیریت اطلاعات و فناوری در دولت فدرال دارد.",
"label": "n",
"category": "translation-train"
}
训练/验证/测试拆分包含756/271/1751个样本。
详细信息请查看 the corresponding draft 。
[需要更多信息]
谁是源语言生成者?[需要更多信息]
[需要更多信息]
谁是标注者?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
CC BY-NC-SA 4.0许可。
@article{huggingface:dataset,
title = {ParsiNLU: A Suite of Language Understanding Challenges for Persian},
authors = {Khashabi, Daniel and Cohan, Arman and Shakeri, Siamak and Hosseini, Pedram and Pezeshkpour, Pouya and Alikhani, Malihe and Aminnaseri, Moin and Bitaab, Marzieh and Brahman, Faeze and Ghazarian, Sarik and others},
year={2020}
journal = {arXiv e-prints},
eprint = {2012.06154},
}
感谢 @danyaljj 添加此数据集。