数据集:
sberquad
任务:
子任务:
extractive-qa语言:
计算机处理:
monolingual大小:
10K<n<100K批注创建人:
crowdsourced源数据集:
original预印本库:
arxiv:1912.09723许可:
Sber 问答数据集(SberQuAD)是一个阅读理解数据集,由众包工作者在一组维基百科文章上提出问题,每个问题的答案是相应阅读段落中的一段文本或片段,或者问题可能无法回答。俄语原始模型在2017年的 Sberbank 数据科学之旅中呈现。
[需要更多信息]
俄语
{
"context": "Первые упоминания о строении человеческого тела встречаются в Древнем Египте...",
"id": 14754,
"qas": [
{
"id": 60544,
"question": "Где встречаются первые упоминания о строении человеческого тела?",
"answers": [{"answer_start": 60, "text": "в Древнем Египте"}],
}
]
}
| name | train | validation | test |
|---|---|---|---|
| plain_text | 45328 | 5036 | 23936 |
[需要更多信息]
[需要更多信息]
源语言生产者是谁?[需要更多信息]
[需要更多信息]
注释者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
@InProceedings{sberquad,
doi = {10.1007/978-3-030-58219-7_1},
author = {Pavel Efimov and
Andrey Chertok and
Leonid Boytsov and
Pavel Braslavski},
title = {SberQuAD -- Russian Reading Comprehension Dataset: Description and Analysis},
booktitle = {Experimental IR Meets Multilinguality, Multimodality, and Interaction},
year = {2020},
publisher = {Springer International Publishing},
pages = {3--15}
}
感谢 @alenusch 添加此数据集。