数据集:
quora
任务:
语言:
计算机处理:
monolingual大小:
100K<n<1M语言创建人:
found批注创建人:
expert-generated源数据集:
original许可:
Quora 数据集由问题对组成,任务是确定这些问题是否是同义词(具有相同的意思)。
“train”的示例如下所示。
{
"is_duplicate": true,
"questions": {
"id": [1, 2],
"text": ["Is this a sample question?", "Is this an example question?"]
}
}
数据字段在所有拆分中相同。
default| name | train |
|---|---|
| default | 404290 |
未知许可证。
未知。
感谢 @thomwolf , @ghomasHudson , @lewtun 添加此数据集。