数据集:
xsum
任务:
语言:
计算机处理:
monolingual大小:
100K<n<1M语言创建人:
found批注创建人:
found源数据集:
original预印本库:
arxiv:1808.08745许可:
极限摘要(XSum)数据集。
有三个特征:
'验证'的一个示例如下。
{
    "document": "some-body",
    "id": "29750031",
    "summary": "some-sentence"
}
 所有拆分之间的数据字段是相同的。
default| name | train | validation | test | 
|---|---|---|---|
| default | 204045 | 11332 | 11334 | 
@article{Narayan2018DontGM,
  title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
  author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
  journal={ArXiv},
  year={2018},
  volume={abs/1808.08745}
}
 感谢 @thomwolf , @lewtun , @mariamabarham , @jbragg , @lhoestq , @patrickvonplaten 添加了这个数据集。