数据集:
xsum
任务:
语言:
计算机处理:
monolingual大小:
100K<n<1M语言创建人:
found批注创建人:
found源数据集:
original预印本库:
arxiv:1808.08745许可:
极限摘要(XSum)数据集。
有三个特征:
'验证'的一个示例如下。
{
"document": "some-body",
"id": "29750031",
"summary": "some-sentence"
}
所有拆分之间的数据字段是相同的。
default| name | train | validation | test |
|---|---|---|---|
| default | 204045 | 11332 | 11334 |
@article{Narayan2018DontGM,
title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
journal={ArXiv},
year={2018},
volume={abs/1808.08745}
}
感谢 @thomwolf , @lewtun , @mariamabarham , @jbragg , @lhoestq , @patrickvonplaten 添加了这个数据集。