数据集:
rotten_tomatoes
任务:
语言:
计算机处理:
monolingual大小:
1K<n<10K语言创建人:
crowdsourced批注创建人:
crowdsourced源数据集:
original许可:
电影评论数据集。这是一个包含5331个正面和5331个负面处理过的Rotten Tomatoes电影评论句子的数据集。此数据首次用于BoPang和Lillian Lee的论文"Seeing stars: Exploiting class relationships for sentiment categorization with respect to rating scales.",ACL会议论文,2005年。
'validation'的一个示例如下所示。
{
    "label": 1,
    "text": "Sometimes the days and nights just drag on -- it 's the morning that make me feel alive . And I have one thing to thank for that : pancakes . "
}
 所有拆分的数据字段都是相同的。
default| name | train | validation | test | 
|---|---|---|---|
| default | 8530 | 1066 | 1066 | 
@InProceedings{Pang+Lee:05a,
  author =       {Bo Pang and Lillian Lee},
  title =        {Seeing stars: Exploiting class relationships for sentiment
                  categorization with respect to rating scales},
  booktitle =    {Proceedings of the ACL},
  year =         2005
}
 感谢 @thomwolf 、 @jxmorris12 添加此数据集。