数据集:
sst2
任务:
语言:
计算机处理:
monolingual大小:
10K<n<100K语言创建人:
found批注创建人:
crowdsourced源数据集:
original许可:
斯坦福情感树库是一个包含完全标记的句法树的语料库,可以对语言中情感的组合效应进行全面分析。该语料库基于Pang和Lee(2005年)介绍的数据集,包含11,855个从电影评论中提取的单个句子。它使用斯坦福解析器进行解析,并包含来自这些解析树的215,154个唯一短语,每个短语由3个人类评判员进行注释。
完整句子的二元分类实验(将中性句子丢弃,将负面或稍微负面的句子与稍微正面或正面的句子进行区分)将数据集称为SST-2或SST二进制数据集。
数据集中的文本为英语(en)。
{'idx': 0,
'sentence': 'hide new secretions from the parental units ',
'label': 0}
| train | validation | test | |
|---|---|---|---|
| Number of examples | 67349 | 872 | 1821 |
[需要更多信息]
[需要更多信息]
语言生成者是谁?Tomatometmakorelim
[需要更多信息]
注释者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
未知
@inproceedings{socher-etal-2013-recursive,
title = "Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank",
author = "Socher, Richard and
Perelygin, Alex and
Wu, Jean and
Chuang, Jason and
Manning, Christopher D. and
Ng, Andrew and
Potts, Christopher",
booktitle = "Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing",
month = oct,
year = "2013",
address = "Seattle, Washington, USA",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/D13-1170",
pages = "1631--1642",
}
感谢 @albertvillanova 添加此数据集。