数据集:
NbAiLab/norec_agg
任务:
语言:
计算机处理:
monolingual大小:
1K<n<10K语言创建人:
found批注创建人:
expert-generated源数据集:
original预印本库:
arxiv:2011.02686许可:
Aggregated NoRec_fine:挪威细粒度情感数据集。该数据集由北欧语言处理实验室通过聚合NoReC_fine中的细粒度注释并删除具有冲突或无情感的句子创建。
[需要更多信息]
数据集中的文本为挪威语。
数据集中的一个实例示例。
{'label': 0, 'text': 'Verre er det med slagsmålene .'}
数据集分为训练集、验证集和测试集,大小如下:
| Tain | Valid | Test | |
|---|---|---|---|
| Number of examples | 2675 | 516 | 417 |
此数据集主要基于L. Øvrelid、P. Mæhlum、J. Barnes和E. Velldal在LREC 2020上接受的论文"A Fine-Grained Sentiment Dataset for Norwegian"中描述的原始数据,但我们已经对另外3476个句子进行了注释,增加了数据集的总体大小和范围。
本作品采用知识共享署名4.0国际许可协议
@misc{sheng2020investigating,
title={Investigating Societal Biases in a Poetry Composition System},
author={Emily Sheng and David Uthus},
year={2020},
eprint={2011.02686},
archivePrefix={arXiv},
primaryClass={cs.CL}
}