数据集:
crows_pairs
任务:
子任务:
text-scoring语言:
计算机处理:
monolingual大小:
1K<n<10K语言创建人:
crowdsourced批注创建人:
crowdsourced源数据集:
original其他:
bias-evaluation许可:
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
Initial Data Collection and Normalization[需要更多信息]
Who are the source language producers?[需要更多信息]
[需要更多信息]
Annotation process[需要更多信息]
Who are the annotators?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
CrowS-Pairs在 Creative Commons Attribution-ShareAlike 4.0 International License 下许可。
它使用了来自 ROCStories corpora 和 MNLI 的小说部分的提示。有关更多详细信息,请参阅它们的论文。
@inproceedings{nangia-etal-2020-crows,
title = "{C}row{S}-Pairs: A Challenge Dataset for Measuring Social Biases in Masked Language Models",
author = "Nangia, Nikita and
Vania, Clara and
Bhalerao, Rasika and
Bowman, Samuel R.",
booktitle = "Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP)",
month = nov,
year = "2020",
address = "Online",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2020.emnlp-main.154",
doi = "10.18653/v1/2020.emnlp-main.154",
pages = "1953--1967",
}
感谢 @patil-suraj 添加了这个数据集。