数据集:

SetFit/toxic_conversations

英文

有害对话

这是 Jigsaw Unintended Bias in Toxicity Classification dataset 的一个版本。它包含来自 Civil Comments 平台的评论,以及如果评论是有害的话的注释。

每个示例都有10位注释员进行注释,根据任务页面的建议,当目标值 >= 0.5 时,将一个评论标记为有害。

数据集不均衡,只有约8%的评论被标记为有害。