数据集:

yoruba_wordsim353

语言:

en yo

计算机处理:

multilingual

大小:

n<1K

语言创建人:

expert-generated

批注创建人:

crowdsourced

源数据集:

original
英文

yoruba_wordsim353 的数据集卡片

数据集摘要

A translation of the word pair similarity dataset wordsim-353 to Yorùbá.

支持的任务和排行榜

[需要更多信息]

语言

Yorùbá (ISO 639-1: yo)

数据集结构

数据实例

一个实例包括一对单词及它们的相似度。数据集包含了原始的英文单词(来自 wordsim-353 数据集)以及它们翻译成 Yorùbá 语言。

数据字段

  • english1:一对中的第一个单词;原始的英文单词
  • english2:一对中的第二个单词;原始的英文单词
  • yoruba1:一对中的第一个单词;翻译成 Yorùbá 语言
  • yoruba2:一对中的第二个单词;翻译成 Yorùbá 语言
  • similarity:根据英文数据集的相似度评分

数据拆分

[需要更多信息]

数据集创建

策划理由

[需要更多信息]

源数据

[需要更多信息]

Who are the source language producers?

[需要更多信息]

标注

[需要更多信息]

Who are the annotators?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据时的注意事项

数据集的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

附加信息

数据集创建者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

[需要更多信息]

贡献

Thanks to @michael-aloys for adding this dataset.