数据集:
iwslt2017
任务:
计算机处理:
translation大小:
1M<n<10M语言创建人:
expert-generated批注创建人:
crowdsourced源数据集:
original许可:
IWSLT 2017 多语言任务涉及文本翻译,包括零翻译,使用单个 MT 系统在所有方向上进行翻译,包括英语、德语、荷兰语、意大利语和罗马尼亚语。作为非官方任务,英语和阿拉伯语、法语、日语、中文、德语和韩语之间提供传统的双语文本翻译。
"train" 的示例如下。
This example was too long and was cropped:
{
    "translation": "{\"ar\": \"لقد طرت في \\\"القوات الجوية \\\" لمدة ثمان سنوات. والآن أجد نفسي مضطرا لخلع حذائي قبل صعود الطائرة!\", \"en\": \"I flew on Air ..."
}
 iwslt2017-de-en "train" 的示例如下。
{
    "translation": {
        "de": "Es ist mir wirklich eine Ehre, zweimal auf dieser Bühne stehen zu dürfen. Tausend Dank dafür.",
        "en": "And it's truly a great honor to have the opportunity to come to this stage twice; I'm extremely grateful."
    }
}
 iwslt2017-en-ar "train" 的示例如下。
This example was too long and was cropped:
{
    "translation": "{\"ar\": \"لقد طرت في \\\"القوات الجوية \\\" لمدة ثمان سنوات. والآن أجد نفسي مضطرا لخلع حذائي قبل صعود الطائرة!\", \"en\": \"I flew on Air ..."
}
 iwslt2017-en-de "validation" 的示例如下。
{
    "translation": {
        "de": "Die nächste Folie, die ich Ihnen zeige, ist eine Zeitrafferaufnahme was in den letzten 25 Jahren passiert ist.",
        "en": "The next slide I show you will be  a rapid fast-forward of what's happened over the last 25 years."
    }
}
 iwslt2017-en-fr "validation" 的示例如下。
{
    "translation": {
        "en": "But this understates the seriousness of this particular problem  because it doesn't show the thickness of the ice.",
        "fr": "Mais ceci tend à amoindrir le problème parce qu'on ne voit pas l'épaisseur de la glace."
    }
}
 所有拆分的数据字段相同。
iwslt2017-ar-en| name | train | validation | test | 
|---|---|---|---|
| iwslt2017-ar-en | 231713 | 888 | 8583 | 
| iwslt2017-de-en | 206112 | 888 | 8079 | 
| iwslt2017-en-ar | 231713 | 888 | 8583 | 
| iwslt2017-en-de | 206112 | 888 | 8079 | 
| iwslt2017-en-fr | 232825 | 890 | 8597 | 
Creative Commons BY-NC-ND
请参阅 (TED Talks Usage Policy)[ https://www.ted.com/about/our-organization/our-policies-terms/ted-talks-usage-policy] ]。
@inproceedings{cettolo-etal-2017-overview,
    title = "Overview of the {IWSLT} 2017 Evaluation Campaign",
    author = {Cettolo, Mauro  and
      Federico, Marcello  and
      Bentivogli, Luisa  and
      Niehues, Jan  and
      St{\"u}ker, Sebastian  and
      Sudoh, Katsuhito  and
      Yoshino, Koichiro  and
      Federmann, Christian},
    booktitle = "Proceedings of the 14th International Conference on Spoken Language Translation",
    month = dec # " 14-15",
    year = "2017",
    address = "Tokyo, Japan",
    publisher = "International Workshop on Spoken Language Translation",
    url = "https://aclanthology.org/2017.iwslt-1.1",
    pages = "2--14",
}