数据集:
iwslt2017
任务:
计算机处理:
translation大小:
1M<n<10M语言创建人:
expert-generated批注创建人:
crowdsourced源数据集:
original许可:
IWSLT 2017 多语言任务涉及文本翻译,包括零翻译,使用单个 MT 系统在所有方向上进行翻译,包括英语、德语、荷兰语、意大利语和罗马尼亚语。作为非官方任务,英语和阿拉伯语、法语、日语、中文、德语和韩语之间提供传统的双语文本翻译。
"train" 的示例如下。
This example was too long and was cropped:
{
"translation": "{\"ar\": \"لقد طرت في \\\"القوات الجوية \\\" لمدة ثمان سنوات. والآن أجد نفسي مضطرا لخلع حذائي قبل صعود الطائرة!\", \"en\": \"I flew on Air ..."
}
iwslt2017-de-en "train" 的示例如下。
{
"translation": {
"de": "Es ist mir wirklich eine Ehre, zweimal auf dieser Bühne stehen zu dürfen. Tausend Dank dafür.",
"en": "And it's truly a great honor to have the opportunity to come to this stage twice; I'm extremely grateful."
}
}
iwslt2017-en-ar "train" 的示例如下。
This example was too long and was cropped:
{
"translation": "{\"ar\": \"لقد طرت في \\\"القوات الجوية \\\" لمدة ثمان سنوات. والآن أجد نفسي مضطرا لخلع حذائي قبل صعود الطائرة!\", \"en\": \"I flew on Air ..."
}
iwslt2017-en-de "validation" 的示例如下。
{
"translation": {
"de": "Die nächste Folie, die ich Ihnen zeige, ist eine Zeitrafferaufnahme was in den letzten 25 Jahren passiert ist.",
"en": "The next slide I show you will be a rapid fast-forward of what's happened over the last 25 years."
}
}
iwslt2017-en-fr "validation" 的示例如下。
{
"translation": {
"en": "But this understates the seriousness of this particular problem because it doesn't show the thickness of the ice.",
"fr": "Mais ceci tend à amoindrir le problème parce qu'on ne voit pas l'épaisseur de la glace."
}
}
所有拆分的数据字段相同。
iwslt2017-ar-en| name | train | validation | test |
|---|---|---|---|
| iwslt2017-ar-en | 231713 | 888 | 8583 |
| iwslt2017-de-en | 206112 | 888 | 8079 |
| iwslt2017-en-ar | 231713 | 888 | 8583 |
| iwslt2017-en-de | 206112 | 888 | 8079 |
| iwslt2017-en-fr | 232825 | 890 | 8597 |
Creative Commons BY-NC-ND
请参阅 (TED Talks Usage Policy)[ https://www.ted.com/about/our-organization/our-policies-terms/ted-talks-usage-policy] ]。
@inproceedings{cettolo-etal-2017-overview,
title = "Overview of the {IWSLT} 2017 Evaluation Campaign",
author = {Cettolo, Mauro and
Federico, Marcello and
Bentivogli, Luisa and
Niehues, Jan and
St{\"u}ker, Sebastian and
Sudoh, Katsuhito and
Yoshino, Koichiro and
Federmann, Christian},
booktitle = "Proceedings of the 14th International Conference on Spoken Language Translation",
month = dec # " 14-15",
year = "2017",
address = "Tokyo, Japan",
publisher = "International Workshop on Spoken Language Translation",
url = "https://aclanthology.org/2017.iwslt-1.1",
pages = "2--14",
}