英文

eng-sit

  • 源语言组:英语

  • 目标语言组:汉藏语系语言

  • OPUS自述文件: eng-sit

  • 模型:transformer

  • 源语言:eng

  • 目标语言:bod brx brx_Latn cjy_Hans cjy_Hant cmn cmn_Hans cmn_Hant gan lzh lzh_Hans mya nan wuu yue yue_Hans yue_Hant zho zho_Hans zho_Hant

  • 模型:transformer

  • 预处理:标准化 + SentencePiece(spm32k,spm32k)

  • 需要使用句子起始语言标记,格式为<<id><<(id = 目标语言有效ID)

  • 下载原始权重: opus2m-2020-08-01.zip

  • 测试集翻译: opus2m-2020-08-01.test.txt

  • 测试集评分: opus2m-2020-08-01.eval.txt

基准测试

testset BLEU chr-F
newsdev2017-enzh-engzho.eng.zho 23.5 0.217
newstest2017-enzh-engzho.eng.zho 23.2 0.223
newstest2018-enzh-engzho.eng.zho 25.0 0.230
newstest2019-enzh-engzho.eng.zho 20.2 0.225
Tatoeba-test.eng-bod.eng.bod 0.4 0.147
Tatoeba-test.eng-brx.eng.brx 0.5 0.012
Tatoeba-test.eng.multi 25.7 0.223
Tatoeba-test.eng-mya.eng.mya 0.2 0.222
Tatoeba-test.eng-zho.eng.zho 29.2 0.249

系统信息: