模型:
Helsinki-NLP/opus-mt-en-sit
任务:
许可:
源语言组:英语
目标语言组:汉藏语系语言
OPUS自述文件: eng-sit
模型:transformer
源语言:eng
目标语言:bod brx brx_Latn cjy_Hans cjy_Hant cmn cmn_Hans cmn_Hant gan lzh lzh_Hans mya nan wuu yue yue_Hans yue_Hant zho zho_Hans zho_Hant
模型:transformer
预处理:标准化 + SentencePiece(spm32k,spm32k)
需要使用句子起始语言标记,格式为<<id><<(id = 目标语言有效ID)
下载原始权重: opus2m-2020-08-01.zip
测试集翻译: opus2m-2020-08-01.test.txt
测试集评分: opus2m-2020-08-01.eval.txt
| testset | BLEU | chr-F |
|---|---|---|
| newsdev2017-enzh-engzho.eng.zho | 23.5 | 0.217 |
| newstest2017-enzh-engzho.eng.zho | 23.2 | 0.223 |
| newstest2018-enzh-engzho.eng.zho | 25.0 | 0.230 |
| newstest2019-enzh-engzho.eng.zho | 20.2 | 0.225 |
| Tatoeba-test.eng-bod.eng.bod | 0.4 | 0.147 |
| Tatoeba-test.eng-brx.eng.brx | 0.5 | 0.012 |
| Tatoeba-test.eng.multi | 25.7 | 0.223 |
| Tatoeba-test.eng-mya.eng.mya | 0.2 | 0.222 |
| Tatoeba-test.eng-zho.eng.zho | 29.2 | 0.249 |
hf_name: eng-sit
源语言:eng
目标语言:sit
OPUS自述文件链接: https://github.com/Helsinki-NLP/Tatoeba-Challenge/tree/master/models/eng-sit/README.md
原始存储库:Tatoeba-Challenge
标签:['translation']
语言:['en', 'sit']
源语言组成部分:{'eng'}
目标语言组成部分:set()
源多语言:False
目标多语言:True
预处理:标准化 + SentencePiece(spm32k,spm32k)
模型链接: https://object.pouta.csc.fi/Tatoeba-MT-models/eng-sit/opus2m-2020-08-01.zip
测试集链接: https://object.pouta.csc.fi/Tatoeba-MT-models/eng-sit/opus2m-2020-08-01.test.txt
源语言alpha3代码:eng
目标语言alpha3代码:sit
短语对:en-sit
chrF2得分:0.223
bleu得分:25.7
短文惩罚:0.907
参考长度:109538.0
源语言名称:English
目标语言名称:汉藏语系语言
训练日期:2020-08-01
源语言alpha2代码:en
目标语言alpha2代码:sit
首选旧版本:False
长语言对:eng-sit
helsinki_git_sha: 480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535
transformers_git_sha: 2207e5d8cb224e954a7cba69fa4ac2309e9ff30b
端口机器:brutasse
端口时间:2020-08-21-14:41