数据集:
capes
任务:
计算机处理:
multilingual大小:
1M<n<10M语言创建人:
found批注创建人:
found源数据集:
original许可:
从巴西高等教育改善协调委员会(CAPES)网站收集了一份包含英语和葡萄牙语论文摘要的平行语料库。该语料库针对所有语言对进行了句子对齐。使用Hunalign算法对约240,000个文档进行了收集和对齐。
底层任务是机器翻译。
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
源语言制造者是谁?[需要更多信息]
[需要更多信息]
注释者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
@inproceedings{soares2018parallel,
  title={A Parallel Corpus of Theses and Dissertations Abstracts},
  author={Soares, Felipe and Yamashita, Gabrielli Harumi and Anzanello, Michel Jose},
  booktitle={International Conference on Computational Processing of the Portuguese Language},
  pages={345--352},
  year={2018},
  organization={Springer}
}
 感谢 @patil-suraj 添加了该数据集。