数据集:
bsd_ja_en
任务:
计算机处理:
translation大小:
10K<n<100K语言创建人:
expert-generated批注创建人:
expert-generated源数据集:
original许可:
这是 Business Scene Dialogue(BSD)数据集,一个包含了各种商业场景的日英平行语料库,其中包含了书面对话。
该数据集经过了以下3个步骤的构建:
一半的单语对话情景用日语编写,另一半用英语编写。
[需要更多信息]
英语,日语。
每个实例包含一个对话标识符、表示其在对话中的位置的句子编号、英语和日语中的发言者姓名、英语和日语中的文本、原始语言、情景标签以及情景标题。
{
"id": "190315_E004_13",
"no": 14,
"speaker": "Mr. Sam Lee",
"ja_speaker": "サム リーさん",
"en_sentence": "Would you guys consider a different scheme?",
"ja_sentence": "別の事業案も考慮されますか?",
"original_language": "en",
"tag": "phone call",
"title": "Phone: Review spec and scheme"
}
[需要更多信息]
[需要更多信息]
谁是源语言的生成者?[需要更多信息]
[需要更多信息]
谁是注释者?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
此数据集仅供研究目的使用。请查看数据集许可证以获取更多信息。
[需要更多信息]
该数据集采用Creative Commons Attribution-NonCommercial-ShareAlike(CC BY-NC-SA)许可协议发布。
@inproceedings{rikters-etal-2019-designing,
title = "Designing the Business Conversation Corpus",
author = "Rikters, Mat{\=\i}ss and
Ri, Ryokan and
Li, Tong and
Nakazawa, Toshiaki",
booktitle = "Proceedings of the 6th Workshop on Asian Translation",
month = nov,
year = "2019",
address = "Hong Kong, China",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/D19-5204",
doi = "10.18653/v1/D19-5204",
pages = "54--61"
}
感谢 @j-chim 添加了这个数据集。