数据集:
id_panl_bppt
任务:
计算机处理:
translation大小:
10K<n<100K语言创建人:
expert-generated批注创建人:
expert-generated源数据集:
original许可:
这是由BPPT(印尼技术评估与应用机构)为PAN本地化项目(亚洲地区发展本地语言计算能力的区域性倡议)创建的用于多领域翻译系统的平行文本语料库。该数据集包含约24K个句子,分为4个不同主题(经济、国际、科学技术和体育)。
[需要更多信息]
印度尼西亚语
[需要更多信息]
数据集的一个示例:
{
'id': '0',
'topic': 0,
'translation':
{
'en': 'Minister of Finance Sri Mulyani Indrawati said that a sharp correction of the composite
inde x by up to 4 pct in Wedenesday?s trading was a mere temporary effect of regional factors like
decline in plantation commodity prices and the financial crisis in Thailand.',
'id': 'Menteri Keuangan Sri Mulyani mengatakan koreksi tajam pada Indeks Harga Saham Gabungan
IHSG hingga sekitar 4 persen dalam perdagangan Rabu 10/1 hanya efek sesaat dari faktor-faktor regional
seperti penurunan harga komoditi perkebunan dan krisis finansial di Thailand.'
}
}
该数据集被分为训练集、验证集和测试集。
[需要更多信息]
[需要更多信息]
语言源头制作人是谁?[需要更多信息]
[需要更多信息]
注解者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
@inproceedings{id_panl_bppt,
author = {PAN Localization - BPPT},
title = {Parallel Text Corpora, English Indonesian},
year = {2009},
url = {http://digilib.bppt.go.id/sampul/p92-budiono.pdf},
}
感谢 @cahya-wirawan 添加了这个数据集。