数据集:
Datatang/multi_language
该数据集包含25000小时的多语言朗读语音数据。由母语使用者录制,涵盖英语、法语、德语、俄语、西班牙语、葡萄牙语、意大利语、日语、韩语、印地语、越南语、塔加路语、泰语等。记录内容丰富,涵盖经济、娱乐、新闻、口语、数字和字母等多个类别。格式为16kHz、16bit、无损压缩wav、单声道。句子准确率超过95%。详细信息请参考链接: https://bit.ly/39UzIwI
自动语音识别(ASR)、音频说话人识别:该数据集可用于训练自动语音识别(ASR)模型。
英语、法语、德语、俄语、西班牙语、葡萄牙语、意大利语、日语、韩语、印地语、越南语、塔加路语、泰语等。
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
源语言制作者是谁?[需要更多信息]
[需要更多信息]
注释者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
商业许可证: https://drive.google.com/file/d/1saDCPm74D4UWfBL17VbkTsZLGfpOQj1J/view?usp=sharing
[需要更多信息]