数据集:
Datatang/multi_language_conversation
数据集包含12000个小时的多语言对话语音数据。数据由母语为英语、法语、德语、俄语、西班牙语、日语、韩语、印地语、越南语等的说话者录制,涵盖了常见话题,以确保对话的流畅和自然。格式为16kHz、16bit、无压缩wav、单声道。句子准确率超过95%。更多详细信息,请参考链接: https://bit.ly/39UzIwI
自动语音识别,音频说话人识别:该数据集可以用于训练自动语音识别(ASR)模型。
英语、法语、德语、俄语、西班牙语、日语、韩语、印地语、越南语等。
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
谁是源语言的生产者?[需要更多信息]
[需要更多信息]
注释者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
商业许可: https://drive.google.com/file/d/1saDCPm74D4UWfBL17VbkTsZLGfpOQj1J/view?usp=sharing
[需要更多信息]