数据集:
Datatang/mixed_speech_chinese_english
该数据集包含2000小时的中英混合语音。数据来自中国26个省份的说话者,例如河南、山西、四川、湖南、福建等。内容涵盖了通用场景和多种人机交互场景,如音乐、娱乐、旅行、日常生活。数据涵盖了超过30,000个英文单词。句子准确率超过97%。 更多详细信息,请参考链接: https://bit.ly/39UzIwI
自动语音识别,音频说话人识别:该数据集可用于训练自动语音识别(ASR)模型。
中文,英文
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
源语言制作人是谁?[需要更多信息]
[需要更多信息]
标注者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
商业许可证: https://drive.google.com/file/d/1saDCPm74D4UWfBL17VbkTsZLGfpOQj1J/view?usp=sharing
[需要更多信息]