数据集:
Datatang/mandarin_chinese
该数据集包含15000小时的普通话语音数据。这些数据来自中国33个省份的本地普通话使用者,涵盖多种场景和环境。数据格式为16kHz、16bit、无压缩的wav文件,单声道。句子准确率超过97%。详情请参考链接: https://bit.ly/39UzIwI
自动语音识别,语音说话人识别:该数据集可用于训练自动语音识别(ASR)模型。
普通话
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
谁是源语言的生产者?[需要更多信息]
[需要更多信息]
谁是标注者?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
商业许可证: https://drive.google.com/file/d/1saDCPm74D4UWfBL17VbkTsZLGfpOQj1J/view?usp=sharing
[需要更多信息]