数据集:
Datatang/accented_mandarin
这个数据集包含了2000小时的汉语普通话语音数据。数据是从河南、山西、四川、湖南、福建等26个省份的当地讲者收集而来。内容涵盖了通用类别、人机交互、智能家居指令与控制、车载应用、数字等。格式是16kHz,16位,无压缩wav,单声道。句子准确率超过97%。详细信息请参考链接: https://bit.ly/39UzIwI
automatic-speech-recognition, audio-speaker-identification: 该数据集可用于训练自动语音识别(ASR)模型。
普通话的口音
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
源语言制作者是谁?[需要更多信息]
[需要更多信息]
标注者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
商业许可证: https://drive.google.com/file/d/1saDCPm74D4UWfBL17VbkTsZLGfpOQj1J/view?usp=sharing
[需要更多信息]