AudioSet

AudioSet数据集分为三个不相交的集合:平衡评估集,平衡训练集和不平衡训练集。包括632个音频事件类的扩展本体,以及从YouTube视频中提取的2,084,320个人类标记的10秒声音片段的集合。

大小:23.55 MB下载次数:3

立即下载 所需积分:0

TedLium

语音识别训练语料来自TED演讲

大小:34.26 GB下载次数:195

立即下载 所需积分:0