讽刺检测数据集

这个数据集从两个新闻网站收集:洋葱和赫芬顿邮报。《洋葱》(美国洋葱新闻网站)对时事进行讽刺,而《赫芬顿邮报》(HuffPost)则报道真实和非讽刺新闻。

大小:2 MB下载次数:0

立即下载 所需积分:0

新闻类别数据集

该数据集包含从《赫芬顿邮报》 (HuffPost)获得的2012至2018年约20万条新闻标题。它包含诸如新闻类别、新闻标题、新闻故事的简短描述、出版日期等详细信息。

大小:25 MB下载次数:1

立即下载 所需积分:0

AudioSet

AudioSet数据集分为三个不相交的集合:平衡评估集,平衡训练集和不平衡训练集。包括632个音频事件类的扩展本体,以及从YouTube视频中提取的2,084,320个人类标记的10秒声音片段的集合。

大小:23.55 MB下载次数:5

立即下载 所需积分:0

TedLium

语音识别训练语料来自TED演讲

大小:34.26 GB下载次数:197

立即下载 所需积分:0