模型:

facebook/wav2vec2-large-100k-voxpopuli

英文

Wav2Vec2-Large-VoxPopuli

Facebook's Wav2Vec2 VoxPopuli corpus 的 100k 未标记子集上进行预训练的大型模型。

注意:此模型没有分词器,因为它仅在音频上进行了预训练。为了使用该模型进行语音识别,需要创建一个分词器,并且需要在带标签的文本数据上对模型进行微调。详细了解如何微调该模型,请参阅 this blog

论文: VoxPopuli: A Large-Scale Multilingual Speech Corpus for Representation Learning, Semi-Supervised Learning and Interpretation

作者:来自Facebook AI的Changhan Wang,Morgane Riviere,Ann Lee,Anne Wu,Chaitanya Talnikar,Daniel Haziza,Mary Williamson,Juan Pino,Emmanuel Dupoux

更多信息,请访问官方网站: here

微调

有关如何在特定语言上对该模型进行微调的详细信息,请参阅 this blog 。请注意,应将 "facebook/wav2vec2-large-xlsr-53" 替换为此检查点进行微调。