ElevenLabs和谷歌主导了Artificial Analysis更新后的语音转文字基准测试

2026年03月02日 由 alex 发表 245 0

Artificial Analysis 发布了其 AA-WER 语音转文字基准测试的 2.0 版本。ElevenLabs的Scribe v2以仅2.3%的词误率领先,其次是谷歌的Gemini 3 Pro(2.9%)和Mistral的Voxtral Small(3.0%)。谷歌的Gemini 3 Flash(3.1%)和ElevenLabs的旧版Scribe v1(3.2%)紧随其后。值得注意的是,谷歌并未专门训练转录——强有力的结果来自Gemini的通用多模态能力。OpenAI广受欢迎的开源Whisper Large v3(4.2%)位列中游,阿里巴巴的Qwen3 ASR Flash(5.9%)、亚马逊的Nova 2 Omni(6.0%)和Rev AI(6.1%)位居末尾。


AA_speech_AI_benchmarks_032026-2


结果在针对语音助手的AA-AgentTalk单独测试中依然适用:Scribe v2(1.6%)和Gemini 3 Pro(1.7%)遥遥领先,AssemblyAI的Universal-3 Pro以2.3%排名第三。


AA_speech_AI_benchmarks_032026-1

文章来源:https://the-decoder.com/elevenlabs-and-google-dominate-artificial-analysis-updated-speech-to-text-benchmark/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消