ElevenLabs和谷歌主导了Artificial Analysis更新后的语音转文字基准测试

登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

所以，能动手就别吵吵了

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

常用工具

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

2026年03月02日由 alex 发表 611 0

Artificial Analysis 发布了其 AA-WER 语音转文字基准测试的 2.0 版本。ElevenLabs的Scribe v2以仅2.3%的词误率领先，其次是谷歌的Gemini 3 Pro（2.9%）和Mistral的Voxtral Small（3.0%）。谷歌的Gemini 3 Flash（3.1%）和ElevenLabs的旧版Scribe v1（3.2%）紧随其后。值得注意的是，谷歌并未专门训练转录——强有力的结果来自Gemini的通用多模态能力。OpenAI广受欢迎的开源Whisper Large v3（4.2%）位列中游，阿里巴巴的Qwen3 ASR Flash（5.9%）、亚马逊的Nova 2 Omni（6.0%）和Rev AI（6.1%）位居末尾。

AA_speech_AI_benchmarks_032026-2

结果在针对语音助手的AA-AgentTalk单独测试中依然适用：Scribe v2（1.6%）和Gemini 3 Pro（1.7%）遥遥领先，AssemblyAI的Universal-3 Pro以2.3%排名第三。

AA_speech_AI_benchmarks_032026-1

文章来源：https://the-decoder.com/elevenlabs-and-google-dominate-artificial-analysis-updated-speech-to-text-benchmark/

标签：

谷歌 AI

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇一只带有小狗眼的机械臂只是联想新的桌面AI概念之一

下一篇 OpenAI以7300亿美元估值筹集1100亿美元，扩大与AWS和Nvidia的合作伙伴关系

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术