Voxtral Transcribe 2 提供每分钟 0.003 美元的语音识别服务

登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

所以，能动手就别吵吵了

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

常用工具

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

2026年02月06日由 alex 发表 4948 0

Mistral AI 推出 Voxtral Transcribe 2，在语音识别定价上压低竞争对手。第二代语音识别模型起步速度为每分钟0.003美元，据Mistral称，其准确率优于GPT-4o mini Transcribe、Gemini 2.5 Flash和Deepgram Nova。该型号家族有两个变体：Voxtral Mini Transcribe V2，用于处理较大音频文件，以及适用于延迟低于200毫秒的实时应用的Voxtral Realtime。Voxtral Realtime价格是其两倍，采用专有的流媒体架构，音频到达时自动转录——专为语音助手、实时字幕或呼叫中心分析设计。

屏幕截图2026-02-06095241

两款机型均支持13种语言，包括德语、英语和中文。新功能包括扬声器识别、字级时间戳，以及支持长达三小时的录音。Voxtral Realtime 作为开放权重版本在 Apache 2.0 的 Hugging Face 和 API 上可用，而 Voxtral Mini Transcribe V2 仅通过 Le Chat、Mistral API 和游乐场访问。Mistral 于 2025 年 7 月发布了第一代 Voxtral 版本。

文章来源：https://the-decoder.com/voxtral-transcribe-2-offers-speech-recognition-at-0-003-per-minute/#google_vignette

标签：

Mistral AI

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇英伟达RTX 50系列超级更新推迟，RTX 60系列可能会错过2027年

下一篇 Crypto.com在超级碗前以7000万美元购入AI.com域名

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

Meta Muse Spark 1.1：百万上下文瞄准多智能体