Mistral AI 的 Devstral 2 是一个开放权重氛围编码模型,旨在与顶级专有系统竞争

2025年12月10日 由 alex 发表 2049 0

法国人工智能初创公司Mistral AI通过推出Devstral 2新模型,进军氛围编码市场,专为处理高级编码任务而打造。


今天发布的Devstral 2是一款参数达1230亿的模型,配备了自主软件工程能力,公司称其可与顶级专有vie编码系统媲美,同时成本降低近85%。


Devstral 2 将与 Mistral Vibe 同步发布,Mistral Vibe 是一款新的命令行界面,允许开发者访问模型并使用自然语言提示执行复杂任务。还有一个更小的模型叫Devstral Small 2,参数仅240亿个,针对本地部署进行了优化。


Mistral AI 正试图为 Google LLC 和 OpenAI 等公司提供的专有编码机器人提供替代方案,这些机器人试图将用户锁定在生态系统中,从而定位自己为真正的开源氛围编码平台。


Mistral Vibe CLI 是这里的关键界面,利用底层的 Devstral 模型,将用户的自然语言提示转化为现实世界的代码变更。这个系统非常全面,它不仅仅是生成代码片段,而是旨在探索、修改并在整个代码库中创建变更。它可以在任何第三方集成开发环境中运行,也可以作为独立终端工具运行,配备一套工具,使模型能够完全自主地编辑文件、搜索代码库、管理版本控制并执行 shell 命令。


Mistral AI 表示,Devstral 2 能够扫描文件结构和 Git 状态,这意味着它拥有“项目感知上下文”,可以在整个项目中更新依赖或修改代码库,而不会丢失对当前作的跟踪。


Mistral AI表示,Devstral 2的首要目标是运营效率。它结合了1230亿参数的密集变换器架构和256,000令牌上下文窗口,在SWE-bench基准测试中取得了令人印象深刻的72.2%得分,跻身业内表现最出色的编码模型之列。在竞争的无重模型中,只有DeepSeek V3.2取得了更高的分数。谷歌、OpenAI和Anthropic PBC的前沿模型排名也更高。


Screenshot-from-2025-12-10-06-55-25


Devstral Small 2 版本在体积较小的情况下表现亮眼,同一项基准测试中 68% 的评分意味着它可以与体积是其五倍的车型抗衡。这令人印象深刻,因为该型号轻量化,能够高效运行在标准笔记本电脑等消费级硬件上,消除了云端AI运行带来的延迟。


开配重与成本优势

然而,Mistral AI表示,Devstral 2最大的优势在于成本,该模型通过其应用程序接口定价为每百万个输入代币40美分,每百万个输出代币为2美元。这比Anthropic的Claude Sonnet 3.5等模型低了大约七倍。


Devstral 2 和 Devstral Small 2 最明显的区别是尺寸,但 Mistral AI 选择以不同的授权条款发布这些模型。Devstral 2 附带了修改版 MIT 许可证,这意味着对用户有一定的基于收入的限制,而 Devstral Small 2 则采用更宽松的 Apache 2.0 许可证,意味着其使用没有限制。因此,开发者可以根据自己的意愿修改较小的模型并集成,而无需面对专有系统的法律麻烦。


很容易想象,一些使用 Devstral 2 的企业选择混合工作流程,使用重的 1230 亿参数模型处理复杂的架构规划任务,而较小的 240 亿参数版本则用于更快速、私有的代码变更,且这些修改仍属于其网络边界内。


Mistral AI 发布 Devstral 2 之际,正值氛围编码竞争日益激烈之际,但其开放权重策略或许会吸引人。竞争对手一直在努力锁定开发者,谷歌新宣布与Replit Inc.的合作就是这一努力的典范,将强大的模型、IDE和云计算捆绑在一个整体上。


谷歌的Gemini 3 Pro与公司新推出的AntiGravity IDE紧密集成,似乎也希望让开发者牢牢融入其生态系统,而Anthropic据说在收购JavaScript工具包Bun后,正在为自家编码代理开发专用运行时。



文章来源:https://siliconangle.com/2025/12/09/mistral-ais-devstral-2-open-weights-vibe-coding-model-built-rival-best-proprietary-systems/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消