MiniMax发布M2.1 AI模型,提升多语言编程的多样性

2025年12月24日 由 佚名 发表 34 0


中国人工智能初创公司MiniMax今日宣布推出M2.1,在处理真实世界复杂任务、多编程语言和办公场景中显著提升了性能和代理能力。


M2.1的主要亮点包括在多种编程语言中显著增强的编程技能,如Rust、Java、Golang、C++、Kotlin、Objective-C、TypeScript和JavaScript。此外,它在网页、Android和iOS用户界面的美学设计能力和理解力上也有所提升。


M2.1在系统性问题解决方面进行了升级,不仅关注代码执行的正确性,还关注包含额外或复杂指导的指令的执行。公司表示,这在实际办公环境中提供了更高的可用性,即使是简单的规则也可能有复杂的细微差别。


为实现这一目标,公司不仅强调卓越的编码能力,还提升了对话和写作技能。该模型在日常对话、技术文档和写作方面表现出色,并能够提供结构化的响应。


“我们的用户已经习惯于依赖MiniMax提供的前沿级别的编码帮助,成本仅为一小部分。早期测试显示,M2.1在从架构和编排到代码审查和部署的各个方面表现出色,”Kilo Code Inc.的联合创始人兼首席执行官Scott Breitenother说,这是一家开源代理AI编码代理公司。


MiniMax M2于今年十月底发布。公司表示,M2.1在多语言场景中表现出显著的能力提升,尤其是在多语言场景中。它在这里超越了Anthropic PBC的Claude Sonnet 4.5,并接近Claude Opus 4.5(更大、更复杂的模型)。



作为评估的一部分,MiniMax建立了一个新的基准:VIBE,即执行的视觉和交互基准。该套件涵盖了五个核心能力:网页、模拟、Android、iOS和后端开发。与其他基准不同,VIBE以代理作为验证者的语言配置。这使其能够评估生成应用程序的交互逻辑和视觉美学。


M2.1在VIBE基准测试中表现出公司所称的“出色表现”,平均得分为88.6。它在VIBE-Web和VIBE-Android子集中特别出色,得分分别为91.5和89.7。


公司还将新模型与大型供应商如Anthropic、Google LLC、OpenAI Group PBC和DeepSeek进行了测试在全面的行业基准中针对编码和知识,包括MMLU-Pro、人类最后的考试和Toolathon(针对AI代理)。


该模型显示出一致的高性能在代理工具使用、真实世界知识和复杂问题解决能力方面。它在HLE w/o工具中得分22.0,这是一个具有挑战性的学术基准,包含数千个跨多学科的研究生水平的多模态问题。在MMLU,一个同样全面的学科知识基准中,该模型得分88,这与旗舰前沿模型相当或接近。


该模型可用作为MiniMax的应用程序编程接口或从HuggingFace下载,带有开放权重。目前页面尚未开放。公司的旗舰服务,MiniMax Agent,基于新的MiniMax-2.1构建。


文章来源:https://siliconangle.com/2025/12/23/minimax-releases-m2-1-ai-model-multi-language-programming-versatility/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消