MiniMax-M2开源,在新的AI智能指数中超越Claude Opus 4.1

2025年10月28日 由 alex 发表 3683 0

programming-coding.jpg


MiniMax 开源了其新的旗舰 AI 模型 MiniMax-M2,将其定位为目前最高效的编码和代理 AI 系统之一。


MiniMax-M2 构建为“代理和代码原生”模型,专为端到端开发人员工作流程和代理推理而设计。


尽管总共有 2300 亿个参数,但它一次只能激活 100 亿个参数,从而以更紧凑、更具成本效益的形式实现接近前沿级别的性能。


MiniMax 声称,该模型提供的结果的成本约为 Claude Sonnet 的 8%,运行速度几乎是 Claude Sonnet 的两倍。根据人工智能分析智能指数 v3.0,MiniMax-M2 取得了 61 分,总体排名第八,跑赢了 Anthropic 的 Claude Opus 4.1,后者得分为 59。


人工分析基准测试结合了 10 项关键评估的结果,包括 MMLU-Pro、GPQA Diamond、AIME 2025、SciCode 和 Terminal-Bench Hard,以评估一般推理和工具使用性能。


MiniMax-M2 跻身排行榜上最强的开源机型之列,高于 Qwen 3 72B(58 位)和 DeepSeek-V3.2(57 位)。虽然不是顶级开源模型,但它在此基准测试中名列前茅。


基准比较显示其编码性能极具竞争力,在 Terminal-Bench 上得分为 46.3,超过了 Claude Sonnet 4.5 和 Gemini 2.5 Pro,在 BrowseComp 上得分为 44,远高于 Claude Sonnet 4.5 的 19.6。


MiniMax 通过其 Agent 和 API 平台在有限的时间内免费使用 MiniMax-M2,并在 Hugging Face 和 GitHub 上开源了模型权重以供本地部署。


基准测试结果使其高于 Claude Opus 4.1,MiniMax-M2 加强了开源 AI 模型不断增强的实力,这些模型旨在平衡现实世界编码和代理应用中的可负担性、速度和高级推理。

文章来源:https://analyticsindiamag.com/ai-news-updates/minimax-m2-open-sourced-outsmarts-claude-opus-4-1-in-new-ai-intelligence-index/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消