
MiniMax 开源了其新的旗舰 AI 模型 MiniMax-M2,将其定位为目前最高效的编码和代理 AI 系统之一。
MiniMax-M2 构建为“代理和代码原生”模型,专为端到端开发人员工作流程和代理推理而设计。
尽管总共有 2300 亿个参数,但它一次只能激活 100 亿个参数,从而以更紧凑、更具成本效益的形式实现接近前沿级别的性能。
MiniMax 声称,该模型提供的结果的成本约为 Claude Sonnet 的 8%,运行速度几乎是 Claude Sonnet 的两倍。根据人工智能分析智能指数 v3.0,MiniMax-M2 取得了 61 分,总体排名第八,跑赢了 Anthropic 的 Claude Opus 4.1,后者得分为 59。
人工分析基准测试结合了 10 项关键评估的结果,包括 MMLU-Pro、GPQA Diamond、AIME 2025、SciCode 和 Terminal-Bench Hard,以评估一般推理和工具使用性能。
MiniMax-M2 跻身排行榜上最强的开源机型之列,高于 Qwen 3 72B(58 位)和 DeepSeek-V3.2(57 位)。虽然不是顶级开源模型,但它在此基准测试中名列前茅。
基准比较显示其编码性能极具竞争力,在 Terminal-Bench 上得分为 46.3,超过了 Claude Sonnet 4.5 和 Gemini 2.5 Pro,在 BrowseComp 上得分为 44,远高于 Claude Sonnet 4.5 的 19.6。
MiniMax 通过其 Agent 和 API 平台在有限的时间内免费使用 MiniMax-M2,并在 Hugging Face 和 GitHub 上开源了模型权重以供本地部署。
基准测试结果使其高于 Claude Opus 4.1,MiniMax-M2 加强了开源 AI 模型不断增强的实力,这些模型旨在平衡现实世界编码和代理应用中的可负担性、速度和高级推理。
