MiniMax-M2开源，在新的AI智能指数中超越Claude Opus 4.1

2025年10月28日由 alex 发表 4361 0

MiniMax 开源了其新的旗舰 AI 模型 MiniMax-M2，将其定位为目前最高效的编码和代理 AI 系统之一。

MiniMax-M2 构建为“代理和代码原生”模型，专为端到端开发人员工作流程和代理推理而设计。

尽管总共有 2300 亿个参数，但它一次只能激活 100 亿个参数，从而以更紧凑、更具成本效益的形式实现接近前沿级别的性能。

MiniMax 声称，该模型提供的结果的成本约为 Claude Sonnet 的 8%，运行速度几乎是 Claude Sonnet 的两倍。根据人工智能分析智能指数 v3.0，MiniMax-M2 取得了 61 分，总体排名第八，跑赢了 Anthropic 的 Claude Opus 4.1，后者得分为 59。

人工分析基准测试结合了 10 项关键评估的结果，包括 MMLU-Pro、GPQA Diamond、AIME 2025、SciCode 和 Terminal-Bench Hard，以评估一般推理和工具使用性能。

MiniMax-M2 跻身排行榜上最强的开源机型之列，高于 Qwen 3 72B（58 位）和 DeepSeek-V3.2（57 位）。虽然不是顶级开源模型，但它在此基准测试中名列前茅。

基准比较显示其编码性能极具竞争力，在 Terminal-Bench 上得分为 46.3，超过了 Claude Sonnet 4.5 和 Gemini 2.5 Pro，在 BrowseComp 上得分为 44，远高于 Claude Sonnet 4.5 的 19.6。

MiniMax 通过其 Agent 和 API 平台在有限的时间内免费使用 MiniMax-M2，并在 Hugging Face 和 GitHub 上开源了模型权重以供本地部署。

基准测试结果使其高于 Claude Opus 4.1，MiniMax-M2 加强了开源 AI 模型不断增强的实力，这些模型旨在平衡现实世界编码和代理应用中的可负担性、速度和高级推理。

文章来源：https://analyticsindiamag.com/ai-news-updates/minimax-m2-open-sourced-outsmarts-claude-opus-4-1-in-new-ai-intelligence-index/

标签：

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇谷歌在其由 Gemini 提供支持的 AI Studio 中添加了“Vibe Coding”

下一篇亚马逊将从本周开始解雇多达 30,000 名员工

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

Meta Muse Spark 1.1：百万上下文瞄准多智能体