智谱 AI 推出 GLM-5.2,长代码任务性能逼近闭源顶尖模型

2026年06月18日 由 alex 发表 2195 0

智谱 AI 发布 GLM-5.2 大模型,该模型采用 MIT 开源协议,支持稳定百万词元上下文窗口。在耗时数小时的超长代码任务测试中,这款开源模型的性能仅小幅落后于 Anthropic 的 Opus 系列闭源模型。


智谱 AI 正式发布 GLM-5.2,主打长周期任务场景,可处理耗时数小时、包含数千步操作的大型代码工程。为实现该能力,研发团队将上下文窗口扩容至 100 万词元,并针对智能体代码场景专项训练,涵盖大规模工程开发、自动化科研、复杂程序排错等场景。


智谱 AI 在官方博客中表示:“宣称拥有百万上下文不难,但在真实工程高强度负载下维持稳定可靠难度极高。” 模型需要在冗长、无固定结构的代码智能体运行流程中持续保持输出质量。


glm-5-2-01-long-horizon-benchmark


性能仅落后最新 Opus 模型 1 个百分点


FrontierSWE 是一套评测标准,覆盖时长数小时至数十小时的开源工程类任务。GLM-5.2 在该榜单取得 74.4% 的得分,仅比 Anthropic Claude Opus 4.8 低 1 个百分点,小幅领先 OpenAI GPT-5.5。

文章来源:https://the-decoder.com/zhipu-ais-glm-5-2-closes-in-on-closed-source-leaders-in-coding-marathons/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消