智谱 AI 发布 GLM-5.2 大模型,该模型采用 MIT 开源协议,支持稳定百万词元上下文窗口。在耗时数小时的超长代码任务测试中,这款开源模型的性能仅小幅落后于 Anthropic 的 Opus 系列闭源模型。
智谱 AI 正式发布 GLM-5.2,主打长周期任务场景,可处理耗时数小时、包含数千步操作的大型代码工程。为实现该能力,研发团队将上下文窗口扩容至 100 万词元,并针对智能体代码场景专项训练,涵盖大规模工程开发、自动化科研、复杂程序排错等场景。
智谱 AI 在官方博客中表示:“宣称拥有百万上下文不难,但在真实工程高强度负载下维持稳定可靠难度极高。” 模型需要在冗长、无固定结构的代码智能体运行流程中持续保持输出质量。

性能仅落后最新 Opus 模型 1 个百分点
FrontierSWE 是一套评测标准,覆盖时长数小时至数十小时的开源工程类任务。GLM-5.2 在该榜单取得 74.4% 的得分,仅比 Anthropic Claude Opus 4.8 低 1 个百分点,小幅领先 OpenAI GPT-5.5。
