Claude Fable 5 在前沿数学难题测试中，得分超越 GPT-5.5 达 13 分

登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

所以，能动手就别吵吵了

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

常用工具

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

2026年06月15日由 alex 发表 561 0

Anthropic 全新模型 Claude Fable 5 在前沿数学基准测试（FrontierMath）中取得最高分。据 Epoch AI 数据显示，该模型在 1 至 3 难度层级的答题准确率为 87%，在难度最高的第四层级（第二版）准确率更是达到 88%。

frontier_math_fable5

近期，Anthropic 旗下模型的数学能力实现跨越式提升。就在 2026 年初，其上一代模型 Opus 4.5 在第四层级测试中的准确率还不足 10%。OpenAI 的 GPT-5.5 在该层级的准确率约为 75%，大幅落后于 Fable 5，目前 OpenAI 已着手研发 GPT-5.6。

本次所有模型均在 Epoch AI 标准测试框架下开启满强度推理模式。FrontierMath 被公认为衡量人工智能数学推理能力难度最高的评测基准之一。模型数学能力的进步不只体现在测试成绩上，实际应用案例也不断涌现。近期，OpenAI 一款模型成功攻克了一道长期悬而未决的厄多斯难题，而 Claude Mythos 模型同样完成了这一挑战。

文章来源：https://the-decoder.com/claude-fable-5-outpaces-gpt-5-5-by-13-points-on-frontiermaths-toughest-problems/

标签：

Claude Anthropic

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇微软研究院推出 Mirage 视频生成模型：搭载长效空间记忆，镜头流转场景不 “失忆”

下一篇谷歌研究院推出 Gemini-SQL2，大幅领跑文本转 SQL 评测榜单

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术