OpenAI 发布具备尖端数学能力的 GPT-5.2

2025年12月12日由 alex 发表 2946 0

52660764045_a9fd79f194_c-1-1-1-1

OpenAI Group PBC 今日发布了其最新且最强大的大型语言模型 GPT-5.2。

LLM有三个版本：即时版、思维版和专业版。OpenAI表示后两个版本在许多数学任务中都创造了创纪录的性能。该公司声称GPT-5.2在其他领域也优于竞争对手。

OpenAI使用FrontierMath（Tier 1-3）测试了中端思维版本，该基准数据集包含大学水平的数学问题。有些问题需要研究生数小时才能解答。OpenAI表示，GPT-5.2思维正确解决了数据集中40.3%的问题，创下行业新纪录。此外，该模型在国际数学奥林匹克资格考试中获得了满分。

GPT-5.2 Pro，作为LLM中最强大的版本，帮助研究人员在一个名为统计学习理论的数学子领域中取得了新发现。它解决了一个简单版本的未解决问题，该问题在2019年数学会议上提出。据OpenAI称，GPT-5.2 Pro在没有人类指导的情况下开发了该解决方案。

与GPT-5.1相比，该模型在理解科学论文中的图表方面表现更好。OpenAI利用名为CharXiv Reasoning的基准测试评估了GPT-5.2在该领域的表现。Thinking版本的模型正确解读了基准数据集中88.7%的图表，比GPT-5.1 Thinking提升了8%以上。

GPT-5.2的视觉推理功能也适用于其他任务。在一次内部测试中，OpenAI团队为模型提供了主板的低分辨率图像，并成功用它识别了关键组件。GPT-5.2还可以分析商业智能仪表盘、产品图表及其他文件。

OpenAI表示，该模型在前端开发或构建可视化应用组件（如界面）方面明显优于前作。GPT-5.2 特别擅长创建三维资产，如模拟。

该模型还在其他编程任务中带来了性能提升。OpenAI表示，GPT-5.2在SWE-Bench Pro上取得了创纪录的55.6%得分，该软件是一组跨多种编程语言的复杂编码任务。在仅支持Python的SWE测试验证版中，它获得了80%的得分。

OpenAI 今天开始向 ChatGPT 推送 GPT-5.2。它还通过其应用程序接口为开发者提供了LLM的可用性。

入门级GPT-5.2模型定价为每百万输入代币1.75美元，输出代币为14美元。使用LLM专业版的应用，这些费率分别跳升至21美元和168美元。OpenAI表示，开发者可以通过缓存功能将频繁的提示回复降低高达90%，无需为每个请求从零生成。

文章来源：https://siliconangle.com/2025/12/11/openai-launches-gpt-5-2-cutting-edge-math-capabilities/

标签：

openai

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇迪士尼与OpenAI签署协议，允许Sora生成包含其角色的AI视频

下一篇谷歌翻译现支持耳机实时翻译功能

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

本周热门

热门企业

热门职位

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市