OpenAI 发布具备尖端数学能力的 GPT-5.2

2025年12月12日 由 alex 发表 2513 0

52660764045_a9fd79f194_c-1-1-1-1


OpenAI Group PBC 今日发布了其最新且最强大的大型语言模型 GPT-5.2。


LLM有三个版本:即时版、思维版和专业版。OpenAI表示后两个版本在许多数学任务中都创造了创纪录的性能。该公司声称GPT-5.2在其他领域也优于竞争对手。


OpenAI使用FrontierMath(Tier 1-3)测试了中端思维版本,该基准数据集包含大学水平的数学问题。有些问题需要研究生数小时才能解答。OpenAI表示,GPT-5.2思维正确解决了数据集中40.3%的问题,创下行业新纪录。此外,该模型在国际数学奥林匹克资格考试中获得了满分。


GPT-5.2 Pro,作为LLM中最强大的版本,帮助研究人员在一个名为统计学习理论的数学子领域中取得了新发现。它解决了一个简单版本的未解决问题,该问题在2019年数学会议上提出。据OpenAI称,GPT-5.2 Pro在没有人类指导的情况下开发了该解决方案。


与GPT-5.1相比,该模型在理解科学论文中的图表方面表现更好。OpenAI利用名为CharXiv Reasoning的基准测试评估了GPT-5.2在该领域的表现。Thinking版本的模型正确解读了基准数据集中88.7%的图表,比GPT-5.1 Thinking提升了8%以上。


GPT-5.2的视觉推理功能也适用于其他任务。在一次内部测试中,OpenAI团队为模型提供了主板的低分辨率图像,并成功用它识别了关键组件。GPT-5.2还可以分析商业智能仪表盘、产品图表及其他文件。


OpenAI表示,该模型在前端开发或构建可视化应用组件(如界面)方面明显优于前作。GPT-5.2 特别擅长创建三维资产,如模拟。


该模型还在其他编程任务中带来了性能提升。OpenAI表示,GPT-5.2在SWE-Bench Pro上取得了创纪录的55.6%得分,该软件是一组跨多种编程语言的复杂编码任务。在仅支持Python的SWE测试验证版中,它获得了80%的得分。


OpenAI 今天开始向 ChatGPT 推送 GPT-5.2。它还通过其应用程序接口为开发者提供了LLM的可用性。


入门级GPT-5.2模型定价为每百万输入代币1.75美元,输出代币为14美元。使用LLM专业版的应用,这些费率分别跳升至21美元和168美元。OpenAI表示,开发者可以通过缓存功能将频繁的提示回复降低高达90%,无需为每个请求从零生成。

文章来源:https://siliconangle.com/2025/12/11/openai-launches-gpt-5-2-cutting-edge-math-capabilities/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消