OpenAI和谷歌有限责任公司今天宣布,他们最新的推理模型在最近的编程竞赛中取得了金牌级别的成绩。
ICPC是全球最负盛名的大学级编程竞赛,吸引了来自约3000所大学的参赛者。OpenAI表示其推理模型获得了满分,而谷歌的算法在今年的比赛中解决了12个问题中的10个。
ICPC决赛于9月4日举行。139支参赛队伍在五个小时内解决了竞赛组织者提供的12个问题。如果OpenAI和谷歌的AI生成的提交是由人类完成的,他们将分别获得第一和第二名。
两家公司的算法都成功解决了问题C,而没有参赛队伍能够正确回答。任务是计算填充一组水库的最有效方法。谷歌DeepMind研究人员在一篇博客文章中详细说明:“问题C要求找到一种通过互联管道网络向一组水库分配液体的解决方案,目标是找到一种配置,使所有水库尽快填满。”博客文章今天。
公司以“高级”版本的Gemini 2.5 Deep Think参加了比赛,这是一个在四月推出的推理模型。该算法通过并行生成大量潜在答案来解决复杂问题,然后精炼这些答案并将其提炼成单一响应。
根据谷歌的说法,参与ICPC的Gemini 2.5 Deep Think版本使用AI代理生成每个问题的多种潜在解决方案。代理可以访问一个终端,允许他们运行和测试代码。在生成初始代码后,他们进行了改进以提高测试响应的质量。
谷歌研究人员写道:“在ICPC上达到金牌水平对软件开发有直接的实际影响。超越数学和编码,我们的成就展示了一种强大的新抽象推理能力。ICPC所需的技能——理解复杂问题、制定多步骤逻辑计划并完美实施——是许多科学和工程领域所需的相同技能。”
OpenAI使用GPT-5和一个尚未公开的实验性推理模型参加了ICPC。GPT-5在推理模型的帮助下解决了12个问题中的11个。后者算法独立回答了最后一个问题,这是这一组中最困难的。
这一里程碑是在谷歌和OpenAI开发的模型赢得国际数学奥林匹克金牌两个月后取得的。搜索巨头今天披露,它在比赛中使用了Gemini 2.5 Deep Thinking的一个版本。