OpenAI推出两款“开放”AI推理模型

2025年08月06日 由 佚名 发表 121 0


OpenAI于周二宣布推出两款具有类似功能的开放权重AI推理模型,与其o系列相似。这两款模型可以从在线开发者平台免费下载Hugging Face。公司称这些模型在多个用于比较开放模型的基准测试中被描述为“最先进”的。


这些模型有两种尺寸:一个更大且更强大的gpt-oss-120b模型可以在单个Nvidia GPU上运行,另一个较轻的gpt-oss-20b模型可以在具有16GB内存的消费级笔记本电脑上运行。


此次发布标志着OpenAI自GPT-2以来首次推出“开放”语言模型,距今已有五年多。


在一次简报中,OpenAI表示其开放模型将能够向云端的AI模型发送复杂查询,正如TechCrunch之前报道的那样。这意味着如果OpenAI的开放模型无法完成某项任务,例如处理图像,开发者可以将开放模型连接到公司更强大的封闭模型之一。


虽然OpenAI在早期曾开源AI模型,但公司通常更倾向于采用专有的封闭源开发方法。后者的策略帮助OpenAI通过API向企业和开发者出售其AI模型的访问权,建立了庞大的业务。


然而,CEO Sam Altman在一月份表示,他认为OpenAI在开源其技术方面一直“站在历史的错误一边”。如今,公司面临来自中国AI实验室的日益增长的压力——包括DeepSeek、阿里巴巴的Qwen和Moonshot AI——这些实验室开发了世界上最强大和最受欢迎的开放模型。(虽然Meta曾经主导开放AI领域,但该公司的Llama AI模型在去年落后了。)


今年七月,特朗普政府也敦促美国AI开发者开源更多技术以促进符合美国价值观的AI的全球采用。


随着gpt-oss的发布,OpenAI希望赢得开发者和特朗普政府的青睐,他们都目睹了中国AI实验室在开源领域的崛起。


“回到我们2015年开始的时候,OpenAI的使命是确保AGI造福全人类,”Altman在与TechCrunch分享的一份声明中说。“为此,我们很高兴世界能够基于美国创建的开放AI堆栈进行构建,这个堆栈基于民主价值观,免费向所有人开放并广泛受益。”


Open AI CEO Sam Altman

模型的表现如何


OpenAI旨在使其开放模型成为其他开放权重AI模型中的领导者,公司声称已经实现了这一目标。在Codeforces(带工具)这一竞争性编码测试中,gpt-oss-120b和gpt-oss-20b分别得分2622和2516,超过了DeepSeek的R1,但不及o3和o4-mini。


OpenAI的开放模型在codeforces上的表现。



在人类最后的考试(HLE)中,这是一项涵盖各种主题的众包问题的挑战性测试(带工具),gpt-oss-120b和gpt-oss-20b分别得分19%和17.3%。同样,这不及o3,但超过了DeepSeek和Qwen的领先开放模型。



值得注意的是,OpenAI的开放模型比其最新的AI推理模型o3和o4-mini更容易出现幻觉。


幻觉在OpenAI最新的AI推理模型中变得更加严重,公司之前表示尚不完全理解原因。在一份白皮书中,OpenAI表示这是“预期的,因为较小的模型比较大的前沿模型拥有更少的世界知识,往往更容易产生幻觉。”


OpenAI发现gpt-oss-120b和gpt-oss-20b在PersonQA上对49%和53%的问题产生了幻觉,这是公司用于衡量模型关于人类知识准确性的内部基准。这比OpenAI的o1模型的16%幻觉率高出三倍多,也高于其o4-mini模型的36%。


训练新模型


OpenAI表示其开放模型的训练过程与其专有模型相似。公司称每个开放模型都利用专家混合(MoE)来减少任何给定问题的参数使用,使其运行更高效。对于拥有1170亿总参数的gpt-oss-120b,OpenAI表示该模型每个标记仅激活51亿参数。


公司还表示其开放模型使用高计算强化学习(RL)——一种在模拟环境中使用大型Nvidia GPU集群教AI模型分辨对错的后训练过程。这也用于训练OpenAI的o系列模型,开放模型具有类似的思维链过程,在回答问题时需要额外的时间和计算资源。


由于后训练过程,OpenAI表示其开放AI模型在为AI代理提供动力方面表现出色,并能够在其思维链过程中调用工具,如网络搜索或Python代码执行。然而,OpenAI表示其开放模型仅限于文本,这意味着它们无法像公司的其他模型那样处理或生成图像和音频。


OpenAI正在根据Apache 2.0许可证发布gpt-oss-120b和gpt-oss-20b,这通常被认为是最宽松的许可证之一。此许可证将允许企业在无需支付或获得公司许可的情况下将OpenAI的开放模型商业化。


然而,与AI2等AI实验室的完全开源产品不同,OpenAI表示不会发布用于创建其开放模型的训练数据。鉴于针对AI模型提供商(包括OpenAI)的几起活跃诉讼声称这些公司不当训练其AI模型使用了受版权保护的作品,这一决定并不令人意外。


OpenAI推迟了其开放模型的发布几次在最近几个月,部分原因是为了应对安全问题。除了公司的常规安全政策外,OpenAI在一份白皮书中表示还调查了恶意行为者是否可以微调其gpt-oss模型以在网络攻击或生物或化学武器的创建中更有帮助。


经过OpenAI和第三方评估者的测试,公司表示gpt-oss可能会在生物能力方面略有提高。然而,它没有发现这些开放模型即使经过微调也能在这些领域达到其“高能力”危险阈值的证据。


虽然OpenAI的模型在开放模型中似乎是最先进的,但开发者们正热切期待DeepSeek R2的发布,这是其下一个AI推理模型,以及Meta的超级智能实验室的新开放模型。


文章来源:https://techcrunch.com/2025/08/05/openai-launches-two-open-ai-reasoning-models/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消