OpenAI推出两款“开放”AI推理模型

2025年08月06日由佚名发表 518 0

OpenAI于周二宣布推出两款具有类似功能的开放权重AI推理模型，与其o系列相似。这两款模型可以从在线开发者平台免费下载Hugging Face。公司称这些模型在多个用于比较开放模型的基准测试中被描述为“最先进”的。

这些模型有两种尺寸：一个更大且更强大的gpt-oss-120b模型可以在单个Nvidia GPU上运行，另一个较轻的gpt-oss-20b模型可以在具有16GB内存的消费级笔记本电脑上运行。

此次发布标志着OpenAI自GPT-2以来首次推出“开放”语言模型，距今已有五年多。

在一次简报中，OpenAI表示其开放模型将能够向云端的AI模型发送复杂查询，正如TechCrunch之前报道的那样。这意味着如果OpenAI的开放模型无法完成某项任务，例如处理图像，开发者可以将开放模型连接到公司更强大的封闭模型之一。

虽然OpenAI在早期曾开源AI模型，但公司通常更倾向于采用专有的封闭源开发方法。后者的策略帮助OpenAI通过API向企业和开发者出售其AI模型的访问权，建立了庞大的业务。

然而，CEO Sam Altman在一月份表示，他认为OpenAI在开源其技术方面一直“站在历史的错误一边”。如今，公司面临来自中国AI实验室的日益增长的压力——包括DeepSeek、阿里巴巴的Qwen和Moonshot AI——这些实验室开发了世界上最强大和最受欢迎的开放模型。（虽然Meta曾经主导开放AI领域，但该公司的Llama AI模型在去年落后了。）

今年七月，特朗普政府也敦促美国AI开发者开源更多技术以促进符合美国价值观的AI的全球采用。

随着gpt-oss的发布，OpenAI希望赢得开发者和特朗普政府的青睐，他们都目睹了中国AI实验室在开源领域的崛起。

“回到我们2015年开始的时候，OpenAI的使命是确保AGI造福全人类，”Altman在与TechCrunch分享的一份声明中说。“为此，我们很高兴世界能够基于美国创建的开放AI堆栈进行构建，这个堆栈基于民主价值观，免费向所有人开放并广泛受益。”

模型的表现如何

OpenAI旨在使其开放模型成为其他开放权重AI模型中的领导者，公司声称已经实现了这一目标。在Codeforces（带工具）这一竞争性编码测试中，gpt-oss-120b和gpt-oss-20b分别得分2622和2516，超过了DeepSeek的R1，但不及o3和o4-mini。

OpenAI的开放模型在codeforces上的表现。

在人类最后的考试（HLE）中，这是一项涵盖各种主题的众包问题的挑战性测试（带工具），gpt-oss-120b和gpt-oss-20b分别得分19%和17.3%。同样，这不及o3，但超过了DeepSeek和Qwen的领先开放模型。

值得注意的是，OpenAI的开放模型比其最新的AI推理模型o3和o4-mini更容易出现幻觉。

幻觉在OpenAI最新的AI推理模型中变得更加严重，公司之前表示尚不完全理解原因。在一份白皮书中，OpenAI表示这是“预期的，因为较小的模型比较大的前沿模型拥有更少的世界知识，往往更容易产生幻觉。”

OpenAI发现gpt-oss-120b和gpt-oss-20b在PersonQA上对49%和53%的问题产生了幻觉，这是公司用于衡量模型关于人类知识准确性的内部基准。这比OpenAI的o1模型的16%幻觉率高出三倍多，也高于其o4-mini模型的36%。

训练新模型

OpenAI表示其开放模型的训练过程与其专有模型相似。公司称每个开放模型都利用专家混合（MoE）来减少任何给定问题的参数使用，使其运行更高效。对于拥有1170亿总参数的gpt-oss-120b，OpenAI表示该模型每个标记仅激活51亿参数。

公司还表示其开放模型使用高计算强化学习（RL）——一种在模拟环境中使用大型Nvidia GPU集群教AI模型分辨对错的后训练过程。这也用于训练OpenAI的o系列模型，开放模型具有类似的思维链过程，在回答问题时需要额外的时间和计算资源。

由于后训练过程，OpenAI表示其开放AI模型在为AI代理提供动力方面表现出色，并能够在其思维链过程中调用工具，如网络搜索或Python代码执行。然而，OpenAI表示其开放模型仅限于文本，这意味着它们无法像公司的其他模型那样处理或生成图像和音频。

OpenAI正在根据Apache 2.0许可证发布gpt-oss-120b和gpt-oss-20b，这通常被认为是最宽松的许可证之一。此许可证将允许企业在无需支付或获得公司许可的情况下将OpenAI的开放模型商业化。

然而，与AI2等AI实验室的完全开源产品不同，OpenAI表示不会发布用于创建其开放模型的训练数据。鉴于针对AI模型提供商（包括OpenAI）的几起活跃诉讼声称这些公司不当训练其AI模型使用了受版权保护的作品，这一决定并不令人意外。

OpenAI推迟了其开放模型的发布几次在最近几个月，部分原因是为了应对安全问题。除了公司的常规安全政策外，OpenAI在一份白皮书中表示还调查了恶意行为者是否可以微调其gpt-oss模型以在网络攻击或生物或化学武器的创建中更有帮助。

经过OpenAI和第三方评估者的测试，公司表示gpt-oss可能会在生物能力方面略有提高。然而，它没有发现这些开放模型即使经过微调也能在这些领域达到其“高能力”危险阈值的证据。

虽然OpenAI的模型在开放模型中似乎是最先进的，但开发者们正热切期待DeepSeek R2的发布，这是其下一个AI推理模型，以及Meta的超级智能实验室的新开放模型。

文章来源：https://techcrunch.com/2025/08/05/openai-launches-two-open-ai-reasoning-models/

标签：

OpenAI

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇谷歌新发布的Genie 3：从文本提示生成虚拟环境的创新

下一篇 OpenAI和Anthropic推出新型优化推理的语言模型

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

Meta Muse Spark 1.1：百万上下文瞄准多智能体