OpenAI发布具有推理能力的o1模型

2024年09月13日由 daydream 发表 797 0

OpenAI发布了一款名为o1的新模型，这是该公司计划中的一系列“推理”模型之一。这款模型旨在更快速地解答复杂问题。o1将与一个较小且成本较低的版本o1-mini一同推出。尽管OpenAI将此次发布标记为“预览版”，以表明其仍处于早期阶段，但这一模型因其高度期待而备受关注。

微信截图_20240913092411

对于OpenAI而言，o1是实现类人人工智能目标的重要一步。在实用性上，它在编写代码和解决多步骤问题方面比之前的模型表现得更好。然而，相比GPT-4o，o1使用成本更高且速度较慢。OpenAI表示，ChatGPT Plus和Team用户可以访问o1-preview和o1-mini；而Enterprise和Edu用户将在下周获得访问权限。至于免费用户，他们将能够在未来的某个时间点获得o1-mini的使用权。

o1的训练方法与其前身有显著不同。OpenAI的研究负责人Jerry Tworek透露，o1采用了一种全新的优化算法，并且使用了专门为该模型定制的训练数据集。不同于通过模仿训练数据中的模式来学习的GPT模型，o1采用了强化学习技术进行自我问题解决，并通过奖励和惩罚的方式进行训练。此外，它还运用了“思维链”来处理查询，类似于人类逐步解决问题的过程。

据称，这种新的训练方法使模型更为精确，减少了错误生成的情况，但完全消除错误生成仍然是个挑战。新模型在解决AP数学测试和国际数学奥林匹克竞赛题目的能力上表现出色，甚至在Codeforces编程比赛中达到了参赛者的第89百分位。不过，o1在世界事实知识方面不如GPT-4o，并且不具备浏览网络或处理文件和图像的能力。

尽管如此，OpenAI认为o1代表了一个全新的功能类别。该模型被命名为o1，意味着“将计数器重置回1”。OpenAI希望通过这个名称传达出一种新的命名逻辑。

虽然o1在处理复杂问题时展现出更强的能力，但它并不等同于真正的人类思考过程。OpenAI强调，设计模型时并未将其与人类思维等同起来，而是希望通过界面展示模型如何更深入地处理和解决问题。然而，即使在模拟人类思维过程中，o1也并不是真正的思考实体。

文章来源：https://www.theverge.com/2024/9/12/24242439/openai-o1-model-reasoning-strawberry-chatgpt

标签：

OpenAI 模型 o1

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Meta承认未经同意抓取澳大利亚用户数据，引发隐私争议

下一篇 Facebook和Instagram正在降低AI标签的存在感

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术