OpenAI已经推出了Codex,这是一款基于云的研究预览版软件工程代理,旨在自动化常见的开发任务,如编写代码、调试、测试和生成拉取请求。Codex集成在ChatGPT的专业版、团队版和企业版中,每个任务都在一个安全的沙箱环境中运行,该环境预先加载了用户的代码库并配置为反映他们的开发设置。
Codex由codex-1驱动,这是OpenAI的o3模型的一个版本,专为编程任务优化。它通过在真实世界示例上使用强化学习进行训练,能够生成符合人类习惯的代码。该模型反复运行代码和测试,直到找到正确的解决方案。一旦任务完成,Codex会在沙箱中提交其更改,并提供测试输出和终端日志以确保透明度。
ChatGPT中的Codex侧边栏使用户能够通过文本提示分配任务或询问有关其代码库的问题。该模型可以编辑文件、运行命令和执行测试,典型的完成时间从一分钟到三十分钟不等。Codex支持AGENTS.md文件——这些是帮助指导代理通过项目特定实践和测试程序的存储库级说明。
Codex CLI是一个开源的命令行伴侣界面,使用API积分。然而,正如Fouad Matin澄清的,他是OpenAI的技术人员,ChatGPT中的Codex访问包含在专业版、团队版和企业版订阅中:
Codex包含在ChatGPT(专业版、团队版、企业版)的定价中,并在接下来的两周内提供慷慨的访问。
然而,该系统尚不支持具有实时用户界面的完整应用程序测试。正如一位用户指出的:
如今大多数软件工程都是Web开发。它如何处理这种情况,其中某些东西有单独的层、环境变量和UI接口?它是否实际运行应用程序以便用户可以测试,还是需要推送更改然后拉下副本进行本地测试?那将非常烦人。理想情况下,未来代理可以自己测试,但我猜它们还不够好。
Codex在一个没有互联网访问或UI执行能力的隔离容器中运行。虽然它可以处理测试套件、代码检查器和类型检查器,但最终的验证和集成仍由人类开发者负责。
OpenAI还推出了Codex mini,这是一款为更快的交互和更低的延迟而设计的轻量级模型,现在是Codex CLI中的默认引擎,并通过API以codex-mini-latest的形式提供。其定价为每百万输入标记1.50美元和每百万输出标记6美元,提供75%的提示缓存折扣。
此次发布反映了OpenAI更广泛的战略,最终支持实时AI编码助手和异步代理工作流。虽然Codex目前与GitHub连接并可从ChatGPT访问,OpenAI设想未来将有更深入的集成,包括支持从Codex CLI、ChatGPT桌面版和诸如问题跟踪器或CI系统等工具中分配任务。