
OpenAI声称,他们在仅用28天时间构建并发布了Sora的Android应用,主要依赖其AI编码代理Codex。
公司表示,Sora 的初始生产版本于 2025 年 10 月 8 日至 11 月 5 日期间,由一支四名工程师团队与 Codex 合作开发,消耗了“大约 50 亿个代币”。
该应用于11月公开发布,首日登顶Google Play商店,Android用户在首24小时内生成了“超过一百万个视频”。
OpenAI工程师Patrick Hum和RJ Marsan写道,团队在紧迫的截止日期下故意避免增加人手,并引用了美国软件工程师Fred Brooks的著名观察:“在一个后期项目中增加更多人手,反而会拖延时间。”
相反,每位工程师都与Codex合作,进行输出倍增。“我们组建了一支由四名工程师组成的强大团队——全员都配备了Codex,以大幅提升每位工程师的影响力,”他们说。
据OpenAI称,Codex使用了早期版本的GPT-5.1-Codex模型,负责约85%的代码库,该公司表示该模型现已通过其CLI、IDE扩展和网页应用向开发者开放。
尽管时间紧迫,OpenAI声称该应用拥有“99.9%”的无崩溃率。
工程团队描述他们把Codex当作“新聘的高级工程师”,将人力集中在架构、系统设计和用户体验上,而非实现。
OpenAI表示,Codex擅长读取大型代码库、跨平台逻辑转换以及生成广泛的测试覆盖。博客指出:“Codex对编写单元测试(非常)热情,”并补充说工程师经常将CI日志粘贴到提示中以诊断失败。
然而,公司也承认存在局限。Codex“还不擅长推断未被告知的内容”,当没有引导时,它在“深刻的建筑判断”上挣扎。
为此,团队大量投入于文档,如 AGENTS.md,以强制执行模式、编码标准和工具要求。
一种显著的技术是将Codex作为跨平台翻译层使用,而非共享框架。“别管React Native或Flutter了;跨平台的未来就是Codex,“工程师们写道,解释说Codex在保持行为的同时,将iOS应用中的Swift逻辑翻译成了Kotlin。
随着开发加速,瓶颈从编写代码转向审查和协调并行Codex会话。OpenAI表示:“我们开发的瓶颈从编写代码转向决策、反馈和整合变更。”
在几天前发布的《企业人工智能2025现状报告》中,公司指出过去六周内,Codex每周活跃用户数量增长了2倍。此外,公司观察到同期Codex消息增长了~50%。
去年十月,公司首席执行官Sam Altman透露:“OpenAI目前几乎所有新代码都是Codex用户编写的。”他补充说,OpenAI的工程师每周使用Codex完成的拉取请求(PR)数量增加70%。
