IT之家在此援引博文,回到 10 月,Sora iOS 版上线后使用量迅速爆发,人们立刻开始源源不断地生成视频,安卓版呼之欲出,但当时 OpenAI 内部只有安卓端 Sora 的原型版本,因此这项开发任务可谓是高风险、时间紧迫。
OpenAI 为此决定组建一支只有 4 人的强力小队,他们从 10 月 8 日开始开发安卓版 Sora,11 月 5 日交付最终成果,全程用时 28 天,期间并没有使用什么“秘密模型”,而是 GPT-5.1-Codex 的早期版本,整个应用代码的 85% 由 Codex 编写,实现了 99.9% 的版本稳定率。
不过,Codex 并不擅长自行推断未被明确告知的信息,如开发者偏好的架构模式、产品策略、真实用户行为等,并且这名虚拟工程师无法感受应用的实际运行状况,最终只能由真人来进行调试,告诉 AI 滑动是否顺滑、某个流程是否令人困惑。
从这里可以看出,Codex 的本能是“让代码跑起来”,而非长期整洁性,为此 OpenAI 在整个代码库中大量使用 AGENT.md 文件,用于进行统一指导和实践,让 AI 始终遵循规范写代码。
所以我们可以得出结论:Codex 可以在明确边界的情况下实现高效工作,而人类工程师则可以专注于架构、体验、系统性决策,并负责监督最终质量。

