仅用4名工程师,28天完成安卓版Sora应用开发,其中约85%的代码由AI生成——OpenAI近日披露的这一项目细节,引发行业对AI辅助开发模式的深度探讨。这款应用上线首日即登顶谷歌Play Store,用户24小时内生成超百万条视频,其高效开发模式背后,是AI智能体Codex的深度参与。
项目团队透露,从10月8日至11月5日,4人小组与Codex协作消耗约50亿Token,采用GPT-5.1-Codex早期版本完成开发。该应用虽规模庞大,却实现99.9%的无崩溃率,目前Codex已承担OpenAI内部每周70%的代码合并(PR)工作。这种"小团队+AI"的模式,打破了传统软件开发需要大量人力投入的认知。
开发过程中,团队采用"人类定框架、AI填代码"的协作方式。工程师负责架构设计、用户体验和关键模块开发,如身份验证、网络流程等基础组件;Codex则承担大量重复性编码工作,尤其在跨平台移植方面展现优势。通过分析iOS版Swift代码,该工具能生成语义一致的Kotlin代码,实现安卓端功能开发。
项目负责人指出,Codex在理解大型代码库、编写单元测试、响应错误日志等方面表现突出。当CI系统报错时,直接粘贴日志即可获得修复方案;进行内存优化时,该工具能快速扫描多个SDK提出解决方案。但AI仍需人类指导,例如在架构决策、真实设备体验优化等方面存在局限,需工程师明确约束条件和设计规范。
为提升协作效率,团队建立标准化流程:在顶层AGENTS.md文件中定义代码风格规范,要求提交前运行格式检查工具;对于复杂功能,先由Codex分析代码库运行逻辑,人工修正理解偏差后制定实施计划;超长任务则将计划保存至文件,确保跨会话指导连贯性。这种模式使代码审查更聚焦,开发流程从"编码"转向"决策与集成"。
项目高峰期,团队同时运行多个Codex会话,分别处理播放功能、搜索模块和错误修复等任务。每个会话定期汇报进度,工程师通过项目管理工具Linear分配任务,在通讯平台Slack中直接@Codex处理反馈。这种"虚拟团队"模式虽提升效率,但也存在协调成本——就像管理多个新人工程师,需持续关注每个会话的进展。
OpenAI强调,AI辅助开发未降低工程严谨性,反而通过标准化流程和自动化测试提升代码质量。目前团队正探索让Codex在无人监督状态下长时间运行,通过保存计划文件实现跨会话持续开发。这种模式若推广,可能重塑软件开发行业的人力配置与协作方式,但成功关键仍在于人类工程师的系统设计能力和对AI工具的精准引导。
