OpenAI 百万行代码零手写：Agent 驱动开发如何重新定义工程师角色

人不写代码，写的是「编码环境」

工程师们完全信任 Codex（基于 GPT5 模型）的编码能力，没有手写任何一行代码。但这不意味着人变得无关紧要——恰恰相反，人力资源从编码本身转移到了更高层的工作：拆解目标、分解任务、构造一个有明确反馈机制的编码环境。

关键细节在于他们处理错误的方式。当 Agent 出错时，团队不会简单地点「再试一次」让它重新生成，而是停下来思考：这次失败是因为缺少哪些 Context？缺少什么工具？反馈机制哪里断了？然后通过调整环境，让 Agent 在下一轮拥有更充分的上下文。

这种思路和 Ralph Wiggum Loop 的工作理念一脉相承——让 AI 在循环中尝试任务，把这一轮的错误作为下一轮的输入，反复迭代直到收敛。开发者的角色从「人在环中」（Human-in-the-loop）变成了「人在环上」（Human-on-the-loop），只需设定目标和质量标准，剩下的交给 AI 自主完成。

这个设计很实用。比起不断调整 prompt 碰运气，建立一个有清晰错误日志和反馈回路的环境，才是真正可复制、可扩展的做法。

多 Agent 协作审查，不强制人类 Review

代码写完不是终点。在他们的流程中，多个 Agent 会负责代码 Review，只有当所有 Agent 都对代码质量满意后，PR 才会被允许合并。这一步并不强制要求人类参与审查。

这意味着从编码到审查，整条链路都可以由 Agent 闭环完成。

给 Agent 地图，而不是操作手册

Context 管理是 Agent 开发中最容易踩坑的地方。他们的经验是：一个庞大的操作手册效果并不好。更有效的做法是给 Agent 一张「地图」——一个简短的概述文件，告诉 AI：

项目整体架构是什么
去哪里查看各模块代码
每个模块的设计理念
哪些工作已完成，哪些待完成

简洁、结构化、可导航，远比一份几万字的文档有用。

暴露更多信息，释放更大杠杆

在开发过程中，团队追求把尽可能多的信息暴露给 Agent——会议记录、一致性规范、设计决策等。目标是让 Agent 接手代码时，能够在规范约束下开展工作。

这里有一个值得记住的结论：将更多系统以 Agent 能够直接检查、验证和修改的形式纳入，能够带来更大的杠杆效应。这不仅适用于 Codex，也适用于任何正在处理该代码库的其他 Agent。

Karpathy 此前也表达过类似的观点：未来的系统应该尽可能提供面向 Agent 的 API 和 CLI，让 Agent 能够轻松读取上下文信息，而不是依赖视觉方案或 HTML 解析这种低效的方式。

瓶颈不再是 Token，而是人类注意力

当一个开发工程的吞吐量瓶颈从 Token 产出速度变成了人类注意力时，开发者的定位必须跟着变。不再是写代码、跑测试这些执行层面的事，而是：

设计开发环境
调整反馈机制
制定编码规范
帮助 Agent 以更可靠的方式完成开发

对独立开发者而言，这套方法论的核心启示很明确：与其花时间写更好的 prompt，不如花时间搭建更好的 Agent 工作环境——清晰的项目地图、结构化的反馈回路、可机器读取的规范文档。这才是一个人撬动百万行代码的真正杠杆。