Codex 桌面版：从编程助手进化为多 Agent 自动化系统

不只是加了个界面

Codex 桌面版是一个图形化的 Coding Agent，支持同时启动多个 AI 编程助手并行工作。比如一个重构认证模块，一个写支付系统的单元测试，第三个处理代码格式问题——它们各自在独立的 Git 分支上干活，互不干扰。你在一个界面里监控所有进度，完成后看 diff、审代码、决定要不要合并。

侧边栏可以直接查看代码变更记录，不需要切到 VSCode，但目前还不支持直接编辑。

这个设计很实用。有点像手下有几个 24 小时不睡觉的初级程序员，你只负责做决策。

定时任务功能叫 Automations，能让 AI 定期执行一套工程动作，把结果交给你审阅。具体能干什么：

据说 OpenAI 内部也在拿它做 issue 分流、CI 故障总结、版本发布简报这些"值班活"。

两个关键限制要注意：

本地运行：App 必须开着定时器才会起作用，项目目录必须在本机。云端定时器还没上线，OpenAI 说在路上。

沙盒权限：只读模式下改文件、联网的调用都会失败；开到 full access 意味着它能在你电脑上为所欲为，不需要确认就能改东西、跑命令、联网。建议先手工跑一遍，确认影响范围，再上定时。

定时任务默认用 Git worktree 隔离，不干扰你的主工作区。跑完有发现就进收件箱，没事就自动归档——只有真的有事才来敲你。

一个 Skill 本质上是一个文件夹，核心是一个带 YAML 元数据的 SKILL.md，再配上可选的脚本、参考资料、模板资源。可以理解成：把"怎么做某件事"从聊天记录里抽出来，变成能版本控制、能共享、能复用的标准操作流程。

OpenAI 官方提供了一批现成的 Skills：

还有个内置的 Skill Creator，可以教 Codex 怎么用你公司内部的 API。据说 OpenAI 内部已经做了几百个自定义技能，用来跑评测、监控训练、自动写发布说明。

触发方式有两种：显式调用（提示词里点名 $skill-name）和隐式调用（Codex 根据任务自动判断）。更关键的是 Skills 和定时任务打通了，自动化任务里可以直接写 $skill-name，把"定时做事"升级成"定时按标准流程做事"。

两者都能写代码、都有 GUI，但调度哲学不太一样。

Claude Code 更强调开发者在旁边看着，一步步互动。Codex 则更想让你"撒手"，把任务扔给它，自己跑完来找你汇报。

几个具体差别：

并行隔离：Codex 把 worktree 做成一等公民，创建线程时直接选 Worktree 模式，自动化任务也默认用后台 worktree 跑。Claude Code 也支持并行，但更像手动拼装——你得先懂 Git worktree，然后在每个 worktree 里各跑一个实例。
自动化落点：Codex 是桌面内建的定时调度加收件箱回报，贴近个人工作站值班。Claude Code 更偏事件驱动和 CI 集成，通过 hooks 在编辑、任务结束等节点自动跑 shell 命令，把"定时"更多交给 CI 平台。
Skills：两边都基于 Agent Skills 开放标准，都能用 SKILL.md 加 YAML 元数据沉淀团队套路。但 Claude Code 在控制模型何时触发技能、怎么让子代理隔离执行这块，讲得更体系化。

市场层面，据报道 Claude Code 在企业客户里暂时领先，Netflix、Uber、Spotify 都在用。OpenAI 这次免费开放给所有用户试用（限时两个月），同时给付费用户翻倍配额，抢用户的意图很明显。

社区项目 OpenClaw（前身 ClawdBot）做得更激进：让 AI 不只写代码，还能帮你清邮件、订机票、管日程，像个住在电脑里的私人助理。

有意思的是，OpenClaw 的作者 Peter Steinberger 说整个项目都是用 Codex 写的，生产力翻了一倍。但他同时推荐用 Claude Opus 4.5 来跑 OpenClaw 的 Agent，因为更适合做通用任务。

这说明一个趋势：大家对"能真正帮你干活的 AI"有强烈需求。Codex 加 Skills 和定时任务，正是在往这个方向走。

别从"写代码更快"来评估，要从"把哪些重复劳动变成例行流程"来思考：

简单说，就是把你的重复性日常任务，变成 AI 自动执行的标准流程。

这次限时对 Free 和 Go 用户开放试用，Plus/Pro/Business/Enterprise 享受 2 倍用量。Sam Altman 说免费试用会持续两个月。

建议趁免费期重点试三个功能：多任务并行、定时任务、Skills。这三个才是这次更新真正的差异化，也是它从"编程助手"走向"自动化工作站"的关键一步。