不只是加了个界面

Codex 桌面版是一个图形化的 Coding Agent,支持同时启动多个 AI 编程助手并行工作。比如一个重构认证模块,一个写支付系统的单元测试,第三个处理代码格式问题——它们各自在独立的 Git 分支上干活,互不干扰。你在一个界面里监控所有进度,完成后看 diff、审代码、决定要不要合并。

侧边栏可以直接查看代码变更记录,不需要切到 VSCode,但目前还不支持直接编辑。

这个设计很实用。有点像手下有几个 24 小时不睡觉的初级程序员,你只负责做决策。

定时任务:给自己雇个夜班值班员

定时任务功能叫 Automations,能让 AI 定期执行一套工程动作,把结果交给你审阅。具体能干什么:

  • 扫近期提交找潜在 bug
  • 从合并的 PR 里自动写 release notes
  • 总结昨天的 git 活动给站会用
  • 汇总 CI 失败和 flaky tests

据说 OpenAI 内部也在拿它做 issue 分流、CI 故障总结、版本发布简报这些"值班活"。

两个关键限制要注意:

本地运行:App 必须开着定时器才会起作用,项目目录必须在本机。云端定时器还没上线,OpenAI 说在路上。

沙盒权限:只读模式下改文件、联网的调用都会失败;开到 full access 意味着它能在你电脑上为所欲为,不需要确认就能改东西、跑命令、联网。建议先手工跑一遍,确认影响范围,再上定时。

定时任务默认用 Git worktree 隔离,不干扰你的主工作区。跑完有发现就进收件箱,没事就自动归档——只有真的有事才来敲你。

Skills:把团队套路变成可复用的操作卡片

一个 Skill 本质上是一个文件夹,核心是一个带 YAML 元数据的 SKILL.md,再配上可选的脚本、参考资料、模板资源。可以理解成:把"怎么做某件事"从聊天记录里抽出来,变成能版本控制、能共享、能复用的标准操作流程。

OpenAI 官方提供了一批现成的 Skills:

  • Figma 技能:把设计稿转成代码
  • Linear 技能:帮你管项目
  • 部署平台技能:Cloudflare、Vercel、Netlify
  • 办公技能:读写 PDF、表格、docx

还有个内置的 Skill Creator,可以教 Codex 怎么用你公司内部的 API。据说 OpenAI 内部已经做了几百个自定义技能,用来跑评测、监控训练、自动写发布说明。

触发方式有两种:显式调用(提示词里点名 $skill-name)和隐式调用(Codex 根据任务自动判断)。更关键的是 Skills 和定时任务打通了,自动化任务里可以直接写 $skill-name,把"定时做事"升级成"定时按标准流程做事"。

和 Claude Code 的差异

两者都能写代码、都有 GUI,但调度哲学不太一样。

Claude Code 更强调开发者在旁边看着,一步步互动。Codex 则更想让你"撒手",把任务扔给它,自己跑完来找你汇报。

几个具体差别:

  • 并行隔离:Codex 把 worktree 做成一等公民,创建线程时直接选 Worktree 模式,自动化任务也默认用后台 worktree 跑。Claude Code 也支持并行,但更像手动拼装——你得先懂 Git worktree,然后在每个 worktree 里各跑一个实例。
  • 自动化落点:Codex 是桌面内建的定时调度加收件箱回报,贴近个人工作站值班。Claude Code 更偏事件驱动和 CI 集成,通过 hooks 在编辑、任务结束等节点自动跑 shell 命令,把"定时"更多交给 CI 平台。
  • Skills:两边都基于 Agent Skills 开放标准,都能用 SKILL.md 加 YAML 元数据沉淀团队套路。但 Claude Code 在控制模型何时触发技能、怎么让子代理隔离执行这块,讲得更体系化。

市场层面,据报道 Claude Code 在企业客户里暂时领先,Netflix、Uber、Spotify 都在用。OpenAI 这次免费开放给所有用户试用(限时两个月),同时给付费用户翻倍配额,抢用户的意图很明显。

OpenClaw:一个值得关注的方向

社区项目 OpenClaw(前身 ClawdBot)做得更激进:让 AI 不只写代码,还能帮你清邮件、订机票、管日程,像个住在电脑里的私人助理。

有意思的是,OpenClaw 的作者 Peter Steinberger 说整个项目都是用 Codex 写的,生产力翻了一倍。但他同时推荐用 Claude Opus 4.5 来跑 OpenClaw 的 Agent,因为更适合做通用任务。

这说明一个趋势:大家对"能真正帮你干活的 AI"有强烈需求。Codex 加 Skills 和定时任务,正是在往这个方向走。

对一人公司意味着什么

别从"写代码更快"来评估,要从"把哪些重复劳动变成例行流程"来思考:

  • 每天早上自动扫 CI 失败,归因并给出修复建议,结果进收件箱,你只做决策
  • 每天自动生成 release 简报,把过去 24 小时的关键变更变成可读文档
  • 把最佳实践写成 Skills,新人、外包、甚至另一个 Agent 都按同一本操作手册来
  • 固定格式的文件处理(发票、报告、统计表),定期整理成干净的表格或 PDF
  • 内容工作者每周把素材文件夹里的新内容归档、生成摘要,只做最后审核

简单说,就是把你的重复性日常任务,变成 AI 自动执行的标准流程。

用量和定价

这次限时对 Free 和 Go 用户开放试用,Plus/Pro/Business/Enterprise 享受 2 倍用量。Sam Altman 说免费试用会持续两个月。

建议趁免费期重点试三个功能:多任务并行、定时任务、Skills。这三个才是这次更新真正的差异化,也是它从"编程助手"走向"自动化工作站"的关键一步。