不只是加了个界面
Codex 桌面版是一个图形化的 Coding Agent,支持同时启动多个 AI 编程助手并行工作。比如一个重构认证模块,一个写支付系统的单元测试,第三个处理代码格式问题——它们各自在独立的 Git 分支上干活,互不干扰。你在一个界面里监控所有进度,完成后看 diff、审代码、决定要不要合并。
侧边栏可以直接查看代码变更记录,不需要切到 VSCode,但目前还不支持直接编辑。
这个设计很实用。有点像手下有几个 24 小时不睡觉的初级程序员,你只负责做决策。
定时任务:给自己雇个夜班值班员
定时任务功能叫 Automations,能让 AI 定期执行一套工程动作,把结果交给你审阅。具体能干什么:
- 扫近期提交找潜在 bug
- 从合并的 PR 里自动写 release notes
- 总结昨天的 git 活动给站会用
- 汇总 CI 失败和 flaky tests
据说 OpenAI 内部也在拿它做 issue 分流、CI 故障总结、版本发布简报这些"值班活"。
两个关键限制要注意:
本地运行:App 必须开着定时器才会起作用,项目目录必须在本机。云端定时器还没上线,OpenAI 说在路上。
沙盒权限:只读模式下改文件、联网的调用都会失败;开到 full access 意味着它能在你电脑上为所欲为,不需要确认就能改东西、跑命令、联网。建议先手工跑一遍,确认影响范围,再上定时。
定时任务默认用 Git worktree 隔离,不干扰你的主工作区。跑完有发现就进收件箱,没事就自动归档——只有真的有事才来敲你。
Skills:把团队套路变成可复用的操作卡片
一个 Skill 本质上是一个文件夹,核心是一个带 YAML 元数据的 SKILL.md,再配上可选的脚本、参考资料、模板资源。可以理解成:把"怎么做某件事"从聊天记录里抽出来,变成能版本控制、能共享、能复用的标准操作流程。
OpenAI 官方提供了一批现成的 Skills:
- Figma 技能:把设计稿转成代码
- Linear 技能:帮你管项目
- 部署平台技能:Cloudflare、Vercel、Netlify
- 办公技能:读写 PDF、表格、docx
还有个内置的 Skill Creator,可以教 Codex 怎么用你公司内部的 API。据说 OpenAI 内部已经做了几百个自定义技能,用来跑评测、监控训练、自动写发布说明。
触发方式有两种:显式调用(提示词里点名 $skill-name)和隐式调用(Codex 根据任务自动判断)。更关键的是 Skills 和定时任务打通了,自动化任务里可以直接写 $skill-name,把"定时做事"升级成"定时按标准流程做事"。
和 Claude Code 的差异
两者都能写代码、都有 GUI,但调度哲学不太一样。
Claude Code 更强调开发者在旁边看着,一步步互动。Codex 则更想让你"撒手",把任务扔给它,自己跑完来找你汇报。
几个具体差别:
- 并行隔离:Codex 把 worktree 做成一等公民,创建线程时直接选 Worktree 模式,自动化任务也默认用后台 worktree 跑。Claude Code 也支持并行,但更像手动拼装——你得先懂 Git worktree,然后在每个 worktree 里各跑一个实例。
- 自动化落点:Codex 是桌面内建的定时调度加收件箱回报,贴近个人工作站值班。Claude Code 更偏事件驱动和 CI 集成,通过 hooks 在编辑、任务结束等节点自动跑 shell 命令,把"定时"更多交给 CI 平台。
- Skills:两边都基于 Agent Skills 开放标准,都能用
SKILL.md加 YAML 元数据沉淀团队套路。但 Claude Code 在控制模型何时触发技能、怎么让子代理隔离执行这块,讲得更体系化。
市场层面,据报道 Claude Code 在企业客户里暂时领先,Netflix、Uber、Spotify 都在用。OpenAI 这次免费开放给所有用户试用(限时两个月),同时给付费用户翻倍配额,抢用户的意图很明显。
OpenClaw:一个值得关注的方向
社区项目 OpenClaw(前身 ClawdBot)做得更激进:让 AI 不只写代码,还能帮你清邮件、订机票、管日程,像个住在电脑里的私人助理。
有意思的是,OpenClaw 的作者 Peter Steinberger 说整个项目都是用 Codex 写的,生产力翻了一倍。但他同时推荐用 Claude Opus 4.5 来跑 OpenClaw 的 Agent,因为更适合做通用任务。
这说明一个趋势:大家对"能真正帮你干活的 AI"有强烈需求。Codex 加 Skills 和定时任务,正是在往这个方向走。
对一人公司意味着什么
别从"写代码更快"来评估,要从"把哪些重复劳动变成例行流程"来思考:
- 每天早上自动扫 CI 失败,归因并给出修复建议,结果进收件箱,你只做决策
- 每天自动生成 release 简报,把过去 24 小时的关键变更变成可读文档
- 把最佳实践写成 Skills,新人、外包、甚至另一个 Agent 都按同一本操作手册来
- 固定格式的文件处理(发票、报告、统计表),定期整理成干净的表格或 PDF
- 内容工作者每周把素材文件夹里的新内容归档、生成摘要,只做最后审核
简单说,就是把你的重复性日常任务,变成 AI 自动执行的标准流程。
用量和定价
这次限时对 Free 和 Go 用户开放试用,Plus/Pro/Business/Enterprise 享受 2 倍用量。Sam Altman 说免费试用会持续两个月。
建议趁免费期重点试三个功能:多任务并行、定时任务、Skills。这三个才是这次更新真正的差异化,也是它从"编程助手"走向"自动化工作站"的关键一步。