先搞清楚两边在干什么

OpenClaw 是一个持久运行的 AI Agent,通过 Gateway 常驻,对接 WhatsApp、Telegram、Discord 等通讯平台。你用自然语言抛需求,它自己拆解、规划、调用工具、执行,整个 agent loop 跑完再回复你。听起来很美,问题在于这个 loop 每一轮到底吃掉多少 token。

Claude Code CLI 是 Anthropic 官方的命令行工具,底层跑的也是 agent loop,但它绑定 Pro 或 Max 订阅,月费固定,不按 token 另外收钱。你在终端里下指令,它跑完就结束,没有常驻 daemon,没有多通道路由。

两边都在烧 token,区别在于谁买单、怎么买。

OpenClaw 的 token 成本为什么容易失控

OpenClaw 每一轮对话送进模型的 prompt 不只是你打的那句话。它会把以下内容全部塞进 context window:

  • 系统指令(IDENTITY.md、SOUL.md、BOOT.md、AGENTS.md)
  • 完整的对话历史(跨 session 的 memory 也算)
  • 所有已启用的 skill schema
  • 所有已注册的 tool schema
  • 当前 session 状态

这些加起来,还没算你的 prompt,context 已经吃掉一大半。如果用的是 Opus 4.6,input token 单价本身就高,几轮对话下来账单就跳上去了。

更关键的是 OpenClaw 的设计是「对话式」的。一个任务可能跑 5-10 轮 agent loop,每一轮都重新塞一次完整 context。跟写一个 shell script 跑一次指令相比,token 消耗差一到两个数量级完全正常。

CLI 订阅赢在哪

成本可预测。 月费固定,不管跑多少次指令,账单不会因为某天 debug 比较久就翻倍。对每天都在用 AI 辅助开发的人来说,这是最大的优势。

可重放。 今天用 CLI 跑的任何操作,都可以包进 shell script、Makefile、CI pipeline 里。同一组指令,明天、下个月、换一台机器,结果一致。OpenClaw 的对话式交互几乎不可能精确重现同样的执行路径——agent 每次拆解任务的方式可能不同。

可审计。 指令在 script 里,输出在 log 里,变更在 git diff 里。出事了可以回溯、可以 rollback。OpenClaw 的对话记录当然也在,但要从一堆多轮对话里还原「到底改了什么」,远比看一个 git commit 困难。

安全面更干净。 CLI 跑完就结束,不需要常驻 Gateway,不需要开 WebSocket,不需要管第三方 skill 有没有被塞 prompt injection。OpenClaw 今年爆过 CVE-2026-25253,跨站 WebSocket 劫持直接 RCE,也有安全机构抓到第三方 skill 做数据外泄。CLI 的攻击面小得多。

OpenClaw 什么时候该用

不是完全不用,而是限缩场景:

  • 需求高度不确定,自己还没想清楚怎么拆的时候
  • 排障探索,需要 agent 自己去翻 log、试假设、来回验证
  • 人在手机上,没法开终端,通过 WhatsApp 或 Telegram 快速交办
  • 一次性的研究任务,不值得花时间先写脚本

但重点是:就算用 OpenClaw 完成了任务,最后一步一定要把结果固化成 CLI 脚本或 config。下次同样的事情不用再走 agent loop,直接跑脚本,不再重复烧 token。这一步很容易被忽略,但恰恰是省钱的关键。

实际操作建议

部署、更新、重启、备份、跑测试、批量任务、例行运维——全部走 CLI script。这些任务流程是确定的,写一次跑一辈子,零额外 token 消耗。

只有排障和探索性任务才开 OpenClaw,用完立刻整理成脚本归档。

订阅 Claude Max 或其他家的钱花得值不值,取决于你有多少工作量真的走 CLI。如果大部分工作搬到了 CLI,那个月费基本上是最划算的 AI 工具支出。反过来,如果全靠 OpenClaw 跑 API,账单会让你很有感觉。

省钱、可重放、可审计、可回滚——CLI 先行,Claw 备用。对于一人公司来说,把确定性的工作交给脚本、把探索性的工作交给 Agent,这个分工原则值得写进自己的运维手册里。