别让最贵的模型干所有活
这是账单炸裂的头号元凶。默认情况下,OpenClaw 会把每一个请求都丢给你设的主模型处理,包括每 30 分钟一次的心跳检测、子智能体的并行任务、随手问一句"我日历上有什么",统统走最贵的模型。
打个比方,用 Opus 处理心跳检测,就像请了个大律师帮你看信箱。能干吗?能。有必要吗?真没有。
做法很简单:设置分层模型配置。便宜快速的模型当主力,聪明但贵的模型当后备,只在真正需要深度推理的时候才调用。聊天中随时可以切——输入 /model Opus 干硬活,完事后 /model Haiku 切回来省钱。
有人就靠这一个改动,单次请求 Token 从 20k-40k 降到了 1.5k,月账单从 300 美元直接变 30 美元。十倍差距,就差一个配置。
你的智能体需要规则,而且是很多规则
开箱即用的 OpenClaw 就是一张白纸。它完全不知道你想让它怎么干活,所以会各种抽风:陷入死循环、翻来覆去说同样的话、忘掉之前的任务、做出莫名其妙的决定。
这很正常。你在网上看到那些炫酷演示,什么智能体一晚上搞定一个 App、像真人助手一样管邮件,背后都有一个你看不到的东西:大量定制化的指令集。
OpenClaw 用的是 Skills(技能)机制,就是包含 SKILL.md 指令文件的文件夹。你可以把技能理解成某个任务的「规则手册」——邮件处理、编码规范、日历管理,想建多少建多少。
规则写什么?实战中总结出来的几个方向:
- 明确告诉它什么该做、什么不该做
- 定义输出格式和质量标准
- 指定出错时的回退策略
- 限制它的行动边界
一个高级玩法我觉得挺妙的:让智能体自己写规则。对它说「回顾我们过去 10 条消息,看看出了什么问题,帮我写几条规则来避免」,然后把建议直接存成技能文件。用 AI 训练 AI,杠杆算是用对了。
「让它通宵干活」不是你以为的那样
这是最普遍的一个误解。很多人觉得把任务布置好去睡觉,智能体会自己干一整晚。但真相是:当你跟 OpenClaw 聊天时,对话是在一个 Session 里的。你关掉聊天或者走开,会话就结束了,智能体直接停了。
想让智能体按计划自动干活,你需要 Cron Jobs(定时任务)。简单说就是智能体的闹钟,到点它自动启动一个全新的、独立的会话来执行任务,干完把结果发给你。
最简单的用法是直接在聊天里让智能体帮你建:「创建一个每天早上 7 点运行的定时任务,检查我的紧急邮件,总结前 3 项,通过 Telegram 发给我。用 sessionTarget: 'isolated' 让它独立运行。」
关键就是 "sessionTarget": "isolated",这告诉系统起一个独立会话,不管你在不在线都能跑。
几个常用的 Cron 表达式供参考:
| 表达式 | 含义 |
|---|---|
0 7 * * * |
每天早上 7 点 |
0 */2 * * * |
每 2 小时一次 |
*/30 * * * * |
每 30 分钟一次 |
0 9 * * 1-5 |
工作日早上 9 点 |
0 22 * * * |
每天晚上 10 点 |
如果只是一次性任务(比如「今晚帮我把这个 App 搞出来」),可以建个定时任务跑完手动删,或者搞个任务队列——建一个文本文件,让定时任务每 30 分钟去检查有没有新任务。
从一个小任务开始,做到端到端跑通
我知道一口气把邮件、日历、Telegram、网页爬取、定时任务全设上的冲动有多强烈,想想就激动。但每加一个集成就多一个出错的地方,两个集成之间的交互 bug 能让你排查一整天,最后啥正事都没干成。
靠谱的路径其实很朴素:
- 挑一个特别小的流程,比如「每天早上 8 点检查天气,发消息给我」
- 把它做到完美——端到端可靠运行,不需要任何手动干预
- 稳定了再加下一项,比如邮件检查
- 逐层累加
调试的时候可以跑一下 openclaw doctor --fix,它能自动验证配置、做必要的迁移、修复常见问题。
管用的方法赶紧存下来
OpenClaw 用压缩(Compaction)来管理记忆。对话越来越长时,它会自动总结旧消息来腾出上下文窗口空间。结果就是:你之前折腾半天才搞定的配置和决策,可能一压缩就全没了。
应对方法有两个:
状态文件——智能体可以读写的持久文件,不会被压缩掉。直接对智能体说:「把当前项目状态存到 ~/.openclaw/workspace/memory/project-status.md 里,包括已完成的、进行中的、做过的决定、下一步计划。」
工作区文档——工作区里有几个特殊文件,智能体每次启动都会自动读取:
| 文件 | 用途 |
|---|---|
USER.md |
你的偏好、时区、做事风格 |
AGENTS.md |
智能体的行为准则 |
TOOLS.md |
哪些工具怎么用 |
HEARTBEAT.md |
心跳轮询时该检查什么 |
一句话原则:凡是花了你超过 5 分钟才调通的东西,赶紧写下来。你一定会再用到,而智能体一定会忘。
模型选得对不对,比什么都重要
大部分人对 OpenClaw 的挫败感,根源不在配置,而在模型不行。OpenClaw 不是聊天机器人,是智能体,它需要精准地调用浏览器、文件系统、终端命令、各种 API。一个模型文字写得再漂亮,如果工具调用的格式老出错,整个系统照样崩。另外模型至少得有 64,000 Token 的上下文窗口,不然容易溢出导致冻住。
各模型实际表现参考(截至目前的社区反馈):
| 模型 | 工具调用能力 | 成本 | 备注 |
|---|---|---|---|
| Claude Opus 4.6 | 极佳 | $$$ | 质量最高,当主模型太贵 |
| Claude Sonnet 4.5 | 极佳 | $$ | 全能选手,最佳性价比后备 |
| Claude Haiku 4.5 | 良好 | $ | 便宜,适合心跳和简单任务 |
| GPT-5.2 | 良好 | $$ | 稳健的备用选择 |
| MiniMax M2.1 | 良好 | $ | API 性价比高,社区热门 |
| Kimi K2 (API) | 良好 | $ | 工具调用能力强 |
| Gemini 3 Flash | 尚可 | ¢ | 极快约 250 tok/s,适合子智能体 |
| DeepSeek V3.2 | 尚可 | ¢ | 便宜,但别用 Reasoner 版本,工具调用容易出错 |
| GPT-5.1 Mini | 较弱 | ¢ | 极便宜,但干智能体的活很吃力 |
关于本地模型:如果你有好显卡(16GB 以上显存),可以用 Ollama 或 LM Studio 跑本地模型。建议拿本地模型(比如 Qwen3 8B 或 30B)当日常主力,把云端模型留给啃不动的硬骨头。本地加云端混合,是目前最划算的方案。
你没有问题,是这件事本身就挺难的
如果你折腾了两周感觉一事无成,放心,你不孤单,也没做错什么。OpenClaw 不是成品,它是一个早期阶段的、极其强大但也极其粗糙的框架。那些发帖说「智能体一晚上给我搞了个 App」的人,背后往往花了好几周甚至好几个月来调设置、写规则、建流程。你看到的是最终成果,中间的踩坑和崩溃他们没说。
三条实在建议:
- 像带新人一样对待它。 你不会指望新人第一天啥都会,你会给培训、定规矩、讲清楚习惯和偏好。智能体也一样,需要你花时间去「带」。
- 从成功标准清晰的任务入手。「帮我总结今天的邮件」比「帮我管理整个数字生活」靠谱一万倍。前者有明确的输入输出,后者太模糊,注定翻车。
- 善用社区。 你踩的坑大概率有人已经踩过了。OpenClaw 的 Discord 和 Reddit(r/openclaw)是找答案最快的地方。
最后附一个常见问题速查:
- 智能体陷入循环:加「严禁死循环」的规则
- 成本太高:切到分层模型配置,Haiku 为主,Opus 为辅
- 网关崩溃:跑一下
openclaw doctor --fix - 智能体冻住了:通常是上下文窗口太小,换模型或清理记忆
- 工具调用失败:检查模型是否支持结构化输出,或换 Claude 系列
说到底,智能体框架现阶段都还在「能用但需要调教」的状态。不管是 OpenClaw 还是别的框架,核心方法论是一样的:分层用模型控成本、写好规则让它有章可循、从小任务做起逐步扩展、把经验沉淀下来别让它忘。把这几件事做好,智能体才真的能帮你省时间,而不是反过来吃掉你的时间。