Token焦虑终结指南：拆解OpenClaw架构与省Token代理工具实战

codex-proxy：Token不够用的先看这里

如果你只是单纯缺Token，有个叫codex-proxy的开源项目值得关注。它能接入Claude Code、Codex、Cursor、OpenClaw等主流AI编程工具，相当于在你和API之间加了一层代理调度。

部署方式有三种，挑适合自己的：

Docker部署（推荐）：

git clone https://github.com/icebear0828/codex-proxy.git
cd codex-proxy
cp .env.example .env
# 复制配置模板，一般不需要改，直接用默认值
docker compose up -d

桌面客户端： 去GitHub Releases页面下载，Windows选.exe，Mac选.dmg。Mac用户第一次打开需要去「系统设置」→「隐私与安全性」里手动放行，后续就不用了。

装好之后根据url、key、model接入你的平台即可。注意：free账户已经不能用GPT 5.4了，5.4仅限会员。

如果你只是来解决Token焦虑的，到这就够了。下面是硬核拆解部分。

整体架构：四大模块各司其职

这套系统在架构上分为四个核心模块：记忆系统、本地模型、浏览器Web、Agent CLI。为什么要拆开？一是方便调试，二是这些模块本身就是日常高频使用的能力单元，把它们各自内化清楚之后再组合，远比糊成一坨要靠谱。

记忆系统：像写日记，不像填表格

记忆系统的设计思路很有意思——不搞复杂的数据库表结构去硬记一切，而是模仿人类写日记的方式，把信息拆成两层，落在本地文件里。

第一层：当天日志。 记录今天做了什么、踩了什么坑、怎么绕过去的。
第二层：长期记忆库（MEMORY.md）。 只保留以后还会复用的结论，比如某段脚本的固定用法、你对输出格式的偏好。

这个思路借鉴了Claude Code的记忆机制——外层是概要索引，通过映射文件不断维护。但有个现实问题：每个角色（soul）对应不同的用户画像，时间一长记忆会爆炸。所以额外引入了向量数据库，用的是Qwen Embedding模型。

说白了，这套设计参考了SillyTavern（AI角色扮演酒馆）的"世界书"概念，在此基础上叠加了本地RAG检索。

一个关键判断：grep适合你已经知道关键字、文件路径可预测的场景；向量检索适合语义模糊的查询。 从Cursor迁移到Claude Code的过程中会发现，Claude Code更倾向于调用grep搜文件而不是走向量数据库。两种方式各有适用场景，不是非此即彼。

执行逻辑：ReAct + Agent Loop

OpenClaw怎么实现自主写代码的？核心就是ReAct加Agent Loop这套机制。你可以把它想象成一条流水线：

原子任务： 单次循环只处理一个极小的任务单元，复杂工作拆成多个原子任务排队执行。
无状态： 每次运行都是独立进程，干完就退出，不留残余状态。
持久化： 进度、结论、待办全部写入硬盘文件（todo.md、MEMORY.md等）。

具体运行流程是这样的：

读档： 加载soul.md（角色约束）、User.md（用户偏好）、todo.md（具体事项）
推进： 在执行区按ReAct模式一轮轮推进任务
熔断与求援： 遇到验证码、高风险操作（删文件、覆盖配置）时立即停止，等人确认
归档： 任务完成后把新知识写入MEMORY.md，更新todo.md，进程退出

这个设计的精髓在于"熔断"——不是什么都让AI自己决定，危险操作必须人类兜底。这才是生产环境里靠谱的做法。

心跳系统：定时叫醒你的AI员工

Agent CLI内部又细分了多个板块：Web模块通过RPC操控浏览器，spawn agent就是子代理，调用完即解散。

"心跳"这个概念很形象——就是系统自带的定时闹钟。可以用cron、Windows任务计划或者常驻守护进程来触发。每次被叫醒，它执行一套固定动作：从硬盘读取关键文件，把本次要干的事拼成一份工单，然后开跑。

这里用的心跳配置是：n8n cron → Dashboard API → 空闲不到60分钟就巡检，超过60分钟就读TODO自主推进任务。

为什么选n8n而不是原生方案？两个原因：

编排方便： 用LLM写复杂的定时工作流，n8n天然适合。通过Skills能稳定生成专属工作流，生成图片、视频、语音只需要调用对应的Skills，原子化设计方便自由组合。
省Token： OpenClaw原生的那套调度机制，说实话烧不起。

Skills系统与圆桌会议

Skills体系也值得单独说。Bot分为通用Skills和私有Skills，并且内置了"圆桌会议"机制——多个Agent可以同时讨论问题。这个设计参考了Claude Code的Agent Team方案，利用JSON加Worktree实现并发沟通。

后续还会开源NotebookLM的CLI/Skills模块，可以直接喂给Claude Code或OpenClaw使用。

写在最后

这套架构的核心思想其实不复杂：把AI Agent当成一个需要日记本、闹钟和工作手册的实习生来管理。 记忆系统是日记本，心跳是闹钟，soul.md和Skills是工作手册。对于想搭建自己AI工作流的独立开发者来说，与其从零造轮子，不如先把这几个模块的设计逻辑吃透，再根据自己的实际场景做取舍——毕竟省Token这件事，架构层面的优化永远比找便宜API靠谱。