codex-proxy:Token不够用的先看这里
如果你只是单纯缺Token,有个叫codex-proxy的开源项目值得关注。它能接入Claude Code、Codex、Cursor、OpenClaw等主流AI编程工具,相当于在你和API之间加了一层代理调度。
部署方式有三种,挑适合自己的:
Docker部署(推荐):
git clone https://github.com/icebear0828/codex-proxy.git
cd codex-proxy
cp .env.example .env
# 复制配置模板,一般不需要改,直接用默认值
docker compose up -d
桌面客户端: 去GitHub Releases页面下载,Windows选.exe,Mac选.dmg。Mac用户第一次打开需要去「系统设置」→「隐私与安全性」里手动放行,后续就不用了。
装好之后根据url、key、model接入你的平台即可。注意:free账户已经不能用GPT 5.4了,5.4仅限会员。
如果你只是来解决Token焦虑的,到这就够了。下面是硬核拆解部分。
整体架构:四大模块各司其职
这套系统在架构上分为四个核心模块:记忆系统、本地模型、浏览器Web、Agent CLI。为什么要拆开?一是方便调试,二是这些模块本身就是日常高频使用的能力单元,把它们各自内化清楚之后再组合,远比糊成一坨要靠谱。
记忆系统:像写日记,不像填表格
记忆系统的设计思路很有意思——不搞复杂的数据库表结构去硬记一切,而是模仿人类写日记的方式,把信息拆成两层,落在本地文件里。
- 第一层:当天日志。 记录今天做了什么、踩了什么坑、怎么绕过去的。
- 第二层:长期记忆库(MEMORY.md)。 只保留以后还会复用的结论,比如某段脚本的固定用法、你对输出格式的偏好。
这个思路借鉴了Claude Code的记忆机制——外层是概要索引,通过映射文件不断维护。但有个现实问题:每个角色(soul)对应不同的用户画像,时间一长记忆会爆炸。所以额外引入了向量数据库,用的是Qwen Embedding模型。
说白了,这套设计参考了SillyTavern(AI角色扮演酒馆)的"世界书"概念,在此基础上叠加了本地RAG检索。
一个关键判断:grep适合你已经知道关键字、文件路径可预测的场景;向量检索适合语义模糊的查询。 从Cursor迁移到Claude Code的过程中会发现,Claude Code更倾向于调用grep搜文件而不是走向量数据库。两种方式各有适用场景,不是非此即彼。
执行逻辑:ReAct + Agent Loop
OpenClaw怎么实现自主写代码的?核心就是ReAct加Agent Loop这套机制。你可以把它想象成一条流水线:
- 原子任务: 单次循环只处理一个极小的任务单元,复杂工作拆成多个原子任务排队执行。
- 无状态: 每次运行都是独立进程,干完就退出,不留残余状态。
- 持久化: 进度、结论、待办全部写入硬盘文件(todo.md、MEMORY.md等)。
具体运行流程是这样的:
- 读档: 加载soul.md(角色约束)、User.md(用户偏好)、todo.md(具体事项)
- 推进: 在执行区按ReAct模式一轮轮推进任务
- 熔断与求援: 遇到验证码、高风险操作(删文件、覆盖配置)时立即停止,等人确认
- 归档: 任务完成后把新知识写入MEMORY.md,更新todo.md,进程退出
这个设计的精髓在于"熔断"——不是什么都让AI自己决定,危险操作必须人类兜底。这才是生产环境里靠谱的做法。
心跳系统:定时叫醒你的AI员工
Agent CLI内部又细分了多个板块:Web模块通过RPC操控浏览器,spawn agent就是子代理,调用完即解散。
"心跳"这个概念很形象——就是系统自带的定时闹钟。可以用cron、Windows任务计划或者常驻守护进程来触发。每次被叫醒,它执行一套固定动作:从硬盘读取关键文件,把本次要干的事拼成一份工单,然后开跑。
这里用的心跳配置是:n8n cron → Dashboard API → 空闲不到60分钟就巡检,超过60分钟就读TODO自主推进任务。
为什么选n8n而不是原生方案?两个原因:
- 编排方便: 用LLM写复杂的定时工作流,n8n天然适合。通过Skills能稳定生成专属工作流,生成图片、视频、语音只需要调用对应的Skills,原子化设计方便自由组合。
- 省Token: OpenClaw原生的那套调度机制,说实话烧不起。
Skills系统与圆桌会议
Skills体系也值得单独说。Bot分为通用Skills和私有Skills,并且内置了"圆桌会议"机制——多个Agent可以同时讨论问题。这个设计参考了Claude Code的Agent Team方案,利用JSON加Worktree实现并发沟通。
后续还会开源NotebookLM的CLI/Skills模块,可以直接喂给Claude Code或OpenClaw使用。
写在最后
这套架构的核心思想其实不复杂:把AI Agent当成一个需要日记本、闹钟和工作手册的实习生来管理。 记忆系统是日记本,心跳是闹钟,soul.md和Skills是工作手册。对于想搭建自己AI工作流的独立开发者来说,与其从零造轮子,不如先把这几个模块的设计逻辑吃透,再根据自己的实际场景做取舍——毕竟省Token这件事,架构层面的优化永远比找便宜API靠谱。