一个 AI Agent 真实工作日：OpenClaw 多模型协作修 Bug、搭爬虫、造工具实录

模型切换：Gemini 3.1 的短暂体验

早上把 OpenClaw 的模型切换成 Gemini 3.1，体感效果非常强悍。但好景不长，后来模型无法调用，Pro 权限也被收回，怀疑可能是平台侧的临时开放或配置问题。如果有同样在 OpenClaw 中成功调用过 Gemini 3.1 的朋友，欢迎确认一下这个模型的实际可用状态。

多模型协作修 Bug

OpenClaw 的 x fetch 功能之前存在一个 Bug：无法抓取回复中包含的链接。先用 MiniMax 2.5 修复了主要问题，但遗留了一个楼中楼（嵌套回复）无法抓取的边界情况。随后切换到 Claude Opus 4.6，干净利落地解决了剩余问题。

这是一个很典型的多模型协作场景：用一个模型做初步修复，再用另一个模型处理遗留的难点。不同模型在不同类型的任务上各有优势，灵活切换比死磕一个模型效率高得多。

用 SubAgent 批量测试 Playwright 反检测方案

之前分享过一篇关于 playwright-bot-bypass 的文章，声称 99% 适配 Lobechat 浏览器。评论区积累了不少用户反馈和用法分享，于是用 x fetch 把这些评论抓取出来，开了多个 SubAgent 并行测试各种方案。

测试过程中直接把 Gemini 3.1 跑挂了，但副产物是沉淀出了一篇《Headless 已死》的技术文章草稿，后续会整理发布。这个工作流本身就很有参考价值：抓取社区讨论 → 提炼可执行方案 → 用 SubAgent 并行验证，省去了大量手动测试的时间。

扩展 x fetch 的平台支持

日常获取信息主要依赖两个渠道：推特和微信公众号。顺手测试了几个对爬虫比较友好的站点，更新了 x fetch，新增了对国内几家平台的支持。对于信息获取型的 Agent 来说，数据源的覆盖面直接决定了它的实用性。

x-analyzer 的有趣发现

用 x-analyzer 分析了两个互动量较高的推特账号，发现即使有数百条推文作为数据支撑，模型在推断用户星座这类"玄学"任务上依然表现得毫无头绪。这说明 LLM 的推理能力在某些缺乏逻辑关联的任务上存在天然瓶颈——数据量大不等于能推导出有意义的结论。

快速搭建 camofox_search 搜索工具

一天高强度操作下来，顺手做了个小工具 camofox_search()，集成到 x fetch 中，作为搜索功能的补充。这样就不用每次都依赖 Brave API 了，降低了对单一外部服务的依赖。

下一步：链接追踪小程序

晚上给 Agent 布置了一个新任务：做一个链接追踪小程序，用来监控分享出去的链接是否被阅读。这个需求本身不新鲜，市面上早有类似产品，但自己动手做的好处是可以完全定制追踪逻辑和通知方式。

一天下来最大的感受是：OpenClaw 这类 Agent 平台的价值不在于单次对话有多聪明，而在于你能把多个模型、多个工具串成一条自动化流水线。修 Bug、抓数据、跑测试、造工具——每一件事单独做都不难，但串起来之后效率是指数级的提升。建议刚上手的朋友从一个具体的小需求开始，比如先把 x fetch 跑通，再逐步叠加 SubAgent 和自定义工具。