模型切换:Gemini 3.1 的短暂体验
早上把 OpenClaw 的模型切换成 Gemini 3.1,体感效果非常强悍。但好景不长,后来模型无法调用,Pro 权限也被收回,怀疑可能是平台侧的临时开放或配置问题。如果有同样在 OpenClaw 中成功调用过 Gemini 3.1 的朋友,欢迎确认一下这个模型的实际可用状态。
多模型协作修 Bug
OpenClaw 的 x fetch 功能之前存在一个 Bug:无法抓取回复中包含的链接。先用 MiniMax 2.5 修复了主要问题,但遗留了一个楼中楼(嵌套回复)无法抓取的边界情况。随后切换到 Claude Opus 4.6,干净利落地解决了剩余问题。
这是一个很典型的多模型协作场景:用一个模型做初步修复,再用另一个模型处理遗留的难点。不同模型在不同类型的任务上各有优势,灵活切换比死磕一个模型效率高得多。
用 SubAgent 批量测试 Playwright 反检测方案
之前分享过一篇关于 playwright-bot-bypass 的文章,声称 99% 适配 Lobechat 浏览器。评论区积累了不少用户反馈和用法分享,于是用 x fetch 把这些评论抓取出来,开了多个 SubAgent 并行测试各种方案。
测试过程中直接把 Gemini 3.1 跑挂了,但副产物是沉淀出了一篇《Headless 已死》的技术文章草稿,后续会整理发布。这个工作流本身就很有参考价值:抓取社区讨论 → 提炼可执行方案 → 用 SubAgent 并行验证,省去了大量手动测试的时间。
扩展 x fetch 的平台支持
日常获取信息主要依赖两个渠道:推特和微信公众号。顺手测试了几个对爬虫比较友好的站点,更新了 x fetch,新增了对国内几家平台的支持。对于信息获取型的 Agent 来说,数据源的覆盖面直接决定了它的实用性。
x-analyzer 的有趣发现
用 x-analyzer 分析了两个互动量较高的推特账号,发现即使有数百条推文作为数据支撑,模型在推断用户星座这类"玄学"任务上依然表现得毫无头绪。这说明 LLM 的推理能力在某些缺乏逻辑关联的任务上存在天然瓶颈——数据量大不等于能推导出有意义的结论。
快速搭建 camofox_search 搜索工具
一天高强度操作下来,顺手做了个小工具 camofox_search(),集成到 x fetch 中,作为搜索功能的补充。这样就不用每次都依赖 Brave API 了,降低了对单一外部服务的依赖。
下一步:链接追踪小程序
晚上给 Agent 布置了一个新任务:做一个链接追踪小程序,用来监控分享出去的链接是否被阅读。这个需求本身不新鲜,市面上早有类似产品,但自己动手做的好处是可以完全定制追踪逻辑和通知方式。
一天下来最大的感受是:OpenClaw 这类 Agent 平台的价值不在于单次对话有多聪明,而在于你能把多个模型、多个工具串成一条自动化流水线。修 Bug、抓数据、跑测试、造工具——每一件事单独做都不难,但串起来之后效率是指数级的提升。建议刚上手的朋友从一个具体的小需求开始,比如先把 x fetch 跑通,再逐步叠加 SubAgent 和自定义工具。