Agent-Browser:AI 原生的 Playwright 封装
Agent-Browser 由 Vercel 团队开发,OpenClaw 也已内置集成。本质上,它是在 Playwright 之上封装了一层"AI 友好"的交互接口。
核心优势在于自然语言驱动:你可以在与 AI 对话时直接说"点击登录按钮",Agent-Browser 会自动探索页面元素并执行操作。
更实用的工作流是:先用 AI Coding 工具(如 Claude Code)通过自然语言探索完整的自动化流程,确认逻辑无误后,再让 AI 将其转换为 Playwright 生产代码。相当于先用 AI 画草图,满意后再输出工程图纸——整个过程既高效又节省 Token。
PinchTab:多实例浏览器编排引擎
PinchTab 是一个用 Go 编写的独立服务,核心是一个 12MB 的二进制文件。启动后提供 HTTP 服务,AI 可以通过 curl 调用来操控浏览器。
设计哲学是语言无关:不管你用 Python、Go 还是其他语言,只要能发 HTTP 请求就能接入。
最大卖点是多实例自动编排。如果你需要同时运行 10 个浏览器实例(比如管理 10 个不同的社交媒体账户),用 Playwright 需要自己管理端口、进程、配置文件路径。而 PinchTab 一行命令搞定:自动分配端口(9868、9869、9870……),配置文件管理和健康检查全部内置,且支持保存登录状态。
此外,PinchTab 还通过模拟人类鼠标轨迹和点击习惯来降低被反爬虫机制检测的风险。
如何选择
选 Agent-Browser 的场景:
- 主要用 TypeScript 开发,单实例足够
- 日常依赖 Claude Code 等 AI Coding 工具写代码
- 追求开发体验和快速迭代
- 背靠 Playwright 和 Vercel 生态,文档和社区支持完善
选 PinchTab 的场景:
- 需要同时管理多个账户,每个需要独立浏览器实例
- 技术栈是 Python 或 Go,不想引入 Node.js
- 需要部署为微服务,跑在 Docker 容器中
- 需要更强的反检测能力
小结
两款工具定位截然不同:Agent-Browser 是 AI Agent 开发者的首选探索工具,适合从原型到生产的渐进式开发;PinchTab 则是多实例编排的专业方案,适合需要规模化浏览器管理的场景。根据自己的技术栈和业务需求选择即可——这类基础设施级别的工具,从一开始就选对比后面迁移要省力得多。