一开始走了不少弯路
最初的想法很直接:告诉AI我要做什么项目、完成什么任务,让它直接写出来。但现实是,如果你自己的理论基础不够,连需求都描述不清楚,AI再强也帮不了你。试过两个AI搭配协作,试过一步步定位页面元素、用浏览器的操作记录器辅助,都不行。
后来换了个思路想通了:脚本本质上就是把一个操作流程重复执行。那如果我把一次完整的操作流程录制下来,再让AI根据录制内容来编写脚本,是不是就行了?
事实证明,这条路走通了。
具体怎么操作
需要准备三样东西:
- Claude Code(核心编程工具)
- 影刀(RPA录制工具)
- 全新浏览器(Edge 或 Chrome 都行)
以一个叫 Onvoyage 的项目举例,任务很简单:登录Google账号,点击签到,完成。整个操作流程是这样的:
- 在桌面创建一个项目文件夹(比如 Onvoyage)
- 安装影刀,新建一个PC端应用
- 给浏览器装上影刀插件,点击智能录制
- 手动把整个项目流程从头到尾做一遍,同时按 F12 打开开发者工具,把网络 → Fetch/XHR 请求下载保存到项目文件夹
- 流程结束后停止录制,右击主流程打开文件夹——里面就是刚才录制的操作程序和页面元素文件,复制文件路径
- 在项目文件夹里打开 Claude Code,让它阅读你下载的网络请求文件,再阅读录制操作和元素所在的文件夹,根据这些内容编写脚本
骨架有了,血肉自己填
上面这套流程就是骨架。剩下的部分可以根据自己的需求灵活调整:
- 准备好账号信息、代理信息
- 选择用什么编程语言
- 如果账号都在指纹浏览器里,可以把指纹浏览器的 API 和环境 ID 一起喂给 Claude Code,让脚本直接在指纹窗口内运行
说白了,能用脚本自动化的操作,底层套路都差不多。一旦你跑通了一套成熟的骨架,后面做新项目就是替换具体内容而已。
核心启发
这个方法最聪明的地方在于:不要求你会写代码,但要求你能清晰地把操作流程呈现给AI。 用RPA工具录制操作、用浏览器抓取网络请求,这两样东西组合起来,就是AI编写脚本最需要的上下文信息。
这其实是一个很好的AI协作范式——你负责"做一遍"并记录下来,AI负责把"做一遍"变成"做一万遍"。越写越熟练,成就感也是实打实的。
对于同样零基础但想用AI写脚本的人,方法用谁的不重要,重要的是动手去试。对和错都是在路上才能知道的事。