核心逻辑

整套系统的数据流很简单:

  1. 把发票 PDF 发给 OpenClaw
  2. OpenClaw 调用 PaddleOCR Skills 提取发票的结构化信息(号码、日期、金额、税率等),以 JSON 格式返回
  3. OpenClaw 将 PDF 上传至飞书云空间
  4. 所有字段自动写入飞书多维表格

全程不需要手动填任何表单。技术栈三个组件各司其职:PaddleOCR Skills 负责文档解析(基于文心大模型体系训练),OpenClaw 负责 Agent 编排和自动化执行,飞书多维表格负责数据存储和管理。

搭建步骤

第一步:安装 PaddleOCR Skills

直接在 OpenClaw 中告诉它安装这个技能,它会自动从 ClawHub 拉取并完成安装。PaddleOCR Skills 目前已经上架 ClawHub,以 Skill 形式即插即用。

第二步:配置 API

核心操作是获取两个参数:API_URL 和 TOKEN。流程如下:

  • 打开 PaddleOCR 官网,上传一个发票 PDF 附件进行解析测试
  • 解析完成后,点击左上角的 API 入口
  • 完成手机号验证后,即可看到 API_URL 和 TOKEN
  • 将这两个参数复制到 OpenClaw 中,让它自动完成配置

配置完成后,上传任意 PDF 发票即可触发解析。PaddleOCR 的识别精度相当高,几乎能提取出所有可识别的字段,并以 JSON 结构化数据返回。

第三步:对接飞书多维表格

向 OpenClaw 输入以下提示词,让它自动创建飞书多维表格并建立字段映射:

帮我将该信息存入到飞书多维表格,我希望有的字段是:发票号码、发票类型、开票日期、开票人、购买方名称、购买方统一社会信用代码、销售方名称、销售方统一社会信用代码、开户银行、银行账号、合计费用项目名称、合计费用单价、合计费用数量、合计费用金额、合计费用税率、合计费用税额,以及上传发票附件到附件字段。

完成飞书授权后,表格自动创建。有一个细节需要注意:附件字段无法直接上传,需要先传到飞书云空间,再以超链接形式关联过去,这部分需要手动微调一下字段类型。

第四步:固化工作流

调整好多维表格的字段类型和名称后,再告诉 OpenClaw:

我整体修改了下《发票管理》多维表中的字段类型和名称,请你以后按照这个要求,我只需要上传发票附件给你,你就借助 PaddleOCR 技能帮我做解析后,把相应字段对应的存储到《发票管理》这个飞书多维表格。

至此,工作流固化完成。以后只需要往 OpenClaw 丢一个发票文件,解析、上传、录入全部自动执行。

实测数据

用两张发票做了完整测试,字段识别准确率 100%,连表格内的结构化数据都能完整提取。对于一人公司每月几十张发票的场景,这个方案基本消灭了手动录入的时间开销。

一个值得关注的趋势

这个案例真正有意思的地方不在发票本身,而在于能力交付方式的变化。以前做文档解析,需要自己调 API、写胶水代码、处理异常。现在 PaddleOCR 以 Skill 的形式上架 ClawHub,在 OpenClaw 里直接传文件就能用——大模型的能力正在通过 Skill 市场进入开发者的工具链,变成可以直接组合调用的标准化组件。

对独立开发者来说,这意味着搭建自动化工作流的门槛在持续降低。不需要写代码,不需要理解底层 API,只要会描述需求,就能把多个 Skill 编排成一条完整的业务流。当这类"能力即插即用"的基础设施足够成熟,一人公司能覆盖的业务复杂度会比现在再上一个台阶。