PaddleOCR + OpenClaw + 飞书多维表格：30秒完成发票自动识别入库

核心逻辑

整套系统的数据流很简单：

把发票 PDF 发给 OpenClaw
OpenClaw 调用 PaddleOCR Skills 提取发票的结构化信息（号码、日期、金额、税率等），以 JSON 格式返回
OpenClaw 将 PDF 上传至飞书云空间
所有字段自动写入飞书多维表格

全程不需要手动填任何表单。技术栈三个组件各司其职：PaddleOCR Skills 负责文档解析（基于文心大模型体系训练），OpenClaw 负责 Agent 编排和自动化执行，飞书多维表格负责数据存储和管理。

搭建步骤

第一步：安装 PaddleOCR Skills

直接在 OpenClaw 中告诉它安装这个技能，它会自动从 ClawHub 拉取并完成安装。PaddleOCR Skills 目前已经上架 ClawHub，以 Skill 形式即插即用。

第二步：配置 API

核心操作是获取两个参数：API_URL 和 TOKEN。流程如下：

打开 PaddleOCR 官网，上传一个发票 PDF 附件进行解析测试
解析完成后，点击左上角的 API 入口
完成手机号验证后，即可看到 API_URL 和 TOKEN
将这两个参数复制到 OpenClaw 中，让它自动完成配置

配置完成后，上传任意 PDF 发票即可触发解析。PaddleOCR 的识别精度相当高，几乎能提取出所有可识别的字段，并以 JSON 结构化数据返回。

第三步：对接飞书多维表格

向 OpenClaw 输入以下提示词，让它自动创建飞书多维表格并建立字段映射：

帮我将该信息存入到飞书多维表格，我希望有的字段是：发票号码、发票类型、开票日期、开票人、购买方名称、购买方统一社会信用代码、销售方名称、销售方统一社会信用代码、开户银行、银行账号、合计费用项目名称、合计费用单价、合计费用数量、合计费用金额、合计费用税率、合计费用税额，以及上传发票附件到附件字段。

完成飞书授权后，表格自动创建。有一个细节需要注意：附件字段无法直接上传，需要先传到飞书云空间，再以超链接形式关联过去，这部分需要手动微调一下字段类型。

第四步：固化工作流

调整好多维表格的字段类型和名称后，再告诉 OpenClaw：

我整体修改了下《发票管理》多维表中的字段类型和名称，请你以后按照这个要求，我只需要上传发票附件给你，你就借助 PaddleOCR 技能帮我做解析后，把相应字段对应的存储到《发票管理》这个飞书多维表格。

至此，工作流固化完成。以后只需要往 OpenClaw 丢一个发票文件，解析、上传、录入全部自动执行。

实测数据

用两张发票做了完整测试，字段识别准确率 100%，连表格内的结构化数据都能完整提取。对于一人公司每月几十张发票的场景，这个方案基本消灭了手动录入的时间开销。

一个值得关注的趋势

这个案例真正有意思的地方不在发票本身，而在于能力交付方式的变化。以前做文档解析，需要自己调 API、写胶水代码、处理异常。现在 PaddleOCR 以 Skill 的形式上架 ClawHub，在 OpenClaw 里直接传文件就能用——大模型的能力正在通过 Skill 市场进入开发者的工具链，变成可以直接组合调用的标准化组件。

对独立开发者来说，这意味着搭建自动化工作流的门槛在持续降低。不需要写代码，不需要理解底层 API，只要会描述需求，就能把多个 Skill 编排成一条完整的业务流。当这类"能力即插即用"的基础设施足够成熟，一人公司能覆盖的业务复杂度会比现在再上一个台阶。