起因:发现了一个视频制作技能

事情的起点很简单。在浏览AI应用的技能列表时,偶然发现了一个视频制作相关的技能模块。出于好奇,直接问了AI一个问题:「你可以如何来生成视频?」

AI给出的回答不是一句模糊的"可以试试",而是一套完整的工作流框架。更有意思的是接下来的操作——直接给AI下了一个"套娃"任务:让AI利用自己的视频生成功能,制作一条教程视频,教用户如何用它来生成视频。

换句话说,让工具自己拍一条"如何使用我"的说明书。

AI给出的三步工作流

AI拆解任务的方式相当清晰,分成三个阶段:

第一步:内容拆解

把教程主题拆分成5-8个逻辑段落,比如「问题介绍 → 步骤1 → 步骤2 → 步骤3 → 总结」。每段标注时长(1分钟视频的话,每段8-12秒),并为每段设计视觉呈现方式——是用截图演示,还是纯图文卡片。

第二步:逐段制作

对每一段分别处理:

  • 用图像生成能力制作讲解配图,或用视频工具做带动画的段落
  • 生成解说文案(这次选择了纯字幕方案,不需要语音)
  • 用视频合成工具将图片、字幕、转场效果合成为单个段落视频

第三步:拼接成片

用 ffmpeg 将所有段落视频无缝拼接,加上开场和片尾,输出完整视频。

实际执行:一句需求,AI全程跑完

给AI的需求描述只有一句话的量级:做一个1分钟教程,内容是从打开App开始,如何使用视频技能,再加一段动画演示(比如"Orange先生每天起床后就开始玩AI Agent")。核心步骤、文案内容全部交给AI自己拆解和决定。

然后AI就真的开始干活了——拆内容、生成配图、合成段落、拼接成片。最终输出了一条完整的教程视频。

现阶段的能力边界

成片并不完美。很多画面还只是静态镜头,动画效果也比较基础。但关键不在于画质有多精致,而在于整个从需求到成片的链路已经跑通了

这里面真正值得关注的是工作流的编排能力:内容规划、素材生成、视频合成、后期拼接,这几个环节被AI串联成了一条自动化流水线。每个环节单独看都不算新鲜,但组合在一起、由AI自主调度完成,这就是Agent能力的实际体现。

对独立创作者的启示

如果你是一个人在做内容——不管是教程、产品演示还是营销短视频——这个案例的思路可以直接借鉴:

  • 把视频制作拆成模块化流程:脚本、配图、字幕、合成、拼接,每一步都可以交给AI工具处理
  • 先跑通再优化:第一版不需要完美,先让AI把整条链路自动跑完,再针对具体段落手动调整
  • 用"套娃测试"检验工具能力:让AI工具制作一条关于自身使用方法的教程,是快速摸清其能力边界的好办法

视频制作一直是独立创作者的时间黑洞。当AI能把"从零到成片"压缩到一次对话的长度,剩下的精力就可以花在真正需要人来把关的地方——选题判断和创意方向。