起因:发现了一个视频制作技能
事情的起点很简单。在浏览AI应用的技能列表时,偶然发现了一个视频制作相关的技能模块。出于好奇,直接问了AI一个问题:「你可以如何来生成视频?」
AI给出的回答不是一句模糊的"可以试试",而是一套完整的工作流框架。更有意思的是接下来的操作——直接给AI下了一个"套娃"任务:让AI利用自己的视频生成功能,制作一条教程视频,教用户如何用它来生成视频。
换句话说,让工具自己拍一条"如何使用我"的说明书。
AI给出的三步工作流
AI拆解任务的方式相当清晰,分成三个阶段:
第一步:内容拆解
把教程主题拆分成5-8个逻辑段落,比如「问题介绍 → 步骤1 → 步骤2 → 步骤3 → 总结」。每段标注时长(1分钟视频的话,每段8-12秒),并为每段设计视觉呈现方式——是用截图演示,还是纯图文卡片。
第二步:逐段制作
对每一段分别处理:
- 用图像生成能力制作讲解配图,或用视频工具做带动画的段落
- 生成解说文案(这次选择了纯字幕方案,不需要语音)
- 用视频合成工具将图片、字幕、转场效果合成为单个段落视频
第三步:拼接成片
用 ffmpeg 将所有段落视频无缝拼接,加上开场和片尾,输出完整视频。
实际执行:一句需求,AI全程跑完
给AI的需求描述只有一句话的量级:做一个1分钟教程,内容是从打开App开始,如何使用视频技能,再加一段动画演示(比如"Orange先生每天起床后就开始玩AI Agent")。核心步骤、文案内容全部交给AI自己拆解和决定。
然后AI就真的开始干活了——拆内容、生成配图、合成段落、拼接成片。最终输出了一条完整的教程视频。
现阶段的能力边界
成片并不完美。很多画面还只是静态镜头,动画效果也比较基础。但关键不在于画质有多精致,而在于整个从需求到成片的链路已经跑通了。
这里面真正值得关注的是工作流的编排能力:内容规划、素材生成、视频合成、后期拼接,这几个环节被AI串联成了一条自动化流水线。每个环节单独看都不算新鲜,但组合在一起、由AI自主调度完成,这就是Agent能力的实际体现。
对独立创作者的启示
如果你是一个人在做内容——不管是教程、产品演示还是营销短视频——这个案例的思路可以直接借鉴:
- 把视频制作拆成模块化流程:脚本、配图、字幕、合成、拼接,每一步都可以交给AI工具处理
- 先跑通再优化:第一版不需要完美,先让AI把整条链路自动跑完,再针对具体段落手动调整
- 用"套娃测试"检验工具能力:让AI工具制作一条关于自身使用方法的教程,是快速摸清其能力边界的好办法
视频制作一直是独立创作者的时间黑洞。当AI能把"从零到成片"压缩到一次对话的长度,剩下的精力就可以花在真正需要人来把关的地方——选题判断和创意方向。