让AI自己拍了一条教自己怎么用的教学视频，全程零人工参与

起因：发现了一个视频制作技能

事情的起点很简单。在浏览AI应用的技能列表时，偶然发现了一个视频制作相关的技能模块。出于好奇，直接问了AI一个问题：「你可以如何来生成视频？」

AI给出的回答不是一句模糊的"可以试试"，而是一套完整的工作流框架。更有意思的是接下来的操作——直接给AI下了一个"套娃"任务：让AI利用自己的视频生成功能，制作一条教程视频，教用户如何用它来生成视频。

换句话说，让工具自己拍一条"如何使用我"的说明书。

AI拆解任务的方式相当清晰，分成三个阶段：

第一步：内容拆解

把教程主题拆分成5-8个逻辑段落，比如「问题介绍 → 步骤1 → 步骤2 → 步骤3 → 总结」。每段标注时长（1分钟视频的话，每段8-12秒），并为每段设计视觉呈现方式——是用截图演示，还是纯图文卡片。

第二步：逐段制作

对每一段分别处理：

第三步：拼接成片

用 ffmpeg 将所有段落视频无缝拼接，加上开场和片尾，输出完整视频。

给AI的需求描述只有一句话的量级：做一个1分钟教程，内容是从打开App开始，如何使用视频技能，再加一段动画演示（比如"Orange先生每天起床后就开始玩AI Agent"）。核心步骤、文案内容全部交给AI自己拆解和决定。

然后AI就真的开始干活了——拆内容、生成配图、合成段落、拼接成片。最终输出了一条完整的教程视频。

成片并不完美。很多画面还只是静态镜头，动画效果也比较基础。但关键不在于画质有多精致，而在于整个从需求到成片的链路已经跑通了。

这里面真正值得关注的是工作流的编排能力：内容规划、素材生成、视频合成、后期拼接，这几个环节被AI串联成了一条自动化流水线。每个环节单独看都不算新鲜，但组合在一起、由AI自主调度完成，这就是Agent能力的实际体现。

如果你是一个人在做内容——不管是教程、产品演示还是营销短视频——这个案例的思路可以直接借鉴：

视频制作一直是独立创作者的时间黑洞。当AI能把"从零到成片"压缩到一次对话的长度，剩下的精力就可以花在真正需要人来把关的地方——选题判断和创意方向。