一句话驱动 Claude Code：从纯文本到 3D 配音动画的全自动视频生成实践

从「能跑」到「能说」：第一个版本

起点很简单：给 Claude Code 一句「帮我把这篇育儿文章做成视频」。它直接开始分析文章结构，拆成 6 个场景，用 Remotion 搭建视频框架，画 SVG 角色和背景动画。

发现没有声音后，补一句「没有声音诶」，它立刻用 EdgeTTS 生成中文旁白，自动对齐时间轴，甚至还主动加了配音。不过 TTS 的声音太机械，后来换成了事先克隆好的个人声音，质感立刻从「AI 在念稿」变成「我在讲故事」。

这个体验揭示了一个有意思的时间窗口：AI 的能力已经足够强，但大多数人还没意识到可以这么用。

V1 跑通之后，开始加需求：

配色：原来的颜色太土，让 Claude Code 换成 Tailwind 的 pink/sky 色系，对标马卡龙风格。字体换成「jf open 粉圆」
组件化：这是最值得关注的设计思路——每个角色都是独立的 React 组件。想改爸爸的衣服颜色？改一行。想让宝宝从爬变成走？改一个 prop。想加新角色？复制粘贴，调参数

本质上就是前端组件化的思路，只不过输出从网页变成了视频。这意味着视频制作可以拥有和软件开发一样的能力：版本控制、可复用、自动化渲染。

升级到 3D 版本之前，让 Claude Code 进入 Plan 模式分析方案，它给出了多个选项。一个关键决策是：全部选择最复杂的方案。

原因很简单——AI 说的「复杂」和「需要更多时间」，是对人的描述，不是对 AI 自己的限制。AI 不会累，不会烦，不会因为代码太长而偷懒。写 500 行和 5000 行，对它来说没区别。所以策略是：尽量选复杂方案，把脏活累活交给 AI。

最终它用 Three.js 基础几何体（球体、胶囊体、圆柱体）组合出了完整的 3D 角色，支持走路动画、表情变化（开心、哭泣、好奇、睡着）、手臂动作、多种姿态（站立、躺着、爬行）。

Claude Code 在 Plan 模式里还规划了更进阶的方案——用 Blender 建模导出 GLTF，配合 Mixamo 的骨骼动画库，甚至列出了 Sketchfab、Ready Player Me 这些免费模型资源。

这里有一个更深层的价值：AI 解决了「不知道自己不知道」的问题。最初只是想做个 3D 视频，但并不知道 Mixamo 这个动画库的存在，不知道 GLTF 是 3D 模型的通用格式，不知道 Sketchfab 有大量免费资源。AI 的头脑风暴能力，能帮你突破认知边界，扩展可能性空间。

升级 3D 的过程不是一帆风顺的。渲染时报错：Error creating WebGL context。原因是 6 个 3D 场景同时创建 WebGL 上下文，超出浏览器限制。

把报错扔给 Claude Code，它立刻给出方案：

问题解决。「遇到报错 → 扔给 AI → 拿到方案」这个循环，是 AI 编程中最高效的工作方式。

用 Skills CLI 一键安装 Remotion 最佳实践，装完之后 Claude Code 就掌握了 Remotion 的项目结构组织、动画写法、音视频同步处理等全套知识。在 skills.sh 排行榜上，Remotion 排第 3，仅次于 React 和网页设计，安装量本身就说明了需求。

视频制作正在从「创意活」变成「工程活」——组件化、可复用、版本控制、自动化渲染，全是程序员熟悉的概念。你不需要会 Three.js，不需要会动画，甚至不需要会 Remotion，只需要会描述你想要什么。对 AI 来说，复杂从来不是限制，那只是人的限制。