从「能跑」到「能说」:第一个版本
起点很简单:给 Claude Code 一句「帮我把这篇育儿文章做成视频」。它直接开始分析文章结构,拆成 6 个场景,用 Remotion 搭建视频框架,画 SVG 角色和背景动画。
发现没有声音后,补一句「没有声音诶」,它立刻用 EdgeTTS 生成中文旁白,自动对齐时间轴,甚至还主动加了配音。不过 TTS 的声音太机械,后来换成了事先克隆好的个人声音,质感立刻从「AI 在念稿」变成「我在讲故事」。
这个体验揭示了一个有意思的时间窗口:AI 的能力已经足够强,但大多数人还没意识到可以这么用。
迭代:配色、字体、组件化
V1 跑通之后,开始加需求:
- 配色:原来的颜色太土,让 Claude Code 换成 Tailwind 的 pink/sky 色系,对标马卡龙风格。字体换成「jf open 粉圆」
- 组件化:这是最值得关注的设计思路——每个角色都是独立的 React 组件。想改爸爸的衣服颜色?改一行。想让宝宝从爬变成走?改一个 prop。想加新角色?复制粘贴,调参数
本质上就是前端组件化的思路,只不过输出从网页变成了视频。这意味着视频制作可以拥有和软件开发一样的能力:版本控制、可复用、自动化渲染。
思维转变:复杂不是限制
升级到 3D 版本之前,让 Claude Code 进入 Plan 模式分析方案,它给出了多个选项。一个关键决策是:全部选择最复杂的方案。
原因很简单——AI 说的「复杂」和「需要更多时间」,是对人的描述,不是对 AI 自己的限制。AI 不会累,不会烦,不会因为代码太长而偷懒。写 500 行和 5000 行,对它来说没区别。所以策略是:尽量选复杂方案,把脏活累活交给 AI。
最终它用 Three.js 基础几何体(球体、胶囊体、圆柱体)组合出了完整的 3D 角色,支持走路动画、表情变化(开心、哭泣、好奇、睡着)、手臂动作、多种姿态(站立、躺着、爬行)。
AI 解决的不只是已知问题
Claude Code 在 Plan 模式里还规划了更进阶的方案——用 Blender 建模导出 GLTF,配合 Mixamo 的骨骼动画库,甚至列出了 Sketchfab、Ready Player Me 这些免费模型资源。
这里有一个更深层的价值:AI 解决了「不知道自己不知道」的问题。最初只是想做个 3D 视频,但并不知道 Mixamo 这个动画库的存在,不知道 GLTF 是 3D 模型的通用格式,不知道 Sketchfab 有大量免费资源。AI 的头脑风暴能力,能帮你突破认知边界,扩展可能性空间。
踩坑记录:WebGL 上下文溢出
升级 3D 的过程不是一帆风顺的。渲染时报错:Error creating WebGL context。原因是 6 个 3D 场景同时创建 WebGL 上下文,超出浏览器限制。
把报错扔给 Claude Code,它立刻给出方案:
- 渲染器配置:把 OpenGL 渲染器从默认改成
angle-egl - 懒加载场景:只渲染当前帧 ±30 帧范围内的场景,其他场景不挂载
问题解决。「遇到报错 → 扔给 AI → 拿到方案」这个循环,是 AI 编程中最高效的工作方式。
快速上手:一行命令安装 Remotion Skills
用 Skills CLI 一键安装 Remotion 最佳实践,装完之后 Claude Code 就掌握了 Remotion 的项目结构组织、动画写法、音视频同步处理等全套知识。在 skills.sh 排行榜上,Remotion 排第 3,仅次于 React 和网页设计,安装量本身就说明了需求。
视频制作正在从「创意活」变成「工程活」——组件化、可复用、版本控制、自动化渲染,全是程序员熟悉的概念。你不需要会 Three.js,不需要会动画,甚至不需要会 Remotion,只需要会描述你想要什么。对 AI 来说,复杂从来不是限制,那只是人的限制。