Claude Fable 5 通过纯提示驱动,端到端生成 4K Launch 视频。从 17 个 Sony S-Log3 4K take(约 25GB)出发,流程包括:Whisper 逐词转录、Claude 作为子 agent 选片输出 JSON 编辑决策列表 (EDL)、FFmpeg 拼接粗剪、手写 7 个自定义 .cube LUT 颜色分级、通过 Remotion + Figma MCP 将 11 张设计 PNG 转为 React 组件并实现代码↔Figma 往返迭代。最终渲染 3840×2160@24fps、4334 帧、653MB 成品,全程未打开视频编辑器。
Claude Fable 5 实现零传统编辑的 Launch 视频生产:Remotion + FFmpeg + Figma MCP 端到端实践
来自 Claude Code 核心开发者 @trq212 的又一次高质量分享:他全程未打开任何传统视频编辑软件,仅通过提示驱动 Claude Fable 5 生成代码、调用工具、迭代优化,最终产出 4K、3 分钟成品视频。 https://thariqs.github.io/cc-video-editing-deck/
# 核心流程与关键步骤(高度结构化、可复现)
原材料准备:17 个拍摄 take(约 25GB Sony S-Log3 4K 原片),分为 4 个场景(Intro、Thought Partner、Goals & Verification、Be More Ambitious)。
Step 01:转录与理解 · 一条完整提示启动整个流程:要求使用 ElevenLabs / Whisper(本地 M4 Max 运行)对所有视频进行逐词时间戳转录。 · Claude 生成 JSON 格式的详细转录,支持精确到帧的定位(即使 Whisper 误听名字如 "Thariq" 为 "Sark",时间戳仍准确)。
Step 02-03:智能选片与剪辑决策 · Claude 作为子 agent 逐场景分析所有 take,挑选最佳版本(优先零 ums、完整脚本、干净结尾)。 · 输出 final-edit.json(EDL 编辑决策列表),包含每个 clip 的起止时间、候选 take、详细选片理由。 · 直接用 FFmpeg 执行 JSON,实现精确拼接(第一版可在几分钟内生成可观看的 2:50 粗剪)。Claude 还会自验证转录结果("zero ums")。
Step 04:颜色分级(Color Grading) · 从 S-Log3 平面原片出发,Claude 手写多个 .cube LUT(7 个自定义 LUT,如 neutral_cool_desat、warm_filmic 等)。 · 通过提示迭代生成示例,作者选择后应用 FFmpeg 编码。突出代理在专业视觉任务中的潜力(虽有色域专家指出可能存在细微 gamma/管理问题,但整体可用)。
Step 05-08:图形叠加与设计迭代(Remotion + Figma MCP) · 输入 11 张静态设计 PNG(interludes/overlays)。 · Claude 将 PNG 重构为 Remotion React 组件(JSX),每个文字、颜色、动画均为可提示参数。 · 定义全局 timing knobs(6 个关键帧参数)和 cue sheet(基于转录词时间戳精确对齐叠加,如在 "right" 一词出现帧上触发动画)。 · 通过 Figma MCP 导出为真实 Figma 文件,支持设计团队审阅/调整滑块。 · 设计反馈转回提示 → Claude 更新代码 → 重新渲染,实现高效 code <-> Figma 往返。
最终渲染:npx remotion render 生成 3840×2160@24fps、4334 帧、653MB 成品。 Claude 会先逐帧截图自审,再全渲染。整个过程在几天内完成(主要在 Jun 6-9),凌晨 6:24 交付。
底层架构("The edit is text") · 整个项目是一个代码仓库:转录 JSON、final-edit.json、LUT 文件、Remotion 组件、anim.tsx。 · 无时间线、无项目文件,一切可 diff、可 grep、可提示修改。 · 强调 agent 协作哲学:"Treat Claude like a thoughtful partner" - 给出清晰目标、验证方法,保持雄心。 · 结果:从 raw 文件夹到成品,agent 承担绝大部分"中间劳动",作者主要提供 taste 和最终把关。