V
视频 IDE Round 00
M0 立项
2026-04-25
1
M1 P1 完成
2026-05-02
2
M2 P3 完成
2026-05-16
3
M3 demo 跑通
2026-06-06
4
M4 用户测试
2026-06-20
5
M5 GO/PIVOT/KILL
2026-07-04
2026-04-25 18:10 Day 4
Phase 1 Day 4 完成:R1-D 实时预览页 · Phase 1 完整 demo
把前 3 天的零件串成 PM 能直接用的产品形态:
  • 左侧 YAML 编辑器:textarea + 加载 3 个样例 + 清空按钮 + 实时 stats(shot 数 / 渲染时间 / 错误警告)
  • 右侧双视图:单 shot 详情(大图 + 字段表 + ←→ 翻页)/ 九宫格全貌(点击卡片跳到单 shot)
  • 错误/警告 banner:顶部红色错误 + 黄色警告,每条引用具体 shot 索引
  • 性能 ~150ms:debounce 150ms + 渲染 ~30-100ms,满足 PRD 的 <200ms 目标
  • 无框架:单 HTML + Vanilla JS + 3 个 CDN 依赖(rough.js / js-yaml / 自家两个 .js)
Phase 1 的"4 天 4 个产出"全部交付。立即体验 →
2026-04-25 17:55 Day 3
Phase 1 Day 3 完成:DSL Parser + 渲染器
把 Day 1 的 yaml 样例和 Day 2 的 SVG 原语库串起来:
  • render.js:parseYAML / validateScene / render 三步 + renderFromYAML 一站式 API
  • 严格 schema v0.1(15 字段)校验:必填检查 + 严格枚举(shot_type/angle/motion)+ 引用检查(subject/scene/cast)+ 弱枚举警告(action/emotion/light)
  • 有错误也照样渲染(开发体验 > 严格阻塞),错误展示在顶部 + shot 卡片对照
  • render-test.html:3 个 sample yaml 全部跑通,22 个 shot 全部通过 schema 验证
  • 性能:22 shot 总渲染 < 100ms(rough.js 抖动是主要开销,单 shot 平均 ~4ms)
2026-04-25 17:50 评审
导演 agent 三评 4.03/5.0 通过 → Day 3 启动放行
三轮评审进展:2.45 → 3.05 → 4.03(+1.58)。修了 5 个 P0 + 3 个 P1:
  • P0-1 30 姿态差异化(看望类 bug 修 + 坐卧类加接触面 + 站立类拉开)
  • P0-2 情绪嘴/眉放大 2.5x + 6 套辅助符号(泪/怒线/汗珠/抖动/上挑线/腮线)
  • P0-3 8 种运镜画面级视觉(同心矩形/水平箭头/垂直箭头/handheld 抖动)
  • P0-4 POV 不画主体 + letterbox + 8 字眼眶 + 十字取景器
  • P0-5 transition 标识右上角(⚡ SMASH / ◑◐ DISSOLVE 等)
  • 反建议③ roughness 1.4→2.4(更"粗炭笔牛皮纸"感)
导演原话:"这一轮的修复质量在我 35 年项目评审里是少见的——真修而非粉饰。"
2026-04-25 17:35 Day 2
Phase 1 Day 2 完成:SVG 原语库 + Gallery
600 行 primitives.js 实现完整原语库 + 一个视觉展示页 gallery.html
  • 30 种姿态(站立/行走/坐卧/看望/互动/情绪 6 类各 5 种)—— 火柴人 keypoint 系统
  • 10 种情绪 = 4 眉毛形态 × 6 嘴形组合
  • 5 种场景模板(cafe/street/interior/room/outdoor)
  • 7 种景别框(ECU/CU/MS/WS/EWS/OTS/2S,scale 区分)
  • 8 种运镜箭头(static/push/pull/pan-L/R/tilt-up/down/handheld)
  • 14 种光线背景(D-015 新增的 light 字段对应色调)
  • 10 种 cast 位置(D-015 新增的 cast.position 对应坐标)
  • 5 个完整 shot 渲染示范(用 3 个样例的代表性 shot)
技术:rough.js(CDN 4.6.6)+ Vanilla JS。立即查看 Gallery →
2026-04-25 17:24 决策
D-015:Schema 字段升级 10 → 15
基于 Day 1 写 3 样例发现:3/3 样例都用了 light 和 note,2/3 用了 transition,1/3 用了 cast 和 pov。 用户判断"早装比晚装好",5 个高频 meta 直接升格为 v0.1 正式字段:
  • light(光线/时辰,11 种枚举:dawn/golden-hour/midday/blue-hour/dusk/night/dim/very-dim/harsh-bright/noir/warm-yellow 等)
  • transition(转场,8 种枚举:cut/hard-cut/fade-in/fade-out/cross-dissolve/match-cut/smash-cut/snap)
  • cast(多角色 array:每元素 {subject, action, position} + 10 种位置枚举)
  • pov(主观视角 boolean)
  • note(导演意图/旁注,自由字符串)
3 个样例 yaml 全部重写,消除 meta.* 兜底。自评提升:情感 8→9 / 动作 7→8.5 / 悬疑 6→8。
2026-04-25 17:16 Day 1
Phase 1 Day 1 完成:DSL Schema v0.1 + 3 个样例
基于 PRD 通过后立即启动 Day 1,产出:
  • DSL Schema v0.1 规范:10 字段精确定义、严格枚举(shot_type/angle/motion)、鼓励枚举(action 30 种 + emotion 10 种)、ref+override 引用机制、meta 扩展槽、验证规则
  • 样例 1:咖啡店邂逅(情感)· 7 shots · 18s · 自评 8/10 表达力
  • 样例 2:街头追逐(动作)· 9 shots · 20s · 自评 7/10
  • 样例 3:悬疑开门(悬疑)· 6 shots · 15s · 自评 6/10(最薄弱,POV/光线/叙事节拍 都靠 meta 兜底)
心智模型边界发现:3 个样例都用了 meta.light 和 meta.note;Day 5 验证时考察是否升格为正式字段。详见 Round-01 索引
2026-04-25 17:04 PRD
Phase 1 PRD 完成 · 已通过
基于 9 个对齐过的设计决策(Q1-Q9)写完 Phase 1 PRD:
  • DSL Schema v0.1:10 字段 + meta 扩展槽 + ref+override 资产引用
  • SVG 原语库:30 种姿态 / 简笔人 + 服装颜色+图案 / 情绪线条+文字 / 5 场景模板
  • 渲染器 + 双视图实时预览页(单 shot 详情 + 九宫格切换)
  • 5 天节奏 + 3 个核心验证问题(心智模型/传达力/loop 体验)+ Kill 信号
PRD 通过用户 review 后才进入 Day 1(写 Schema + 3 个手工样例)。
2026-04-25 15:37 里程碑
M0 立项完成
Round-00 战略立项收官。完成的事:
  • 项目目录建立:~/Projects/video-ide/、~/Vault/Projects/视频IDE/
  • 核心文档 7 篇:项目规划、第一性原理、技术选型、网站组织规范、关键决策、文档索引、8 周路径(已废)
  • 关键决策 14 条(D-001 ~ D-014)
  • 项目主站搭建(5 板块结构)
2026-04-25 决策
D-012 节奏调整:从访谈先行切换为技术先行
原 D-004 决策"8 周访谈先行"被替换为新方案:
  • Phase 0 准备 → Phase 1 DSL+SVG → Phase 2 视频生成
  • Phase 3 短剧拆解 → Phase 4 多视图 demo → Phase 5 Roundtrip
  • Phase 6 用户测试 → Phase 7 优化
理由:用户偏好"先做技术 demo 再验证"的工作风格;技术原型能立刻暴露 DSL 设计的问题。
2026-04-25 讨论
第一性原理确立:结构先于内容
基于康德认识论 + 结构主义 + Schema Theory 的对偶推演——人类先用结构组织世界再认识它,创作作为认知的对偶动作必须结构先于内容。 这是项目最深层的根基,统一了之前所有的产品判断。
2026-04-25 讨论
合并双 session 讨论 → 战略基准成型
合并两个并行 session 的讨论:
  • 另一边 session:执行纪律强(8 周 SOP、Concierge MVP、4 个 Kill 信号)
  • 这边 session:架构思考强(L1-L17 体系、4 模块 + Harness、AI Native 视频 IDE 范式)
合并后形成 video-ide 项目的战略基准:5 个采纳分歧 + 4 条共识 + 10 条整合风险。