真实面经题目 · 原创解析
视频 AIGC 的多镜头与智能分镜调度能力,如何划分模型侧与产品侧交付边界,并设计可控参数、质量指标和异常兜底?
这题考视频 AIGC 产品经理能否划清模型能力、产品编排和用户控制之间的边界。好答案要讲清模型侧负责生成质量和多镜头一致性,产品侧负责工作流、参数控制、质量门禁和异常兜底,并用结构化分镜协议把两边衔接起来。
真实面经题目 · 原创解析
这题考视频 AIGC 产品经理能否划清模型能力、产品编排和用户控制之间的边界。好答案要讲清模型侧负责生成质量和多镜头一致性,产品侧负责工作流、参数控制、质量门禁和异常兜底,并用结构化分镜协议把两边衔接起来。
我会把多镜头和智能分镜调度拆成三层:模型侧能力、产品侧编排和交付侧质量保障。模型侧主要负责理解用户意图、生成分镜计划、保持角色和场景一致、控制运动和镜头语言、减少闪烁和跳变、提升画面质量与时序连贯。产品侧主要负责把用户目标转成可控输入,提供镜头数、时长、比例、风格、角色、场景、运镜、转场、节奏、参考素材和安全边界等参数,并把模型输出组织成用户能编辑、重试、替换和导出的工作流。 边界划分上,我会用“生成质量归模型、可控体验归产品、交付稳定性共同负责”来定义。模型不能只返回一段不可解释的视频,而要返回结构化分镜结果,比如每个镜头的时长、主体、动作、场景、镜头类型、运镜、转场、提示词、负向约束和依赖关系。产品侧基于这个结构化结果做预览、局部重生成、镜头锁定、参数调节、版本对比、失败重试和安全审核。这样模型能力和产品体验之间有清晰契约,而不是把所有问题都归因给模型。 指标上,模型侧要看指令遵循、多镜头一致性、角色一致性、场景连续性、运动自然度、转场合理性、视觉质量、安全违规率和生成成功率;产品侧要看任务完成率、首版采纳率、局部重试率、编辑时长、导出率、发布率、用户满意度、P95 生成时长和单位有效视频成本。异常兜底要覆盖模型不可用、超时、质量不达标、镜头不连贯、敏感内容、素材解析失败和成本超限,可以采取模板化分镜、降低镜头数、单镜头降级、只重生成问题镜头、锁定关键帧、转人工编辑或提示用户调整输入。
模型侧的核心交付是理解文本或素材意图,并生成符合主题、节奏和视觉约束的多镜头结果。它要尽量解决角色一致、场景一致、物体连续、动作自然、镜头衔接和风格稳定等问题。产品经理要把这些能力拆成可测试项,而不是笼统地说视频效果好。
产品侧要把复杂模型能力变成用户能理解的控制项,例如视频比例、总时长、镜头数、风格、角色设定、场景设定、节奏、运镜、转场、参考素材强度和安全范围。控制项不能无限堆叠,要按新手默认、专业高级和局部编辑分层,避免用户被参数淹没。
比较稳的做法是让模型输出结构化 storyboard schema,包括 shot_id、duration、scene、subject、action、camera、transition、style、prompt、negative_prompt、dependencies 和 risk_flags。产品侧基于这个协议做镜头列表、局部修改、镜头锁定、版本管理和质量校验。
模型质量可以看提示词遵循、主体一致性、时间连续性、运动稳定、转场合理、低质帧比例和安全命中。产品质量要看生成成功率、首版采纳、局部重试、编辑完成、导出发布、生成等待、失败恢复和成本。两类指标都要有,因为模型好不代表产品交付体验好。
视频 AIGC 很容易遇到超时、失败、角色漂移、镜头跳变、动作不自然、素材不合规或成本超限。兜底不能只是报错,应提供可执行路径:重试单个镜头、降低分辨率、减少镜头数、切换模板、保留脚本和分镜、提示用户补充约束,或者导出可编辑草稿。
模型侧迭代要通过离线样本、人工盲评和 badcase 回归;产品侧迭代要通过可用性测试和线上漏斗。交付边界不是甩锅机制,而是让每个问题能被归因:是模型不懂意图、分镜 schema 不完整、产品参数表达不清,还是质量门禁和兜底策略不足。
角色一致性、动作生成、场景理解、镜头语言生成和时序连贯主要应由模型提升。产品侧可以提供约束和校验,但如果靠大量硬规则拼接,视频会僵硬且扩展性差。
不是。参数要围绕用户决策分层,普通用户需要清晰默认值和少量关键控制,专业用户才需要镜头、运镜、节奏和参考强度等高级选项。参数过多会降低完成率。
可以从角色外观、服饰、场景、物体、动作方向、光照风格、镜头节奏和转场逻辑评估。离线用人工盲评和自动一致性检测,线上看局部重生成率、编辑率和放弃率。
要保留用户已输入的脚本、素材和分镜草稿,并给出可选择的恢复动作,例如重生成问题镜头、降低规格、减少镜头、切换模板或继续手动编辑。用户不应因为一次失败丢失全部进度。