真实面经题目 · 原创解析

AIGC 画本产品如何保证角色、风格和场景一致性,ComfyUI 工作流、参考图、种子、ControlNet 和后处理分别起什么作用?

这题考 AIGC 产品经理是否理解图像生成一致性不是单靠提示词,而是由角色设定、参考资产、工作流编排、可控生成、种子复现、后处理和质量评估共同保证。

出现于:美团 · 产品

60 秒回答模板

我会先把画本一致性拆成角色一致、风格一致、场景一致和叙事连续四类。角色一致看人物的脸型、发型、服饰、年龄、配饰和身份特征是否稳定;风格一致看画风、线条、色彩、光影和材质是否统一;场景一致看地点、道具、空间关系和镜头逻辑是否前后不冲突;叙事连续看每页画面是否服务同一故事。实现上不能只靠一句 Prompt。第一层是资产和规则:建立角色卡、世界观、风格板、禁用词、页面脚本和镜头表。第二层是 ComfyUI 工作流,把文本提示、参考图、模型、ControlNet、采样器、种子、局部重绘、放大和后处理节点串成可复用 pipeline,让每页生成可追踪、可复现、可批量调参。第三层是参考图,它负责把角色外观和风格锚住,可以配合图生图、IP-Adapter、角色 LoRA 或风格参考使用;但参考强度太高会抄图,太低又会漂。第四层是种子,它主要保证同一配置下随机初始化可复现,适合对比调参和批量生成候选,但不能单独保证角色语义一致。第五层是 ControlNet,它用姿态、边缘、深度、分割、草图等条件约束构图、动作和场景结构,解决“同一角色做不同动作、同一空间换镜头”的可控性。第六层是后处理和质检,包括局部重绘修脸修手、统一色调、超分、排版、文字处理、人审和自动指标回归。产品上要把这些能力包装成稳定流程,并用角色相似度、风格一致性、提示词遵循、重生成率、人工修改率和用户接受率来评估。

考点 一致性先拆维度
难度 真实面经题
回答目标 让候选人能从产品和技术协作角度解释 AIGC 画本一致性:先定义一致性维度,再说明 ComfyUI、参考图、seed、ControlNet、后处理和评估闭环分别解决什么问题。

深入解析

01

先定义一致性和前置资产

AIGC 画本的一致性不只是“看起来像同一个人”。角色一致包括五官、发型、服装、体型、年龄、表情气质和关键配饰;风格一致包括绘本风格、线条粗细、色彩、光影、材质和渲染方式;场景一致包括空间布局、道具、时间、天气和镜头连续性;叙事一致包括角色行为和故事节奏。稳定流程应先沉淀角色卡、风格板、世界观、页面脚本、镜头表和负面约束,否则每页临时写 Prompt 很容易出现衣服变、年龄变、场景跳和风格漂。

02

ComfyUI 负责把流程节点化

ComfyUI 的价值在于把生成过程变成可视化、可复用、可追踪的节点工作流。产品或算法团队可以把模型选择、提示词模板、参考图输入、ControlNet 条件、采样器、CFG、seed、图生图强度、局部重绘、超分和导出规则串起来。这样每页画面不是一次性的手工尝试,而是同一套 pipeline 下的可控变体,便于批量生成、对比实验和问题定位。

03

参考图锚定身份和风格

参考图用于告诉模型“这个角色或这种画风长什么样”。角色参考可以稳定脸型、发型、服装和配饰,风格参考可以稳定色彩、笔触和材质。工程上可以结合图生图、参考图适配、角色 LoRA 或风格 LoRA 等方式。关键是控制参考强度:太弱会角色漂移,太强会姿态僵硬或过度复制原图;多角色、多镜头时还要保证每个角色的参考资产和提示词绑定准确。

04

Seed 保证复现但不保证理解

种子的作用是固定随机初始状态,让同一模型、同一参数、同一提示词和同一工作流下的输出可复现。它很适合做 A/B 调参、找稳定候选和回滚线上问题。但 seed 不是语义约束,换了 Prompt、模型、分辨率、采样器或控制条件,结果仍可能变化;即使 seed 相同,也不能保证跨页面角色一致。面试中要明确:seed 是复现工具,不是角色一致性的核心方案。

05

ControlNet 约束结构和动作

ControlNet 通过额外条件控制图像结构,例如 pose 控制人物动作,canny/lineart 控制边缘和构图,depth 控制空间层次,segmentation 控制区域布局,scribble 控制草图轮廓。在画本里,它可以让同一角色在不同页面保持动作、姿态和场景关系可控,尤其适合从分镜草图生成成稿。它解决的是结构一致性和可控性,角色身份仍需要参考图、Prompt 或模型适配来配合。

06

后处理和质检形成闭环

生成后还需要局部重绘修复脸、手、服装和关键道具,统一色调和画风,做超分、裁切、排版和文字处理。产品侧要设计自动质检和人工审核:检查角色相似度、风格一致性、提示词遵循、画面安全、文字错误、跨页冲突和用户可接受度。badcase 应回流到角色卡、Prompt 模板、参考资产、ControlNet 条件和工作流参数,而不是每次靠人工返工。

易错点

  • 把一致性简单理解为 Prompt 写得更详细,没有拆角色、风格、场景和叙事维度。
  • 认为固定 seed 就能保证同一角色跨页一致,忽略 seed 只固定随机性,不提供身份语义约束。
  • 只强调参考图,不考虑参考强度、过拟合复制、多角色绑定和不同镜头下的变化需求。
  • 把 ControlNet 当成万能角色保持工具,没有说明它主要约束姿态、边缘、深度和布局结构。
  • ComfyUI 只说“会用工具”,没有讲清它在产品流程中承担节点编排、批量生成、复现和调参的作用。
  • 忽略后处理和质检,默认生成结果一次成功,没有设计局部重绘、人工审核和 badcase 回流。
  • 评估只看单张图好不好看,不看跨页相似度、故事连续性、重生成成本和用户接受度。

面试官追问

为什么只靠 Prompt 很难保证画本一致性?

Prompt 是语义描述,适合表达角色设定和画面目标,但对五官细节、服装纹理、姿态结构、场景空间和跨页连续性控制有限。模型每次采样都会带随机性,同一个词也可能被解释成不同视觉结果。因此画本通常需要角色卡、参考图、固定工作流、ControlNet、seed、局部重绘和质检一起使用。

Seed 和参考图的区别是什么?

seed 固定的是随机初始化,让同一配置下的生成可复现;参考图提供的是视觉锚点,让模型更接近指定角色或风格。seed 解决复现和对比问题,参考图解决身份和风格约束问题。两者可以配合,但 seed 不能替代参考图。

ControlNet 在画本里最适合解决什么问题?

它适合解决结构控制问题,比如人物姿态、镜头构图、场景布局、空间深度和线稿成图。画本常见做法是先有分镜草图或姿态条件,再用 ControlNet 约束生成结果,使页面之间的动作和构图更稳定。但角色长相和画风还需要参考图、Prompt 或模型适配来约束。

产品经理不懂 ComfyUI 细节时怎么和算法或设计协作?

产品经理不一定要会写每个节点,但要能定义输入输出和验收标准:每页需要哪些角色资产、Prompt 字段、控制条件、候选图数量、质检规则和失败兜底。和算法讨论可控性、成本、延迟和失败模式,和设计讨论风格板、分镜、可接受修改范围。重点是把技术流程转成可交付的产品 SOP。

如何评估画本一致性是否达标?

可以结合机器指标和人工评审。机器侧看角色相似度、风格 embedding 距离、提示词遵循、重生成次数、修图次数和违规检测;人工侧看角色是否一眼能认出、场景是否连贯、画风是否统一、是否影响故事理解。最终还要看用户接受率、保存/分享率、投诉和返工成本。