客服场景中，Expert Agent 应如何按业务维度拆分，并通过 Prompt 输入、输出约束和预设 Workflow 降低幻觉与泛化损失？｜字节跳动 AI 应用开发面经解析

60 秒回答模板

客服场景拆 Expert Agent 的核心不是把一个大 Prompt 拆成多个小 Prompt，而是把业务责任、可用知识、工具权限和输出契约一起拆清楚。这样每个 Expert 只处理自己擅长的子域，同时由路由层和质检层控制跨域问题、证据不足和高风险动作。按业务责任拆分：可以按售前咨询、订单状态、售后政策、投诉安抚、工单生成、坐席辅助等维度划分，而不是按模型能力随意命名。每个 Expert 要有明确可处理意图、不可处理边界和转交规则。 Prompt 输入要结构化：输入不应只有用户原话，还应包含意图、槽位、历史摘要、可引用知识、工具结果、用户风险标签和当前流程状态。结构化输入能减少模型自行猜测业务事实。输出要有契约：Expert 输出应包括答案、证据引用、置信度、是否需要追问、是否转人工、是否创建工单和可执行动作。用固定 schema 能让下游校验、审计和回放。 Workflow 兜住高风险：退款、投诉、身份核验、权限写操作等场景不能只靠生成式回答，应通过预设流程、规则校验、工具权限和人工确认来约束执行路径。泛化损失要被管理：拆得太细会导致跨场景问题没人负责，拆得太粗又会引入幻觉。需要路由召回多个候选 Expert、支持协同转交，并用灰度数据持续调边界。最后要把方案落到可验证的指标、失败兜底和迭代闭环上。面试里不要只讲概念名词，要说明边界、取舍、数据来源、线上观测和出问题后的回滚或人工介入。

考点 业务维度优先

难度 真实面经题

回答目标 让面试官看到你能把客服 Expert Agent 讲成可治理的业务架构，而不是停留在多 Agent 概念。

深入解析

按业务责任拆分

可以按售前咨询、订单状态、售后政策、投诉安抚、工单生成、坐席辅助等维度划分，而不是按模型能力随意命名。每个 Expert 要有明确可处理意图、不可处理边界和转交规则。

Prompt 输入要结构化

输入不应只有用户原话，还应包含意图、槽位、历史摘要、可引用知识、工具结果、用户风险标签和当前流程状态。结构化输入能减少模型自行猜测业务事实。

输出要有契约

Expert 输出应包括答案、证据引用、置信度、是否需要追问、是否转人工、是否创建工单和可执行动作。用固定 schema 能让下游校验、审计和回放。

Workflow 兜住高风险

退款、投诉、身份核验、权限写操作等场景不能只靠生成式回答，应通过预设流程、规则校验、工具权限和人工确认来约束执行路径。

泛化损失要被管理

拆得太细会导致跨场景问题没人负责，拆得太粗又会引入幻觉。需要路由召回多个候选 Expert、支持协同转交，并用灰度数据持续调边界。

易错点

只说多建几个 Agent，不说明每个 Agent 的业务责任和权限。
Prompt 输入仍然是一段用户原话，缺少证据、状态和工具结果。
让 Expert 直接输出自然语言，缺少置信度、证据和动作 schema。
把所有不能处理的问题都强行回答，忽略拒答、追问和转人工。
只关注幻觉下降，不评估拆分后跨域问题的召回和泛化损失。

面试官追问

Expert Agent 以什么维度划分更合理？

优先按业务场景、工具权限、知识域和风险等级划分。纯按模型能力划分容易导致责任不清，后续也难做质检和指标归因。

如何判断应该转给另一个 Expert？

看当前 Expert 的意图覆盖、证据覆盖、置信度、工具权限和输出风险。如果缺关键证据或权限，应转交或请求路由层重新规划。

为什么预设 Workflow 能降低幻觉？

Workflow 把关键步骤、校验点、可调用工具和人工确认固化下来，模型只能在允许范围内补全语言和参数，不能自由编造处理结果。

拆 Expert Agent 的主要代价是什么？

代价是路由复杂、跨域上下文传递困难、维护多个 Prompt 和评测集。必须用统一 trace、版本管理和边界测试来控制。