真实面经题目 · 原创解析

客服场景中,Expert Agent 应如何按业务维度拆分,并通过 Prompt 输入、输出约束和预设 Workflow 降低幻觉与泛化损失?

这题考客服 Agent 架构拆分能力。回答要讲清 Expert Agent 的划分维度、Prompt 输入、输出约束、预设 Workflow,以及如何用证据和边界降低幻觉与泛化损失。

出现于:字节跳动 · AI 应用开发

60 秒回答模板

客服场景拆 Expert Agent 的核心不是把一个大 Prompt 拆成多个小 Prompt,而是把业务责任、可用知识、工具权限和输出契约一起拆清楚。这样每个 Expert 只处理自己擅长的子域,同时由路由层和质检层控制跨域问题、证据不足和高风险动作。 按业务责任拆分:可以按售前咨询、订单状态、售后政策、投诉安抚、工单生成、坐席辅助等维度划分,而不是按模型能力随意命名。每个 Expert 要有明确可处理意图、不可处理边界和转交规则。 Prompt 输入要结构化:输入不应只有用户原话,还应包含意图、槽位、历史摘要、可引用知识、工具结果、用户风险标签和当前流程状态。结构化输入能减少模型自行猜测业务事实。 输出要有契约:Expert 输出应包括答案、证据引用、置信度、是否需要追问、是否转人工、是否创建工单和可执行动作。用固定 schema 能让下游校验、审计和回放。 Workflow 兜住高风险:退款、投诉、身份核验、权限写操作等场景不能只靠生成式回答,应通过预设流程、规则校验、工具权限和人工确认来约束执行路径。 泛化损失要被管理:拆得太细会导致跨场景问题没人负责,拆得太粗又会引入幻觉。需要路由召回多个候选 Expert、支持协同转交,并用灰度数据持续调边界。 最后要把方案落到可验证的指标、失败兜底和迭代闭环上。面试里不要只讲概念名词,要说明边界、取舍、数据来源、线上观测和出问题后的回滚或人工介入。

考点 业务维度优先
难度 真实面经题
回答目标 让面试官看到你能把客服 Expert Agent 讲成可治理的业务架构,而不是停留在多 Agent 概念。

深入解析

01

按业务责任拆分

可以按售前咨询、订单状态、售后政策、投诉安抚、工单生成、坐席辅助等维度划分,而不是按模型能力随意命名。每个 Expert 要有明确可处理意图、不可处理边界和转交规则。

02

Prompt 输入要结构化

输入不应只有用户原话,还应包含意图、槽位、历史摘要、可引用知识、工具结果、用户风险标签和当前流程状态。结构化输入能减少模型自行猜测业务事实。

03

输出要有契约

Expert 输出应包括答案、证据引用、置信度、是否需要追问、是否转人工、是否创建工单和可执行动作。用固定 schema 能让下游校验、审计和回放。

04

Workflow 兜住高风险

退款、投诉、身份核验、权限写操作等场景不能只靠生成式回答,应通过预设流程、规则校验、工具权限和人工确认来约束执行路径。

05

泛化损失要被管理

拆得太细会导致跨场景问题没人负责,拆得太粗又会引入幻觉。需要路由召回多个候选 Expert、支持协同转交,并用灰度数据持续调边界。

易错点

  • 只说多建几个 Agent,不说明每个 Agent 的业务责任和权限。
  • Prompt 输入仍然是一段用户原话,缺少证据、状态和工具结果。
  • 让 Expert 直接输出自然语言,缺少置信度、证据和动作 schema。
  • 把所有不能处理的问题都强行回答,忽略拒答、追问和转人工。
  • 只关注幻觉下降,不评估拆分后跨域问题的召回和泛化损失。

面试官追问

Expert Agent 以什么维度划分更合理?

优先按业务场景、工具权限、知识域和风险等级划分。纯按模型能力划分容易导致责任不清,后续也难做质检和指标归因。

如何判断应该转给另一个 Expert?

看当前 Expert 的意图覆盖、证据覆盖、置信度、工具权限和输出风险。如果缺关键证据或权限,应转交或请求路由层重新规划。

为什么预设 Workflow 能降低幻觉?

Workflow 把关键步骤、校验点、可调用工具和人工确认固化下来,模型只能在允许范围内补全语言和参数,不能自由编造处理结果。

拆 Expert Agent 的主要代价是什么?

代价是路由复杂、跨域上下文传递困难、维护多个 Prompt 和评测集。必须用统一 trace、版本管理和边界测试来控制。