真实面经题目 · 原创解析

多 Agent 运行时如何基于任务复杂度、风险等级和运行时信号,在单 Agent、规划-执行、并行候选和监督校验之间动态切换,并保证状态迁移和幂等一致?

这题考多 Agent 策略路由与运行时切换。回答要说明哪些策略可选、切换信号是什么、如何保持状态一致,以及如何评估策略选择是否有效。

出现于:字节跳动 · AI 应用开发

60 秒回答模板

多 Agent 系统的执行策略不是固定选一种。简单任务可以单步工具调用,复杂任务可用规划-执行,探索任务可用多候选并行,高风险任务要加入监督和人工确认。策略切换的关键是用任务特征和运行时信号控制,而不是让模型随意决定。 先定义策略集合:常见策略包括单 Agent 快速执行、Planner-Executor 分工、多 Agent 讨论、并行候选求解、Critic 校验、人工确认和降级模板回答。每种策略有适用条件和成本。 用任务特征路由:根据意图、风险等级、是否需要工具、步骤数、实时性、用户价值和证据要求选择初始策略。比如高风险写操作不应进入无监督自动执行。 运行中动态切换:当工具失败、置信度下降、循环次数过多、用户补充信息、成本超预算或证据冲突时,可以从快速执行切到重规划、校验、转人工或降级。 状态要可迁移:切换策略时要保留目标、已完成步骤、工具结果、证据、失败原因和用户确认,避免重新开始或丢失关键上下文。 评估要看收益成本:策略选择应通过任务成功率、延迟、成本、错误率、人工接管率和用户满意度评估。复杂策略若只提升少量质量但显著拖慢体验,未必值得默认启用。 最后要把方案落到可验证的指标、失败兜底和迭代闭环上。面试里不要只讲概念名词,要说明边界、取舍、数据来源、线上观测和出问题后的回滚或人工介入。

考点 策略有边界
难度 真实面经题
回答目标 展示你能设计可控、可评估、可恢复的多 Agent 运行时策略。

深入解析

01

先定义策略集合

常见策略包括单 Agent 快速执行、Planner-Executor 分工、多 Agent 讨论、并行候选求解、Critic 校验、人工确认和降级模板回答。每种策略有适用条件和成本。

02

用任务特征路由

根据意图、风险等级、是否需要工具、步骤数、实时性、用户价值和证据要求选择初始策略。比如高风险写操作不应进入无监督自动执行。

03

运行中动态切换

当工具失败、置信度下降、循环次数过多、用户补充信息、成本超预算或证据冲突时,可以从快速执行切到重规划、校验、转人工或降级。

04

状态要可迁移

切换策略时要保留目标、已完成步骤、工具结果、证据、失败原因和用户确认,避免重新开始或丢失关键上下文。

05

评估要看收益成本

策略选择应通过任务成功率、延迟、成本、错误率、人工接管率和用户满意度评估。复杂策略若只提升少量质量但显著拖慢体验,未必值得默认启用。

易错点

  • 只说多 Agent 更强,不定义具体策略集合。
  • 让模型无限制自行切换,缺少状态机和风险边界。
  • 切换后重新执行所有工具,导致重复扣费和副作用。
  • 只追求准确率,不计算延迟和推理成本。
  • 没有用户可见状态,用户不知道任务为什么变慢或转人工。

面试官追问

初始策略由模型决定还是规则决定?

通常是规则和轻量分类器先做边界控制,再让模型在安全范围内补充判断。高风险和成本阈值不应完全交给模型。

策略切换最容易出什么问题?

最常见是状态丢失、重复工具调用、成本失控和用户看不懂当前状态,所以需要结构化状态、幂等和前端状态反馈。

如何防止策略频繁抖动?

可以设置切换冷却、最大切换次数、明确状态机和终止条件,并把异常样本回放分析。

多 Agent 并行一定更好吗?

不一定。并行会增加成本和结果冲突,适合复杂推理、候选方案生成或高价值任务,不适合低风险简单问答。