多 Agent 运行时如何基于任务复杂度、风险等级和运行时信号，在单 Agent、规划-执行、并行候选和监督校验之间动态切换，并保证状态迁移和幂等一致？｜字节跳动 AI 应用开发面经解析

60 秒回答模板

多 Agent 系统的执行策略不是固定选一种。简单任务可以单步工具调用，复杂任务可用规划-执行，探索任务可用多候选并行，高风险任务要加入监督和人工确认。策略切换的关键是用任务特征和运行时信号控制，而不是让模型随意决定。先定义策略集合：常见策略包括单 Agent 快速执行、Planner-Executor 分工、多 Agent 讨论、并行候选求解、Critic 校验、人工确认和降级模板回答。每种策略有适用条件和成本。用任务特征路由：根据意图、风险等级、是否需要工具、步骤数、实时性、用户价值和证据要求选择初始策略。比如高风险写操作不应进入无监督自动执行。运行中动态切换：当工具失败、置信度下降、循环次数过多、用户补充信息、成本超预算或证据冲突时，可以从快速执行切到重规划、校验、转人工或降级。状态要可迁移：切换策略时要保留目标、已完成步骤、工具结果、证据、失败原因和用户确认，避免重新开始或丢失关键上下文。评估要看收益成本：策略选择应通过任务成功率、延迟、成本、错误率、人工接管率和用户满意度评估。复杂策略若只提升少量质量但显著拖慢体验，未必值得默认启用。最后要把方案落到可验证的指标、失败兜底和迭代闭环上。面试里不要只讲概念名词，要说明边界、取舍、数据来源、线上观测和出问题后的回滚或人工介入。

考点 策略有边界

难度 真实面经题

回答目标 展示你能设计可控、可评估、可恢复的多 Agent 运行时策略。

深入解析

先定义策略集合

常见策略包括单 Agent 快速执行、Planner-Executor 分工、多 Agent 讨论、并行候选求解、Critic 校验、人工确认和降级模板回答。每种策略有适用条件和成本。

用任务特征路由

根据意图、风险等级、是否需要工具、步骤数、实时性、用户价值和证据要求选择初始策略。比如高风险写操作不应进入无监督自动执行。

运行中动态切换

当工具失败、置信度下降、循环次数过多、用户补充信息、成本超预算或证据冲突时，可以从快速执行切到重规划、校验、转人工或降级。

状态要可迁移

切换策略时要保留目标、已完成步骤、工具结果、证据、失败原因和用户确认，避免重新开始或丢失关键上下文。

评估要看收益成本

策略选择应通过任务成功率、延迟、成本、错误率、人工接管率和用户满意度评估。复杂策略若只提升少量质量但显著拖慢体验，未必值得默认启用。

易错点

只说多 Agent 更强，不定义具体策略集合。
让模型无限制自行切换，缺少状态机和风险边界。
切换后重新执行所有工具，导致重复扣费和副作用。
只追求准确率，不计算延迟和推理成本。
没有用户可见状态，用户不知道任务为什么变慢或转人工。

面试官追问

初始策略由模型决定还是规则决定？

通常是规则和轻量分类器先做边界控制，再让模型在安全范围内补充判断。高风险和成本阈值不应完全交给模型。

策略切换最容易出什么问题？

最常见是状态丢失、重复工具调用、成本失控和用户看不懂当前状态，所以需要结构化状态、幂等和前端状态反馈。

如何防止策略频繁抖动？

可以设置切换冷却、最大切换次数、明确状态机和终止条件，并把异常样本回放分析。

多 Agent 并行一定更好吗？

不一定。并行会增加成本和结果冲突，适合复杂推理、候选方案生成或高价值任务，不适合低风险简单问答。