真实面经题目 · 原创解析
多 Agent 运行时如何基于任务复杂度、风险等级和运行时信号,在单 Agent、规划-执行、并行候选和监督校验之间动态切换,并保证状态迁移和幂等一致?
这题考多 Agent 策略路由与运行时切换。回答要说明哪些策略可选、切换信号是什么、如何保持状态一致,以及如何评估策略选择是否有效。
真实面经题目 · 原创解析
这题考多 Agent 策略路由与运行时切换。回答要说明哪些策略可选、切换信号是什么、如何保持状态一致,以及如何评估策略选择是否有效。
多 Agent 系统的执行策略不是固定选一种。简单任务可以单步工具调用,复杂任务可用规划-执行,探索任务可用多候选并行,高风险任务要加入监督和人工确认。策略切换的关键是用任务特征和运行时信号控制,而不是让模型随意决定。 先定义策略集合:常见策略包括单 Agent 快速执行、Planner-Executor 分工、多 Agent 讨论、并行候选求解、Critic 校验、人工确认和降级模板回答。每种策略有适用条件和成本。 用任务特征路由:根据意图、风险等级、是否需要工具、步骤数、实时性、用户价值和证据要求选择初始策略。比如高风险写操作不应进入无监督自动执行。 运行中动态切换:当工具失败、置信度下降、循环次数过多、用户补充信息、成本超预算或证据冲突时,可以从快速执行切到重规划、校验、转人工或降级。 状态要可迁移:切换策略时要保留目标、已完成步骤、工具结果、证据、失败原因和用户确认,避免重新开始或丢失关键上下文。 评估要看收益成本:策略选择应通过任务成功率、延迟、成本、错误率、人工接管率和用户满意度评估。复杂策略若只提升少量质量但显著拖慢体验,未必值得默认启用。 最后要把方案落到可验证的指标、失败兜底和迭代闭环上。面试里不要只讲概念名词,要说明边界、取舍、数据来源、线上观测和出问题后的回滚或人工介入。
常见策略包括单 Agent 快速执行、Planner-Executor 分工、多 Agent 讨论、并行候选求解、Critic 校验、人工确认和降级模板回答。每种策略有适用条件和成本。
根据意图、风险等级、是否需要工具、步骤数、实时性、用户价值和证据要求选择初始策略。比如高风险写操作不应进入无监督自动执行。
当工具失败、置信度下降、循环次数过多、用户补充信息、成本超预算或证据冲突时,可以从快速执行切到重规划、校验、转人工或降级。
切换策略时要保留目标、已完成步骤、工具结果、证据、失败原因和用户确认,避免重新开始或丢失关键上下文。
策略选择应通过任务成功率、延迟、成本、错误率、人工接管率和用户满意度评估。复杂策略若只提升少量质量但显著拖慢体验,未必值得默认启用。
通常是规则和轻量分类器先做边界控制,再让模型在安全范围内补充判断。高风险和成本阈值不应完全交给模型。
最常见是状态丢失、重复工具调用、成本失控和用户看不懂当前状态,所以需要结构化状态、幂等和前端状态反馈。
可以设置切换冷却、最大切换次数、明确状态机和终止条件,并把异常样本回放分析。
不一定。并行会增加成本和结果冲突,适合复杂推理、候选方案生成或高价值任务,不适合低风险简单问答。