Agent 任务中 Human-in-the-Loop 应如何设计确认、纠错和中断流程？｜阿里巴巴算法面经解析

60 秒回答模板

HITL 不是在最后加一个人工审核按钮，而是把人类确认、纠错和中断设计成 Agent 状态机的一部分。我会先按风险定义哪些节点必须人工参与：高风险外部动作、不可逆写入、低置信判断、权限变化、异常成本和用户明确要求确认的步骤。确认流程要展示 Agent 计划、依据、影响范围和可选动作，让用户批准、拒绝或修改。纠错流程要允许用户改目标、改参数、替换证据或指出错误，并把 correction 写回状态，后续步骤从修正后的状态继续。中断流程要能取消模型流、停止工具、保存快照、回滚可回滚动作，并返回 interrupted/cancelled 状态。所有人工输入、模型建议、执行结果和时间点都要审计。这样 HITL 才能提升可靠性，而不是把责任模糊地甩给用户。

考点 风险分级

难度 真实面经题

回答目标 讲清机制、训练与评估取舍

深入解析

先识别人工介入点

不是每一步都需要人参与。应把人工确认放在高风险、不可逆、低置信、成本异常、权限敏感和用户指定的节点。低风险自动化继续自动执行，避免 HITL 变成效率瓶颈。

确认要给足决策信息

确认界面或接口要展示 Agent 准备做什么、为什么做、会影响哪些对象、使用哪些证据、风险是什么，以及批准、拒绝、修改和稍后处理的选项。只问“是否继续”通常不足以让人类承担有效决策。

纠错要写回状态

用户纠错不是重新开一轮聊天，而是修改任务状态、参数、证据或计划。系统要保留原建议和修正内容，并让后续节点读取修正后的状态，避免 Agent 下一步又回到旧假设。

中断要端到端生效

中断需要取消模型流、停止工具执行、标记任务状态、保存快照并释放资源。对于已经执行的外部动作，要区分可回滚、需补偿和不可回滚，并给用户明确反馈。

恢复要从稳定点继续

HITL 后的继续执行应从被确认或纠正后的稳定状态恢复，而不是让模型根据对话历史猜测。状态快照、版本号和幂等工具调用能避免重复执行和状态覆盖。

审计明确责任边界

系统要记录模型建议、证据、人工选择、修改内容、执行结果和时间点。审计不是形式要求，它决定事故复盘、权限治理、效果评估和后续训练数据筛选。

易错点

把 HITL 理解成最后人工审核，没有设计中间控制点。
确认信息不足，只让用户点继续或取消。
用户纠错只写进对话历史，没有更新任务状态。
中断只停前端输出，不停止工具和后端任务。
没有处理已执行动作的回滚或补偿。
缺少审计，无法区分模型建议、人类确认和系统执行责任。

面试官追问

HITL 会不会让 Agent 变慢？

会增加部分节点耗时，所以要按风险分级，只在必要节点介入。低风险步骤自动执行，高风险步骤人工确认。

用户纠错后如何避免 Agent 重犯？

把纠错内容结构化写回任务状态，并更新当前计划或约束。后续节点读取状态，而不是只把纠错当成聊天消息。

中断和停止生成有什么区别？

停止生成偏模型输出层，中断任务还包括停止工具、保存状态、处理已执行动作、释放资源和给出可恢复状态。

哪些动作必须人工确认？

外部写入、付款或资源变更、删除、发消息、提交代码、权限变更、不可逆操作和低置信高影响决策通常应确认。