60 秒回答模板

HITL 不是在最后加一个人工审核按钮,而是把人类确认、纠错和中断设计成 Agent 状态机的一部分。我会先按风险定义哪些节点必须人工参与:高风险外部动作、不可逆写入、低置信判断、权限变化、异常成本和用户明确要求确认的步骤。确认流程要展示 Agent 计划、依据、影响范围和可选动作,让用户批准、拒绝或修改。纠错流程要允许用户改目标、改参数、替换证据或指出错误,并把 correction 写回状态,后续步骤从修正后的状态继续。中断流程要能取消模型流、停止工具、保存快照、回滚可回滚动作,并返回 interrupted/cancelled 状态。所有人工输入、模型建议、执行结果和时间点都要审计。这样 HITL 才能提升可靠性,而不是把责任模糊地甩给用户。

考点 风险分级
难度 真实面经题
回答目标 讲清机制、训练与评估取舍

深入解析

01

先识别人工介入点

不是每一步都需要人参与。应把人工确认放在高风险、不可逆、低置信、成本异常、权限敏感和用户指定的节点。低风险自动化继续自动执行,避免 HITL 变成效率瓶颈。

02

确认要给足决策信息

确认界面或接口要展示 Agent 准备做什么、为什么做、会影响哪些对象、使用哪些证据、风险是什么,以及批准、拒绝、修改和稍后处理的选项。只问“是否继续”通常不足以让人类承担有效决策。

03

纠错要写回状态

用户纠错不是重新开一轮聊天,而是修改任务状态、参数、证据或计划。系统要保留原建议和修正内容,并让后续节点读取修正后的状态,避免 Agent 下一步又回到旧假设。

04

中断要端到端生效

中断需要取消模型流、停止工具执行、标记任务状态、保存快照并释放资源。对于已经执行的外部动作,要区分可回滚、需补偿和不可回滚,并给用户明确反馈。

05

恢复要从稳定点继续

HITL 后的继续执行应从被确认或纠正后的稳定状态恢复,而不是让模型根据对话历史猜测。状态快照、版本号和幂等工具调用能避免重复执行和状态覆盖。

06

审计明确责任边界

系统要记录模型建议、证据、人工选择、修改内容、执行结果和时间点。审计不是形式要求,它决定事故复盘、权限治理、效果评估和后续训练数据筛选。

易错点

  • 把 HITL 理解成最后人工审核,没有设计中间控制点。
  • 确认信息不足,只让用户点继续或取消。
  • 用户纠错只写进对话历史,没有更新任务状态。
  • 中断只停前端输出,不停止工具和后端任务。
  • 没有处理已执行动作的回滚或补偿。
  • 缺少审计,无法区分模型建议、人类确认和系统执行责任。

面试官追问

HITL 会不会让 Agent 变慢?

会增加部分节点耗时,所以要按风险分级,只在必要节点介入。低风险步骤自动执行,高风险步骤人工确认。

用户纠错后如何避免 Agent 重犯?

把纠错内容结构化写回任务状态,并更新当前计划或约束。后续节点读取状态,而不是只把纠错当成聊天消息。

中断和停止生成有什么区别?

停止生成偏模型输出层,中断任务还包括停止工具、保存状态、处理已执行动作、释放资源和给出可恢复状态。

哪些动作必须人工确认?

外部写入、付款或资源变更、删除、发消息、提交代码、权限变更、不可逆操作和低置信高影响决策通常应确认。