真实面经题目 · 原创解析
Agent 任务中 Human-in-the-Loop 应如何设计确认、纠错和中断流程?
这题考 Agent 任务中的 Human-in-the-Loop 控制点设计,回答重点是确认、纠错、中断、恢复、审计和人机责任边界。
真实面经题目 · 原创解析
这题考 Agent 任务中的 Human-in-the-Loop 控制点设计,回答重点是确认、纠错、中断、恢复、审计和人机责任边界。
HITL 不是在最后加一个人工审核按钮,而是把人类确认、纠错和中断设计成 Agent 状态机的一部分。我会先按风险定义哪些节点必须人工参与:高风险外部动作、不可逆写入、低置信判断、权限变化、异常成本和用户明确要求确认的步骤。确认流程要展示 Agent 计划、依据、影响范围和可选动作,让用户批准、拒绝或修改。纠错流程要允许用户改目标、改参数、替换证据或指出错误,并把 correction 写回状态,后续步骤从修正后的状态继续。中断流程要能取消模型流、停止工具、保存快照、回滚可回滚动作,并返回 interrupted/cancelled 状态。所有人工输入、模型建议、执行结果和时间点都要审计。这样 HITL 才能提升可靠性,而不是把责任模糊地甩给用户。
不是每一步都需要人参与。应把人工确认放在高风险、不可逆、低置信、成本异常、权限敏感和用户指定的节点。低风险自动化继续自动执行,避免 HITL 变成效率瓶颈。
确认界面或接口要展示 Agent 准备做什么、为什么做、会影响哪些对象、使用哪些证据、风险是什么,以及批准、拒绝、修改和稍后处理的选项。只问“是否继续”通常不足以让人类承担有效决策。
用户纠错不是重新开一轮聊天,而是修改任务状态、参数、证据或计划。系统要保留原建议和修正内容,并让后续节点读取修正后的状态,避免 Agent 下一步又回到旧假设。
中断需要取消模型流、停止工具执行、标记任务状态、保存快照并释放资源。对于已经执行的外部动作,要区分可回滚、需补偿和不可回滚,并给用户明确反馈。
HITL 后的继续执行应从被确认或纠正后的稳定状态恢复,而不是让模型根据对话历史猜测。状态快照、版本号和幂等工具调用能避免重复执行和状态覆盖。
系统要记录模型建议、证据、人工选择、修改内容、执行结果和时间点。审计不是形式要求,它决定事故复盘、权限治理、效果评估和后续训练数据筛选。
会增加部分节点耗时,所以要按风险分级,只在必要节点介入。低风险步骤自动执行,高风险步骤人工确认。
把纠错内容结构化写回任务状态,并更新当前计划或约束。后续节点读取状态,而不是只把纠错当成聊天消息。
停止生成偏模型输出层,中断任务还包括停止工具、保存状态、处理已执行动作、释放资源和给出可恢复状态。
外部写入、付款或资源变更、删除、发消息、提交代码、权限变更、不可逆操作和低置信高影响决策通常应确认。