真实面经题目 · 原创解析
Agent 长期记忆功能如何设计、召回和持续优化?
这题考 Agent 长期记忆的生命周期,不是多用户隔离。答案要覆盖存什么、如何抽取、召回、更新、遗忘、删除、隐私授权和质量评估。
真实面经题目 · 原创解析
这题考 Agent 长期记忆的生命周期,不是多用户隔离。答案要覆盖存什么、如何抽取、召回、更新、遗忘、删除、隐私授权和质量评估。
Agent 长期记忆不是把所有聊天记录永久保存,而是把对未来任务有稳定价值的信息结构化沉淀,并可召回、更新和删除。我会先定义记忆类型,比如用户偏好、长期目标、事实资料、项目背景、历史决策和禁用规则;再设计写入流程,由模型或规则从对话中抽取候选记忆,经过用户授权、置信度判断、去重和结构化后存储。召回时结合当前任务、时间、用户、权限和相似度检索记忆,再通过 rerank 和上下文预算控制注入给模型。更新上要支持冲突解决、过期衰减、用户纠错、删除和审计;评估上看记忆命中率、任务提升、误召回、过期信息、隐私投诉和用户可控感。
长期记忆应保存对未来任务有复用价值且用户允许保存的信息,例如偏好、常用约束、项目背景、身份资料、长期目标、历史决策和明确禁忌。临时上下文、一次性闲聊、敏感信息和低置信内容不应默认沉淀。
可以由模型从对话中抽取候选记忆,再用规则或小模型判断是否值得保存、是否重复、是否敏感。关键记忆最好让用户确认或提供管理入口,避免 Agent 擅自保存错误或隐私信息。
记忆可以同时有结构化字段和文本 embedding,例如类型、主体、内容、来源、时间、置信度、权限、有效期和最近使用时间。这样既方便语义召回,也方便用户查看、修改、删除和审计。
召回不是把所有记忆塞进 prompt,而是根据当前意图、用户、会话、权限和相似度筛选,再通过 rerank 控制数量。对高风险或低置信记忆,可以先询问用户确认,而不是直接影响决策。
长期记忆需要更新、覆盖、衰减和删除。用户偏好可能改变,项目背景可能过期,不同记忆可能冲突。系统要有更新时间、有效期、冲突规则和用户纠错入口,不能把旧记忆当成永久真相。
长期记忆的价值要用任务成功率、用户满意度、重复输入减少、召回命中率、误召回率、纠错率、删除率和隐私投诉来评估。好的记忆系统应该提高效率,同时让用户知道它记了什么、为什么使用和如何关闭。
长期记忆应存稳定偏好、长期目标、明确事实、用户授权信息和高价值历史,不应存一次性临时上下文、敏感数据、未经确认的推断或容易过期的状态。
最好在明确告知和可管理的前提下保存,并按敏感等级控制。用户应能查看、修改、删除或关闭长期记忆;高敏感信息默认不应自动沉淀。
需要记录来源、时间、置信度、适用范围和用户确认状态。新记忆与旧记忆冲突时,可以请求用户确认、按更新时间或权威来源更新,并保留审计记录。
可以用语义检索召回候选记忆,再按时间、置信度、任务相关性、用户当前意图和敏感级别重排。不是所有记忆都应该进入 Prompt。
看记忆命中后是否提升任务完成率、个性化满意度和复用率,同时监控错误引用、过期记忆、隐私投诉和用户删除率。人工抽检和 badcase 回放也很重要。
可以设置过期时间、衰减权重、用户确认、冲突检测和定期清理。临时兴趣或场景状态不能永久保存,过期记忆要降权或删除。