真实面经题目 · 原创解析

RAG 在意图识别中有什么作用?

RAG 在意图识别中的作用,是把相似历史表达、标签定义、业务文档和动态规则检索出来,辅助模型缩小候选、消除歧义、识别长尾和处理新业务。它不是替代分类器,而是给分类决策提供可更新的外部证据。

出现于:字节跳动 · 算法

60 秒回答模板

RAG 用在意图识别中,核心是把用户输入先与知识库、标签说明、历史标注样本、FAQ、业务规则或流程文档做检索,再把检索结果作为上下文交给分类器或 LLM 判断。它的作用有四类:第一,候选召回,把几百上千个意图缩小到少量候选;第二,语义对齐,用相似历史问法和标签定义帮助模型理解用户表达;第三,动态更新,新业务或规则变化时更新知识库,不必每次重新训练模型;第四,长尾和冷启动,在标注数据不足时借助说明文档和样例增强判断。风险是检索噪声、知识过期、延迟增加和错误证据误导模型,所以要做召回评估、重排、证据置信度和拒识兜底。

考点 核心定位
难度 真实面经高频题
回答目标 讲清机制、边界和追问

深入解析

01

候选召回

意图数量一多,直接让模型在全标签空间里分类会增加混淆和成本。RAG 可以先用向量检索或关键词检索召回最相似的标签定义、历史样本和业务说明,把候选范围缩小到少量高相关意图。后续模型只需要在候选内精排或做结构化判断,准确率和延迟都更容易控制。

02

标签语义补充

很多意图标签名称很短,例如退款、赔付、售后进度,单靠标签名不足以区分。检索出的标签定义、正例、反例和边界说明能补充语义,帮助模型理解哪些表达属于该意图、哪些相近表达不属于该意图。对于新标注员和 LLM 裁决,这种上下文尤其重要。

03

长尾和冷启动

新业务刚上线时,训练样本可能很少,但通常已经有产品文档、FAQ、流程说明和少量人工样例。RAG 可以利用这些外部资料,让意图识别先具备可用能力,再通过线上日志回流补充训练数据。对于低频长尾意图,检索相似案例也能减少模型只偏向高频标签的问题。

04

动态规则更新

业务规则、活动政策和标签口径经常变化。如果所有知识都写进模型参数,每次变化都要重新训练和发布。RAG 把可变知识放在外部索引中,更新文档、样例或规则后即可影响识别结果。这样更适合快速迭代的业务,但必须做好版本管理和知识有效期控制。

05

噪声和安全边界

RAG 的短板是检索不一定正确。相似文本可能属于不同意图,过期文档可能覆盖新规则,错误样例可能误导模型。工程上要加入重排、来源优先级、候选分数阈值、冲突检测和无证据拒识。评估时既要看最终分类效果,也要单独看召回阶段是否漏掉正确意图。

易错点

  • 把 RAG 当成万能分类器,忽略检索只是提供候选和证据。
  • 只建设向量库,不维护标签定义、反例、版本和过期规则。
  • 只看最终准确率,不评估召回阶段是否漏掉正确意图。
  • 没有低置信度拒识,检索噪声会被模型强行解释成错误意图。

面试官追问

RAG 和直接微调分类器怎么取舍?

稳定高频意图适合微调分类器,成本低、延迟小;变化快、样本少、标签说明复杂的意图适合 RAG 补充外部知识。实际系统常把两者组合,分类器负责主干,RAG 处理长尾和动态知识。

检索召回错了会怎样?

如果正确意图没有被召回,后续模型很难选对;如果召回噪声太多,模型会被干扰。要评估 recall@k、候选覆盖率和重排效果,并保留低置信度拒识或全量分类兜底。

RAG 是否会增加延迟?

会增加向量检索、重排和上下文构造成本。可以通过缓存、轻量召回、分层检索、限制候选数和异步更新索引控制延迟。高频意图也可以绕过 RAG 直接分类。

如何维护意图识别知识库?

要给每个标签维护定义、正例、反例、边界条件和版本号;线上误判样本定期回流;过期规则及时下线。知识库质量低时,RAG 会把错误放大。