RAG 在意图识别中有什么作用？｜字节跳动算法面经解析

60 秒回答模板

RAG 用在意图识别中，核心是把用户输入先与知识库、标签说明、历史标注样本、FAQ、业务规则或流程文档做检索，再把检索结果作为上下文交给分类器或 LLM 判断。它的作用有四类：第一，候选召回，把几百上千个意图缩小到少量候选；第二，语义对齐，用相似历史问法和标签定义帮助模型理解用户表达；第三，动态更新，新业务或规则变化时更新知识库，不必每次重新训练模型；第四，长尾和冷启动，在标注数据不足时借助说明文档和样例增强判断。风险是检索噪声、知识过期、延迟增加和错误证据误导模型，所以要做召回评估、重排、证据置信度和拒识兜底。

考点 候选召回

主线 标签语义补充

易错点 把 RAG 当成万能分类器，忽略检索只是提供候选和证据。

深入解析

候选召回

意图数量一多，直接让模型在全标签空间里分类会增加混淆和成本。RAG 可以先用向量检索或关键词检索召回最相似的标签定义、历史样本和业务说明，把候选范围缩小到少量高相关意图。后续模型只需要在候选内精排或做结构化判断，准确率和延迟都更容易控制。

标签语义补充

很多意图标签名称很短，例如退款、赔付、售后进度，单靠标签名不足以区分。检索出的标签定义、正例、反例和边界说明能补充语义，帮助模型理解哪些表达属于该意图、哪些相近表达不属于该意图。对于新标注员和 LLM 裁决，这种上下文尤其重要。

长尾和冷启动

新业务刚上线时，训练样本可能很少，但通常已经有产品文档、FAQ、流程说明和少量人工样例。RAG 可以利用这些外部资料，让意图识别先具备可用能力，再通过线上日志回流补充训练数据。对于低频长尾意图，检索相似案例也能减少模型只偏向高频标签的问题。

动态规则更新

业务规则、活动政策和标签口径经常变化。如果所有知识都写进模型参数，每次变化都要重新训练和发布。RAG 把可变知识放在外部索引中，更新文档、样例或规则后即可影响识别结果。这样更适合快速迭代的业务，但必须做好版本管理和知识有效期控制。

噪声和安全边界

RAG 的短板是检索不一定正确。相似文本可能属于不同意图，过期文档可能覆盖新规则，错误样例可能误导模型。工程上要加入重排、来源优先级、候选分数阈值、冲突检测和无证据拒识。评估时既要看最终分类效果，也要单独看召回阶段是否漏掉正确意图。

易错点

把 RAG 当成万能分类器，忽略检索只是提供候选和证据。
只建设向量库，不维护标签定义、反例、版本和过期规则。
只看最终准确率，不评估召回阶段是否漏掉正确意图。
没有低置信度拒识，检索噪声会被模型强行解释成错误意图。

面试官追问

RAG 和直接微调分类器怎么取舍？

稳定高频意图适合微调分类器，成本低、延迟小；变化快、样本少、标签说明复杂的意图适合 RAG 补充外部知识。实际系统常把两者组合，分类器负责主干，RAG 处理长尾和动态知识。

检索召回错了会怎样？

如果正确意图没有被召回，后续模型很难选对；如果召回噪声太多，模型会被干扰。要评估 recall@k、候选覆盖率和重排效果，并保留低置信度拒识或全量分类兜底。

RAG 是否会增加延迟？

会增加向量检索、重排和上下文构造成本。可以通过缓存、轻量召回、分层检索、限制候选数和异步更新索引控制延迟。高频意图也可以绕过 RAG 直接分类。

如何维护意图识别知识库？

要给每个标签维护定义、正例、反例、边界条件和版本号；线上误判样本定期回流；过期规则及时下线。知识库质量低时，RAG 会把错误放大。