真实面经题目 · 原创解析
RAG 在意图识别中有什么作用?
RAG 在意图识别中的作用,是把相似历史表达、标签定义、业务文档和动态规则检索出来,辅助模型缩小候选、消除歧义、识别长尾和处理新业务。它不是替代分类器,而是给分类决策提供可更新的外部证据。
真实面经题目 · 原创解析
RAG 在意图识别中的作用,是把相似历史表达、标签定义、业务文档和动态规则检索出来,辅助模型缩小候选、消除歧义、识别长尾和处理新业务。它不是替代分类器,而是给分类决策提供可更新的外部证据。
RAG 用在意图识别中,核心是把用户输入先与知识库、标签说明、历史标注样本、FAQ、业务规则或流程文档做检索,再把检索结果作为上下文交给分类器或 LLM 判断。它的作用有四类:第一,候选召回,把几百上千个意图缩小到少量候选;第二,语义对齐,用相似历史问法和标签定义帮助模型理解用户表达;第三,动态更新,新业务或规则变化时更新知识库,不必每次重新训练模型;第四,长尾和冷启动,在标注数据不足时借助说明文档和样例增强判断。风险是检索噪声、知识过期、延迟增加和错误证据误导模型,所以要做召回评估、重排、证据置信度和拒识兜底。
意图数量一多,直接让模型在全标签空间里分类会增加混淆和成本。RAG 可以先用向量检索或关键词检索召回最相似的标签定义、历史样本和业务说明,把候选范围缩小到少量高相关意图。后续模型只需要在候选内精排或做结构化判断,准确率和延迟都更容易控制。
很多意图标签名称很短,例如退款、赔付、售后进度,单靠标签名不足以区分。检索出的标签定义、正例、反例和边界说明能补充语义,帮助模型理解哪些表达属于该意图、哪些相近表达不属于该意图。对于新标注员和 LLM 裁决,这种上下文尤其重要。
新业务刚上线时,训练样本可能很少,但通常已经有产品文档、FAQ、流程说明和少量人工样例。RAG 可以利用这些外部资料,让意图识别先具备可用能力,再通过线上日志回流补充训练数据。对于低频长尾意图,检索相似案例也能减少模型只偏向高频标签的问题。
业务规则、活动政策和标签口径经常变化。如果所有知识都写进模型参数,每次变化都要重新训练和发布。RAG 把可变知识放在外部索引中,更新文档、样例或规则后即可影响识别结果。这样更适合快速迭代的业务,但必须做好版本管理和知识有效期控制。
RAG 的短板是检索不一定正确。相似文本可能属于不同意图,过期文档可能覆盖新规则,错误样例可能误导模型。工程上要加入重排、来源优先级、候选分数阈值、冲突检测和无证据拒识。评估时既要看最终分类效果,也要单独看召回阶段是否漏掉正确意图。
稳定高频意图适合微调分类器,成本低、延迟小;变化快、样本少、标签说明复杂的意图适合 RAG 补充外部知识。实际系统常把两者组合,分类器负责主干,RAG 处理长尾和动态知识。
如果正确意图没有被召回,后续模型很难选对;如果召回噪声太多,模型会被干扰。要评估 recall@k、候选覆盖率和重排效果,并保留低置信度拒识或全量分类兜底。
会增加向量检索、重排和上下文构造成本。可以通过缓存、轻量召回、分层检索、限制候选数和异步更新索引控制延迟。高频意图也可以绕过 RAG 直接分类。
要给每个标签维护定义、正例、反例、边界条件和版本号;线上误判样本定期回流;过期规则及时下线。知识库质量低时,RAG 会把错误放大。