60 秒回答模板

大模型本身参数里固化的是训练期知识,无法可靠覆盖企业私有数据、实时数据和长尾文档。向量数据库把文档、图片或其他对象转成 embedding,建立 ANN 索引,支持按语义相似度快速召回相关片段,再把结果放进 prompt 或工具链中。主要诉求包括 RAG 知识增强、减少幻觉、支持私域知识更新、突破上下文限制、做相似问答和记忆检索。工程上要关注切分、embedding 模型、索引、召回精度、权限、更新和评估。

考点 外部知识层
难度 真实面经题
回答目标 讲清方法、取舍和追问

深入解析

01

补模型知识边界

大模型参数知识有训练截止时间和领域覆盖限制,企业文档、订单、制度、客服知识和实时内容不适合全部重新训练进模型。向量数据库提供可更新的外部知识层。

02

支持语义召回

传统关键词检索依赖字面匹配,向量检索能按语义相似度召回相关片段。用户问法和文档措辞不完全一致时,embedding 检索更容易找到候选知识。

03

服务 RAG 链路

典型流程是文档切分、embedding、入库建索引、查询向量化、TopK 召回、重排、拼接 prompt,再让大模型基于证据回答。向量库负责高效召回,不负责最终生成。

04

降低幻觉和成本

把相关证据放进上下文,可以减少模型凭空编造,也避免把所有知识都塞进 prompt。相对频繁微调,更新向量库通常更快、更便宜、更可控。

05

工程治理要求

向量数据库还要处理权限隔离、增量更新、删除同步、索引参数、召回评估、冷热数据、embedding 版本和结果可解释性。只建库不评估召回质量没有意义。

易错点

  • 不要把向量数据库说成大模型的替代品,它主要负责检索和知识管理。
  • 不要忽略权限控制,私域知识检索必须按用户和业务权限过滤。
  • 不要只关注 TopK,相似度阈值、重排和证据质量同样重要。
  • 不要以为入库后就完成了,还要评估召回率、答案质量和更新一致性。

面试官追问

向量数据库能完全解决幻觉吗?

不能。它只能提供更相关证据,还需要重排、引用约束、答案校验和拒答策略,模型仍可能误读或忽略证据。

文档切分为什么重要?

切得太小会缺上下文,切得太大召回不准且浪费上下文窗口。切分粒度直接影响召回质量和生成质量。

向量检索和关键词检索怎么配合?

常用混合检索。关键词擅长精确实体和编号,向量擅长语义近似;两者召回后可用 reranker 融合排序。