大模型使用向量数据库的诉求是什么？｜京东后端开发面经解析

60 秒回答模板

大模型本身参数里固化的是训练期知识，无法可靠覆盖企业私有数据、实时数据和长尾文档。向量数据库把文档、图片或其他对象转成 embedding，建立 ANN 索引，支持按语义相似度快速召回相关片段，再把结果放进 prompt 或工具链中。主要诉求包括 RAG 知识增强、减少幻觉、支持私域知识更新、突破上下文限制、做相似问答和记忆检索。工程上要关注切分、embedding 模型、索引、召回精度、权限、更新和评估。

考点 外部知识层

难度 真实面经题

回答目标 讲清方法、取舍和追问

深入解析

补模型知识边界

大模型参数知识有训练截止时间和领域覆盖限制，企业文档、订单、制度、客服知识和实时内容不适合全部重新训练进模型。向量数据库提供可更新的外部知识层。

支持语义召回

传统关键词检索依赖字面匹配，向量检索能按语义相似度召回相关片段。用户问法和文档措辞不完全一致时，embedding 检索更容易找到候选知识。

服务 RAG 链路

典型流程是文档切分、embedding、入库建索引、查询向量化、TopK 召回、重排、拼接 prompt，再让大模型基于证据回答。向量库负责高效召回，不负责最终生成。

降低幻觉和成本

把相关证据放进上下文，可以减少模型凭空编造，也避免把所有知识都塞进 prompt。相对频繁微调，更新向量库通常更快、更便宜、更可控。

工程治理要求

向量数据库还要处理权限隔离、增量更新、删除同步、索引参数、召回评估、冷热数据、embedding 版本和结果可解释性。只建库不评估召回质量没有意义。

易错点

不要把向量数据库说成大模型的替代品，它主要负责检索和知识管理。
不要忽略权限控制，私域知识检索必须按用户和业务权限过滤。
不要只关注 TopK，相似度阈值、重排和证据质量同样重要。
不要以为入库后就完成了，还要评估召回率、答案质量和更新一致性。

面试官追问

向量数据库能完全解决幻觉吗？

不能。它只能提供更相关证据，还需要重排、引用约束、答案校验和拒答策略，模型仍可能误读或忽略证据。

文档切分为什么重要？

切得太小会缺上下文，切得太大召回不准且浪费上下文窗口。切分粒度直接影响召回质量和生成质量。

向量检索和关键词检索怎么配合？

常用混合检索。关键词擅长精确实体和编号，向量擅长语义近似；两者召回后可用 reranker 融合排序。