真实面经题目 · 原创解析
大模型使用向量数据库的诉求是什么?
大模型使用向量数据库的核心诉求是把外部知识、私域文档和长尾内容以语义检索方式接入模型,弥补上下文长度、知识时效和幻觉问题。它通常服务于 RAG、记忆、相似检索和推荐召回。
真实面经题目 · 原创解析
大模型使用向量数据库的核心诉求是把外部知识、私域文档和长尾内容以语义检索方式接入模型,弥补上下文长度、知识时效和幻觉问题。它通常服务于 RAG、记忆、相似检索和推荐召回。
大模型本身参数里固化的是训练期知识,无法可靠覆盖企业私有数据、实时数据和长尾文档。向量数据库把文档、图片或其他对象转成 embedding,建立 ANN 索引,支持按语义相似度快速召回相关片段,再把结果放进 prompt 或工具链中。主要诉求包括 RAG 知识增强、减少幻觉、支持私域知识更新、突破上下文限制、做相似问答和记忆检索。工程上要关注切分、embedding 模型、索引、召回精度、权限、更新和评估。
大模型参数知识有训练截止时间和领域覆盖限制,企业文档、订单、制度、客服知识和实时内容不适合全部重新训练进模型。向量数据库提供可更新的外部知识层。
传统关键词检索依赖字面匹配,向量检索能按语义相似度召回相关片段。用户问法和文档措辞不完全一致时,embedding 检索更容易找到候选知识。
典型流程是文档切分、embedding、入库建索引、查询向量化、TopK 召回、重排、拼接 prompt,再让大模型基于证据回答。向量库负责高效召回,不负责最终生成。
把相关证据放进上下文,可以减少模型凭空编造,也避免把所有知识都塞进 prompt。相对频繁微调,更新向量库通常更快、更便宜、更可控。
向量数据库还要处理权限隔离、增量更新、删除同步、索引参数、召回评估、冷热数据、embedding 版本和结果可解释性。只建库不评估召回质量没有意义。
不能。它只能提供更相关证据,还需要重排、引用约束、答案校验和拒答策略,模型仍可能误读或忽略证据。
切得太小会缺上下文,切得太大召回不准且浪费上下文窗口。切分粒度直接影响召回质量和生成质量。
常用混合检索。关键词擅长精确实体和编号,向量擅长语义近似;两者召回后可用 reranker 融合排序。