标签题目
向量数据库相关面试题
大模型使用向量数据库的诉求是什么?
大模型使用向量数据库的核心诉求是把外部知识、私域文档和长尾内容以语义检索方式接入模型,弥补上下文长度、知识时效和幻觉问题。它通常服务于 RAG、记忆、相似检索和推荐召回。
RAG 可以做哪些优化?
RAG 优化要覆盖切分、索引、召回、重排、上下文组装、生成约束和评估闭环,不能只停留在换 embedding 模型。
推荐系统中引入向量索引召回时,在线 serving 链路应该如何改造?
这道题考察的不是向量索引原理,而是把向量召回接入推荐在线 serving 后,链路、模块边界、延迟、降级、索引更新和实验评估应该怎样设计。回答要把它放在召回层讲清楚,并说明 query vector 如何生成、ANN 服务如何调用、候选如何回到后续粗排/精排。
同题还出现在 2 个公司岗位
RAG 处理 PDF 知识库时,如何设计切片、分页元数据和检索链路来减少答非所问?
这题考察 PDF 知识库 RAG 的端到端设计:要用结构化解析保留标题、页码和版面语义,按文档结构切 chunk 并带 page span metadata,通过召回、重排和上下文组装减少答非所问,并用 badcase 闭环持续修正切片与检索链路。
同公司岗位有 2 条面经记录
RAG 知识库如何做定期维护,什么时候应选 RAG 而不是 SFT?
这题考 RAG 知识库生命周期治理和 RAG/SFT 方案选择,回答要把数据更新、质量评估、检索效果和模型改造边界分开。
向量数据库和传统数据库在查询方式、索引结构和事务能力上有什么区别?
这题考向量数据库和传统数据库的边界,回答要围绕查询目标、索引结构、事务一致性和工程搭配展开。
RAG 知识库如何做不停服更新,并保证检索结果一致性?
这题考 RAG 知识库不停服更新和一致性,不是 RAG vs SFT。回答要覆盖版本化索引、离线构建、影子验证、别名切换、缓存失效、权限元数据和回滚。
RAG 能力作为 Agent 工具开放后,如何评估召回质量、任务成功率和用户体验?
这题考 RAG 作为 Agent 工具后的评估体系,重点不是单纯调召回,而是同时评估检索质量、工具选择、答案可信度、端到端任务成功和用户体验。
强模型直连与本地模型 + RAG + Prompt 优化,应如何按成本、延迟、安全和效果取舍?
这题考强模型直连与本地模型加 RAG 和 Prompt 优化之间的架构取舍,回答要按效果、成本、延迟、安全、可控性和运维复杂度做决策,而不是给单一答案。
RAG Embedding 召回出现误判时,如何定位并改进?
这题考 RAG 中 embedding 召回误判的诊断和改进,回答要区分误召回与漏召回,并用标注集、近邻检查、负样本、混合检索、rerank 和阈值策略闭环优化。
同题还出现在 1 个公司岗位
向量检索中 IVF_FLAT 和 HNSW 有什么区别,如何按召回率、延迟和内存选型?
这题考向量检索索引选型,回答重点是 IVF_FLAT 的聚类倒排思想、HNSW 的近邻图搜索思想,以及召回、延迟、内存、构建和更新成本的权衡。
同题还出现在 1 个公司岗位
代码 Agent 的 RAG 检索索引如何同时设计语义、关键词、结构化和权限索引?
这题考代码 Agent 的 RAG 索引架构,不是泛泛讲向量库。回答要覆盖语义索引、关键词索引、结构化代码索引和权限索引如何协同检索、过滤、排序和增量更新。
向量数据库在 AI 应用中数据量增大时,如何扩展索引、分片和召回性能?
这题考向量库从小规模知识库增长到大规模检索服务时的扩展思路。回答要覆盖容量评估、索引选择、分片分区、过滤与召回、在线更新、评估和成本延迟取舍。
RAG 外部知识库分片过大时,如何重新切分、保留语义边界并控制召回噪声?
这题考 RAG 知识库切分的工程细节,重点是说明分片过大会稀释 embedding、挤占上下文、引入噪声,并给出递归切分、层级索引、元数据继承、召回重排和回归评测方案。
同题还出现在 1 个公司岗位
Agent 如何从对话中更新向量记忆库里的用户画像,避免脏记忆、过期记忆和隐私风险?
这题考 Agent 长期记忆的写入路径:从对话提取用户画像不能直接整段入库,而要做候选抽取、确认、结构化、去重、过期、隐私过滤和可撤回治理。
向量检索中常见相似度计算指标有哪些?余弦相似度、点积和欧氏距离如何选择?
这题考向量检索基础和工程选择:候选人要能解释 cosine、dot product、L2 的含义、适用前提、归一化关系,以及为什么指标要和 embedding 训练目标及索引配置一致。
RAG 混合召回链路中 URL 解析怎么做,如何把网页链接、正文和元数据接入向量与关键词召回?
这题考的是 Web 类知识源进入 RAG 的完整索引链路:候选人要能讲清 URL 规范化、网页抓取解析、正文抽取、元数据建模、chunk 切分、向量和关键词混合召回、权限过滤、去重引用和评估闭环。
RAG 为什么要引入父子索引,如何兼顾小粒度召回和大粒度上下文回填?
这题考的是 RAG 检索粒度设计:小 chunk 更容易被向量或关键词召回命中,但单独放进上下文时可能缺少标题、章节、定义、前提和表格上下文;父子索引用子块做高精度召回,用父文档或父章节做证据回填,从而兼顾召回命中率、答案可读性和上下文预算。
RAG 检索中为什么要混合 BM25 和向量召回,融合权重或比例如何设置和评估?
这题考 sparse+dense hybrid retrieval 的工程判断:BM25 擅长精确词项、专名、数字、错误码和短查询,向量召回擅长语义相近、同义表达和自然语言问题。融合比例不是拍脑袋固定值,而要根据 query 类型、离线指标、线上反馈、延迟成本和 badcase 分布动态调优。
同题还出现在 1 个公司岗位
RAG 需要跨多个文档综合回答时,如何做多跳召回、证据合并和冲突处理?
这题考的是多文档 RAG 的端到端设计能力:不能只说把更多 chunk 塞进上下文,而要能讲清问题拆解、多路召回、证据覆盖、去重合并、冲突处理、带引用生成和评估闭环。
RAG 检索召回无关内容时,如何从 query rewrite、混合检索、rerank、过滤和拒答机制处理?
这题考察候选人能否把 RAG 无关召回拆成可诊断、可治理、可评估的检索链路问题,而不是只说调提示词或换模型。
同题还出现在 1 个公司岗位
生产级 RAG 的数据解析与入库流水线如何设计,如何处理 PDF、DOCX、表格、图片和多格式文档?
生产级 RAG 的数据解析与入库流水线应从文件接入、格式识别、内容解析、结构保留、规范化切分、embedding、索引落库、权限和质量监控全链路设计。PDF、DOCX、表格、图片、Markdown、TXT 和富文本的解析策略不同:PDF 要区分数字文本和扫描件,DOCX 要保留标题层级和表格,表格要理解 sheet、表头和单元格关系,图片要 OCR 或生成视觉描述,多格式文档要保留统一的 document、section、chunk 和 asset 元数据。入库侧要支持幂等、版本、增量更新、失败重试、死信队列、ACL 过滤、向量库和关键词索引协同,以及可回溯的解析证据。
RAG 处理大表格时,如何切块、限流和错峰,避免索引写入与消息队列被压垮?
这题考的是候选人能否把大表格 RAG 从“把每一行都扔进 embedding 和向量库”升级为可控的数据管道:先减少无效 chunk,再用限流、批量、队列削峰、错峰调度和可观测性保护索引系统与消息队列。
RAG 中 query rewrite、HyDE 和 RRF 分别解决什么问题,如何接入混合检索链路?
这题考的是候选人是否能区分 query rewrite、HyDE 和 RRF 在混合检索中的职责:rewrite 改善查询表达,HyDE 用假设答案拉近语义空间,RRF 融合多路召回结果,它们分别作用在召回前、向量查询构造和多路结果融合阶段。
图纸类视觉内容没有文本描述时,如何依托视觉特征、多模态 Embedding 和向量检索实现精准召回?
这题考无文本图纸检索系统设计:要能从图纸预处理、视觉和多模态 embedding、向量索引、混合召回、重排、评估和工程更新链路讲清楚如何提高精准召回。
向量数据库检索到语义相关但时间过久的历史信息时,RAG 系统应如何判断能否使用?
这道题考察 RAG 系统面对“语义相关但时间过久”的向量检索结果时,如何把相关性判断升级为证据可用性判断。回答要说明不能只看 embedding 分数,而要结合问题的时效敏感度、文档时间戳、版本、生效范围、来源权威性、与新证据的冲突情况和业务风险来决定使用、降权、补检、拒答或提示不确定。好的方案还要覆盖元数据过滤、时间衰减、动态检索、冲突检测、评估指标和上线监控。
VikingDB 这类向量数据库如何设计核心链路,向量写入、ANN 索引、元数据过滤和查询召回如何协同?
这道题考察对向量数据库核心链路的系统设计能力,而不是背某个产品未公开实现。回答要从写入、向量化、分片、持久化、ANN 索引构建、增量更新、元数据过滤、查询召回、重排和运维指标串起来,说明向量、原始文档、元数据和索引如何保持一致。关键是讲清近似召回与过滤条件的协同:先过滤、后过滤、混合过滤各有什么代价;写入与索引的实时性、删除更新、分布式扩展、一致性和评估指标如何设计。
文本搜图场景如何设计图片搜索系统,让用户搜“小狗”时能召回包含小狗的图片?
文本搜图系统要让用户输入“小狗”时召回包含小狗的图片,核心不是只按文件名搜索,而是建立图片内容理解、文本语义表示、索引召回和排序评估的完整链路。图片侧需要离线或实时提取对象标签、检测框、caption、OCR、视觉向量和多模态向量;查询侧需要把文本解析成语义向量和关键词;召回侧结合倒排索引、向量检索和元数据过滤;排序侧再按语义匹配、对象置信度、图片质量和用户意图重排。
推荐召回中 Word2Vec 召回具体怎么做,训练样本和近邻检索如何设计?
这道题考察 item2vec 召回的完整链路。好答案要从行为序列构造、样本窗口、负采样、向量训练、ANN 建索引、线上 seed 扩展、过滤去重、融合排序和指标验证讲起,而不是只说用 Word2Vec 算相似 item。
同题还出现在 1 个公司岗位
推荐系统里的基于深度模型召回怎么做,如何与 ItemCF 或 Word2Vec 召回配合?
这道题考察深度召回的模型和工程边界。好的回答要说明双塔/DSSM/YouTube DNN 等模型如何学习 user/item 向量,如何用 ANN 服务大规模候选,如何与 ItemCF、Word2Vec 等通道互补,以及负样本、偏差、版本、索引和指标如何治理。
RAG 和 Embedding 分别是什么,在大模型应用中各自解决什么问题?
这道题看似是定义题,实际考察大模型应用的知识接入链路。Embedding 是把对象映射成可计算的语义向量,RAG 是检索增强生成架构;RAG 常用 embedding 做召回,但不等于向量库加大模型,还需要文档切分、索引、混合检索、重排、权限、引用、拒答、评估和监控。
在商品库中如何快速找出相似商品描述,倒排索引、向量召回和 ANN 检索各适合什么场景?
这道题考商品文本检索的工程设计。好答案要先定义“相似”是近重复、同款、替代品还是语义相关,再比较倒排索引、向量召回和 ANN 的机制、成本、召回质量、实时更新和线上评估。
RAG 知识库有十几万文档时,如何设计切片、索引、召回和增量更新,避免检索质量与性能下降?
这题考察大规模 RAG 知识库的工程扩展能力。十几万文档不是简单把文本塞进向量库,而要设计文档解析、切片策略、索引结构、召回链路、重排、增量更新、权限过滤、评估和性能优化。好的回答要同时覆盖质量和性能,说明如何避免召回变差、延迟变高、索引过期和重复内容污染。
构建 AI Agent 时,Memory 机制通常如何分层设计,短期上下文、长期记忆和检索注入分别解决什么问题?
这题考察的是候选人是否理解 Agent Memory 不是一个简单向量库,而是一套分层状态管理和检索注入机制。回答要区分短期上下文、工作记忆、长期记忆、外部知识检索和写入更新策略,并说明每层解决的问题、成本权衡、失效模式和评估方法。
基于商品属性 Embedding 的推荐召回如何设计,如何处理属性特征、向量索引和冷启动?
这道题考察的是候选人能否把“商品属性 Embedding”从一个模糊向量概念,拆成一条完整召回链路。商品属性包括类目、品牌、价格带、标签、文本描述、图片特征、商家、地域、质量分等结构化和非结构化信息。设计时要先定义属性 schema 和清洗规则,再把稀疏属性编码成 item embedding,构建 ANN 向量索引,在线用用户画像、最近行为或 query embedding 召回相似商品,并处理过滤、去重、冷启动、实时更新和效果评估。好的回答要强调它适合新商品、长尾商品和行为稀疏场景,但不能完全替代协同过滤;属性相似不等于用户会转化,仍需要后续排序和实验验证。
RAG 系统上线时,向量数据库应选择实时增量更新还是离线批量刷新?本地部署架构如何搭建,并如何评估检索与生成效果?
这道题考察 RAG 系统从向量库更新、部署架构到效果评估的上线能力。回答要权衡实时增量和离线批刷,并覆盖本地部署组件、权限、回滚和检索/生成指标。
RAG 文档发生局部更新时,如何通过增量索引避免全量重新向量化,并保证检索结果一致?
这题考生产级 RAG 数据更新。回答要讲文档版本、chunk 变更检测、增量 embedding、索引原子切换、删除 tombstone 和检索一致性。