快手后端开发工程师面经题库

生产级 RAG 的数据解析与入库流水线应从文件接入、格式识别、内容解析、结构保留、规范化切分、embedding、索引落库、权限和质量监控全链路设计。PDF、DOCX、表格、图片、Markdown、TXT 和富文本的解析策略不同：PDF 要区分数字文本和扫描件，DOCX 要保留标题层级和表格，表格要理解 sheet、表头和单元格关系，图片要 OCR 或生成视觉描述，多格式文档要保留统一的 document、section、chunk 和 asset 元数据。入库侧要支持幂等、版本、增量更新、失败重试、死信队列、ACL 过滤、向量库和关键词索引协同，以及可回溯的解析证据。

RAG Embedding 向量数据库 AI 搜索系统设计稳定性

快手 / 后端开发

RAG 处理大表格时，如何切块、限流和错峰，避免索引写入与消息队列被压垮？

这题考的是候选人能否把大表格 RAG 从“把每一行都扔进 embedding 和向量库”升级为可控的数据管道：先减少无效 chunk，再用限流、批量、队列削峰、错峰调度和可观测性保护索引系统与消息队列。

RAG Embedding 向量数据库消息队列稳定性性能排查

快手 / 后端开发

RAG 中 query rewrite、HyDE 和 RRF 分别解决什么问题，如何接入混合检索链路？

这题考的是候选人是否能区分 query rewrite、HyDE 和 RRF 在混合检索中的职责：rewrite 改善查询表达，HyDE 用假设答案拉近语义空间，RRF 融合多路召回结果，它们分别作用在召回前、向量查询构造和多路结果融合阶段。

RAG AI 搜索 Embedding 向量数据库模型评估

快手 / 后端开发

GraphRAG 中 local、global、混合检索和社区检索分别如何工作，适合什么问题？

这题考的是候选人是否理解 GraphRAG 不是单一检索方法，而是一组利用实体、关系、社区和文本证据组织上下文的策略：local 偏实体邻域，global 偏全局主题，社区检索偏聚合摘要，混合检索负责把图和文本召回结合起来。

RAG 图数据库 AI 搜索系统设计大语言模型

快手 / 后端开发

RAG 中如何评估 Rerank 的有效性，应该看哪些离线指标和线上指标？

这题考的是候选人能否把 rerank 评估从“看排序模型分数高不高”讲成完整闭环：离线看相关性排序和证据覆盖，线上看答案质量、用户行为、延迟成本和系统稳定性，并注意 rerank 可能改善排序但损害整体 RAG 体验。

RAG 模型评估 AI 搜索可观测性质量工程

快手 / 后端开发

RAG 中既然向量检索已经计算相似度，为什么还需要 Cross-Encoder 重排？

这道题考察 RAG 检索链路中双塔向量召回和 Cross-Encoder 重排的职责边界。好的回答要说明向量检索适合在大规模语料上做低成本粗召回，但它把 query 和文档分别编码，主要比较全局语义相似度，难以精细判断短语匹配、否定关系、字段约束、时效和答案可用性。Cross-Encoder 把 query 与候选片段一起输入模型，可以做 token 级交互和上下文相关判断，因此通常用于小候选集精排。回答还应覆盖成本、延迟、候选规模、失败模式、评估指标和何时不需要重排。

RAG Embedding AI 搜索模型评估系统设计

快手 / 后端开发

向量数据库检索到语义相关但时间过久的历史信息时，RAG 系统应如何判断能否使用？

这道题考察 RAG 系统面对“语义相关但时间过久”的向量检索结果时，如何把相关性判断升级为证据可用性判断。回答要说明不能只看 embedding 分数，而要结合问题的时效敏感度、文档时间戳、版本、生效范围、来源权威性、与新证据的冲突情况和业务风险来决定使用、降权、补检、拒答或提示不确定。好的方案还要覆盖元数据过滤、时间衰减、动态检索、冲突检测、评估指标和上线监控。

RAG 向量数据库 AI 搜索稳定性系统设计

快手 / 后端开发

Agent 的 think-execute 循环如何控制规划路径，避免偏离业务预期或无限循环？

这题考 Agent 循环规划的可控性，重点是说明为什么需要 think-execute，以及如何用目标约束、状态机、校验器、评估器、停止条件和测试回放确保路径不跑偏。

同题还出现在 1 个公司岗位

AI Agent 大语言模型工作流质量工程测试用例设计稳定性

快手 后端开发面经

后端开发工程师相关题目

快手后端开发面经