已解析题目
后端开发工程师相关题目
AI Agent 系统从通用 Agent 模式切到 Cline / Code 模式时,如何量化评估效果差异?
这题考 AI Coding Agent 从通用 Agent 模式切到 Cline / Code 模式后的工程评估方法,回答要覆盖任务成功率、代码变更正确性、工具调用稳定性、延迟成本和用户验收。
RAG 能力作为 Agent 工具开放后,如何评估召回质量、任务成功率和用户体验?
这题考 RAG 作为 Agent 工具后的评估体系,重点不是单纯调召回,而是同时评估检索质量、工具选择、答案可信度、端到端任务成功和用户体验。
强模型直连与本地模型 + RAG + Prompt 优化,应如何按成本、延迟、安全和效果取舍?
这题考强模型直连与本地模型加 RAG 和 Prompt 优化之间的架构取舍,回答要按效果、成本、延迟、安全、可控性和运维复杂度做决策,而不是给单一答案。
LLM 服务在 500 并发下如何把 TTFT P99 从 3s 优化到 1.5s?
这题考高并发 LLM 服务的首 token 长尾优化,回答要先建立可观测性,再从排队、调度、prefill/decode、批处理、KV 缓存、prompt 长度、容量和流式链路逐层处理。
Agent 中上下文工程如何设计,如何组织 System Prompt、工具结果和记忆?
这题考 Agent 上下文工程的结构化设计,回答重点是如何组织 System Prompt、用户任务、工具结果、记忆、约束和截断策略,让模型拿到必要信息而不过载。
同题还出现在 2 个公司岗位
LangGraph 相比 LangChain 在多 Agent 编排中有什么优势,状态快照机制解决什么问题?
这题考多 Agent 编排中框架选型和状态管理能力,回答重点是图式编排、可恢复状态、调试回放、人工介入和长流程可靠性。
同题还出现在 1 个公司岗位
生产级 Agent 如何设计敏感词过滤、停止生成和死循环防护?
这题考生产级 Agent 的运行时安全控制,回答重点是敏感内容过滤、停止生成、工具切换约束、死循环防护、观测告警和人工接管。
基于 LangGraph 和 RAG 的内容生成 Agent,应如何设计检索、生成和审核流程?
这题考用 LangGraph 和 RAG 设计内容生成 Agent 的端到端流程,回答重点是检索、证据整理、生成、审核、重试和发布前控制,而不是只讲向量召回。
使用 AI 编程时,如果模型生成了严重错误代码,应如何定位、修复并建立工程防护?
这题考 AI Coding 不是只会提高效率,还要能处理模型误生成带来的工程事故。高质量回答应从复现、定位、最小修复、测试补齐、流程护栏和团队经验沉淀展开。
把 Skill 放进 Agent 沙箱后,主 Agent、Skill 运行时和文件系统之间应如何通信,并怎样做最小暴露和渐进式披露?
这题考 Agent 工程里的沙箱通信边界:不能让 Skill 直接拿到宿主进程和完整文件系统,而要用受控协议、能力句柄、文件视图和审计链路把调用、数据和权限拆开。
Agent 上下文压缩应该在什么时候触发,如何在 token 预算、信息损失和任务连续性之间取舍?
这题考上下文压缩的运行时策略:触发点不能只看 token 快满,而要结合任务阶段、信息密度、工具结果、记忆状态、失败风险和可恢复性来决定。
同题还出现在 1 个公司岗位
Agent 使用滑动窗口摘要时,旧摘要应逐步合并还是分段保留,如何控制信息遗失、冲突和可追溯性?
这题考滑动窗口摘要的状态维护策略:合并摘要更省上下文,分段摘要更可追溯,工程上通常需要分层结构而不是二选一。
Agent 如何从对话中更新向量记忆库里的用户画像,避免脏记忆、过期记忆和隐私风险?
这题考 Agent 长期记忆的写入路径:从对话提取用户画像不能直接整段入库,而要做候选抽取、确认、结构化、去重、过期、隐私过滤和可撤回治理。
大模型 Function Call 为什么会产生工具调用幻觉,工程上如何用 schema、权限、校验和反馈闭环降低误调用?
这题考 Function Call 的工程治理能力:工具调用幻觉不只靠 prompt 解决,还要靠工具契约、调用门禁、参数校验、执行反馈、回退策略和评测闭环共同降低。
同题还出现在 3 个公司岗位
Chain-of-Thought 为什么能提升复杂推理任务表现,它的收益、风险和生产可控性如何理解?
这题考 Chain-of-Thought 的机制理解:它通过显式或隐式中间步骤降低复杂任务的一次性求解难度,但上线时要控制答案暴露、成本、稳定性和可验证性。
同题还出现在 1 个公司岗位
Agent 系统中 Multi-Agent、One-Agent 和 LLM+Workflow 应如何选型?
这题考 Agent 架构模式选型,回答重点是 Multi-Agent、One-Agent 和 LLM+Workflow 在复杂度、可控性、成本、延迟、可观测性和适用场景上的取舍。
同题还出现在 2 个公司岗位
Agent 沙箱运行上下文如何封装用户配置、能力定义和可执行工具?
这题考 Agent 沙箱运行上下文的封装方式,回答重点是用户配置、能力定义、权限边界、可执行工具、工作目录、环境变量和可观测状态如何统一管理。
同题还出现在 1 个公司岗位
Agent 短期记忆应何时抽取、存放到哪里,并如何拼进 System Prompt?
这题考 Agent 短期记忆的工程链路,回答要区分对话缓冲、摘要、抽取事实和工具状态,并说明抽取时机、存储位置、Prompt 拼装顺序、预算控制和失效规则。
同题还出现在 2 个公司岗位
RAG 外部知识库分片过大时,如何重新切分、保留语义边界并控制召回噪声?
这题考 RAG 知识库切分的工程细节,重点是说明分片过大会稀释 embedding、挤占上下文、引入噪声,并给出递归切分、层级索引、元数据继承、召回重排和回归评测方案。
同题还出现在 1 个公司岗位
向量检索中 IVF_FLAT 和 HNSW 有什么区别,如何按召回率、延迟和内存选型?
这题考向量检索索引选型,回答重点是 IVF_FLAT 的聚类倒排思想、HNSW 的近邻图搜索思想,以及召回、延迟、内存、构建和更新成本的权衡。
同题还出现在 1 个公司岗位
PagedAttention 如何改善 LLM 长上下文推理的 KV Cache 管理?
这题考 PagedAttention 如何改善长上下文 LLM 推理中的 KV Cache 管理,回答重点是块化分页、减少碎片、支持连续批处理和提升显存利用率。
同题还出现在 1 个公司岗位
RAG 为什么要引入父子索引,如何兼顾小粒度召回和大粒度上下文回填?
这题考的是 RAG 检索粒度设计:小 chunk 更容易被向量或关键词召回命中,但单独放进上下文时可能缺少标题、章节、定义、前提和表格上下文;父子索引用子块做高精度召回,用父文档或父章节做证据回填,从而兼顾召回命中率、答案可读性和上下文预算。
RAG 检索中为什么要混合 BM25 和向量召回,融合权重或比例如何设置和评估?
这题考 sparse+dense hybrid retrieval 的工程判断:BM25 擅长精确词项、专名、数字、错误码和短查询,向量召回擅长语义相近、同义表达和自然语言问题。融合比例不是拍脑袋固定值,而要根据 query 类型、离线指标、线上反馈、延迟成本和 badcase 分布动态调优。
同题还出现在 1 个公司岗位
RAG rerank 后 TopK 与上下文长度预算如何选择,过短或过长时怎么处理?
这题考的是 rerank 之后的证据选择策略:TopK 不是固定返回几个 chunk,而是在相关性、证据覆盖、去重多样性、父子扩展、token 预算、模型长上下文能力、延迟成本和拒答策略之间做动态取舍。
生产级 RAG 的数据解析与入库流水线如何设计,如何处理 PDF、DOCX、表格、图片和多格式文档?
生产级 RAG 的数据解析与入库流水线应从文件接入、格式识别、内容解析、结构保留、规范化切分、embedding、索引落库、权限和质量监控全链路设计。PDF、DOCX、表格、图片、Markdown、TXT 和富文本的解析策略不同:PDF 要区分数字文本和扫描件,DOCX 要保留标题层级和表格,表格要理解 sheet、表头和单元格关系,图片要 OCR 或生成视觉描述,多格式文档要保留统一的 document、section、chunk 和 asset 元数据。入库侧要支持幂等、版本、增量更新、失败重试、死信队列、ACL 过滤、向量库和关键词索引协同,以及可回溯的解析证据。
RAG 处理大表格时,如何切块、限流和错峰,避免索引写入与消息队列被压垮?
这题考的是候选人能否把大表格 RAG 从“把每一行都扔进 embedding 和向量库”升级为可控的数据管道:先减少无效 chunk,再用限流、批量、队列削峰、错峰调度和可观测性保护索引系统与消息队列。
RAG 中 query rewrite、HyDE 和 RRF 分别解决什么问题,如何接入混合检索链路?
这题考的是候选人是否能区分 query rewrite、HyDE 和 RRF 在混合检索中的职责:rewrite 改善查询表达,HyDE 用假设答案拉近语义空间,RRF 融合多路召回结果,它们分别作用在召回前、向量查询构造和多路结果融合阶段。
GraphRAG 中 local、global、混合检索和社区检索分别如何工作,适合什么问题?
这题考的是候选人是否理解 GraphRAG 不是单一检索方法,而是一组利用实体、关系、社区和文本证据组织上下文的策略:local 偏实体邻域,global 偏全局主题,社区检索偏聚合摘要,混合检索负责把图和文本召回结合起来。
RAG 中如何评估 Rerank 的有效性,应该看哪些离线指标和线上指标?
这题考的是候选人能否把 rerank 评估从“看排序模型分数高不高”讲成完整闭环:离线看相关性排序和证据覆盖,线上看答案质量、用户行为、延迟成本和系统稳定性,并注意 rerank 可能改善排序但损害整体 RAG 体验。
RAG 中既然向量检索已经计算相似度,为什么还需要 Cross-Encoder 重排?
这道题考察 RAG 检索链路中双塔向量召回和 Cross-Encoder 重排的职责边界。好的回答要说明向量检索适合在大规模语料上做低成本粗召回,但它把 query 和文档分别编码,主要比较全局语义相似度,难以精细判断短语匹配、否定关系、字段约束、时效和答案可用性。Cross-Encoder 把 query 与候选片段一起输入模型,可以做 token 级交互和上下文相关判断,因此通常用于小候选集精排。回答还应覆盖成本、延迟、候选规模、失败模式、评估指标和何时不需要重排。
向量数据库检索到语义相关但时间过久的历史信息时,RAG 系统应如何判断能否使用?
这道题考察 RAG 系统面对“语义相关但时间过久”的向量检索结果时,如何把相关性判断升级为证据可用性判断。回答要说明不能只看 embedding 分数,而要结合问题的时效敏感度、文档时间戳、版本、生效范围、来源权威性、与新证据的冲突情况和业务风险来决定使用、降权、补检、拒答或提示不确定。好的方案还要覆盖元数据过滤、时间衰减、动态检索、冲突检测、评估指标和上线监控。
Agent 的 think-execute 循环如何控制规划路径,避免偏离业务预期或无限循环?
这题考 Agent 循环规划的可控性,重点是说明为什么需要 think-execute,以及如何用目标约束、状态机、校验器、评估器、停止条件和测试回放确保路径不跑偏。
同题还出现在 1 个公司岗位