已解析题目
后端开发工程师相关题目
Claude Code 使用 grep 检索与 RAG 检索有什么区别?
grep 检索和 RAG 检索的区别在于前者是确定性的文本匹配工具,后者是面向语义召回、上下文组织和生成回答的检索增强流程。
Agent 系统中的 skill(能力模块)应如何设计和实现?
这题考 Agent 能力模块的工程抽象,回答要说明 skill 的边界、契约、工具绑定、权限、测试、版本和失败处理。
同题还出现在 1 个公司岗位
RAG 混合召回链路中 URL 解析怎么做,如何把网页链接、正文和元数据接入向量与关键词召回?
这题考的是 Web 类知识源进入 RAG 的完整索引链路:候选人要能讲清 URL 规范化、网页抓取解析、正文抽取、元数据建模、chunk 切分、向量和关键词混合召回、权限过滤、去重引用和评估闭环。
聊天 AI 应用中如何减少大模型幻觉?
减少聊天 AI 应用中的大模型幻觉,需要同时处理知识来源、提示约束、检索增强、工具调用、输出校验、拒答策略、评测监控和用户体验。核心原则是让模型少凭空补全,多基于可验证证据回答,并在证据不足时明确不确定。
同题还出现在 1 个公司岗位
大模型微调方法有哪些?
大模型微调可以从“训练目标”和“参数更新方式”两条线回答:训练目标包括继续预训练、监督微调、偏好对齐和任务适配;参数更新方式包括全参数微调和参数高效微调。面试中要说清每类方法解决什么问题、用什么数据、优化什么损失,以及成本和风险。
同题还出现在 1 个公司岗位
RAG 什么时候只用静态知识库,什么时候需要接入动态网页检索?
这道题考察 RAG 检索源选择和系统边界设计。回答要说明静态知识库适合权威、可治理、更新频率低或组织受控知识,优势是稳定、可审计、低延迟、低风险;动态网页检索适合新闻、政策、价格、版本、故障状态、市场信息等变化快且静态库无法覆盖的问题,优势是新鲜度和覆盖面。高质量回答应给出 query 路由、混合检索、来源可信度、成本延迟、安全合规、冲突处理、引用和评估方案,而不是简单说“静态不够就联网”。
多 Agent 协作时,Agent 之间如何传递状态、消息和工具结果,并避免并发读写冲突?
这道题考察多 Agent 系统的状态建模、通信协议、工具结果传递和并发一致性设计。好答案不能停留在 Agent 之间互相发消息,而要区分临时对话消息、可持久化任务状态、不可变工具产物和需要事务保护的共享资源。回答边界应覆盖消息队列或事件总线、共享状态存储、编排器协调、版本号或乐观锁、文件和数据库写入隔离、幂等重试、冲突检测,以及如何用日志和压测证明没有丢消息、重复执行和覆盖写。
Agent 的 self-refine 自我修正如何处理 API 返回字段缺失、冗余或结构不符合预期?
这道题考察 Agent 自我修正是否能和工程化 API 契约治理结合起来。好答案不能把 self-refine 说成让模型再想一遍,而要说明先用确定性 schema 校验发现字段缺失、冗余字段、类型错误和结构不匹配,再根据错误类型决定丢弃、补默认值、结构化转换、重调 API、降级或交给模型生成修复计划。边界是不能让模型凭空编造缺失事实;所有修复都要可追溯、有限重试、重新校验,并用错误率、修复成功率和幻觉字段率验证效果。
多 Agent 系统如何设计编排流程,并控制每个 Agent 的任务边界?
这题考多 Agent 编排流程和任务边界。回答重点是 coordinator、planner、executor、reviewer 的流程、契约、状态交接、冲突处理和可观测性,不是泛泛解释 Agent。
同题还出现在 1 个公司岗位
RAG 检索中为什么要混合 BM25 和向量召回,融合权重或比例如何设置和评估?
这题考 sparse+dense hybrid retrieval 的工程判断:BM25 擅长精确词项、专名、数字、错误码和短查询,向量召回擅长语义相近、同义表达和自然语言问题。融合比例不是拍脑袋固定值,而要根据 query 类型、离线指标、线上反馈、延迟成本和 badcase 分布动态调优。
同题还出现在 1 个公司岗位
Agent 调用服务端 API 工具的完整流程是什么?如何完成参数生成、鉴权、执行、错误处理和结果回填?
这题考 Agent 工具调用的工程链路:模型通常不直接访问业务 API,而是由宿主系统基于工具 schema、权限、参数校验、执行器、错误处理和结果回填来完成闭环。
同题还出现在 2 个公司岗位