标签题目
AI Agent相关面试题
Agent 和传统大模型有什么区别?
Agent 和传统大模型的核心区别在于是否具备面向目标的规划、工具调用、状态管理和执行闭环。回答时要把 LLM 说成能力底座,把 Agent 说成围绕任务运行的系统。
如何通过后端和大模型实现司机智能接单助手?
司机智能接单助手可以按网约车接单辅助的后端系统设计题回答,重点不是只调用大模型,而是把订单特征、司机状态、规则风控、模型推理和可解释建议串成稳定闭环。
Claude Code 使用 grep 检索与 RAG 检索有什么区别?
grep 检索和 RAG 检索的区别在于前者是确定性的文本匹配工具,后者是面向语义召回、上下文组织和生成回答的检索增强流程。
堆栈分析到代码定位链路中,大模型调用应采用单轮还是多轮?
堆栈分析到代码定位适合采用受控多轮流程:单轮适合简单摘要,多轮适合逐步检索、验证和收敛,但必须限制步骤和工具输出。
多用户并发 Agent 中,记忆模块如何做隔离并保证线程安全?
这题考察多用户并发 Agent 的状态边界设计:记忆必须按 tenant、user、session 或 conversation 隔离,外部化存储并避免进程内共享可变状态,同时用原子写入、锁、版本号和异步上下文传递保证并发安全。
MCP 客户端调用服务端工具的完整交互流程是什么?
这题考 MCP 工具调用协议的端到端理解,回答时要按连接握手、工具发现、模型决策、客户端分发、服务端执行、结果回传和安全边界展开。
Agent 多工具调度模块如何做冲突检测与解决?
这题考 Agent 多工具并发调度的工程治理,回答要说明冲突类型、预检查、执行中仲裁、补偿和审计闭环。
Agent 工具调用超时后如何设计降级方案?
这题考 Agent 工具调用可靠性设计,回答要围绕超时预算、重试、降级答案、异步继续、熔断和用户可见状态展开。
同题还出现在 1 个公司岗位
Agent 系统中的 skill(能力模块)应如何设计和实现?
这题考 Agent 能力模块的工程抽象,回答要说明 skill 的边界、契约、工具绑定、权限、测试、版本和失败处理。
同题还出现在 1 个公司岗位
Agent 系统 Prompt 如何设计迭代,并处理用户请求不完整的意图补全?
这题考 Agent system prompt 的工程化设计,以及用户请求不完整时如何识别缺口、澄清、假设和补全。
Agent 场景下 Prompt 自动优化应如何工程化设计?
这题考 Agent Prompt 自动优化的工程化闭环,回答要聚焦候选生成、离线评测、安全门禁、灰度实验和回滚。
创作 Agent 的效果评估指标如何同时覆盖任务成功率、创作质量和用户信任?
这题考创作 Agent 的效果评估体系,回答要同时覆盖任务成功、创作质量、用户信任、安全合规、效率成本和反馈闭环。
AI 产品需求什么时候应该做 Agent,什么时候应该做确定性工作流?
这题考 AI 产品需求中 Agent 和确定性工作流的边界判断,回答要用不确定性、自治程度、失败成本、可观测性和混合架构来决策。
代码生成或代码定位场景中,文件过长超过 LLM 上下文窗口时如何处理?
这题考代码生成或代码定位中长文件超过 LLM 上下文窗口的工程处理,重点是检索、切片、结构化上下文和验证,而不是泛泛讨论 long context 退化。
金融场景下 Agent 超时、失败或中断时,如何设计安全重试和兜底?
这题考金融场景下 Agent 执行失败后的安全边界。答案必须围绕资金安全、幂等、状态机、确认、审计、对账和补偿展开,不能写成普通接口超时重试。
同公司岗位有 3 条面经记录
多 Agent 系统如何设计编排流程,并控制每个 Agent 的任务边界?
这题考多 Agent 编排流程和任务边界。回答重点是 coordinator、planner、executor、reviewer 的流程、契约、状态交接、冲突处理和可观测性,不是泛泛解释 Agent。
同题还出现在 1 个公司岗位
Agent Skill 不一定可靠时,如何用 Workflow 和 System Prompt 固定主流程?
这题考 Skill 不可靠时如何用 Workflow 和 System Prompt 固定主流程。答案要覆盖能力探测、节点契约、流程骨架、受控执行、重试降级、前端确认和提示词护栏。
Agent 项目如何选择底层模型,依据和验证方法是什么?
这题考 Agent 项目的底层模型选型。答案要从任务类型、工具调用、结构化输出、上下文、延迟成本、安全、评测集、灰度和 fallback 路由来讲。
Agent 长期记忆功能如何设计、召回和持续优化?
这题考 Agent 长期记忆的生命周期,不是多用户隔离。答案要覆盖存什么、如何抽取、召回、更新、遗忘、删除、隐私授权和质量评估。
大模型幻觉在 Agent 服务化中会带来哪些问题,如何治理?
这题考大模型幻觉在 Agent 服务化中的生产风险。答案要聚焦错误工具调用、虚假状态、操作控制、权限、审计、dry-run、确认和事故闭环,而不是泛泛说 RAG 和提示词。
AI Agent 系统从通用 Agent 模式切到 Cline / Code 模式时,如何量化评估效果差异?
这题考 AI Coding Agent 从通用 Agent 模式切到 Cline / Code 模式后的工程评估方法,回答要覆盖任务成功率、代码变更正确性、工具调用稳定性、延迟成本和用户验收。
RAG 能力作为 Agent 工具开放后,如何评估召回质量、任务成功率和用户体验?
这题考 RAG 作为 Agent 工具后的评估体系,重点不是单纯调召回,而是同时评估检索质量、工具选择、答案可信度、端到端任务成功和用户体验。
Agent 短期记忆应何时抽取、存放到哪里,并如何拼进 System Prompt?
这题考 Agent 短期记忆的工程链路,回答要区分对话缓冲、摘要、抽取事实和工具状态,并说明抽取时机、存储位置、Prompt 拼装顺序、预算控制和失效规则。
同题还出现在 2 个公司岗位
Agent 记忆出现过期或冲突事实时,如何更新、覆盖和回溯?
这题考 Agent 记忆过期和冲突事实的治理,回答要覆盖事实版本、来源置信度、用户确认、覆盖规则、tombstone、审计回溯和 Prompt 侧只使用当前有效记忆。
同题还出现在 1 个公司岗位
多模态 Agentic RL 中用 VERL 做强化学习时,如何判断训练进度和收敛质量?
这题考多模态 Agentic RL 训练过程的可观测和收敛判断,回答要覆盖奖励曲线、成功率分层、KL/熵、rollout 质量、视觉 grounding 和回归评测。
同题还出现在 1 个公司岗位
DeepResearch 类 Agent 如何和 RL 后训练结合,整体训练流程是什么?
这题考 DeepResearch 类 Agent 的 RL 后训练流程,重点是轨迹采集、工具动作、奖励设计、偏好或结果信号、策略优化、评测和防止研究型 Agent 走偏。
Agent 中上下文工程如何设计,如何组织 System Prompt、工具结果和记忆?
这题考 Agent 上下文工程的结构化设计,回答重点是如何组织 System Prompt、用户任务、工具结果、记忆、约束和截断策略,让模型拿到必要信息而不过载。
同题还出现在 2 个公司岗位
LangGraph 相比 LangChain 在多 Agent 编排中有什么优势,状态快照机制解决什么问题?
这题考多 Agent 编排中框架选型和状态管理能力,回答重点是图式编排、可恢复状态、调试回放、人工介入和长流程可靠性。
同题还出现在 1 个公司岗位
生产级 Agent 如何设计敏感词过滤、停止生成和死循环防护?
这题考生产级 Agent 的运行时安全控制,回答重点是敏感内容过滤、停止生成、工具切换约束、死循环防护、观测告警和人工接管。
基于 LangGraph 和 RAG 的内容生成 Agent,应如何设计检索、生成和审核流程?
这题考用 LangGraph 和 RAG 设计内容生成 Agent 的端到端流程,回答重点是检索、证据整理、生成、审核、重试和发布前控制,而不是只讲向量召回。
Agent 沙箱中承载 Skill 时,如何避免工具调用幻觉和多工具切换混乱?
这题考 Agent 沙箱中 Skill 的可靠调用,回答重点是能力声明、工具选择约束、沙箱权限、调用确认、错误恢复和防止模型编造工具能力。
Agent Memory 为什么不能简单塞进 Prompt,渐进式披露如何减少上下文污染?
这题考 Agent Memory 的上下文污染控制,回答重点是为什么不能把全部记忆塞进 Prompt,以及如何通过渐进式披露按任务阶段加载必要记忆。
同题还出现在 1 个公司岗位
Agent 沙箱运行上下文如何封装用户配置、能力定义和可执行工具?
这题考 Agent 沙箱运行上下文的封装方式,回答重点是用户配置、能力定义、权限边界、可执行工具、工作目录、环境变量和可观测状态如何统一管理。
同题还出现在 1 个公司岗位
Agent 项目选用 OpenAI Agents SDK 时,应如何和自研或开源框架做选型?
这题考 Agent 框架选型方法,回答重点是用任务复杂度、编排需求、工具集成、可观测性、评测、锁定风险、生态成熟度和迁移成本做理性比较。
Agent 任务中 Human-in-the-Loop 应如何设计确认、纠错和中断流程?
这题考 Agent 任务中的 Human-in-the-Loop 控制点设计,回答重点是确认、纠错、中断、恢复、审计和人机责任边界。
Agent 系统中 Multi-Agent、One-Agent 和 LLM+Workflow 应如何选型?
这题考 Agent 架构模式选型,回答重点是 Multi-Agent、One-Agent 和 LLM+Workflow 在复杂度、可控性、成本、延迟、可观测性和适用场景上的取舍。
同题还出现在 2 个公司岗位
Agent 系统如何把用户反馈接入 DPO/PPO 训练,并用 ELO 评估版本效果?
这题考 Agent 反馈闭环和版本评估,回答重点是如何把用户反馈转成偏好数据、用于 DPO/PPO 优化,并用 ELO 或对战评估做版本选择。
Agent 中模型调用、本地函数调用、MCP 调用和 Skill 调用有什么区别?
这题考 Agent 调用边界设计,回答重点是模型调用、本地函数调用、MCP 调用和 Skill 调用在调用方、协议、信任边界、生命周期和失败处理上的区别。
同题还出现在 1 个公司岗位
Claude Code 类代码 Agent 的 Memory 三层设计如何区分短期上下文、项目知识和长期偏好?
这题考代码 Agent 的记忆分层设计,回答重点是短期工作上下文、项目知识和长期偏好三层如何分工,以及如何更新、检索、隔离和防污染。
如何手写一个 Skill 系统,支持注册、发现和调用本地能力?
这题考手写 Skill 系统的最小实现,回答重点是注册、发现、参数校验、权限控制、调用分发、错误处理和可观测 trace。
Agentic RL 项目中,如何判断 SFT 阶段已经可以进入 RL 后训练?
这题考 Agentic RL 的训练阶段判断,重点是 SFT 是否已经让模型具备稳定轨迹、工具协议、基础成功率和可评估 reward,再决定进入 RL。
MCP 的传输层有哪些方式,stdio 和 Streamable HTTP 分别适合什么场景?
这题考 MCP 的通信协议和传输层取舍,回答重点是 MCP 定义的是客户端、服务器和工具的上下文协议,传输上要区分本地 stdio、当前远程 Streamable HTTP,以及旧 HTTP+SSE 的历史或兼容语境。
代码 Agent 的 RAG 检索索引如何同时设计语义、关键词、结构化和权限索引?
这题考代码 Agent 的 RAG 索引架构,不是泛泛讲向量库。回答要覆盖语义索引、关键词索引、结构化代码索引和权限索引如何协同检索、过滤、排序和增量更新。
AIGC 产品中 AI 与人工应如何分工协同,既提效又控制质量风险?
这题考 AIGC 产品经理能否把“AI 替代人工”改写成更成熟的人机协同系统。高质量回答应说明哪些任务交给 AI,哪些判断保留给人,哪些场景需要人工复核,以及如何用产品机制、指标和反馈闭环持续优化。
AI 面试系统中,多轮对话记忆如何用 Redis 存储、过期和隔离?
这题考 AI 面试系统里的短期会话记忆设计。回答要围绕 Redis 如何保存多轮对话状态、控制 TTL、做用户/会话隔离、处理并发和失败恢复,不能泛化成抽象 Agent 记忆。
Agent 自动生成 PPT 后,如何设计展示效果校验和自动迭代闭环?
这题考文档生成 Agent 的自验证闭环。回答要聚焦 PPT 渲染后的视觉效果、内容一致性、规则校验、多模态评估、人工审核和局部迭代,而不是泛泛说让模型再检查一遍。
使用 AI 编程时,如果模型生成了严重错误代码,应如何定位、修复并建立工程防护?
这题考 AI Coding 不是只会提高效率,还要能处理模型误生成带来的工程事故。高质量回答应从复现、定位、最小修复、测试补齐、流程护栏和团队经验沉淀展开。
AI Coding 落地时,如何给模型提供有效仓库上下文,并限制它触碰事务、权限、资金等高风险链路?
这题考 AI Coding 的上下文工程和风险边界。答案要同时讲清如何给模型足够信息完成任务,以及如何通过范围控制、权限控制、测试和 review 防止它碰坏核心链路。