AI Agent 面试题解析

Agent 多工具调度模块如何做冲突检测与解决？

这题考 Agent 多工具并发调度的工程治理，回答要说明冲突类型、预检查、执行中仲裁、补偿和审计闭环。

Java 并发并发多线程 AI Agent 大语言模型系统设计

Agent 工具调用超时后如何设计降级方案？

这题考 Agent 工具调用可靠性设计，回答要围绕超时预算、重试、降级答案、异步继续、熔断和用户可见状态展开。

同题还出现在 1 个公司岗位

AI Agent 大语言模型稳定性服务治理系统设计

蚂蚁集团 / 后端开发

Agent 系统中的 skill（能力模块）应如何设计和实现？

这题考 Agent 能力模块的工程抽象，回答要说明 skill 的边界、契约、工具绑定、权限、测试、版本和失败处理。

同题还出现在 1 个公司岗位

AI Agent 大语言模型 AI 编程系统设计 Prompt 工程

百度 / 后端开发

Agent 系统 Prompt 如何设计迭代，并处理用户请求不完整的意图补全？

这题考 Agent system prompt 的工程化设计，以及用户请求不完整时如何识别缺口、澄清、假设和补全。

AI Agent Prompt 工程大语言模型系统设计

百度 / 后端开发

Agent 场景下 Prompt 自动优化应如何工程化设计？

这题考 Agent Prompt 自动优化的工程化闭环，回答要聚焦候选生成、离线评测、安全门禁、灰度实验和回滚。

AI Agent Prompt 工程大语言模型模型评估系统设计

阿里巴巴 / 产品

创作 Agent 的效果评估指标如何同时覆盖任务成功率、创作质量和用户信任？

这题考创作 Agent 的效果评估体系，回答要同时覆盖任务成功、创作质量、用户信任、安全合规、效率成本和反馈闭环。

AI 产品产品管理 AI Agent 模型评估产品指标

阿里巴巴 / 产品

AI 产品需求什么时候应该做 Agent，什么时候应该做确定性工作流？

这题考 AI 产品需求中 Agent 和确定性工作流的边界判断，回答要用不确定性、自治程度、失败成本、可观测性和混合架构来决策。

AI 产品产品管理 AI Agent 大语言模型稳定性

滴滴 / 后端开发

代码生成或代码定位场景中，文件过长超过 LLM 上下文窗口时如何处理？

这题考代码生成或代码定位中长文件超过 LLM 上下文窗口的工程处理，重点是检索、切片、结构化上下文和验证，而不是泛泛讨论 long context 退化。

大语言模型 AI Agent AI 编程 RAG Prompt 工程稳定性

腾讯 / 后端开发

金融场景下 Agent 超时、失败或中断时，如何设计安全重试和兜底？

这题考金融场景下 Agent 执行失败后的安全边界。答案必须围绕资金安全、幂等、状态机、确认、审计、对账和补偿展开，不能写成普通接口超时重试。

同公司岗位有 3 条面经记录

AI Agent 大语言模型稳定性安全幂等系统设计

腾讯 / 后端开发

多 Agent 系统如何设计编排流程，并控制每个 Agent 的任务边界？

这题考多 Agent 编排流程和任务边界。回答重点是 coordinator、planner、executor、reviewer 的流程、契约、状态交接、冲突处理和可观测性，不是泛泛解释 Agent。

同题还出现在 1 个公司岗位

AI Agent 大语言模型系统设计稳定性服务治理

百度 / 前端

Agent Skill 不一定可靠时，如何用 Workflow 和 System Prompt 固定主流程？

这题考 Skill 不可靠时如何用 Workflow 和 System Prompt 固定主流程。答案要覆盖能力探测、节点契约、流程骨架、受控执行、重试降级、前端确认和提示词护栏。

AI Agent Prompt 工程大语言模型稳定性前端工程化系统设计

Agent 项目如何选择底层模型，依据和验证方法是什么？

这题考 Agent 项目的底层模型选型。答案要从任务类型、工具调用、结构化输出、上下文、延迟成本、安全、评测集、灰度和 fallback 路由来讲。

AI Agent 大语言模型模型评估大模型推理稳定性系统设计

Agent 长期记忆功能如何设计、召回和持续优化？

这题考 Agent 长期记忆的生命周期，不是多用户隔离。答案要覆盖存什么、如何抽取、召回、更新、遗忘、删除、隐私授权和质量评估。

AI Agent 大语言模型内存管理 Embedding RAG 隐私保护

大模型幻觉在 Agent 服务化中会带来哪些问题，如何治理？

这题考大模型幻觉在 Agent 服务化中的生产风险。答案要聚焦错误工具调用、虚假状态、操作控制、权限、审计、dry-run、确认和事故闭环，而不是泛泛说 RAG 和提示词。

AI Agent 大语言模型大模型幻觉稳定性服务治理系统设计

AI Agent 系统从通用 Agent 模式切到 Cline / Code 模式时，如何量化评估效果差异？

这题考 AI Coding Agent 从通用 Agent 模式切到 Cline / Code 模式后的工程评估方法，回答要覆盖任务成功率、代码变更正确性、工具调用稳定性、延迟成本和用户验收。

AI Agent AI 编程大语言模型模型评估系统设计稳定性

RAG 能力作为 Agent 工具开放后，如何评估召回质量、任务成功率和用户体验？

这题考 RAG 作为 Agent 工具后的评估体系，重点不是单纯调召回，而是同时评估检索质量、工具选择、答案可信度、端到端任务成功和用户体验。

RAG AI Agent 大语言模型模型评估产品指标向量数据库

Agent 短期记忆应何时抽取、存放到哪里，并如何拼进 System Prompt？

这题考 Agent 短期记忆的工程链路，回答要区分对话缓冲、摘要、抽取事实和工具状态，并说明抽取时机、存储位置、Prompt 拼装顺序、预算控制和失效规则。

同题还出现在 2 个公司岗位

AI Agent 大语言模型内存管理 Prompt 工程系统设计

Agent 记忆出现过期或冲突事实时，如何更新、覆盖和回溯？

这题考 Agent 记忆过期和冲突事实的治理，回答要覆盖事实版本、来源置信度、用户确认、覆盖规则、tombstone、审计回溯和 Prompt 侧只使用当前有效记忆。

同题还出现在 1 个公司岗位

AI Agent 大语言模型内存管理稳定性隐私保护系统设计

滴滴 / 算法

多模态 Agentic RL 中用 VERL 做强化学习时，如何判断训练进度和收敛质量？

这题考多模态 Agentic RL 训练过程的可观测和收敛判断，回答要覆盖奖励曲线、成功率分层、KL/熵、rollout 质量、视觉 grounding 和回归评测。

同题还出现在 1 个公司岗位

多模态学习 AI Agent 强化学习模型训练模型评估大语言模型

美团 / 算法

DeepResearch 类 Agent 如何和 RL 后训练结合，整体训练流程是什么？

这题考 DeepResearch 类 Agent 的 RL 后训练流程，重点是轨迹采集、工具动作、奖励设计、偏好或结果信号、策略优化、评测和防止研究型 Agent 走偏。

AI Agent 大语言模型强化学习模型训练模型评估

Agent 中上下文工程如何设计，如何组织 System Prompt、工具结果和记忆？

这题考 Agent 上下文工程的结构化设计，回答重点是如何组织 System Prompt、用户任务、工具结果、记忆、约束和截断策略，让模型拿到必要信息而不过载。

同题还出现在 2 个公司岗位

AI Agent 大语言模型 Prompt 工程系统设计

LangGraph 相比 LangChain 在多 Agent 编排中有什么优势，状态快照机制解决什么问题？

这题考多 Agent 编排中框架选型和状态管理能力，回答重点是图式编排、可恢复状态、调试回放、人工介入和长流程可靠性。

同题还出现在 1 个公司岗位

AI Agent 大语言模型系统设计稳定性

生产级 Agent 如何设计敏感词过滤、停止生成和死循环防护？

这题考生产级 Agent 的运行时安全控制，回答重点是敏感内容过滤、停止生成、工具切换约束、死循环防护、观测告警和人工接管。

AI Agent 大语言模型稳定性安全服务治理

基于 LangGraph 和 RAG 的内容生成 Agent，应如何设计检索、生成和审核流程？

这题考用 LangGraph 和 RAG 设计内容生成 Agent 的端到端流程，回答重点是检索、证据整理、生成、审核、重试和发布前控制，而不是只讲向量召回。

AI Agent RAG 大语言模型 Prompt 工程系统设计

快手 / 算法

Agent 沙箱中承载 Skill 时，如何避免工具调用幻觉和多工具切换混乱？

这题考 Agent 沙箱中 Skill 的可靠调用，回答重点是能力声明、工具选择约束、沙箱权限、调用确认、错误恢复和防止模型编造工具能力。

AI Agent 大语言模型稳定性系统设计

快手 / 算法

Agent Memory 为什么不能简单塞进 Prompt，渐进式披露如何减少上下文污染？

这题考 Agent Memory 的上下文污染控制，回答重点是为什么不能把全部记忆塞进 Prompt，以及如何通过渐进式披露按任务阶段加载必要记忆。

同题还出现在 1 个公司岗位

AI Agent 大语言模型 Prompt 工程稳定性

快手 / 算法

Agent 沙箱运行上下文如何封装用户配置、能力定义和可执行工具？

这题考 Agent 沙箱运行上下文的封装方式，回答重点是用户配置、能力定义、权限边界、可执行工具、工作目录、环境变量和可观测状态如何统一管理。

同题还出现在 1 个公司岗位

AI Agent 大语言模型系统设计安全

Agent 项目选用 OpenAI Agents SDK 时，应如何和自研或开源框架做选型？

这题考 Agent 框架选型方法，回答重点是用任务复杂度、编排需求、工具集成、可观测性、评测、锁定风险、生态成熟度和迁移成本做理性比较。

Java 并发并发多线程 AI Agent 大语言模型系统设计

Agent 任务中 Human-in-the-Loop 应如何设计确认、纠错和中断流程？

这题考 Agent 任务中的 Human-in-the-Loop 控制点设计，回答重点是确认、纠错、中断、恢复、审计和人机责任边界。

AI Agent 大语言模型稳定性

Agent 系统中 Multi-Agent、One-Agent 和 LLM+Workflow 应如何选型？

这题考 Agent 架构模式选型，回答重点是 Multi-Agent、One-Agent 和 LLM+Workflow 在复杂度、可控性、成本、延迟、可观测性和适用场景上的取舍。

同题还出现在 2 个公司岗位

AI Agent 大语言模型系统设计稳定性

Agent 系统如何把用户反馈接入 DPO/PPO 训练，并用 ELO 评估版本效果？

这题考 Agent 反馈闭环和版本评估，回答重点是如何把用户反馈转成偏好数据、用于 DPO/PPO 优化，并用 ELO 或对战评估做版本选择。

AI Agent 大语言模型模型训练模型评估强化学习

Agent 中模型调用、本地函数调用、MCP 调用和 Skill 调用有什么区别？

这题考 Agent 调用边界设计，回答重点是模型调用、本地函数调用、MCP 调用和 Skill 调用在调用方、协议、信任边界、生命周期和失败处理上的区别。

同题还出现在 1 个公司岗位

AI Agent 大语言模型系统设计

Claude Code 类代码 Agent 的 Memory 三层设计如何区分短期上下文、项目知识和长期偏好？

这题考代码 Agent 的记忆分层设计，回答重点是短期工作上下文、项目知识和长期偏好三层如何分工，以及如何更新、检索、隔离和防污染。

AI Agent AI 编程大语言模型 Prompt 工程

如何手写一个 Skill 系统，支持注册、发现和调用本地能力？

这题考手写 Skill 系统的最小实现，回答重点是注册、发现、参数校验、权限控制、调用分发、错误处理和可观测 trace。

AI Agent AI 编程手写题系统设计

字节跳动 / 算法

Agentic RL 项目中，如何判断 SFT 阶段已经可以进入 RL 后训练？

这题考 Agentic RL 的训练阶段判断，重点是 SFT 是否已经让模型具备稳定轨迹、工具协议、基础成功率和可评估 reward，再决定进入 RL。

大语言模型 AI Agent 强化学习 SFT 模型训练模型评估

腾讯 / C/C++

MCP 的传输层有哪些方式，stdio 和 Streamable HTTP 分别适合什么场景？

这题考 MCP 的通信协议和传输层取舍，回答重点是 MCP 定义的是客户端、服务器和工具的上下文协议，传输上要区分本地 stdio、当前远程 Streamable HTTP，以及旧 HTTP+SSE 的历史或兼容语境。

计算机网络 AI Agent 大语言模型系统设计协议解析

代码 Agent 的 RAG 检索索引如何同时设计语义、关键词、结构化和权限索引？

这题考代码 Agent 的 RAG 索引架构，不是泛泛讲向量库。回答要覆盖语义索引、关键词索引、结构化代码索引和权限索引如何协同检索、过滤、排序和增量更新。

AI Agent RAG Embedding 向量数据库安全 AI 编程

字节跳动 / 产品

AIGC 产品中 AI 与人工应如何分工协同，既提效又控制质量风险？

这题考 AIGC 产品经理能否把“AI 替代人工”改写成更成熟的人机协同系统。高质量回答应说明哪些任务交给 AI，哪些判断保留给人，哪些场景需要人工复核，以及如何用产品机制、指标和反馈闭环持续优化。

AI 产品产品管理模型评估业务指标 AI Agent

Cider / 后端开发

AI 面试系统中，多轮对话记忆如何用 Redis 存储、过期和隔离？

这题考 AI 面试系统里的短期会话记忆设计。回答要围绕 Redis 如何保存多轮对话状态、控制 TTL、做用户/会话隔离、处理并发和失败恢复，不能泛化成抽象 Agent 记忆。

Redis 缓存 AI Agent 大语言模型状态管理稳定性

腾讯 / 后端开发

Agent 自动生成 PPT 后，如何设计展示效果校验和自动迭代闭环？

这题考文档生成 Agent 的自验证闭环。回答要聚焦 PPT 渲染后的视觉效果、内容一致性、规则校验、多模态评估、人工审核和局部迭代，而不是泛泛说让模型再检查一遍。

AI Agent 大语言模型模型评估文档生成工作流