标签题目
工作流相关面试题
Agent 自动生成 PPT 后,如何设计展示效果校验和自动迭代闭环?
这题考文档生成 Agent 的自验证闭环。回答要聚焦 PPT 渲染后的视觉效果、内容一致性、规则校验、多模态评估、人工审核和局部迭代,而不是泛泛说让模型再检查一遍。
Agent 的 think-execute 循环如何控制规划路径,避免偏离业务预期或无限循环?
这题考 Agent 循环规划的可控性,重点是说明为什么需要 think-execute,以及如何用目标约束、状态机、校验器、评估器、停止条件和测试回放确保路径不跑偏。
同题还出现在 1 个公司岗位
把 Skill 放进 Agent 沙箱后,主 Agent、Skill 运行时和文件系统之间应如何通信,并怎样做最小暴露和渐进式披露?
这题考 Agent 工程里的沙箱通信边界:不能让 Skill 直接拿到宿主进程和完整文件系统,而要用受控协议、能力句柄、文件视图和审计链路把调用、数据和权限拆开。
AIGC 平台如何赋能内容创作者生态,产品经理应如何设计能力开放、质量控制、成本和激励闭环?
这题考 AIGC 平台如何真正进入创作者工作流:不是只提供生成按钮,而是围绕创作效率、质量治理、成本控制、分发反馈和激励形成闭环。
AI 语音合成平台应如何规划,产品经理如何设计音色、情感、质量评估、版权合规和创作者工作流?
这题考语音合成平台的产品规划能力:要同时讲清用户场景、音色资产、可控参数、质量评估、版权合规、成本延迟和工作流闭环。
AI Coding Agent 从用户输入到完成任务的完整链路是什么,如何经过上下文构建、计划、工具调用、代码修改和验证?
这题考的是 AI Coding Agent 的端到端运行时理解:候选人要能把自然语言需求如何变成可验证代码改动讲清楚,包括上下文、计划、工具、修改、测试和回滚闭环。
AI Coding Agent 如何从人工逐步确认切换到自主执行,权限、审批策略、风险护栏和回滚机制应如何设计?
这题考 Agent 自主化的安全工程:不是简单关闭确认按钮,而是用风险分级、最小权限、策略审批、沙箱执行、自动验证和回滚审计来决定哪些动作可以自动做。
同题还出现在 1 个公司岗位
企业协作产品中哪些场景适合用 LLM 提效,如何评估会议、文档、知识检索、项目协同和自动化工作流的价值?
这题考企业协作 AI 场景判断:要从高频知识工作出发,说明会议、文档、知识检索、项目协同和工作流自动化的价值、指标、边界与落地优先级。
Agent 的计划模式是什么?如何把用户目标拆成步骤、工具调用和可恢复执行状态?
这题考 Agent 运行机制:计划模式不是让模型多想一会儿,而是把开放目标转成可执行、可观测、可重试、可恢复的任务状态机或工作流。
同题还出现在 1 个公司岗位
Agent 调用服务端 API 工具的完整流程是什么?如何完成参数生成、鉴权、执行、错误处理和结果回填?
这题考 Agent 工具调用的工程链路:模型通常不直接访问业务 API,而是由宿主系统基于工具 schema、权限、参数校验、执行器、错误处理和结果回填来完成闭环。
同题还出现在 2 个公司岗位
Agent 的 thinking 阶段如何判断该调用工具还是直接回复,如何设计决策信号和安全约束?
这题考的是 Agent 运行时决策设计:候选人要能说明什么时候直接回答、什么时候调用工具、什么时候追问,以及如何用置信度、权限、安全和回归评估约束决策。
同题还出现在 1 个公司岗位
MCP、Function Call 和 A2A 在 Agent 系统中分别解决什么边界,如何协同?
这题考 Agent 系统的协议和责任边界。Function Call 解决模型到宿主工具调用意图的结构化表达,MCP 解决宿主和外部工具/资源服务之间的标准化连接,A2A 解决 Agent 与 Agent 之间的任务委托和协作。三者层级不同,不能混成同一个概念。
从用户行为日志抽取 Agent 训练对话时,如何做归一化和事件抽象?
这题考从用户行为日志构造 Agent 训练对话的能力。关键不是把日志拼成聊天记录,而是做会话切分、事件抽象、状态归一、隐私脱敏、目标推断、轨迹标注和质量过滤,让低层行为事件变成可训练、可审计、可评估的 Agent 对话样本。
Spring AI Alibaba Graph 的底层原理是什么,图式编排如何表达 Agent 节点、状态流转、条件分支和工具调用?
这题考察对图式 Agent 编排的理解,重点是状态、节点、边、条件路由、工具调用、失败处理和可测试性,而不是背某个版本的 API。
在现有 LangGraph Agent 上新增功能时,如何设计节点、边、state schema、工具注册和回归测试?
这题考的是把 Agent 功能扩展做成可维护的状态机工程,而不是在一个大 prompt 或一个大节点里继续堆逻辑。高质量回答应说明如何先界定新功能的触发条件和输出契约,再决定是否新增节点、边、state 字段和工具,并用可回放测试证明新增路径没有破坏原有 Agent 行为。
Agent 项目中的 harness engineering 是什么,如何支撑工具模拟、回放、评测、回归和线上前验证?
这题考的是 Agent 工程里的验证基础设施意识。harness engineering 不是写几个单测,而是为不稳定的模型输出、外部工具、副作用和多轮状态机建立可控运行环境,让开发者能模拟工具、回放真实轨迹、做离线评测、跑回归并在上线前发现风险。
当 Agent 有 100 个 Tool 时,如何做工具分组、动态子集检索、schema 治理、监控和 meta-tool/Skill 收口?
这题考的是大规模工具接入后的 Agent 治理能力。100 个 Tool 不能简单全部塞进模型上下文,否则会带来选择混乱、token 成本、schema 冲突、误调用和监控不可解释。好的回答应从工具分类、检索式候选集、契约治理、调用观测和能力收口几层展开。
同题还出现在 1 个公司岗位
内容安全类 Agent 需求如何从“万能问答”拆成可评测的原子能力、输入输出契约和停止条件?
这题考的是把模糊的内容安全 Agent 需求工程化。不能把它做成什么都能问、什么都回答的聊天助手,而要拆成可独立评测的能力单元,例如分类、证据抽取、规则匹配、风险解释、处置建议和人工复核触发,并为每个能力定义输入、输出、置信度和停止条件。
多 Agent 协作时,Agent 之间如何传递状态、消息和工具结果,并避免并发读写冲突?
这道题考察多 Agent 系统的状态建模、通信协议、工具结果传递和并发一致性设计。好答案不能停留在 Agent 之间互相发消息,而要区分临时对话消息、可持久化任务状态、不可变工具产物和需要事务保护的共享资源。回答边界应覆盖消息队列或事件总线、共享状态存储、编排器协调、版本号或乐观锁、文件和数据库写入隔离、幂等重试、冲突检测,以及如何用日志和压测证明没有丢消息、重复执行和覆盖写。
Agent 的 self-refine 自我修正如何处理 API 返回字段缺失、冗余或结构不符合预期?
这道题考察 Agent 自我修正是否能和工程化 API 契约治理结合起来。好答案不能把 self-refine 说成让模型再想一遍,而要说明先用确定性 schema 校验发现字段缺失、冗余字段、类型错误和结构不匹配,再根据错误类型决定丢弃、补默认值、结构化转换、重调 API、降级或交给模型生成修复计划。边界是不能让模型凭空编造缺失事实;所有修复都要可追溯、有限重试、重新校验,并用错误率、修复成功率和幻觉字段率验证效果。
业务 Agent 的评测流程应该怎么设计?如果工具被多调用但不影响最终结果,应该用哪些指标描述冗余工具调用?
这题考业务 Agent 评测,不是简单统计工具调用次数。关键是判断某次工具调用是否带来新增信息、状态推进或风险降低,再用 trace、反事实回放和人工标注校准冗余工具调用指标。
MCP 接入多个测评工具时,如果不同工具对同一问题返回格式不统一,应该如何设计统一输出协议或适配层?
这题考 MCP 多工具输出治理。多个 MCP 工具返回格式不统一时,应在工具和 Agent Runtime 之间加适配层,统一 envelope、内容块、结构化数据、错误协议、元数据、版本和审计,而不是让模型解析各类私有格式。
Agent 工具调用限制中间件应如何设计,才能约束候选工具范围、调用预算、权限校验和循环停止条件?
这题考 Agent 工具调用限制中间件。重点是 runtime/executor 如何通过 allowlist、预算、权限、参数校验、循环检测和停止条件约束工具调用,而不是只在 prompt 里提醒模型少调用。
如果要设计蚂蚁金服内部自动客服系统,如何定义用户场景、能力边界、流程和评估指标?
这题考 AI 产品经理能否把内部自动客服设计成企业级系统。要先明确内部员工、运营、技术支持等场景,再设计知识、权限、工单、模型回答、人工升级和质检闭环,并用解决率、准确率、转人工率、时效、满意度和风险指标验收。
面向 3C 数码产品推荐的 AI workflow 应如何设计,才能从用户输入生成可用推荐结果?
这题考 AI 产品经理能否把 3C 推荐从聊天式建议设计成可控 workflow:采集预算、场景、偏好和约束,检索结构化商品库与实时价格库存,用规则/模型排序,再由 LLM 生成可解释对比,并用转化、满意度、退货、缺货和事实错误闭环。
Agent 开发框架通常由哪些核心组件组成,Planner、Memory、Tools、Executor 和 Evaluator 分别负责什么?
这题考察候选人是否能把 Agent 从“调用大模型的应用”拆成可工程化的运行系统。好的回答应说明 Planner 负责把目标拆成步骤,Memory 负责保留和检索上下文,Tools 负责连接外部能力,Executor 负责按计划执行并处理状态,Evaluator 负责判断结果质量和是否需要重试、修正或终止。重点不是背组件名,而是讲清楚组件之间的数据流、控制流、失败兜底和可观测性。
多工具 Agent 如何设计工具选择与调用调度链路,并在超时、参数错误或工具失败时做 fallback?
这题考察多工具 Agent 的工程调度能力。好的回答不能停在“让模型选择工具”,而要说明工具注册、候选召回、参数生成、权限校验、执行编排、状态记录、错误分类和 fallback 策略。面试官重点看你是否能把不稳定的 LLM 工具调用变成可观测、可恢复、可降级的业务链路。
可中断的 Agent 系统如何设计,怎样保存执行状态、恢复任务并处理用户打断?
这题从后端视角考察可中断 Agent 的状态机、持久化和恢复设计。好的回答要说明 Agent 执行不是一次同步请求,而是可暂停、可恢复、可取消、可重试的长任务。核心包括任务状态模型、步骤 checkpoint、幂等工具调用、用户打断语义、恢复策略、并发控制和可观测性。
钉钉 AI Agent 如何与 RPA、低代码等效率工具联动,为企业提供自动化工作流?
这题考企业 AI Agent 如何从聊天入口落到可执行工作流。高质量回答要讲清 Agent、低代码和 RPA 的分工,说明如何接入企业系统、沉淀流程资产,并用权限、审计、确认、异常兜底和 ROI 指标保证真实落地。
AI 应用开发中的原子状态机是什么?如何用有限状态、原子转移和异常状态约束执行流程,避免状态错乱、重复执行和异常无法收敛?
这道题考察 AI 应用或 Agent runtime 的流程约束能力。原子状态机不是让大模型自由决定下一步,而是把执行拆成有限状态、受控事件和原子转移:每次转移都校验前置状态、写入持久状态、绑定幂等键或执行记录,再推进任务或恢复异常。它解决的是状态错乱、重复执行、异常恢复、并发竞争和流程无法收敛问题。好的回答要能讲出状态集合、转移表、异常状态、幂等、锁/CAS、step budget、可观测性和验证指标。
AI 产品和普通互联网产品在需求验证、技术协作、评估指标和上线迭代上有什么区别?
这道题考察 AI 产品经理是否能把 AI 产品和普通互联网产品的差异讲到工作流层面。好的回答不是说 AI 产品更智能,而是从需求验证、技术协作、评估指标和上线迭代四个维度比较:普通互联网产品主要验证用户需求、流程效率和商业转化;AI 产品还必须验证模型能力边界、数据可得性、成本延迟、质量稳定性、安全合规和 badcase 闭环。AI PM 的核心能力是把不确定的模型能力转化为可验收、可监控、可回滚的产品体验。
视频剪辑智能体的全链路架构如何设计,核心模块的职责和交互逻辑是什么?
这道题考察 AI 应用开发候选人能否把“视频剪辑智能体”设计成可落地的工程系统:从用户意图理解、素材解析、剪辑计划、工具执行、预览修正到渲染导出,拆清楚核心模块、数据结构和交互闭环。
用 LangChain 编排 AI 工作流时,如何和原生调用、自研引擎做选型,并分析各自优缺点和瓶颈?
这题考察的是 AI 工作流编排的技术选型,而不是问 LangChain 好不好。高质量回答要先拆清楚业务复杂度:只是单轮模型调用、少量 prompt 链、RAG 检索增强、工具调用、长流程状态机、多 Agent 协作,还是需要可视化编排、回放、权限、灰度和审计。原生调用的优势是简单、可控、性能和依赖风险低,适合链路短、业务稳定、团队希望自己掌握协议的场景;LangChain 的优势是生态组件多、原型快、抽象现成,适合探索期和标准 RAG/Tool/Agent 流程,但瓶颈是抽象层厚、版本变化、调试复杂、性能和可观测性需要补强;自研引擎适合业务流程复杂、稳定性和治理要求高、需要平台化复用的场景,但成本高、周期长,容易重复造轮子。最终选型不是三选一的宗教问题,而是按阶段演进:原型期可以用框架提速,核心生产链路要收敛成自己的稳定接口和可观测执行模型。
AI/自动化 Agent 平台如何结合 Jenkins 调度执行、Linux 日志采集解析和配置规则治理,实现状态回传、参数校验,并从拉日志演进到自动排障?
这题考 AI/自动化 Agent 平台的工程落地能力,重点是 Jenkins 调度、Linux 多机日志采集、配置规则治理、状态回传、参数校验,以及从拉日志工具演进到自动诊断和受控排障的路线。
主流 Agent 框架如何选型,如何按 RAG 检索、有状态工作流、多 Agent 协作、工具/记忆/检索能力和自主性与可控性边界做取舍?
这题考 Agent 框架选型边界,而不是背框架名。好的回答应按业务需要拆分:RAG 检索优先看数据索引和检索评估,有状态工作流优先看可控状态机,多 Agent 协作优先看角色协议和收敛性,工具、记忆、检索抽象要看边界清晰度,最终在 Agent 自主性和工程可控性之间取舍。
构建复杂 LLM Agent 时最主要的挑战是什么,如何处理可靠性、规划、工具调用和可观测性?
这题考复杂 Agent 的生产可靠性理解。高质量回答要说明最大的挑战不是“会不会用框架”,而是 LLM 非确定性、规划漂移、工具误调用、上下文污染、循环失控、成本延迟和问题定位困难,并给出工程化治理方案。
从 0 到 1 规划客服 Agent MVP 时,如何拆分对话机器人、人工协同、工单闭环和质检模块,并确定边界与优先级?
这题考从 0 到 1 规划客服 Agent MVP 的产品拆解能力。回答要把对话机器人、人工协同、工单闭环和质检模块拆清楚,并说明边界、依赖关系和优先级。
使用 Coze 这类低代码/Agent 平台在 2-3 周内验证客服 Agent MVP,如何定义范围、验收口径和 Go/No-Go 门槛?
这题考低代码或 Agent 平台快速验证的产品实验能力。回答要说明 2-3 周内如何收敛范围、定义验收口径,并用 Go/No-Go 门槛决定继续投入、调整方向或停止。
AI 从客服对话自动生成工单时,如何设计字段标准、触发条件和审核机制,避免自动化制造噪音?
这题考 AI 自动生成工单的产品治理能力。核心不是把每段客服对话都转成工单,而是定义字段标准、触发条件、审核机制和噪音控制,保证自动化真正减少人工负担。
客服场景中,Expert Agent 应如何按业务维度拆分,并通过 Prompt 输入、输出约束和预设 Workflow 降低幻觉与泛化损失?
这题考客服 Agent 架构拆分能力。回答要讲清 Expert Agent 的划分维度、Prompt 输入、输出约束、预设 Workflow,以及如何用证据和边界降低幻觉与泛化损失。
智能运维助手中,Planner/Executor/Supervisor 多 Agent 模式相比单 Agent 有什么优势、边界和适用场景?
这题考智能运维助手的多 Agent 分工。回答要比较 Planner、Executor、Supervisor 与单 Agent 的差异,并说明适用场景、边界和工程代价。
多 Agent 运行时如何基于任务复杂度、风险等级和运行时信号,在单 Agent、规划-执行、并行候选和监督校验之间动态切换,并保证状态迁移和幂等一致?
这题考多 Agent 策略路由与运行时切换。回答要说明哪些策略可选、切换信号是什么、如何保持状态一致,以及如何评估策略选择是否有效。
Agent 推理链路中多个工具串行调用导致响应变慢时,如何优化延迟并保证结果可靠?
这题考 Agent 多工具链路性能优化。回答要覆盖依赖分析、并行化、缓存、批处理、模型调用压缩、流式反馈、降级和可靠性校验。
Agent 按需加载工具说明、规则和上下文的渐进式披露架构下,是否还需要 RAG?二者如何分工与协同?
这题考 Agent 上下文架构和知识检索的边界。回答要说明渐进式披露管工具说明、规则和上下文的按需加载,RAG 管外部事实证据检索,并给出二者协同的执行链路。
多跳推理或复杂逻辑查询需要多次 RAG 时,如何优化检索编排、上下文预算、证据聚合,并处理权限隔离与知识时效性?
这题考复杂 RAG 架构。回答要讲多跳检索编排、子问题拆解、上下文预算、证据聚合、权限过滤、知识时效和可审计输出。
航旅排障智能体如何把航班、订单、改签和退款等诊断步骤编排成可回放工作流,并对高风险写操作做权限、确认和审计控制?
这题考场景化 Agent 系统设计。回答要讲航旅排障链路、Planner/Executor 通信、结果回传、权限确认、审计和误操作防护。