公司岗位题库

阿里巴巴 AI 应用开发面经

14 道题 21 个标签 14 条出现记录

已解析题目

AI 应用开发工程师相关题目

阿里巴巴 / AI 应用开发

大模型 SFT 从数据构建到训练通常怎么做，SFT 之后 DPO、RLHF/PPO、RL 等 Post-Training 分别解决什么问题？

这题考察候选人是否真正理解大模型对齐训练链路，而不是只会背 SFT、DPO、RLHF 这些名词。好的回答要先讲 SFT 的数据构建、清洗、格式化、训练和评估流程，再解释 SFT 主要让模型学会按指令输出，DPO/RLHF/PPO 等 Post-Training 进一步处理偏好对齐、安全边界、复杂任务奖励和人类反馈优化。面试重点是区分每个阶段解决的问题、依赖的数据形态和带来的风险。

大语言模型模型训练模型微调模型评估

阿里巴巴 / AI 应用开发

多工具 Agent 如何设计工具选择与调用调度链路，并在超时、参数错误或工具失败时做 fallback？

这题考察多工具 Agent 的工程调度能力。好的回答不能停在“让模型选择工具”，而要说明工具注册、候选召回、参数生成、权限校验、执行编排、状态记录、错误分类和 fallback 策略。面试官重点看你是否能把不稳定的 LLM 工具调用变成可观测、可恢复、可降级的业务链路。

AI Agent 工作流稳定性系统设计 Prompt 工程

阿里巴巴 / AI 应用开发

Agent 评估体系应该覆盖哪些维度，如何分别衡量规划能力、任务成功率和幻觉率？

这题考察 Agent 评估体系设计。好的回答要把评估拆成任务成功、规划质量、工具调用质量、事实一致性、幻觉率、安全合规、成本延迟和用户体验等维度。规划能力和幻觉率不能都靠主观打分，应该结合离线任务集、步骤级 trace、工具结果、证据对齐、人工标注和线上指标。

AI Agent 模型评估可观测性产品指标稳定性

阿里巴巴 / AI 应用开发

多轮对话中 Attention 为什么可能导致历史信息衰减？

多轮对话中历史信息衰减，不是 Attention 单一机制的错误，而是注意力权重竞争、上下文窗口容量、位置距离、长文本噪声、摘要压缩、KV cache 截断等因素叠加后的结果。核心现象是：随着新轮次不断加入，早期信息虽然可能仍在上下文中，但在模型计算当前 token 时获得的有效影响力下降，甚至被截断、压缩或检索失败，从而表现为遗忘、答非所问或前后不一致。

同题还出现在 1 个公司岗位

大语言模型

阿里巴巴 / AI 应用开发

Agent 的计划模式是什么？如何把用户目标拆成步骤、工具调用和可恢复执行状态？

这题考 Agent 运行机制：计划模式不是让模型多想一会儿，而是把开放目标转成可执行、可观测、可重试、可恢复的任务状态机或工作流。

同题还出现在 1 个公司岗位

AI Agent 大语言模型工作流系统设计稳定性

阿里巴巴 / AI 应用开发

大模型 Function Call 为什么会产生工具调用幻觉，工程上如何用 schema、权限、校验和反馈闭环降低误调用？

这题考 Function Call 的工程治理能力：工具调用幻觉不只靠 prompt 解决，还要靠工具契约、调用门禁、参数校验、执行反馈、回退策略和评测闭环共同降低。

同题还出现在 3 个公司岗位

AI Agent 大模型幻觉大语言模型 Prompt 工程模型评估

阿里巴巴 / AI 应用开发

Agent 中上下文工程如何设计，如何组织 System Prompt、工具结果和记忆？

这题考 Agent 上下文工程的结构化设计，回答重点是如何组织 System Prompt、用户任务、工具结果、记忆、约束和截断策略，让模型拿到必要信息而不过载。

同题还出现在 2 个公司岗位

AI Agent 大语言模型 Prompt 工程系统设计

阿里巴巴 / AI 应用开发

Agent 记忆出现过期或冲突事实时，如何更新、覆盖和回溯？

这题考 Agent 记忆过期和冲突事实的治理，回答要覆盖事实版本、来源置信度、用户确认、覆盖规则、tombstone、审计回溯和 Prompt 侧只使用当前有效记忆。

同题还出现在 1 个公司岗位

AI Agent 大语言模型内存管理稳定性隐私保护系统设计

阿里巴巴 / AI 应用开发

微调 Qwen 这类大模型时，learning rate scheduler 应如何设计？如何确定 step 口径、warmup、cosine/linear decay、最小学习率和峰值学习率？

这题考察的不是背诵某个 scheduler，而是能否把 Qwen 微调中的学习率设计拆成训练稳定性、收敛效率、泛化效果和版本选择四件事。好的回答要明确 step 口径、warmup 比例、衰减曲线、最小学习率和峰值学习率。

大语言模型模型微调模型训练通义千问

阿里巴巴 / AI 应用开发

主流 Agent 框架如何选型，如何按 RAG 检索、有状态工作流、多 Agent 协作、工具/记忆/检索能力和自主性与可控性边界做取舍？

这题考 Agent 框架选型边界，而不是背框架名。好的回答应按业务需要拆分：RAG 检索优先看数据索引和检索评估，有状态工作流优先看可控状态机，多 Agent 协作优先看角色协议和收敛性，工具、记忆、检索抽象要看边界清晰度，最终在 Agent 自主性和工程可控性之间取舍。

AI Agent RAG 工作流系统设计大语言模型

阿里巴巴 / AI 应用开发

Agent 中多个工具语义相近且副作用不同，如何设计工具命名、description 和 JSON Schema，避免误选、漏参和高风险误触发？

这题考 Function Calling/Agent 工具契约设计。回答要讲工具命名做候选粗筛，description 划清使用/禁用边界，JSON Schema 约束参数和缺失处理，再配合权限、示例和评测降低误调用。

AI Agent Prompt 工程规则机制稳定性

阿里巴巴 / AI 应用开发

Agent 推理链路中多个工具串行调用导致响应变慢时，如何优化延迟并保证结果可靠？

这题考 Agent 多工具链路性能优化。回答要覆盖依赖分析、并行化、缓存、批处理、模型调用压缩、流式反馈、降级和可靠性校验。

AI Agent 性能排查工作流稳定性

阿里巴巴 / AI 应用开发

高并发场景下如何设计 Agent 服务的弹性伸缩、核心监控指标和告警策略？

这题考生产级 Agent 服务治理。回答要把弹性伸缩、监控指标、告警策略和容量保护结合起来，而不是只讲加机器。

AI Agent 可扩展性可观测性服务治理

阿里巴巴 / AI 应用开发

电商客服 Agent 覆盖商品咨询、售后咨询和投诉安抚时，如何设计离线评测集、线上指标、用户满意度和提效口径来判断效果好坏？

这题考电商客服 Agent 的评测体系。回答要覆盖离线样本、线上指标、满意度、提效口径、风险指标和数据闭环。

AI Agent 模型评估电商产品指标