百度后端开发工程师面经题库

已解析题目

后端开发工程师相关题目

百度 / 后端开发

计算机视觉模型与 ChatGPT 这类大模型的网络有什么区别？

计算机视觉模型和 ChatGPT 类大模型的差异主要在输入形态、主干结构、训练目标、上下文建模方式和推理生成范式。

计算机视觉大语言模型神经网络

百度 / 后端开发

多用户并发 Agent 中，记忆模块如何做隔离并保证线程安全？

这题考察多用户并发 Agent 的状态边界设计：记忆必须按 tenant、user、session 或 conversation 隔离，外部化存储并避免进程内共享可变状态，同时用原子写入、锁、版本号和异步上下文传递保证并发安全。

AI Agent 大语言模型并发系统设计

百度 / 后端开发

LLM 服务用 vLLM 和 Streaming 输出时，如何在首 token、总延迟和吞吐之间折中？

这题考 LLM 推理服务的性能取舍，回答要把 vLLM/KV-cache、Streaming、TTFT、总延迟、吞吐和 batching 之间的矛盾讲清楚。

大语言模型 vLLM 大模型推理 TTFT 性能排查系统设计

百度 / 后端开发

Agent 系统 Prompt 如何设计迭代，并处理用户请求不完整的意图补全？

这题考 Agent system prompt 的工程化设计，以及用户请求不完整时如何识别缺口、澄清、假设和补全。

AI Agent Prompt 工程大语言模型系统设计

百度 / 后端开发

Agent 场景下 Prompt 自动优化应如何工程化设计？

这题考 Agent Prompt 自动优化的工程化闭环，回答要聚焦候选生成、离线评测、安全门禁、灰度实验和回滚。

AI Agent Prompt 工程大语言模型模型评估系统设计

百度 / 后端开发

大模型 SFT 微调效果不好时，可以从哪些数据、模板、训练配置、参数高效微调和评估闭环维度优化？

这题考的是 SFT 效果诊断和优化方法论：要把问题拆成数据质量、任务分布、指令模板、训练超参、PEFT 配置、基座能力和评估闭环，而不是只说多清洗数据。

模型微调 SFT 模型训练模型评估大语言模型

百度 / 后端开发

Agent 的计划模式是什么？如何把用户目标拆成步骤、工具调用和可恢复执行状态？

这题考 Agent 运行机制：计划模式不是让模型多想一会儿，而是把开放目标转成可执行、可观测、可重试、可恢复的任务状态机或工作流。

同题还出现在 1 个公司岗位

AI Agent 大语言模型工作流系统设计稳定性

百度 / 后端开发

向量检索中常见相似度计算指标有哪些？余弦相似度、点积和欧氏距离如何选择？

这题考向量检索基础和工程选择：候选人要能解释 cosine、dot product、L2 的含义、适用前提、归一化关系，以及为什么指标要和 embedding 训练目标及索引配置一致。

Embedding 向量数据库 RAG 大语言模型

百度 / 后端开发

Agent 调用服务端 API 工具的完整流程是什么？如何完成参数生成、鉴权、执行、错误处理和结果回填？

这题考 Agent 工具调用的工程链路：模型通常不直接访问业务 API，而是由宿主系统基于工具 schema、权限、参数校验、执行器、错误处理和结果回填来完成闭环。

同题还出现在 2 个公司岗位

AI Agent 大语言模型工作流系统设计安全稳定性

百度 / 后端开发

Agent 系统中的 skill（能力模块）应如何设计和实现？

这题考 Agent 能力模块的工程抽象，回答要说明 skill 的边界、契约、工具绑定、权限、测试、版本和失败处理。

同题还出现在 1 个公司岗位

AI Agent 大语言模型 AI 编程系统设计 Prompt 工程

百度 / 后端开发

RAG 项目里的召回排序链路如何设计，Embedding 召回、粗排、重排和答案生成各自承担什么职责？

这题考 RAG 的工程链路设计：不是只接一个向量库，而是要把查询理解、混合召回、粗排、重排、上下文拼装、生成约束和评测闭环讲成一条可上线的检索增强系统。

同题还出现在 3 个公司岗位

RAG Embedding AI 搜索大语言模型模型评估

百度 / 后端开发

Agent 微调中如何选择和清洗训练样本，哪些样本质量问题最容易改变模型行为？

这题考 Agent 微调数据的样本选择与清洗能力。与普通 SFT 不同，Agent 样本不仅有问答文本，还包含意图、计划、工具选择、参数、工具结果、状态变化、安全边界和最终回复。回答要说明哪些样本值得训练、哪些噪声会改变模型行为，以及如何用指标验证。

同题还出现在 1 个公司岗位

AI Agent 模型微调 SFT 模型训练隐私保护质量工程

百度 / 后端开发

从用户行为日志抽取 Agent 训练对话时，如何做归一化和事件抽象？

这题考从用户行为日志构造 Agent 训练对话的能力。关键不是把日志拼成聊天记录，而是做会话切分、事件抽象、状态归一、隐私脱敏、目标推断、轨迹标注和质量过滤，让低层行为事件变成可训练、可审计、可评估的 Agent 对话样本。

AI Agent 模型训练隐私保护数据分析工作流质量工程

百度 / 后端开发

DPO 是什么，和 SFT 在训练目标、数据形式和适用阶段上有什么区别？

SFT 和 DPO 都用于大模型训练后的对齐阶段，但目标不同。SFT 是让模型学习应该怎么回答的示范答案，DPO 是让模型学习同一问题下更偏好哪一个回答。SFT 更偏能力和格式学习，DPO 更偏偏好对齐、风格控制和质量排序。

同题还出现在 1 个公司岗位

大语言模型模型微调 DPO SFT AI 产品

百度 后端开发面经

后端开发工程师相关题目

百度后端开发面经