已解析题目
后端开发工程师相关题目
计算机视觉模型与 ChatGPT 这类大模型的网络有什么区别?
计算机视觉模型和 ChatGPT 类大模型的差异主要在输入形态、主干结构、训练目标、上下文建模方式和推理生成范式。
多用户并发 Agent 中,记忆模块如何做隔离并保证线程安全?
这题考察多用户并发 Agent 的状态边界设计:记忆必须按 tenant、user、session 或 conversation 隔离,外部化存储并避免进程内共享可变状态,同时用原子写入、锁、版本号和异步上下文传递保证并发安全。
LLM 服务用 vLLM 和 Streaming 输出时,如何在首 token、总延迟和吞吐之间折中?
这题考 LLM 推理服务的性能取舍,回答要把 vLLM/KV-cache、Streaming、TTFT、总延迟、吞吐和 batching 之间的矛盾讲清楚。
Agent 系统 Prompt 如何设计迭代,并处理用户请求不完整的意图补全?
这题考 Agent system prompt 的工程化设计,以及用户请求不完整时如何识别缺口、澄清、假设和补全。
Agent 场景下 Prompt 自动优化应如何工程化设计?
这题考 Agent Prompt 自动优化的工程化闭环,回答要聚焦候选生成、离线评测、安全门禁、灰度实验和回滚。
大模型 SFT 微调效果不好时,可以从哪些数据、模板、训练配置、参数高效微调和评估闭环维度优化?
这题考的是 SFT 效果诊断和优化方法论:要把问题拆成数据质量、任务分布、指令模板、训练超参、PEFT 配置、基座能力和评估闭环,而不是只说多清洗数据。
Agent 的计划模式是什么?如何把用户目标拆成步骤、工具调用和可恢复执行状态?
这题考 Agent 运行机制:计划模式不是让模型多想一会儿,而是把开放目标转成可执行、可观测、可重试、可恢复的任务状态机或工作流。
同题还出现在 1 个公司岗位
向量检索中常见相似度计算指标有哪些?余弦相似度、点积和欧氏距离如何选择?
这题考向量检索基础和工程选择:候选人要能解释 cosine、dot product、L2 的含义、适用前提、归一化关系,以及为什么指标要和 embedding 训练目标及索引配置一致。
Agent 调用服务端 API 工具的完整流程是什么?如何完成参数生成、鉴权、执行、错误处理和结果回填?
这题考 Agent 工具调用的工程链路:模型通常不直接访问业务 API,而是由宿主系统基于工具 schema、权限、参数校验、执行器、错误处理和结果回填来完成闭环。
同题还出现在 2 个公司岗位
Agent 系统中的 skill(能力模块)应如何设计和实现?
这题考 Agent 能力模块的工程抽象,回答要说明 skill 的边界、契约、工具绑定、权限、测试、版本和失败处理。
同题还出现在 1 个公司岗位
RAG 项目里的召回排序链路如何设计,Embedding 召回、粗排、重排和答案生成各自承担什么职责?
这题考 RAG 的工程链路设计:不是只接一个向量库,而是要把查询理解、混合召回、粗排、重排、上下文拼装、生成约束和评测闭环讲成一条可上线的检索增强系统。
同题还出现在 3 个公司岗位
Agent 微调中如何选择和清洗训练样本,哪些样本质量问题最容易改变模型行为?
这题考 Agent 微调数据的样本选择与清洗能力。与普通 SFT 不同,Agent 样本不仅有问答文本,还包含意图、计划、工具选择、参数、工具结果、状态变化、安全边界和最终回复。回答要说明哪些样本值得训练、哪些噪声会改变模型行为,以及如何用指标验证。
同题还出现在 1 个公司岗位
从用户行为日志抽取 Agent 训练对话时,如何做归一化和事件抽象?
这题考从用户行为日志构造 Agent 训练对话的能力。关键不是把日志拼成聊天记录,而是做会话切分、事件抽象、状态归一、隐私脱敏、目标推断、轨迹标注和质量过滤,让低层行为事件变成可训练、可审计、可评估的 Agent 对话样本。
DPO 是什么,和 SFT 在训练目标、数据形式和适用阶段上有什么区别?
SFT 和 DPO 都用于大模型训练后的对齐阶段,但目标不同。SFT 是让模型学习应该怎么回答的示范答案,DPO 是让模型学习同一问题下更偏好哪一个回答。SFT 更偏能力和格式学习,DPO 更偏偏好对齐、风格控制和质量排序。
同题还出现在 1 个公司岗位