大语言模型面试题解析第 2 页

计算机视觉模型与 ChatGPT 这类大模型的网络有什么区别？

计算机视觉模型和 ChatGPT 类大模型的差异主要在输入形态、主干结构、训练目标、上下文建模方式和推理生成范式。

计算机视觉大语言模型神经网络

美团 / 算法

多模态模型中的模态对齐方法有哪些？

多模态对齐方法包括对比学习、投影到共享空间、跨注意力融合、指令微调、图文匹配损失和细粒度 token/patch 对齐。

多模态学习大语言模型 Embedding

京东 / 算法

Qwen-VL 如何压缩图片 token，多模态大模型中图像 token 和文本 token 的处理链路有什么差异？

这道题考察多模态大模型里视觉 token 的压缩和图文 token 进入 LLM 前的差异。回答要说清图片先变成连续视觉特征再压缩投影，文本则经过离散 tokenizer 直接得到词向量，两者在融合前的链路不同。

通义千问多模态学习大语言模型 Transformer

字节跳动 / 算法

LLM 微调项目里新数据加入后离线评估掉点，应该如何排查数据、训练和评估口径？

这道题考察 LLM 微调项目的掉点诊断能力。回答重点不是背 SFT 或 LoRA 方法名，而是把新数据引入后的数据 pipeline diff、质量和格式漂移、分布混合比例、训练 schedule、评估集回归、指标切片、Recall/Precision 取舍和上线决策串成一套可执行排查流程。

大语言模型模型微调模型训练模型评估

滴滴 / 算法

大模型微调后出现不遵循指令、复读和错误答案，如何定位原因并判断 CoT 是否有效？

这题考察大模型微调后行为退化的定位方法：要把不遵循指令、复读和错误答案拆成可复现的错误类型，分别从数据、训练配置、解码参数和评估切片定位，并用对照实验判断 CoT 是否真正改善推理或事实正确率。

大语言模型模型微调模型评估大模型幻觉 Prompt 工程大模型推理

多用户并发 Agent 中，记忆模块如何做隔离并保证线程安全？

这题考察多用户并发 Agent 的状态边界设计：记忆必须按 tenant、user、session 或 conversation 隔离，外部化存储并避免进程内共享可变状态，同时用原子写入、锁、版本号和异步上下文传递保证并发安全。

AI Agent 大语言模型并发系统设计

腾讯 / 后端开发

RAG 处理 PDF 知识库时，如何设计切片、分页元数据和检索链路来减少答非所问？

这题考察 PDF 知识库 RAG 的端到端设计：要用结构化解析保留标题、页码和版面语义，按文档结构切 chunk 并带 page span metadata，通过召回、重排和上下文组装减少答非所问，并用 badcase 闭环持续修正切片与检索链路。

同公司岗位有 2 条面经记录

RAG 大语言模型 Embedding 向量数据库模型评估

企业协作场景的 AI 智能伙伴如何设计评测集和指标体系？

这题考察企业协作 AI 助手的评测体系设计：评测集要覆盖真实协作任务、权限边界和长尾场景，指标要分层衡量任务完成、事实性、安全合规、效率、体验满意度和线上反馈闭环。

AI 产品大语言模型模型评估指标体系产品管理产品指标

美团 / 后端开发

MCP 客户端调用服务端工具的完整交互流程是什么？

这题考 MCP 工具调用协议的端到端理解，回答时要按连接握手、工具发现、模型决策、客户端分发、服务端执行、结果回传和安全边界展开。

AI Agent 大语言模型系统设计服务治理

字节跳动 / 后端开发

RAG 知识库如何做定期维护，什么时候应选 RAG 而不是 SFT？

这题考 RAG 知识库生命周期治理和 RAG/SFT 方案选择，回答要把数据更新、质量评估、检索效果和模型改造边界分开。

RAG SFT 大语言模型向量数据库 Embedding 模型微调

阿里巴巴 / 后端开发

Agent 多工具调度模块如何做冲突检测与解决？

这题考 Agent 多工具并发调度的工程治理，回答要说明冲突类型、预检查、执行中仲裁、补偿和审计闭环。

Java 并发并发多线程 AI Agent 大语言模型系统设计

阿里巴巴 / 后端开发

Agent 工具调用超时后如何设计降级方案？

这题考 Agent 工具调用可靠性设计，回答要围绕超时预算、重试、降级答案、异步继续、熔断和用户可见状态展开。

同题还出现在 1 个公司岗位

AI Agent 大语言模型稳定性服务治理系统设计

LLM 服务用 vLLM 和 Streaming 输出时，如何在首 token、总延迟和吞吐之间折中？

这题考 LLM 推理服务的性能取舍，回答要把 vLLM/KV-cache、Streaming、TTFT、总延迟、吞吐和 batching 之间的矛盾讲清楚。

大语言模型 vLLM 大模型推理 TTFT 性能排查系统设计

小米 / 算法

长上下文扩展技术如 YaRN 应如何评测效果，而不只看最大上下文长度？

这题考长上下文扩展的评测方法，回答重点是不能只看最大 token 长度，还要验证检索、推理、稳定性、成本和短上下文回归。

大语言模型 Transformer 模型评估注意力机制

蚂蚁集团 / 后端开发

Agent 系统中的 skill（能力模块）应如何设计和实现？

这题考 Agent 能力模块的工程抽象，回答要说明 skill 的边界、契约、工具绑定、权限、测试、版本和失败处理。

同题还出现在 1 个公司岗位

AI Agent 大语言模型 AI 编程系统设计 Prompt 工程

京东 / 后端开发

向量数据库和传统数据库在查询方式、索引结构和事务能力上有什么区别？

这题考向量数据库和传统数据库的边界，回答要围绕查询目标、索引结构、事务一致性和工程搭配展开。

大语言模型向量数据库数据库数据库索引事务

快手 / 算法

从 MHA 到 MLA，注意力机制为什么要改进，DeepSeek MLA 解决什么问题？

这题考注意力机制从效果优先到推理效率优先的演进，重点是 KV cache 压力、MHA/MQA/GQA/MLA 的取舍和工程评估。

同题还出现在 1 个公司岗位

大语言模型注意力机制 Transformer 大模型推理

快手 / 算法

MoE 一般加在大模型哪里，从训练和推理角度有什么收益与代价？

这题考 LLM MoE 的位置和训练推理取舍，回答要讲清 FFN 专家、router、稀疏激活、负载均衡和服务成本。

同题还出现在 1 个公司岗位

大语言模型模型训练大模型推理系统设计模型评估

腾讯 / 后端开发

大模型推理中 Prefill/Decode（PD）分离部署为什么能提升处理速度？

这题考 LLM serving 的工作负载拆分，回答要讲清 prefill 和 decode 的差异、分离部署收益、KV cache 交接和适用边界。

大语言模型大模型推理性能排查系统设计

Agent 系统 Prompt 如何设计迭代，并处理用户请求不完整的意图补全？

这题考 Agent system prompt 的工程化设计，以及用户请求不完整时如何识别缺口、澄清、假设和补全。

AI Agent Prompt 工程大语言模型系统设计

Agent 场景下 Prompt 自动优化应如何工程化设计？

这题考 Agent Prompt 自动优化的工程化闭环，回答要聚焦候选生成、离线评测、安全门禁、灰度实验和回滚。

AI Agent Prompt 工程大语言模型模型评估系统设计

小米 / 算法

文生 3D 任务中，Stable Diffusion 输出如何与 NeRF / SDF 重建方法结合？

这题考文生 3D 中 2D diffusion 先验和 3D 表示优化的结合，回答要讲清 SDS、多视角一致性、NeRF/SDF 取舍和评估。

多模态学习计算机视觉大语言模型模型训练模型评估

小米 / 算法

视频生成中，时序信息对齐和空间对齐哪个更重要，如何取舍？

这题考视频生成中的一致性取舍，回答要说明时序对齐和空间对齐分别解决什么、何时更重要、如何训练和评估。

多模态学习计算机视觉模型评估大语言模型

AIGC 模型持续迭代时如何设计质量回归守护和灰度机制？

这题考 AIGC 模型持续迭代后的质量守护，回答要把离线回归、灰度分流、线上监控、回滚阈值和复盘机制连成闭环。

AI 产品产品管理模型评估产品指标指标体系大语言模型

大模型能力超出边界时，AI 产品应如何识别风险并触发兜底流程？

这题考大模型产品的能力边界管理，回答要说明如何识别超能力风险、触发兜底、降低伤害并把失败样本回流。

AI 产品产品管理大语言模型模型评估产品指标稳定性

人工介入提升 AI 准确率时，如何平衡成本和收益？

这题考 AI 产品引入人工介入时的成本收益判断，核心是按风险分层、算边际收益、控制人审成本并持续降低依赖。

AI 产品产品管理产品指标业务指标模型评估大语言模型

办公套件引入 AI 功能时如何平衡智能化和用户掌控感？

这题考办公套件 AI 的体验边界，回答要说明哪些地方让 AI 自动做，哪些地方必须保留用户确认、编辑、回退和权限控制。

AI 产品产品管理大语言模型产品指标指标体系

百度 / 产品

AI 多轮对话如何在轮数、任务完成率和用户体验之间取舍？

这题考多轮对话产品的轮数取舍，回答要围绕任务完成率、信息收集成本、用户耐心和主动澄清策略展开。

AI 产品产品管理大语言模型产品指标指标体系

AI 聊天产品如何评估好坏，哪些指标能衡量对话体验？

这题考 AI 聊天产品的指标体系，回答要把用户任务、对话体验、模型质量、系统性能、安全和 badcase 闭环串起来，而不是只说满意度或留存。

AI 产品产品管理产品指标模型评估指标体系大语言模型

办公协作 LLM 新功能如何从用户痛点切入，并验证产品价值？

这题考办公协作 LLM 新功能的产品发现和价值验证，回答要从用户痛点、工作流、原型、定性定量验证和灰度护栏展开。示例只作为通用说明。

AI 产品产品管理大语言模型产品指标业务指标