知识点标签

大语言模型面试题解析第 2 页

大语言模型相关面试题解析,按真实面经题目沉淀核心机制、易错点和面试官追问。

382 道题 12 个岗位 24 个公司

大语言模型相关面试题第 2 页

LLM 微调项目里新数据加入后离线评估掉点,应该如何排查数据、训练和评估口径?

这道题考察 LLM 微调项目的掉点诊断能力。回答重点不是背 SFT 或 LoRA 方法名,而是把新数据引入后的数据 pipeline diff、质量和格式漂移、分布混合比例、训练 schedule、评估集回归、指标切片、Recall/Precision 取舍和上线决策串成一套可执行排查流程。

大模型微调后出现不遵循指令、复读和错误答案,如何定位原因并判断 CoT 是否有效?

这题考察大模型微调后行为退化的定位方法:要把不遵循指令、复读和错误答案拆成可复现的错误类型,分别从数据、训练配置、解码参数和评估切片定位,并用对照实验判断 CoT 是否真正改善推理或事实正确率。

RAG 处理 PDF 知识库时,如何设计切片、分页元数据和检索链路来减少答非所问?

这题考察 PDF 知识库 RAG 的端到端设计:要用结构化解析保留标题、页码和版面语义,按文档结构切 chunk 并带 page span metadata,通过召回、重排和上下文组装减少答非所问,并用 badcase 闭环持续修正切片与检索链路。

同公司岗位有 2 条面经记录