公司岗位题库

百度算法面经第 2 页

55 道题 37 个标签 55 条出现记录

分页题目

算法工程师相关题目第 2 页

百度 / 算法

机器学习中的偏差和方差分别指什么，如何判断并降低它们？

这题考偏差-方差分解和模型泛化诊断，重点是能用欠拟合、过拟合、训练/验证误差曲线解释问题，并给出对应降低方法。

算法统计学模型评估模型训练

百度 / 算法

LSTM 的输入门、遗忘门和输出门是如何工作的？

LSTM 用遗忘门、输入门和输出门控制细胞状态的保留、写入和暴露，从而缓解普通 RNN 的长期依赖和梯度衰减问题。

同题还出现在 1 个公司岗位

神经网络推荐系统

百度 / 算法

CLIP 的图文对比学习流程如何用伪代码表示？

这题考 CLIP 图文对比学习的训练流程，回答重点是 batch 内配对、图像/文本归一化向量、相似度矩阵、温度系数和对称交叉熵损失。

同题还出现在 1 个公司岗位

多模态学习 Embedding 计算机视觉手写题模型训练

百度 / 算法

推荐系统的离线特征与样本流水线如何设计？线上服务消费离线结果时，如何在固定周期刷新、近实时更新和特征滞后补偿之间取舍？

这道题考察推荐系统离线特征、样本流水线与线上服务消费的工程设计。好的回答要讲清固定周期刷新、近实时更新和特征滞后补偿的取舍。

推荐系统特征工程模型评估

百度 / 算法

DPO 为什么可能导致回答过长，SimPO 如何缓解长度偏置？

这题考察对偏好优化目标的细节理解。核心不是简单说“DPO 会变啰嗦，SimPO 会变短”，而是要解释 DPO 的隐式 reward 如何由整段回答的 logprob 差构成，为什么长度、参考模型、偏好数据和评测方式会共同放大长回答倾向，以及 SimPO 如何用平均 log probability 和目标间隔缓解这种偏置。

大语言模型 DPO RLHF 强化学习模型训练模型评估

百度 / 算法

多模态 CoT 场景下，如何构造用于 DPO 的偏好数据，并保证推理过程与图文证据一致？

这题考多模态偏好数据构造。回答要讲正负样本、图文证据一致性、推理链标注、偏好质量、DPO 训练和评估闭环。

多模态学习 DPO 模型训练模型评估

百度 / 算法

统一生成理解多模态模型做下游微调时，如何为分类、VQA、OCR、定位和生成任务设计统一样本格式，同时保留各任务的专属监督，并控制混训比例、数据质量和能力退化风险？

这题考统一生成理解模型的下游微调数据设计。回答要讲任务格式统一、数据混合、采样比例、模态对齐、质量控制和评测。

多模态学习模型微调模型训练计算机视觉