分页题目
算法工程师相关题目第 2 页
机器学习中的偏差和方差分别指什么,如何判断并降低它们?
这题考偏差-方差分解和模型泛化诊断,重点是能用欠拟合、过拟合、训练/验证误差曲线解释问题,并给出对应降低方法。
LSTM 的输入门、遗忘门和输出门是如何工作的?
LSTM 用遗忘门、输入门和输出门控制细胞状态的保留、写入和暴露,从而缓解普通 RNN 的长期依赖和梯度衰减问题。
同题还出现在 1 个公司岗位
CLIP 的图文对比学习流程如何用伪代码表示?
这题考 CLIP 图文对比学习的训练流程,回答重点是 batch 内配对、图像/文本归一化向量、相似度矩阵、温度系数和对称交叉熵损失。
同题还出现在 1 个公司岗位
推荐系统的离线特征与样本流水线如何设计?线上服务消费离线结果时,如何在固定周期刷新、近实时更新和特征滞后补偿之间取舍?
这道题考察推荐系统离线特征、样本流水线与线上服务消费的工程设计。好的回答要讲清固定周期刷新、近实时更新和特征滞后补偿的取舍。
DPO 为什么可能导致回答过长,SimPO 如何缓解长度偏置?
这题考察对偏好优化目标的细节理解。核心不是简单说“DPO 会变啰嗦,SimPO 会变短”,而是要解释 DPO 的隐式 reward 如何由整段回答的 logprob 差构成,为什么长度、参考模型、偏好数据和评测方式会共同放大长回答倾向,以及 SimPO 如何用平均 log probability 和目标间隔缓解这种偏置。
多模态 CoT 场景下,如何构造用于 DPO 的偏好数据,并保证推理过程与图文证据一致?
这题考多模态偏好数据构造。回答要讲正负样本、图文证据一致性、推理链标注、偏好质量、DPO 训练和评估闭环。
统一生成理解多模态模型做下游微调时,如何为分类、VQA、OCR、定位和生成任务设计统一样本格式,同时保留各任务的专属监督,并控制混训比例、数据质量和能力退化风险?
这题考统一生成理解模型的下游微调数据设计。回答要讲任务格式统一、数据混合、采样比例、模态对齐、质量控制和评测。