已解析题目
算法工程师相关题目
你觉得要如何提高目前支付宝中搜索功能的效果和用户体验?
这个问题可以按支付宝这类任务型搜索场景回答:同时提升搜索效果和用户体验,不能只改排序或入口样式。高质量回答应围绕意图理解、多路召回、排序目标、结果组织、交互反馈和实验评估展开。
如果让你设计一个推荐系统,会设计什么样的架构?
推荐系统架构题要从离线训练、在线服务、召回排序、策略重排、实验监控和反馈闭环回答,不能只列协同过滤或深度模型。
如何合并 N 个有序数组并输出有序数组?
合并 N 个有序数组的经典做法是使用小顶堆维护每个数组当前最小元素,复杂度 O(M log N),其中 M 是总元素数。
大模型使用的损失函数是什么?
大模型预训练最常见的损失函数是 next-token prediction 的交叉熵损失;对齐阶段还会出现 SFT 交叉熵、奖励模型损失、RLHF 或 DPO 这类偏好优化目标。
如何将 NLP 和推荐相互结合?
NLP 和推荐结合的关键是把文本理解能力转成推荐可用的用户、物料和上下文表示,用于召回、排序、冷启动和解释,而不是简单把两个系统拼起来。
常用的召回算法有哪些?
常用召回算法可以按规则、协同过滤、内容向量、模型向量、图关系和实时行为分组,核心目标是在可控延迟内从海量物料中取到足够好的候选。
RAG 可以做哪些优化?
RAG 优化要覆盖切分、索引、召回、重排、上下文组装、生成约束和评估闭环,不能只停留在换 embedding 模型。
给店铺卖家发放贷款并控制逾期率,特征工程如何设计?
这题考风控特征工程的完整框架:围绕逾期风险定义标签、时间窗口、主体画像、经营现金流、历史履约、异常行为和数据泄漏控制。
如何设计一个基于历史搜索关键词的推荐系统?
基于历史搜索关键词的推荐系统要把用户 query 历史转成可用兴趣画像,再匹配候选内容或广告。设计重点包括 query 日志表、用户画像表、关键词标准化与类目映射表、候选物料表、曝光点击转化日志表,以及召回、排序、过滤和反馈闭环。
决策树的分裂准则有哪些?最大信息增益和最大信息增益比有什么不同,为什么最大信息增益有缺陷?
决策树分裂准则用于选择让子节点更纯的特征和切分点。信息增益看熵下降,容易偏向取值多的特征;信息增益比用特征自身的分裂信息做归一化,缓解多值特征偏置,但也可能偏向分裂信息过小的特征,需要结合阈值和验证效果判断。
Teacher forcing 为什么会带来训练和推理不一致,如何缓解 exposure bias?
这题考序列模型训练中的 teacher forcing 和 exposure bias,回答要解释训练推理输入分布不一致、误差累积和常见缓解方法。
3D Gaussian Splatting 重建中的主要误差来源有哪些,如何从相机位姿、点云初始化和优化过程定位?
这题把“高斯重建”明确放在高斯重建 / 3D Gaussian Splatting 类重建语境下,重点考误差归因能力:相机、初始化、可见性、材质、Gaussian 参数优化和评估调试都可能成为重建误差来源。
MVS 点云采样和 NeRF 采样在 3D 重建中各有什么优势和局限,如何按场景选择?
这题考的是 3D 重建方法取舍:MVS 更偏显式几何和多视图匹配点云,NeRF 更偏沿射线做体渲染采样和隐式辐射场优化,选择要看视角密度、纹理、材质、速度、输出形态和下游需求。
如何用 PyTorch/CUDA 思路实现四线性插值,说明索引、权重计算和边界处理伪代码?
这题考实现思路而不是背库函数:先声明把“四线性插值”按 4D/quadrilinear interpolation 理解,即 4 个连续维度上各取 floor/ceil 共 16 个邻居,再讲索引映射、权重乘积、边界策略、CUDA 并行和反向传播验证。
DPO、PPO、GRPO 三种对齐方法在工程上如何选择,各自适合什么反馈和决策场景?
这题考的是候选人能否把 DPO、PPO、GRPO 从“算法名词”落到工程选择。好答案要先按反馈形态和决策场景分类:只有离线成对偏好时优先 DPO;有可训练奖励模型、在线采样和长链动作优化需求时考虑 PPO;同一 prompt 能采多条候选并用组内相对奖励比较,尤其是可验证任务或推理题时适合 GRPO。还要讲清 reward hacking、KL 漂移、长度偏置、探索成本、训练稳定性和评估指标。
同题还出现在 2 个公司岗位
Transformer 中 Pre-Norm 和 Post-Norm 有什么区别,为什么会影响深层模型训练稳定性?
这题考的是 Transformer 残差块里 LayerNorm 放置位置对梯度流和深层训练的影响:Pre-Norm 更利于深层稳定训练,Post-Norm 表达形式经典但更依赖 warmup、初始化和训练技巧,二者还有最终性能与稳定性的取舍。
同题还出现在 1 个公司岗位
Agent 系统里上下文缓存有什么价值,如何用它处理频繁复用的系统指令并降低冗余上下文成本?
这题考 Agent 上下文缓存和 prompt caching。核心是把稳定系统指令、工具协议和安全策略作为可缓存前缀,把用户问题、检索材料和工具结果作为动态上下文,并通过版本、权限作用域和失效机制避免缓存污染。