公司岗位题库

蚂蚁集团算法面经

17 道题 33 个标签 17 条出现记录

已解析题目

算法工程师相关题目

蚂蚁集团 / 算法

你觉得要如何提高目前支付宝中搜索功能的效果和用户体验？

这个问题可以按支付宝这类任务型搜索场景回答：同时提升搜索效果和用户体验，不能只改排序或入口样式。高质量回答应围绕意图理解、多路召回、排序目标、结果组织、交互反馈和实验评估展开。

搜索产品推荐系统模型评估

蚂蚁集团 / 算法

如果让你设计一个推荐系统，会设计什么样的架构？

推荐系统架构题要从离线训练、在线服务、召回排序、策略重排、实验监控和反馈闭环回答，不能只列协同过滤或深度模型。

推荐系统系统设计特征工程

蚂蚁集团 / 算法

如何合并 N 个有序数组并输出有序数组？

合并 N 个有序数组的经典做法是使用小顶堆维护每个数组当前最小元素，复杂度 O(M log N)，其中 M 是总元素数。

算法数据结构排序算法

蚂蚁集团 / 算法

大模型使用的损失函数是什么？

大模型预训练最常见的损失函数是 next-token prediction 的交叉熵损失；对齐阶段还会出现 SFT 交叉熵、奖励模型损失、RLHF 或 DPO 这类偏好优化目标。

大语言模型模型训练 RLHF

蚂蚁集团 / 算法

如何将 NLP 和推荐相互结合？

NLP 和推荐结合的关键是把文本理解能力转成推荐可用的用户、物料和上下文表示，用于召回、排序、冷启动和解释，而不是简单把两个系统拼起来。

推荐系统 Embedding 文本分类

蚂蚁集团 / 算法

常用的召回算法有哪些？

常用召回算法可以按规则、协同过滤、内容向量、模型向量、图关系和实时行为分组，核心目标是在可控延迟内从海量物料中取到足够好的候选。

推荐系统 Embedding 算法

蚂蚁集团 / 算法

RAG 可以做哪些优化？

RAG 优化要覆盖切分、索引、召回、重排、上下文组装、生成约束和评估闭环，不能只停留在换 embedding 模型。

RAG 向量数据库大语言模型

蚂蚁集团 / 算法

给店铺卖家发放贷款并控制逾期率，特征工程如何设计？

这题考风控特征工程的完整框架：围绕逾期风险定义标签、时间窗口、主体画像、经营现金流、历史履约、异常行为和数据泄漏控制。

特征工程统计学模型评估

蚂蚁集团 / 算法

如何设计一个基于历史搜索关键词的推荐系统？

基于历史搜索关键词的推荐系统要把用户 query 历史转成可用兴趣画像，再匹配候选内容或广告。设计重点包括 query 日志表、用户画像表、关键词标准化与类目映射表、候选物料表、曝光点击转化日志表，以及召回、排序、过滤和反馈闭环。

推荐系统广告搜索产品

蚂蚁集团 / 算法

决策树的分裂准则有哪些？最大信息增益和最大信息增益比有什么不同，为什么最大信息增益有缺陷？

决策树分裂准则用于选择让子节点更纯的特征和切分点。信息增益看熵下降，容易偏向取值多的特征；信息增益比用特征自身的分裂信息做归一化，缓解多值特征偏置，但也可能偏向分裂信息过小的特征，需要结合阈值和验证效果判断。

树统计学模型训练

蚂蚁集团 / 算法

Teacher forcing 为什么会带来训练和推理不一致，如何缓解 exposure bias？

这题考序列模型训练中的 teacher forcing 和 exposure bias，回答要解释训练推理输入分布不一致、误差累积和常见缓解方法。

大语言模型模型训练模型评估 SFT

蚂蚁集团 / 算法

3D Gaussian Splatting 重建中的主要误差来源有哪些，如何从相机位姿、点云初始化和优化过程定位？

这题把“高斯重建”明确放在高斯重建 / 3D Gaussian Splatting 类重建语境下，重点考误差归因能力：相机、初始化、可见性、材质、Gaussian 参数优化和评估调试都可能成为重建误差来源。

计算机视觉模型评估问题排查神经网络算法

蚂蚁集团 / 算法

MVS 点云采样和 NeRF 采样在 3D 重建中各有什么优势和局限，如何按场景选择？

这题考的是 3D 重建方法取舍：MVS 更偏显式几何和多视图匹配点云，NeRF 更偏沿射线做体渲染采样和隐式辐射场优化，选择要看视角密度、纹理、材质、速度、输出形态和下游需求。

计算机视觉神经网络模型评估算法问题排查

蚂蚁集团 / 算法

如何用 PyTorch/CUDA 思路实现四线性插值，说明索引、权重计算和边界处理伪代码？

这题考实现思路而不是背库函数：先声明把“四线性插值”按 4D/quadrilinear interpolation 理解，即 4 个连续维度上各取 floor/ceil 共 16 个邻居，再讲索引映射、权重乘积、边界策略、CUDA 并行和反向传播验证。

CUDA GPU 算法手写题计算机视觉

蚂蚁集团 / 算法

DPO、PPO、GRPO 三种对齐方法在工程上如何选择，各自适合什么反馈和决策场景？

这题考的是候选人能否把 DPO、PPO、GRPO 从“算法名词”落到工程选择。好答案要先按反馈形态和决策场景分类：只有离线成对偏好时优先 DPO；有可训练奖励模型、在线采样和长链动作优化需求时考虑 PPO；同一 prompt 能采多条候选并用组内相对奖励比较，尤其是可验证任务或推理题时适合 GRPO。还要讲清 reward hacking、KL 漂移、长度偏置、探索成本、训练稳定性和评估指标。

同题还出现在 2 个公司岗位

大语言模型强化学习 RLHF DPO 模型训练模型评估

蚂蚁集团 / 算法

Transformer 中 Pre-Norm 和 Post-Norm 有什么区别，为什么会影响深层模型训练稳定性？

这题考的是 Transformer 残差块里 LayerNorm 放置位置对梯度流和深层训练的影响：Pre-Norm 更利于深层稳定训练，Post-Norm 表达形式经典但更依赖 warmup、初始化和训练技巧，二者还有最终性能与稳定性的取舍。

同题还出现在 1 个公司岗位

大语言模型 Transformer 模型训练神经网络正则化

蚂蚁集团 / 算法

Agent 系统里上下文缓存有什么价值，如何用它处理频繁复用的系统指令并降低冗余上下文成本？

这题考 Agent 上下文缓存和 prompt caching。核心是把稳定系统指令、工具协议和安全策略作为可缓存前缀，把用户问题、检索材料和工具结果作为动态上下文，并通过版本、权限作用域和失效机制避免缓存污染。

AI Agent 大语言模型 Prompt 工程状态管理性能排查