拼多多算法工程师面经题库

这题考 GPU 推理中 depthwise / separable convolution 为什么容易 memory-bound。它虽然显著降低 FLOPs，但 activation 读写没有同比减少，算术强度低，无法充分利用 GPU 计算吞吐，瓶颈常转向显存带宽、cache locality 和 kernel launch。

神经网络 GPU CUDA 性能排查大模型推理

拼多多 / 算法

推理优化中为什么可以做 Conv+BN 融合，融合后的权重和偏置公式如何推导？

这题考推理态算子融合的数学等价性和工程收益。BN 在 inference 时使用固定 running mean/variance，是逐输出通道仿射变换，所以可以吸收到前一层卷积的权重和偏置里，减少算子调度和中间 tensor 读写。

神经网络大模型推理模型评估性能排查

拼多多 / 算法

推理框架中卷积算子通常有哪些实现方式，如何按输入形状、硬件和延迟目标选型？

这题考推理框架里的卷积实现谱系，而不是卷积数学定义。回答要覆盖 direct、im2col/GEMM、implicit GEMM、Winograd、FFT、1x1/depthwise/group 专用 kernel，并说明选型受形状、batch、硬件、内存带宽、精度和端到端延迟影响。

神经网络大模型推理模型评估性能排查

拼多多 / 算法

构建 AI Agent 时，Memory 机制通常如何分层设计，短期上下文、长期记忆和检索注入分别解决什么问题？

这题考察的是候选人是否理解 Agent Memory 不是一个简单向量库，而是一套分层状态管理和检索注入机制。回答要区分短期上下文、工作记忆、长期记忆、外部知识检索和写入更新策略，并说明每层解决的问题、成本权衡、失效模式和评估方法。

AI Agent 大语言模型状态管理 RAG 向量数据库

拼多多 / 算法

大模型反欺诈项目从开发、测试到部署应如何设计流程，Agent 框架选型需要关注哪些工程约束？

这题考大模型反欺诈项目的端到端工程化能力，不是只问“用了哪个 Agent 框架”。高质量回答要从业务边界、数据合规、Agent 工具链、离线评测、测试门禁、灰度部署、监控回流和框架选型约束讲清楚，体现反欺诈场景对准确性、可解释性、安全和稳定性的要求。

大语言模型 AI Agent 系统设计模型评估质量工程安全

拼多多 / 算法

分词算法有哪些？

分词算法解决的是把连续文本切成有意义的词或子词单位。中文没有天然空格，因此分词既要处理词典匹配，也要处理歧义、未登录词、新词、专名、领域词和下游任务适配。常见算法包括基于词典的正向/逆向/双向最大匹配、DAG 加动态规划、HMM/CRF 序列标注、统计语言模型、深度学习序列标注，以及 BPE、WordPiece、SentencePiece 等子词切分方法。

同题还出现在 2 个公司岗位

算法数据结构

拼多多 / 算法

OpenCL/GPU kernel 为什么要尽量减少分支，掩码写法如何影响 SIMT/SIMD 执行效率和有效吞吐？

这题考 GPU/OpenCL 高性能实现里的分支发散和掩码写法。高质量回答要说明 work-item 在 subgroup/warp/wavefront 内锁步执行，分支不一致会串行执行不同路径并屏蔽 inactive lane，从而降低有效吞吐。

Java 并发并发多线程 GPU 性能排查大模型推理

拼多多 算法面经

算法工程师相关题目

拼多多算法面经