公司题库

拼多多面经题库

33 道题 7 个岗位 50 个标签

拼多多相关面试题

图像滤波如何通过卷积实现,如何从频域理解低频平滑和高频边缘信息?

图像滤波可以从空间域和频域两条线理解:空间域里,卷积核在局部邻域加权求和,改变每个像素与周围像素的关系;频域里,卷积等价于频谱相乘,滤波器是在保留或抑制不同频率成分。低频通常对应缓慢变化的亮度和大块结构,低通滤波会平滑噪声和细节;高频通常对应边缘、纹理和突变,高通或梯度滤波会强化轮廓但也可能放大噪声。

除了传统 RFM 模型,如何用无监督学习从海量用户行为中挖掘有商业价值的新用户分群?

这题考察的是数据分析候选人能否把无监督学习从“算法名词”落到用户分群的业务闭环。好的回答要先说明分群不是为了替代 RFM,而是从更丰富的行为、偏好、价格敏感度、生命周期和转化路径中发现可解释、可触达、可验证的人群,并用离线稳定性指标和线上业务实验共同证明分群有价值。

构建 AI Agent 时,Memory 机制通常如何分层设计,短期上下文、长期记忆和检索注入分别解决什么问题?

这题考察的是候选人是否理解 Agent Memory 不是一个简单向量库,而是一套分层状态管理和检索注入机制。回答要区分短期上下文、工作记忆、长期记忆、外部知识检索和写入更新策略,并说明每层解决的问题、成本权衡、失效模式和评估方法。

关注页上线新的排序方案时,如何通过 A/B 测试选择更优方案,并设计核心指标、护栏指标和分层分析?

关注页排序方案 A/B 测试要围绕“用户是否更有效消费关注内容”设计指标:核心看关注页消费和互动提升,护栏看负反馈、留存、整体体验、创作者曝光和系统性能,并通过分层分析、显著性检验和长期观察决定是否上线。

同题还出现在 1 个公司岗位

大模型反欺诈项目从开发、测试到部署应如何设计流程,Agent 框架选型需要关注哪些工程约束?

这题考大模型反欺诈项目的端到端工程化能力,不是只问“用了哪个 Agent 框架”。高质量回答要从业务边界、数据合规、Agent 工具链、离线评测、测试门禁、灰度部署、监控回流和框架选型约束讲清楚,体现反欺诈场景对准确性、可解释性、安全和稳定性的要求。

分词算法有哪些?

分词算法解决的是把连续文本切成有意义的词或子词单位。中文没有天然空格,因此分词既要处理词典匹配,也要处理歧义、未登录词、新词、专名、领域词和下游任务适配。常见算法包括基于词典的正向/逆向/双向最大匹配、DAG 加动态规划、HMM/CRF 序列标注、统计语言模型、深度学习序列标注,以及 BPE、WordPiece、SentencePiece 等子词切分方法。

同题还出现在 2 个公司岗位

拼多多处于流失风险期的用户,如何用自动化数据策略做召回?

这题考用户生命周期运营里的风险识别、自动化策略和实验闭环,不是简单问“给流失用户发券”。高质量回答要先定义拼多多场景下的流失风险期,再说明如何用行为、交易、品类偏好和价格敏感度打分分层,最后讲触达时机、召回权益、推荐内容、实验 holdout、召回后留存和打扰护栏。

资源有限时,增长运营如何用广告投放 ROI 平衡投放规模与效果?

这道题考察增长运营在资源有限时是否理解投放 ROI 的边际收益逻辑。广告投放不是简单追求最高 ROI,也不是盲目放量,而是在预算、库存、团队能力和商业目标约束下,寻找“规模增长”和“单位效率”的平衡。关键框架是区分平均 ROI 与边际 ROI:小预算高 ROI 不代表可放量,预算扩大后流量质量下降、频次上升、竞价成本上升,ROI 往往递减。好答案需要覆盖预算分层、实验放量、止损线、利润口径、LTV 口径和 portfolio 管理。

拼多多 App 百亿补贴频道转化率连续 3 天下跌,数据分析师应如何一步步定位原因?

这道题考察数据分析师处理核心频道转化异常的结构化能力。好的回答要从指标口径和数据质量开始,确认连续 3 天下跌是否真实,再拆百亿补贴频道的访问、商品曝光、点击、加购或拼单、下单、支付等漏斗,定位第一处异常。随后按流量来源、用户分层、商品供给、价格补贴、库存履约、推荐排序、页面性能、支付登录和活动竞争等维度归因,最后给出影响量级、责任 owner、验证方案和恢复监控。