知识点标签

推荐系统面试题解析第 2 页

推荐系统相关面试题解析,按真实面经题目沉淀核心机制、易错点和面试官追问。

95 道题 7 个岗位 18 个公司

推荐系统相关面试题第 2 页

推荐系统中如何把 Transformer 行为序列表征接入 DIN 式目标兴趣建模?

这道题考察的是推荐序列建模和目标兴趣抽取的组合设计。高质量回答要说明:Transformer 适合把用户历史行为编码成带上下文的序列表征,DIN 的价值在于针对当前候选物品做 target-aware attention;工程上不能只拿一个全局向量,要处理时间因果、候选量、缓存、延迟和线上线下一致。

推荐系统中的用户画像和特征工程如何实现,怎样保证训练样本与线上特征口径一致?

这道题考察推荐特征工程的体系化能力。好答案不只是列画像字段,而要说明画像分层、特征定义、时间窗口、训练样本构造、线上读取、point-in-time correctness、特征平台复用和训练服务一致性,否则很容易出现泄漏、口径漂移和线上效果回退。

商业化产品中,用户画像如何用于个性化推荐,并如何平衡推荐效果与用户隐私保护?

用户画像在商业化产品中的作用,是把用户行为、兴趣、消费意图和场景偏好转化为可用于广告定向、内容推荐、商品匹配和效果优化的产品能力。但商业化不能只追求点击率和转化率,还必须遵守隐私保护、最小必要、透明可控、数据安全和用户信任原则。回答要同时覆盖推荐效果和隐私治理。

关注页上线新的排序方案时,如何通过 A/B 测试选择更优方案,并设计核心指标、护栏指标和分层分析?

关注页排序方案 A/B 测试要围绕“用户是否更有效消费关注内容”设计指标:核心看关注页消费和互动提升,护栏看负反馈、留存、整体体验、创作者曝光和系统性能,并通过分层分析、显著性检验和长期观察决定是否上线。

同题还出现在 1 个公司岗位

视频推荐中“正能量”标签准确率较低时,产品经理应如何判断它能否进入分发侧,并设计排序策略、指标和风险控制?

这题考产品经理如何处理低准确率标签进入推荐分发的问题。核心不是回答“能用”或“不能用”,而是判断标签在分发链路里的使用层级:低准确率标签不能作为强过滤或强排序依据,但可以在置信度、召回范围、人工校验、负反馈和实验护栏充分的情况下,作为弱特征、探索特征或多目标排序约束。

推荐系统中做采样后样本分布被改变,点击率预估值应该如何校准?

采样会改变训练样本中的先验点击率,模型在采样分布上学到的概率通常不是线上真实曝光分布的 CTR。回答时要先说明校准目标是把 sampled posterior 还原到 target posterior,再给出 odds/prior correction 公式,并补充用未采样验证集做 Platt、isotonic、温度缩放或分桶校准,最后用可靠性曲线、ECE、Brier/logloss 和线上 A/B 验证。

DCN 和 DeepFM 的特征交叉机制有什么异同?

DCN 和 DeepFM 都用于稀疏特征推荐排序,都试图同时建模低阶和高阶交叉。DeepFM 用 FM 显式建模二阶 pairwise 交叉,再用 DNN 隐式学习高阶非线性交叉;DCN 用 cross network 递推地把原始特征 x0 与当前层 xl 做显式交叉,得到有界阶数的多项式交叉。回答重点是公式、显式/隐式、交叉阶数、参数效率、可解释性和工程选型。

推荐系统中多任务学习有哪些常见结构,PLE 主要优化了共享底座或 MMoE 的哪些问题?

推荐多任务常见结构包括 hard parameter sharing/shared-bottom、独立塔、ESMM、soft sharing、MMoE、PLE 等。核心矛盾是任务相关性不均、梯度冲突、负迁移、任务跷跷板和样本空间差异。PLE 在共享专家之外引入任务专属专家,并通过多层 CGC/门控逐层抽取 shared 与 task-specific 表征,主要缓解 shared-bottom 的过度共享和 MMoE 的专家混用、任务干扰问题。

推荐模型离线 AUC 与线上效果不一致时,可能有哪些原因,如何定位和修正?

离线 AUC 与线上效果不一致通常不是单点问题,而是数据分布、样本构造、标签口径、特征一致性、评估指标、候选集、系统链路和实验统计共同造成。回答要先说明 AUC 衡量 P(score_pos > score_neg),不等于线上业务收益;再按数据、模型、评估、服务、实验五层排查,并给出 replay、shadow scoring、切片、A/A、A/B 和监控修正路径。

推荐或广告系统新增一路召回后,如何评估这一路召回的效果、效率和 ROI?

新增一路召回不能只看“这路召回了多少 item”或“命中了多少点击”,因为多路召回存在去重、排序、预算竞争和归因稀释。高质量回答要把评估拆成效果、效率、增量价值和 ROI 四层:效果看覆盖率、命中率、后链路采纳、排序后曝光/点击/转化贡献;效率看召回耗时、QPS、CPU/GPU/内存、索引成本、去重后有效候选率;增量价值看相对 baseline 的新增好样本、新增人群、新增广告主/商品覆盖,以及 A/B 中核心业务指标提升;ROI 则用增量收益减增量成本,或增量 GMV/广告收入/利润除以系统和维护成本。回答时要强调离线只能做候选筛查,最终要靠在线实验和归因方法判断是否值得长期保留。

主场景数据充足但抢购等小样本场景 CTR/CVR 分布不同,推荐模型如何用增量学习或 PPNet 做适配?

这题的关键是小样本场景不是简单“数据少”,而是抢购等场景的用户意图、价格敏感度、库存稀缺、时间压力和 CTR/CVR 分布都与主场景不同。只用主场景大数据训练一个统一模型,容易在小场景上校准偏、排序目标错或过度拟合主场景。可行方案包括增量学习、样本重加权、多任务/多场景建模、场景特征注入和 PPNet。PPNet 的核心是用场景/人群/上下文作为 gating 或 personalized parameter generator,对底层网络的 hidden units 或专家输出做个性化缩放,让主模型共享大样本知识,小场景通过参数调制适配分布差异。回答还要覆盖数据构造、冷启动、负迁移、校准、在线 A/B 和防遗忘。

推荐系统中用召回模型蒸馏粗排模型时,如何评价蒸馏后的召回效果?

这题考察召回模型蒸馏粗排模型后的评价方法。核心在于区分“学生模型是否拟合了粗排老师”和“蒸馏后的召回是否真的更好”。召回蒸馏粗排通常是把粗排模型对候选的打分、排序关系或 top item 偏好迁移到召回侧,使召回阶段更早拿到高质量候选。但评价不能只看蒸馏 loss 或 teacher-student 分数相关性,因为召回的职责是从海量 item 中找回后链路需要的候选。高质量答案应覆盖:离线召回指标、与 teacher 排序一致性、下游粗排/精排漏斗贡献、系统性能成本、在线 A/B 以及失败模式,如过度模仿粗排导致多样性下降、覆盖变窄、训练候选偏差和 teacher 错误被放大。

给定用户 session 曝光或点击序列,如何设计公式衡量推荐内容多样性并用于优化?

这题要求给定用户 session 的曝光或点击序列,设计可计算的推荐内容多样性公式,并说明如何用于优化。高质量答案不应只说“类别越多越好”,而要根据业务内容表示定义多样性:可以从类目覆盖、分布熵、两两相似度、去重率、新颖性、序列相邻差异和用户兴趣覆盖几个角度构造指标。对于 session 序列,常用公式包括 intra-list diversity:`ILD = 1 - average(sim(i,j))`;类别熵:`H = -Σ p_c log p_c`;有效类别数:`exp(H)`;相邻多样性:`1 - average(sim(i_t, i_{t+1}))`。用于优化时不能盲目提高多样性,需要和相关性、CTR/CVR、时长、留存做 trade-off,可在重排阶段加入多样性正则或约束,并用 A/B 验证用户体验和业务指标。

同公司岗位有 2 条面经记录

在 OCPX 广告系统中,bid 出价如何参与广告混排,混排逻辑应放在排序侧还是出价侧?

这题的核心是广告系统里“出价”和“排序/混排”的职责边界。OCPX 中 bid 不只是广告主手填的静态价格,而是围绕优化目标、转化率预估、预算消耗、约束和平台机制形成的有效出价信号;它最终要进入广告候选的价值计算,例如 eCPM、pCTR、pCVR、bid、质量分、用户体验和业务约束的组合。混排不是由出价侧单独决定,也不应该完全脱离出价信号放在推荐排序里随意处理。更合理的边界是:出价侧负责把广告主目标、预算、CPA/ROI 约束和竞价机制转换成可解释、可控、可校准的 bid 或 value 信号;排序/混排侧负责在用户请求上下文中融合广告和自然内容,综合收益、相关性、体验、多样性、频控和商业约束做最终排序。广告混排逻辑通常更靠近排序/混排侧,但需要消费出价侧产出的价值信号,并把曝光、点击、转化和消耗反馈回出价系统形成闭环。

推荐排序中,LGB 点击率预估与 LambdaMART 这类 pairwise 排序模型应如何选型?

这题考察的是推荐排序模型目标与业务阶段的匹配。LGB 做点击率预估通常是 pointwise 思路:把每个曝光样本建成点击/不点击标签,预测 pCTR 或相关概率,优点是训练样本构造简单、可解释、工程成熟、延迟低、支持非线性特征组合,对稀疏表格特征和中小规模排序链路很实用;缺点是优化目标和最终排序指标 NDCG/MAP 不完全一致,也可能受曝光位置偏差和样本校准影响。LambdaMART 属于 learning-to-rank,常用 pairwise/listwise 的梯度思想直接优化排序相关指标,适合有 query/session/list 结构、强相对排序标签和 TopK 质量目标的场景;但它对样本分组、标签质量、训练成本、在线 serving、增量更新和校准都有更高要求。选型不能说谁绝对更好,而要看目标是概率预估、广告/推荐价值计算、可校准 CTR,还是列表相对顺序和 NDCG 提升。

推荐召回中,为什么可能不用 UserCF,ItemCF 又该如何结合热度信号?

这题考察推荐召回中的协同过滤取舍和热门度信号使用方式。UserCF 不用不代表不懂协同过滤,而可能是业务和工程上的理性选择:用户行为稀疏、用户兴趣变化快、用户相似度计算成本高、相似用户可解释但稳定性差、冷启动和噪声影响大,在大规模内容平台中维护 user-user 相似矩阵往往不如 item-item 稳定。ItemCF 利用“看过同一内容的人还看了什么”建 item-item 相似,物品侧关系相对稳定、可离线预计算、召回延迟低,适合视频/内容推荐召回。但 ItemCF 容易被热门内容支配,所以热度信号不能简单相加放大热门,而要做平滑、去偏、分桶、时间衰减和个性化权重控制。高质量回答要讲清为什么不用 UserCF、ItemCF 相似度如何计算、热度如何作为补充召回或重排序特征、如何避免马太效应,以及如何用离线和在线指标验证。

ItemCF 召回中如何引入时间间隔和位置间隔信息来改进相似度计算?

这道题考察的是候选人能否把 ItemCF 从“共同被同一用户交互过就相似”的朴素共现,升级成考虑用户行为序列和时间上下文的召回方法。时间间隔表达两个物品是否在接近的兴趣周期内被消费,位置间隔表达它们在用户序列中是否相邻或有方向性。好的回答要从 ItemCF 基础相似度公式出发,说明在共现贡献项里乘上时间衰减和位置衰减,再配合用户活跃度归一化、物品热度惩罚、会话切分、方向性建模、离线召回评估和线上指标护栏。重点不是背一个固定公式,而是说明为什么这些权重能降低偶然共现和长周期兴趣漂移带来的噪声。

基于商品属性 Embedding 的推荐召回如何设计,如何处理属性特征、向量索引和冷启动?

这道题考察的是候选人能否把“商品属性 Embedding”从一个模糊向量概念,拆成一条完整召回链路。商品属性包括类目、品牌、价格带、标签、文本描述、图片特征、商家、地域、质量分等结构化和非结构化信息。设计时要先定义属性 schema 和清洗规则,再把稀疏属性编码成 item embedding,构建 ANN 向量索引,在线用用户画像、最近行为或 query embedding 召回相似商品,并处理过滤、去重、冷启动、实时更新和效果评估。好的回答要强调它适合新商品、长尾商品和行为稀疏场景,但不能完全替代协同过滤;属性相似不等于用户会转化,仍需要后续排序和实验验证。

推荐系统新增一路召回后,排序阶段需要做哪些特征接入、分数校准和模型训练改造?

这道题考察的是候选人是否理解推荐系统是召回、排序、重排和实验闭环的整体系统。新增一路召回不是把候选直接塞给排序模型就结束,因为新召回源会带来候选分布变化、分数口径不一致、样本覆盖不足、特征缺失、去重归因复杂、线上配额和延迟变化。排序阶段至少要接入召回源特征、补齐候选侧特征、处理新旧渠道分数校准、更新训练样本和负采样、监控不同来源的排序表现,并通过 A/B 验证用户指标、业务指标和系统成本。回答的关键是把新增召回后的排序改造讲成“分布变化治理”,而不是只说模型重新训练。

用户增长算法与传统搜索、广告、推荐算法在目标、数据、模型和评估指标上有什么区别?

这道题考察的是候选人能否跳出搜广推常见的 CTR、CVR 预估框架,理解用户增长算法的目标更偏用户生命周期和增量价值。搜索、广告、推荐通常围绕当前请求或当前流量做匹配、排序和转化优化;用户增长更关注拉新、激活、召回、留存、复购、会员转化、LTV、补贴效率和渠道 ROI。它的数据有更强的跨周期、跨渠道、延迟反馈和因果干预特征,模型也常涉及人群分层、uplift、因果推断、LTV 预估、流失预测、触达频控和预算分配。好的回答要比较目标、样本、标签、模型、实验和指标,并说明增长算法不能只追短期转化,否则可能造成补贴浪费、用户打扰和长期留存受损。

设计 AI 驱动的个性化推荐系统时,如何在推荐准确性、实时性、计算成本和用户体验之间取舍?

这题考推荐系统产品经理的系统取舍能力。回答要把准确性、实时性、计算成本和用户体验放在同一个推荐链路里讨论,通过召回、粗排、精排、重排、缓存、降级和实验指标做分层决策,而不是简单说模型越准越好。