CVR 建模遇到转化回传延时高时怎么处理，CTR/CVR 的特征和模型结构有什么不同？｜快手算法面经解析

60 秒回答模板

CTR 和 CVR 的核心差异在标签空间和反馈速度。CTR 是曝光后是否点击，反馈快、样本多，特征更偏用户即时兴趣、广告素材和上下文；CVR 是点击或曝光后是否转化，反馈慢、正样本少，特征更偏商品/服务属性、价格、落地页、历史转化和用户购买意图。遇到转化回传延时高，不能把当前未回传样本直接当负样本。我会先定义转化窗口和标签成熟时间，只用成熟样本做稳定训练；对未成熟样本按年龄加权、延迟反馈模型或 survival/hazard 思路估计最终转化概率；线上训练要支持正样本回填和样本重标。评估时也要用成熟 cohort，避免新近流量因为正样本还没回来而低估模型。

考点 反馈速度

难度 真实面经题

回答目标 讲清原理、实现和边界

深入解析

先区分两个任务

CTR 预测曝光后是否点击，标签几乎即时产生，样本量大且负样本充分。CVR 预测点击后或曝光后是否转化，标签可能在几小时到几天后回传，正样本更少，且只有点击人群的转化更容易被观察到。这个差异决定了 CVR 不能直接照搬 CTR 的训练样本和评估方式。

特征侧差异

CTR 特征更关注吸引点击的因素，例如用户短期兴趣、广告创意、展示位置、时间上下文和历史点击。CVR 特征更关注完成转化的因素，例如商品或服务价格、落地页质量、支付/下单路径、用户购买能力、历史转化、转化周期和广告主质量。两者可以共享部分用户和广告表征，但 CVR 需要更多转化意图和链路质量特征。

模型结构差异

CTR 模型通常追求高吞吐、低延迟和快速反馈迭代，常见做法是大规模稀疏特征加深度排序模型。CVR 模型要处理点击选择偏差、标签稀疏和延迟反馈，可以采用 ESMM/多任务结构、延迟反馈建模、样本重加权或校准模块。回答时不要只说“都是二分类”，而要指出 CVR 的观测机制更复杂。

延迟回传的标签口径

处理延迟反馈的第一步是定义转化窗口，例如曝光或点击后多长时间内算转化。窗口未结束的样本是未成熟样本，不能简单标成负例。离线训练可以只使用成熟样本，或者对不同年龄样本估计成熟概率，避免把尚未回传的正样本污染为负样本。

建模和训练策略

工程上可以做正样本回填和样本重标：先让样本进入训练流，后续转化回传后更新标签或补充训练。模型上可以同时预测是否最终转化和转化延迟分布，用样本年龄、回传渠道和历史延迟分布做 correction；也可以用 survival/hazard 思路估计在未来窗口内转化的概率。目标是把“未观察到”与“确定不会转化”分开。

评估和线上监控

CVR 的离线评估必须用成熟 cohort，否则越新的流量看起来转化率越低。指标除了 AUC、LogLoss，还要看分桶校准、预估/实际转化比、不同转化延迟切片和广告主/行业切片。线上要监控回传延迟分布变化，因为回传链路变化会让模型指标和真实效果同时漂移。

易错点

把 CVR 说成点击后的普通二分类，不讨论标签延迟和点击选择偏差。
把所有未转化样本立即当负例，忽略转化窗口和回传成熟时间。
只比较 CTR/CVR 特征名，不解释为什么 CTR 关注吸引点击而 CVR 关注完成转化。
用未成熟数据评估 CVR，导致模型被错误地判定为低估或高估。

面试官追问

为什么未回传样本不能直接标成负样本？

因为其中一部分只是还没到转化窗口或还没完成回传。直接标负会系统性低估 CVR，尤其伤害转化周期较长的广告或人群。

CVR 延迟反馈和样本选择偏差有什么关系？

延迟反馈解决的是标签什么时候可观察，样本选择偏差解决的是只在点击样本上观察 CVR。两者经常同时存在，但处理方法不同：前者要管标签成熟，后者要管训练样本空间。

离线评估为什么要按转化延迟切片？

不同广告、行业或用户的回传延迟不同。只看整体指标可能掩盖模型对长延迟样本的低估，也可能把回传链路变化误认为模型变差。

CTR 和 CVR 可以共享底层特征吗？

可以共享用户、广告、上下文等基础表征，但 CVR 需要任务专属特征和任务头。多任务结构要控制负迁移，避免高频 CTR 任务压制稀疏 CVR 任务。