真实面经题目 · 原创解析

评估推荐效果时,需要采集哪些曝光 log 和点击 log,如何保证指标可归因?

这题考推荐系统评估的数据基础。回答要说明曝光 log 是分母和归因基础,点击 log 是用户反馈结果,两者必须用 requestId、itemId、position、策略版本和时间窗口串起来,否则 CTR、转化率和 A/B 结论都不可靠。

出现于:腾讯 · 数据分析

60 秒回答模板

评估推荐效果时,曝光 log 和点击 log 不是越多越好,而是要能还原一次推荐请求从候选、排序、展示到用户行为的链路。曝光 log 至少要记录 userId 或匿名用户标识、requestId、sessionId、itemId、推荐位、位置序号、展示时间、页面场景、召回通道、排序模型版本、实验分组、是否真正进入可视区域、设备和网络等信息。它决定指标分母,也决定一次点击能不能归因到具体策略。 点击 log 要记录同一个 requestId 或可关联的 traceId、userId、itemId、点击时间、点击位置、点击类型、停留、后续阅读、收藏、分享、转化和返回等行为。点击不是孤立事件,要能回连到曝光记录,确认用户点击的是哪一次展示、哪个位置、哪个实验组产生的结果。 质量上要特别注意四类问题。第一是口径,曝光到底是服务端下发、客户端渲染,还是用户可见曝光,口径不同 CTR 会差很多。第二是去重,同一个 item 在同一 session 多次展示要区分首次曝光、重复曝光和刷新。第三是延迟和丢数,客户端日志可能延迟上报或丢失,需要监控曝光点击匹配率。第四是实验归因,必须记录策略版本和实验桶,避免把自然流量、运营位或缓存结果混进推荐模型效果。最后用这些日志计算 CTR、有效点击率、阅读完成率、转化率、负反馈率、分位置收益和分人群收益,再结合 A/B 判断推荐策略是否真实提升。

考点 曝光是分母
难度 真实面经题
回答目标 让面试官看到你能从埋点字段、日志关联、口径治理和实验归因四层评估推荐效果。

深入解析

01

曝光日志是分母

曝光 log 要说明系统给用户展示了什么、在哪个场景展示、处于什么位置、来自哪个策略和实验组。没有准确曝光,就无法计算 CTR,也无法判断未点击是用户不感兴趣还是根本没看到。

02

点击日志是反馈

点击 log 要记录用户对某次曝光的行为反馈,包括点击、停留、阅读、转化和负反馈。它必须能和曝光 log 关联,否则点击只能说明发生过行为,不能说明是哪套推荐策略带来的。

03

链路字段要能归因

requestId、sessionId、itemId、position、strategyId、modelVersion、experimentBucket 和 timestamp 是关键字段。它们把一次推荐请求、展示结果和用户行为连成可分析链路。

04

曝光口径要统一

服务端下发、客户端渲染、进入可视区域和停留超过阈值都可以叫曝光,但业务含义不同。评估前必须统一口径,并监控不同端和版本的埋点差异。

05

用日志支撑实验

推荐效果不能只看全站点击上升。要按实验组、场景、位置、人群、新老用户和内容类型分层,确认指标变化来自推荐策略,而不是流量结构或运营资源变化。

易错点

  • 只列点击日志字段,不说明曝光日志是指标分母和归因基础。
  • 没有 requestId 或 traceId,导致点击无法关联到具体曝光。
  • 混用服务端下发曝光和客户端可见曝光,造成 CTR 口径混乱。
  • 忽略 position bias,把高位置点击率误认为模型效果好。
  • 不记录实验桶和策略版本,导致 A/B 结果无法解释。

面试官追问

曝光 log 只记 itemId 和 userId 够吗?

不够。缺少 requestId、位置、场景、策略版本和实验桶时,无法判断该 item 为什么被展示、展示在什么位置,也无法把点击归因到具体推荐策略。

为什么要记录 position?

位置会显著影响点击率。第一位天然更容易被点击,如果不控制位置,就会把位置优势误判为模型效果。

如何发现埋点有问题?

看曝光点击匹配率、端上和服务端数量差、不同版本突变、同一 request 的重复曝光、点击无曝光比例和日志上报延迟分布。

推荐评估是否只看 CTR?

不能。CTR 只是入口指标,还要看有效阅读、停留、转化、负反馈、留存、多样性和长期体验,避免推荐标题党或短期刺激内容。