评估推荐效果时，需要采集哪些曝光 log 和点击 log，如何保证指标可归因？｜腾讯数据分析面经解析

60 秒回答模板

评估推荐效果时，曝光 log 和点击 log 不是越多越好，而是要能还原一次推荐请求从候选、排序、展示到用户行为的链路。曝光 log 至少要记录 userId 或匿名用户标识、requestId、sessionId、itemId、推荐位、位置序号、展示时间、页面场景、召回通道、排序模型版本、实验分组、是否真正进入可视区域、设备和网络等信息。它决定指标分母，也决定一次点击能不能归因到具体策略。点击 log 要记录同一个 requestId 或可关联的 traceId、userId、itemId、点击时间、点击位置、点击类型、停留、后续阅读、收藏、分享、转化和返回等行为。点击不是孤立事件，要能回连到曝光记录，确认用户点击的是哪一次展示、哪个位置、哪个实验组产生的结果。质量上要特别注意四类问题。第一是口径，曝光到底是服务端下发、客户端渲染，还是用户可见曝光，口径不同 CTR 会差很多。第二是去重，同一个 item 在同一 session 多次展示要区分首次曝光、重复曝光和刷新。第三是延迟和丢数，客户端日志可能延迟上报或丢失，需要监控曝光点击匹配率。第四是实验归因，必须记录策略版本和实验桶，避免把自然流量、运营位或缓存结果混进推荐模型效果。最后用这些日志计算 CTR、有效点击率、阅读完成率、转化率、负反馈率、分位置收益和分人群收益，再结合 A/B 判断推荐策略是否真实提升。

考点 曝光是分母

难度 真实面经题

回答目标 让面试官看到你能从埋点字段、日志关联、口径治理和实验归因四层评估推荐效果。

深入解析

曝光日志是分母

曝光 log 要说明系统给用户展示了什么、在哪个场景展示、处于什么位置、来自哪个策略和实验组。没有准确曝光，就无法计算 CTR，也无法判断未点击是用户不感兴趣还是根本没看到。

点击日志是反馈

点击 log 要记录用户对某次曝光的行为反馈，包括点击、停留、阅读、转化和负反馈。它必须能和曝光 log 关联，否则点击只能说明发生过行为，不能说明是哪套推荐策略带来的。

链路字段要能归因

requestId、sessionId、itemId、position、strategyId、modelVersion、experimentBucket 和 timestamp 是关键字段。它们把一次推荐请求、展示结果和用户行为连成可分析链路。

曝光口径要统一

服务端下发、客户端渲染、进入可视区域和停留超过阈值都可以叫曝光，但业务含义不同。评估前必须统一口径，并监控不同端和版本的埋点差异。

用日志支撑实验

推荐效果不能只看全站点击上升。要按实验组、场景、位置、人群、新老用户和内容类型分层，确认指标变化来自推荐策略，而不是流量结构或运营资源变化。

易错点

只列点击日志字段，不说明曝光日志是指标分母和归因基础。
没有 requestId 或 traceId，导致点击无法关联到具体曝光。
混用服务端下发曝光和客户端可见曝光，造成 CTR 口径混乱。
忽略 position bias，把高位置点击率误认为模型效果好。
不记录实验桶和策略版本，导致 A/B 结果无法解释。

面试官追问

曝光 log 只记 itemId 和 userId 够吗？

不够。缺少 requestId、位置、场景、策略版本和实验桶时，无法判断该 item 为什么被展示、展示在什么位置，也无法把点击归因到具体推荐策略。

为什么要记录 position？

位置会显著影响点击率。第一位天然更容易被点击，如果不控制位置，就会把位置优势误判为模型效果。

如何发现埋点有问题？

看曝光点击匹配率、端上和服务端数量差、不同版本突变、同一 request 的重复曝光、点击无曝光比例和日志上报延迟分布。

推荐评估是否只看 CTR？

不能。CTR 只是入口指标，还要看有效阅读、停留、转化、负反馈、留存、多样性和长期体验，避免推荐标题党或短期刺激内容。