推荐召回中，为什么可能不用 UserCF，ItemCF 又该如何结合热度信号？｜哔哩哔哩算法面经解析

60 秒回答模板

我会先说明不用 UserCF 的原因不一定是算法不行，而是大规模内容推荐里 user-user 相似度往往不稳定、稀疏且成本高。用户兴趣变化快，一个用户的历史行为可能少且噪声大，计算相似用户需要维护巨大的用户相似图，实时更新和在线召回都比较重。ItemCF 更适合召回，因为 item 的共现关系相对稳定，可以离线根据用户行为序列计算 `sim(i,j)`，比如共现次数除以物品热度归一化，再从用户最近交互 item 扩展相似 item。热度信号可以作为补充，但不能粗暴把热门内容分数加上去，否则会让热门越来越热、长尾被压制。可以用 `score(u,j)=Σ sim(i,j)*w(u,i)*time_decay + α*personalized_heat(j)`，其中 heat 做 log 平滑、时间衰减、类目内归一化，并按用户新颖性偏好、内容生命周期和召回通道配额调权。验证时离线看 Recall@K、覆盖率、热门占比、多样性和新鲜度，线上看 CTR、完播/时长、留存、负反馈、长尾曝光和内容生态。

考点 不用 UserCF 可能是因为用户相似度稀疏、不...

难度 真实面经题

回答目标 让候选人能讲清 UserCF 与 ItemCF 在召回层的工程取舍，并给出 ItemCF 融合热度信号的可落地方案、偏置控制和验证指标。

深入解析

为什么可能不用 UserCF：用户相似度不稳定且成本高

UserCF 依赖用户之间的行为相似性，但在内容平台中用户数巨大、行为矩阵极稀疏，很多用户历史短、兴趣变化快、噪声行为多。两个用户今天相似，不代表明天仍相似；新用户和低活用户也很难找到可靠邻居。工程上维护 user-user 相似矩阵成本高，在线根据相似用户扩展候选也可能带来延迟和存储压力。相比之下，item 数量通常小于用户数或至少 item 共现关系更稳定，离线预计算 item-item 相似更容易服务化。

ItemCF 的召回逻辑：从用户历史 item 扩展相似内容

ItemCF 的核心是计算物品之间的协同相似：如果很多用户在相近时间内共同消费了 item i 和 item j，那么 i 与 j 可能相似。常见做法是遍历用户行为序列，统计共现矩阵 `co(i,j)`，再用热度归一化得到 `sim(i,j)=co(i,j)/sqrt(cnt(i)*cnt(j))` 或改进版惩罚超活跃用户、加入时间间隔衰减。在线召回时取用户最近或高权重行为 item，查相似 item 列表并累加分数，得到候选集。它的优势是召回快、可解释、可离线构建、适合补充个性化候选。

UserCF 仍有适用场景：不是绝对不能用

UserCF 在用户规模较小、行为密度高、社交关系强、兴趣稳定或需要人群相似解释的场景仍有价值。例如社区、小型垂直内容、企业推荐或强社交平台中，相似用户群可能很稳定。面试回答不能说 UserCF 一无是处，而要说明在大规模视频/内容推荐召回里，基于 item 的关系通常更稳定、成本更低；UserCF 可以作为补充通道、人群扩展或冷启动策略，但不一定作为主召回。

热度信号的价值：解决冷启动、趋势和质量先验

热度信号反映内容的全局或局部受欢迎程度，例如曝光、点击、播放、完播、点赞、投币/收藏、评论、分享、转化、增长速度和发布时间。它能补足 ItemCF 的不足：新内容共现少时可以靠趋势热度进入候选；质量高的热门内容可以提升召回稳定性；热点事件需要快速响应。但热度既可能代表质量，也可能代表曝光偏置，所以必须区分真实受欢迎和被系统推高。

融合方式：热度可以做分数、特征、通道或约束

ItemCF 与热度融合有几种方式。第一是分数融合：`score(u,j)=Σ_{i in history} sim(i,j)*w(u,i)*decay(i) + α*heat(j)`；第二是把 heat 作为 rerank/排序特征，而不是召回分直接相加；第三是单独做热门/趋势召回通道，再通过多路召回配额和融合层控制比例；第四是用热度做过滤和探索，例如新热视频保底曝光。实际工程中更推荐把热度做平滑、分桶和类目内归一化，再根据用户兴趣和内容生命周期动态调权。

防止热门偏置：平滑、去偏、衰减和多样性

如果直接把播放量或点击量加到 ItemCF 分数上，热门内容会不断获得更多曝光，形成马太效应，长尾和新内容被压制。可以使用 `log(1+heat)`、分位数归一化、类目内归一化、时间衰减、曝光去偏、Wilson score、贝叶斯平滑等方式降低头部内容统治力。还可以对历史热门和近期趋势分开建模，对用户设置新颖性/热门偏好权重，在融合层控制热门通道比例，并在 rerank 中加入多样性和重复惩罚。

实时性：热度和 ItemCF 的更新频率不同

ItemCF 相似矩阵通常离线或近实时更新，因为共现统计需要一定行为量，频繁全量更新成本高。热度信号则更适合实时或分钟级更新，尤其是内容平台热点变化快。工程上可以用离线 ItemCF 相似表提供稳定个性化候选，用实时热度服务提供趋势特征或补充通道。融合时要注意时间穿越和反馈循环：热度必须基于推荐前可见数据，不能把未来点击用于训练或评估。

验证指标：效果、生态和偏置同时评估

离线看 Recall@K、HitRate、NDCG、覆盖率、去重后有效候选、热门占比、长尾覆盖、新内容覆盖和类目多样性；线上看 CTR、播放时长、完播率、互动率、留存、负反馈、重复曝光、内容消费多样性和创作者生态。还要分用户类型评估：新用户、老用户、重度用户、兴趣窄用户、追热点用户对热度权重的最优值可能不同。若整体 CTR 提升但长尾曝光大幅下降或负反馈上升，说明热度融合过强。

易错点

简单说 UserCF 过时或没用，而不解释用户稀疏、稳定性和工程成本。
把 ItemCF 相似度说成只看共同点击次数，不做热度归一化和活跃用户惩罚。
直接把播放量、点击量加到召回分，导致热门内容马太效应。
只追求 CTR，不看多样性、长尾覆盖、新内容曝光和用户负反馈。
忽略实时热度和离线 ItemCF 更新频率不同，导致热点响应慢或时间穿越。
把热度当成质量的等价物，忽略曝光偏置和运营推流影响。
所有用户使用同一个热度权重，忽略用户对新颖性、热门内容和垂类兴趣的差异。

面试官追问

ItemCF 为什么也会有热门偏置？

热门 item 会和大量 item 共现，天然出现在很多相似列表里。如果相似度归一化不充分，或者在线召回再叠加热度分，热门内容会被反复召回。需要用物品热度归一化、活跃用户惩罚、时间窗口、类目归一化和 rerank 多样性控制来缓解。

新 item 没有共现，ItemCF 怎么召回？

新 item 是 ItemCF 的弱点。可以用热门/新内容召回、内容向量召回、标签/类目召回、作者召回、探索流量和实时趋势信号补充。等新 item 积累行为后再进入 ItemCF 相似矩阵。热度信号在这里更像冷启动和趋势补充，而不是替代个性化。

热度应该用全局热度还是个性化热度？

全局热度简单稳定，但容易推所有人都在看的内容；个性化热度更好，例如类目内热度、兴趣圈层热度、地域/时间热度、关注作者热度。实践中可以把热度分成全局、类目、实时趋势和用户兴趣内热度，再由模型或规则按场景加权。

UserCF 可以作为召回补充吗？

可以，尤其在用户行为密度高或存在稳定兴趣群的场景。它可以作为一条补充召回通道，用配额控制成本和风险。但如果用户规模巨大、行为稀疏、兴趣变化快，UserCF 主通道的稳定性和工程成本通常不如 ItemCF 或向量召回。

如何判断热度融合过强？

可以看热门 item 曝光占比、长尾覆盖、新内容覆盖、类目多样性、重复曝光、用户负反馈和分用户组效果。如果 CTR 小幅上涨但完播、留存或多样性下降，或者所有用户候选高度相似，说明热度权重可能过强。还可以做不同 α 的在线剂量实验。