真实面经题目 · 原创解析
目前主流的视频推荐和音乐推荐算法有哪些?
视频和音乐推荐常用算法可以按召回、排序和重排来回答:协同过滤、内容理解、向量召回、深度排序、多目标排序和多样性控制共同组成链路。
出现于:百度 · 算法
真实面经题目 · 原创解析
视频和音乐推荐常用算法可以按召回、排序和重排来回答:协同过滤、内容理解、向量召回、深度排序、多目标排序和多样性控制共同组成链路。
主流推荐算法不是单一模型。召回层常见有热门召回、协同过滤、ItemCF/UserCF、内容向量召回、双塔召回、图召回和规则召回;排序层会用 LR、GBDT、Wide&Deep、DeepFM、DIN/DIEN、双塔或多任务模型预测点击、完播、收藏和转化;重排层处理多样性、去重、频控、探索和冷启动。视频更重视时长、完播、画面和作者,音乐更重视歌手、曲风、音频、歌词和听歌场景。
推荐系统一般分召回、粗排、精排、重排,不同层的算法目标不同。召回追求覆盖和速度,精排追求效果,重排负责体验和业务约束。
常见召回包括热门召回、协同过滤、相似 item、用户兴趣标签、双塔向量召回、图召回和内容召回。视频和音乐都需要多路召回避免单一通道偏置。
排序层会结合用户、内容、上下文和交叉特征,预测点击、完播、停留、收藏、分享、转化等目标。深度模型适合学习复杂交叉,但要受延迟预算约束。
视频推荐会看画面、标题、作者、标签、时长、互动和完播;音乐推荐会看歌手、曲风、歌词、音频 embedding、情绪、节奏和听歌场景。
最终列表还要做多样性、去重、频控、探索、冷启动和内容安全。否则模型可能持续推荐相似内容,造成审美疲劳或马太效应。
ItemCF 依赖行为共现,双塔通过向量学习用户和物料表示,更容易融合内容特征和泛化到长尾。
点击只能说明入口吸引,完播和停留更能反映内容消费质量,但也要避免偏向短视频或低价值内容。
可用歌手、曲风、歌词、音频特征、热门兜底和小流量探索为新歌建立初始曝光。