如何实现给用户推荐音乐的功能，需要哪些特征和算法？｜百度算法面经解析

60 秒回答模板

我会把音乐推荐拆成数据、特征、模型和评估。特征上，用户侧有历史播放、收藏、跳过、搜索、歌单、偏好标签和实时行为；音乐侧有歌手、曲风、语言、节奏、音频 embedding、歌词语义和热度；上下文有时间、场景、设备和地理位置。算法上多路召回可用协同过滤、相似歌曲、内容向量和热门召回，排序模型预测点击、完播、收藏和长期满意度，重排处理多样性、去重和冷启动。

考点 特征三类

难度 真实面经题

回答目标 讲清方法、取舍和追问

深入解析

先定义推荐目标

音乐推荐不只是点击率，通常还要看播放完成、收藏、加入歌单、重复收听、跳过率、长期留存和用户满意度。目标不同，样本和排序权重也不同。

用户特征看兴趣变化

用户侧要记录长期偏好和短期意图，包含播放历史、收藏、跳过、搜索、歌单、关注歌手、听歌时段和最近行为。短期兴趣能反映当前场景，长期兴趣保持稳定口味。

音乐特征看内容理解

歌曲侧可以用歌手、专辑、语言、曲风、节奏、年代、歌词、音频特征、情绪标签、相似歌曲 embedding 和热度。冷启动时内容特征尤其重要。

模型链路分层处理

召回阶段从海量曲库中取候选，粗排控制成本，精排做多目标预测，重排再处理重复歌手、曲风多样性、探索、冷门歌曲曝光和业务规则。

反馈闭环持续迭代

曝光、播放、跳过、收藏、分享和负反馈都要回流样本。还要处理位置偏差、热门偏差和马太效应，避免系统长期只推荐头部歌曲。

易错点

不要只回答协同过滤，要覆盖特征、召回、排序、重排和评估。
不要忽略跳过、负反馈和长期满意度。
不要把热门推荐当作唯一兜底，长期会放大马太效应。

面试官追问

新歌没有行为数据怎么办？

用歌曲内容特征、歌手先验、相似歌曲、编辑标签和小流量探索做冷启动。

如何避免一直推荐相似歌曲？

重排阶段加入多样性、频控、探索和负反馈规则，同时控制同歌手、同曲风的连续曝光。

完播率和点击率冲突怎么办？

做多目标排序，按业务目标设置权重，并在线观察长期留存和满意度而不是单点指标。