60 秒回答模板

我会先明确场景目标,比如首页推荐、搜索排序、视频质量评估、冷启动或创作者成长,不同目标对应不同标签和特征。候选特征可以从用户、视频、UP主、上下文、交互行为和多模态内容中来;筛选方法包括业务先验、缺失率和稳定性检查、相关性/互信息/卡方过滤、L1 正则、树模型重要性、SHAP、Permutation importance、特征消融、线上 A/B 和成本评估。最后要防止标签泄漏、训练服务不一致、热门偏置和过高特征延迟。

考点 目标先行
难度 真实面经题
回答目标 讲清方法、取舍和追问

深入解析

01

先定义业务目标

B站视频场景可能优化点击、播放时长、完播、点赞投币收藏、关注、负反馈、长期留存或内容生态健康。目标不同,特征价值不同;例如首页推荐更重序列兴趣,冷启动更重内容和 UP主先验。

02

构建候选特征池

候选特征可分为用户特征、视频特征、UP主特征、上下文特征和交叉特征。视频侧包括分区、标签、标题、封面、时长、发布时间、质量分、互动率、ASR/OCR、音频和视觉 embedding。

03

做统计过滤

基础筛选要看缺失率、覆盖率、取值稳定性、唯一值数量、分布漂移、相关性、互信息、卡方和 PSI。低覆盖、高漂移或训练线上口径不一致的特征,即使离线有收益也要谨慎。

04

用模型评估贡献

可以用 L1 正则、GBDT/XGBoost 特征重要性、Permutation importance、SHAP、深度模型 gate 权重和特征消融评估贡献。更可靠的是按特征组逐步加入,观察验证集和关键切片收益。

05

用线上结果收口

最终是否保留特征要看线上 A/B、延迟、存储、稳定性、可解释性和维护成本。某些特征离线提升很高,但如果引入标签泄漏、热门偏置或服务延迟,就不适合上线。

易错点

  • 不要只按相关性选特征,相关性可能来自热门偏置、曝光偏差或标签泄漏。
  • 不要忽略训练服务一致性,离线可算但线上拿不到的特征不能直接上线。
  • 不要把所有互动特征都用于冷启动,新视频可能没有稳定行为反馈。
  • 不要只看整体指标,B站视频业务要分新老用户、长短视频、分区和长尾内容评估。

面试官追问

冷启动视频优先选哪些特征?

优先用标题、分区、标签、封面、ASR/OCR、多模态 embedding、UP主历史质量和发布时间等不依赖大量互动的特征。

离线重要但线上无效怎么办?

要排查标签泄漏、样本偏差、训练服务口径不一致、特征延迟、流量切片差异和重排策略覆盖,再决定修复还是下线。

如何评估多模态 embedding 是否值得用?

看离线指标、冷启动和长尾切片收益、召回覆盖、线上 A/B、推理成本、更新周期和与已有文本行为特征的互补性。