推荐排序阶段通常使用哪些特征，如何划分用户、物品、上下文和交叉特征并保证线上线下一致？｜百度算法面经解析

60 秒回答模板

排序阶段要在召回候选中做精细比较，所以特征比召回更丰富。常见分为用户特征、物品特征、上下文特征和交叉特征。用户特征包括长期画像、短期兴趣、历史点击/购买/停留、活跃度、价格和类目偏好；物品特征包括类目、品牌、文本/图片 embedding、价格、质量、热度、新鲜度、库存和历史 CTR/CVR；上下文包括时间、地点、设备、入口、页面位置和场景；交叉特征表达用户与候选的匹配，如用户类目偏好和物品类目、最近点击序列与候选 embedding 相似度、地理距离和历史同品牌行为。线上线下一致要靠统一特征定义、时间窗口、缺失处理、归一化、版本和日志回放。

考点 排序更重交叉

难度 真实面经题

回答目标 让候选人展示推荐排序特征分类、交叉匹配、时间截断和训练服务一致性的完整理解。

深入解析

用户特征

长期画像体现稳定偏好，短期序列表达当前意图。常见字段有城市、设备、会员、活跃度、历史点击/购买/停留、负反馈、价格偏好、类目偏好、品牌偏好和最近 session 行为。

物品特征

物品侧包括 ID、类目、品牌、标题、文本/图片 embedding、价格、质量分、热度、新鲜度、库存、商家、历史 CTR/CVR、内容安全状态和可售状态。它们既服务相关性，也服务风险过滤和供给质量。

上下文特征

同一用户在不同时间、地点、设备、入口、网络和页面位置下意图会变化。上下文特征帮助模型理解通勤、夜间、节假日、首页、搜索页和活动页等场景差异。

交叉特征

排序的个性化强度往往来自交叉：用户类目偏好与 item 类目、用户价格带与商品价格、用户最近行为序列与候选向量相似度、用户地理位置与门店距离、历史是否购买过同品牌。

一致性保障

统计特征要严格按时间截断，不能用未来曝光或转化。离线训练和线上 serving 要共享特征定义，保证默认值、hash、分桶、归一化、窗口和版本一致。用日志回放比较同一请求的线上/离线特征值。

监控与评估

离线看 AUC、GAUC、LogLoss、NDCG 和校准度；线上看 CTR、CVR、GMV、停留、复购、留存、负反馈和延迟。特征侧要监控覆盖率、缺失率、分布漂移和训练服务 diff。

易错点

只枚举用户、物品、上下文字段，不讲交叉特征和一致性。
离线训练用全量统计，线上只能拿历史统计，造成时间穿越。
缺失值和归一化规则线上线下不同。
盲目堆交叉特征，造成稀疏、过拟合和线上延迟上升。
只看 AUC，不看 GAUC、校准、分桶效果和线上业务指标。

面试官追问

为什么推荐排序常用 GAUC？

全局 AUC 容易被活跃用户或样本多的用户支配。GAUC 按用户或请求分组后加权，更能衡量每个用户内部候选排序是否正确，和个性化排序目标更一致。

如何发现特征穿越？

检查特征生成时间是否早于样本曝光时间，做 point-in-time join 审计，用日志回放复算线上请求特征，并关注离线指标异常高、线上显著回退、特征重要性异常等信号。

新特征上线前如何评估？

先看覆盖率、稳定性、分布、单特征分桶效果和离线增益，再做 shadow/canary 验证延迟和缺失，最后 A/B 看业务指标。低覆盖或高成本特征即使离线有小增益也要谨慎。

实时特征和离线特征如何选择？

强短期意图和即时状态用实时或近线，稳定画像和长期统计用离线。实时特征更贵也更不稳定，要有缺失指示、TTL 和降级；离线特征稳定但可能不够新鲜。