真实面经题目 · 原创解析
面对羊毛党,推荐模块应如何识别风险、调整排序策略并兼顾平台转化和正常用户体验?
这题考的是数据分析师能否把羊毛党问题放到推荐系统里处理:既识别风险和控制补贴损失,也避免误伤正常用户和损害推荐体验。
真实面经题目 · 原创解析
这题考的是数据分析师能否把羊毛党问题放到推荐系统里处理:既识别风险和控制补贴损失,也避免误伤正常用户和损害推荐体验。
面对羊毛党,推荐模块不能简单一刀切屏蔽,也不能继续按短期转化率给高风险用户推高补贴商品。我会先做风险识别,把用户、设备、支付、地址、优惠券使用、退货售后、异常频次、低留存和多账号关联等信号汇总成风险分层;再把推荐目标从单纯点击转化改成风险调整后的价值,例如预期成交收益减去补贴、退款、套利和风控成本。策略上,对高风险用户减少高补贴、易套利、库存敏感商品的曝光,增加低风险或低套利空间商品,必要时触发限频、验证、优惠资格校验或人工审核;对正常价格敏感用户则不能误伤,应保留合理优惠和探索。指标上同时看风险订单率、补贴损耗、GMV、利润、正常用户转化、误伤率、投诉、留存和策略迁移。核心是把风控信号变成推荐排序和资源分配的约束,而不是把风控当成推荐之外的事。
羊毛党通常指以套利为主要目的、利用优惠、补贴、规则漏洞或多账号手段获取利益的人群。正常价格敏感用户也会关注优惠,但他们有真实消费需求和长期价值。推荐策略不能把所有爱用优惠的人都当成风险用户,否则会误伤大量正常用户,损害转化和口碑。
可用信号包括账号年龄、设备和环境异常、登录支付地址关系、优惠券领取和使用频率、极低价商品偏好、异常下单时间、批量行为、退款售后率、收货地址集中度、支付失败或取消模式、活动期突增行为、低复购和低留存等。单个信号容易误判,应该通过规则、模型和人工反馈形成风险分层。
传统推荐可能按点击率、转化率或 GMV 排序,但面对羊毛党时要把风险成本纳入目标函数。例如排序分可以从预期转化价值中扣除补贴成本、退款概率、套利概率和风控成本。这样高点击高转化但高风险的商品或人群,不会因为短期数据好看而获得更多推荐资源。
低风险用户保持正常推荐;中风险用户可以降低高补贴商品曝光、控制优惠券触达频次、增加真实需求相关商品;高风险用户可限制活动商品、提高验证门槛、减少推荐资源或触发风控审核。分级策略比一刀切更稳,因为它能在降低损耗的同时保留正常交易机会。
风控系统提供风险标签、风险分、规则命中和处置结果,推荐系统提供曝光、点击、下单、支付、退款和后续行为。两边要打通样本回流,避免推荐继续给高风险用户分配高价值补贴,也避免风控标签过期后长期压制已经恢复正常的用户。
不能只看风险订单下降,因为强限制一定能让风险下降,但可能牺牲正常 GMV。应该同时看风险订单率、补贴损耗、套利识别率、正常用户转化率、误伤率、投诉率、留存、复购、商家影响和策略迁移。尤其要关注被限制用户中是否存在高价值正常用户。
羊毛党会根据规则改变行为,例如换设备、换账号、换商品、换时间段。策略上线后还会改变样本分布,导致模型只看到被拦截后的行为。数据分析要持续监控新模式、分层抽检、灰度实验和规则效果衰减,不能认为一次策略就能永久解决。
因为识别有误差,一刀切会误伤正常价格敏感用户,也可能造成投诉和转化损失。更合理的是风险分层和资源降权,对高风险场景加强限制,对低风险用户保留正常体验。
可以把预估点击、转化和成交价值作为收益项,再扣除补贴成本、退款概率、套利风险、售后成本和风控成本。排序不只看成交概率,而看净价值和风险。
看被限制人群中的历史正常消费、复购、投诉、客服反馈、后续留存和人工抽检结果,也可以设置小流量对照观察限制前后的正常转化损失。
先区分下降来自风险订单减少还是正常订单受损。如果主要减少低质量风险 GMV,可能是合理结果;如果正常用户转化下降,就要调整风险阈值、干预强度或商品策略。
风控侧负责识别风险、给出风险分和处置建议;推荐侧负责在召回、排序、重排和资源分配中使用这些信号,并观察用户体验和交易指标变化。