真实面经题目 · 原创解析
美团外卖用 AI 优化配送路径时,产品经理如何设计实验来比较不同算法对履约效率、成本、稳定性和用户体验的影响?
这题考 AI 路径优化实验设计能力。回答重点是先做离线回放和仿真,再做受控线上实验;指标要同时覆盖履约效率、配送成本、稳定性、骑手与用户体验,并处理调度网络中的干扰效应和安全护栏。
真实面经题目 · 原创解析
这题考 AI 路径优化实验设计能力。回答重点是先做离线回放和仿真,再做受控线上实验;指标要同时覆盖履约效率、配送成本、稳定性、骑手与用户体验,并处理调度网络中的干扰效应和安全护栏。
我会把配送路径优化实验分成离线验证、仿真验证和线上灰度三层。配送不是普通页面点击实验,一个算法的调度结果会影响骑手、商家、用户、周边订单和后续运力状态,所以不能直接把所有流量随机拆给不同算法。上线前要先用历史订单回放和仿真环境比较算法在不同城市、商圈、天气、峰谷时段、订单密度和骑手供给下的表现,过滤掉明显不稳定或高风险的方案。 实验目标上,我不会只看平均配送时长。主指标可以是准时率、履约时长、ETA 误差、超时率、订单完成率和路径合理性;成本指标包括骑手行驶距离、空驶率、补贴成本、重派率、取消率和单位订单履约成本;稳定性指标包括 P95/P99 时长、极端天气表现、算法超时、回滚次数和异常路径比例;体验指标要看用户等待、投诉、商家等待、骑手接单意愿、骑手收入稳定性和安全相关反馈。 线上实验设计上,我会优先采用城市/商圈分层、小流量灰度、switchback 交替实验或骑手/区域簇随机,而不是简单按用户随机。原因是配送算法有明显网络效应,同一个骑手和同一片区域的订单会互相影响。实验要提前定义分层、样本量、运行周期、峰谷覆盖、节假日和天气控制,并保持算法之外的补贴、派单规则、商家策略尽量一致。 决策上,我会设置硬护栏和停止条件。只要安全投诉、严重超时、取消率、骑手异常反馈或系统失败率超过阈值,就立即暂停或回滚。实验结束后不只看整体均值,还要看分城市、分商圈、分天气、分订单类型、分新老骑手的效果,避免算法在整体上好看但伤害某些高风险场景。
不同路径算法可能优化的目标不同,有的缩短配送距离,有的提升准时率,有的降低骑手空驶,有的增强峰值稳定性。产品经理要先把算法差异翻译成业务假设:它会影响哪类订单、哪类商圈、哪个履约环节,以及可能牺牲什么指标。
配送场景风险高,不能只靠线上试错。离线阶段用历史订单回放比较路径长度、预计时长、超时风险和异常路径;仿真阶段加入订单涌入、骑手位置、商家出餐、天气和交通扰动;线上阶段再从低风险城市或小区域灰度,逐步扩大。
配送路径优化存在强干扰效应,一个订单的路径会影响同一骑手后续订单和周边运力。简单按用户或订单随机会污染实验。更合理的是按商圈、站点、骑手簇、时间窗口做分组,或用 switchback 交替实验,让同一区域在不同时间使用不同算法。
主指标包括准时率、履约时长、ETA 误差、超时率和订单完成率;成本看单位履约成本、空驶、重派、补贴和取消;体验看用户等待、投诉、商家等待、骑手接单、收入波动和安全反馈。配送是多边系统,不能只优化用户侧等待时间。
一个算法可能在高密度商圈有效,在低密度区域反而变差;可能在晴天有效,在雨雪天气不稳定;可能对短距离单有效,对多单合并伤害大。实验要按城市、区域、峰谷、天气、订单类型、骑手经验和商家出餐稳定性分层看。
路径算法会直接影响履约和安全,必须设置实时监控、异常报警和自动回滚。护栏包括严重超时、取消率、投诉率、异常路线、算法响应超时、骑手拒单、事故相关反馈和系统降级成功率。达到阈值时要停止扩量,而不是等实验周期结束。
因为同一骑手的多个订单、同一区域的运力和后续派单会互相影响。一个订单被新算法改变路径后,可能影响下一单接单位置和周边订单等待,导致实验组和对照组相互污染。
这说明算法可能把成本转嫁给骑手或改变了接单结构。需要看收入下降是否来自距离增加、等待增加、补贴变化或订单分配不均。如果骑手体验明显受损,即使用户侧指标提升,也不能直接全量。
可以把极端天气作为关键分层单独观察,结合历史回放和仿真补充验证。线上不应因为样本少就忽略它,因为极端天气恰恰是履约风险最高的场景。必要时对极端天气采用保守策略或单独算法。
不一定。配送体验很依赖稳定性,P95 变差可能意味着少部分用户或区域被严重伤害。要看长尾问题集中在哪些场景,以及是否能通过分层策略规避。如果无法规避,不能只因平均值好就上线。