真实面经题目 · 原创解析
出行派单中,如何建模乘客对“顺路”的感知,并构造训练数据?
这道题考察出行派单里如何把“地理上看似顺路”转成“乘客主观感知也顺路”的可训练问题。高质量回答要讲清建模目标、弱监督标签、规则样本、特征设计、偏差处理、评估指标和线上体验护栏,而不是只回答最短路或 ETA。
真实面经题目 · 原创解析
这道题考察出行派单里如何把“地理上看似顺路”转成“乘客主观感知也顺路”的可训练问题。高质量回答要讲清建模目标、弱监督标签、规则样本、特征设计、偏差处理、评估指标和线上体验护栏,而不是只回答最短路或 ETA。
我会先把“顺路”定义成乘客感知到的额外成本是否可接受,而不只是导航距离更短。建模目标可以是预测某个派单或路线方案的“感知不顺路风险”,标签来自显式反馈、取消、投诉、差评、乘后评价、客服原因和少量人工复核;强标签不足时,用绕行率、额外时长、方向夹角、路径重合度、反向行驶、偏离主路、接送顺序变化等规则生成弱监督样本,并保留不确定样本不强行标注。特征上要同时看几何路线、时间成本、乘客历史容忍度、订单场景、天气高峰和价格/等待等上下文。模型可以从规则分层和可解释分类/排序模型做起,输出顺路感知分或不顺路风险,并做概率校准。评估不能只看 AUC,还要看校准、规则命中样本表现、取消率、投诉率、差评率、接受率、完单率和司机/平台效率。上线时要有硬规则拦截、阈值灰度、异常回退和 A/B 监控,宁可少放行一部分边界方案,也不要为了派单效率牺牲乘客体验。
“顺路”不是单纯的最短路或 ETA 最小,而是乘客是否觉得这次路线、接送顺序和额外时间在心理上可接受。同样多 3 分钟,在通勤高峰、赶车、雨天、反向绕行、先靠近目的地又远离目的地等场景下,乘客感知会完全不同。面试里先把目标定义成“感知不顺路风险”或“顺路接受概率”,后面的标签和特征才有统一口径。
强标签可以来自用户明确反馈,例如乘后评价、投诉、客服原因、取消原因、路线不满、少量人工审核样本。隐式标签可以用取消、提前终止、差评、重复改派、订单接受后放弃等行为近似,但这些信号有噪声,不能直接等同于“不顺路”。强标签少时,用规则生成弱标签,并给每个样本保留置信度或标签来源,避免把所有样本当成同等质量。
可用规则包括:相对直达路线的额外时长、额外距离、绕行率、起终点方向夹角、路径重合度、是否出现明显反向行驶、是否多次远离目的地、接送顺序是否让乘客先接近又远离目的地、实际路线和承诺路线差异。规则阈值不要说成固定事实,应作为业务可调参数。更稳妥的做法是多条规则一致时打高置信标签,规则冲突或边界样本进入人工复核或训练时降低权重。
几何特征看距离增量、方向一致性、路径重合、转弯和绕行形态;时间特征看额外预计耗时、等待、迟到风险、峰谷时段和天气活动;用户特征看历史取消、投诉、对绕行的容忍度、是否经常在类似场景接受方案;订单特征看起终点类型、行程长度、价格补偿、服务类型和司机接驾状态。回答时要强调这些是通用候选特征,不是某家公司内部字段。
训练数据只来自被展示、被派出或被用户接受过的方案,会有选择偏差;取消和投诉又受价格、等待、司机服务、天气等因素影响。可以先用规则基线和可解释模型验证方向,再训练分类、排序或多任务模型预测不顺路风险,并通过时间切分、城市/区域切片和概率校准检查泛化。若有展示日志和策略概率,可以做 propensity 加权或分桶对比,减少只学习历史策略偏好的问题。
离线看 AUC、PR-AUC、校准误差、规则高置信样本召回、不同城市/时段/长短途切片表现;在线看取消率、投诉率、差评率、接受率、完单率、乘客等待、司机空驶和平台效率。上线不应只追求派单成功率,还要设置硬规则拦截、风险阈值、灰度流量、异常监控和回退策略。边界方案可以进入人工抽检或小流量探索,明显不顺路的方案应直接拦截。
先用高置信业务规则构造弱标签,例如额外时长过高、明显反向、路径重合度过低作为不顺路候选;用直达增量很小、方向一致、历史反馈稳定的样本作为顺路候选。再抽取规则冲突和边界样本做少量人工复核,用来校准规则和模型。
不能直接等同。取消和投诉可能来自等待太久、价格变化、司机服务、天气或用户临时改变计划。可以把它们作为弱标签或辅助任务,并结合路线增量、方向、反馈原因和上下文过滤,必要时给低置信度。
训练集按时间切分,保留展示/派单日志,记录候选是否被展示和用户是否有反馈。若有策略概率可做 propensity 加权;没有时至少按城市、时段、距离段和策略版本切片验证,并用规则高置信样本做稳定性检查。
说明目标或阈值没有把体验约束放够。应先回滚或收紧高风险阈值,按绕行率、额外时长、接送顺序、区域和人群切片定位问题,再把投诉/差评约束纳入排序目标或硬规则,不能只用成交率覆盖体验损失。