真实面经题目 · 原创解析
当模型出现 bad case 时,如何分析并改进?
模型 bad case 分析要先复现和分层定位,再判断是数据、特征、标签、模型、阈值还是业务分布问题,最后用可验证实验闭环改进。
出现于:拼多多 · 算法
真实面经题目 · 原创解析
模型 bad case 分析要先复现和分层定位,再判断是数据、特征、标签、模型、阈值还是业务分布问题,最后用可验证实验闭环改进。
我会先收集 bad case 并按业务场景、类别、用户、时间、设备、样本难度分层,确认是不是集中在某些切片。然后检查数据和标签是否有噪声,特征是否缺失或穿越,训练和线上特征是否一致,模型是否欠拟合或过拟合,阈值和后处理是否合适。改进可以从补数据、清洗标签、加特征、调模型、改损失、调阈值和重排规则入手,最后通过离线指标和线上 A/B 验证。
bad case 不是泛泛说模型错了,要明确错误类型、业务影响和样本范围,例如误召、漏召、排序错位、分类错误或生成结果不符合预期。定义越清楚,后续定位才不会发散。
按类别、场景、用户群、时间、设备、地域、长尾样本和模型置信度分桶,找出错误是否集中在某些切片,避免被整体指标平均掉。
常见根因包括标签噪声、样本偏差、数据泄漏、特征缺失、离在线不一致、训练数据过旧和线上分布变化。先排这些比盲目换模型更有效。
如果数据特征没问题,再看模型容量、损失函数、类别不平衡、阈值、校准、后处理和业务规则是否导致错误集中出现。
每个改进都要能被验证,例如补充困难样本、重采样、加特征、调阈值、模型蒸馏或规则兜底。离线通过后还要线上灰度和 A/B 实验,确认不是只修好了少数样本却伤害整体表现。
可以用规则兜底、人工审核、高风险阈值和专门困难样本集评估,而不是只看平均指标。
先看标签、特征缺失、分布差异和离在线一致性;若数据可靠,再做模型容量、损失和阈值实验。
建立错误类型 taxonomy、样本库、切片指标和回归评测集,让后续模型迭代持续检查同类问题。