标签题目
样本不平衡相关面试题
如何用 XGBoost 处理不平衡分类问题?
用 XGBoost 处理不平衡分类,要同时调整训练目标、样本权重、采样策略、评估指标和阈值。面试回答不能只说调 `scale_pos_weight`,还要说明为什么 accuracy 不可靠,以及如何用 PR-AUC、Recall、F1 和业务成本验证。
在样本不平衡问题中,除了修正数据集,还能有哪些方法?
样本不平衡除了修正数据集,还可以从损失函数、样本权重、阈值移动、指标选择、模型集成、概率校准和业务决策成本入手。回答要说明不同方法解决的是训练偏差、预测阈值还是评估偏差。
同题还出现在 1 个公司岗位
SMOTE 数据扩增算法的原理是什么?
SMOTE 是处理类别不平衡的过采样方法,它在少数类样本和近邻之间插值生成新样本,而不是简单复制少数类样本。
重采样和欠采样会带来什么问题?
重采样和欠采样能缓解类别不平衡,但会改变训练分布,引入信息损失、过拟合、概率校准偏差和评估口径问题。
风控评分卡建模从样本、分箱到评估监控的流程是什么?
这道题考察风控评分卡的端到端建模能力。回答要覆盖样本定义、时间切分、缺失和异常处理、分箱与 WOE、可解释模型、评分映射、AUC/KS/校准/PSI 评估,以及上线后的稳定性监控。
ReID 训练采样时如何保证每个身份的图像数一致,为什么这种 P-K 采样有利于度量学习?
这题考的是 ReID 训练中 batch 构造和度量学习损失的关系。P-K 采样不是简单凑 batch,而是每个 batch 选 P 个身份、每个身份取 K 张图,保证 anchor 有正样本、batch 内有足够负身份,并让 triplet、contrastive、circle、batch-hard 等损失能够稳定挖掘正负样本,同时缓解身份样本数不均衡带来的训练偏置。
推荐系统中做采样后样本分布被改变,点击率预估值应该如何校准?
采样会改变训练样本中的先验点击率,模型在采样分布上学到的概率通常不是线上真实曝光分布的 CTR。回答时要先说明校准目标是把 sampled posterior 还原到 target posterior,再给出 odds/prior correction 公式,并补充用未采样验证集做 Platt、isotonic、温度缩放或分桶校准,最后用可靠性曲线、ECE、Brier/logloss 和线上 A/B 验证。
同一分类器和同一阈值下,测试集正负样本比例从 1:1 变为 1:1000 时,Precision 和 Recall 通常会如何变化,为什么?
在同一分类器、同一阈值、正负类条件分布不变的前提下,Recall 本质上是 TPR,通常基本不随类别先验变化;Precision 强依赖正样本先验,会随着正样本比例从 1:1 降到 1:1000 而大幅下降。回答关键是写出 Precision = π TPR / (π TPR + (1-π) FPR),并说明前提、例外和阈值重调策略。
推荐模型离线 AUC 与线上效果不一致时,可能有哪些原因,如何定位和修正?
离线 AUC 与线上效果不一致通常不是单点问题,而是数据分布、样本构造、标签口径、特征一致性、评估指标、候选集、系统链路和实验统计共同造成。回答要先说明 AUC 衡量 P(score_pos > score_neg),不等于线上业务收益;再按数据、模型、评估、服务、实验五层排查,并给出 replay、shadow scoring、切片、A/A、A/B 和监控修正路径。
在小目标检测且数据量较小的场景下,如何用深度学习方案改造传统检测流程,并围绕 Faster R-CNN、多尺度特征和数据增强提升效果?
这道题考察小目标检测和小样本场景的方案设计。回答要覆盖传统流程改造、Faster R-CNN 选型、多尺度特征、数据增强、迁移学习、样本不均衡和评估误差分析。
视觉感知多任务网络(如检测、分割、车道线、关键点等)如何处理任务间和类别间数据不平衡,并说明网络结构、数据加载、损失权重和评估策略?
这道题考察感知多任务网络在任务间和类别间不平衡时的系统治理。回答要覆盖共享骨干、多任务头、采样、损失权重、梯度冲突和分任务评估。