二分类任务中，AUC是什么意思？｜百度算法面经解析

60 秒回答模板

AUC 是 Area Under Curve，二分类里通常指 ROC 曲线下面积。ROC 曲线横轴是 FPR，纵轴是 TPR，它通过改变分类阈值得到一系列点。AUC 衡量的是模型在所有阈值下的整体区分能力，也可以理解为随机抽取一个正样本和一个负样本，模型给正样本打分高于负样本的概率。AUC 不依赖单一阈值，适合评价排序能力；但它不直接反映概率校准，也不能单独说明某个业务阈值下的精确率、召回率或成本收益。

考点定义

难度 算法岗真实面经题

回答目标 讲清原理、边界和追问

深入解析

ROC 与 AUC

ROC 曲线通过不断改变分类阈值，统计不同阈值下的 TPR 和 FPR。TPR 是真正例率，也叫召回率；FPR 是假正例率，表示负样本中被误判为正的比例。AUC 就是 ROC 曲线下的面积，用一个数概括整体区分能力。

排序概率解释

AUC 有一个很重要的概率解释：随机抽取一个正样本和一个负样本，模型对正样本的预测分数高于负样本的概率。这个解释说明 AUC 更关注排序质量，而不是某个固定阈值下是否分类正确。分数绝对值可以不准，但排序好时 AUC 仍可能较高。

数值含义

AUC 等于 1 表示所有正样本分数都高于所有负样本，是理想排序；AUC 约为 0.5 表示接近随机排序；小于 0.5 通常意味着排序方向可能反了，或者模型信号存在严重问题。在真实任务中，应结合数据噪声和样本分布理解数值。

优点

AUC 的优点是与具体分类阈值无关，能综合考察模型在不同阈值下的表现。对于正负样本比例变化较大的二分类任务，AUC 常被用来衡量模型区分能力，因为它不像 accuracy 那样容易被多数类样本掩盖。

局限性

AUC 不能反映概率校准，也不能保证某个阈值下 precision、recall 或业务成本最优。两个模型 AUC 接近时，局部阈值区间表现可能差异很大。对于极端不平衡且更关心正例命中的任务，还应同时观察 PR-AUC、召回率、精确率等指标。

面试表达重点

回答时不要只说 AUC 是曲线面积，还要讲清 ROC 的横纵轴、阈值变化、排序概率解释和适用边界。尤其要强调 AUC 衡量的是排序区分能力，而不是直接衡量预测概率是否准确，也不是某个固定阈值下的分类效果。

易错点

只说 AUC 是面积，不说明 ROC 横轴 FPR、纵轴 TPR。
把 AUC 当成固定阈值下的准确率。
认为 AUC 高就代表概率校准好。
在极端不平衡任务中只看 AUC，不结合 PR-AUC 和具体阈值指标。

面试官追问

AUC 和 accuracy 有什么区别？

accuracy 依赖固定分类阈值，衡量该阈值下预测对了多少；AUC 不依赖单一阈值，衡量模型把正样本排在负样本前面的整体能力。

为什么 AUC 可以理解成排序能力？

因为 AUC 等价于随机取一个正样本和一个负样本时，正样本预测分数高于负样本预测分数的概率。因此它关注分数相对顺序。

样本极度不平衡时只看 AUC 足够吗？

通常不够。AUC 仍有参考价值，但如果更关心少数类识别效果，应结合 PR-AUC、precision、recall、F1 以及业务阈值下的混淆矩阵。

AUC 高是否说明预测概率很准？

不一定。AUC 高说明排序好，但概率可能没有校准。例如模型能把正样本排在前面，却可能把 0.9 的概率系统性估成 0.6。