必须了解AUC ROC与"精确/精确"等"逐点"指标之间的关键差异.ROC是阈值的函数.给定一个模型(分类器)输出属于每个类的概率,我们预测具有最高概率(支持)的类.但是,有时我们可以通过更改此规则获得更好的分数,并要求一个支持比另一个大2倍,以实际分类为给定的类.对于不平衡的数据集,这通常是正确的.这样,您实际上是在修改类的学习优先级以更好地适应您的数据.ROC着眼于"如果我将此阈值更改为所有可能值会发生什么",然后AUC ROC计算此曲线的积分.
所以:
高AUC ROC与低f1或其他"点"指标,意味着您的分类器目前做得不好,但是您可以找到其分数实际相当不错的阈值
低AUC ROC和低f1或其他"点"度量,意味着您的分类器目前做得不好,甚至适合阈值也不会改变它
高AUC ROC和高f1或其他"点"度量,意味着您的分类器目前做得不错,而对于许多其他阈值值,它也会做同样的事情
较低的AUC ROC与高f1或其他"点"指标,意味着您的分类器目前做得不错,但是对于许多其他阈值值 - 这是非常糟糕的