当前位置:  开发笔记 > 开发工具 > 正文

xgboost正确使用auc指标

如何解决《xgboost正确使用auc指标》经验,为你挑选了0个好方法。

对于二进制分类问题,我的数据集略有不平衡,正负比为0.6。我最近从以下答案中了解了auc指标:https ://stats.stackexchange.com/a/132832/128229 ,并决定使用它。

但是我碰到了另一个链接http://fastml.com/what-you-wanted-to-know-about-auc/,该链接声称AUC-ROC对类不平衡不敏感,我们应该使用AUC来提高精度召回曲线。

xgboost文档尚不清楚他们使用哪个AUC,是否使用AUC-ROC?此外,该链接还提到,仅当您不关心概率而仅关心排名时,才应使用AUC。

但是,由于我使用的是binary:logistic目标,因此我认为我应该关注概率,因为我必须为预测设置阈值。

xgboost参数调整指南https://github.com/dmlc/xgboost/blob/master/doc/how_to/param_tuning.md 还建议了一种通过不平衡正样本和负样本并使用max_delta_step = 1处理类不平衡的替代方法。 。

因此有人可以解释,什么时候AUC优先于xgboost处理类不平衡的另一种方法。如果我使用的是AUC,我需要为预测设置的阈值是多少?或更笼统地说,我应该如何使用AUC来精确处理xgboost中的不平衡二进制分类问题?

编辑:

我还需要消除误报,而不是消除误报,除了binary:logistic目标之外,如何简单地改变阈值,我如何才能做到这一点?

推荐阅读
谢谢巷议
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有