如本文所述,对于计算F-1分数(即计算召回率和精确度)而言,无论这些计算是基于阳性还是阴性,都是很重要的。例如,如果我有一个偏斜的数据集,其中标签类别A的标签为1%,类别B标签的标签为99%,而我只是将A分配为阳性类别,并将所有测试项目归为阳性,那么我的F-1分数将非常好。如何告诉scikit-learn二进制分类中哪个类别是肯定类别?(如果有帮助,我可以提供代码。)
对于二进制分类,sklearn.metrics.f1_score
默认情况下将假设1是肯定类别,而0是否定类别。如果您使用这些约定(0
对于类别B,1
对于类别A),它应该会为您提供所需的行为。通过将pos_label
关键字参数传递给f1_score
函数,可以覆盖此行为。
请参阅:http : //scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html