您的问题似乎是由数据集中的巨大类不平衡引起的.可以看出,0为每个示例分配一个类可以提供超过90%的准确性.为了解决这个问题,您可以使用以下策略:
0
重新平衡数据集:通过对较不频繁的类进行上采样或对较频繁的类进行下采样.
调整班级权重:通过为较不频繁的班级设置较高的班级权重,您将推广您的网络培训,以便更多地关注下采样班级.
增加培训时间:在许多情况下 - 经过较长时间的培训,网络开始更多地集中在不太频繁的课程上.