如前所述这里,交叉熵不是多标签分类合适的损失函数。我的问题是“这个事实是否也适用于带有softmax的交叉熵?”。如果是这样,它如何与文档的此部分匹配。
我应该提到,我的问题范围在cntk中。
多标签分类通常表示“许多二进制标签”。考虑到该定义,softmax的交叉熵不适用于多标签分类。您在第二个链接中提供的文档讨论的是多类问题,而不是多标签问题。带有softmax的交叉熵适用于多类分类。对于多标签分类,通常的选择是使用每个标签的二进制交叉熵之和。可以使用Logistic
Brainscript或binary_cross_entropy
Python 计算二进制交叉熵。
另一方面,如果您在使用多个多类标签时遇到问题,则可以对每个标签使用cross_entropy_with_softmax,CNTK将自动对所有这些损失值求和。