19赞

当前位置: 开发笔记 > 开发工具 > 正文

Pytorch BCELoss和BCEWithLogitsLoss的使用

作者：谢谢巷议 | 2021-10-21 16:47

这篇文章主要介绍了PytorchBCELoss和BCEWithLogitsLoss的使用详解，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教

BCELoss

在图片多标签分类时，如果3张图片分3类，会输出一个3*3的矩阵。

先用Sigmoid给这些值都搞到0~1之间：

假设Target是：

下面我们用BCELoss来验证一下Loss是不是0.7194！

emmm应该是我上面每次都保留4位小数，算到最后误差越来越大差了0.0001。不过也很厉害啦哈哈哈哈哈！

BCEWithLogitsLoss

BCEWithLogitsLoss就是把Sigmoid-BCELoss合成一步。我们直接用刚刚的input验证一下是不是0.7193：

嘻嘻，我可真是太厉害啦！

补充：Pytorch中BCELoss,BCEWithLogitsLoss和CrossEntropyLoss的区别

BCEWithLogitsLoss = Sigmoid+BCELoss

当网络最后一层使用nn.Sigmoid时，就用BCELoss，当网络最后一层不使用nn.Sigmoid时，就用BCEWithLogitsLoss。

(BCELoss)BCEWithLogitsLoss

用于单标签二分类或者多标签二分类，输出和目标的维度是(batch,C)，batch是样本数量，C是类别数量，对于每一个batch的C个值，对每个值求sigmoid到0-1之间，所以每个batch的C个值之间是没有关系的,相互独立的，所以之和不一定为1。

每个C值代表属于一类标签的概率。如果是单标签二分类，那输出和目标的维度是(batch,1)即可。

CrossEntropyLoss用于多类别分类

输出和目标的维度是(batch,C)，batch是样本数量，C是类别数量，每一个C之间是互斥的，相互关联的，对于每一个batch的C个值，一起求每个C的softmax，所以每个batch的所有C个值之和是1，哪个值大，代表其属于哪一类。如果用于二分类，那输出和目标的维度是(batch,2)。

补充：Pytorch踩坑记之交叉熵（nn.CrossEntropy，nn.NLLLoss，nn.BCELoss的区别和使用）

在Pytorch中的交叉熵函数的血泪史要从nn.CrossEntropyLoss()这个损失函数开始讲起。

从表面意义上看，这个函数好像是普通的交叉熵函数，但是如果你看过一些Pytorch的资料，会告诉你这个函数其实是softmax()和交叉熵的结合体。

然而如果去官方看这个函数的定义你会发现是这样子的：

哇，竟然是nn.LogSoftmax()和nn.NLLLoss()的结合体，这俩都是什么玩意儿啊。再看看你会发现甚至还有一个损失叫nn.Softmax()以及一个叫nn.nn.BCELoss()。我们来探究下这几个损失到底有何种关系。

nn.Softmax和nn.LogSoftmax

首先nn.Softmax()官网的定义是这样的：

嗯...就是我们认识的那个softmax。那nn.LogSoftmax()的定义也很直观了：

果不其然就是Softmax取了个log。可以写个代码测试一下：

import torch
import torch.nn as nn
 
a = torch.Tensor([1,2,3])
#定义Softmax
softmax = nn.Softmax()
sm_a = softmax=nn.Softmax()
print(sm)
#输出：tensor([0.0900, 0.2447, 0.6652])
 
#定义LogSoftmax
logsoftmax = nn.LogSoftmax()
lsm_a = logsoftmax(a)
print(lsm_a)
#输出tensor([-2.4076, -1.4076, -0.4076])，其中ln(0.0900)=-2.4076

nn.NLLLoss

上面说过nn.CrossEntropy()是nn.LogSoftmax()和nn.NLLLoss的结合，nn.NLLLoss官网给的定义是这样的：

The negative log likelihood loss. It is useful to train a classification problem with C classes

负对数似然损失，看起来好像有点晦涩难懂，写个代码测试一下：

import torch
import torch.nn
 
a = torch.Tensor([[1,2,3]])
nll = nn.NLLLoss()
target1 = torch.Tensor([0]).long()
target2 = torch.Tensor([1]).long()
target3 = torch.Tensor([2]).long()
 
#测试
n1 = nll(a,target1)
#输出：tensor(-1.)
n2 = nll(a,target2)
#输出：tensor(-2.)
n3 = nll(a,target3)
#输出：tensor(-3.)

看起来nn.NLLLoss做的事情是取出a中对应target位置的值并取负号，比如target1=0，就取a中index=0位置上的值再取负号为-1，那这样做有什么意义呢，要结合nn.CrossEntropy往下看。

nn.CrossEntropy

看下官网给的nn.CrossEntropy()的表达式：

看起来应该是softmax之后取了个对数，写个简单代码测试一下：

import torch
import torch.nn as nn
 
a = torch.Tensor([[1,2,3]])
target = torch.Tensor([2]).long()
logsoftmax = nn.LogSoftmax()
ce = nn.CrossEntropyLoss()
nll = nn.NLLLoss()
 
#测试CrossEntropyLoss
cel = ce(a,target)
print(cel)
#输出：tensor(0.4076)
 
#测试LogSoftmax+NLLLoss
lsm_a = logsoftmax(a)
nll_lsm_a = nll(lsm_a,target)
#输出tensor(0.4076)

看来直接用nn.CrossEntropy和nn.LogSoftmax+nn.NLLLoss是一样的结果。为什么这样呢，回想下交叉熵的表达式：

$l(x,y)=-\sum y*logx=\left\{\begin{matrix} -logx , y=1& \\ 0,y=0& \end{matrix}\right.$

直觉上和多酚类交叉熵的区别在于，不仅考虑了 $y_n=1$ 的样本，也考虑了 $y_n=0$ 的样本的损失。

总结

nn.LogSoftmax是在softmax的基础上取自然对数nn.NLLLoss是负的似然对数损失，但Pytorch的实现就是把对应target上的数取出来再加个负号，要在CrossEntropy中结合LogSoftmax来用BCELoss是二分类的交叉熵损失，Pytorch实现中和多分类有区别

Pytorch是个深坑，让我们一起扎根使用手册，结合实践踏平这些坑吧~~暴风哭泣~~。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持。

推荐阅读

程序员
通过C中的数组迭代

如何解决《通过C中的数组迭代》经验，为你挑选了1个好方法。 ... [详细]
程序员
Jenkins Swarm插件-具有RANDOM字母数字值的从站名称

如何解决《JenkinsSwarm插件-具有RANDOM字母数字值的从站名称》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python请求模块导入错误

如何解决《Python请求模块导入错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Babel 6中使用babel-runtime？

如何解决《如何在Babel6中使用babel-runtime？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何从Google App Engine中的延迟任务返回数据

如何解决《如何从GoogleAppEngine中的延迟任务返回数据》经验，为你挑选了0个好方法。 ... [详细]
程序员
Shell - 如何在Bash中将String转换为Byte数组

如何解决《Shell-如何在Bash中将String转换为Byte数组》经验，为你挑选了1个好方法。 ... [详细]
程序员
Matplotlib,水平条形图(barh)是颠倒的

如何解决《Matplotlib,水平条形图(barh)是颠倒的》经验，为你挑选了2个好方法。 ... [详细]
程序员
clamscan不会跳过大文件并且有fmap错误

如何解决《clamscan不会跳过大文件并且有fmap错误》经验，为你挑选了0个好方法。 ... [详细]
程序员
检查何时加载了异步javascript文件

如何解决《检查何时加载了异步javascript文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android Studio渲染问题 - 缺少样式？

如何解决《AndroidStudio渲染问题-缺少样式？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java class.getResource()返回null

如何解决《Javaclass.getResource()返回null》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么HTTP/2的浏览器实现需要TLS？

如何解决《为什么HTTP/2的浏览器实现需要TLS？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Angular Directive:在编译时在现有模板元素上添加ng-class指令

如何解决《AngularDirective:在编译时在现有模板元素上添加ng-class指令》经验，为你挑选了1个好方法。 ... [详细]
程序员
google oauth令牌的链接是什么？

如何解决《googleoauth令牌的链接是什么？》经验，为你挑选了0个好方法。 ... [详细]
程序员
将min-height设置为等于width

如何解决《将min-height设置为等于width》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Windows 7 SP1上安装Visual Studio Community 2015

如何解决《在Windows7SP1上安装VisualStudioCommunity2015》经验，为你挑选了1个好方法。 ... [详细]
程序员
将joda DateTime转换为java.time.LocalDate

如何解决《将jodaDateTime转换为java.time.LocalDate》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Asp.NET中为选项预检请求添加'access-control-allow-origin'响应

如何解决《在Asp.NET中为选项预检请求添加'access-control-allow-origin'响应》经验，为你挑选了0个好方法。 ... [详细]
程序员
日历 - 获取上个月的最后一天

如何解决《日历-获取上个月的最后一天》经验，为你挑选了1个好方法。 ... [详细]
程序员
确定ActiveCell是否在特定表中

如何解决《确定ActiveCell是否在特定表中》经验，为你挑选了1个好方法。 ... [详细]

谢谢巷议

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章