20赞

pytorch中交叉熵损失(nn.CrossEntropyLoss())的计算过程详解

作者：360691894_8a5c48 | 2021-10-22 20:56

今天小编就为大家分享一篇pytorch中交叉熵损失(nn.CrossEntropyLoss())的计算过程详解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

公式

首先需要了解CrossEntropyLoss的计算过程，交叉熵的函数是这样的：

其中，其中yi表示真实的分类结果。这里只给出公式，关于CrossEntropyLoss的其他详细细节请参照其他博文。

测试代码（一维）

import torch
import torch.nn as nn
import math

criterion = nn.CrossEntropyLoss()
output = torch.randn(1, 5, requires_grad=True)
label = torch.empty(1, dtype=torch.long).random_(5)
loss = criterion(output, label)

print("网络输出为5类:")
print(output)
print("要计算label的类别:")
print(label)
print("计算loss的结果:")
print(loss)

first = 0
for i in range(1):
  first = -output[i][label[i]]
second = 0
for i in range(1):
  for j in range(5):
    second += math.exp(output[i][j])
res = 0
res = (first + math.log(second))
print("自己的计算结果：")
print(res)

测试代码（多维）

import torch
import torch.nn as nn
import math
criterion = nn.CrossEntropyLoss()
output = torch.randn(3, 5, requires_grad=True)
label = torch.empty(3, dtype=torch.long).random_(5)
loss = criterion(output, label)

print("网络输出为3个5类:")
print(output)
print("要计算loss的类别:")
print(label)
print("计算loss的结果:")
print(loss)

first = [0, 0, 0]
for i in range(3):
  first[i] = -output[i][label[i]]
second = [0, 0, 0]
for i in range(3):
  for j in range(5):
    second[i] += math.exp(output[i][j])
res = 0
for i in range(3):
  res += (first[i] + math.log(second[i]))
print("自己的计算结果：")
print(res/3)

nn.CrossEntropyLoss()中的计算方法

注意：在计算CrossEntropyLosss时，真实的label（一个标量）被处理成onehot编码的形式。

在pytorch中，CrossEntropyLoss计算公式为：

CrossEntropyLoss带权重的计算公式为（默认weight=None）：

以上这篇pytorch中交叉熵损失(nn.CrossEntropyLoss())的计算过程详解就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

推荐阅读

程序员
静态表视图的错误

如何解决《静态表视图的错误》经验，为你挑选了0个好方法。 ... [详细]
程序员
具有离散值的Java for循环

如何解决《具有离散值的Javafor循环》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用org-mode为科学期刊编写LaTeX？

如何解决《如何使用org-mode为科学期刊编写LaTeX？》经验，为你挑选了1个好方法。 ... [详细]
程序员
iOS/Swift:超过10个ADBannerView实例

如何解决《iOS/Swift:超过10个ADBannerView实例》经验，为你挑选了1个好方法。 ... [详细]
程序员
向按钮提交按钮值但未能发布值

如何解决《向按钮提交按钮值但未能发布值》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何清理不良的Azure PowerShell卸载？

如何解决《如何清理不良的AzurePowerShell卸载？》经验，为你挑选了2个好方法。 ... [详细]
程序员
获取正确的名称值而不是Microsoft.SharePoint.Client.FieldUserValue

如何解决《获取正确的名称值而不是Microsoft.SharePoint.Client.FieldUserValue》经验，为你挑选了1个好方法。 ... [详细]
程序员
git rebase - 继续没有变化

如何解决《gitrebase-继续没有变化》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么`.asInstanceOf`有时会抛出,有时不抛出？

如何解决《为什么`.asInstanceOf`有时会抛出,有时不抛出？》经验，为你挑选了1个好方法。 ... [详细]
程序员
何时检查C++模板实例化类型？

如何解决《何时检查C++模板实例化类型？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在glBufferData期间处理GL_OUT_OF_MEMORY错误？

如何解决《如何在glBufferData期间处理GL_OUT_OF_MEMORY错误？》经验，为你挑选了1个好方法。 ... [详细]
程序员
运行Tensorflow单元测试

如何解决《运行Tensorflow单元测试》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在tomcat dbcp池中跟踪/记录连接,并检测不返回池连接的代码

如何解决《如何在tomcatdbcp池中跟踪/记录连接,并检测不返回池连接的代码》经验，为你挑选了1个好方法。 ... [详细]
程序员
Laravel SQL选择查询,其中DateTimestamp包含此月份和年份

如何解决《LaravelSQL选择查询,其中DateTimestamp包含此月份和年份》经验，为你挑选了0个好方法。 ... [详细]
程序员
{}之前没有任何关键字的目的是什么？

如何解决《{}之前没有任何关键字的目的是什么？》经验，为你挑选了3个好方法。 ... [详细]
程序员
在eclipse中管理H2连接池

如何解决《在eclipse中管理H2连接池》经验，为你挑选了0个好方法。 ... [详细]
程序员
Bash for循环与文件中的空格分隔字段

如何解决《Bashfor循环与文件中的空格分隔字段》经验，为你挑选了1个好方法。 ... [详细]
程序员
从C＃SSH.NET的ShellStream获取完整的命令输出

如何解决《从C＃SSH.NET的ShellStream获取完整的命令输出》经验，为你挑选了1个好方法。 ... [详细]
程序员
强制netcat立即发送消息(不缓冲)

如何解决《强制netcat立即发送消息(不缓冲)》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用dateutil.parser解析不完整的日期时,如何将日期设置为1？

如何解决《使用dateutil.parser解析不完整的日期时,如何将日期设置为1？》经验，为你挑选了1个好方法。 ... [详细]

360691894_8a5c48

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章