解决pytorch 交叉熵损失输出为负数的问题

作者：贴进你的心聆听你的世界 | 2021-12-11 18:15

这篇文章主要介绍了解决pytorch交叉熵损失输出为负数的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

网络训练中，loss曲线非常奇怪

交叉熵怎么会有负数。

经过排查，交叉熵不是有个负对数吗，当网络输出的概率是0-1时，正数。可当网络输出大于1的数，就有可能变成负数。

所以加上一行就行了

out1 = F.softmax(out1, dim=1)

补充知识：在pytorch框架下，训练model过程中，loss=nan问题时该怎么解决？

当我在UCF-101数据集训练alexnet时，epoch设为100，跑到三十多个epoch时，出现了loss=nan问题，当时是一脸懵逼，在查阅资料后，我通过减小学习率解决了问题，现总结一下出现这个问题的可能原因及解决方法：

1. 减小整体学习率。学习率比较大的时候，参数可能over shoot了，结果就是找不到极小值点；减小学习率可以让参数朝着极值点前进；

2. 改变网络宽度。有可能是网络后面的层参数更新异常，增加后面层的宽度试试；

3. 改变层的学习率。每个层都可以设置学习率，可以尝试减小后面层的学习率试试；

4. 数据归一化（减均值，除方差，或者加入normalization，例如BN、L2 norm等）；

5. 加入gradient clipping；

6 输入数据含有脏数据，即NaN,一般当使用实际业务的真实数据时，容易出现脏数据。

以上这篇解决pytorch 交叉熵损失输出为负数的问题就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

推荐阅读

程序员
Spring社交facebook登录错误 - 数字值超出int范围

如何解决《Spring社交facebook登录错误-数字值超出int范围》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么是JPA中的异常配置？

如何解决《什么是JPA中的异常配置？》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法绑定SQL Server 2012多部分标识符

如何解决《无法绑定SQLServer2012多部分标识符》经验，为你挑选了1个好方法。 ... [详细]
程序员
jQuery - 链接多个.next()方法的替代方法

如何解决《jQuery-链接多个.next()方法的替代方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python - 以非正统方式迭代数组

如何解决《Python-以非正统方式迭代数组》经验，为你挑选了1个好方法。 ... [详细]
程序员
awk动态文档索引

如何解决《awk动态文档索引》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么我需要创建`QApplication`的对象,它在PyQt GUI编程中的目的是什么？

如何解决《为什么我需要创建`QApplication`的对象,它在PyQtGUI编程中的目的是什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
二进制运算符'+'不能应用于两个'T'操作数

如何解决《二进制运算符'+'不能应用于两个'T'操作数》经验，为你挑选了2个好方法。 ... [详细]
程序员
客户端上传文件到远程服务器的最佳方法？

如何解决《客户端上传文件到远程服务器的最佳方法？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在机架级别阻止请求？

如何解决《如何在机架级别阻止请求？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何查看我的laravel数据库？

如何解决《如何查看我的laravel数据库？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在React Native for iOS上设置分析

如何解决《如何在ReactNativeforiOS上设置分析》经验，为你挑选了1个好方法。 ... [详细]
程序员
xcode"文件无法打开"

如何解决《xcode"文件无法打开"》经验，为你挑选了1个好方法。 ... [详细]
程序员
PHP 7用户会话问题 - 无法初始化存储模块

如何解决《PHP7用户会话问题-无法初始化存储模块》经验，为你挑选了2个好方法。 ... [详细]
程序员
为什么我得到"'聚合操作只能用于RLMArray属性'"？

如何解决《为什么我得到"'聚合操作只能用于RLMArray属性'"？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Windows 10上使用Excel interop无法打开超过11个Excel实例

如何解决《在Windows10上使用Excelinterop无法打开超过11个Excel实例》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何设置Android库模块并被Android Studio中的多个项目引用？

如何解决《如何设置Android库模块并被AndroidStudio中的多个项目引用？》经验，为你挑选了1个好方法。 ... [详细]
程序员
WPF中的Prism弹出新窗口

如何解决《WPF中的Prism弹出新窗口》经验，为你挑选了2个好方法。 ... [详细]
程序员
为什么无法在CompilerPass中注入logger服务？

如何解决《为什么无法在CompilerPass中注入logger服务？》经验，为你挑选了0个好方法。 ... [详细]
程序员
是否可以在设计用于go generate的模板上使用gofmt？

如何解决《是否可以在设计用于gogenerate的模板上使用gofmt？》经验，为你挑选了1个好方法。 ... [详细]

贴进你的心聆听你的世界

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章