7赞

CNN损失停留在2.302（ln（10））

作者：帆侮听我悄悄说星星 | 2023-06-10 08:34

如何解决《CNN损失停留在2.302（ln（10））》经验，为你挑选了1个好方法。

我正在尝试对神经网络进行建模以解决CIFAR-10数据集，但是我面临着这个非常奇怪的问题，我已经尝试了6种不同的CNN体系结构，并使用了许多不同的CNN超参数和完全连接的#neurons值，但似乎都为了失败而损失2.302，而相应的精度为0.0625，为什么会发生这种情况，CNN或神经网络的特性使它如此，我还尝试了dropout，l2_norm，不同的内核大小，CNN和Max Pool中的不同填充。我不明白为什么损失会卡在这样的奇数上？

我正在使用tensorflow来实现这一点，并且我尝试了softmax层+ cross_entropy_loss和not_softmax_layer + sparse_cross_entropy_loss。神经净损失函数停留在高原吗？

1> 小智..：

似乎您不小心将非线性/激活功能应用于网络的最后一层。请记住，交叉熵适用于介于0到1之间的值。当您在计算交叉熵之前通过应用softmax函数将输出自动“强制”到此范围时，应该仅“应用”线性激活功能（只是不添加任何功能）。

顺便说一下，2.302的值不是偶然的。相反，当您假设所有10个类别（CIFAR-10）最初都具有相同的0.1预期扩散概率时，softmax损失为-ln（0.1）。请查看Andrej Karpathy的解释：http ://cs231n.github.io/neural-networks-3/

推荐阅读

程序员
使用Protractor获取ng-repeat ng-repeat

如何解决《使用Protractor获取ng-repeatng-repeat》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何处理Spring Boot重定向到/ error？

如何解决《如何处理SpringBoot重定向到/error？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在Powershell哈希表中获得特定值的名称？

如何解决《如何在Powershell哈希表中获得特定值的名称？》经验，为你挑选了0个好方法。 ... [详细]
程序员
递归函数中堆栈溢出的原因

如何解决《递归函数中堆栈溢出的原因》经验，为你挑选了0个好方法。 ... [详细]
程序员
UICollectionViewCell和UICollectionView的高度相等

如何解决《UICollectionViewCell和UICollectionView的高度相等》经验，为你挑选了2个好方法。 ... [详细]
程序员
PyCharm类型暗示古怪

如何解决《PyCharm类型暗示古怪》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Angular 2(beta和更新版本)加载RxJS(和zone.js/reflect-metadata)？

如何解决《如何使用Angular2(beta和更新版本)加载RxJS(和zone.js/reflect-metadata)？》经验，为你挑选了1个好方法。 ... [详细]
程序员
SQL有MAX(COUNT)错误

如何解决《SQL有MAX(COUNT)错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
再现"关闭一个foreach的变量"得到了

如何解决《再现"关闭一个foreach的变量"得到了》经验，为你挑选了2个好方法。 ... [详细]
程序员
张量流softmax回归始终预测1

如何解决《张量流softmax回归始终预测1》经验，为你挑选了1个好方法。 ... [详细]
程序员
Qt安装程序框架:自动更新

如何解决《Qt安装程序框架:自动更新》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么构成"有效"C标识符？

如何解决《什么构成"有效"C标识符？》经验，为你挑选了3个好方法。 ... [详细]
程序员
Visual Studio 2015的Git问题

如何解决《VisualStudio2015的Git问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何通过REST API发送文件？

如何解决《如何通过RESTAPI发送文件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
x86汇编中端口I/O后jmp短路的目的

如何解决《x86汇编中端口I/O后jmp短路的目的》经验，为你挑选了1个好方法。 ... [详细]
程序员
Mulesoft转换消息错误:"当前类路径中存在一些错误"

如何解决《Mulesoft转换消息错误:"当前类路径中存在一些错误"》经验，为你挑选了0个好方法。 ... [详细]
程序员
从字符串列表中的拆分字符串创建字典

如何解决《从字符串列表中的拆分字符串创建字典》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何计算Spark SQL中的总百分比

如何解决《如何计算SparkSQL中的总百分比》经验，为你挑选了1个好方法。 ... [详细]
程序员
获取Siri Remote方向(或获取更改通知？)

如何解决《获取SiriRemote方向(或获取更改通知？)》经验，为你挑选了0个好方法。 ... [详细]
程序员
在string []中返回用户所属的所有Active Directory组的列表

如何解决《在string[]中返回用户所属的所有ActiveDirectory组的列表》经验，为你挑选了1个好方法。 ... [详细]

帆侮听我悄悄说星星

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章