3赞

浅谈pytorch中的BN层的注意事项

作者：Gbom2402851125 | 2022-01-05 17:41

这篇文章主要介绍了浅谈pytorch中的BN层的注意事项，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

最近修改一个代码的时候，当使用网络进行推理的时候，发现每次更改测试集的batch size大小竟然会导致推理结果不同，甚至产生错误结果，后来发现在网络中定义了BN层，BN层在训练过程中，会将一个Batch的中的数据转变成正太分布，在推理过程中使用训练过程中的参数对数据进行处理，然而网络并不知道你是在训练还是测试阶段，因此，需要手动的加上，需要在测试和训练阶段使用如下函数。

model.train() or model.eval()

BN类的定义见pytorch中文参考文档

补充知识：关于pytorch中BN层（具体实现）的一些小细节

最近在做目标检测，需要把训好的模型放到嵌入式设备上跑前向，因此得把各种层的实现都用C手撸一遍，，，此为背景。

其他层没什么好说的，但是BN层这有个小坑。pytorch在打印网络参数的时候，只打出weight和bias这两个参数。咦，说好的BN层有四个参数running_mean、running_var 、gamma 、beta的呢？一开始我以为是pytorch把BN层的计算简化成weight * X + bias，但马上反应过来应该没这么简单，因为pytorch中只有可学习的参数才称为parameter。上网找了一些资料但都没有说到这么细的，毕竟大部分用户使用时只要模型能跑起来就行了，，，于是开始看BN层有哪些属性，果然发现了熟悉的running_mean和running_var，原来pytorch的BN层实现并没有不同。这里吐个槽：为啥要把gamma和beta改叫weight、bias啊，很有迷惑性的好不好，，，

扯了这么多，干脆捋一遍pytorch里BN层的具体实现过程，帮自己理清思路，也可以给大家提供参考。再吐槽一下，在网上搜“pytorch bn层”出来的全是关于这一层怎么用的、初始化时要输入哪些参数，没找到一个pytorch中BN层是怎么实现的，，，

众所周知，BN层的输出Y与输入X之间的关系是：Y = (X - running_mean) / sqrt(running_var + eps) * gamma + beta，此不赘言。其中gamma、beta为可学习参数（在pytorch中分别改叫weight和bias），训练时通过反向传播更新；而running_mean、running_var则是在前向时先由X计算出mean和var，再由mean和var以动量momentum来更新running_mean和running_var。所以在训练阶段，running_mean和running_var在每次前向时更新一次；在测试阶段，则通过net.eval()固定该BN层的running_mean和running_var，此时这两个值即为训练阶段最后一次前向时确定的值，并在整个测试阶段保持不变。

以上这篇浅谈pytorch中的BN层的注意事项就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

推荐阅读

程序员
如何管理iOS apns令牌更改

如何解决《如何管理iOSapns令牌更改》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Javascript在每个第二个字符后添加冒号(:)

如何解决《使用Javascript在每个第二个字符后添加冒号(:)》经验，为你挑选了2个好方法。 ... [详细]
程序员
IB Designables:无法更新自动布局状态:代理引发了"CALayerInvalidGeometry"异常

如何解决《IBDesignables:无法更新自动布局状态:代理引发了"CALayerInvalidGeometry"异常》经验，为你挑选了0个好方法。 ... [详细]
程序员
SQLSTATE [HY000] [2002] php_network_getaddresses:getaddrinfo失败:提供nodename或servname,或者不知道

如何解决《SQLSTATE[HY000][2002]php_network_getaddresses:getaddrinfo失败:提供nodename或servname,或者不知道》经验，为你挑选了1个好方法。 ... [详细]
程序员
抛出constexpr功能

如何解决《抛出constexpr功能》经验，为你挑选了2个好方法。 ... [详细]
程序员
通过IO了解Haskell中的纯函数

如何解决《通过IO了解Haskell中的纯函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Yii2中的视图文件中使用ArrayHelper

如何解决《在Yii2中的视图文件中使用ArrayHelper》经验，为你挑选了1个好方法。 ... [详细]
程序员
尾递归与原始递归

如何解决《尾递归与原始递归》经验，为你挑选了1个好方法。 ... [详细]
程序员
语法错误:'delimiter'在这里输入无效

如何解决《语法错误:'delimiter'在这里输入无效》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么不能满足相关类型的From <>的更高的kinded特性限制,但Into <>可以吗？

如何解决《为什么不能满足相关类型的From<>的更高的kinded特性限制,但Into<>可以吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何将Future [Vector [UserLocation]]转换为Future [Vector [User]]

如何解决《如何将Future[Vector[UserLocation]]转换为Future[Vector[User]]》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以构建一个惰性条件元函数

如何解决《是否可以构建一个惰性条件元函数》经验，为你挑选了0个好方法。 ... [详细]
程序员
制作填充图Matplotlib-错误：类型升级无效

如何解决《制作填充图Matplotlib-错误：类型升级无效》经验，为你挑选了1个好方法。 ... [详细]
程序员
在R中将两个列值粘贴在一起时省略NA值

如何解决《在R中将两个列值粘贴在一起时省略NA值》经验，为你挑选了0个好方法。 ... [详细]
程序员
从视图运行时如何修复Url（〜/ Views / Home / Index.cshtml）

如何解决《从视图运行时如何修复Url（〜/Views/Home/Index.cshtml）》经验，为你挑选了1个好方法。 ... [详细]
程序员
Gunicorn Upstart文件无法启动

如何解决《GunicornUpstart文件无法启动》经验，为你挑选了0个好方法。 ... [详细]
程序员
函数uasort在PHP 5.5和PHP 7.0中的不同行为

如何解决《函数uasort在PHP5.5和PHP7.0中的不同行为》经验，为你挑选了1个好方法。 ... [详细]
程序员
我们应该如何实现对象类型的移动？

如何解决《我们应该如何实现对象类型的移动？》经验，为你挑选了1个好方法。 ... [详细]
程序员
BeautifulSoup中的select方法无法用空格选择属性值

如何解决《BeautifulSoup中的select方法无法用空格选择属性值》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何处理谷歌地图上的触摸事件(MapFragment)？

如何解决《如何处理谷歌地图上的触摸事件(MapFragment)？》经验，为你挑选了1个好方法。 ... [详细]

Gbom2402851125

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章