Pytorch实现将模型的所有参数的梯度清0

作者：mobiledu2402851377 | 2021-12-11 18:27

这篇文章主要介绍了Pytorch实现将模型的所有参数的梯度清0，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

有两种方式直接把模型的参数梯度设成0：

model.zero_grad()
optimizer.zero_grad()#当optimizer=optim.Optimizer(model.parameters())时，两者等效

如果想要把某一Variable的梯度置为0，只需用以下语句：

Variable.grad.data.zero_()

补充知识：PyTorch中在反向传播前为什么要手动将梯度清零？optimizer.zero_grad()的意义

optimizer.zero_grad()意思是把梯度置零，也就是把loss关于weight的导数变成0.

在学习pytorch的时候注意到，对于每个batch大都执行了这样的操作：

optimizer.zero_grad()             ## 梯度清零
preds = model(inputs)             ## inference
loss = criterion(preds, targets) ## 求解loss
loss.backward()                   ## 反向传播求解梯度
optimizer.step()                  ## 更新权重参数

1、由于pytorch的动态计算图，当我们使用loss.backward()和opimizer.step()进行梯度下降更新参数的时候，梯度并不会自动清零。并且这两个操作是独立操作。

2、backward()：反向传播求解梯度。

3、step()：更新权重参数。

基于以上几点，正好说明了pytorch的一个特点是每一步都是独立功能的操作，因此也就有需要梯度清零的说法，如若不显示的进 optimizer.zero_grad()这一步操作，backward()的时候就会累加梯度。

以上这篇Pytorch实现将模型的所有参数的梯度清0就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

推荐阅读

程序员
为key = value定义开关

如何解决《为key=value定义开关》经验，为你挑选了1个好方法。 ... [详细]
程序员
设置并使用Meld作为你的git difftool和mergetool

如何解决《设置并使用Meld作为你的gitdifftool和mergetool》经验，为你挑选了4个好方法。 ... [详细]
程序员
通过模糊转换运算符引用绑定

如何解决《通过模糊转换运算符引用绑定》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用协议以typealias作为属性

如何解决《使用协议以typealias作为属性》经验，为你挑选了0个好方法。 ... [详细]
程序员
JavaScript意外的输入结束

如何解决《JavaScript意外的输入结束》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何让sqlite3在Tcl中执行regexp

如何解决《如何让sqlite3在Tcl中执行regexp》经验，为你挑选了1个好方法。 ... [详细]
程序员
有没有官方方法来获取模型的管理选项？

如何解决《有没有官方方法来获取模型的管理选项？》经验，为你挑选了0个好方法。 ... [详细]
程序员
在混合Java/Kotlin项目中使用Dagger 2的Maven配置

如何解决《在混合Java/Kotlin项目中使用Dagger2的Maven配置》经验，为你挑选了0个好方法。 ... [详细]
程序员
Swift - 无法转换'UITabBarController'类型的值

如何解决《Swift-无法转换'UITabBarController'类型的值》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么以下C++程序打印'0'而不是'6'？

如何解决《为什么以下C++程序打印'0'而不是'6'？》经验，为你挑选了1个好方法。 ... [详细]
程序员
AWS API Gateway:由于配置错误导致执行失败:输出映射不匹配且未配置默认输出映射

如何解决《AWSAPIGateway:由于配置错误导致执行失败:输出映射不匹配且未配置默认输出映射》经验，为你挑选了2个好方法。 ... [详细]
程序员
Swift:CFArray:将值作为UTF字符串获取

如何解决《Swift:CFArray:将值作为UTF字符串获取》经验，为你挑选了1个好方法。 ... [详细]
程序员
Heroku:运行npm install和gulp build for Django app

如何解决《Heroku:运行npminstall和gulpbuildforDjangoapp》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Browserify在ES6中使用Bootstrap和jQuery包时出错

如何解决《使用Browserify在ES6中使用Bootstrap和jQuery包时出错》经验，为你挑选了1个好方法。 ... [详细]
程序员
Emgu CV 3 findContours和Vec4i类型的层级参数是否等效？

如何解决《EmguCV3findContours和Vec4i类型的层级参数是否等效？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何将constexpr作为模板参数传递？

如何解决《如何将constexpr作为模板参数传递？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android PC上的Android工作室更快吗？

如何解决《AndroidPC上的Android工作室更快吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
在class属性中引用类名的最佳方法是什么？

如何解决《在class属性中引用类名的最佳方法是什么？》经验，为你挑选了0个好方法。 ... [详细]
程序员
将Android Studio更新为1.5后出现Gradle错误

如何解决《将AndroidStudio更新为1.5后出现Gradle错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
实际上是否可以从构造微积分中删除"Pi"？

如何解决《实际上是否可以从构造微积分中删除"Pi"？》经验，为你挑选了1个好方法。 ... [详细]

mobiledu2402851377

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章