5赞

pytorch 实现模型不同层设置不同的学习率方式

作者：拾味湖 | 2022-02-22 11:33

今天小编就为大家分享一篇pytorch实现模型不同层设置不同的学习率方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

在目标检测的模型训练中，我们通常都会有一个特征提取网络backbone，例如YOLO使用的darknet SSD使用的VGG-16。

为了达到比较好的训练效果，往往会加载预训练的backbone模型参数，然后在此基础上训练检测网络，并对backbone进行微调，这时候就需要为backbone设置一个较小的lr。

class net(torch.nn.Module):
  def __init__(self):
    super(net, self).__init__()
    # backbone
    self.backbone = ...
    # detect
    self....

在设置optimizer时，只需要参数分为两个部分，并分别给定不同的学习率lr。

base_params = list(map(id, net.backbone.parameters()))
logits_params = filter(lambda p: id(p) not in base_params, net.parameters())
params = [
  {"params": logits_params, "lr": config.lr},
  {"params": net.backbone.parameters(), "lr": config.backbone_lr},
]
optimizer = torch.optim.SGD(params, momentum=config.momentum, weight_decay=config.weight_decay)

以上这篇pytorch 实现模型不同层设置不同的学习率方式就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

推荐阅读

程序员
css3列和溢出隐藏

如何解决《css3列和溢出隐藏》经验，为你挑选了0个好方法。 ... [详细]
程序员
水平UICollectionView单行布局

如何解决《水平UICollectionView单行布局》经验，为你挑选了0个好方法。 ... [详细]
程序员
SQL:选择具有相同单词的字符串

如何解决《SQL:选择具有相同单词的字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Action Listener获取JButton的文本

如何解决《使用ActionListener获取JButton的文本》经验，为你挑选了1个好方法。 ... [详细]
程序员
将变量传递给嵌套的Handlebars模板/部分

如何解决《将变量传递给嵌套的Handlebars模板/部分》经验，为你挑选了1个好方法。 ... [详细]
程序员
SBT插件在非托管jar文件中

如何解决《SBT插件在非托管jar文件中》经验，为你挑选了1个好方法。 ... [详细]
程序员
设置onSeekBarChangeListener会导致null对象异常

如何解决《设置onSeekBarChangeListener会导致null对象异常》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Lisp中格式化REPL输出的数字精度？

如何解决《如何在Lisp中格式化REPL输出的数字精度？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在python中读取/写出字典到csv文件

如何解决《在python中读取/写出字典到csv文件》经验，为你挑选了2个好方法。 ... [详细]
程序员
Ngnix - FastCGI在stderr中发送:"PHP消息:PHP注意:未定义的变量

如何解决《Ngnix-FastCGI在stderr中发送:"PHP消息:PHP注意:未定义的变量》经验，为你挑选了1个好方法。 ... [详细]
程序员
用枚举编写JSON键

如何解决《用枚举编写JSON键》经验，为你挑选了1个好方法。 ... [详细]
程序员
有没有办法如何在"prestart"npm脚本中自动运行"nvm use"？

如何解决《有没有办法如何在"prestart"npm脚本中自动运行"nvmuse"？》经验，为你挑选了1个好方法。 ... [详细]
程序员
格式化perl正则表达式捕获组

如何解决《格式化perl正则表达式捕获组》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python:在任何函数调用中创建一个返回None的类

如何解决《Python:在任何函数调用中创建一个返回None的类》经验，为你挑选了1个好方法。 ... [详细]
程序员
Angular UI modalinstance将数据传递给视图

如何解决《AngularUImodalinstance将数据传递给视图》经验，为你挑选了1个好方法。 ... [详细]
程序员
静态空数组实例的性能优势

如何解决《静态空数组实例的性能优势》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在KIbana 4发现中将URL显示为可单击的链接

如何解决《如何在KIbana4发现中将URL显示为可单击的链接》经验，为你挑选了1个好方法。 ... [详细]
程序员
Tkinter的!了解如何切换帧

如何解决《Tkinter的!了解如何切换帧》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么逐列复制2D数组比C中的逐行复制？

如何解决《为什么逐列复制2D数组比C中的逐行复制？》经验，为你挑选了1个好方法。 ... [详细]
程序员
没有运算符">>"匹配这些操作数

如何解决《没有运算符">>"匹配这些操作数》经验，为你挑选了1个好方法。 ... [详细]

拾味湖

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章