6赞

如何在咖啡馆中使用"BatchNorm"图层？

作者：Life一切安好 | 2023-09-07 14:24

如何解决《如何在咖啡馆中使用"BatchNorm"图层？》经验，为你挑选了1个好方法。

我对如何"BatchNorm"在模型中使用/插入图层感到有点困惑.
我看到了几种不同的方法,例如:

ResNets:`"BatchNorm"`+ `"Scale"`(无参数共享)

"BatchNorm"图层紧跟着"Scale"图层:

layer {
    bottom: "res2a_branch1"
    top: "res2a_branch1"
    name: "bn2a_branch1"
    type: "BatchNorm"
    batch_norm_param {
        use_global_stats: true
    }
}

layer {
    bottom: "res2a_branch1"
    top: "res2a_branch1"
    name: "scale2a_branch1"
    type: "Scale"
    scale_param {
        bias_term: true
    }
}

cifar10示例:仅`"BatchNorm"`

在提供caffe的cifar10示例中,"BatchNorm"使用时没有任何"Scale"跟随它:

layer {
  name: "bn1"
  type: "BatchNorm"
  bottom: "pool1"
  top: "bn1"
  param {
    lr_mult: 0
  }
  param {
    lr_mult: 0
  }
  param {
    lr_mult: 0
  }
}

cifar10不同`batch_norm_param`的`TRAIN`和`TEST`

batch_norm_param: use_global_scale在TRAIN和TEST阶段之间改变:

layer {
  name: "bn1"
  type: "BatchNorm"
  bottom: "pool1"
  top: "bn1"
  batch_norm_param {
    use_global_stats: false
  }
  param {
    lr_mult: 0
  }
  param {
    lr_mult: 0
  }
  param {
    lr_mult: 0
  }
  include {
    phase: TRAIN
  }
}
layer {
  name: "bn1"
  type: "BatchNorm"
  bottom: "pool1"
  top: "bn1"
  batch_norm_param {
    use_global_stats: true
  }
  param {
    lr_mult: 0
  }
  param {
    lr_mult: 0
  }
  param {
    lr_mult: 0
  }
  include {
    phase: TEST
  }
}

那应该是什么？

如何"BatchNorm"在咖啡馆中使用图层？

1> Jonathan..：

如果您按照原始纸张进行批量标准化,则应遵循"比例"和"偏移"图层(可以通过"比例"包含偏差,但这会使"偏差"参数无法访问).use_global_stats也应该从训练(False)更改为测试/部署(True) - 这是默认行为.请注意,您提供的第一个示例是用于部署的原型文本,因此将其设置为True是正确的.

我不确定共享参数.

我提出了一个拉取请求来改进批量规范化的文档,但后来因为我想修改它而关闭它.然后,我再也没有回过头来.

请注意,我觉得lr_mult: 0对于"BatchNorm"不再需要(也许是不允许的？),虽然我不是现在发现相应的PR.

推荐阅读

程序员
安装ruby ruby-1.9.3-p551时出错

如何解决《安装rubyruby-1.9.3-p551时出错》经验，为你挑选了1个好方法。 ... [详细]
程序员
权限更改了Android 6.0中的回调

如何解决《权限更改了Android6.0中的回调》经验，为你挑选了1个好方法。 ... [详细]
程序员
Slick 3.0批量插入返回对象的顺序

如何解决《Slick3.0批量插入返回对象的顺序》经验，为你挑选了1个好方法。 ... [详细]
程序员
Instagram新API,按标签获取项目

如何解决《Instagram新API,按标签获取项目》经验，为你挑选了0个好方法。 ... [详细]
程序员
PHP:将epoch转换为MySQL DateTime格式

如何解决《PHP:将epoch转换为MySQLDateTime格式》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python - 合并两个重叠的字符串

如何解决《Python-合并两个重叠的字符串》经验，为你挑选了0个好方法。 ... [详细]
程序员
在chartjs中显示饼图外的值

如何解决《在chartjs中显示饼图外的值》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何防止张量流分配GPU内存的全部？

如何解决《如何防止张量流分配GPU内存的全部？》经验，为你挑选了6个好方法。 ... [详细]
程序员
使用C宏启用/禁用LOG级别

如何解决《使用C宏启用/禁用LOG级别》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用PowerShell远程安装Windows 10应用程序

如何解决《使用PowerShell远程安装Windows10应用程序》经验，为你挑选了0个好方法。 ... [详细]
程序员
文本溢出省略号和flex在Firefox上不起作用

如何解决《文本溢出省略号和flex在Firefox上不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
我怎么能自动一个一个地提交远程分支

如何解决《我怎么能自动一个一个地提交远程分支》经验，为你挑选了1个好方法。 ... [详细]
程序员
获得除了一个循环之外

如何解决《获得除了一个循环之外》经验，为你挑选了1个好方法。 ... [详细]
程序员
a = [undefined]和a = new Array(1)之间的区别

如何解决《a=[undefined]和a=newArray(1)之间的区别》经验，为你挑选了1个好方法。 ... [详细]
程序员
"SplashScreen.java使用或覆盖已弃用的API"进行离子构建.错误

如何解决《"SplashScreen.java使用或覆盖已弃用的API"进行离子构建.错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
替换正则表达式占位符,后跟Sublime Text 2中的数字

如何解决《替换正则表达式占位符,后跟SublimeText2中的数字》经验，为你挑选了1个好方法。 ... [详细]
程序员
WebRTC getUserMedia承诺在Chrome中支持api

如何解决《WebRTCgetUserMedia承诺在Chrome中支持api》经验，为你挑选了1个好方法。 ... [详细]
程序员
桥接头中导入的文件数量是否会影响编译时间？

如何解决《桥接头中导入的文件数量是否会影响编译时间？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在Windows 7 64位上创建本地多节点Cassandra集群？

如何解决《如何在Windows764位上创建本地多节点Cassandra集群？》经验，为你挑选了1个好方法。 ... [详细]
程序员
MongoDB C＃驱动程序超时

如何解决《MongoDBC＃驱动程序超时》经验，为你挑选了1个好方法。 ... [详细]

Life一切安好

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章

如何在咖啡馆中使用"BatchNorm"图层？

ResNets:"BatchNorm"+ "Scale"(无参数共享)

cifar10示例:仅"BatchNorm"

cifar10不同batch_norm_param的TRAIN和TEST

那应该是什么？

ResNets:`"BatchNorm"`+ `"Scale"`(无参数共享)

cifar10示例:仅`"BatchNorm"`

cifar10不同`batch_norm_param`的`TRAIN`和`TEST`