20赞

使用TensorFlow中的3D卷积进行批量标准化

作者：低调pasta_730 | 2023-09-06 15:52

如何解决《使用TensorFlow中的3D卷积进行批量标准化》经验，为你挑选了0个好方法。

我正在实施一个依赖于3D卷积的模型(用于类似于动作识别的任务),我想使用批量标准化(参见[Ioffe&Szegedy 2015]).我找不到任何专注于3D转换的教程,因此我在这里做一个简短的教程,我想和你一起回顾.

下面的代码引用TensorFlow r0.12并且它显式实例变量 - 我的意思是我没有使用tf.contrib.learn,除了tf.contrib.layers.batch_norm()函数.我这样做是为了更好地了解事情如何在幕后工作并具有更多的实现自由(例如,可变摘要).

通过首先编写完全连接层的示例,然后进行2D卷积,最后编写3D情况,我将顺利地进入3D卷积情况.在浏览代码时,如果你能检查一切是否正确完成会很好 - 代码运行,但我不能100%确定应用批量规范化的方式.我以更详细的问题结束这篇文章.

import tensorflow as tf

# This flag is used to allow/prevent batch normalization params updates
# depending on whether the model is being trained or used for prediction.
training = tf.placeholder_with_default(True, shape=())



完全连接(FC)外壳

# Input.
INPUT_SIZE = 512
u = tf.placeholder(tf.float32, shape=(None, INPUT_SIZE))

# FC params: weights only, no bias as per [Ioffe & Szegedy 2015].
FC_OUTPUT_LAYER_SIZE = 1024
w = tf.Variable(tf.truncated_normal(
    [INPUT_SIZE, FC_OUTPUT_LAYER_SIZE], dtype=tf.float32, stddev=1e-1))

# Layer output with no activation function (yet).
fc = tf.matmul(u, w)

# Batch normalization.
fc_bn = tf.contrib.layers.batch_norm(
    fc,
    center=True,
    scale=True,
    is_training=training,
    scope='fc-batch_norm')

# Activation function.
fc_bn_relu = tf.nn.relu(fc_bn)
print(fc_bn_relu)  # Tensor("Relu:0", shape=(?, 1024), dtype=float32)


2D卷积(CNN)层情况

# Input: 640x480 RGB images (whitened input, hence tf.float32).
INPUT_HEIGHT = 480
INPUT_WIDTH = 640
INPUT_CHANNELS = 3
u = tf.placeholder(tf.float32, shape=(None, INPUT_HEIGHT, INPUT_WIDTH, INPUT_CHANNELS))

# CNN params: wights only, no bias as per [Ioffe & Szegedy 2015].
CNN_FILTER_HEIGHT = 3  # Space dimension.
CNN_FILTER_WIDTH = 3  # Space dimension.
CNN_FILTERS = 128
w = tf.Variable(tf.truncated_normal(
    [CNN_FILTER_HEIGHT, CNN_FILTER_WIDTH, INPUT_CHANNELS, CNN_FILTERS],
    dtype=tf.float32, stddev=1e-1))

# Layer output with no activation function (yet).
CNN_LAYER_STRIDE_VERTICAL = 1
CNN_LAYER_STRIDE_HORIZONTAL = 1
CNN_LAYER_PADDING = 'SAME'
cnn = tf.nn.conv2d(
    input=u, filter=w,
    strides=[1, CNN_LAYER_STRIDE_VERTICAL, CNN_LAYER_STRIDE_HORIZONTAL, 1],
    padding=CNN_LAYER_PADDING)

# Batch normalization.
cnn_bn = tf.contrib.layers.batch_norm(
    cnn,
    data_format='NHWC',  # Matching the "cnn" tensor which has shape (?, 480, 640, 128).
    center=True,
    scale=True,
    is_training=training,
    scope='cnn-batch_norm')

# Activation function.
cnn_bn_relu = tf.nn.relu(cnn_bn)
print(cnn_bn_relu)  # Tensor("Relu_1:0", shape=(?, 480, 640, 128), dtype=float32)


3D卷积(CNN3D)层案例

# Input: sequence of 9 160x120 RGB images (whitened input, hence tf.float32).
INPUT_SEQ_LENGTH = 9
INPUT_HEIGHT = 120
INPUT_WIDTH = 160
INPUT_CHANNELS = 3
u = tf.placeholder(tf.float32, shape=(None, INPUT_SEQ_LENGTH, INPUT_HEIGHT, INPUT_WIDTH, INPUT_CHANNELS))

# CNN params: wights only, no bias as per [Ioffe & Szegedy 2015].
CNN3D_FILTER_LENGHT = 3  # Time dimension.
CNN3D_FILTER_HEIGHT = 3  # Space dimension.
CNN3D_FILTER_WIDTH = 3  # Space dimension.
CNN3D_FILTERS = 96
w = tf.Variable(tf.truncated_normal(
    [CNN3D_FILTER_LENGHT, CNN3D_FILTER_HEIGHT, CNN3D_FILTER_WIDTH, INPUT_CHANNELS, CNN3D_FILTERS],
    dtype=tf.float32, stddev=1e-1))

# Layer output with no activation function (yet).
CNN3D_LAYER_STRIDE_TEMPORAL = 1
CNN3D_LAYER_STRIDE_VERTICAL = 1
CNN3D_LAYER_STRIDE_HORIZONTAL = 1
CNN3D_LAYER_PADDING = 'SAME'
cnn3d = tf.nn.conv3d(
    input=u, filter=w,
    strides=[1, CNN3D_LAYER_STRIDE_TEMPORAL, CNN3D_LAYER_STRIDE_VERTICAL, CNN3D_LAYER_STRIDE_HORIZONTAL, 1],
    padding=CNN3D_LAYER_PADDING)

# Batch normalization.
cnn3d_bn = tf.contrib.layers.batch_norm(
    cnn3d,
    data_format='NHWC',  # Matching the "cnn" tensor which has shape (?, 9, 120, 160, 96).
    center=True,
    scale=True,
    is_training=training,
    scope='cnn3d-batch_norm')

# Activation function.
cnn3d_bn_relu = tf.nn.relu(cnn3d_bn)
print(cnn3d_bn_relu)  # Tensor("Relu_2:0", shape=(?, 9, 120, 160, 96), dtype=float32)


我想确定的是上面的代码是否完全实现了批次规范化,如[Ioffe&Szegedy 2015]中所述.3.2:


  对于卷积层,我们还希望归一化遵循卷积属性 - 以便在不同位置对同一特征映射的不同元素以相同方式进行归一化.为实现这一目标,我们联合规范了所有地点的小批量活动.[...] Alg.类似地修改图2,使得在推理期间,BN变换对给定特征图中的每个激活应用相同的线性变换.


更新 
我猜上面的代码对于3D转换情况也是正确的.事实上,当我定义我的模型时,如果我打印所有可训练的变量,我也会看到β和γ变量的预期数量.例如:

Tensor("conv3a/conv3d_weights/read:0", shape=(3, 3, 3, 128, 256), dtype=float32)
Tensor("BatchNorm_2/beta/read:0", shape=(256,), dtype=float32)
Tensor("BatchNorm_2/gamma/read:0", shape=(256,), dtype=float32)


这对我来说没问题,因为由于BN,每个特征映射都学习了一对beta和gamma(总共256个).



[Ioffe&Szegedy 2015]:批量标准化:通过减少内部协变量转换来加速深度网络训练



    

    

    
        推荐阅读
        
            
                                
                    
                        程序员
                        是否可以在没有VPC的情况下启动RDS实例？
                    

                    
                                                
                        如何解决《是否可以在没有VPC的情况下启动RDS实例？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        为什么onActivityResult总是返回0,即使按下确定按钮？
                    

                    
                                                
                        如何解决《为什么onActivityResult总是返回0,即使按下确定按钮？》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        CSS中边框底部的曲线末端
                    

                    
                                                
                            
                        
                                                
                        如何解决《CSS中边框底部的曲线末端》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何从我的应用程序传递和检索内存流到DLL？
                    

                    
                                                
                        如何解决《如何从我的应用程序传递和检索内存流到DLL？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Swift 2协议扩展使用
                    

                    
                                                
                        如何解决《Swift2协议扩展使用》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何将错误标记为不可重现？
                    

                    
                                                
                        如何解决《如何将错误标记为不可重现？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        从命令行运行的Windows上的Python 3安装
                    

                    
                                                
                        如何解决《从命令行运行的Windows上的Python3安装》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        重定向到Firebase托管自定义域
                    

                    
                                                
                        如何解决《重定向到Firebase托管自定义域》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        foo，bar，baz等的含义
                    

                    
                                                
                        如何解决《foo，bar，baz等的含义》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        从文本文件中读取一行会返回不需要的斜杠
                    

                    
                                                
                            
                        
                                                
                        如何解决《从文本文件中读取一行会返回不需要的斜杠》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何从C++中的单独线程发布要在Android主线程上运行的代码？
                    

                    
                                                
                        如何解决《如何从C++中的单独线程发布要在Android主线程上运行的代码？》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何使用Firebase的新bolt编译器定义索引
                    

                    
                                                
                        如何解决《如何使用Firebase的新bolt编译器定义索引》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        将某个JSON值映射到Enum值C#
                    

                    
                                                
                        如何解决《将某个JSON值映射到Enum值C#》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        PMA 4.5.2.0 file_exists():open_basedir限制生效
                    

                    
                                                
                        如何解决《PMA4.5.2.0file_exists():open_basedir限制生效》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Nginx无法将Docker部署到亚马逊
                    

                    
                                                
                        如何解决《Nginx无法将Docker部署到亚马逊》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        TLS变量上的"非常线程局部引用常规符号"错误
                    

                    
                                                
                        如何解决《TLS变量上的"非常线程局部引用常规符号"错误》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        使用BouncyCastle和GnuPG 2.1的`pubring.kbx`文件
                    

                    
                                                
                        如何解决《使用BouncyCastle和GnuPG2.1的`pubring.kbx`文件》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Null检查Linq中的String.ToLower表达式
                    

                    
                                                
                        如何解决《Null检查Linq中的String.ToLower表达式》经验，为你挑选了2个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        控制图例中的行数
                    

                    
                                                
                            
                        
                                                
                        如何解决《控制图例中的行数》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        无法ping泊坞窗容器
                    

                    
                                                
                        如何解决《无法ping泊坞窗容器》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                

            
        
    

    
        吐了个 "CAO" !
        
            
                吐个槽吧,看都看了
            
            
                
                                        会员登录 | 用户注册
























    

    
        
            
            
                
                    
                
            

            
                低调pasta_730            

            
                这个屌丝很懒，什么也没留下！            
            
            

                                
                    
                    关注作者
                            

        
    


    
        Tags | 热门标签
        
            
                                
                    actionscrip
                
                                
                    bash
                
                                
                    c#
                
                                
                    c++
                
                                
                    c语言
                
                                
                    erlang
                
                                
                    flutter
                
                                
                    go
                
                                
                    golang
                
                                
                    java
                
                                
                    javascript
                
                                
                    lua
                
                                
                    node.js
                
                                
                    perl
                
                                
                    php
                
                                
                    python
                
                                
                    scala
                
                                
                    typescript
                
                                
            
        
    


    
        RankList | 热门文章
        
            
                                
                    1循环遍历列表会抛出超出界限的异常C#
                
                                
                    2程序执行后如何删除"完成"消息？
                
                                
                    3我的旧网站是否被正确重定向？
                
                                
                    4java.util.HashMap在Kotlin中没有实现java.util.Map吗？
                
                                
                    5是否有返回ES6承诺的setTimeout版本？
                
                                
                    6`std :: terminate`如何知道特别处理`std :: exception`s？
                
                                
                    7LLVM(3.5+)PassManager与LegacyPassManager
                
                                
                    8如何获得ESPN开发人员密钥？
                
                                
                    9iOS可重用组件
                
                                
                    10cqrs与cqs之间的差异
                
                                
                    11使用javascript或jquery模拟ctrl +单击(打开没有焦点的新选项卡)
                
                                
                    12使用ggplot2插入地图
                
                                
                    13Xcode项目中的Jpeg图片报告无效
                
                                
                    14lubridate masking dplyr"union"但加载时没有掩码消息
                
                                
                    15c ++函数指针没有改变
                
                                
                    16只需使用Immutable.js将对象分配给变量,即可克隆新对象
                
                                
                    17如何应对竞争条件
                
                                
                    18一个TickObject到底是什么？如何防止它成为内存泄漏？
                
                                
                    193-D笛卡尔指向2-D半球形并计算2-D Voronoi单元的面积
                
                                
                    20对象初始值设定项中的属性赋值与C#6中的自动属性不在同一级别上