20赞

Tensorflow tf.nn.atrous_conv2d如何实现空洞卷积的

作者：Gbom2402851125 | 2022-02-22 10:15

这篇文章主要介绍了Tensorflowtf.nn.atrous_conv2d如何实现空洞卷积的，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

实验环境：tensorflow版本1.2.0，python2.7

介绍

关于空洞卷积的理论可以查看以下链接，这里我们不详细讲理论：

1.Long J, Shelhamer E, Darrell T, et al. Fully convolutional networks for semantic segmentation[C]. Computer Vision and Pattern Recognition, 2015.

2.Yu, Fisher, and Vladlen Koltun. “Multi-scale context aggregation by dilated convolutions.” arXiv preprint arXiv:1511.07122 (2015).

3.如何理解空洞卷积（dilated convolution）？

其实用一句话概括就是，在不用pooling的情况下扩大感受野（pooling层会导致信息损失）

为了阅读方便再贴一些相关链接：

【TensorFlow】tf.nn.conv2d是怎样实现卷积的？

【TensorFlow】tf.nn.conv2d_transpose是怎样实现反卷积的？

惯例先展示函数：

tf.nn.atrous_conv2d(value,filters,rate,padding,name=None）

除去name参数用以指定该操作的name，与方法有关的一共四个参数：

value：
指需要做卷积的输入图像，要求是一个4维Tensor，具有[batch, height, width, channels]这样的shape，具体含义是[训练时一个batch的图片数量, 图片高度, 图片宽度, 图像通道数]

filters：
相当于CNN中的卷积核，要求是一个4维Tensor，具有[filter_height, filter_width, channels, out_channels]这样的shape，具体含义是[卷积核的高度，卷积核的宽度，图像通道数，卷积核个数]，同理这里第三维channels，就是参数value的第四维

rate：
要求是一个int型的正数，正常的卷积操作应该会有stride（即卷积核的滑动步长），但是空洞卷积是没有stride参数的，这一点尤其要注意。取而代之，它使用了新的rate参数，那么rate参数有什么用呢？它定义为我们在输入图像上卷积时的采样间隔，你可以理解为卷积核当中穿插了（rate-1）数量的“0”，把原来的卷积核插出了很多“洞洞”，这样做卷积时就相当于对原图像的采样间隔变大了。具体怎么插得，可以看后面更加详细的描述。此时我们很容易得出rate=1时，就没有0插入，此时这个函数就变成了普通卷积。

padding：
string类型的量，只能是”SAME”,”VALID”其中之一，这个值决定了不同边缘填充方式。

ok，完了，到这就没有参数了，或许有的小伙伴会问那“stride”参数呢。其实这个函数已经默认了stride=1，也就是滑动步长无法改变，固定为1。

结果返回一个Tensor，填充方式为“VALID”时，返回[batch,height-2*(filter_width-1),width-2*(filter_height-1),out_channels]的Tensor，填充方式为“SAME”时，返回[batch, height, width, out_channels]的Tensor，这个结果怎么得出来的？先不急，我们通过一段程序形象的演示一下空洞卷积。

实验

首先创建一张2通道图

img = tf.constant(value=[[[[1],[2],[3],[4]],[[1],[2],[3],[4]],[[1],[2],[3],[4]],[[1],[2],[3],[4]]]],dtype=tf.float32)
img = tf.concat(values=[img,img],axis=3)

然后用一个3*3卷积核去做卷积

filter = tf.constant(value=1, shape=[3,3,2,5], dtype=tf.float32)
out_img = tf.nn.atrous_conv2d(value=img, filters=filter, rate=1)

建立好了img和filter，就可以做卷积了

out_img = tf.nn.conv2d(input=img, filter=filter, strides=[1,1,1,1], padding='VALID')

输出5个channel，我们设置rate=1，此时空洞卷积可以看做普通的卷积，分别在SAME和VALID模式下输出如下：

ok，调整rate=2，继续运行程序

out_img = tf.nn.atrous_conv2d(value=img, filters=filter, rate=2, padding='SAME')

查看输出结果

[[[[ 16. 16. 16. 16. 16.]
[ 24. 24. 24. 24. 24.]
[ 16. 16. 16. 16. 16.]
[ 24. 24. 24. 24. 24.]]

[[ 16. 16. 16. 16. 16.]
[ 24. 24. 24. 24. 24.]
[ 16. 16. 16. 16. 16.]
[ 24. 24. 24. 24. 24.]]

[[ 16. 16. 16. 16. 16.]
[ 24. 24. 24. 24. 24.]
[ 16. 16. 16. 16. 16.]
[ 24. 24. 24. 24. 24.]]

[[ 16. 16. 16. 16. 16.]
[ 24. 24. 24. 24. 24.]
[ 16. 16. 16. 16. 16.]
[ 24. 24. 24. 24. 24.]]]]

这个结果怎么出来的呢？再用一张图

这里我们看到rate=2时，通过穿插“0”，卷积核由3*3膨胀到了5*5。再看看“VALID”模式下，会发生什么？

直接报错了。因为卷积核的大小已经超过了原图大小

好了，看到这里相信大家对于空洞卷积有了基本的了解了。那么，填充方式为“VALID”时，返回[batch,height-2*(filter_width-1),width-2*(filter_height-1),out_channels]的Tensor，这个结果，相信大家就可以证明了。

代码清单

import tensorflow as tf


img = tf.constant(value=[[[[1],[2],[3],[4]],[[1],[2],[3],[4]],[[1],[2],[3],[4]],[[1],[2],[3],[4]]]],dtype=tf.float32)
img = tf.concat(values=[img,img],axis=3)
filter = tf.constant(value=1, shape=[3,3,2,5], dtype=tf.float32)
out_img1 = tf.nn.atrous_conv2d(value=img, filters=filter, rate=1, padding='SAME')
out_img2 = tf.nn.atrous_conv2d(value=img, filters=filter, rate=1, padding='VALID')
out_img3 = tf.nn.atrous_conv2d(value=img, filters=filter, rate=2, padding='SAME')

#error
#out_img4 = tf.nn.atrous_conv2d(value=img, filters=filter, rate=2, padding='VALID')

with tf.Session() as sess:
  print 'rate=1, SAME mode result:'
  print(sess.run(out_img1))

  print 'rate=1, VALID mode result:'
  print(sess.run(out_img2))

  print 'rate=2, SAME mode result:'
  print(sess.run(out_img3))

  # error
  #print 'rate=2, VALID mode result:'
  #print(sess.run(out_img4))

到此这篇关于Tensorflow tf.nn.atrous_conv2d如何实现空洞卷积的的文章就介绍到这了,更多相关Tensorflow tf.nn.atrous_conv2d空洞卷积内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持！

推荐阅读

程序员
从更高级别提出异常,la警告

如何解决《从更高级别提出异常,la警告》经验，为你挑选了0个好方法。 ... [详细]
程序员
Gulp Browserify中的标准错误日志

如何解决《GulpBrowserify中的标准错误日志》经验，为你挑选了0个好方法。 ... [详细]
程序员
Angular $ http - spring - 抛出异常但http状态为200

如何解决《Angular$http-spring-抛出异常但http状态为200》经验，为你挑选了1个好方法。 ... [详细]
程序员
更新到新Chrome版本后,在Chrome中获取Polymer Error

如何解决《更新到新Chrome版本后,在Chrome中获取PolymerError》经验，为你挑选了0个好方法。 ... [详细]
程序员
Haskell:找不到模块`Data.List.Split'

如何解决《Haskell:找不到模块`Data.List.Split'》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用预训练(Tensorflow)CNN提取特征

如何解决《使用预训练(Tensorflow)CNN提取特征》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从Task返回结果？

如何解决《如何从Task返回结果？》经验，为你挑选了1个好方法。 ... [详细]
程序员
从URL中删除锚标记

如何解决《从URL中删除锚标记》经验，为你挑选了1个好方法。 ... [详细]
程序员
在关闭Go中的应用程序之前是否需要关闭数据库连接？

如何解决《在关闭Go中的应用程序之前是否需要关闭数据库连接？》经验，为你挑选了0个好方法。 ... [详细]
程序员
我在ubuntu中使用sleep函数,但printf函数在while循环中运行得非常慢.为什么？

如何解决《我在ubuntu中使用sleep函数,但printf函数在while循环中运行得非常慢.为什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
缺少权利文件

如何解决《缺少权利文件》经验，为你挑选了2个好方法。 ... [详细]
程序员
Hadoop中的map，shuffle，merge和减少时间的精确定义

如何解决《Hadoop中的map，shuffle，merge和减少时间的精确定义》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在android上使用离线包来反应原生项目？

如何解决《如何在android上使用离线包来反应原生项目？》经验，为你挑选了3个好方法。 ... [详细]
程序员
在Windows 10上运行dot net 3.5应用程序

如何解决《在Windows10上运行dotnet3.5应用程序》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用熊猫和scipy的树状图

如何解决《使用熊猫和scipy的树状图》经验，为你挑选了1个好方法。 ... [详细]
程序员
在java中与弹性城堡的标志文件

如何解决《在java中与弹性城堡的标志文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
float或double值如何存储在C中的变量中？

如何解决《float或double值如何存储在C中的变量中？》经验，为你挑选了2个好方法。 ... [详细]
程序员
将数据注入Phoenix的Action params

如何解决《将数据注入Phoenix的Actionparams》经验，为你挑选了1个好方法。 ... [详细]
程序员
日期时间无效

如何解决《日期时间无效》经验，为你挑选了1个好方法。 ... [详细]
程序员
VB.NET没什么日期时间？DataReader的

如何解决《VB.NET没什么日期时间？DataReader的》经验，为你挑选了1个好方法。 ... [详细]

Gbom2402851125

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章