15赞

pytorch 图像中的数据预处理和批标准化实例

作者：云聪京初瑞子_617 | 2021-10-21 16:55

今天小编就为大家分享一篇pytorch图像中的数据预处理和批标准化实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

目前数据预处理最常见的方法就是中心化和标准化。

中心化相当于修正数据的中心位置，实现方法非常简单，就是在每个特征维度上减去对应的均值，最后得到 0 均值的特征。

标准化也非常简单，在数据变成 0 均值之后，为了使得不同的特征维度有着相同的规模，可以除以标准差近似为一个标准正态分布，也可以依据最大值和最小值将其转化为 -1 ~ 1 之间

批标准化：BN

在数据预处理的时候，我们尽量输入特征不相关且满足一个标准的正态分布，这样模型的表现一般也较好。但是对于很深的网路结构，网路的非线性层会使得输出的结果变得相关，且不再满足一个标准的 N(0, 1) 的分布，甚至输出的中心已经发生了偏移，这对于模型的训练，特别是深层的模型训练非常的困难。

所以在 2015 年一篇论文提出了这个方法，批标准化，简而言之，就是对于每一层网络的输出，对其做一个归一化，使其服从标准的正态分布，这样后一层网络的输入也是一个标准的正态分布，所以能够比较好的进行训练，加快收敛速度。

batch normalization 的实现非常简单，接下来写一下对应的python代码：

import sys
sys.path.append('..')
 
import torch
 
def simple_batch_norm_1d(x, gamma, beta):
  eps = 1e-5
  x_mean = torch.mean(x, dim=0, keepdim=True) # 保留维度进行 broadcast
  x_var = torch.mean((x - x_mean) ** 2, dim=0, keepdim=True)
  x_hat = (x - x_mean) / torch.sqrt(x_var + eps)
  return gamma.view_as(x_mean) * x_hat + beta.view_as(x_mean)
   
x = torch.arange(15).view(5, 3)
gamma = torch.ones(x.shape[1])
beta = torch.zeros(x.shape[1])
print('before bn: ')
print(x)
y = simple_batch_norm_1d(x, gamma, beta)
print('after bn: ')
print(y)

测试的时候该使用批标准化吗？

答案是肯定的，因为训练的时候使用了，而测试的时候不使用肯定会导致结果出现偏差，但是测试的时候如果只有一个数据集，那么均值不就是这个值，方差为 0 吗？这显然是随机的，所以测试的时候不能用测试的数据集去算均值和方差，而是用训练的时候算出的移动平均均值和方差去代替

下面我们实现以下能够区分训练状态和测试状态的批标准化方法

def batch_norm_1d(x, gamma, beta, is_training, moving_mean, moving_var, moving_momentum=0.1):
  eps = 1e-5
  x_mean = torch.mean(x, dim=0, keepdim=True) # 保留维度进行 broadcast
  x_var = torch.mean((x - x_mean) ** 2, dim=0, keepdim=True)
  if is_training:
    x_hat = (x - x_mean) / torch.sqrt(x_var + eps)
    moving_mean[:] = moving_momentum * moving_mean + (1. - moving_momentum) * x_mean
    moving_var[:] = moving_momentum * moving_var + (1. - moving_momentum) * x_var
  else:
    x_hat = (x - moving_mean) / torch.sqrt(moving_var + eps)
  return gamma.view_as(x_mean) * x_hat + beta.view_as(x_mean)

下面我们在卷积网络下试用一下批标准化看看效果

def data_tf(x):
  x = np.array(x, dtype='float32') / 255
  x = (x - 0.5) / 0.5 # 数据预处理，标准化
  x = torch.from_numpy(x)
  x = x.unsqueeze(0)
  return x
 
train_set = mnist.MNIST('./data', train=True, transform=data_tf, download=True) # 重新载入数据集，申明定义的数据变换
test_set = mnist.MNIST('./data', train=False, transform=data_tf, download=True)
train_data = DataLoader(train_set, batch_size=64, shuffle=True)
test_data = DataLoader(test_set, batch_size=128, shuffle=False)
# 使用批标准化
class conv_bn_net(nn.Module):
  def __init__(self):
    super(conv_bn_net, self).__init__()
    self.stage1 = nn.Sequential(
      nn.Conv2d(1, 6, 3, padding=1),
      nn.BatchNorm2d(6),
      nn.ReLU(True),
      nn.MaxPool2d(2, 2),
      nn.Conv2d(6, 16, 5),
      nn.BatchNorm2d(16),
      nn.ReLU(True),
      nn.MaxPool2d(2, 2)
    )
    
    self.classfy = nn.Linear(400, 10)
  def forward(self, x):
    x = self.stage1(x)
    x = x.view(x.shape[0], -1)
    x = self.classfy(x)
    return x
 
net = conv_bn_net()
optimizer = torch.optim.SGD(net.parameters(), 1e-1) # 使用随机梯度下降，学习率 0.1
 
 
train(net, train_data, test_data, 5, optimizer, criterion)

以上这篇pytorch 图像中的数据预处理和批标准化实例就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

推荐阅读

程序员
[iOS]:检测视图控制器何时从另一个外部应用程序返回后出现

如何解决《[iOS]:检测视图控制器何时从另一个外部应用程序返回后出现》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用jquery或javascript从html表中删除文本框而不会丢失文本框值

如何解决《如何使用jquery或javascript从html表中删除文本框而不会丢失文本框值》经验，为你挑选了1个好方法。 ... [详细]
程序员
for stylus for CSS选择器名称的循环

如何解决《forstylusforCSS选择器名称的循环》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用控制台在React Native Android中调试Java代码

如何解决《如何使用控制台在ReactNativeAndroid中调试Java代码》经验，为你挑选了1个好方法。 ... [详细]
程序员
打印单击按钮的文本tkinter

如何解决《打印单击按钮的文本tkinter》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何正确编写递归jquery承诺的代码

如何解决《如何正确编写递归jquery承诺的代码》经验，为你挑选了0个好方法。 ... [详细]
程序员
样式本机JavaScript通知

如何解决《样式本机JavaScript通知》经验，为你挑选了0个好方法。 ... [详细]
程序员
具有外部身份验证的AWS API Gateway

如何解决《具有外部身份验证的AWSAPIGateway》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何明确地广播张量以匹配张量流中的另一个形状？

如何解决《如何明确地广播张量以匹配张量流中的另一个形状？》经验，为你挑选了1个好方法。 ... [详细]
程序员
字符串在Javascript中无法正确排序

如何解决《字符串在Javascript中无法正确排序》经验，为你挑选了1个好方法。 ... [详细]
程序员
UWP:你如何降低所选图像的质量？

如何解决《UWP:你如何降低所选图像的质量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在android测试上重启应用程序

如何解决《在android测试上重启应用程序》经验，为你挑选了0个好方法。 ... [详细]
程序员
VS 2015的RESTful Web服务

如何解决《VS2015的RESTfulWeb服务》经验，为你挑选了1个好方法。 ... [详细]
程序员
laravel 5中的VARCHAR max

如何解决《laravel5中的VARCHARmax》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将ICollection <T>转换为IReadOnlyCollection <T>？

如何解决《如何将ICollection<T>转换为IReadOnlyCollection<T>？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在haskell中使用ffmpeg-light查找mp4元数据？

如何解决《如何在haskell中使用ffmpeg-light查找mp4元数据？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在获取路由中将默认参数传递给laravel控制器

如何解决《如何在获取路由中将默认参数传递给laravel控制器》经验，为你挑选了1个好方法。 ... [详细]
程序员
尝试在Chrome中调试时,React Native Android崩溃

如何解决《尝试在Chrome中调试时,ReactNativeAndroid崩溃》经验，为你挑选了0个好方法。 ... [详细]
程序员
pyspark将列拆分为多个没有pandas的列

如何解决《pyspark将列拆分为多个没有pandas的列》经验，为你挑选了1个好方法。 ... [详细]
程序员
表单提交后加载模式

如何解决《表单提交后加载模式》经验，为你挑选了2个好方法。 ... [详细]

云聪京初瑞子_617

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章