6赞

Pytorch中Tensor与各种图像格式的相互转化详解

作者：雨天是最美 | 2022-12-26 13:11

这篇文章主要介绍了Pytorch中Tensor与各种图像格式的相互转化详解，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

前言

在pytorch中经常会遇到图像格式的转化，例如将PIL库读取出来的图片转化为Tensor，亦或者将Tensor转化为numpy格式的图片。而且使用不同图像处理库读取出来的图片格式也不相同，因此，如何在pytorch中正确转化各种图片格式(PIL、numpy、Tensor)是一个在调试中比较重要的问题。

本文主要说明在pytorch中如何正确将图片格式在各种图像库读取格式以及tensor向量之间转化的问题。以下代码经过测试都可以在Pytorch-0.4.0或0.3.0版本直接使用。

对python不同的图像库读取格式有疑问可以看这里：https://www.jb51.net/article/177288.htm

格式转换

我们一般在pytorch或者python中处理的图像无非这几种格式：

PIL：使用python自带图像处理库读取出来的图片格式
numpy：使用python-opencv库读取出来的图片格式
tensor：pytorch中训练时所采取的向量格式（当然也可以说图片）

注意，之后的讲解图片格式皆为RGB三通道，24-bit真彩色，也就是我们平常使用的图片形式。

PIL与Tensor

PIL与Tensor的转换相对容易些，因为pytorch已经提供了相关的代码，我们只需要搭配使用即可：

所有代码都已经引用了（之后的代码省略引用部分）：

import torch
from PIL import Image
import matplotlib.pyplot as plt

# loader使用torchvision中自带的transforms函数
loader = transforms.Compose([
  transforms.ToTensor()]) 

unloader = transforms.ToPILImage()

1 PIL读取图片转化为Tensor

# 输入图片地址
# 返回tensor变量
def image_loader(image_name):
  image = Image.open(image_name).convert('RGB')
  image = loader(image).unsqueeze(0)
  return image.to(device, torch.float)

2 将PIL图片转化为Tensor

# 输入PIL格式图片
# 返回tensor变量
def PIL_to_tensor(image):
  image = loader(image).unsqueeze(0)
  return image.to(device, torch.float)

3 Tensor转化为PIL图片

# 输入tensor变量
# 输出PIL格式图片
def tensor_to_PIL(tensor):
  image = tensor.cpu().clone()
  image = image.squeeze(0)
  image = unloader(image)
  return image

4 直接展示tensor格式图片

def imshow(tensor, title=None):
  image = tensor.cpu().clone() # we clone the tensor to not do changes on it
  image = image.squeeze(0) # remove the fake batch dimension
  image = unloader(image)
  plt.imshow(image)
  if title is not None:
    plt.title(title)
  plt.pause(0.001) # pause a bit so that plots are updated

5 直接保存tensor格式图片

def save_image(tensor, **para):
  dir = 'results'
  image = tensor.cpu().clone() # we clone the tensor to not do changes on it
  image = image.squeeze(0) # remove the fake batch dimension
  image = unloader(image)
  if not osp.exists(dir):
    os.makedirs(dir)
  image.save('results_{}/s{}-c{}-l{}-e{}-sl{:4f}-cl{:4f}.jpg'
        .format(num, para['style_weight'], para['content_weight'], para['lr'], para['epoch'],
            para['style_loss'], para['content_loss']))

numpy与Tensor

numpy格式是使用cv2，也就是python-opencv库读取出来的图片格式，需要注意的是用python-opencv读取出来的图片和使用PIL读取出来的图片数据略微不同，经测试用python-opencv读取出来的图片在训练时的效果比使用PIL读取出来的略差一些(详细过程之后发布)。

之后所有代码引用：

import cv2
import torch
import matplotlib.pyplot as plt

numpy转化为tensor

def toTensor(img):
  assert type(img) == np.ndarray,'the img type is {}, but ndarry expected'.format(type(img))
  img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
  img = torch.from_numpy(img.transpose((2, 0, 1)))
  return img.float().div(255).unsqueeze(0) # 255也可以改为256

tensor转化为numpy

def tensor_to_np(tensor):
  img = tensor.mul(255).byte()
  img = img.cpu().numpy().squeeze(0).transpose((1, 2, 0))
  return img

展示numpy格式图片

def show_from_cv(img, title=None):
  img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
  plt.figure()
  plt.imshow(img)
  if title is not None:
    plt.title(title)
  plt.pause(0.001)

展示tensor格式图片

def show_from_tensor(tensor, title=None):
  img = tensor.clone()
  img = tensor_to_np(img)
  plt.figure()
  plt.imshow(img)
  if title is not None:
    plt.title(title)
  plt.pause(0.001)

注意

上面介绍的都是一张图片的转化，如果是n张图片一起的话，只需要修改一下相应代码即可。

举个例子，将之前说过的修改略微修改一下即可：

# 将 N x H x W X C 的numpy格式图片转化为相应的tensor格式
def toTensor(img):
  img = torch.from_numpy(img.transpose((0, 3, 1, 2)))
  return img.float().div(255).unsqueeze(0)

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

推荐阅读

程序员
Java内存不足自动堆转储文件名

如何解决《Java内存不足自动堆转储文件名》经验，为你挑选了2个好方法。 ... [详细]
程序员
由双指针创建的C++ 2d数组

如何解决《由双指针创建的C++2d数组》经验，为你挑选了1个好方法。 ... [详细]
程序员
与Unity使用Facebook插件时的ActivityNotFoundException

如何解决《与Unity使用Facebook插件时的ActivityNotFoundException》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用C#在Mac上开始使用Sitecore CMS进行开发

如何解决《使用C#在Mac上开始使用SitecoreCMS进行开发》经验，为你挑选了1个好方法。 ... [详细]
程序员
Sails不会创建mysql表

如何解决《Sails不会创建mysql表》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何修复travis.yml中拒绝的gradlew权限？

如何解决《如何修复travis.yml中拒绝的gradlew权限？》经验，为你挑选了1个好方法。 ... [详细]
程序员
-e和-ne在bash脚本中的含义是什么？

如何解决《-e和-ne在bash脚本中的含义是什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用嵌入式Tomcat 7在Spring Boot中启用SSL - FileNotFoundException和oacoyote.http11.Http11NioProtocol问题

如何解决《使用嵌入式Tomcat7在SpringBoot中启用SSL-FileNotFoundException和oacoyote.http11.Http11NioProtocol问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
普通开发人员如何尝试isPermissionRevokedByPolicy()？

如何解决《普通开发人员如何尝试isPermissionRevokedByPolicy()？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Rcpp将包从建筑物恢复到Rstudio中没有Rcpp的建筑物

如何解决《使用Rcpp将包从建筑物恢复到Rstudio中没有Rcpp的建筑物》经验，为你挑选了1个好方法。 ... [详细]
程序员
Nginx规则添加x-robots-tag标头

如何解决《Nginx规则添加x-robots-tag标头》经验，为你挑选了1个好方法。 ... [详细]
程序员
Intellij Scala类定义格式

如何解决《IntellijScala类定义格式》经验，为你挑选了0个好方法。 ... [详细]
程序员
是否有一个等效于R的sample()函数的Python？

如何解决《是否有一个等效于R的sample()函数的Python？》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用ffmpeg快速检查目录中视频文件的完整性

如何解决《使用ffmpeg快速检查目录中视频文件的完整性》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在pyspark中更改数据框列名？

如何解决《如何在pyspark中更改数据框列名？》经验，为你挑选了8个好方法。 ... [详细]
程序员
使用'bool'而不是'Boolean'的JQuery Typescript定义

如何解决《使用'bool'而不是'Boolean'的JQueryTypescript定义》经验，为你挑选了2个好方法。 ... [详细]
程序员
是否可以在JavaScript中的变量名后面的新行上开始方法链接？

如何解决《是否可以在JavaScript中的变量名后面的新行上开始方法链接？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在javascript中将float转换为int的最快方法？

如何解决《在javascript中将float转换为int的最快方法？》经验，为你挑选了2个好方法。 ... [详细]
程序员
不使用cocoapods下载gos for ios

如何解决《不使用cocoapods下载gosforios》经验，为你挑选了0个好方法。 ... [详细]
程序员
vim:gq在包装文本时忽略打开的引号

如何解决《vim:gq在包装文本时忽略打开的引号》经验，为你挑选了0个好方法。 ... [详细]

雨天是最美

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章