14赞

pytorch多进程加速及代码优化方法

作者：惬听风吟jyy_802 | 2022-01-26 06:10

今天小编就为大家分享一篇pytorch多进程加速及代码优化方法。具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

目标：优化代码，利用多进程，进行近实时预处理、网络预测及后处理：

本人尝试了pytorch的multiprocessing，进行多进程同步处理以上任务。

from torch.multiprocessing import Pool,Manager

为了进行各进程间的通信，使用Queue，作为数据传输载体。

  manager = Manager()
  input_queue = manager.Queue()
  output_queue = manager.Queue()

  show_queue = manager.Queue()

即将预处理进程处理后的图像放进 input_queue，而网络预测进程实时获取 input_queue队列中的数据，一旦放入，就从中取出，输入网络：

while 1：

  input = input_queue.get()

同理，将网络输出放入output_queue，再由后处理进程实时获取并进行后处理，处理后，放入show_queue

从而实现了多进程同步进行预处理、网络预测及后处理，加速了网络实时预测的表现。

问题及解决方案：

1. pytorch cuda报错，re-initialization报错问题：

习惯了在一开始将模型先加载进来放入gpu中，所以模型在主线程就完成了初始化，但是调用网络是在网络预测子进程进行的，就会导致跨进程重复初始化失败。

解决方案：

直接在子进程开始时初始化，其他进程可以设置个延时，等网络初始化好后再开始运行。

同理，数据输入网络也是同样的在子进程进行。

2. python3多进程编程，子进程不报错问题：

一开始总是代码运行起来什么都不出现，就开始各种debug，但因为python3中子进程不报错，出错了就卡在那里，就每次自己找bug很麻烦，所以就急需子进程的报错信息。

解决方案：

用try except组合，来打印子进程中某段程序错误，如下：

      try:
        out = forward(input_img,model,1)
      except Exception as error:
        print(error)

3.进程完全不运行时，考虑是否是输入设置的问题，即当单变量输入时，后面要加都好，如：

pool.apply_async(load_frame,args=(input_queue,))

如果是pool.apply_async(load_frame,args=(input_queue))则该进程不会启动运行。

4. 一开始想优化cv2.resize，想用gpu下的tensor的resize_代替，但发现这种方式和numpy.resize一脉相承啊，根本不是我们想要的resize，如果是变大的话，这种resize会直接按顺序填，然后剩下的就填0，实在是太草率了。。。

解决方案：还没有很好的替代方案，只找了一下，cuda::resize，但是好像貌似没有python接口，要是混合编程好像有点小题大做，得不偿失了。如果各位有较好的方案，欢迎指点迷津。

以上这篇pytorch多进程加速及代码优化方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

推荐阅读

程序员
在Phoenix Framework(Elixir)中实现图库

如何解决《在PhoenixFramework(Elixir)中实现图库》经验，为你挑选了1个好方法。 ... [详细]
程序员
PHP XDEBUG未启用

如何解决《PHPXDEBUG未启用》经验，为你挑选了1个好方法。 ... [详细]
程序员
Linq Lambda Where子句在where子句中

如何解决《LinqLambdaWhere子句在where子句中》经验，为你挑选了1个好方法。 ... [详细]
程序员
两个ImageView出现在Navigation标题中,而我只在xml中设置了一个

如何解决《两个ImageView出现在Navigation标题中,而我只在xml中设置了一个》经验，为你挑选了1个好方法。 ... [详细]
程序员
在ios的背景中连续显示"打开蓝牙以允许应用程序连接到附件"警报消息

如何解决《在ios的背景中连续显示"打开蓝牙以允许应用程序连接到附件"警报消息》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何检查javascript数组中是否存在密钥？

如何解决《如何检查javascript数组中是否存在密钥？》经验，为你挑选了2个好方法。 ... [详细]
程序员
按位AND和OR运算的说明

如何解决《按位AND和OR运算的说明》经验，为你挑选了1个好方法。 ... [详细]
程序员
max在一组列表上做了什么？

如何解决《max在一组列表上做了什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在R中的函数中保存单个对象：RData文件的大小非常大

如何解决《在R中的函数中保存单个对象：RData文件的大小非常大》经验，为你挑选了1个好方法。 ... [详细]
程序员
以4k(3840*2160)分辨率缩放Tkinter GUI？

如何解决《以4k(3840*2160)分辨率缩放TkinterGUI？》经验，为你挑选了1个好方法。 ... [详细]
程序员
基于已安装的引擎,使用url_for获取基于约束的url

如何解决《基于已安装的引擎,使用url_for获取基于约束的url》经验，为你挑选了1个好方法。 ... [详细]
程序员
当app强制退出时如何恢复下载？

如何解决《当app强制退出时如何恢复下载？》经验，为你挑选了0个好方法。 ... [详细]
程序员
改变Tx蓝牙Linux无效

如何解决《改变Tx蓝牙Linux无效》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Aurelia repeat.for中有条件地添加或删除CSS类？

如何解决《如何在Aureliarepeat.for中有条件地添加或删除CSS类？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ForkJoinPool.invoke()和ForkJoinTask.invoke()或compute()

如何解决《ForkJoinPool.invoke()和ForkJoinTask.invoke()或compute()》经验，为你挑选了1个好方法。 ... [详细]
程序员
多个广告尺寸的Google广告会导致失败

如何解决《多个广告尺寸的Google广告会导致失败》经验，为你挑选了0个好方法。 ... [详细]
程序员
正则表达式(C#)对于RFC 4180的CSV

如何解决《正则表达式(C#)对于RFC4180的CSV》经验，为你挑选了0个好方法。 ... [详细]
程序员
IntelliJ - 查找未记录的公共方法

如何解决《IntelliJ-查找未记录的公共方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
与'wss:// ...'的WebSocket连接失败:连接建立错误:net :: ERR_CONNECTION_CLOSED

如何解决《与'wss://'的WebSocket连接失败:连接建立错误:net::ERR_CONNECTION_CLOSED》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么要将String转换为String？

如何解决《为什么要将String转换为String？》经验，为你挑选了1个好方法。 ... [详细]

惬听风吟jyy_802

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章