9赞

浅谈tensorflow之内存暴涨问题

作者：李桂平2402851397 | 2021-10-27 05:18

今天小编就为大家分享一篇浅谈tensorflow之内存暴涨问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

在用tensorflow实现一些模型的时候，有时候我们在运行程序的时候，会发现程序占用的内存在不断增长。最后内存溢出，程序被kill掉了。

这个问题，其实有两个可能性。一个是比较常见，同时也是很难发现的。这个问题的解决，需要我们知道tensorflow在构图的时候，是没有所谓的临时变量的，只要有operator。那么tensorflow就会在构建的图中增加这个operator所代表的节点。所以，在运行程序的过程中，内存不断增长的原因就是在模型训练迭代的过程中，tensorflow一直在帮你增加图的节点。导致内存占用越来越多。

那么什么情况下就会像上面说的那样呢？我们举个例子：

import tensorflow as tf

x = tf.Variable(tf.constant(1))
y = tf.constant(2)
sess = tf.Session()
sess.run(tf.global_variables_initializer())

while True:
 print(sess.run(x+y))

如果你运行上面这段代码，会发现在运行的过程中，内存占用越来越大。原因就在于sess.run(x+y)这个语句。我们知道在tensorflow中，所有的操作都是graph的节点。而在迭代的过程中，x+y这个operator(操作)是匿名的，所以它会不断地重复，在graph中创建节点，导致内存占用越来越大。

所以要对上面的代码进行修改：

z = x+y
while True:
 print(sess.run(z))

这样就不会出现问题了。

上面只是一个简单的例子，我们可以很快发现问题。但是有时候我们的模型比较复杂，很难判断是否在迭代的过程中一直在增加节点。那怎么办呢？

其实在tensorflow里面有个函数叫做：

sess.graph.finalize()

只要每一次构图完成后，调用这个函数。然后运行程序，如果你的程序在运行的过程中还一直新建节点，这个函数就会检测到，然后就会报错。这样你就知道你的程序中一定有不合理的地方。

另一个导致内存暴涨的原因是，数据的加载问题。tensorflow现在有一个API接口，tf.data.Dataset 。这个接口里面有个函数叫做cache(filename)。cache函数的作用是将加载进来的数据存放到filename指定的地方。但是如果我们没有指定filename，数据就是一直存储在内存中。所以，随着迭代次数的增加，存储在内存中的数据越来越多，就会导致内存暴涨。所以要么不要使用这个函数，要么就要记得添加filename参数。

以上这篇浅谈tensorflow之内存暴涨问题就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

推荐阅读

程序员
iOS Core Audio AUAudioUnit和AVAudioUnit有什么区别？

如何解决《iOSCoreAudioAUAudioUnit和AVAudioUnit有什么区别？》经验，为你挑选了1个好方法。 ... [详细]
程序员
泛型超类和超类类型的区别

如何解决《泛型超类和超类类型的区别》经验，为你挑选了2个好方法。 ... [详细]
程序员
错误:'operator =='的模糊重载

如何解决《错误:'operator=='的模糊重载》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何更改Visual Studio代码中的缩进？

如何解决《如何更改VisualStudio代码中的缩进？》经验，为你挑选了5个好方法。 ... [详细]
程序员
从字符串右侧删除一定数量的零

如何解决《从字符串右侧删除一定数量的零》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用已删除的复制构造函数和初始化列表重载调用类定义中的成员构造函数

如何解决《使用已删除的复制构造函数和初始化列表重载调用类定义中的成员构造函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用DNX和ASP.NET 5实现持续交付

如何解决《如何使用DNX和ASP.NET5实现持续交付》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何用里面的两个视图刷新SwipeRefreshLayout

如何解决《如何用里面的两个视图刷新SwipeRefreshLayout》经验，为你挑选了1个好方法。 ... [详细]
程序员
Laravel Eloquent:如何在Json响应中生成假列？

如何解决《LaravelEloquent:如何在Json响应中生成假列？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ES6模块:重新导出为对象

如何解决《ES6模块:重新导出为对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何检查证书是否自签名？

如何解决《如何检查证书是否自签名？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用参考参数

如何解决《使用参考参数》经验，为你挑选了1个好方法。 ... [详细]
程序员
PyQt4:如何在发出信号之前暂停线程？

如何解决《PyQt4:如何在发出信号之前暂停线程？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Docker构建参数

如何解决《Docker构建参数》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在我的Mac OSX上安装PHP扩展"pcntl"

如何解决《如何在我的MacOSX上安装PHP扩展"pcntl"》经验，为你挑选了1个好方法。 ... [详细]
程序员
spring jdbctemplate get byte array

如何解决《springjdbctemplategetbytearray》经验，为你挑选了0个好方法。 ... [详细]
程序员
SQL datetime比较

如何解决《SQLdatetime比较》经验，为你挑选了2个好方法。 ... [详细]
程序员
按Java 8中的Map列表分组

如何解决《按Java8中的Map列表分组》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python字符串文字串联

如何解决《Python字符串文字串联》经验，为你挑选了1个好方法。 ... [详细]
程序员
doctrine ORM count arraycollection in where condition

如何解决《doctrineORMcountarraycollectioninwherecondition》经验，为你挑选了0个好方法。 ... [详细]

李桂平2402851397

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章