6赞

TensorFlow实现模型断点训练,checkpoint模型载入方式

作者：惬听风吟jyy_802 | 2021-10-27 04:59

这篇文章主要介绍了TensorFlow实现模型断点训练,checkpoint模型载入方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

深度学习中，模型训练一般都需要很长的时间，由于很多原因，导致模型中断训练，下面介绍继续断点训练的方法。

方法一：载入模型时，不必指定迭代次数，一般默认最新

# 保存模型
saver = tf.train.Saver(max_to_keep=1) # 最多保留最新的模型
 
# 开启会话
with tf.Session() as sess:
 # saver.restore(sess, './log/' + "model_savemodel.cpkt-" + str(20000))
 sess.run(tf.global_variables_initializer())
 ckpt = tf.train.get_checkpoint_state('./log/') # 注意此处是checkpoint存在的目录，千万不要写成‘./log'
 if ckpt and ckpt.model_checkpoint_path:
 saver.restore(sess,ckpt.model_checkpoint_path) # 自动恢复model_checkpoint_path保存模型一般是最新
 print("Model restored...")
 else:
 print('No Model')

方法二：载入时，指定想要载入模型的迭代次数

需要到Log文件夹中，查看当前迭代的次数，如下：此时为111000次。

# 保存模型
saver = tf.train.Saver(max_to_keep=1)
# 开启会话
 
with tf.Session() as sess:
 saver.restore(sess, './log/' + "model_savemodel.cpkt-" + str(111000))
 sess.run(tf.global_variables_initializer())

载入模型后，会继续端点处的变量继续训练，那么是否可以减小剩余的需要的迭代次数？

模型断点训练效果展示：

训练到167000次后，载入模型重新训练。设置迭代次数为10000次，（d_step=1000）。原始设置的迭代的次数为1000000，已经训练了167000次。

Model restored...
Iter:0, D_loss:0.5139875411987305, G_loss:2.8023970127105713
Iter:1000, D_loss:0.4400891065597534, G_loss:2.781547784805298
Iter:2000, D_loss:0.5169454216957092, G_loss:2.58009934425354
Iter:3000, D_loss:0.4507023096084595, G_loss:2.584151268005371
Iter:4000, D_loss:0.5746167898178101, G_loss:2.5365757942199707
Iter:5000, D_loss:0.5288565158843994, G_loss:2.426676034927368
Iter:6000, D_loss:0.549595057964325, G_loss:2.820535659790039
Iter:7000, D_loss:0.32620012760162354, G_loss:2.540236473083496
Iter:8000, D_loss:0.4363398551940918, G_loss:2.5880446434020996
Iter:9000, D_loss:0.569464921951294, G_loss:2.5133447647094727
done！

保存的图片仍然从头开始编号，会覆盖掉之前的图片。

以前对应编号的采样图片为：

若有朋友有高见，还请不吝赐教。

补充知识：tensorflow加载训练好的模型及参数(读取checkpoint)

checkpoint 保存路径

model_path下存有包含多个迭代次数的模型

1.获取最新保存的模型

即上图中的model-9400

import tensorflow as tf

graph=tf.get_default_graph()  # 获取当前图
sess=tf.Session()
sess.run(tf.global_variables_initializer())

checkpoint_file=tf.train.latest_checkpoint(model_path)
saver = tf.train.import_meta_graph("{}.meta".format(checkpoint_file))
saver.restore(sess,checkpoint_file)

2.获取某个迭代次数的模型

比如上图中的model-9200

import tensorflow as tf

graph=tf.get_default_graph()  # 获取当前图
sess=tf.Session()
sess.run(tf.global_variables_initializer())

checkpoint_file=os.path.join(model_path,'model-9200')
saver = tf.train.import_meta_graph("{}.meta".format(checkpoint_file))
saver.restore(sess,checkpoint_file)

获取变量值

## 得到当前图中所有变量的名称
tensor_name_list=[tensor.name for tensor in graph.as_graph_def().node] 
# 查看所有变量
print(tensor_name_list) 

# 获取input_x和input_y的变量值
input_x = graph.get_operation_by_name("input_x").outputs[0]
input_y = graph.get_operation_by_name("input_y").outputs[0]

以上这篇TensorFlow实现模型断点训练,checkpoint模型载入方式就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

推荐阅读

程序员
用c ++或c语言打印fibo大数字

如何解决《用c++或c语言打印fibo大数字》经验，为你挑选了1个好方法。 ... [详细]
程序员
在最后一个斜杠后将值插入String

如何解决《在最后一个斜杠后将值插入String》经验，为你挑选了1个好方法。 ... [详细]
程序员
NodeJS检查SSL认证其他主机的有效性

如何解决《NodeJS检查SSL认证其他主机的有效性》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么我的活动空无一人？

如何解决《为什么我的活动空无一人？》经验，为你挑选了1个好方法。 ... [详细]
程序员
GoogleApiClient具有可选的Plus.API,并且未与Play服务8.3中引入的新Google标志连接到Plus

如何解决《GoogleApiClient具有可选的Plus.API,并且未与Play服务8.3中引入的新Google标志连接到Plus》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在laravel中保存使用条件？

如何解决《如何在laravel中保存使用条件？》经验，为你挑选了0个好方法。 ... [详细]
程序员
没有RTTI但仍然是虚拟方法

如何解决《没有RTTI但仍然是虚拟方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
当应用程序在设备上运行时,无法获取uiautomator工具中的元素

如何解决《当应用程序在设备上运行时,无法获取uiautomator工具中的元素》经验，为你挑选了1个好方法。 ... [详细]
程序员
动态添加脚本时未定义$/jQuery

如何解决《动态添加脚本时未定义$/jQuery》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在不打印的情况下在Matlab循环中监视变量？

如何解决《如何在不打印的情况下在Matlab循环中监视变量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将C#List <string>转换为Javascript

如何解决《将C#List<string>转换为Javascript》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在recyclelerView向下滚动时折叠后隐藏工具栏

如何解决《如何在recyclelerView向下滚动时折叠后隐藏工具栏》经验，为你挑选了0个好方法。 ... [详细]
程序员
ConcurrentQueue允许我等待一个生产者

如何解决《ConcurrentQueue允许我等待一个生产者》经验，为你挑选了0个好方法。 ... [详细]
程序员
Swift选项 - 从'x'到'x'的条件转换警告总是成功

如何解决《Swift选项-从'x'到'x'的条件转换警告总是成功》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用秒表倒计时

如何解决《使用秒表倒计时》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以在chrome中使浏览器看起来像打印页面

如何解决《是否可以在chrome中使浏览器看起来像打印页面》经验，为你挑选了1个好方法。 ... [详细]
程序员
控件模板:如何创建绑定

如何解决《控件模板:如何创建绑定》经验，为你挑选了1个好方法。 ... [详细]
程序员
点击一个可疑的div剧照外面的焦点？

如何解决《点击一个可疑的div剧照外面的焦点？》经验，为你挑选了2个好方法。 ... [详细]
程序员
箭头功能中的默认参数值

如何解决《箭头功能中的默认参数值》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Gradle预编译JSP

如何解决《使用Gradle预编译JSP》经验，为你挑选了0个好方法。 ... [详细]

惬听风吟jyy_802

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章