2赞

训练时如何冻结张量流变量中的特定节点？

作者：手机用户2402851335 | 2023-06-10 09:44

如何解决《训练时如何冻结张量流变量中的特定节点？》经验，为你挑选了1个好方法。

目前，我在使变量中的一些元素变为不可训练方面遇到麻烦。它意味着给定变量，例如x，

x= tf.Variable(tf.zeros([2,2]))

我希望只训练x [0,0]和x [1,1]，同时在训练时保持x [0,1]和x [1.0]不变。

当前，tensorflow确实提供了使用trainable=False或使任何变量不可训练的选项tf.stop_gradient()。但是，这些方法将使所有元素x成为不可训练的。我的问题是如何获得这种选择性？

1> lejlot..：

到目前为止，没有选择性缺乏更新；但是，可以通过明确指定应更新的变量来间接实现此效果。双方.minimize所有的梯度函数接受变量列表要优化过-只需创建一个列表省略其中的一些，例如

v1 = tf.Variable( ... ) # we want to freeze it in one op 
v2 = tf.Variable( ... ) # we want to freeze it in another op
v3 = tf.Variable( ... ) # we always want to train this one
loss = ...
optimizer = tf.train.GradientDescentOptimizer(0.1)

op1 = optimizer.minimize(loss, 
      var_list=[v for v in tf.get_collection(tf.TRAINABLE_VARIABLES) if v != v1])

op2 = optimizer.minimize(loss, 
      var_list=[v for v in tf.get_collection(tf.TRAINABLE_VARIABLES) if v != v2])

现在，只要您想培训wrt，就可以打电话给他们。变量子集。请注意，如果您使用的是Adam或其他方法来收集统计信息，则可能需要2个单独的优化器（最终每个优化器将获得单独的统计信息！）。但是，如果每次训练只有一组冻结变量，那么使用var_list可以很简单地完成所有工作。

但是，没有办法修复变量子集的训练。Tensorflow始终将变量视为单个单元。您必须以其他方式指定计算方式才能实现这一目标，其中一种方式是：

创建一个带有1的二进制掩码M，您要在其中停止X上的更新

创建单独的变量X'，该变量不可训练，并将tf.x的值赋给它

输出X'* M +（1-M）* X

例如：

x = tf.Variable( ... )
xp= tf.Variable( ..., trainable=False)
m = tf.Constant( ... ) # mask
cp= tf.Assign(x, xp)
with tf.control_dependencies([cp]):
  x_frozen = m*xp + (1-m)*x

而您只使用x_frozen而不是x。请注意，我们需要控制依赖项，因为tf.assign可以异步执行，在这里我们要确保它始终具有最新的x值。

推荐阅读

程序员
用单元测试重新构建C++应用程序

如何解决《用单元测试重新构建C++应用程序》经验，为你挑选了0个好方法。 ... [详细]
程序员
多线程建议

如何解决《多线程建议》经验，为你挑选了0个好方法。 ... [详细]
程序员
从矢量中删除元素的大小

如何解决《从矢量中删除元素的大小》经验，为你挑选了1个好方法。 ... [详细]
程序员
ORA-00979:不是Oracle的GROUP BY表达式,但在子句差异的上下文中对MySQL无效

如何解决《ORA-00979:不是Oracle的GROUPBY表达式,但在子句差异的上下文中对MySQL无效》经验，为你挑选了1个好方法。 ... [详细]
程序员
字符串连接的变体？

如何解决《字符串连接的变体？》经验，为你挑选了1个好方法。 ... [详细]
程序员
改变facebook redirect_uri web api

如何解决《改变facebookredirect_uriwebapi》经验，为你挑选了1个好方法。 ... [详细]
程序员
将Blob数据转换为JavaScript或节点中的Raw缓冲区

如何解决《将Blob数据转换为JavaScript或节点中的Raw缓冲区》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何"手动"表示[NSThread callStackSymbols](获取atos的起始地址)(iOS)

如何解决《如何"手动"表示[NSThreadcallStackSymbols](获取atos的起始地址)(iOS)》经验，为你挑选了0个好方法。 ... [详细]
程序员
S.browser_fallback_url是什么时候在Chrome中引入的？

如何解决《S.browser_fallback_url是什么时候在Chrome中引入的？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将Java流转换为滑动窗口？

如何解决《如何将Java流转换为滑动窗口？》经验，为你挑选了3个好方法。 ... [详细]
程序员
返回其元素(列)都与引用向量匹配的行的索引

如何解决《返回其元素(列)都与引用向量匹配的行的索引》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在R markdown投影仪中打印较长的书目（超过一页）？

如何解决《如何在Rmarkdown投影仪中打印较长的书目（超过一页）？》经验，为你挑选了1个好方法。 ... [详细]
程序员
比较矢量值:1个元素与所有其他元素

如何解决《比较矢量值:1个元素与所有其他元素》经验，为你挑选了1个好方法。 ... [详细]
程序员
ggmap扩展缩放或边界

如何解决《ggmap扩展缩放或边界》经验，为你挑选了1个好方法。 ... [详细]
程序员
Eclipse Mars:无法解析导入org.osgi

如何解决《EclipseMars:无法解析导入org.osgi》经验，为你挑选了1个好方法。 ... [详细]
程序员
ES6类方法在内部引用类实例的最有效方法

如何解决《ES6类方法在内部引用类实例的最有效方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
HTML,身高100%不起作用

如何解决《HTML,身高100%不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在获取"无法解决放置符号"错误时向Hashmap添加键和值

如何解决《如何在获取"无法解决放置符号"错误时向Hashmap添加键和值》经验，为你挑选了1个好方法。 ... [详细]
程序员
tvos:UITextView焦点外观像电影App

如何解决《tvos:UITextView焦点外观像电影App》经验，为你挑选了0个好方法。 ... [详细]
程序员
QML：即使drag属性处于活动状态，也不会调用onDragStarted / finish

如何解决《QML：即使drag属性处于活动状态，也不会调用onDragStarted/finish》经验，为你挑选了1个好方法。 ... [详细]

手机用户2402851335

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章