我正在玩tensorflow并遇到以下代码的问题:
def _init_parameters(self, input_data, labels): # the input shape is (batch_size, input_size) input_size = tf.shape(input_data)[1] # labels in one-hot format have shape (batch_size, num_classes) num_classes = tf.shape(labels)[1] stddev = 1.0 / tf.cast(input_size, tf.float32) w_shape = tf.pack([input_size, num_classes], 'w-shape') normal_dist = tf.truncated_normal(w_shape, stddev=stddev, name='normaldist') self.w = tf.Variable(normal_dist, name='weights')
(我正在tf.pack
按照这个问题的建议使用,因为我得到了同样的错误)
当我运行它(从一个更大的脚本调用这个),我得到这个错误:
ValueError: initial_value must have a shape specified: Tensor("normaldist:0", shape=TensorShape([Dimension(None), Dimension(None)]), dtype=float32)
我试图在交互式shell中复制该过程.实际上,normal_dist
虽然提供的值确实存在,但未指定维度:
In [70]: input_size.eval() Out[70]: 4 In [71]: num_classes.eval() Out[71]: 3 In [72]: w_shape.eval() Out[72]: array([4, 3], dtype=int32) In [73]: normal_dist.eval() Out[73]: array([[-0.27035281, -0.223277 , 0.14694688], [-0.16527176, 0.02180306, 0.00807841], [ 0.22624688, 0.36425814, -0.03099642], [ 0.25575709, -0.02765726, -0.26169327]], dtype=float32) In [78]: normal_dist.get_shape() Out[78]: TensorShape([Dimension(None), Dimension(None)])
这很奇怪.Tensorflow生成矢量但不能说它的形状.难道我做错了什么?
正如Ishamael所说,所有张量都具有静态形状,这在图形构造时已知并且可以使用Tensor.get_shape()
; 和动态形状,仅在运行时已知,可通过获取张量的值或将其传递给运算符来访问tf.shape
.在许多情况下,静态和动态形状是相同的,但它们可以是不同的 - 静态形状可以部分定义 - 以允许动态形状从一个步骤到下一个步骤变化.
在您的代码中normal_dist
有一个部分定义的静态形状,因为它w_shape
是一个计算值.(TensorFlow有时试图评估在图构造时间这些计算出的值,但它卡住在tf.pack
.)它推断出的形状TensorShape([Dimension(None), Dimension(None)])
,这意味着"具有未知数量的行和列的矩阵",因为它的已知,即w_shape
是长度的矢量2,因此产生的normal_dist
必须是二维的.
您有两种方法可以解决这个问题.您可以像Ishamael建议的那样设置静态形状,但这需要您了解图形构建时的形状.例如,以下可能有效:
normal_dist.set_shape([input_data.get_shape()[1], labels.get_shape()[1]])
或者,您可以传递validate_shape=False
给tf.Variable
构造函数.这允许您创建具有部分定义形状的变量,但它限制了稍后可以在图中推断的静态形状信息量.