7赞

如何在TensorFlow中处理具有可变长度序列的批次？

作者：可爱的天使keven_464 | 2023-09-08 10:01

如何解决《如何在TensorFlow中处理具有可变长度序列的批次？》经验，为你挑选了2个好方法。

我试图使用RNN(特别是LSTM)进行序列预测.但是,我遇到了可变序列长度的问题.例如,

sent_1 = "I am flying to Dubain"
sent_2 = "I was traveling from US to Dubai"

我正在尝试使用基于此Benchmark的简单RNN来预测当前的下一个词,以构建PTB LSTM模型.

但是,num_steps参数(用于展开到先前的隐藏状态)应该在每个Tensorflow的纪元中保持相同.基本上,由于句子的长度不同,因此无法批量处理句子.

 # inputs = [tf.squeeze(input_, [1])
 #           for input_ in tf.split(1, num_steps, inputs)]
 # outputs, states = rnn.rnn(cell, inputs, initial_state=self._initial_state)

在这里,num_steps每个句子都需要改变我的情况.我尝试了几次黑客攻击,但似乎没有任何效果.

1> 小智..：

您可以使用以下描述的bucketing和padding的概念:

序列到序列模型

此外,创建RNN网络的rnn函数接受参数sequence_length.

例如,您可以创建相同大小的句子桶,使用必要数量的零填充它们,或者使用代表零字的占位符,然后将它们与seq_length = len(zero_words)一起提供.

seq_length = tf.placeholder(tf.int32)
outputs, states = rnn.rnn(cell, inputs, initial_state=initial_state, sequence_length=seq_length)

sess = tf.Session()
feed = {
    seq_length: 20,
    #other feeds
}
sess.run(outputs, feed_dict=feed)

看看这个reddit线程:

具有"可变长度"序列的Tensorflow基本RNN示例

2> Datalker..：

您可以使用dynamic_rnn而不是通过将数组传递给sequence_length参数来指定每个序列的长度.示例如下:

def length(sequence):
    used = tf.sign(tf.reduce_max(tf.abs(sequence), reduction_indices=2))
    length = tf.reduce_sum(used, reduction_indices=1)
    length = tf.cast(length, tf.int32)
    return length

from tensorflow.nn.rnn_cell import GRUCell

max_length = 100
frame_size = 64
num_hidden = 200

sequence = tf.placeholder(tf.float32, [None, max_length, frame_size])
output, state = tf.nn.dynamic_rnn(
    GRUCell(num_hidden),
    sequence,
    dtype=tf.float32,
    sequence_length=length(sequence),
)

代码取自关于该主题的完美文章,请同时检查.

更新:你可以找到另一篇关于vs的精彩帖子dynamic_rnnrnn

推荐阅读

程序员
故事板警告:iOS 8.0之前的第一个基线布局属性

如何解决《故事板警告:iOS8.0之前的第一个基线布局属性》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在React-Native中的导航器的多个场景之间共享状态

如何解决《如何在React-Native中的导航器的多个场景之间共享状态》经验，为你挑选了0个好方法。 ... [详细]
程序员
Hibernate 5是否为多租户数据实施了DISCRIMINATOR方法？

如何解决《Hibernate5是否为多租户数据实施了DISCRIMINATOR方法？》经验，为你挑选了0个好方法。 ... [详细]
程序员
AWS Kinesis Firehose不在Redshift中插入数据

如何解决《AWSKinesisFirehose不在Redshift中插入数据》经验，为你挑选了2个好方法。 ... [详细]
程序员
在Reactive Cocoa 4中点击UIButton获取信号

如何解决《在ReactiveCocoa4中点击UIButton获取信号》经验，为你挑选了1个好方法。 ... [详细]
程序员
我无法从bufferGeometry获取position属性

如何解决《我无法从bufferGeometry获取position属性》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何防止"可能的分数损失"？

如何解决《如何防止"可能的分数损失"？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Loader项目中连接信号？

如何解决《如何在Loader项目中连接信号？》经验，为你挑选了1个好方法。 ... [详细]
程序员
模板实例化,两阶段名称查找,具有自动推导类型的不同行为

如何解决《模板实例化,两阶段名称查找,具有自动推导类型的不同行为》经验，为你挑选了0个好方法。 ... [详细]
程序员
什么在Ruby中更快,`arr + = [x]`或`arr << x`

如何解决《什么在Ruby中更快,`arr+=[x]`或`arr<<x`》经验，为你挑选了1个好方法。 ... [详细]
程序员
SQLSTATE [HY000] [1049]未知数据库'register_login'

如何解决《SQLSTATE[HY000][1049]未知数据库'register_login'》经验，为你挑选了1个好方法。 ... [详细]
程序员
Rails,Sidekiq - Redis NOAUTH

如何解决《Rails,Sidekiq-RedisNOAUTH》经验，为你挑选了1个好方法。 ... [详细]
程序员
反序列化XML - 对于无符号字节,值太大或太小

如何解决《反序列化XML-对于无符号字节,值太大或太小》经验，为你挑选了1个好方法。 ... [详细]
程序员
量角器检查位置路径

如何解决《量角器检查位置路径》经验，为你挑选了1个好方法。 ... [详细]
程序员
RavenDB Map减少了不同的索引

如何解决《RavenDBMap减少了不同的索引》经验，为你挑选了0个好方法。 ... [详细]
程序员
Yii2注销特定用户

如何解决《Yii2注销特定用户》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用javascript按类名获取价值

如何解决《如何使用javascript按类名获取价值》经验，为你挑选了1个好方法。 ... [详细]
程序员
Xcode中文件夹和组之间的区别？

如何解决《Xcode中文件夹和组之间的区别？》经验，为你挑选了3个好方法。 ... [详细]
程序员
Angular2错误 - 我的登录组件没有提供程序错误

如何解决《Angular2错误-我的登录组件没有提供程序错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
SearchView中的onQueryTextSubmit在Android Java中处理两次

如何解决《SearchView中的onQueryTextSubmit在AndroidJava中处理两次》经验，为你挑选了1个好方法。 ... [详细]

可爱的天使keven_464

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章