15赞

Seq2Seq模型学习几次迭代后仅输出EOS令牌（<\ s>）

作者：kikokikolove | 2023-06-09 15:45

如何解决《Seq2Seq模型学习几次迭代后仅输出EOS令牌（<\s>）》经验，为你挑选了0个好方法。

我正在使用NMT创建在康奈尔电影对话语料库上受过训练的聊天机器人。

我的代码部分来自https://github.com/bshao001/ChatLearner和https://github.com/chiphuyen/stanford-tensorflow-tutorials/tree/master/assignments/chatbot

在训练过程中，我打印了从批处理中馈送到解码器的随机输出答案，以及我的模型预测观察到学习进度的相应答案。

我的问题：仅经过约4次训练，该模型就学会了在<\s>每个时间步输出EOS令牌（）。即使训练继续进行，它也始终将其输出作为其响应（由logits的argmax确定）。该模型偶尔会偶尔输出一系列周期作为其答案。

我还在训练过程中打印了前10个logit值（不仅是argmax），以查看其中是否存在正确的单词，但这似乎是在预测词汇中最常见的单词（例如i，you，？，。）。在培训期间，即使是前10个字词也没有太大变化。

我已经确保正确计算编码器和解码器的输入序列长度，并相应地添加了SOS（~~）和EOS（也用于填充）令牌。我还在损失计算中执行屏蔽。~~

这是一个示例输出：

训练迭代1：

Decoder Input: sure . sure . <\s> <\s> <\s> <\s> <\s> <\s> <\s> <\s> <\s> Predicted Answer: wildlife bakery mentality mentality administration administration winston winston winston magazines magazines magazines magazines

...

训练迭代4：

Decoder Input: ~~i guess i had it coming . let us call it settled . <\s> <\s> <\s> <\s> <\s> Predicted Answer: <\s> <\s> <\s> <\s> <\s> <\s> <\s> <\s> <\s> <\s> <\s> <\s> <\s> <\s> <\s> <\s> <\s> <\s>~~

再经过几次迭代后，它只依靠预测EOS（很少出现周期）

我不确定是什么原因导致了此问题，并且已经在此问题上停留了一段时间。任何帮助将不胜感激！

更新：我让它训练了十万次迭代，但它仍然仅输出EOS（偶尔出现）。经过几次迭代后，训练损失也不会减少（从一开始就保持在47左右）

推荐阅读

程序员
获取所有maven依赖项,包括插件依赖项

如何解决《获取所有maven依赖项,包括插件依赖项》经验，为你挑选了0个好方法。 ... [详细]

程序员
IoC容器映射:单例与每次调用创建

如何解决《IoC容器映射:单例与每次调用创建》经验，为你挑选了0个好方法。 ... [详细]

程序员
在opencv-python中检测星形

如何解决《在opencv-python中检测星形》经验，为你挑选了0个好方法。 ... [详细]

程序员
Amazon RDS中的lower_case_table_names设置

如何解决《AmazonRDS中的lower_case_table_names设置》经验，为你挑选了1个好方法。 ... [详细]

程序员
为什么出口/进口申报必须在2015年达到顶级水平？

如何解决《为什么出口/进口申报必须在2015年达到顶级水平？》经验，为你挑选了1个好方法。 ... [详细]

程序员
chrome webview中出现"不支持的ABI"错误

如何解决《chromewebview中出现"不支持的ABI"错误》经验，为你挑选了0个好方法。 ... [详细]

程序员
使用$ rootscope显示和隐藏

如何解决《使用$rootscope显示和隐藏》经验，为你挑选了0个好方法。 ... [详细]

程序员
使用python中的openpyxl读取存储在sharepoint位置的xlsx？

如何解决《使用python中的openpyxl读取存储在sharepoint位置的xlsx？》经验，为你挑选了0个好方法。 ... [详细]

程序员
无法使用python子进程模块使用*运行shell命令

如何解决《无法使用python子进程模块使用*运行shell命令》经验，为你挑选了1个好方法。 ... [详细]

程序员
熊猫改变了数据帧结构

如何解决《熊猫改变了数据帧结构》经验，为你挑选了1个好方法。 ... [详细]

程序员
如何在Swift中执行一次代码只执行一次？

如何解决《如何在Swift中执行一次代码只执行一次？》经验，为你挑选了2个好方法。 ... [详细]

程序员
使用SharedElement在活动转换中崩溃

如何解决《使用SharedElement在活动转换中崩溃》经验，为你挑选了0个好方法。 ... [详细]

程序员
在数组上使用AsEnumerable()有什么用？

如何解决《在数组上使用AsEnumerable()有什么用？》经验，为你挑选了2个好方法。 ... [详细]

程序员
Swift UI测试 - 用户通知系统警报

如何解决《SwiftUI测试-用户通知系统警报》经验，为你挑选了0个好方法。 ... [详细]

程序员
ActiveRecord :: NoDatabaseError FATAL:数据库"db/development.postgresql"不存在

如何解决《ActiveRecord::NoDatabaseErrorFATAL:数据库"db/development.postgresql"不存在》经验，为你挑选了1个好方法。 ... [详细]

程序员
Flink:如何使用命令行界面取消正确的作业？

如何解决《Flink:如何使用命令行界面取消正确的作业？》经验，为你挑选了1个好方法。 ... [详细]

程序员
React/Flux - 为什么我需要一个动作调度员？

如何解决《React/Flux-为什么我需要一个动作调度员？》经验，为你挑选了1个好方法。 ... [详细]

程序员
如何在rails中使用x-www-form-urlencoded

如何解决《如何在rails中使用x-www-form-urlencoded》经验，为你挑选了1个好方法。 ... [详细]

程序员
无法在Android中使用Intent打开Linkedin个人资料

如何解决《无法在Android中使用Intent打开Linkedin个人资料》经验，为你挑选了0个好方法。 ... [详细]

程序员
是否有原始的linux系统调用API/ABI文档

如何解决《是否有原始的linux系统调用API/ABI文档》经验，为你挑选了0个好方法。 ... [详细]

吐了个 "CAO" !

吐个槽吧,看都看了

会员登录 | 用户注册

kikokikolove

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

actionscrip

bash

c#

c++

c语言

erlang

flutter

go

golang

java

javascript

lua

node.js

perl

php

python

scala

typescript

RankList | 热门文章

1如何围绕sourceRect的角落来寻找Peek和Pop 3D Touch？

2我应该在控制器或模型中使用Ecto.Repo用于Elixir Phoenix吗？

3适配器类中的super.onActivityResult？Android的

4使用bash进程替换和尾部的结果不正确？

5自定义构建键绑定sublime文本

6由从未引用的对象创建的垃圾

7SymbolFinder.FindReferencesAsync找不到任何内容

8是否有一个基本的角度指令用于读取更多/更少的文本

9Firebase未向REST请求添加CORS标头

10long-poll jQuery.ajax()在手机休眠后无法回调？

11iOS UI测试在一个被隔绝的看法

12番茄钟计时器:变量值变为'NaN'

13向UITableViewCell Swift添加渐变背景

14码头工人-PG :: ConnectionBad

15React.js - 实现组件的排序

16Python中的Bokeh包：如何使用rgb进行颜色选择

17使用Xcode的测试类助手编辑器和Swift类

18在RichTextBox中显示NLog跟踪

19bash脚本无法读取第一行

20大熊猫建立在Cygwin上

Seq2Seq模型学习几次迭代后仅输出EOS令牌（&lt;\ s&gt;）

Seq2Seq模型学习几次迭代后仅输出EOS令牌（<\ s>）