13赞

标准的Keras模型输出意味着什么？什么是Keras的时代和损失？

作者：小妖694_807 | 2023-09-08 09:46

如何解决《标准的Keras模型输出意味着什么？什么是Keras的时代和损失？》经验，为你挑选了2个好方法。

我刚刚使用Keras构建了我的第一个模型,这是输出.它看起来像是在构建任何Keras人工神经网络后获得的标准输出.即使在查看文档后,我也不完全了解时代是什么以及输出中打印的内容是什么.

什么是Keras的时代和损失？

(我知道这可能是一个非常基本的问题,但我似乎无法在网上找到答案,如果答案真的很难从文档中收集,我认为其他人会有同样的问题,因此决定在这里发布.)

Epoch 1/20
1213/1213 [==============================] - 0s - loss: 0.1760     
Epoch 2/20
1213/1213 [==============================] - 0s - loss: 0.1840     
Epoch 3/20
1213/1213 [==============================] - 0s - loss: 0.1816     
Epoch 4/20
1213/1213 [==============================] - 0s - loss: 0.1915     
Epoch 5/20
1213/1213 [==============================] - 0s - loss: 0.1928     
Epoch 6/20
1213/1213 [==============================] - 0s - loss: 0.1964     
Epoch 7/20
1213/1213 [==============================] - 0s - loss: 0.1948     
Epoch 8/20
1213/1213 [==============================] - 0s - loss: 0.1971     
Epoch 9/20
1213/1213 [==============================] - 0s - loss: 0.1899     
Epoch 10/20
1213/1213 [==============================] - 0s - loss: 0.1957     
Epoch 11/20
1213/1213 [==============================] - 0s - loss: 0.1923     
Epoch 12/20
1213/1213 [==============================] - 0s - loss: 0.1910     
Epoch 13/20
1213/1213 [==============================] - 0s - loss: 0.2104     
Epoch 14/20
1213/1213 [==============================] - 0s - loss: 0.1976     
Epoch 15/20
1213/1213 [==============================] - 0s - loss: 0.1979     
Epoch 16/20
1213/1213 [==============================] - 0s - loss: 0.2036     
Epoch 17/20
1213/1213 [==============================] - 0s - loss: 0.2019     
Epoch 18/20
1213/1213 [==============================] - 0s - loss: 0.1978     
Epoch 19/20
1213/1213 [==============================] - 0s - loss: 0.1954     
Epoch 20/20
1213/1213 [==============================] - 0s - loss: 0.1949

Lucas Ramada.. 37

只是更具体地回答问题,这里是时代和损失的定义:

时代:完整传递所有训练数据.

例如,在上面的视图中,您有1213个观察值.因此,当你完成对所有1213个观察的训练通过时,一个时代就结束了.

损失:我们在模型训练期间尝试最小化的标量值.损失越低,我们的预测越接近真实标签.

这通常是像David Maust上面所说的平均误差(MSE),或者经常在Keras,分类交叉熵

你期望从你的Keras模型运行中看到的是,在n个时期内损失减少.您的训练运行相当不正常,因为您的损失实际上在增加.这可能是由于学习率太大,导致您超出最佳状态.

正如jaycode所提到的,你会想要看看你的模型在看不见的数据上的表现,因为这是机器学习的一般用例.

因此,您应该在compile方法中包含一个度量列表,它们可能如下所示:

model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])

除了在fit方法中运行验证模型,例如:

model.fit(data, labels, validation_split=0.2)

还有更多要解释的内容,但希望这能让你开始.

1> Lucas Ramada..：

只是更具体地回答问题,这里是时代和损失的定义:

时代:完整传递所有训练数据.

例如,在上面的视图中,您有1213个观察值.因此,当你完成对所有1213个观察的训练通过时,一个时代就结束了.

损失:我们在模型训练期间尝试最小化的标量值.损失越低,我们的预测越接近真实标签.

这通常是像David Maust上面所说的平均误差(MSE),或者经常在Keras,分类交叉熵

正如jaycode所提到的,你会想要看看你的模型在看不见的数据上的表现,因为这是机器学习的一般用例.

因此,您应该在compile方法中包含一个度量列表,它们可能如下所示:

model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])

除了在fit方法中运行验证模型,例如:

model.fit(data, labels, validation_split=0.2)

还有更多要解释的内容,但希望这能让你开始.

2> jaycode..：

当您的模型通过网络中的所有节点运行数据并准备更新权重以达到最佳损失值时,一个时期结束.也就是说,越小越好.在你的情况下,由于在更高的时期有更高的损失分数,它"似乎"在第一个时代的模型更好.

我说"似乎",因为我们实际上无法确定,因为该模型尚未使用适当的交叉验证方法进行测试,即仅根据其训练数据进行评估.

改善模型的方法:

在Keras模型中使用交叉验证以了解模型的实际执行情况,在预测以前从未见过的新数据时,它是否能够很好地概括？

调整您的学习速率,神经网络模型的结构,隐藏单元/层的数量,初始化,优化器和激活器参数在您的模型中使用的无数其他东西.

将sklearn的GridSearchCV与Keras结合使用可以实现此过程的自动化.

推荐阅读

程序员
薄荷:genymotion安装错误

如何解决《薄荷:genymotion安装错误》经验，为你挑选了2个好方法。 ... [详细]
程序员
socket.io client:如何确定是否已安装处理程序

如何解决《socket.ioclient:如何确定是否已安装处理程序》经验，为你挑选了1个好方法。 ... [详细]
程序员
iAd横幅无法在iOS 9上运行

如何解决《iAd横幅无法在iOS9上运行》经验，为你挑选了1个好方法。 ... [详细]
程序员
制作企业iOS应用的安装链接

如何解决《制作企业iOS应用的安装链接》经验，为你挑选了1个好方法。 ... [详细]
程序员
在virtualenvwrapper中激活环境

如何解决《在virtualenvwrapper中激活环境》经验，为你挑选了1个好方法。 ... [详细]
程序员
在编译时是否在Go中评估常量值？

如何解决《在编译时是否在Go中评估常量值？》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法创建调试桥无法检测到adb版本.语法错误:")"升级平台工具23.0.1到23.1.0 Linux-32位导致问题

如何解决《无法创建调试桥无法检测到adb版本.语法错误:")"升级平台工具23.0.1到23.1.0Linux-32位导致问题》经验，为你挑选了2个好方法。 ... [详细]
程序员
Makefile | 依赖于头文件中包含的另一个头文件

如何解决《Makefile|依赖于头文件中包含的另一个头文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么Elixir警告我我的导入未被使用？

如何解决《为什么Elixir警告我我的导入未被使用？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Itext替换PDF文件中的字符串,但不替换字母X.

如何解决《使用Itext替换PDF文件中的字符串,但不替换字母X.》经验，为你挑选了1个好方法。 ... [详细]
程序员
MP Chart Android未显示所有x轴标签

如何解决《MPChartAndroid未显示所有x轴标签》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用10**9超过10亿的成本？

如何解决《使用10**9超过10亿的成本？》经验，为你挑选了2个好方法。 ... [详细]
程序员
support.v7.widgets和android.widgets Toolbar,Fragment之间的区别

如何解决《support.v7.widgets和android.widgetsToolbar,Fragment之间的区别》经验，为你挑选了0个好方法。 ... [详细]
程序员
AVR如何执行浮点运算

如何解决《AVR如何执行浮点运算》经验，为你挑选了0个好方法。 ... [详细]
程序员
当通过本地apache发送请求时,POST转换为GET

如何解决《当通过本地apache发送请求时,POST转换为GET》经验，为你挑选了0个好方法。 ... [详细]
程序员
具有客户端访问控制的Mongodb docker容器

如何解决《具有客户端访问控制的Mongodbdocker容器》经验，为你挑选了1个好方法。 ... [详细]
程序员
C中for循环中的操作顺序

如何解决《C中for循环中的操作顺序》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么strtod没有以正确的方式工作？

如何解决《为什么strtod没有以正确的方式工作？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从源更新Tensorflow

如何解决《如何从源更新Tensorflow》经验，为你挑选了1个好方法。 ... [详细]
程序员
Browserify/Babelify React用于生产(NODE_ENV生产)

如何解决《Browserify/BabelifyReact用于生产(NODE_ENV生产)》经验，为你挑选了1个好方法。 ... [详细]

小妖694_807

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章