19赞

多GPU架构,梯度平均 - 模型不太准确？

作者：小白也坚强_177 | 2023-06-10 13:56

如何解决《多GPU架构,梯度平均-模型不太准确？》经验，为你挑选了0个好方法。

当我按照https://www.tensorflow.org/tutorials/deep_cnn所述执行cifar10模型时,使用单个GPU大约4小时后达到86%的准确率,当我使用2个GPU时,精度降至84%但达到84 2 GPU上的%准确度比1快.

我的直觉是,在https://github.com/tensorflow/models/blob/master/tutorials/image/cifar10/cifar10_multi_gpu_train.py中定义的average_gradients函数会返回一个不太精确的渐变值,因为渐变的平均值将不如实际的梯度值.

如果梯度不太准确,则控制作为训练一部分学习的函数的参数不太准确.查看代码(https://github.com/tensorflow/models/blob/master/tutorials/image/cifar10/cifar10_multi_gpu_train.py)为什么平均多个GPU上的梯度比在单个GPU上计算梯度更不准确？

我对平均值的平均值是否产生一个不太准确的值是正确的？

模型中的随机性描述为:

The images are processed as follows:
They are cropped to 24 x 24 pixels, centrally for evaluation or randomly for training.
They are approximately whitened to make the model insensitive to dynamic range.
For training, we additionally apply a series of random distortions to artificially increase the data set size:

Randomly flip the image from left to right.
Randomly distort the image brightness.
Randomly distort the image contrast.

src:https://www.tensorflow.org/tutorials/deep_cnn

这会对训练准确性产生影响吗？

更新:

试图进一步研究这一点,用不同数量的GPU进行损失函数值训练.

Training with 1 GPU : loss value : .7 , Accuracy : 86%
Training with 2 GPU's : loss value : .5 , Accuracy : 84%

对于更高的精度,损失值是否应该更低,反之则不然？

推荐阅读

程序员
在Anaconda中安装Plotly

如何解决《在Anaconda中安装Plotly》经验，为你挑选了2个好方法。 ... [详细]
程序员
检测数字输入微调器点击

如何解决《检测数字输入微调器点击》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用自定义创建的地图框样式以及传单

如何解决《如何使用自定义创建的地图框样式以及传单》经验，为你挑选了1个好方法。 ... [详细]
程序员
比较std :: stringstream的内容

如何解决《比较std::stringstream的内容》经验，为你挑选了1个好方法。 ... [详细]
程序员
将UIScrollView委托设置为它自己的自定义类

如何解决《将UIScrollView委托设置为它自己的自定义类》经验，为你挑选了1个好方法。 ... [详细]
程序员
获取控制器中Spring启动/安全性的会话令牌

如何解决《获取控制器中Spring启动/安全性的会话令牌》经验，为你挑选了2个好方法。 ... [详细]
程序员
从数据库返回字符串值

如何解决《从数据库返回字符串值》经验，为你挑选了1个好方法。 ... [详细]
程序员
将自定义列添加到Magento报表和销售信息中心

如何解决《将自定义列添加到Magento报表和销售信息中心》经验，为你挑选了0个好方法。 ... [详细]
程序员
JSDoc的输出可以组织成"文件夹"吗？

如何解决《JSDoc的输出可以组织成"文件夹"吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
ES6导出/导入索引文件

如何解决《ES6导出/导入索引文件》经验，为你挑选了4个好方法。 ... [详细]
程序员
收集实时GC指标 - Golang

如何解决《收集实时GC指标-Golang》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在visual Studio 2013中阻止"尝试从状态为TextDocDataAvailable的适配器获取视图"失败？

如何解决《如何在visualStudio2013中阻止"尝试从状态为TextDocDataAvailable的适配器获取视图"失败？》经验，为你挑选了2个好方法。 ... [详细]
程序员
用于打开上次关闭选项卡的Sublime文本快捷方式

如何解决《用于打开上次关闭选项卡的Sublime文本快捷方式》经验，为你挑选了1个好方法。 ... [详细]
程序员
错误后重试相同的项目

如何解决《错误后重试相同的项目》经验，为你挑选了1个好方法。 ... [详细]
程序员
Cassandra create table不会保持列顺序

如何解决《Cassandracreatetable不会保持列顺序》经验，为你挑选了2个好方法。 ... [详细]
程序员
Android OkHttp库:GET请求 - 异常EOFException:\n未找到:size = 0 content =

如何解决《AndroidOkHttp库:GET请求-异常EOFException:\n未找到:size=0content=》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么"错误:使用unique_ptr将'sizeof'无效应用于不完整类型"通过添加空析构函数来修复？

如何解决《为什么"错误:使用unique_ptr将'sizeof'无效应用于不完整类型"通过添加空析构函数来修复？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java HashMap没有从key获得价值

如何解决《JavaHashMap没有从key获得价值》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么时候我们应该使用RTLD_DEEPBIND？

如何解决《什么时候我们应该使用RTLD_DEEPBIND？》经验，为你挑选了1个好方法。 ... [详细]
程序员
以编程方式向Python函数添加“装饰器”

如何解决《以编程方式向Python函数添加“装饰器”》经验，为你挑选了1个好方法。 ... [详细]

小白也坚强_177

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章