使用keras图像生成器平衡不平衡数据集

作者：勤奋的瞌睡猪_715 | 2023-09-07 12:25

如何解决《使用keras图像生成器平衡不平衡数据集》经验，为你挑选了1个好方法。

keras

ImageDataGenerator

可用于"通过实时数据增量生成批量张量图像数据"(https://keras.io/preprocessing/image/)

教程在

https://blog.keras.io/building-powerful-image-classification-models-using-very-little-data.html

演示了如何使用ImageDataGenerator扩充小而平衡的数据集.是否有一种简单的方法可以使用此生成器来增加严重不平衡的数据集,从而使得生成的生成数据集得到平衡？

1> Luke_radio..：

这不是处理不平衡数据的标准方法.我也不认为它是真的有道理 - 你将显着改变你的类的分布,其中较小的类现在变化较小.较大的类具有丰富的变化,较小的类似图像具有小的仿射变换.它们将生活在图像空间中比大多数类更小的区域.

更标准的方法是:

model.fit中的class_weights参数,您可以使用该参数使模型从少数类中学习更多.

减少大多数班级的规模.

接受不平衡.深度学习可以解决这个问题,它只需要更多的数据(真正的解决方案).

前两个选项实际上是一种黑客攻击,这可能会损害您处理现实世界(不平衡)数据的能力.两者都没有真正解决低变异性的问题,这是数据太少所固有的.如果在模型训练之后应用于真实世界数据集并不是一个问题,并且您只想在所拥有的数据上获得良好的结果,那么这些选项都很好(并且比为单个类生成生成器要容易得多).

如果您有足够的数据,第三种选择是正确的方法(例如,谷歌最近关于检测糖尿病视网膜病变的论文在阳性病例介于10%和30%之间的数据集中实现了高准确度).

如果你真的想为一个类生成各种增强图像而不是另一个类,那么在预处理中这样做可能是最容易的.获取少数类的图像并生成一些增强版本,并将其称为数据的所有部分.就像我说的,这一切都很糟糕.

推荐阅读

程序员
Android Volley:在哪里添加重试策略和超时？

如何解决《AndroidVolley:在哪里添加重试策略和超时？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么malloc(1)提供多个页面大小？

如何解决《为什么malloc(1)提供多个页面大小？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Spark数据帧reducebykey就像操作一样

如何解决《Spark数据帧reducebykey就像操作一样》经验，为你挑选了1个好方法。 ... [详细]
程序员
Common Lisp中的矩阵乘法

如何解决《CommonLisp中的矩阵乘法》经验，为你挑选了1个好方法。 ... [详细]
程序员
NumberFormat不会尊重.toFixed

如何解决《NumberFormat不会尊重.toFixed》经验，为你挑选了1个好方法。 ... [详细]
程序员
在字符串中连接时,array.map会自动附加逗号吗？

如何解决《在字符串中连接时,array.map会自动附加逗号吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何处理Laravel 5中的异常和错误消息？

如何解决《如何处理Laravel5中的异常和错误消息？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Java 8中,为什么ArrayList的默认容量现在为零？

如何解决《在Java8中,为什么ArrayList的默认容量现在为零？》经验，为你挑选了3个好方法。 ... [详细]
程序员
C程序保持returnig 1

如何解决《C程序保持returnig1》经验，为你挑选了1个好方法。 ... [详细]
程序员
Flexbox包装Safari中第一行的最后一列

如何解决《Flexbox包装Safari中第一行的最后一列》经验，为你挑选了4个好方法。 ... [详细]
程序员
如何找到具有相同值的三个连续行

如何解决《如何找到具有相同值的三个连续行》经验，为你挑选了0个好方法。 ... [详细]
程序员
Codeigniter php7错误

如何解决《Codeigniterphp7错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用"if let"与逻辑"或"运算符

如何解决《使用"iflet"与逻辑"或"运算符》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何对齐Kindle(KF8)的表格数据

如何解决《如何对齐Kindle(KF8)的表格数据》经验，为你挑选了0个好方法。 ... [详细]
程序员
Jframe setDefaultCloseOperation不起作用

如何解决《JframesetDefaultCloseOperation不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
当字符串默认不可变时,如何描述可变字符串？

如何解决《当字符串默认不可变时,如何描述可变字符串？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Erlang中获取fread一个没有""的字符串

如何解决《如何在Erlang中获取fread一个没有""的字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法从其DataSource获取单元格

如何解决《无法从其DataSource获取单元格》经验，为你挑选了3个好方法。 ... [详细]
程序员
ImportError:在安装的应用程序中输入'registration'时无法导入名称RequestSite

如何解决《ImportError:在安装的应用程序中输入'registration'时无法导入名称RequestSite》经验，为你挑选了2个好方法。 ... [详细]
程序员
postgres数组字段上的ActiveAdmin过滤器

如何解决《postgres数组字段上的ActiveAdmin过滤器》经验，为你挑选了0个好方法。 ... [详细]

勤奋的瞌睡猪_715

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章