我目前正在尝试制作一个程序,仅根据其外观区分腐烂的橙子和可食用的橙子.为此,我计划使用卷积神经网络训练腐烂的橙子和普通的橙子.经过一番搜索,我只能找到一个约数据库.黑色背景上的150个烂橙子和150个普通橙子(http://www.cofilab.com/downloads/).显然,机器学习模型至少需要几千个橙子才能达到90%左右的精度.但是,我可以用某种方式改变这150种橙子来制作更多的橙子照片吗?通过改变,我的意思是在柑橘类水果上添加不同浓度的橙色,以形成"不同的橙色".这是训练神经网络的有效方法吗?
这是增加日期数量的好方法.你要做什么取决于你的数据.例如,如果您正在训练从传感器获得的数据,您可能需要在训练数据中添加一些噪音,以便增加数据集.毕竟,您可以预期传感器会产生一些噪音.
假设您将在图像上训练它,这里有一个非常好的github存储库,它提供了使用这些技术的方法.这个python库可以帮助您为机器学习项目扩充图像.它将一组输入图像转换为一组新的,更大的略微改变的图像.链接:https://github.com/aleju/imgaug
特征:
大多数标准增强技术可用.
技术可以应用于图像上的图像和关键点/界标.在实验开始时定义一次增强序列,然后多次应用.
为每次增强定义灵活的随机范围,例如"将每个图像旋转-45到45度之间的值"或"将每个图像旋转一个从正态分布N(0,5.0)中采样的值".
轻松将所有随机范围转换为确定性值,以完全相同的方式增加不同批次的图像(例如图像及其热图).