如何使用keras ImageDataGenerator与Siamese或Tripple网络

作者：mobiledu2402852357 | 2023-09-07 13:10

如何解决《如何使用kerasImageDataGenerator与Siamese或Tripple网络》经验，为你挑选了1个好方法。

我正在尝试在自定义大型数据集上建立一个连体神经网络和三重神经网络

Keras具有ImageDataGenerator这使得输入数据的生成到一个regular神经网络非常容易.

我很有兴趣使用ImageDataGenerator或类似的方式来训练具有2(siamese)和3(triple)输入的网络.

在mniset keras siamese示例中,由预处理阶段生成的输入由create_pairs方法完成.我不认为这种方式适合大型数据集.

ImageDataGenerator在这种情况下可以使用吗？假设数据集非常大,我的其他选择是什么？

1> indraforyou..：

DataGenerators的想法是fit_generator批量提供数据流..因此,您可以控制如何生成数据,即是从文件加载还是像执行的那样进行数据扩充ImageDataGenerator.

在这里,我发布了自定义DataGenerator的mniset siamese示例的修改版本,您可以从这里开始工作.

import numpy as np
np.random.seed(1337)  # for reproducibility

import random
from keras.datasets import mnist
from keras.models import Sequential, Model
from keras.layers import Dense, Dropout, Input, Lambda
from keras.optimizers import SGD, RMSprop
from keras import backend as K

class DataGenerator(object):
    """docstring for DataGenerator"""
    def __init__(self, batch_sz):
        # the data, shuffled and split between train and test sets
        (X_train, y_train), (X_test, y_test) = mnist.load_data()
        X_train = X_train.reshape(60000, 784)
        X_test = X_test.reshape(10000, 784)
        X_train = X_train.astype('float32')
        X_test = X_test.astype('float32')
        X_train /= 255
        X_test /= 255

        # create training+test positive and negative pairs
        digit_indices = [np.where(y_train == i)[0] for i in range(10)]
        self.tr_pairs, self.tr_y = self.create_pairs(X_train, digit_indices)

        digit_indices = [np.where(y_test == i)[0] for i in range(10)]
        self.te_pairs, self.te_y = self.create_pairs(X_test, digit_indices)

        self.tr_pairs_0 = self.tr_pairs[:, 0]
        self.tr_pairs_1 = self.tr_pairs[:, 1]
        self.te_pairs_0 = self.te_pairs[:, 0]
        self.te_pairs_1 = self.te_pairs[:, 1]

        self.batch_sz = batch_sz
        self.samples_per_train  = (self.tr_pairs.shape[0]/self.batch_sz)*self.batch_sz
        self.samples_per_val    = (self.te_pairs.shape[0]/self.batch_sz)*self.batch_sz


        self.cur_train_index=0
        self.cur_val_index=0

    def create_pairs(self, x, digit_indices):
        '''Positive and negative pair creation.
        Alternates between positive and negative pairs.
        '''
        pairs = []
        labels = []
        n = min([len(digit_indices[d]) for d in range(10)]) - 1
        for d in range(10):
            for i in range(n):
                z1, z2 = digit_indices[d][i], digit_indices[d][i+1]
                pairs += [[x[z1], x[z2]]]
                inc = random.randrange(1, 10)
                dn = (d + inc) % 10
                z1, z2 = digit_indices[d][i], digit_indices[dn][i]
                pairs += [[x[z1], x[z2]]]
                labels += [1, 0]
        return np.array(pairs), np.array(labels)

    def next_train(self):
        while 1:
            self.cur_train_index += self.batch_sz
            if self.cur_train_index >= self.samples_per_train:
                self.cur_train_index=0
            yield ([    self.tr_pairs_0[self.cur_train_index:self.cur_train_index+self.batch_sz], 
                        self.tr_pairs_1[self.cur_train_index:self.cur_train_index+self.batch_sz]
                    ],
                    self.tr_y[self.cur_train_index:self.cur_train_index+self.batch_sz]
                )

    def next_val(self):
        while 1:
            self.cur_val_index += self.batch_sz
            if self.cur_val_index >= self.samples_per_val:
                self.cur_val_index=0
            yield ([    self.te_pairs_0[self.cur_val_index:self.cur_val_index+self.batch_sz], 
                        self.te_pairs_1[self.cur_val_index:self.cur_val_index+self.batch_sz]
                    ],
                    self.te_y[self.cur_val_index:self.cur_val_index+self.batch_sz]
                )

def euclidean_distance(vects):
    x, y = vects
    return K.sqrt(K.sum(K.square(x - y), axis=1, keepdims=True))


def eucl_dist_output_shape(shapes):
    shape1, shape2 = shapes
    return (shape1[0], 1)


def contrastive_loss(y_true, y_pred):
    '''Contrastive loss from Hadsell-et-al.'06
    http://yann.lecun.com/exdb/publis/pdf/hadsell-chopra-lecun-06.pdf
    '''
    margin = 1
    return K.mean(y_true * K.square(y_pred) + (1 - y_true) * K.square(K.maximum(margin - y_pred, 0)))


def create_base_network(input_dim):
    '''Base network to be shared (eq. to feature extraction).
    '''
    seq = Sequential()
    seq.add(Dense(128, input_shape=(input_dim,), activation='relu'))
    seq.add(Dropout(0.1))
    seq.add(Dense(128, activation='relu'))
    seq.add(Dropout(0.1))
    seq.add(Dense(128, activation='relu'))
    return seq


def compute_accuracy(predictions, labels):
    '''Compute classification accuracy with a fixed threshold on distances.
    '''
    return labels[predictions.ravel() < 0.5].mean()


input_dim = 784
nb_epoch = 20
batch_size=128

datagen = DataGenerator(batch_size)

# network definition
base_network = create_base_network(input_dim)

input_a = Input(shape=(input_dim,))
input_b = Input(shape=(input_dim,))

# because we re-use the same instance `base_network`,
# the weights of the network
# will be shared across the two branches
processed_a = base_network(input_a)
processed_b = base_network(input_b)

distance = Lambda(euclidean_distance, output_shape=eucl_dist_output_shape)([processed_a, processed_b])

model = Model(input=[input_a, input_b], output=distance)

# train
rms = RMSprop()
model.compile(loss=contrastive_loss, optimizer=rms)
model.fit_generator(generator=datagen.next_train(), samples_per_epoch=datagen.samples_per_train, nb_epoch=nb_epoch, validation_data=datagen.next_val(), nb_val_samples=datagen.samples_per_val)


        
`fit_generator`只运行`generator =`函数和`validation_data =`函数作为基于`pickle_safe`参数的线程/进程,并给出`fit`函数的回调功能.任何数据混洗都需要在生成器本身中完成.



    

    

    
        推荐阅读
        
            
                                
                    
                        程序员
                        摆脱旧的scala版本并安装2.11.7
                    

                    
                                                
                        如何解决《摆脱旧的scala版本并安装2.11.7》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        在IPython Widgets中,如何使用新值更新DropDown小部件？
                    

                    
                                                
                        如何解决《在IPythonWidgets中,如何使用新值更新DropDown小部件？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        IEnumerable <T>跳过无限序列
                    

                    
                                                
                        如何解决《IEnumerable<T>跳过无限序列》经验，为你挑选了3个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        javafx.scene.control.TableColumn无法强制转换为javafx.scene.control.TableColumn $ CellDataFeatures
                    

                    
                                                
                        如何解决《javafx.scene.control.TableColumn无法强制转换为javafx.scene.control.TableColumn$CellDataFeatures》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何在工具栏android中为自定义字体设置标题
                    

                    
                                                
                            
                        
                                                
                        如何解决《如何在工具栏android中为自定义字体设置标题》经验，为你挑选了6个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        护照:允许注册姓名和电子邮件地址？(地方战略)
                    

                    
                                                
                        如何解决《护照:允许注册姓名和电子邮件地址？(地方战略)》经验，为你挑选了2个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何开发一个自定义的UICollectionViewLayout,它具有与自定义单元格交错的列？
                    

                    
                                                
                            
                        
                                                
                        如何解决《如何开发一个自定义的UICollectionViewLayout,它具有与自定义单元格交错的列？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        std :: forward转发的重载函数
                    

                    
                                                
                        如何解决《std::forward转发的重载函数》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何清除C中数组的所有元素？
                    

                    
                                                
                        如何解决《如何清除C中数组的所有元素？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何使用ajax GET或POST方法将过去的数据发送到amazon lambda node.js函数
                    

                    
                                                
                        如何解决《如何使用ajaxGET或POST方法将过去的数据发送到amazonlambdanode.js函数》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        使用Gmail从Excel发送电子邮件
                    

                    
                                                
                            
                        
                                                
                        如何解决《使用Gmail从Excel发送电子邮件》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Laravel 5渴望加载限制
                    

                    
                                                
                        如何解决《Laravel5渴望加载限制》经验，为你挑选了2个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        从API-viewDidLoad,viewWillAppear或viewDidAppear加载数据的最佳位置是什么？
                    

                    
                                                
                        如何解决《从API-viewDidLoad,viewWillAppear或viewDidAppear加载数据的最佳位置是什么？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Laravel 5.1 Eloquent ORM随机返回不正确的关系 - *主要更新*
                    

                    
                                                
                        如何解决《Laravel5.1EloquentORM随机返回不正确的关系-*主要更新*》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        没有给出与所需的形式参数相对应的参数-.NET错误
                    

                    
                                                
                        如何解决《没有给出与所需的形式参数相对应的参数-.NET错误》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何使<td>响应
                    

                    
                                                
                        如何解决《如何使<td>响应》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何从IntelliJ IDEA向远程Spark集群提交代码
                    

                    
                                                
                        如何解决《如何从IntelliJIDEA向远程Spark集群提交代码》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        "控制到达非空函数的结束",在枚举类型上使用完全处理的情况切换
                    

                    
                                                
                        如何解决《"控制到达非空函数的结束",在枚举类型上使用完全处理的情况切换》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        比较数组对象是否相等
                    

                    
                                                
                        如何解决《比较数组对象是否相等》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        在Python Pandas中连接大量CSV文件(30,000)
                    

                    
                                                
                        如何解决《在PythonPandas中连接大量CSV文件(30,000)》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                

            
        
    

    
        吐了个 "CAO" !
        
            
                吐个槽吧,看都看了
            
            
                
                                        会员登录 | 用户注册
























    

    
        
            
            
                
                    
                
            

            
                mobiledu2402852357            

            
                这个屌丝很懒，什么也没留下！            
            
            

                                
                    
                    关注作者
                            

        
    


    
        Tags | 热门标签
        
            
                                
                    eclipse
                
                                
                    emacs
                
                                
                    git
                
                                
                    github
                
                                
                    intellij-idea
                
                                
                    macos
                
                                
                    phpstorm
                
                                
                    pycharm
                
                                
                    sublime-text
                
                                
                    svn
                
                                
                    vim
                
                                
                    visual-studio
                
                                
                    visual-studio-code
                
                                
                    webstorm
                
                                
                    windows
                
                                
                    编辑器
                
                                
            
        
    


    
        RankList | 热门文章
        
            
                                
                    1正则表达式 - 将C#Regex转换为JavaScript Regex的量词的目标无效
                
                                
                    2如何将图标(Bitmap)转换为ImageSource？
                
                                
                    3UglifyJS选项只删除死代码
                
                                
                    4如何生成Firebase ID？
                
                                
                    5有没有一种可靠的方法来了解哪些库可以在elf二进制文件中进行dlopen()编辑？
                
                                
                    6箭头函数与函数声明/表达式:它们是等效/可交换的吗？
                
                                
                    7Google Adwords CSP(内容安全政策)img-src
                
                                
                    8在PHP中查找并从String中提取匹配值
                
                                
                    9"使用未分配的局部变量"错误的原因是什么？
                
                                
                    10声明函数并在jquery事件绑定上调用它
                
                                
                    11如何以编程方式撰写邮件？
                
                                
                    12如何使用jQuery/Javascript将0.0099999999999909舍入到0.01？
                
                                
                    13如何在React组件上管理状态,该组件可以从父级或事件中的事件更改状态？
                
                                
                    14无法使用sequelize连接到SQL Azure数据库,但localhost上的SQL Server工作正常
                
                                
                    15通用Windows应用商店应用关闭时如何执行代码？
                
                                
                    16如何等待async void完成？
                
                                
                    17routes.LowercaseUrls和routes.AppendTrailingSlash在MVC中不起作用
                
                                
                    18使用swiftmailer发送多封电子邮件时如何绕过失败的电子邮件？
                
                                
                    19Django:什么是权限代号？
                
                                
                    20从旧字典键生成新的字典键