create_generators 数据集准备
该代码支持Pascal VOC格式、COCO格式以及CSV格式。keras中有三个函数可以用来进行模型的训练:分别是fit,fit_generator和train_on_batch。
fit(train_x, train_y, batchsize, epochs)
By the way,数据生成器可以使用keras的API或者直接自己手码python的代码,因为其本质上也就是python的函数。
train_on_batch(batchX, batchY)
- 本算法的实现过程就是采用的fit_generator进行的模型训练。因此需要为其构建数据生成器。common.py文件:class Generator(keras.utils.Sequence)构建数据生成器的基类,咱们先说道说道keras.utils.Sequence这个类。
Generator类可以当成一个抽象基类,其中主要实现的是batch的划分、数据增强的处理、以及标注数据的转换(将bounding box的标注形式转换成高斯分布的标注)。而真正使用的数据集的生成器如下所示。主要按照不同的数据集生成的类,并均都继承于Generator抽象类,这里区分不同的数据集主要为了能方便区分其不同的数据标注格式,使用起来更为方便。主要是load_annotations()和load_image()函数的实现。至此数据生成器便构建完成了。
class PascalVocGenerator(Generator)
class CocoGenerator(Generator)
算法实现采用的Resnet50作为网络的backbone,采用下述引用网络。网络构建这里相对就比较简单了,取出Resnet的C5,先添加了一层dropout,然后进行了上采样,然后分别构建网络head,主要有三支:中心点预测、中心点偏移值预测以及bouding box的size预测。
from keras.applications.resnet50 import ResNet50
loss_ = Lambda(loss, name='centernet_loss')([y1, y2, y3, hm_input, wh_input, reg_input, reg_mask_input, index_input])
model = Model(inputs=[image_input, hm_input, wh_input, reg_input, reg_mask_input, index_input], outputs=[loss_])
model.load_weights(args.snapshot, by_name=True, skip_mismatch=True)
- 目标函数/损失函数的字符串,比如keras内置的一些损失函数
- 目标函数/损失函数,通常为自定义的损失函数
- 将目标函数/损失函数定义成model的一个层,类似本代码的实现。本代码实现时,因为直接把loss作为model的输出,因此输入y_true和y_pred,实际使用y_pred即输出loss,对其进行优化。
model.compile(optimizer=Adam(lr=1e-3), loss={'centernet_loss': lambda y_true, y_pred: y_pred})