1、前言
ConvNeXt 网络基于传统的卷积神经网络,与当下 transformer当道而言简直是一股清流
ConvNeXt并没有特别复杂或者创新的结构
ConvNeXt 网络有五种大小,可以参考下面
2、项目实现
完整的项目如下:
这里参考了网上的ConvNeXt 模型,训练脚本、预测脚本全部自己实现。
这里简单介绍
2.1 ConvNeXt 模型
因为ConvNeXt 模型有tiny、base等等五个版本,这里为了方便,定义了五种模型,只需要在train的训练参数里面更改即可
优化器可以在SGD或者Adam中选择
其余的参数就是字面意思,其中学习率衰减是cos余弦退火算法,lr是初始学习率,lrf是衰减的比例
2.2 迁移学习
这里并没有使用官方的预训练权重,当然需要的话,可以在model下面的链接中下载。训练之前删去分类的部分,然后导入即可进行迁移学习
需要注意的是,迁移学习最好保证数据分布相同,这样效果最好。
也就是说迁移学习的话,最好保证数据归一化的mean和std一样,这里使用compute-gray控制。
True的话,代码会自动计算数据集的mean和std,在归一化的时候自动载入计算好的mean和std
而要是迁移学习的话,需要设置为False,这样代码会载入默认的官方的mean和std
因为本人测试的时候没有进行迁移学习,所以这里设置为True,也就是自动计算数据的均值和方差
2.3 训练生成的东西
生成的全部在runs目录下
json 文件是分类项目的索引和类别,通过这个json文件自动为ConvNeXt 模型定义输出
loss accuracy 就是分别在训练集和验证集上的loss和acc曲线
这里有时候test曲线高于train曲线,因为数据集划分不足导致,可以将验证集加的再多点
然后除了训练集和验证集的混淆矩阵图像外,还有一个训练数据预处理的可视化,就是trainSet图像,里面存放的是数据经过预处理后的图像,如下:
2.4 训练过程的打印
开始:
中间过程:
结束:
2.5 推理
推理的时候,需要更改下面的参数
然后将推理的数据放在 inference\inference_test 目录下,代码会自动将推理结果放在 inference\ret 中
3、代码使用
项目下载:基于ConvNeXt网络对4种苹果叶片病害识别【包含数据集、完整代码、训练的结果、混淆矩阵结果等等】资源-CSDN文库
这里使用的python版本是3.8,里面的库文件参考requirements文件
训练自定义数据集很简单,也可以参考README文件
首先摆放好数据集,格式如下,数据按照目录摆放
本人习惯test就是验证集
然后选择参数,训练即可
最后推理: