记录图像分类论文资源列表。
图片分类任务可以分为:粗粒度图片分类、细粒度图片分类。
2012 AlexNet :ImageNet Classification with Deep Convolutional Neural Networks。
2014 GoogLeNet:Going Deeper with Convolutions。
Rethinking the Inception Architecture for Computer Vision。
2014 VGG :Very Deep Convolutional Networks for Large-Scale Image Recognition。
2015 ResNet: Deep Residual Learning for Image Recognition。
2016 DenseNet:Densely Connected Convolutional Networks。
2014 Inception v1:Going deeper with convolutions
2015 Inception v2,v3:Rethinking the Inception Architecture for Computer Vision
2016 Inception v4:Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning
2019 EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
论文网址: https://arxiv.org/abs/1905.11946
************************************************************************************
细粒度图片分类
************************************************************************************
【深度学习】pretrained model预训练模型下载地址
https://blog.csdn.net/shwan_ma/article/details/88601080
tensorflow slim的预训练模型下载地址:tensorflow/models
keras的预训练模型下载地址:fchollet/deep-learning-models
pytorch 预训练模型下载地址: https://github.com/Cadene/pretrained-models.pytorch/blob/master/pretrainedmodels/models/torchvision_models.py
A repo of image classfication using Keras :https://github.com/lxztju/keras_classfication
图像分类数据集
MNIST:
cifar10:
cifar100:
imagenet:
细粒度图片分类数据集:
Caltech-UCSD Birds-200-2011(简称CU200) : 不同鸟类的细粒度分类,共包含200种不同类别、11788张鸟类图像数据。同时,该数据库提供了丰富的人工标注数据,每张图像包含15个局部区域位置、312个二值属性、1个标注框 以及语义分割图像。http://www.vision.caltech.edu/visipedia/CUB-200-2011.html
Stanford Dogs:狗细粒度图片分类,提供了120种不同种类的狗的图像数据,共有20 580张图,只提供标注框这一个人工标注数据。
Stanford Cars :车辆细粒度图片分类。对车辆进行了详细的汇总和收集,提供196类不同品牌不同年份不同车型的车辆图像数据,一共包含有16185张图像,只提供标注框信息。
Oxford Flowers:花朵细粒度图像分类,共包含102种类别,每个类别包含了40到258张图像数据,共有8189张图像。该数据库只提供语义分割图像 , 不包含其他额外标注信息。
参考:
https://zhuanlan.zhihu.com/p/47281243
https://zhuanlan.zhihu.com/p/75199948
https://zhuanlan.zhihu.com/p/53611407