摘要
预训练模型在提高训练成绩上是非常有效,大家通常使用COCO数据集训练的模型做为预训练模型,在小型数据集做实验发现,使用COCO数据集训练的预训练模型比没有使用预训练模型的得分能高出2%mAP,同时,如果使用Objects365做预训练,能比没有使用预训练的模型高出4%的mAP,是涨分的利器(当然,不全是能达到这样的水平,但是提高成绩还是非常有效的)。这篇文章,采用了一种非常简单的方法完成Objects365的训练。
数据集介绍
北京智源人工智能研究院和旷视联合推出了目标检测任务的新基准:Objects365。它的所有图像数据都是在自然场景设计和收集的。该Objects365目标检测数据集主要用于解决具有365个对象类别的大规模检测,并为目标检测研究提供多样化、实用性的基准。同时,我们围绕数据集组织了2019年智源-旷视目标检测挑战赛,以及2020年智源-旷视目标检测赛,希望这些活动可以成为一个平台,推动目标检测研究的上限。
平台上Objects365数据集包含训练集、验证集、测试集和license.txt:
1、训练集:51个图片文件压缩包,共有超过172万张图片;1个训练集图片标注文件压缩包 zhiyuan_objv2_train.json.tar.gz;
2、验证集: