FCOS: 全卷积单阶段目标检测
我们提出了一种全卷积单阶段目标检测器(FCOS),以逐像素预测的方式解决目标检测问题,类似于语义分割。目前几乎所有的最先进目标检测器,如RetinaNet、SSD、YOLOv3和Faster R-CNN,都依赖于预定义的锚框。相反,我们提出的FCOS检测器是无锚框的,同时也是无候选区域的。通过消除预定义的锚框集,FCOS完全避免了与锚框相关的复杂计算,如训练期间计算重叠等。更重要的是,我们还避免了与锚框相关的所有超参数,这些参数通常对最终的检测性能非常敏感。
仅使用非极大值抑制(NMS)进行后处理,使用ResNeXt-64x4d-101的FCOS在单模型和单尺度测试中实现了44.7%的AP,超越了以前的单阶段检测器,并具有更简单的优势。我们首次展示了一种更简单且灵活的检测框架,实现了改进的检测精度。我们希望所提出的FCOS框架可以作为许多其他实例级任务的一个简单而强大的替代方案。代码可以在以下网址获得:
tinyurl.com/FCOSv1
1. 引言
物体检测是计算机视觉中一个基础但具有挑战性的任务,要求算法为图像中每个感兴趣的实例预测一个包含类别标签的边界框。当前所有的主流检测器如 Faster R-CNN [24]、SSD [18] 和 YOLOv2、v3 [23] 都依赖于一组预定义的锚框,并且长久以来认为锚框的使用是检测器成功的关键。尽管它们取得了巨大的成功,但锚框基检测器存在一些缺点:
-
如文献 [15, 24] 所示,检测性能对锚框的尺寸、长宽比和数