AI学习目录汇总
1、简述
通过前面的学习,已经了解了图像分类模型的原理及实现。图像分类是假定图像中只有一个目标,算法上是对整个图像做的分类。
下面我们来学习“目标检测”,即从一张图像中找出需要的目标,并标记出位置。
2、边界框
边界框:bounding box,就是一个方框,使用方框将目标刚刚好的框起来。
用坐标来表示边界框的位置和大小有两种方式
- 边界框左上角、右下角的坐标表示
- 边界框中心的坐标和框的宽高表示。
3、锚框
锚框:anchor box,想像一下,其实我们不知道目标大小和位置,先假定目标的中心位置,和船下锚类似,然后使用多个不同大小的框来探测是否有被测目标。
不同大小的框可以通过不同的缩放比和宽高比来表示。
除了使用坐标来描述锚框的大小和位置,还需要一个标签来标记被检测目标的类别。
4、交并比
交并比:IoU,用来衡量锚框和真实边界框之间的相似性,杰卡德系数,数学公式如下: