pytorch深度学习-机器视觉-目标检测和边界框简介

机器视觉之目标检测和边界框简介

在图像分类任务里，我们假设图像里只有一个主体目标，并关注如何识别该目标的类别。然而，很多时候图像里有多个我们感兴趣的目标，我们不仅想知道它们的类别，还想得到它们在图像中的具体位置。在计算机视觉里，我们将这类任务称为目标检测（object detection）或物体检测。

目标检测在多个领域中被广泛使用。例如，在无人驾驶里，我们需要通过识别拍摄到的视频图像里的车辆、行人、道路和障碍的位置来规划行进线路。机器人也常通过该任务来检测感兴趣的目标。安防领域则需要检测异常目标，如歹徒或者炸弹。

在接下来的几节里，我们将介绍目标检测里的多个深度学习模型。在此之前，让我们来了解目标位置这个概念。先导入实验所需的包或模块。

%matplotlib inline
from PIL import Image
from matplotlib import pyplot as plt

下面加载本节将使用的示例图像。可以看到图像左边是一只狗，右边是一只猫。它们是这张图像里的两个主要目标。

边界框

在目标检测里，我们通常使用边界框（bounding box）来描述目标位置。边界框是一个矩形框，可以由矩形左上角的 $x$ 和 $y$ 轴坐标与右下角的 $x$ 和 $y$ 轴坐标确定。我们根据上面的图的坐标信息来定义图中狗和猫的边界框。图中的坐标原点在图像的左上角，原点往右和往下分别为 $x$ 轴和 $y$ 轴的正方向。

# bbox是bounding box的缩写
dog_bbox, cat_bbox = [60, 45, 378, 516], [400, 112, 655, 493]

我们可以在图中将边界框画出来，以检查其是否准确。画之前，我们定义一个辅助函数bbox_to_rect。它将边界框表示成matplotlib的边界框格式。

def bbox_to_rect(bbox, color): # 将边界框(左上x, 左上y, 右下x, 右下y)格式转换成matplotlib格式：# ((左上x, 左上y), 宽, 高)return plt.Rectangle(xy=(bbox[0], bbox[1]), width=bbox[2]-bbox[0], height=bbox[3]-bbox[1],fill=False, edgecolor=color, linewidth=2)

我们将边界框加载在图像上，可以看到目标的主要轮廓基本在框内。

fig = plt.imshow(img)
fig.axes.add_patch(bbox_to_rect(dog_bbox, 'blue'))
fig.axes.add_patch(bbox_to_rect(cat_bbox, 'red'));

在目标检测里不仅需要找出图像里面所有感兴趣的目标，而且要知道它们的位置。位置一般由矩形边界框来表示。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/507944.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

pytorch深度学习-机器视觉-目标检测和边界框简介

机器视觉之目标检测和边界框简介

边界框

相关文章

消防荷载楼板按弹性还是塑性计算_第二节消防登高面、消防救援场地和灭火救援窗...

深度学习-词嵌入（word2vec）

ggplot2箱式图两两比较_作图技巧024篇ggplot2在循环中的坑

character-level OCR之Character Region Awareness for Text Detection(CRAFT) 论文阅读

c# wpf 面试_【远程面试】九强通信 | 九洲电器集团全资子公司

ViT(Vision Transformer)学习

cpri带宽不足的解决方法_u盘容量不足怎么办 u盘容量不足解决方法【介绍】

复合的赋值运算符例题_Java学习：运算符的使用与注意事项

腾讯会议如何使用讲演者模式进行汇报（nian gao）

bulk这个词的用法_15、形容词与副词（二）比较的用法

retinex 的水下图像增强算法_图像增强论文:腾讯优图CVPR2019

python 实现 BCH 纠错码的方法

结构体引用_C/C++结构体完全攻略

mysql root密码过期了_Mac下重置mysql的root密码

论文页眉奇偶页不同怎么设置_还在愁毕业论文的页眉页脚吗？

账号管理工具_全新微信个人号管理工具能选择吗？为何这么说？

护理等级分级标准及巡视时间_18项护理核心制度，都在这了

2接口详解_java集合【2】——— Collection接口详解

幅度响应怎么计算_四电平脉冲幅度调制(PAM4)信号的误码分析

windows功能_这 12 个好用 Windows 软件，让你也能用上 macOS 的独占功能