全世界只有3.14 % 的人关注了
爆炸吧知识
计算机视觉在上一个世纪60年代脱胎于人工智能与认知神经科学,并旨在通过设计算法来让计算机自动理解图像的内容。
于是为了“解决”这类机器视觉的问题,麻省理工在1966年正式将这个问题作为一个夏季项目,然而事实验证,要解决这个问题可能还需要更长时间。
转眼间,距离麻省理工最初提出这个项目已过去50多年,一般的图像理解任务仍旧是不能得到完美解决。
不过也已取得显著进展,并且随着机器视觉算法商业化的成功,机器视觉产品已经开始拥有广泛的用户,包括图像分割(例如微软office中去除图片背景的功能)、图像检索、人脸检测对焦和Kinect的人体运动捕捉等。
物体检测是计算机视觉与模式识别领域的核心问题,一直以来受到学术界与工业界的广泛关注。当前物体检测最大的难点是如何对场景中多种尺度的物体进行有效表征,进而进行更为高效、更为准确、更为鲁棒的物体检测。
物体检测对于人眼来说并不困难,我们可以通过对图片中不同颜色、纹理、边缘模块的感知很容易定位出目标物体,但对于计算机来说,面对的是RGB像素矩阵,很难从图像中直接得到狗和猫这样的抽象概念并定位其位置,再加上物体姿态、光照和复杂背景混杂在一起,使得物体检测更加困难。
于是人们在不断探索的过程中,涌现出用以解决各类问题的算法、框架,例如决策树、Fast R-CNN、Mask R-CNN等,今天小天将主要讲讲Mask R-CNN。
Mask R-CNN是一个实例分割(Instance segmentation)算法,由何凯明等人在2017年发表的论文中提出,可以用来做“目标检测”、“目标实例分割”、“目标关键点检测”。
Mask R-CNN是一个非常灵活的框架,可以通过增加不同的分支来完成不同的任务,例如可以用来完成目标分类、目标检测、语义分割、实例分割、人体姿势识别等多种任务!
Mask R-CNN算法建立在Faster R-CNN架构的基础之上,我们可以将Mask R-CNN架构可视化如下图所示:
相较于Faster-rcnn,Mask R-CNN拥有更高速、高准确率(高的分类准确率、高的检测准确率、高的实例分割准确率等)、简单直观、易于使用的特性。即便如此,Faster-rcnn与Mask R-CNN这两个算法都是对应领域中的经典之作。
Mask R-CNN比Faster-rcnn复杂,但是最终仍然可以达到5fps的速度,这和原始的Faster-rcnn的速度相当。
此外,由于发现了ROI Pooling中所存在的像素偏差问题,提出了对应的ROIAlign策略,加上FCN精准的像素MASK,使得其可以获得高准确率。
纵观整个Mask R-CNN,它的算法的思路很简单,就是在原始Faster-rcnn算法的基础上面增加了FCN来产生对应的MASK分支。即Faster-rcnn + FCN,更细致的是 RPN + ROIAlign + Fast-rcnn + FCN。
那么问题来了,到底如何借助Mask R-CNN来进行进行物体检测呢?
为了让大家对Mask R-CNN在物体检测领域的应用有全面的了解,爆炸吧知识携手唐老师推出《深度学习-物体检测实战》。
长按识别二维码
即可查看课程
内容包含:物体检测框架Mask R-CNN项目配置,Mask R-CNN网络框架源码详解、基于Mask R-CNN训练自己的数据集与任务、迁移学习与Resnet网络架构、物体检测Faster R-CNN系列。
限时直降70元,却有满满干货!不止是学习建议,更注重学以致用:
多维度教学模式:录播+学习群,不受时间/地域限制,大家可轻松安排时间学习;
项目实战:以真实赛题为训练目标,学习就是比赛,这样才能学以致用;
全程代码:课上讲解的训练代码都会分享给大家,使学生做到及时的活学活用。
关于主讲老师
适用对象与课程特色
适用对象:
◆ 人工智能爱好者、Python爱好者、机器学习爱好者、深度学习爱好者
课程特色:
学习平台——腾讯课堂
上课形式——录播
课程资料——配有专属实战案例
课程收益——了解物体检测Faster R-CNN与Mask R-CNN,快速入门物体检测
注意事项
①课程有疑问或成功报名均请联系助教☟
小七微信:zwjlee001
大鱼QQ:210187565
来吧,点击下方“阅读原文”,跟随着老师的脚步,提升自我!