本系列是研一课程《图像处理与图像识别》的随堂笔记,主要内容是数字图像处理方面,根据老师的讲课内容与自己的理解所书写,还会有一些具体实现的代码,基于Python,欢迎交流。本篇主要介绍图像处理与图像识别的基础知识。
一、图像处理(ImageProcessing)
图像处理是对图像信息进行加工处理,以满足人的视觉心理和实际应用的要求。
图像处理是以人作为最终的信息接收者,主要目的是改善图像的质量。
图像处理是计算机视觉的基础。
二、图像识别(ImageRecognition)
图像识别是以机器为对象,目的是使机器或计算机能自动地识别目标,属于计算机视觉范畴内。
图像分割是数字图像处理中的关键技术之一,指的是将图像中的有意义的特征部分提取出来,包括图像中物体的边缘、区域等。图像分割是进一步进行图像识别、分析和理解的基础,例如手写数据集MNIST就是已经分割好的数据集。我们这里所述的图像分割是指传统的分割,将属于不同物体的像素分开,计算机并不知道分割出来的内容是什么,这个阶段的图像分割方法包括像Ostu、FCM、分水岭、N-Cut等,属于非监督学习;图像语义分割是更高级的分割,语义分割是在传统分割的基础之上,分类出每一个区域的语义,这个阶段的主要方法是深度学习。还有一种分割叫实例分割(Instance Segmentation),在语义分割的基础上,对属于同一类别的不同物体进行划分。图像分割的应用场景,比如自动驾驶,3D 地图重建,美化图片,人脸建模等等。图像分割是像素级的,与图像分类、目标检测区分开,是更高一级层面的。
上图中的图像分割应指的是传统的分割方法,在传统的图像识别中需要先进行图像分割。
三、图像识别快速发展的原因
(1)计算性能大幅提高,底层芯片从CPU+GPU到FPGA,再到人工智能芯片,计算性能不断刷新;
(2)应用场景多样化,提升产业与技术的发展;
(3)开源工具与框架方便学习与研究,缩短理论到应用的距离。