MATLAB图像处理
1. 数字图像处理
参考
数字图像处理(Digital Image Processing)又称为计算机图像处理,是一种将图像信号数字化利用计算进行处理的过程。随着计算机科学、电子学和光学的发展,数字图像处理已经广泛的应用到诸多领域之中。本小节主要介绍图像的概念、分类和数字图像处理的产生以及数字图像处理的研究的内容。
1.1 什么是图像
图像: 是三维世界在二维平面的表示,具体来说就是光学器件对一个物体,一个人或是一个场景等的可视化表示。图像中包含了它所表达的事物的大部分信息,据有关资料表示,人类所获得的大部分信息来源于视觉系统,也就是从图像中获得的。
1.2 图像的分类
根据图像的属性不同,图像分类方法也不同。从获取方式上图像分为拍摄类图像和绘制类图像;从颜色上图像分为彩色图像、灰度图像和黑白图像等;从图像的内容上图像分为人物图像,风景图像等;从功能上又分为流程图、结构图、心电图、电路图、设计图等。
在数字图像处理领域,将图像分为模拟图像和数字图像两种,计算机处理的信号都是数字信号,所以在计算机上处理的图像均为数字图像。根据数字图像在计算机中表示方法不同,分为二进制图像,索引图像,灰度图像,RGB图像和多帧图像;根据计算机中图像文件格式不同,图像又分为位图和矢量图。可见,图像的属性是多角度的,图像的分类也是多维的。
1.3 数字图像的产生
数字图像的产生主要有两种渠道,一种是通过数码照相机这样的设备直接拍摄得到数字图像,还有一种是通过图像采集卡、扫描仪等数字化设备,将模拟图像变为数字图像。
模拟图像转换成数字图像: 首先将图像分割成8 * 8 个各自,用数字0表示全是黑色,用数字8表示全是白色.(1~7表示黑色的多少)
1.4 数字图像处理的研究内容
数字图像处理的研究内容主要有以下方向:
- 图像运算与变换
-
图像增强
-
图像复原
-
图像的锐化处理及边缘检测
-
图像分割: 将感兴趣的区域分割出来,进行研究
-
图像编码压缩
2. 图像的表示方法
图像的表示方法是对图像处理算法描述和利用计算机处理图形的基础。一个二维图像,在计算机中通常为一个二维数组f(x, y), 或者是一个M * N 的二维矩阵,其中, M为图像的行数, N为图像的列数。
2.1 二进制图像
二进制图像也称为二值图像,通常用一个二维数组来描述,1位表示一个像素,组成图像的像素值非0即1,没有中间值,通常0表示黑色,1表示白色。二进制图像一般用来描述文字或者图形,其优点是占用空间少,缺点是当表示人物或风景图形时只能描述轮廓。
2.2 灰度图像
灰度图像也称为单色图像,通常也是由一个二维数组表示一副图像,8位表示一个像素,0表示黑色,255表示白色,1~254表示不同的深浅灰色。通常灰度图像显示了黑色与白色之间许多级的颜色深度,比人眼所能识别的颜色深度范围要宽的多。
2.3 RGB图像
RGB图像也称为真彩色,是一种彩色图像的表示方法,利用3个大小相同的二维数组表示一个像素,3个数组分别代表R、G、B三个分量,R表示红色,G表示绿色,B表示蓝色,通过三种基本颜色可以合成任意颜色。每个像素中的每种颜色分量占8位,每一位由[0, 255]中的任意数值表示,那么一个像素由24位表示,允许的最大值为2^24(即1677216,通常记为16M)
2.4 索引图像
索引图像是一种把像素值直接作为RGB调色版下标的图像。在MATLAB中,索引图像包含一个数据矩阵X和一个颜色映射(调色板)矩阵map。数据矩阵可以是8位无符号整型、16位无符号整型或双精度类型的。
3. 图像的数据结构
数字图像处理常用的数据结构有矩阵,链表,拓扑结构和关系结构。图像的数据结构用于目标表示和描述。本节主要介绍矩阵、链表、拓扑结构和关系结构描述图像、图像的边界、区域和区域之间的关系。
3.1 矩阵
矩阵用于描述图像,可以表示黑白图像、灰度图像和彩色图像。矩阵中的一个元素表示图像的一个像素。矩阵描述黑白图像时,矩阵中的元素取值只有0和1两个值,因此黑白图像又叫二值图像或二进制图像。矩阵描述灰度图像时,矩阵中的元素由一个量化的灰度级描述,灰度级通常为8位,即0~255之间的整数,其中0表示黑色,255表示白色。
3.2 RGB彩色图像
RGB彩色图像是由三原色红、绿、蓝组成的,RGB图像的每个像素都是由不同灰度级的红、绿、蓝描述的,每种单色的灰度描述同灰度图像的描述方式相同。
链码用于描述目标图像的边界,通过规定链的起始坐标和链起始点坐标的斜率用一小段线段来表示图像中的曲线。链码按照标准方向的斜率分为4向链码或8向链码。
3.3 拓扑结构
拓扑结构**用于描述图像的基本结构,通常在于形态的图像处理或是二值图像中,用于描述目标事件发生的次数,在一个目标事件中有多少孔洞,有多少联通区域等。在图像中定义相邻的概念,一个像素与它周围的像素组成一个邻域
在图像中,目标事件上的两个像素点如果可以用一个像素序列联通。连接像素p和q的都是4-邻域像素点,则p和q称为4-连通,连接p和q的都是8邻域像素点,则p和q称为8-连通。如果一个像素集合中的所有像素点都是4连通,则这个集合称为4-组元,如果一个像素集合的所有像素都是8连通,则这个集合称为8-组元。
3.4关系结构
关系结构用于描述一组目标物体之间的相互关系,常用的描述方法为传描述和树描述。串描述是一种一维结构,当用串描述图像时,需要建立一种合适的映射关系,将二维图像降为一维形式。串描述适用于那些图像元素的链表的连接可以用来从头到尾或用其他连续形式的图像元素的描述。链码表示就是基于串描述思想描述的。
树描述:是一种能够对不连接区域进行很好描述的方法。树是一个或一个以上节点的有限集合
4. 计算机中图像文件格式
数字图像在计算机中存储的格式有多种多样,每一个文件格式都包括一个头文件和一个数据文件。头文件的内容由制作图像的公司规定,一般包括文件类型、制作时间,文件大小制作人及版本号等信息。文件制作时还涉及到图像的压缩和存储效率等。
4.1 BMP文件格式
BMP文件格式是Windows系统中的一种标准图像文件格式,支持RGB、索引颜色、灰度和位图颜色模式。BMP文件一共有两种类型,设备相关位图(DDB)和设备无关位图(DIB)。Windows3.0及以前的BMP文件格式与显示设备有关,因此把这种BMP文件格式称为设备相关位图DDB(device-dependent bitmap)文件格式。Windows3.0 以后的BMP文件与显示设备无关,因此把这种BMP图像文件格式称为与位图无关DIB(device-independent bitmap)格式。BMP文件默认的文件扩展名是.BMP或.bmp。
4.2 GIF文件格式
- GIF文件格式是CompuServe公司在1987年开发的图像文件格式,任何商业目的使用均须由CompuServe公司授权。
- GIF文件主要是为数据流设计一种传输格式,不作为文件的存储格式,它具有顺序的结构形式。GIF文件主要由5部分组成:
- 文件标志块: 标识"GIF"和版本号;
- 逻辑屏幕描述块: 定义图像显示区域的参数,包含背景颜色信息、显示区域大小、纵横尺寸、颜色深浅以及是否存在全局彩色表;
- 全局彩色表: 其大小由图像使用的颜色决定;
- 图像数据块: 包含图像的描述块,局部彩色表,压缩图像数据,图像控制块,无格式文本扩展块,注释扩展块,应用程序扩展块,此部分可以缺省;
- 尾块: 为三维16进制数,表示数据流以及结束,此部分可以缺省。