以下内容源于网络资源的学习与整理,如有侵权请告知删除。
1、图像编码的必要性
图像的数据量非常大,为了有效地传输和存储图像,有必要压缩图像的数据量。随着现代通信技术的发展,要求传输的图像信息的种类和数据量愈来愈大。若不进行数据压缩,便难以推广应用。
举一个例子。假如显示器正在播放一个视频,分辨率是1280*720,帧率是25,那么一秒所产生正常的数据大小为:1280*720*25 / 8/ 1024 / 1024 = 2.74MB,那么90分钟的电影就要14.8GB,这个数据量显然在当前网络下是不现实的。
2、图像编码的可行性
图像数据可以进行压缩有几方面的原因。
首先,原始图像数据是高度相关的,存在很大的冗余。数据冗余造成比特数浪费,消除这些冗余可以节约码字,也就是达到了数据压缩的目的。大多数图像内相邻像素之间有较大的相关性,这称为空间冗余。序列图像前后帧内相邻之间有较大的相关性,这称为时间冗余。
其次,若用相同码长来表示不同出现概率的符号也会造成比特数的浪费,这种浪费称为符号编码冗余。如果采用可变长编码技术,对出现概率高的符号用短码字表示,对出现概率低的符号用长码字表示,这样就可大大消除符号编码冗余。
再次,有些图像信息(如色度信息、高频信息)在通常的视感觉过程中与另外一些信息相比来说不那么重要,这些信息可以认为是心理视觉冗余,去除这些信息并不会明显地降低人眼所感受到的图像质量,因此在压缩的过程中可以去除这些人眼不敏感的信息,从而实现数据压缩。
3、图像编码的技术分类
从不同的角度出发,图像压缩编码技术有不同的分类方法。根据压缩过程有无信息损失,可分为有损编码和无损编码;根据压缩原理进行划分,可以分为预测编码、变换编码、统计编码等。
(1)有损编码
有损编码又称为不可逆编码,是指对图像进行有损压缩,致使解码重新构造的图像与原始图像存在一定的失真,即丢失了一部分信息。由于允许一定的失真,这类方法能够达到较高的压缩比。有损压缩多用于数字电视、静止图像通信等领域
(2)无损编码
无损压缩又称可逆编码,是指解压后的还原图像与原始图像完全相同,没有任何信息的损失。这类方法能够获得较高的图像质量,但所能达到的压缩比不高,常用于工业检测、医学图像、存档图像等领域的图像压缩中。
(3)预测编码
预测编码是利用图像信号在局部空间和时间范围内的高度相关性,以已经传出的近邻像素值作为参考,预测当前像素值,然后量化、编码预测误差。预测编码广泛应用于运动图像、视频编码如数字电视、视频电话中。
(4)变换编码
变换编码是将空域中描述的图像数据经过某种正交变换(如离散傅里叶变换DFT、离散余弦变换DCT、离散小波变换DWT等)转换到另一个变换域(频率域)中进行描述,变换后的结果是一批变换系数,然后对这些变换系数进行编码处理,从而达到压缩图像数据的目的。
(5)统计编码
统计编码也称为熵编码,它是一类根据信息熵原理进行的信息保持型变字长编码。编码时对出现概率高的事件(被编码的符号)用短码表示,对出现概率低的事件用长码表示。在目前图像编码国际标准中,常见的熵编码方法有哈夫曼(Huffman)编码和算术编码。
4、图像编码的评价指标
压缩比、失真比是衡量图像压缩的重要指标。压缩比是指压缩过程中输入数据量和输出数据量之比。失真比主要是针对有损编码而言的,是指图像经有损压缩,然后将其解码后的图像与原图像之间的误差,有损压缩会使原始图像数据不能完全恢复,信息受到一定的损失,但压缩比较高,复原后的图像存在一定的失真。