文章目录
- 一、图像压缩
- 1.1 三种冗余
- 1.2 模型
- 1.3 信息测量
- 二、无误差压缩
- 2.1 哈夫曼编码
- 2.1.1 步骤
- 2.1.2 例题
- 2.2 算术编码
- 三、变换编码
一、图像压缩
1.1 三种冗余
1. 三种基本的是数据冗余为:编码冗余、像素间冗余、心理视觉冗余。
2. 编码冗余:如果一个图像的灰度级编码使用了多于实际需要的编码符号,就称该图像包含了编码冗余。
3. 像素间冗余:对于一幅图像,很多单个像素对视觉的贡献是冗余的。它的值可以通过与它相邻的像素值为基础进行预测。
4. 心理视觉冗余:有些信息在通常的视觉过程中与另外一些信息相比并不那么重要,这些信息被认为是心理视觉冗余的,去除这些信息并不会明显降低图像质量。
由于消除心理视觉冗余数据会导致一定量信息的丢失,所以这一过程通常称为量化。心理视觉冗余压缩是不可恢复的,量化的结果导致了数据有损压缩。
1.2 模型
1. 图像压缩模型由编码器和解码器组成。
2. 信源编码器:减少或消除输入图像中的编码冗余、像素间冗余及心理视觉冗余。组成图:
(1) 转换器:减少像素间冗余。
(2) 量化器:减少心理视觉冗余,该步操作是不可逆的。
(3) 符号编码器:减少编码冗余。
注:并不是每个图像压缩系统都必须包含这 3 3 3 种操作,如进行无误差压缩时,必须去掉量化器。
3. 信源解码器组成图:
(1) 符号解码器:进行符号编码的逆操作。
(2) 反向转换器:进行转换器的逆操作。
1.3 信息测量
1. 对一个随机事件 E E E,如果它的出现概率是 P ( E ) P(E) P(E),那么它包含的信息如下公式所示。 I ( E ) I(E) I(E) 称为 E E E 的自信息。如果 P ( E ) = 1 P(E)=1 P(E)=1,那么 I ( E ) = 0 I(E)=0 I(E)=0。
2. 压缩比 r r r 如下公式所示。一般情况下 r ≥ 1 r≥1 r≥1, r r r 愈大则压缩程度愈高。
3. 图像熵 H H H 公式如下。令 p ( d i ) p(d_i) p(di) 为数字图像第 i i i 个灰度级 d i d_i di 相应出现概率。
4. 平均码字长度公式如下所示。令 L i L_i Li 为数字图像第 i i i 个灰度级 d i d_i di 的编码长度。
5. 编码效率 η η η 公式如下所示。如果平均码字长度接近 H H H,则编码效果为佳。
二、无误差压缩
1. 采用变字长编码,变字长编码是每个符号的码字长度随字符出现概率而变化。
2. 若编码时,对出现概率较大的符号用较少比特数(短码)表示,对出现概率较少的符号用较多比特数(长码)表示,则其平均码字长度要比等长编码时所需码字少。
2.1 哈夫曼编码
2.1.1 步骤
哈夫曼编码步骤如下:
2.1.2 例题
2.2 算术编码
1. 算术编码从整个符号序列出发,采用递推形式连续编码。在算术编码中,信源符号(灰度值)和码字之间不存在一一对应的关系。
2. 算术编码用到的两个基本的参数:符号的概率和它的编码间距。
3. 算法编码包括编码和解码过程。编码本质就是按给的码的顺序找区间划分;解码本质就是按给的实数反向找区间,再将每一次找到的区间对应成码。例题如下:
三、变换编码
1. 用可逆的线性变换(如傅里叶变换)将图像映射成一组变换系数,然后将这些系数量化和编码。大多数图像变换得到的系数值都很小,这些系数可以较粗地量化,或忽略不计。虽然失真很小,信息仍不能完全复原,所以还是有损压缩。
2. 变换编码系统组成:
3. 离散傅里叶变换和离散余弦变换比较:
(1) 相同:都是图像变换,对信息进行集中。
(2) 异同:离散傅里叶变换涉及复数运算,而离散余弦变换涉及实数运算,离散余弦变换是离散傅里叶变换的一种特殊形式。