一、哈夫曼树的定义
(1)简单路径长度
所谓树的简单路径长度,是指从树的跟节点到每个节点的路径长度之和。
完全二叉树是简单路径长度更小的二叉树。
(2)加权路径长度
所谓树的加权路径长度,是指树中所以带权(非0)叶节点的加权路径长度之和。
如下图所示,不同的树结构,加权路径长度也不一样。
(3)哈夫曼树的定义
哈夫曼树又称为最优二叉树。哈夫曼树是指具有相同节点的树中,加权路径长度最小的二叉树。
二、哈夫曼树的构造过程
哈夫曼树的构造过程需要借助最小堆算法。
如下图所示,首先将原始数据构造出一个最小堆,然后每次从堆中选取值最小两个节点,计算他们的权重之和,作为一个新节点的值,然后插入到最小堆中,直到所有数据节点都构造完毕,成为一个最大堆。
三、哈夫曼树的作用(哈夫曼编码)
哈夫曼编码是一种编码方式,是一种用于无损数据压缩的权编码算法。编码之后的字符串的平均长度、期望值降低,从而达到无损压缩数据的目的。