文章目录
二叉树
考纲内容
复习提示
1.二叉树的概念
1.1二叉树的定义及其主要特性
1.1.1二叉树的定义
1.1.2几种特殊的二叉树
1.1.3二叉树的性质
1.2二叉树的存储结构
1.2.1顺序存储结构
1.2.2链式存储结构
知识回顾
二叉树
考纲内容
(一)树的基本概念
(二)二叉树
二叉树的定义及其主要特征;二叉树的顺序存储结构和链式存储结构;
二叉树的遍历;线索二叉树的基本概念和构造
(三)树、森林
树的存储结构;森林与二叉树的转换;树和森林的遍历
(四)树与二叉树的应用
哈夫曼(Huffman)树和哈夫曼编码;并查集及其应用
复习提示
本章内容多以选择题或综合题的形式考查,但统考也会出涉及树遍历相关的算法题。树和二叉树的性质、遍历操作、转换、存储结构和操作特性等,满二叉树、完全二叉树、线索二叉树、哈夫曼树的定义和性质,都是选择题必然会涉及的内容。
1.二叉树的概念
1.1二叉树的定义及其主要特性
1.1.1二叉树的定义
二叉树是一种特殊的树形结构,其特点是每个结点至多只有两棵子树(即二叉树中不存在度大于2的结点),并且二叉树的子树有左右之分,其次序不能任意颠倒。
与树相似,二叉树也以递归的形式定义。二叉树是n(n=>0)个结点的有限集合:
① 或者为空二叉树,即 n=0。
②或者由一个根结点和两个互不相交的被称为根的左子树和右子树组成。左子树和右子树又分别是一棵二叉树。
二叉树是有序树,若将其左、右子树颠倒,则成为另一棵不同的二叉树。即使树中结点只有一棵子树,也要区分它是左子树还是右子树。二叉树的5种基本形态如图所示。
二叉树与度为2的有序树的区别:
① 度为2的树至少有3个结点,而二叉树可以为空。
② 度为2的有序树的孩子的左右次序是相对于另一个孩子而言的,若某个结点只有一个孩子,则这个孩子就无须区分其左右次序,而二叉树无论其孩子数是否为2,均需确定其左右次序,即二叉树的结点次序不是相对于另一结点而言的,而是确定的。
1.1.2几种特殊的二叉树
1) 满二叉树。一棵高度为 h,且有 个结点的二叉树称为满二叉树,即二叉树中的每层都含有最多的结点,如图5.3(a)所示。满二叉树的叶结点都集中在二叉树的最下一层,并且除叶结点之外的每个结点度数均为2。
可以对满二叉树按层序编号:约定编号从根结点(根结点编号为1)起,自上而下,自左向右。这样,每个结点对应一个编号,对于编号为i的结点,若有双亲,则其双亲为(该符号为向下取整符);若有左孩子,则左孩子为2i;若有右孩子,则右孩子为2i+1。
【命题追踪——完全二叉树中结点数和叶结点数的关系】
2) 完全二叉树。高度为h、有n个结点的二叉树,当且仅当其每个结点都与高度为h的满二叉树中编号为1~n的结点一一对应时,称为完全二叉树,如图 5.3(b)所示。其特
点如下:
① 若 (向下取整符),则结点i为分支结点,否则为叶结点。
②叶结点只可能在层次最大的两层上出现。对于最大层次中的叶结点,都依次排列在该层最左边的位置上。
③ 若有度为1的结点,则最多只可能有一个,且该结点只有左孩子而无右孩子。
④ 按层序编号后,一旦出现某结点(编号为i)为叶结点或只有左孩子,则编号大于i的结点均为叶结点。
⑤ 若n为奇数,则每个分支结点都有左孩子和右孩子:若n为偶数,则编号最大的分支结点(编号为n/2)只有左孩子,没有右孩子,其余分支结点左、右孩子都有。
3) 二叉排序树。左子树上所有结点的关键字均小于根结点的关键字;右子树上所有结点的关键字均大于根结点的关键字;左子树和右子树又各是一棵二叉排序树。
4) 平衡二叉树。树中任意一个结点的左子树和右子树的高度之差的绝对值不超过1。关于二叉排序树和平衡二叉树的详细介绍,见本书中的7.3节。
【命题追踪——正则k叉树树高和结点数的关系的应用】
5) 正则二叉树。树中每个分支结点都有2个孩子,即树中只有度为0或2的结点。
1.1.3二叉树的性质
1) 非空二叉树上的叶结点数等于度为2的结点数加1,即n0=n2+1。
证明:设度为0,1和2的结点个数分别为n0,n1和n2,结点总数n=n0+n1+n2。再看二叉树中的分支数,除根结点外,其余结点都有一个分支进入,设B为分支总数,
则(n为节点数)n=B+1。由于这些分支是由度为1或2的结点射出的,因此又有 B=n1 + 2n2。于是得n0+n1+n2=n1+2n2+1,则n0=n2+1。
注意:该性质经常在选择题中涉及,希望读者牢记并灵活应用。
2) 非空二叉树的第k层最多有个结点(k>1)。
第1层最多有 1个结点(根),第2层最多有 2个结点,以此类推,可以证明其为一个公比为2的等比数列 。
3) 高度为h的二叉树至多有 个结点(h>1)。
该性质利用性质2求前h项的和,即等比数列求和的结果。
注意:性质2和性质3还可以拓展到 m叉树的情况,即m 叉树的第k层最多有 个结点,高度为 h的 m 叉树至多有个结点。
4)对完全二叉树按从上到下、从左到右的顺序依次编号1,2,…,n,则有以下关系:
① 若 ,则结点i为分支结点,否则为叶结点,即最后一个分支结点的编号为。
② 叶结点只可能在层次最大的两层上出现(若删除满二叉树中最底层、最右边的连续 2个或以上的叶结点,则倒数第二层将会出现叶结点)。
③ 若有度为1的结点,则只可能有一个,且该结点只有左孩子而无右孩子(度为1的分支结点只可能是最后一个分支结点,其结点编号为)。
④ 按层序编号后,一旦出现某结点(如结点 i)为叶结点或只有左孩子的情况,则编号大于i的结点均为叶结点(与结论①和结论③是相通的)。
⑤ 若n为奇数,则每个分支结点都有左、右孩子;若n为偶数,则编号最大的分支结点(编号为 n/2)只有左孩子,没有右孩子,其余分支结点都有左、右孩子。
⑥ 当i>1时,结点i的双亲结点的编号为。
⑦ 若结点i有左、右孩子,则左孩子编号为 2i,右孩子编号为 2i+1。
⑧ 结点i所在层次(深度)为 。
5) 具有n个(n>0)结点的完全二叉树的高度为(向上取整)或 (向下取整)
设高度为 h,根据性质 3和完全二叉树的定义有:
或者
得 ,即 ,因为h为正整数,所以,或者得 ,所以。
1.2二叉树的存储结构
1.2.1顺序存储结构
二叉树的顺序存储是指用一组连续的存储单元依次自上而下、自左至右存储完全二叉树上的结点元素,即将完全二叉树上编号为i的结点元素存储在一维数组下标为i-1的分量中。
依据二叉树的性质,完全二叉树和满二叉树采用顺序存储比较合适,树中结点的序号可以唯一地反映结点之间的逻辑关系,这样既能最大可能地节省存储空间,又能利用数组元素的下标值确定结点在二叉树中的位置,以及结点之间的关系。
【命题追踪——特定条件下二叉树树形及占用存储空间的分析】
但对于一般的二叉树,为了让数组下标能反映二叉树中结点之间的逻辑关系,只能添加一些并不存在的空结点,让其每个结点与完全二叉树上的结点相对照,再存储到一维数组的相应分量中。
然而,在最坏情况下,一个高度为h且只有h个结点的单支树却需要占据近 个存储单元。二叉树的顺序存储结构如图5.4所示,其中0表示并不存在的空结点。
注意:建议从数组下标1开始存储树中的结点,保证数组下标和结点编号一致。
1.2.2链式存储结构
由于顺序存储的空间利用率较低,因此二叉树一般都采用链式存储结构,用链表结点来存储二叉树中的每个结点。在二叉树中,结点结构通常包括若干数据域和若干指针域,二叉链表至少包含3个域:数据域 data、左指针域 lchild 和右指针域 rchild,如图5.5 所示。
图 5.6 所示为一棵二叉树及其对应的二叉链表。而实际上在不同的应用中,还可以增加某些指针域,如增加指向父结点的指针后,变为三叉链表的存储结构。
二叉树的链式存储结构描述如下:
typedef struct BiTNode{ElemType data; //数据域struct BiTNode *lchild,*rchild; //左、右孩子指针
}BiTNode,*BiTree;
使用不同的存储结构时,实现二叉树操作的算法也会不同,因此要根据实际应用场合(二叉树的形态和需要进行的运算)来选择合适的存储结构。
容易验证,在含有n个结点的二叉链表中,含有n+1个空链域(重要结论,经常出现在选择题中)。在下一节中,我们将利用这些空链域来组成另一种链表结构--线索链表。
【因为每一个节点有左右两个指针,n个节点共有2n个链域,而n个节点只需用n-1个指针就可互连(因为连接n个点只需n-1条直线),所以还剩下2n-(n-1)=n+1个】