文章出处:极客时间《数据结构和算法之美》-作者:王争。该系列文章是本人的学习笔记。
1 树
1.1 概念
概念:树、根、父节点、子节点、叶子节点。
几个度:高度、深度、层。与实际生活中的这几个概念类比。
高度:从下往上数(从叶子往根),从0开始。
深度:从上往下看(从根往叶子),从0开始。
层数:深度+1
2 二叉树
2.1 定义
定义:每个节点最多有两个子节点。
满二叉树:除了叶子节点没有子节点,其余每个节点都有2个子节点。
完全二叉树:1 叶子节点在最下面两层;2 最后一层的叶子节点都靠左排列;3 除了最后一层,其他层的节点达到最大个数。
二叉树的存储:有两种方式。一种是链式存储,一个节点存储数据,两个指针分别指向左右子节点。一种是顺序存储(数组存储)。根节点在下标为1的位置。左节点存储下标为2i=2,右节点存储下标为2i+1=3。依次类推。下标为i的节点,左子节点存储在下标为2i的位置,右子节点存储在2i+1的位置。
class Node{T value;Node leftChild;Node rightChild;
}
如果一棵树是完全二叉树,使用数组存储的话,只有下标为0的位置是空的,其余完全利用。而且不需要额外的指针,更节约空间。这也是完全二叉树单独提出来的原因。
2.2 遍历
二叉树的遍历有前序遍历、中序遍历、后续遍历,和层次遍历。前中后序遍历是指访问节点与其子节点的相对顺序。
前序遍历:访问节点,访问左子节点,访问右子节点
中序遍历:访问左子节点,访问节点,访问右子节点
后续遍历:访问左子节点,访问右子节点,访问节点
前中后序遍历是一个递归过程。递归的重点是不是能写出递归公式。写递归公式的重点是能不能将要解决的问题A,分解为子问题B、C、D,假设B、C、D已经解决,如何利用B、C、D的结果来解决问题A。
前序遍历递推公式:
preOrder(r)=print r->preOrder(r.leftChild)->preOrder(r.rightChild);
中序遍历递推公式
inOrder(r)=inOrder(r.leftChild)->print r->inOrder(r.rightChild);
后序遍历递推公式
postOrder(r)=postOrder(r.leftChild)->postOrder(r.rightChild)->print r;
2.3思考题
给定一组数据1,3,5,6,9,10。可以构造出多少种不同的二叉树。
答案:卡特兰数。
3 二叉查找树
定义:二叉查找树中任意一个节点的左子树中的每一个节点都要求小于当前节点,右子树的任意一个节点都要求大于当前节点。
3.1 二叉查找树的查找
当要查找一个数的时候,从根节点开始。如果要查找的值等于根节点的值,则返回。如果要查找的值大于根节点的值,则在右子树递归查找。否则,要从左子树递归查找。
3.2 二叉查找树的插入
插入操作与查找操作类似。从根节点开始。如果要插入的数据比节点数据大,并且节点的右子树是空的,则直接插入右子节点;如果右子树不为空,递归查找右子树,寻找插入位置。
如果要插入的数据比节点数据小,并且节点的左子树是空的,则直接插入左子节点;如果左子树不为空,则递归查找左子树,寻找插入位置。
3.3 二叉查找树的删除
二叉树的删除操作比较复杂,需要分情况讨论。
规则1:要删除的节点是一个叶子节点,例如55。将其父节点指向该节点的引用置为空即可。
规则2:要删除的节点有一个子节点,例如13。将13父节点指向该节点的引用指向13的叶子节点。
规则3:要删除的节点有两个子节点,例如18。在18的右子树查找最小值19,将18节点的value值改为最小值19,删除节点19,应用规则1或者规则2删除节点19。
二叉树的删除还有一种操作方法是将要删除的数据标记为删除状态,并且真正删除。这样做会浪费部分空间,但整体时间复杂度不会受影响,且实现简单。
3.4其他操作
查找最大值
查找最小值
中序遍历得到一个顺序数组,时间复杂度O(n),非常高效,所以二叉查找树又被称为二叉排序树。
3.5 支持重复元素
如果要插入的元素有重复的,该怎么处理?
一种处理方法参考散列表的链式存储。树的每个节点存储数值的是一个链表,遇到值相同的元素就依次添加到链表中。
一种处理方法是,大于等于当前节点的元素都插入到右子树。当要查找的时候,遇到相等的元素不停下来,而是继续查找,直到找到所有要查找的值值相同的元素。删除的时候也是同样。要删除每一个等于要删除值的节点。
3.6二叉查找树的时间复杂度分析
二叉查找树因为形态多样,查找时间复杂度也不相同。例如图中第一棵树已经退化为链表,时间复杂度O(n)。
第三棵树是一棵完全二叉树。无论查找、插入
删除,时间复杂度与它的高度成正比。一棵 包含n个节点的完全二叉树,高度是多少?
完全二叉树每一层节点数量是:1、2、4…2k−22^{k-2}2k−2,假设有k层。最后一层节点数量在1到2k−12^{k-1}2k−1之间。假设最后一层节点数量是2k−12^{k-1}2k−1。那么1+2+4+....+2k−1=n1+2+4+....+2^{k-1}=n1+2+4+....+2k−1=n,则k=log2(n+1)k=log_2(n+1)k=log2(n+1)。假设最后一层节点数量是1,那么1+2+4+....+2k−2+1=n1+2+4+....+2^{k-2}+1=n1+2+4+....+2k−2+1=n,k=log2n+1k=log_2n+1k=log2n+1。k值的区间是[log2(n+1),log2n+1][log_2(n+1),log_2n+1][log2(n+1),log2n+1]。完全二叉树的层数小于等于log2n+1log_2n+1log2n+1,则完全二叉树的高度小于等于log2nlog_2nlog2n。
所以在理想情况下完全二叉树的时间复杂度是O(logn)。
4 平衡二叉查找树-红黑树
红黑树目前我只了解概念,关于从二三树到红黑树之后再学习。