树与二叉树的基础知识
树与二叉树的基础知识
本文将详细介绍树与二叉树的基础知识,包括树的定义、相关术语、分类,以及二叉树的定义、特殊类型和存储结构。通过本文的学习,读者将能够全面理解树和二叉树的基本概念和重要特性。
树与二叉树的基础知识
1. 树简介
1.1 树的定义
树(Tree):由个节点与节点之间的关系组成的有限集合。当时称为空树,当时称为非空树。
之所以把这种数据结构称为「树」是因为这种数据结构看起来就像是一棵倒挂的树,也就是说数据结构中的「树」是根朝上,而叶朝下的。如下图所示。
树
「树」具有以下的特点:
- 有且仅有一个节点没有前驱节点,该节点被称为树的「根节点(Root)」。
- 除了根节点以之,每个节点有且仅有一个直接前驱节点。
- 包括根节点在内,每个节点可以有多个后继节点。
- 当时,除了根节点之外的其他节点,可分为个互不相交的有限集合T_1, T_2, ..., T_mT1 ,T2 ,...,Tm ,其中每一个集合本身又是一棵树,并且被称为根的「子树(SubTree)」。
如下图所示,红色节点AAA是根节点,除了根节点之外,还有333棵互不相交的子树T_1(B, E, H, I, G)、、T_3(D, F, G, K)。
树与子树
1.2 树的相关术语
下面我们来介绍一下树结构中的一些基本术语。
1.2.1 节点分类
「树的节点」由一个数据元素和若干个指向其子树的树的分支组成。而节点所含有的子树个数称为「节点的度」。度为000的节点称为「叶子节点」或者「终端节点」,度不为000的节点称为「分支节点」或者「非终端节点」。树中各节点的最大度数称为「树的度」。
节点分类
- 树的节点:由一个数据元素和若干个指向其子树的树的分支组成。
- 节点的度:一个节点所含有的子树个数。
- 叶子节点(终端节点):度为000的节点。例如图中叶子节点为CCC、HHH、III、GGG、FFF、KKK。
- 分支节点(非终端节点):度不为000的节点。例如图中分支节点为AAA、BBB、DDD、EEE、GGG。
- 树的度:树中节点的最大度数。例如图中树的度为333。
1.2.2 节点间关系
一个节点的子树的根节点称为该节点的「孩子节点」,相应的,该节点称为孩子的「父亲节点」。同一个父亲节点的孩子节点之间互称为「兄弟节点」。
节点间关系
- 孩子节点(子节点):一个节点含有的子树的根节点称为该节点的子节点。例如图中BBB是AAA的孩子节点。
- 父亲节点(父节点):如果一个节点含有子节点,则这个节点称为其子节点的父节点。例如图中BBB是EEE的父亲节点。
- 兄弟节点:具有相同父节点的节点互称为兄弟节点。例如图中FFF、GGG互为兄弟节点。
1.2.3 树的其他术语
「节点的层次」是从根节点开始定义,将根节点作为第 1 层,根的孩子节点作为第 2 层,以此类推,如果某个节点在第iii层,则其孩子节点在第层。而父亲节点在同一层的节点互为「堂兄弟节点」。树中所有节点最大的层数称为「树的深度」或「树的高度」。树中,两个节点之间所经过节点序列称为「路径」,两个节点之间路径上经过的边数称为「路径长度」。
树的其他术语
- 节点的层次:从根节点开始定义,根为第111层,根的子节点为第222层,以此类推。
- 树的深度(高度):所有节点中最大的层数。例如图中树的深度为444。
- 堂兄弟节点:父节点在同一层的节点互为堂兄弟。例如图中JJJ、KKK互为堂兄弟节点。
- 路径:树中两个节点之间所经过的节点序列。例如图中EEE到GGG的路径为E - B - A - D - G。
- 路径长度:两个节点之间路径上经过的边数。例如图中EEE到GGG的路径长度为444。
- 节点的祖先:从该节点到根节点所经过的所有节点,被称为该节点的祖先。例如图中HHH的祖先为EEE、BBB、AAA。
- 节点的子孙:节点的子树中所有节点被称为该节点的子孙。例如图中DDD的子孙为FFF、GGG、KKK。
1.3 树的分类
根据节点的子树是否可以互换位置,我们可以将树分为两种类型:「有序树」和「无序树」。
如果将树中节点的各个子树看做是从左到右是依次有序的(即不能互换),则称该树为「有序树」。反之,如果节点的各个子树可以互换位置,则成该树为「无序树」。
- 有序树:节点的各个⼦树从左⾄右有序, 不能互换位置。
- 无序树:节点的各个⼦树可互换位置。
2. 二叉树简介
2.1 二叉树的定义
二叉树(Binary Tree):树中各个节点的度不大于222个的有序树,称为二叉树。通常树中的分支节点被称为「左子树」或「右子树」。二叉树的分支具有左右次序,不能随意互换位置。
下图就是一棵二叉树。
二叉树
二叉树也可以使用递归方式来定义,即二叉树满足以下两个要求之一:
- 空树:二叉树是一棵空树。
- 非空树:二叉树是由一个根节点和两棵互不相交的子树、,分别称为根节点的左子树、右子树组成的非空树;并且、本身都是二叉树。
⼆叉树是种特殊的树,它最多有两个⼦树,分别为左⼦树和右⼦树,并且两个子树是有序的,不可以互换。也就是说,在⼆叉树中不存在度⼤于222的节点。
二叉树在逻辑上可以分为555种基本形态,如下图所示。
二叉树的形态
2.2 特殊的二叉树
下面我们来介绍一些特殊的二叉树。
2.2.1 满二叉树
满二叉树(Full Binary Tree):如果所有分支节点都存在左子树和右子树,并且所有叶子节点都在同一层上,则称该二叉树为满二叉树。
满二叉树满足以下特点:
- 叶子节点只出现在最下面一层。
- 非叶子节点的度一定为222。
- 在同等深度的二叉树中,满二叉树的节点个数最多,叶子节点个数最多。
如果我们对满二叉树的节点进行编号,根节点编号为111,然后按照层次依次向下,每一层从左至右的顺序进行编号。则深度为kkk的满二叉树最后一个节点的编号为。
我们可以来看几个例子。
满二叉树与非满二叉树
2.2.2 完全二叉树
完全二叉树(Complete Binary Tree):如果叶子节点只能出现在最下面两层,并且最下层的叶子节点都依次排列在该层最左边的位置上,具有这种特点的二叉树称为完全二叉树。
完全二叉树满足以下特点:
- 叶子节点只能出现在最下面两层。
- 最下层的叶子节点一定集中在该层最左边的位置上。
- 倒数第二层如果有叶子节点,则该层的叶子节点一定集中在右边的位置上。
- 如果节点的度为111,则该节点只偶遇左孩子节点,即不存在只有右子树的情况。
- 同等节点数的二叉树中,完全二叉树的深度最小。
完全二叉树也可以使用类似满二叉树的节点编号的方式来定义。即从根节点编号为111开始,按照层次从上至下,每一层从左至右进行编号。对于深度为iii且有nnn个节点的二叉树,当且仅当每一个节点都与深度为kkk的满二叉树中编号从111至nnn的节点意义对应时,该二叉树为完全二叉树。
我们可以来看几个例子。
完全二叉树与非完全二叉树
2.2.3 二叉搜索树
二叉搜索树(Binary Search Tree):也叫做二叉查找树、有序二叉树或者排序二叉树。是指一棵空树或者具有下列性质的二叉树:
- 如果任意节点的左子树不为空,则左子树上所有节点的值均小于它的根节点的值。
- 如果任意节点的右子树不为空,则右子树上所有节点的值均大于它的根节点的值。
- 任意节点的左子树、右子树均为二叉搜索树。
如图所示,这333棵树都是二叉搜索树。
二叉搜索树
2.2.4 平衡二叉搜索树
平衡二叉搜索树(Balanced Binary Tree):一种结构平衡的二叉搜索树。即叶节点高度差的绝对值不超过111,并且左右两个子树都是一棵平衡二叉搜索树。平衡二叉树可以在内完成插入、查找和删除操作。最早被发明的平衡二叉搜索树为「AVL 树(Adelson-Velsky and Landis Tree))」。
AVL 树满足以下性质:
- 空二叉树是一棵 AVL 树。
- 如果 T 是一棵 AVL 树,那么其左右子树也是 AVL 树,并且∣h(ls)−h(rs)∣≤1|h(ls) - h(rs)| \le 11,是左子树的高度,是右子树的高度。
- AVL 树的高度为。
如图所示,前222棵树是平衡二叉搜索树,最后一棵树不是平衡二叉搜索树,因为这棵树的左右子树的高度差的绝对值超过了111。
平衡二叉树与非平衡二叉树
2.3 二叉树的存储结构
二叉树的存储结构分为两种:「顺序存储结构」和「链式存储结构」,下面进行一一讲解。
2.3.1 二叉树的顺序存储结构
其实,堆排序、优先队列中的二叉堆结构,采用的就是二叉树的顺序存储结构。
二叉树的顺序存储结构使用一维数组来存储二叉树中的节点,节点存储位置则采用完全二叉树的节点层次编号,按照层次从上至下,每一层从左至右的顺序依次存放二叉树的数据元素。在进行顺序存储时,如果对应的二叉树节点不存在,则设置为「空节点」。
下图为二叉树的顺序存储结构。
二叉树的顺序存储结构
从图中我们也可以看出节点之间的逻辑关系。
- 如果某二叉树节点(非叶子节点)的下标为iii,那么其左孩子节点下标为,右孩子节点下标为。
- 如果某二叉树节点(非根节点)的下标为iii,那么其根节点下标为(i - 1) // 2。//////表示整除。
对于完全二叉树(尤其是满二叉树)来说,采用顺序存储结构比较合适,它能充分利用存储空间;而对于一般二叉树,如果需要设置很多的「空节点」,则采用顺序存储结构就会浪费很多存储空间。并且,由于顺序存储结构固有的一些缺陷,会使得二叉树的插入、删除等操作不方便,效率也比较低。对于二叉树来说,当树的形态和大小经常发生动态变化时,更适合采用链式存储结构。
2.3.2 二叉树的链式存储结构
二叉树采用链式存储结构时,每个链节点包含一个用于数据域,存储节点信息;还包含两个指针域和,分别指向左右两个孩子节点,当左孩子或者右孩子不存在时,相应指针域值为空。二叉链节点结构如下图所示。
二叉链节点
二叉链节点结构的对应代码为:
class TreeNode:
def __init__(self, val=0, left=None, right=None):
self.val = val
self.left = left
self.right = right
下面我们将值为[1, 2, 3, 4, 5, 6, 7]的二叉树使用链式存储结构进行存储,即为下图所示。
二叉树的链式存储结构
二叉树的链表存储结构具有灵活、方便的特点。节点的最大数目只受系统最大可存储空间的限制。一般情况下,二叉树的链表存储结构比顺序存储结构更省空间(用于存储指针域的空间开销只是二叉树中节点数的线性函数),而且对于二叉树实施相关操作也很方便,因此,一般我们使用链式存储结构来存储二叉树。
参考链接
- 【书籍】数据结构教程 第 3 版 - 唐发根 著
- 【书籍】大话数据结构 程杰 著
- 【书籍】算法训练营 陈小玉 著
- 【博文】二叉树理论基础 - 代码随想录
- 【博文】二叉树基础 - 袁厨的算法小屋