问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

咬文嚼图式的介绍二叉树、B树/B-树

创作时间:
作者:
@小白创作中心

咬文嚼图式的介绍二叉树、B树/B-树

引用
1
来源
1.
https://www.cnblogs.com/oldme/p/18305424

本文通过"咬文嚼图"的方式详细介绍了二叉树和B树这两种数据结构。文章从二叉树的基本概念开始,逐步深入到二叉搜索树的特性、操作(查找、遍历、插入、删除)以及自平衡二叉树的概念。接着,文章详细介绍了B树的结构特点、查找、遍历和插入删除操作,通过具体的图示和步骤说明,帮助读者理解这些抽象的概念。

二叉树

在中文语境中,节点结点傻傻分不清楚,故后文以 node 代表 "结点",root node 代表根节点,child node 代表 “子节点”
二叉树是诸多树状结构的始祖,至于为什么不是三叉树,四叉树,或许是因为计算机只能数到二吧,哈哈,开个玩笑。二叉树很简单,每个 node 最多存在两个 child node,第一个节点称之为 root node。

二叉树具备着一些基本的数学性质,不过很简单,定义从
i
从 0 开始:


  • i
    层至多有
    2i
    个 node;
  • 深度为 i 层二叉树至多有
    2i+1-1
    个 node。

二叉树的特殊类型

这里有兴趣的可以了解一下,不影响后文的阅读。二叉树根据 child node 的不同,衍生出了几种特殊类型:在一颗二叉树中,如果每个 node 都有 0 或 2 个 child node,则二叉树是满二叉树;定义从
i
从 0 开始,一棵深度为
i
,且仅有
2i+1−1
个 node 的二叉树,称为完美二叉树;若除最后一层外的其余层都是满的,并且最后一层要么是满的,要么在右边缺少连续若干 node,则此二叉树为完全二叉树

二叉搜索树

二叉搜索树(Binary Search Tree),也叫二叉查找树,有序二叉树,排序二叉树(名字还挺多)。它是一种常用且特殊的二叉树,它具备一个特有的性质,left node(左结点)始终小于 parent node (父结点),right node 始终大于 parent node。

二叉搜索树的查找

  1. 二叉搜索树从 root node 开始,如果命中则返回;
  2. 否则,目标值比 node 小进入 left node;
  3. 比 node 大进入 right node;
  4. 如果左右都为空,则未命中。

二叉搜索树的遍历

二叉搜索树有不同的遍历方式,这里介绍常用的中序遍历方式:
2. 先遍历左子树;
4. 然后查找当前左子树的 parent node;
6. 遍历右子树。

二叉搜索树的插入

  1. 二叉搜索树从 root node 开始,如果命中则不进行操作;
  2. 否则,目标值比 node 小进入 left node;
  3. 比 node 大进入 right node;
  4. 最终将值插入搜索停止的地方。

二叉搜索树的删除

二叉树的删除和查询基本一致,只要在命中时删除即可。
2. 二叉搜索树从 root node 开始,如果命中则删除;
4. 否则,目标值比 node 小进入 left node;
6. 比 node 大进入 right node;
8. 删除后使用该 node左子树最大值或者右子树最小值替代该 node。

自平衡二叉树

从上面的几张动图中我们知晓,二叉搜索树不同于线性结构,它可以大大降低查找,插入的时间复杂度。但在特殊情况下,二叉搜索树可能退化为线性结构,假如我们依次插入1,2,3,4,5:
此时,二叉搜索树退化为线性结构,效率重新变回遍历。于是,便出现了自平衡二叉树,例如 AVL 树,红黑树,替罪羊树等。但它们并不是本文重点,下面我要介绍的是另外一种很常见的自平衡二叉树:B树。

B树

B树和B-树是同一个概念。B树相对于二叉树有两点最大的不同:

  • 每个 node 可以有不止一个数值
  • 每个 node 也可以有不止两个 child node
    B树有两种类型 node:
  • internal node(内部结点):不仅仅存储数据,也具备 child node;
  • leaf node(叶子结点):仅存储数据,不具备 child node。
    这两种 node 不同于前文所提的 root node 和 child node。root 和 child 是相对于阶层的概念,而 internal 和 leaf 是相对于性质的概念
    一个简单的图例如下:

    图中的蓝色方块是 internal node,绿色则是 leaf node。
    B树有一些需要满足的性质,这里的抽象的逻辑有些烧脑,我们会对照前面的图片来解释。设定一颗 m 阶的B树,
    m = 3

    设 internal node 的 child node 个数为
    k
  1. 如果 internal node 是 root node,那么
    k = [2, m]
    ,比如上图的 8 有两个 child node(3|6, 10/12);
  2. 如果 internal node 不是 root node,那么
    k = [m/2, m]
    ,m/2 向上取整,比如上图的
    3|6
    有三个 child node;
  3. 如果 root node 的
    k
    为 0,那么 root node 是 leaf 类型的;
  4. 所有 leaf node 在同一层,上图最后一行的六个 node。
    设任意 node 键值个数为
    n
  5. 对于 internal node,
    n = k-1
    , 升序排序,满足
    k[i] < k[i+1]
    ,比如上图的三个 internal(8,3|6,10|12) 都满足此规律;
  6. 对于 leaf node,
    n = [0, m-1]
    ,同样升序排序,比如上图最后一个的六个 leaf,其键值最多为两个。
    上述的概念有些抽象,但是这是理解B树关键的地方所在,后面在B树的插入讲解,会有更多具象的动图来解释这些概念。

B树的查找

B树的查找类似于二叉树:
2. 从 root node 开始,如果目标值小于 root node,进入左子树,否则进入右子树;
4. 遍历 child node 的多个键值;
6. 如果匹配到键值,则返回;
8. 如果不匹配,则根据目标值的范围选择对应的子树;
10. 重复步骤2、3、4,直到匹配成功返回或者未找到。
假如我们要查找 11:

B树的遍历

B树的遍历方式类似二叉搜索树,不过因为B树一个 node 有多个键值和多个 child node,所以需要遍历每个左右子树和键值:
2. 先遍历第一个左子树,也就是 parent node 第一个键值的左边;
4. 然后查找当前 parent node 的第一个键值;
6. 遍历第二个左子树,也就是 parent node 第二个键值的左边;
8. 遍历完搜索的左子树,最后遍历当前 parent 的最右子树,即最后一个键值的右边。

B树的插入

插入前面的过程和查询一致,在插入后可能需要重整 node,以符合B树的性质,例如插入 16:
2. 先查找到目标 node,也就是
13|15

4. 因为这是一颗 3 阶B树,所以 node 最多只能有两个键值,于是向上传递中间值 15;
6. parent node 最多也只能有两个键值,于是继续向上传递中间值 12;
8. 此时 root node 是 8|12,需要有三个 child node,于是 10|15 需要拆分,再向下进一步调整,至此,插入 16 完成。

B树的删除

删除是插入的逆操作,但是往往比插入更复杂,因为删除后经常需要重整 node:
2. 先查找到目标 node,也就是
16

4. 删除 16,此时 15 child node 剩下一个,不符合条件,递归向上调整,一直到根节点;
6. 直到所有的条件都满足后,删除 16 完成。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号