数据结构论坛

首页 » 分类 » 分类 » 一文弄懂数据结构中的红黑树二叉树
TUhjnbcbe - 2023/9/4 21:04:00

前言

红黑树

在讲红黑树之前,我们需要先了解几种树:二叉树,二叉查找树以及平衡二叉树。

二叉树

最多有2个孩子的树称为二叉树。由于二叉树中的每个元素只能有2个孩子,我们通常将它们命名为左孩子和右孩子。

示意:

5/  \23  复制代码

代码定义:

classNode{Tdata;Nodeleft;Noderight;}复制代码

二叉查找树

二叉查找树(BinarySearchTree,简称BST),(又:二叉搜索树,二叉排序树)它是一种基于节点的二叉树数据结构,具有以下特性:

节点的左子树仅包含值小于节点值的节点。

节点的右子树仅包含值大于节点值的节点。

左右子树也必须是二叉查找树。

示意:  

              5            /\            26            /\          13            \            4复制代码  

一颗平衡的BST查找效率很高,原理就是二分查找,二分查找的时间复杂度为O(logn)。

二叉查找树退化成链表

当我们插入一组元素正好是有序的时候,这时会让排序二叉树退化成链表。如下所示:

          1            \            2            \          3          \          4复制代码

这样排序二叉树退化成链表结构,那么检索效率就变成了线性的O(n)的,相对来说,检索效率肯定是要差不少的。

平衡二叉树

平衡二叉树(AVL)树是一种自平衡二叉查找树(BST),并且其中所有节点的左右子树的高度差不能超过1。

平衡二叉树在二叉查找树的基础上多了一个特性:所有节点的左右子树的高度差不能超过;从而实现自平衡。

AVL树示意:

        13        /\                /\\              /      4复制代码

大多数BST操作(例如,搜索、最大、最小、插入、删除等)花费O(h)时间,其中h是BST的高度。对于偏斜二叉树,这些操作的成本可能变为O(n)。如果我们确保每次插入和删除后树的高度都保持O(Logn),那么我们可以保证所有这些操作的上限为O(Logn)。AVL树的高度始终为O(Logn),其中n是树中的节点数。

红黑树

介绍:

红黑树是一种自平衡二叉搜索树,每个节点都有一个额外的位置用来存储节点的颜色(红色或黑色)。这些颜色用于确保树在插入和删除过程中保持平衡。虽然树的平衡性并不完美,但足以减少搜索时间并保持在O(logn)时间左右,其中n是树中元素的总数。红黑树是由鲁道夫·拜耳(RudolfBayer)于年发明的。

其实红黑树和上面的平衡二叉树类似,本质上都是为了解决排序二叉树在极端情况下退化成链表导致检索效率大大降低的问题。

红黑树的特性

每个节点要么是红色,要么是黑色。

根节点永远是黑色的。

所有的叶子节点都是空节点(即null),并且是黑色的。

没有两个相邻的红色节点(红色节点不能有红色父节点或红色子节点)。

从任一节点到其子树中每个叶子节点的路径都包含相同数量的黑色节点。

红黑树示意图:

``

对于3中指定红黑树的每个叶子节点都是空节点,而且叶子节点都是黑色,但Java实现的红黑树会使用null来代表空节点,因此我们在遍历Java里的红黑树的时候会看不到叶子节点,而看到的是每个叶子节点都是红色的,这一点需要注意。

由第5条:

从任一节点到它的子树的每个叶子节点黑色节点的数量都是相同的,这个数量被称为这个节点的黑高

从根节点出发到每个叶子节点的路径都包含相同数量的黑色节点,这个黑色节点的数量被称为树的黑高

我们知道AVL树所有节点的左右子树的高度差不超过1,在这里我们思考一个问题,对于红黑树任意节点左右树的高度差是多少呢?

看下面的这个红黑树:

依次验证上面5条特性,

每个节点要么是红色,要么是黑色。

根节点永远是黑色的。

所有的叶子节点都是空节点(即null),并且是黑色的。

没有两个相邻的红色节点(红色节点不能有红色父节点或红色子节点)。

从任一节点到其子树中每个叶子节点的路径都包含相同数量的黑色节点。

发现都可以满足。

事实上,以上是红黑树中比较极端的一个例子,该树在满足红黑树特性的前提下,左子树达到了最小高度(全黑),右子树达到了最大高度(一层黑一层红,红黑交替);分别是2和4;

也就是说,一个黑高为3的红黑树,其最小高度为3,最大高度为5;同时其子树最小高度为2,最大高度为4。

从一个节点到其最远后代叶的节点数不超过到最近后代叶节点数的两倍;可以这么简单理解,红黑树根节点到叶子节点最长的路径都不会比最短的路径长出两倍。

红黑树VSAVL树

与红黑树相比,AVL树更平衡,但它们在插入和删除过程中可能会导致更多的旋转。所以如果涉及频繁的插入和删除,那么红黑树应该是首选。如果插入和删除不那么频繁并且搜索是一个更频繁的操作,那么AVL树应该比红黑树更合适。

红黑树的应用

红黑树的应用比较广泛,主要是用它来存储有序的数据,它的时间复杂度是O(lgn),效率非常之高。例如,Java集合中的TreeSet和TreeMap,C++STL中的set、map,以及Linux虚拟内存的管理,都是通过红黑树去实现的。

插入

当我们向红黑树中插入新的元素时,红黑树发生变化,有可能不再满足那5个条件,不再平衡;我们有两种方法使其重新恢复平衡:重新着色、旋转。

其中旋转分为左旋和右旋

对X左旋:

对X右旋:

为了避免混淆,接下来使用图示的叫法:

设X为新插入的节点,完整步骤为:

一、按照二叉查找插入方法将X插入到指定的位置,并将新插入节点的颜色设为红色。

二、如果X是根节点,则将X的颜色更改为黑色。

三、被X节点的父节点是黑色,什么都不需要做。

四、被X节点的父节点是红色(该情况与红黑树的“特性(4)”相冲突):

a)如果x的叔叔节点是红色的

将父节点和叔叔节点的颜色更改为黑色

将祖父节点设为红色

令x=祖父节点,对新的x重复以上步骤

b)如果x的叔叔节点是黑色的,分别对应下面四种不同情况

左左案例(LL旋转)

左右案例(LR旋转)

右右案例(RR旋转)

右左案例(RL旋转)

以上就是插入的所有步骤,接下来举例分析以上几种情况:

叔叔节点为红色:

这种情况不需要旋转,只需要对父节点,叔叔节点,祖父节点重新染色即可。注意,由于祖父节点重新染色后有可能会破坏掉之前的平衡,所以我们需要对祖父节点重复这个染色操作,使其始终满足5条特性。

左左案例(插入节点的父节点是左节点,插入节点也是左节点)

对祖父节点右旋

重新着色

左右案例(插入节点的父节点是左节点,插入节点是右节点)

对父节点左旋

对祖父节点右旋

重新染色

右右案例(插入节点的父节点是右节点,插入节点左节点)

对祖父节点左旋

重新染色

右左案例(插入节点的父节点是右节点,插入节点左节点)

对父节点右旋

对祖父节点左旋

新着色

删除

与插入一样,利用重新着色、旋转来保持红黑树平衡。在插入操作中,我们检查叔叔节点的颜色来决定合适的情况。在删除操作中,我们检查兄弟节点的颜色来决定合适的情况。

插入新元素后违反的主要属性是两个连续的红色。在删除中,主要违反的性质是,子树中黑色高度的变化,因为删除一个黑色节点可能会导致一个根到叶路径的黑色高度降低。

删除是一个相当复杂的过程。为了方便理解,使用了双黑的概念。当一个黑色节点被删除并被一个黑色子节点替换时,这个子节点被标记为双黑(在本文中,双黑意味着节点的黑高不再平衡,需要调整,这里只是一种叫法而已,并没有什么其他的含义)。这是会引起黑高改变的情况,也是我们需要重点

1
查看完整版本: 一文弄懂数据结构中的红黑树二叉树