最近公共祖先(LCA)详解:定义、性质与多种求解算法
最近公共祖先(LCA)详解:定义、性质与多种求解算法
最近公共祖先(LCA,Lowest Common Ancestor)是计算机科学和算法领域中的一个重要概念,广泛应用于图论、数据结构和算法设计中。本文将详细介绍LCA的定义、性质以及多种求解算法,包括朴素算法、倍增算法、Tarjan算法、欧拉序列转化为RMQ问题、树链剖分、动态树和标准RMQ等方法。
定义
最近公共祖先简称 LCA(Lowest Common Ancestor)。两个节点的最近公共祖先,就是这两个点的公共祖先里面,离根最远的那个。 为了方便,我们记某点集
的最近公共祖先为
或
。
性质
本节 性质 部分内容翻译自 wcipeg,并做过修改。
- ;
- 是
的祖先,当且仅当
; - 如果
不为
的祖先并且
不为
的祖先,那么
分别处于
的两棵不同子树中; - 前序遍历中,
出现在所有
中元素之前,后序遍历中
则出现在所有
中元素之后; - 两点集并的最近公共祖先为两点集分别的最近公共祖先的最近公共祖先,即
; - 两点的最近公共祖先必定处在树上两点间的最短路上;
- ,其中
是树上两点间的距离,
代表某点到树根的距离。
求法
朴素算法
过程
可以每次找深度比较大的那个点,让它向上跳。显然在树上,这两个点最后一定会相遇,相遇的位置就是想要求的 LCA。 或者先向上调整深度较大的点,令他们深度相同,然后再共同向上跳转,最后也一定会相遇。
性质
朴素算法预处理时需要 dfs 整棵树,时间复杂度为
,单次查询时间复杂度为
。如果树满足随机性质,则时间复杂度与这种随机树的期望高度有关。
倍增算法
过程
倍增算法是最经典的 LCA 求法,他是朴素算法的改进算法。通过预处理
数组,游标可以快速移动,大幅减少了游标跳转次数。
表示点
的第
个祖先。
数组可以通过 dfs 预处理出来。
现在我们看看如何优化这些跳转: 在调整游标的第一阶段中,我们要将
两点跳转到同一深度。我们可以计算出
两点的深度之差,设其为
。通过将
进行二进制拆分,我们将
次游标跳转优化为「
的二进制表示所含
1
的个数」次游标跳转。 在第二阶段中,我们从最大的
开始循环尝试,一直尝试到
(包括
),如果
,则
,那么最后的 LCA 为
。
性质
倍增算法的预处理时间复杂度为
,单次查询时间复杂度为
。 另外倍增算法可以通过交换
fa
数组的两维使较小维放在前面。这样可以减少 cache miss 次数,提高程序效率。
例题
可先求出 LCA,再结合性质
进行解答。也可以直接在求 LCA 时求出结果。
参考代码
Tarjan 算法
过程
Tarjan 算法是一种 离线算法,需要使用 并查集 记录某个结点的祖先结点。做法如下:
- 首先接受输入边(邻接链表)、查询边(存储在另一个邻接链表内)。查询边其实是虚拟加上去的边,为了方便,每次输入查询边的时候,将这个边及其反向边都加入到
queryEdge
数组里。 - 然后对其进行一次 DFS 遍历,同时使用
visited
数组进行记录某个结点是否被访问过、
parent
记录当前结点的父亲结点。 - 其中涉及到了 回溯思想,我们每次遍历到某个结点的时候,认为这个结点的根结点就是它本身。让以这个结点为根节点的 DFS 全部遍历完毕了以后,再将这个结点的根节点设置为这个结点的父一级结点。
- 回溯的时候,如果以该节点为起点,
queryEdge
查询边的另一个结点也恰好访问过了,则直接更新查询边的 LCA 结果。 - 最后输出结果。
性质
Tarjan 算法需要初始化并查集,所以预处理的时间复杂度为
。
朴素的 Tarjan 算法处理所有
次询问的时间复杂度为
,。但是 Tarjan 算法的常数比倍增算法大。存在
的实现。
注意
并不存在「朴素 Tarjan LCA 算法中使用的并查集性质比较特殊,单次调用
find()
函数的时间复杂度为均摊
」这种说法。
以下的朴素 Tarjan 实现复杂度为
。如果需要追求严格线性,可以参考 Gabow 和 Tarjan 于 1983 年的论文。其中给出了一种复杂度为
的做法。
实现
参考代码
用欧拉序列转化为 RMQ 问题
定义
对一棵树进行 DFS,无论是第一次访问还是回溯,每次到达一个结点时都将编号记录下来,可以得到一个长度为
的序列,这个序列被称作这棵树的欧拉序列。
在下文中,把结点
在欧拉序列中第一次出现的位置编号记为
(也称作节点
的欧拉序),把欧拉序列本身记作
。
过程
有了欧拉序列,LCA 问题可以在线性时间内转化为 RMQ 问题,即
。
这个等式不难理解:从
走到
的过程中一定会经过
,但不会经过
的祖先。因此,从
走到
的过程中经过的欧拉序最小的结点就是
。
用 DFS 计算欧拉序列的时间复杂度是
,且欧拉序列的长度也是
,所以 LCA 问题可以在
的时间内转化成等规模的 RMQ 问题。
实现
参考代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34 int dfn[N << 1], pos[N], tot, st[30][(N << 1) + 2],
rev[30][(N << 1) + 2]; // rev表示最小深度对应的节点编号
void dfs(int cur, int dep) {
dfn[++tot] = cur;
depth[tot] = dep;
pos[cur] = tot;
for (int i = head[t]; i; i = side[i].next) {
int v = side[i].to;
if (!pos[v]) {
dfs(v, dep + 1);
dfn[++tot] = cur, depth[tot] = dep;
}
}
}
void init() {
for (int i = 2; i <= tot + 1; ++i)
lg[i] = lg[i >> 1] + 1; // 预处理 lg 代替库函数 log2 来优化常数
for (int i = 1; i <= tot; i++) st[0][i] = depth[i], rev[0][i] = dfn[i];
for (int i = 1; i <= lg[tot]; i++)
for (int j = 1; j + (1 << i) - 1 <= tot; j++)
if (st[i - 1][j] < st[i - 1][j + (1 << i - 1)])
st[i][j] = st[i - 1][j], rev[i][j] = rev[i - 1][j];
else
st[i][j] = st[i - 1][j + (1 << i - 1)],
rev[i][j] = rev[i - 1][j + (1 << i - 1)];
}
int query(int l, int r) {
int k = lg[r - l + 1];
return st[k][l] < st[k][r + 1 - (1 << k)] ? rev[k][l]
: rev[k][r + 1 - (1 << k)];
}
当我们需要查询某点对
的 LCA 时,查询区间
上最小值的所代表的节点即可。
若使用 ST 表来解决 RMQ 问题,那么该算法不支持在线修改,预处理的时间复杂度为
,每次查询 LCA 的时间复杂度为
。
树链剖分
LCA 为两个游标跳转到同一条重链上时深度较小的那个游标所指向的点。
树链剖分的预处理时间复杂度为
,单次查询的时间复杂度为
,并且常数较小。
动态树
设连续两次 access 操作的点分别为
u
和
v
,则第二次 access 操作返回的点即为
u
和
v
的 LCA.
在无 link 和 cut 等操作的情况下,使用 link cut tree 单次查询的时间复杂度为
。
标准 RMQ
前面讲到了借助欧拉序将 LCA 问题转化为 RMQ 问题,其瓶颈在于 RMQ。如果能做到
求解 RMQ,那么也就能做到
求解 LCA。
注意到欧拉序满足相邻两数之差为 1 或者 -1,所以可以使用
的 加减 1RMQ 来做。
时间复杂度
,空间复杂度
,支持在线查询,常数较大。
例题 Luogu P3379【模板】最近公共祖先(LCA)
参考代码
习题
- 祖孙询问
- 货车运输
- 点的距离
