与图论的邂逅05:最近公共祖先LCA

什么是LCA?

祖先链

对于一棵树T,若它的根节点是r,对于任意一个树上的节点x,从r走到x的路径是唯一的(显然),那么这条路径上的点都是并且只有这些点是x的祖先。这些点组成的链(或者说路径)就是x的祖先链。

LCA

根据名字来说,最近公共祖先就是两个点最近的相同祖先。实际上也可以理解为:两个点的祖先链深度最大的那个交点。极端的情况下,LCA可以就是两个点之一,或者就是根节点root。

顺便贴下eg:

 

树中节点8和7的LCA为3,节点4和7的LCA为1,节点5和2的LCA为2。

*可以写成LCA(u,v)=w的形式


LCA的求法

问题:给出一棵有n(n≤500000)个节点的树,并给出m(m≤500000)个询问,每个询问给出两个点u,v,请你求出每个u,v的LCA。

1.向上标记法

首先根据定义来。LCA(u,v)是两个点的祖先链的第一个交点(从下往上第一个)。那么我们可以先从u开始往根节点走,那么走到的点都是u的祖先,走出的路径就是u的祖先链。那么我们在走的时候把祖先链上的点都标记一下,再从v开始往根节点走,走到的第一个被标记过的点就是LCA了。最坏的情况下时间复杂度为O(n),总共就是O(n*m)。显然不能满足题目的需要~

2.树上倍增法

一个一个地跳显然太慢,不如加加速?怎么加速呢?根据一贯套路,慢了就倍增~为什么这里不倍增呢?那就倍增一下咯~

树上倍增的思路不同于标记的思路,因为倍增的时候是无法标记的。反正跳得快,就干脆让u,v都跳一跳,跳到同一个点时就到了LCA了。不过不是一上来就一起跳的,树上倍增的预处理可是很浩大的。

首先预处理出倍增之后跳到的点是谁。设f(i,j)为节点i往上跳2^j步到达的节点,那么

f(i,j)=f(f(i,j-1),j-1) 

初始化f(i,0)=fa(i),即i的父亲。(刚才那里真的是零......)

设d(i)为i的深度,顺便把这货也处理出来(这么简单就不讲了)。

弄了这么多之后还不能直接两个点倍增。首先需要将深度大的那个点(假设是v)往上倍增到和u深度相同为止。基于二进制转化的思想,任何树都可以用二进制表示出来,所以绝对是可以倍增到同一深度的。

接着,两个点同时倍增。经过若干次倍增之后,若fa(u)==fa(v),那么fa(u)就是LCA了。

放上预处理的代码:

xxxxxxxxxx
inline void bfs(){
    q.push(s);
    d[s] = 1;
    while(!q.empty()){
        int u = q.front(); q.pop();
        for(int i = head[u]; ~i; i = e[i].next){
            int v = e[i].to;
            if(d[v]) continue;
            d[v] = d[u] + 1,f[v][0] = u;
            for(int j = 1; j <= t; j++) f[v][j] = f[f[v][j - 1]][j - 1];
            q.push(v);
        }
    }
}
//在main函数中
t = (int)(log(n) / log(2)) + 1;
bfs();

以及倍增的代码:

xxxxxxxxxx
inline int lca(int &u, int &v){
    if(d[u] > d[v]) swap(u, v);
    for(int i = t; i >= 0; i--) if(d[f[v][i]] >= d[u]){
        v = f[v][i];
    }
    if(u == v) return u;
    for(int i = t; i >= 0; i--) if(f[u][i] != f[v][i]){
        u = f[u][i];
        v = f[v][i];
    }
    return f[u][0];
}

*一般数组会开成这样:

xxxxxxxxxx
int f[maxn][20];

这样一般就够用了。

预处理的复杂度为O(nlogn),每个询问的复杂度为O(logn),一共就是O((n+m)logn),可以跑过题目的数据。


3.Tarjan

不同于倍增,Tarjan是一种离线算法,并且很优秀很优秀(就是难写)。考虑到刚接触LCA的OIer可能难以理解Tarjan,这里我用几种不同的方式来讲。

本人的方式:你首先在心里构造出一棵树来......标记祖先链的方式其实可以多个询问一起进行。首先依照Tarjan的流程,遍历这棵树。假设现在遍历到了点u,并且开始回溯,那么你可以想象在回溯的过程中实际上是从节点u往上拉出了一条祖先链。当拉链子拉到了一处分叉,并且分叉的另一边还没去过时,就停止拉链,往下走。假设这个过程中走到了节点v并开始回溯,并且询问里有问u和v的LCA,那么在从v回溯的过程中相当于从v开始也拉上去了一条祖先链,会一直拉到之前的分叉处,此时u和v的祖先链便第一次相交,交于分叉处,这个分叉处便是LCA(u,v)。也就是说,当我们遍历到一个点v,发现询问里有LCA(u,v)这个询问,并且从u已经拉出了祖先链,那么LCA(u,v)就是此时u的祖先链的顶端。其实我们不该只局限于这一个询问,从宏观上看,在遍历的过程中我们其实从每个回溯过的点都拉出了一条祖先链来。如果你觉得拉的链子太多,我们可以剪掉一些:只留下询问里涉及的点的祖先链。那么这些祖先链的交点就是遍历过程中走到的那些分叉口,所以一次遍历就可以求出所有询问的LCA。

还是附个流程图吧......

 

我们先在要求:LCA(9,10),LCA(9,5),LCA(8,7),LCA(9,8)。

然后我们从左到右遍历下去,遍历到了9号节点,便往回拉祖先链:

 

(箭头的边是祖先链)现在拉到了4号节点,发现有分叉,往下走到10号节点,发现询问里有LCA(9,10)这个询问,并且从9已经拉出了祖先链,那么LCA(9,10)就是此时9的祖先链的顶端:4号节点。(由于关于10的询问都处理完了,10的祖先链就不画了)此时继续往上拉链:

 

此时发现又有一个分叉,便往分叉走,走到5的位置,并发现询问里有LCA(9,5),那么LCA(9,5)就是此时9的祖先链的顶端:2号节点。(5的祖先链也不画了)继续往上拉链。

 

发现有分叉,往下走到8的位置,发现询问里有LCA(9,8),那么LCA(9,8)就是此时9的祖先链的顶端:1号节点。接着从8往上拉祖先链:

 

发现有分叉,往下走到7的位置,发现询问里有LCA(8,7),那么LCA(8,7)就是此时8的祖先链的顶端:3号节点。

这样应该就可以理解了......整个遍历的复杂度为O(n),加上回答询问的复杂度总共也才O(n+m)。像上面题目里的数据范围可以随便跑。

下面是教练的方式:拉祖先链的过程可以想象成灌水......当你往下灌到底部时,水就会慢慢往上涨,当涨到一个分岔口时就会往另一边流。其实也差不多啦~

附上存询问的代码(用邻接表来存,方便查询):

xxxxxxxxxx
struct edge{
    int to, next, lca;
    edge(){}
    edge(register const int &_to, register const int &_next){
        to = _to,next = _next;
    }
}qe[maxm << 1];
int qhead[maxn], qk;
inline void qadd(register const int &u, register const int &v){
    qe[qk] = edge(v, qhead[u]);
    qhead[u] = qk++;
}
//main函数中
    memset(qhead, -1, sizeof qhead);
    for(register int i = 1; i <= m; i++){
        scanf("%d%d", &u, &v);
        qadd(u, v),qadd(v, u);
    }

然后是Tarjan函数:

xxxxxxxxxx
inline int find(register const int &x){
    if(fa[x] == x) return x;
    return fa[x] = find(fa[x]);
}//用并查集的方式查找祖先链的顶端
void LCA_tarjan(int u, int pre){
    vis[u] = true;
    for(register int i = head[u]; ~i; i = e[i].next){
        int v = e[i].to;
        if(v != pre){
            LCA_tarjan(v, u);
            fa[v] = u;//拉祖先链
        }
    }
    
    for(register int i = qhead[u]; ~i; i = qe[i].next){
        v = qe[i].to;
        //如果v已经拉出了祖先链,就回答询问
        if(vis[v]) qe[i].lca = qe[i ^ 1].lca = find(v);
    }
}
//main函数中
    for(register int i = 1; i <= n; i++) fa[i] = i;
    LCA_tarjan(s, 0);//s为根

以及回答询问:

xxxxxxxxxx
    for(int i = 0; i < qk; i += 2) printf("%d\n", qe[i].lca);

考虑到并查集的存在,Tarjan的复杂度其实为:O(n+mlogn),只不过实际远远达不到这个程度而已。



只有倍增和Tarjan两种算法可以跑LCA?

4.树链剖分

*声明:如果你不会树链剖分你可以不看这一块。

树上倍增嫌慢?Tarjan嫌内存太大操作太麻烦?树链剖分求LCA,你值得拥有!类似于树上倍增的思想,只不过加快了往上跳的速度而已。树链剖分的方法是,一条链子一条链子地往上跳!当跳到两个点所在的链子为同一条时,浅的那个点就是LCA。

xxxxxxxxxx
#include <stdio.h>
#include <string.h>
#define maxn 500010
#define maxm 500010
struct graph{
    struct edge{
        int to, next;
        edge(){}
        edge(const int &_to, const int &_next){
            to = _to;
            next = _next;
        }
    }e[maxm << 1];
    int head[maxn], k;
    inline void init(){
        memset(head, -1, sizeof head);
        k = 0;
    }
    inline void add(const int &u, const int &v){
        e[k] = edge(v, head[u]);
        head[u] = k++;
    }
}g;
int fa[maxn], son[maxn], size[maxn], dep[maxn];
int dfn[maxn], id[maxn], top[maxn], cnt[maxn], tot;
int n, m, s;
inline void swap(int &x, int &y){int t = x; x = y; y = t;}
inline void dfs_getson(int u){
    size[u] = 1;
    for(int i = g.head[u]; ~i; i = g.e[i].next){
        int v = g.e[i].to;
        if(v == fa[u]) continue;
        dep[v] = dep[u] + 1;
        fa[v] = u;
        dfs_getson(v);
        size[u] += size[v];
        if(size[v] > size[son[u]]) son[u] = v;
    }
}
inline void dfs_rewrite(int u, int tp){
    top[u] = tp;
    dfn[u] = ++tot;
    id[tot] = u;
    if(son[u]) dfs_rewrite(son[u], tp);
    for(int i = g.head[u]; ~i; i = g.e[i].next){
        int v = g.e[i].to;
        if(v != son[u] && v != fa[u]) dfs_rewrite(v, v);
    }
    cnt[u] = tot;
}
inline int lca(int u, int v){
    while(top[u] != top[v]){
        if(dep[top[u]] > dep[top[v]]) swap(u, v);
        v = fa[top[v]];
    }
    if(dep[u] > dep[v]) swap(u, v);
    return u;
}
int main(){
    g.init();
    scanf("%d%d%d", &n, &m, &s);
    for(int i = 1; i < n; i++){
        int u, v;
        scanf("%d%d", &u, &v);
        g.add(u, v);
        g.add(v, u);
    }
    dfs_getson(s);
    dfs_rewrite(s, s);
    
    for(int i = 1; i <= n; i++){
        int u, v;
        scanf("%d%d", &u, &v);
        printf("%d\n", lca(u, v));
    }
    
    return 0;
}

#滑稽

经过亲测,放出三种算法的成绩:

树上倍增——用时2287ms,内存50.66MB
Tarjan——用时1272ms,内存29.76MB
树链剖分——用时1538ms,内存25.49MB

综合一下时间和内存的开销,Tarjan和树剖完爆树上倍增......不过树剖的过程中可以很容易得实现更复杂的操作:区间修改、子树修改之类的,个人认为树剖比Tarjan更优。

加上常数优化的树剖:用时1102ms,内存25.55MB

转载于:https://www.cnblogs.com/akura/p/10808772.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/387746.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MAC地址进行验证的方法

需要对对应的MAC地址进行验证的方法&#xff0c;以为很简单就能过&#xff0c;鼓捣了半天以后才发现&#xff0c;我的机器是window7&#xff0c;查询出来是乱码&#xff0c;居然不给支持。没办法在网上继续找资料。终于找到了&#xff0c;贴上来&#xff0c;以备不时之需。 东西…

JAVA 分布式环境 Redis互斥锁

开始的时候项目没有添加互斥锁&#xff0c;用的依然是老的思路&#xff0c;在并发量增加的情况下&#xff0c;遇到了很多的问题&#xff0c;包括数据库重复读等&#xff0c;想了下考虑增加 互斥锁来排序对单个资源的操作。 Target(ElementType.METHOD) Retention(RetentionPoli…

相机添加多张图片css布局

<section class"feedback-upload"><aside class"photos"><div></div><div class"camera"></div></aside><aside class"tips"><div><span>选填0~4</span></div&…

移动端滑动操作学习

(function(window,document){var Slide function(box,judge,fun){if (!(this instanceof Slide)) return new Slide(box,judge,fun);var startx,starty;box.addEventListener("touchstart", function(e) {e.preventDefault(); // 阻止浏览器默认事件startx parseIn…

深入学习Oracle分区表及分区索引

关于分区表和分区索引(About Partitioned Tables and Indexes)对于10gR2而言&#xff0c;基本上可以分成几类&#xff1a; ?    Range(范围)分区 ?    Hash(哈希)分区 ?    List(列表)分区 ?    以及组合分区&#xff1a;Range-Hash,R…

跟随我在oracle学习php(21)

变量间的传值方式 总体说明&#xff1a; 1&#xff0c;这里讨论的传值方式是指&#xff1a;一个变量对另一个变量 2&#xff0c;它不仅仅适用于赋值语句&#xff0c;也适用于其他有同样含义的语句&#xff0c;比如&#xff1a;函数的实参到形参 3&#xff0c;传值方式只有2种&a…

分区索引常用命令

一般使用LOCAL索引较为方便&#xff0c;而且维护代价较低&#xff0c;并且LOCAL索引是在分区的基础上去创建索引&#xff0c;类似于在一个子表内部去创建索引&#xff0c;这样开销主要是区分分区上&#xff0c;很规范的管理起来&#xff0c;在OLAP系统中应用很广泛&#xff1b;…

面向对象简述

1&#xff0c;封装&#xff1a;将对象的属性集成在 class person:def __init__(self,name,idnum):self.namenameself.idnumidnum 2&#xff0c;继承&#xff1a;子类自动拥有父类的的封装&#xff0c;除了非私有之外 class person: def __init__(self,name,idnum): self.namena…

== 和 is 的区别

1. 比较的是值 a2 b2 print(a b) # True lis1 [1,2,3] lis2 [1,2,3] print(lis1 lis2) # True 2.is 是比较的是内存地址 a name print(id(a)) # 内存地址 字符串 a name b name print(a is b) # True 数字 n 10 n110 print(n is n1) # True 小数据池 数字 -5~256 字…

oracle数据量大时候分区索引思路

有一个分区表&#xff0c;按list分区&#xff0c;只有一个本地唯一索引&#xff0c;没有外键和触发器 当单个分区数量在2000万以内时&#xff0c;insert效率还可以&#xff0c;每秒2.3-2.5万条 但数据量越大&#xff0c;速度越慢&#xff0c; 目前单个分区数量达到3亿&#xff…

【转】WPF自定义控件与样式(3)-TextBox RichTextBox PasswordBox样式、水印、Label标签、功能扩展...

一&#xff0e;前言.预览 申明&#xff1a;WPF自定义控件与样式是一个系列文章&#xff0c;前后是有些关联的&#xff0c;但大多是按照由简到繁的顺序逐步发布的等。 本文主要是对文本输入控件进行样式开发&#xff0c;及相关扩展功能开发&#xff0c;主要内容包括&#xff1a;…

JVM调优 dump文件怎么生成和分析

1、获取JVM的dump文件的两种方式   1. JVM启动时增加两个参数: #出现 OOME 时生成堆 dump: -XX:HeapDumpOnOutOfMemoryError #生成堆文件地址&#xff1a; -XX:HeapDumpPath/home/liuke/jvmlogs/ 2. 发现程序异常前通过执行指令&#xff0c;直接生成当前JVM的dmp文件&#x…

关于 Oracle 分区索引的失效和重建

--创建测试表 SQL> create table t as select object_id,object_name from dba_objects;表已创建。SQL> select min(object_id),max(object_id) from t;MIN(OBJECT_ID) MAX(OBJECT_ID)-------------- --------------2 76083SQL> create table t_part(object…

【网络安全/CTF】unseping 江苏工匠杯

该题考察序列化反序列化及Linux命令执行相关知识。 题目 <?php highlight_file(__FILE__);class ease{private $method;private $args;function __construct($method, $args) {$this->method $method;$this->args $args;}function __destruct(){if (in_array($thi…

yum配置中driver-class-name: com.mysql.jdbc.Driver报错

错误&#xff1a; 原因&#xff1a; 解决方法&#xff1a;把方框中的<scope>runtime</scope>删掉 转载于:https://www.cnblogs.com/zly123/p/10834958.html

gitlab中的CI

https://blog.csdn.net/chengzi_comm/article/details/78778284 转载于:https://www.cnblogs.com/effortsing/p/10142720.html

增加表空间大小的四种方法

增加表空间大小的四种方法Meathod1&#xff1a;给表空间增加数据文件ALTER TABLESPACE app_data ADD DATAFILED:\ORACLE\PRODUCT\10.2.0\ORADATA\EDWTEST\APP03.DBF SIZE 50M;Meathod2&#xff1a;新增数据文件&#xff0c;并且允许数据文件自动增长ALTER TABLESPACE app_data …

Red Hat 8.0中设置光盘为软件源

为什么80%的码农都做不了架构师&#xff1f;>>> 以管理员身份登录 su 编辑设置软件源的repo文件 gedit /etc/yum.repos.d/redhat.repo 粘贴如下文本至空白处&#xff1a; [InstallMedia] nameRed Hat Enterprise Linux 8.0.0 mediaidNone metadata_expire-1 gpgche…

C++11并发编程:多线程std::thread

一&#xff1a;概述 C11引入了thread类&#xff0c;大大降低了多线程使用的复杂度&#xff0c;原先使用多线程只能用系统的API&#xff0c;无法解决跨平台问题&#xff0c;一套代码平台移植&#xff0c;对应多线程代码也必须要修改。现在在C11中只需使用语言层面的thread可以解…

图像特征提取——韦伯局部描述符(WLD)

一、原理及概述 韦伯局部描述符&#xff08;WLD&#xff09;是一种鲁棒性好、简单高效的局部特征描述符。WLD由两个部分组成&#xff1a;差分激励和梯度方向。 其具体算法是对于给定的一幅图像&#xff0c;通过对每个像素进行这两个分量的计算来提取其差分激励图像和梯度方向图…