题目链接
冗余路径, Redundant Paths G
题目描述
为了从 F F F 个草场中的一个走到另一个,奶牛们有时不得不路过一些她们讨厌的可怕的树。
奶牛们已经厌倦了被迫走某一条路,所以她们想建一些新路,使每一对草场之间都会至少有两条相互分离的路径,这样她们就有多一些选择。
每对草场之间已经有至少一条路径。
给出所有 R R R 条双向路的描述,每条路连接了两个不同的草场,请计算最少的新建道路的数量,路径由若干道路首尾相连而成。
两条路径相互分离,是指两条路径没有一条重合的道路。
但是,两条分离的路径上可以有一些相同的草场。
对于同一对草场之间,可能已经有两条不同的道路,你也可以在它们之间再建一条道路,作为另一条不同的道路。
输入格式
第 1 1 1 行输入 F F F 和 R R R。
接下来 R R R 行,每行输入两个整数,表示两个草场,它们之间有一条道路。
输出格式
输出一个整数,表示最少的需要新建的道路数。
样例 #1
样例输入 #1
7 7
1 2
2 3
3 4
2 5
4 5
5 6
5 7
样例输出 #1
2
提示
【数据范围】
1 ≤ F ≤ 5000 1≤F≤5000 1≤F≤5000,
F − 1 ≤ R ≤ 10000 F−1≤R≤10000 F−1≤R≤10000
【题目来源】
算法思想
根据题目描述,要在一个无向的连通图中,建一些新路,使每一对草场之间都会至少有两条相互分离的路径,计算最少的新建道路的数量。
先来分析一下测试样例,如下图所示。
其中蓝色虚线的边, ( 1 , 2 ) , ( 5 , 6 ) , ( 5 , 7 ) (1,2),(5,6),(5,7) (1,2),(5,6),(5,7),删除其中一条后,都会将图分裂成两个不相连通的子图,这样的边又被成为割边,或桥。
而绿色虚线中的子图 { 2 , 3 , 4 , 5 } \{2,3,4,5\} {2,3,4,5}之间都有两条“相互分离的路径”(不存在相同边的路径)。在这个子图中是不存在桥的,这样的子图又被成为边双连通分量。
要解决这个问题之前,先来了解一下相关概念。
相关概念
割点
给定无向连通图 G = ( V , E ) G=(V,E) G=(V,E):
若对于 u ∈ V u\in V u∈V,从图中删去边节点 u u u以及所有与 u u u关联的边之后, G G G分裂成两个或两个以上不相连的子图,则称 u u u为 G G G的割点。
桥
给定无向连通图 G = ( V , E ) G=(V,E) G=(V,E):
若对于 e ∈ E e\in E e∈E,从图中删去边 e e e之后, G G G分裂成两个不相连的子图,则称 e e e为 G G G的桥或割边。
无向图的双连通分量
若一张无向连通图不存在割点,则成它为点双连通图。若一张无向连通图不存在桥,则称它为边双连通图。
无向图的极大点双连通子图被称为点双连通分量,记为 v-DCC \text{v-DCC} v-DCC,Vertex Double Connected Component;无向图的极大边双连通子图被称为边双连通分量,记为 e-DCC \text{e-DCC} e-DCC,Edge Double Connected Component。
Tarjan算法
Tarjan算法能够在线性时间内求出无向图的割点与桥,进一步可以求出无向图的双连通分量。
Tarjan算法基于无向图的深度优先遍历,并引入了时间戳的概念。
时间戳
在图的深度优先遍历过程中,按照每个节点第一次被访问的时间顺序,依次将 N N N个节点标记为 1 ∼ N 1\sim N 1∼N,该标记就被称为时间戳,记为 d f n [ u ] dfn[u] dfn[u]。
搜索树
在无向连通图中任选一个节点出发进行深度优先遍历,每个点只访问一次。所有发生递归的边 ( u , v ) (u,v) (u,v),构成一棵树,被称为无向连通图的搜索树。如下图所示,其中节点和绿色的边构成了一棵搜索树。
追溯值
除了时间戳之外,Tarjan算法还引入了一个追溯值 l o w [ u ] low[u] low[u]。设子树 s u b t r e e ( u ) subtree(u) subtree(u)表示搜索树中以 u u u为根的子树。 l o w [ u ] low[u] low[u]表示为以下节点的时间戳的最小值:
- s u b t r e e ( u ) subtree(u) subtree(u)中的节点
- 通过 1 1 1条不在搜索树上的边,能够到达 s u b t r e e ( u ) subtree(u) subtree(u)的节点
如上图所示,其中节点编号为时间戳。 s u b t r e e ( 2 ) = { 2 , 3 , 4 , 5 } subtree(2)=\{2,3,4,5\} subtree(2)={2,3,4,5},由于节点 1 1 1通过不在搜索树上的边 1 → 5 1\to5 1→5能够到达 s u b t r e e ( 2 ) subtree(2) subtree(2),所以 l o w [ 2 ] = 1 low[2]=1 low[2]=1
为了计算 l o w [ u ] low[u] low[u],首先将low[u] = dfn[u] = ++timestamp
,然后考虑从 u u u出发的每条边 ( u , v ) (u,v) (u,v):
- 若在搜索树上, u u u是 v v v的父结点,则令
low[u] = min(low[u], low[v])
- 若无向边 ( u , v ) (u,v) (u,v)不是搜索树上的边,则令
low[u] = min(low[u], dfn[v])
下图括号里的数值标注了每个节点的追溯值 l o w low low:
割边(桥)判断法
无向边 ( u , v ) (u,v) (u,v)是桥,当且仅当搜索树上存在 u u u的一个子节点 v v v满足: d f n [ u ] < l o w [ v ] dfn[u]<low[v] dfn[u]<low[v]
根据定义, d f n [ u ] < l o w [ v ] dfn[u]<low[v] dfn[u]<low[v]说明从 s u b t r e e ( v ) subtree(v) subtree(v)出发,在不经过 ( u , v ) (u,v) (u,v)这条边的前提下,不管走那条边都无法到达 u u u或者比 u u u更早访问的节点。这样的话,若把 ( u , v ) (u,v) (u,v)删除,则 s u b t r e e ( v ) subtree(v) subtree(v)就形成了一个封闭的连通块,与节点 u u u没有边相连,图断开成立两部分。因此 ( u , v ) (u,v) (u,v)是割边(桥)。
下图中的两条割边用虚线标识:
不难发现,桥一定是搜索树种的边,一个简单环中的边一定都不是桥。
需要注意的是,在求一张无向图中所有的割边时,因为深度优先遍历的是无向图,所以从每个节点 u u u出发,总能访问到它的父结点 f a fa fa。根据追溯值 l o w low low的计算方法, ( u , f a ) (u,fa) (u,fa)属于搜索树上的边,且 f a fa fa不是 u u u的子节点,所以不能用 f a fa fa的时间戳来更新 l o w [ u ] low[u] low[u]。
但是如果只记录每个节点的父节点,会无法处理重边的情况——当 u u u与 f a fa fa之间有多条边时, ( u , f a ) (u,fa) (u,fa)一定不是桥。在这些重边中,只有一条算是搜索树上的边,其它重边都不算。故有重边时, d f n [ f a ] dfn[fa] dfn[fa]能用来更新 l o w [ u ] low[u] low[u]。
一个好的解决方案是:将记录 f a fa fa改为记录递归进入每个节点的边的编号 f r o m from from。若沿着编号为 f r o m from from的边递归进入了节点 u u u,则忽略从 u u u出发相对于 f r o m from from的反向边。
算法实现
- 基于上述分析,可以通过Tarjan求出图中所有的桥边,同时也能求出图中的边双连通分量。
- 如果将每个边双连通分量缩成一个点,原图就变成一棵树,桥就是树的边。
- 然后只需将在树中所有叶子节点间添加边,将树变成一个边双连通分量,就能保证整个图中任意两点之间都至少有两条“相互分离的路径”。如下图所示:
由于叶子节点的度都为 1 1 1,因此只需要统计处度为 1 1 1的节点个数 c n t cnt cnt,最终答案为 ⌈ c n t 2 ⌉ \lceil \frac {cnt}{2}\rceil ⌈2cnt⌉。
代码实现
#include <bits/stdc++.h>
using namespace std;
const int N = 5005, M = 40005;
int h[N], e[M], ne[M], idx;
int n, m;
int dfn[N], low[N], timestamp, stk[N], top, dcc_cnt, id[N], d[M];
bool bridge[M]; //标记是否为桥(割边)
void add(int a, int b) // 添加一条边a->b
{e[idx] = b, ne[idx] = h[a], h[a] = idx ++ ;
}
//from表示进入节点u的边
void tarjan(int u, int from)
{dfn[u] = low[u] = ++ timestamp;stk[++ top] = u;for(int i = h[u]; ~ i; i = ne[i]){int v = e[i];if(!dfn[v]) //v点没有访问,则边i是搜索树上的边{tarjan(v, i);low[u] = min(low[u], low[v]);if(dfn[u] < low[v]) //v无法回到u,说明当前边是桥bridge[i] = bridge[i ^ 1] = true; //将正向边、反向边标记为桥}else //边i不是搜索树上的边{ if(i != (from ^ 1)) //边i不是from的反向边low[u] = min(low[u], dfn[v]); }}if(dfn[u] == low[u]) //u是双连通分量的最高点{//取出该双连通分量中的所有点进行标记++ dcc_cnt;int v;do {v = stk[top --];id[v] = dcc_cnt;} while(u != v);}
}
int main()
{cin >> n >> m;memset(h, -1, sizeof h);while(m --){int a, b;cin >> a >> b;add(a, b), add(b, a);}tarjan(1, -1); //每对草场之间已经有至少一条路径,是连通的,因此从顶点1出发即可//遍历每条边for(int i = 0; i < idx; i ++){if(bridge[i]) //如果是桥d[id[e[i]]] ++; //给桥的两个顶点所在的双连通分量的度数增加1}int cnt = 0; //统计叶子节点的个数,即度为1的节点个数for(int i = 1; i <= dcc_cnt; i ++){if(d[i] == 1) cnt ++;}cout << (cnt + 1) / 2 << endl;
}