有向图强连通分量:在
有向图G中,如果两个顶点vi,vj间(vi大于vj)有一条从vi到vj的有向路径,同时还有一条从vj到vi的有向路径,则称两个顶点
强连通(strongly connected)。如果有向图G的每两个顶点都强连通,称G是一个
强连通图。有向图的极大强连通
子图,称为强连通分量。
定义
如果一个
有向图G,对于其中任意两个顶点v,u,都存在从v到u以及从u到v的有向路径,则称G为
强连通图。而在一个不是强连通图的有向图G中,若其中两个顶点u、v在两个方向上都存在有向路径,则称u和v强连通。
而有向图G的极大
强连通子图S,即添加任意顶点都会导致S失去强连通的属性,则称S为G的强连通分量。
算法思路
Kosaraju算法
Kosaraju算法可以说是最容易理解,最常用的算法,其比较关键的部分是同时应用了原图G和反图GT。步骤1:先用对原图G进行深搜
生成树,步骤2:然后任选一棵树对其进行深搜(注意这次深搜节点A能往子节点B走的要求是EAB存在于反图GT),能
遍历到的顶点就是一个强连通分量。余下部分和原来的树一起组成一个新的树,继续步骤2直到 没有顶点为止。
改进思路:
当然,基本思路实现起来是比较麻烦的(因为步骤2每次对一棵树进行深搜时,可能深搜到其他树上去,这是不允许的,强连通分量只能存在单棵树中(由开篇第一句话可知)),我们当然不这么做,我们可以巧妙的选择第二深搜选择的树的顺序,使其不可能深搜到其他树上去。想象一下,如果步骤2是从森林里选择树,那么哪个树是不连通(对于GT来说)到其他树上的呢?就是最后
遍历出来的树,它的
根节点在步骤1的遍历中离开时间最晚,而且可知它也是该树中离开时间最晚的那个节点。这给我们提供了很好的选择,在第一次深搜遍历时,记录时间i离开的顶点j,即numb[i]=j。那么,我们每次只需找到没有找过的顶点中具有最晚离开时间的顶点直接深搜(对于GT来说)就可以了。每次深搜都得到一个强连通分量。
隐藏性质:
分析到这里,我们已经知道怎么求强连通分量了。但是,应当注意到第二次深搜选择树的顺序有一个特点。它就是:如果把求出来的每个强连通分量收缩成一个点,并且用求出每个强连通分量的顺序来标记收缩后的节点,那么这个顺序其实就是强连通分量收缩成点后形成的
有向无环图的拓扑序列。为什么呢?首先,应该明确搜索后的图一定是有向无环图呢?废话,如果还有环,那么环上的顶点对应的所有原来图上的顶点构成一个强连通分量,而不是构成环上那么多点对应的独自的强连通分量了。然后就是为什么是
拓扑序列,我们在改进分析的时候,不是先选的树不会连通到其他树上(对于反图GT来说),也就是后选的树没有连通到先选的树,也即先出现的强连通分量收缩的点只能指向后出现的强连通分量收缩的点。那么拓扑序列不是理所当然的吗?这就是
Kosaraju算法的一个隐藏性质。
代码思路
step1:对原图G进行
深度优先遍历,记录每个节点的离开时间。
step2:选择具有最晚离开时间的顶点,对反图GT进行
遍历,删除能够遍历到的顶点,这些顶点构成一个强连通分量。
step3:如果还有顶点没有删除,继续step2,否则算法结束。
实现代码(C++)
Tarjan算法
Tarjan算法思路不难理解,因为任何一个强连通分量,必定是对原图的深度优先搜索树的
子树。那么其实只要确定每个强连通分量的子树的根,然后根据这些根从树的最低层开始,一个一个的拿出强连通分量即可。那么剩下的问题就只剩下如何确定强连通分量的根和如何从最低层开始拿出强连通分量了。
那么如何确定强连通分量的根,在这里我们维护两个数组,一个是indx[1..n],一个是mlik[1..n],其中indx[i]表示顶点i开始访问时间,mlik[i]为与顶点i邻接的顶点未删除顶点j的mlik[j]和mlik[i]的
最小值(mlik[i]初始化为indx[i])。这样,在一次深搜的回溯过程中,如果发现mlik[i]==indx[i]那么,当前顶点就是一个强连通分量的根,为什么呢?因为如果它不是强连通分量的根,那么它一定是属于另一个强连通分量,而且它的根是当前顶点的祖宗,那么存在包含当前顶点的到其祖宗的回路,可知mlik[i]一定被更改为一个比indx[i]更小的值。
至于如何拿出强连通分量,如果当前节点为一个强连通分量的根,那么它的强连通分量一定是以该根为根节点的(剩下节点)子树。在
深度优先遍历的时候维护一个
堆栈,每次访问一个新节点,就压入堆栈。这样,由于当前节点是这个强连通分量中最先被压入堆栈的,那么在当前节点以后压入堆栈的并且仍在堆栈中的节点都属于这个强连通分量。可以用
反证法证明这个做法的正确性。假设一个节点在当前节点压入堆栈以后压入并且还存在,同时它不属于该强连通分量,那么它一定属于另一个强连通分量,但当前节点是它的根的祖宗,那么这个强连通分量应该在此之前已经被拿出。
实现代码(pascal)
代码中数组dfn为上述indx,low为mlik
实现代码(C++)
Gabow算法
Gabow算法其实就是Tarjan算法的变形,我们观察一下,只是它用第二个
堆栈来辅助求出强连通分量的根,而不是Tarjan算法里面的indx[]和mlik[]数组。那么,我们说一下如何使用第二个堆栈来辅助求出强连通分量的根。
我们使用类比方法,在Tarjan算法中,每次mlik[i]的修改都是由于环的出现(不然,mlik[i]的值不可能变小),每次出现环,在这个环里面只剩下一个mlik[i]没有被改变(深度最低的那个),或者全部被改变,因为那个深度最低的节点在另一个环内。那么Gabow算法中的第二堆栈变化就是删除构成环的节点,只剩深度最低的节点,或者全部删除,这个过程是通过
出栈来实现,因为深度最低的那个顶点一定比前面的先访问,那么只要出栈一直到
栈顶那个顶点的访问时间不大于深度最低的那个顶点。其中每个被弹出的节点属于同一个强连通分量。那有人会问:为什么弹出的都是同一个强连通分量?因为在这个节点访问之前,能够构成强连通分量的那些节点已经被弹出了,这个对
Tarjan算法有了解的都应该清楚,那么Tarjan算法中的判断根我们用什么来代替呢?想想,其实就是看看第二个
堆栈的顶元素是不是当前顶点就可以了。
其实Tarjan算法和Gabow算法其实是同一个思想的不同实现,但是,Gabow算法更精妙,时间更少(不用频繁更新mlik[])。
代码思路
步骤1:找一个没有被访问过的节点v,goto step2(v)。否则,算法结束。
步骤2(v):
对于v所有的邻接顶点u:
(1) 如果没有访问过,则step2(u)
(2) 如果访问过,但没有删除,维护stk2[](处理环的过程)
如果stk2[]的顶元素=v,那么输出相应的强连通分量
实现代码(C++)
算法总结
Kosaraju算法的第二次深搜隐藏了一个拓扑性质,而
Tarjan算法和Gabow算法省略了第二次深搜,所以,它们不具有拓扑性质。Tarjan算法用
堆栈和标记,Gabow用两个堆栈(其中一个堆栈的实质是代替了Tarjan算法的标记部分)来代替
Kosaraju算法的第二次深搜,所以只用一次深搜,效率比Kosaraju算法要高。