二分图的最优匹配(km算法)

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Hale Waihona Puke Baidu
（关键，关键），此时属于 S 的 X 均已经减去 d 了，所以不属于 T 的 y 也要减去 d，防止下次循环更改出错）。 Kuhn－Munkras 算法流程： (1)初始化可行顶标的值 (2)用匈牙利算法寻找完备匹配 (3)若未找到完备匹配则修改可行顶标的值 (4)重复(2)(3)直到找到相等子图的完备匹配为止
KM 算法总结
分类： ACM_图论 2010-08-22 09:411090人阅读评论(0)收藏举报
【二分图】二分图是一种特殊的图结构，所有点分为两类，记做 x 和 y，所有的边的两端分别在 x 和 y，不存在两端同在 x 或 y 的边。【最大匹配、完备匹配】给定一个二分图(x,y)，找到一种匹配数最大的方案，记做最大匹配。|x|=|y|=匹配数时，我们称该匹配方案为完备匹配。显然，解决了最大匹配也就解决了完备匹配。解决二分图的最大匹配可以用网络流或者匈牙利算法，两者本质上是相同的，不过不论从编程复杂度还是运行效率来讲，匈牙利算法都更加优秀。关于匈牙利算法，可以参见我以前写的文章：用匈牙利算法求二分图的最大匹配这里我主要叙述另一类问题：【最优完备匹配】对于二分图的每条边都有一个权（非负），要求一种完备匹配方案，使得所有匹配边的权和最大，记做最优完备匹配。（特殊的，当所有边的权为1时，就是最大完备匹配问题） KM 算法：（全称是 Kuhn-Munkras，是这两个人在1957年提出的，有趣的是，匈牙利算法是在1965年提出的）为每个点设立一个顶标 Li，先不要去管它的意义。设 vi,j为(i,j)边的权，如果可以求得一个完备匹配，使得每条匹配边 vi,j=Li+Lj，其余边 vi,j≤Li+Lj。此时的解就是最优的，因为匹配边的权和=∑Li，其余任意解的权和都不可能比这个大定理：二分图中所有 vi,j=Li+Lj 的边构成一个子图 G，用匈牙利算法求 G 中的最大匹配，如果该匹配是完备匹配，则是最优完备匹配。（不知道怎么证明）问题是，现在连 Li 的意义还不清楚。其实，我们现在要求的就是 L 的值，使得在该 L 值下达到最优完备匹配。
例2
如图： | 1 2 3 | | 3 2 4 | | 2 3 5 | 若要对这个完全二分图求最佳匹配
初始化： Lx(1)= max{ y| w(1,y), 1<= y<= 3 }= max{ 1, 2, 3 }= 3, Ly(1)= 0 Lx(2)= max{ 3, 2, 4 }= 4, Ly(2)= 0 Lx(3)= max{ 2, 3, 5 }= 5, Ly(3)= 0; 我们建立等价子图( 满足 Lx(x)+ Ly(y)== W(x,y) ) 如下：
二分图的最优匹配（KM 算法）
KM 算法用来解决最大权匹配问题：在一个二分图内，左顶点为 X，右顶点为 Y，现对于每组左右连接 XiYj 有权 wij，求一种匹配使得所有 wij 的和最大。
基本原理
该算法是通过给每个顶点一个标号（叫做顶标）来把求最大权匹配的问题转化为求完备匹配的问题的。设顶点 Xi 的顶标为 A[ i ]，顶点 Yj 的顶标为 B[ j ]，顶点 Xi 与 Yj 之间的边权为 w[i,j]。在算法执行过程中的任一时刻，对于任一条边(i,j)，A[ i ]+B[j]>=w[i,j]始终成立。 KM 算法的正确性基于以下定理：若由二分图中所有满足 A[ i ]+B[j]=w[i,j]的边(i,j)构成的子图（称做相等子图）有完备匹配，那么这个完备匹配就是二分图的最大权匹配。首先解释下什么是完备匹配，所谓的完备匹配就是在二部图中，X 点集中的所有点都有对应的匹配或者是 Y 点集中所有的点都有对应的匹配，则称该匹配为完备匹配。这个定理是显然的。因为对于二分图的任意一个匹配，如果它包含于相等子图，那么它的边权和等于所有顶点的顶标和；如果它有的边不包含于相等子图，那么它的边权和小于所有顶点的顶标和。所以相等子图的完备匹配一定是二分图的最大权匹配。初始时为了使 A[ i ]+B[j]>=w[i,j]恒成立，令 A[ i ]为所有与顶点 Xi 关联的边的最大权，B[j]=0。如果当前的相等子图没有完备匹配，就按下面的方法修改顶标以使扩大相等子图，直到相等子图具有完备匹配为止。我们求当前相等子图的完备匹配失败了，是因为对于某个 X 顶点，我们找不到一条从它出发的交错路。这时我们获得了一棵交错树，它的叶子结点全部是 X 顶点。现在我们把交错树中 X 顶点的顶标全都减小某个值 d，Y 顶点的顶标全都增加同一个值 d，那么我们会发现： 1）两端都在交错树中的边(i,j)，A[ i ]+B[j]的值没有变化。也就是说，它原来属于相等子图，现在仍属于相等子图。 2）两端都不在交错树中的边(i,j)，A[ i ]和 B[j]都没有变化。也就是说，它原来属于（或不属于）相等子图，现在仍属于（或不属于）相等子图。 3）X 端不在交错树中，Y 端在交错树中的边(i,j)，它的 A[ i ]+B[j]的值有所增大。它原来不属于相等子图，现在仍不属于相等子图。 4）X 端在交错树中，Y 端不在交错树中的边(i,j)，它的 A[ i ]+B[j]的值有所减小。也就说，它原来不属于相等子图，现在可能进入了相等子图，因而使相等子图得到了扩大。（针对之后例子中 x1->y4 这条边）现在的问题就是求 d 值了。为了使 A[ i ]+B[j]>=w[i,j]始终成立，且至少有一条边进入相等子图， d 应该等于： Min{A[i]+B[j]-w[i,j] | Xi 在交错树中，Yi 不在交错树中}。
例
已知 K5,5 的权矩阵为 y1 y2 y3 y4 y5 x1 3 5 5 4 1 x2 2 2 0 2 2 x3 2 4 4 1 0 x4 0 1 1 0 0 x5 1 2 1 3 3 求最佳匹配，其中 K5,5 的顶划分为 X={xi},Y={yi},i=1,2,3,4,5. 解： (1)取可行顶标 l(v)为 l(yi)=0,i=1,2,3,4,5； l(x1)=max{3,5,5,4,1}=5,l(x2)=max{2,2,0,2,2}=2,l(x3)=max(2,4,4,1,0}=4,l(x4)=max{0,1,1,0,0} =1,l(x5)=max{1,2,1,3,3}=3. (2) Gl 及其上之匹配见图 7.12。这个图中 ο (G-x2)=3,由 Tutte 定理知无完备匹配。需要修改顶标。 (3) u=x4,得 S={x4,x3,x1},T={y3,y2},N(S)=T,于是 al=min(l(x)+l(y)-w(xy)}=1. (x∈S,y∈T) x1,x2,x3,x4,x5 的顶标分别修改成 4,2,3,0,3；y1,y2,y3,y4,y5 的顶标分别修改成 0,1,1,0,0。 (4) 用修改后的顶标 l 得 Gl 及其上面的一个完备匹配如图 7.13。图中粗实线给出了一个最佳匹配，其最大权是 2+4+1+4+3=14。我们看出：al>0；修改后的顶标仍是可行顶标；Gl 中仍含 Gl 中的匹配 M；Gl 中至少会出现不属于 M 的一条边，所以会造成 M 的逐渐增广。得到可行顶标后求最大匹配：书上这部分没讲，实际上是这样的，对于上面这个例子来说，通过 Kuhn-Munkres 得到了顶标 l(x)= {4,2,3,0,3},l(y)={0,1,1,0,0},那么，对于所有的 l(xi)+l(yj) = w(i,j)，在二分图 G 设置存在边 w(i,j)。再用匈牙利算法求出最大匹配，再把匹配中的每一边的权值加起来就是最后的结果了。
1. 如果 x∈ S 则 Lx(x)= Lx(x)- d。 2. 如果 x∈ T 则 Ly(x)= Ly(x)+ d。 3. 其它情况保持不变。如此修改后，我们发现对于边<x,y>，顶标 Lx(x)+ Ly(y) 的值为 1. Lx(x)- d+ Ly(y)+ d， x∈ S, y∈ T。 2. Lx(x)+ Ly(y)， x∉ S, y∉ T。 3. Lx(x)- d+ Ly(y)， x∈ S, y∉ T。 4. Lx(x)+ Ly(y)+ d， x∉ S, y∈ T。易知，修改后对于任何边仍满足 Lx(x)+ Ly(y)>= W(x,y)，并且第三种情况顶标值减少了 d，如此定会使等价子图扩大。
就上例而言: 修改后 Lx(1)= 2, Lx(2)= 3, Lx(3)= 5, Ly(1)= 0, Ly(1)= 0, Ly(2)= 0, Ly(3)= 1。这时 Lx(2)+Ly(1)=3+0=3= W(2,1)，在等价子图中增加了一条边，等价子图变为：
如此按以上方法，得到等价子图的完美匹配。另外计算 d 值的时候可以进行一些优化。定义 slack(y)= min{ (x,y)| Lx(x)+ Ly(y)- W(x,y)，x∈ S, y∉ T } 这样能在寻找增广路径的时候就顺便将 slack 求出。
对于该图，运用匈牙利算法对 X 部顶点 1 求增广路径，得到一个匹配，如图( 红色代表匹配边 )：
对 X 部顶点 2 求增广路径失败，寻找增广路径的过程为 X 2-> Y 3-> X 1。我们把寻找增广路径失败的 DFS 的交错树中，在 X 部顶点集称之为 S，在 Y 部的顶点集称之为 T。则 S= { 1, 2 }，T= { 3 }。现在我们就通过修改顶标值来扩大等价子图，如何修改。 1) 我们寻找一个 d 值，使得 d= min{ (x,y)| Lx(x)+ Ly(y)- W(x,y), x∈ S, y∉ T }，因些，这时 d= min{
Lx(1)+Ly(1)-W(1,1), Lx(1)+Ly(2)-W(1,2), Lx(2)+Ly(1)-W(2,1), Lx(2)+Ly(2)-W(2,2) }= min{ 3+0- 1, 3+0-2, 4+0-3, 4+0-2 }= min{ 2, 1, 1, 2 }= 1。寻找最小的 d 是为了保证修改后仍满足性质对于边 <x,y> 有 Lx(x)+ Ly(y)>= W(x,y)。 2) 然后对于顶点 x
改进
以上就是 KM 算法的基本思路。但是朴素的实现方法，时间复杂度为 O(n4)——需要找 O(n)次增广路，每次增广最多需要修改 O(n)次顶标，每次修改顶标时由于要枚举边来求 d 值，复杂度为 O(n2)。实际上 KM 算法的复杂度是可以做到 O(n3)的。我们给每个 Y 顶点一个“松弛量”函数 slack，每次开始找增广路时初始化为无穷大。在寻找增广路的过程中，检查边(i,j)时，如果它不在相等子图中，则让 slack[j]变成原值与 A[ i ]+B[j]-w[i,j]的较小值。这样，在修改顶标时，取所有不在交错树中的 Y 顶点的 slack 值中的最小值作为 d 值即可。但还要注意一点：修改顶标后，要把所有的不在交错树中的 Y 顶点的 slack 值都减去 d（因为：d 的定义为 min{ (x,y)| Lx(x)+ Ly(y)- W(x,y), x∈ S, y∉ T }
L 初始化： Li=max{wi,j}(i∈ x,j∈ y) Lj=0 建立子图 G，用匈牙利算法求 G 的最大匹配，如果在某点 i (i∈ x)找不到增广轨，则得不到完备匹配。此时需要对 L 做一些调整：设 S 为寻找从 i 出发的增广轨时访问的 x 中的点的集合，T 为访问的 y 中的点的集合。找到一个改进量 dx，dx=min{Li+Lj-wi,j}(i∈ S,j 不∈ T) Li=Li-dx (i∈ S) Li=Li+dx (i∈ T) 重复以上过程，不断的调整 L，直到求出完备匹配为止。从调整过程中可以看出：每次调整后新子图中在包含原子图中所有的边的基础上添加了一些新边。每次调整后∑Li 会减少 dx，由于每次 dx 取最小，所以保证了解的最优性。复杂度分析：设 m 为边数，从 x 中的一个未盖点出发寻找增广轨的复杂度最坏是 O(m)，每次调整后至少添加一条边，则最多调整 m 次，每次调整的的复杂度最坏是 O(m)，所以总的复杂度在最坏情况下是 O(m+m2)=O(m2) 扩展：根据 KM 算法的实质，可以求出使得所有匹配边的权和最小的匹配方案。 L 初始化： Li=min{wi,j}(i∈ x,j∈ y) Lj=0 dx=min{wi,j-Li-Lj}(i∈ S,j 不∈ T) Li=Li+dx (i∈ S) Li=Li-dx (i∈ T)