目录
- 一、学习要点
- 1.1 回溯法
- 1.2 问题的解空间
- 1.3 0-1背包问题的解空间
- 1.4 旅行售货员问题的解空间
- 1.5 生成问题状态的基本方法
- 二、回溯法的基本思想
- 三、回溯算法的适用条件
- 四、递归回溯
- 五、迭代回溯
- 六、子集树与排列树
- 七、装载问题
- 八、批处理作业调度问题
一、学习要点
理解回溯法的深度优先搜索策略。
掌握用回溯法解题的算法框架
(1)递归回溯
(2)迭代回溯
(3)子集树算法框架
(4)排列树算法框架
通过应用范例学习回溯法的设计策略。
(1)装载问题;
(2)批处理作业调度;
(3)符号三角形问题
(4)n后问题;
(5)0-1背包问题;
(6)最大团问题;
(7)图的m着色问题
(8)旅行售货员问题
(9)圆排列问题
(10)电路板排列问题
(11)连续邮资问题
1.1 回溯法
有许多问题,当需要找出它的解集或者要求回答什么解是满足某些约束条件的最佳解时,往往要使用回溯法。
回溯法的基本做法是搜索,或是一种组织得井井有条的,能避免不必要搜索的穷举式搜索法。这种方法 适用于解一些组合数相当大的问题。
回溯法在问题的解空间树中,按深度优先策略,从根结点出发搜索解空间树。算法搜索至解空间树的任意一点时,先判断该结点是否包含问题的解。如果肯定不包含,则跳过对该结点为根的子树的搜索,逐层向其祖先结点回溯;否则,进入该子树,继续按深度优先策略搜索。
1.2 问题的解空间
问题的解向量:回溯法希望一个问题的解能够表示成一个n元式(x1,x2,…,xn)的形式。
显约束:对分量xi的取值限定。
隐约束:为满足问题的解而对不同分量之间施加的约束。
解空间:对于问题的一个实例,解向量满足显式约束条件的所有多元组,构成了该实例的一个解空间。
注意:同一个问题可以有多种表示,有些表示方法更简单,所需表示的状态空间更小(存储量少,搜索方法简单)。
n=3时的0-1背包问题用完全二叉树表示的解空间:
1.3 0-1背包问题的解空间
问题的解空间应该至少包含问题的一个(最优)解。
对于n种可选择物品的0-1背包问题,其解空间由长度为n的0-1向量组成。
当n=3时,其解空间为{(0,0,0),(0,0,1),(0,1,0),(0,1,1),(1,0,0),(1,0,1),(1,1,0),(1,1,1)}
解空间其实就是解的集合!
1.4 旅行售货员问题的解空间
问题:某售货员要到若干城市去推销商品,已知各城市之间的路程(旅费)。他要选择一条从驻地出发,经过每个城市一遍,然后回到驻地的路线,使总的路程(总旅费)最小。
1.5 生成问题状态的基本方法
白结点:未被访问到的结点。
灰结点:一个自身已生成但其儿子还没有全部生成的节点称做灰结点。
黑结点:一个所有儿子已经产生的结点称做黑结点。
深度优先的问题状态生成法:如果对一个扩展结点R,一旦产生了它的一个儿子C,就把C当做新的扩展结点。在完成对子树C(以C为根的子树)的穷尽搜索之后,将R重新变成扩展结点,继续生成R的下一个儿子(如果存在)。
宽度优先的问题状态生成法:在一个扩展结点变成黑结点之前,它一直是扩展结点。
回溯法:为了避免生成那些不可能产生最佳解的问题状态,要不断地利用限界函数(bounding function)来处死那些实际上不可能产生所需解的活结点,以减少问题的计算量。具有限界函数的深度优先生成法称为回溯法
二、回溯法的基本思想
(1)针对所给问题,定义问题的解空间;
(2)确定易于搜索的解空间结构;
(3)以深度优先方式搜索解空间,并在搜索过程中用剪枝函数避免无效搜索。
常用剪枝函数:
用约束函数在扩展结点处剪去不满足约束的子树;
用限界函数剪去得不到最优解的子树。
用回溯法解题的一个显著特征是在搜索过程中动态产生问题的解空间。在任何时刻,算法只保存从根结点到当前扩展结点的路径。如果解空间树中从根结点到叶结点的最长路径的长度为h(n),则回溯法所需的计算空间通常为O(h(n))。而显式地存储整个解空间则需要O(2h(n))或O(h(n)!)内存空间。
三、回溯算法的适用条件
在结点<x1,x2,…,xk>处P(x1,x2,…,xk)为真。即向量<x1,x2,…,xk>满足某个性质,则有P(x1,x2,…,xk+1)-> P(x1,x2,…,xk) 0<k<n。称之为多米诺性质。
┐ P(x1,x2,…,xk) ->┐ P(x1,x2,…,xk+1) 0<k<n
k维向量不满足约束条件,扩张向量到k+1维仍旧不满足,才可以进行回溯。
四、递归回溯
回溯法对解空间作深度优先搜索,因此,在一般情况下用递归方法实现回溯法。
void backtrack (int t)
{if (t>n) output(x);elsefor (int i=f(n,t);i<=g(n,t);i++) {x[t]=h(i);if (constraint(t)&&bound(t)) backtrack(t+1);}
}
五、迭代回溯
采用 树的非递归深度优先遍历算法,可将回溯法表示为一个非递归迭代过程。
void iterativeBacktrack ()
{int t=1;while (t>0) {if (f(n,t)<=g(n,t)) for (int i=f(n,t);i<=g(n,t);i++) {x[t]=h(i);if (constraint(t)&&bound(t)) {if (solution(t)) output(x);else t++;}}else t--;}
}
六、子集树与排列树
当所给问题是从n个元素的集合S中找出满足某种性质的子集时,相应的解空间树称为子集树(2n)。
当所给问题是确定n个元素满足某种性质的排列时,相应的解空间树称为排列树(n!)。
遍历子集树需O(2n)计算时间。
void backtrack (int t)
{if (t>n) output(x);elsefor (int i=0;i<=1;i++) {x[t]=i;if (legal(t)) backtrack(t+1);}
}
遍历排列树需要O(n!)计算时间。
void backtrack (int t)
{if (t>n) output(x);elsefor (int i=t;i<=n;i++) {swap(x[t], x[i]);if (legal(t)) backtrack(t+1);swap(x[t], x[i]);}
}
七、装载问题
有一批共n个集装箱要装上2艘载重量分别为c1和c2的轮船,其中集装箱i的重量为wi,且。
装载问题要求确定是否有一个合理的装载方案可将这个集装箱装上这2艘轮船。如果有,找出一种装载方案。
将第一艘轮船尽可能装满等价于选取全体集装箱的一个子集,使该子集中集装箱重量之和最接近。由此可知,装载问题等价于以下特殊的0-1背包问题。
用回溯法设计解装载问题的O(2n)计算时间算法。在某些情况下该算法优于动态规划算法。
当n=3,c1=c2=50,且w=[10,40,40]
如果w=[20,40,40]
最优装载方案:
(1)首先将第一艘轮船尽可能装满;
(2)将剩余的集装箱装上第二艘轮船。
解空间:子集树。
可行性约束函数(选择当前元素):
上界函数(不选择当前元素):
当前载重量cw+剩余集装箱的重量r≤当前最优载重量bestw。
void backtrack (int i){// 搜索第i层结点if (i > n) // 到达叶结点更新最优解bestx,bestw;return;r -= w[i];if (cw + w[i] <= c) {// 搜索左子树x[i] = 1;cw += w[i];backtrack(i + 1);cw -= w[i]; }if (cw + r > bestw) {x[i] = 0; // 搜索右子树backtrack(i + 1); }r += w[i];}
八、批处理作业调度问题
n个作业{1, 2, …, n}要在两台机器上处理,每个作业必须先由机器1处理,然后再由机器2处理,机器1处理作业i所需时间为ai,机器2处理作业i所需时间为bi(1≤i≤n),批处理作业调度问题要求确定这n个作业的最优处理顺序,使得从第1个作业在机器1上处理开始,到最后一个作业在机器2上处理结束所需时间最少。
显然,批处理作业的一个最优调度应使机器1没有空闲时间,且机器2的空闲时间最小。可以证明,存在一个最优作业调度使得在机器1和机器2上作业以相同次序完成。
例:三个作业{1, 2, 3},这三个作业在机器1上所需的处理时间为(2, 3, 2),在机器2上所需的处理时间为(1, 1, 3),则最佳调度方案是(1, 3, 2)、(3, 1, 2)和(3, 2, 1),其完成时间为8。
解空间:排列树。
void Flowshop::Backtrack(int i)
{if (i > n) {for (int j = 1; j <= n; j++)bestx[j] = x[j];bestf = f;}elsefor (int j = i; j <= n; j++) {f1+=M[x[j]][1];f2[i]=((f2[i-1]>f1)?f2[i-1]:f1)+M[x[j]][2];f+=f2[i];if (f < bestf) {Swap(x[i], x[j]);Backtrack(i+1);Swap(x[i], x[j]);}f1- =M[x[j]][1];f- =f2[i];}
}
class Flowshop {friend Flow(int**, int, int []);private:void Backtrack(int i);int **M, // 各作业所需的处理时间*x, // 当前作业调度*bestx, // 当前最优作业调度*f2, // 机器2完成处理时间f1, // 机器1完成处理时间f, // 完成时间和bestf, // 当前最优值n; // 作业数};