C语言动态规划

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(3)D1,D2是第一次输入的结点。他们到E 都只有一种费用: f(D1)=5 f(D2)=2
D1
5
E
D2
2
目前无法定下,哪一个点将在全程最优策略的路 径上。第二阶段计算中,5,2都应分别参加计算
(4)C1,C2,C3是第二次输入结点,他们到D1,D2 各有两种费用。此时应计算C1,C2,C3分别到E的最 少费用。 f(C1) =min{C1D1+ f(D1) ,C1D2+ f(D2)}。 计算结果是f(C1)= C1D1+ f(D1)=8 (D1) 同理C2的决策路径计算结果是C2+D2+ E , f(C2)=7 。 同理C3的决策路径计算结果是C3+D2+E,f(C3)=10。
13 B1
7 6 5 8 7
8 C1
3 7 5 3 2
D1
7 C2
5
E
三个将在整体的最优决策路径上。
10 5 D2 8 C3 此时也无法定下第一,二,三阶段的城市那
B2 14
7
(6)第四次输入结点为A,决策输出结点可能为B1, B2。 同理可得决策路径为A:AB2,费用5+14=19 此时才正式确定每个子问题的结点中,那一个结点将 在最优费用的路径上。 子问题的决策中,只对同一城市(结点)比较优劣。 而同一阶段的城市(结点)的优劣要由下一个阶段去 决定。
例如上图中,若路线I和J是A到C的最优路径,则根据最优 化原理,路线J必是从B到C的最优路线。这可用反证法证明: 假设有另一路径J'是B到C的最优路径,则A到C的路线取I和 J'比I和J更优,矛盾。从而证明J'必是B到C的最优路径。
子问题的重叠性
• 动态规划的关键在于解决冗余,这是动态 规划算法的根本目的。 • 动态规划实质上是一种以空间换时间的 技术,它在实现的过程中,不得不存储 产生过程中的各种状态,所以它的空间 复杂度要大于其它的算法。选择动态规 划算法是因为动态规划算法在空间上可 以承受,而搜索算法在时间上却无法承 受,所以我们舍空间而取时间。
5 海盗盗宝问题
海盗有一背包,能容纳10公斤物品,现 有三件宝物:重量分别是6,5,5公斤,价值 分别是30万,20万,15万 请给出装载方案,使背包价值达到最大。
0-1背包问题
给定n种物品和一背包。物品i的重量 是wi,其价值为vi,背包的容量为C。问 应如何选择装入背包的物品,使得装入 背包中物品的总价值最大?
• 所有的海盗都乐于看到他们的一位同伙被扔 进海里,不过,如果让他们选择的话,他们 还是宁可得一笔现金。他们当然也不愿意自 己被扔到海里。 • 所有的海盗都是聪明绝顶的,而且知道其他 的海盗也是聪明绝顶的。 • 此外,没有两名海盗是同等厉害的——这些 海盗按照完全由上到下的等级排好了座次, 并且每个人都清楚自己和其他所有人的等级。 • 这些金块不能再分,也不允许几名海盗共有 金块,因为任何海盗都不相信他的同伙会遵 守关于共享金块的安排。这是一伙每人都只 为自己打算的海盗。
第 五 章 动 态 规 划
1 海盗分金问题
• 5名海盗抢得了窖藏的100块金子,并打算瓜分 这些战利品。 • 这是一些讲民主的海盗(当然是他们自己特有 的民主),他们的习惯是按下面的方式进行分 配:最厉害的一名海盗提出分配方案,然后所 有的海盗(包括提出方案者本人)就此方案进 行表决。如果50%或更多的海盗赞同此方案, 此方案就获得通过并据此分配战利品。否则提 出方案的海盗将被扔到海里,然后下一名最厉 害的海盗又重复上述过程。
动态规划基本步骤
• 找出最优解的性质,并刻划其结构特 征。 • 递归地定义最优值。 • 以自底向上的方式计算出最优值。 • 根据计算最优值时得到的信息,构造 最优解。
思考与练习
• 若城市路径示意图如下图所示, •
• 图中,每条边上的数字是通过这段道路所须 的平均时间。条件:从A地出发,只允许向 右或向上走。试寻找一条从A地到B地所需时 间最短路径和总时间。
讨论:为什么贿赂1号和3号而不是4号和2号?
• 总结
• 分析所有这类策略游戏的奥妙就在于应 当从结尾出发倒推回去。游戏结束时, 你容易知道何种决策有利而何种决策不 利。
多阶段决策问题
• 在现实生活中,有一类活动的过程,由于它的 特殊性,可将过程分成若干个互相联系的阶段, 在它的每一阶段都需要作出决策,从而使整个 过程达到最好的活动效果。 • 这种把一个问题看作是一个前后关联具有链状 结构的多阶段过程就称为多阶段决策过程,这 种问题称为多阶段决策问题。
动态规划的解题思路
• 是先把问题分成多个子问题(一般地每 个子问题是互相关联和影响的),再依 次研究逐个问题的决策。决策就是某个 阶段的状态确定后,从该状态演变到下 一阶段状态的选择。当全体子问题都解 决时,整体问题也随之解决。 • 最优子结构性质 • 子问题重叠性质
最优子结构性质
• 一个最优化策略的子策略总是最优的。一个问题 满足最优化原理又称其具有最优子结构性质。
2 最短距离问题
下图表示城市之间的交通路网,线段 上的数字表示费用,单向通行由A->E。 试用动态规划的最优化原理求出A->E的 最省费用。
7
B1
7 6
5 8
C1
7
3
D1
3
5
A
5
C2 C3
B2
7
5
5 7
E
D2
2
8

如图从A到E共分为4个阶段,即第一阶段 从A到B,第二阶段从B到C,第三阶段从C到 D,第四阶段从D到E。 • 除起点A和终点E外,其它各点既是上一阶 段的终点又是下一阶段的起点。
同理递推下去,可看到各个阶段的决策不同,线路就 不同。
要求在各阶段选取一个恰当的决策
很明显,当某阶段的起点给定时,它直接 影响着后面各阶段的行进路线和整个路线的长 短。 故此问题的要求是:在各个阶段选取一个 恰当的决策,使由这些决策组成的一个决策序 列所决定的一条路线,其总路程最短。如何解 决这个问题呢?
• 从上例的求解结果中,我们不仅得到由A点出 发到终点E的最短路线及最短距离,而且还得 到了从所有各中间点到终点的最短路线及最短 距离,这对许多实际问题来讲是很有用的。
3.动态规划总体思想
• 动态规划算法与分治法类似,其基本思想也是将待求 解问题分解成若干个子问题
T(n)
=
n
T(n/2)
T(n/2)
算法总体思想
• 如果能够保存已解决的子问题的答案,而在需要时再 找出已求得的答案,就可以避免大量重复计算,从而 得到多项式时间算法。
T(n)
n/2
T(n/4) T(n/4) T(n/4)
=
n
n/2 n/2 n/2
T(n/4)
T(n/4)
T(n/4) T(n/4) T(n/4)T(n/4)T(n/4) T(n/4)
4号海盗的策略也差不多。他需要有50%的支 持票,因此同3号一样也需再找一人做同党。 他可以给同党的最低贿赂是1块金子,而他可 以用这块金子来收买2号海盗。因为如果4号被 否决而3号得以通过,则2号将一文不名。
• 5号海盗的分配方案应该是:98块金子归自己, 1块金子给3号,1块金子给1号。 5号海盗的策略稍有不同。他需要收买另两名海 盗,因此至少得用2块金子来贿赂,才能使自己 的方案得到采纳。
8 C1 7 C2
7 5 7 3
D1
3
5
E
2
10 此时也无法定下第一,二阶段的城市那二个将在整体的最 D2 8 C3 优决策路径上。
(5)第三次输入结点为B1,B2,而决策输 出结点可能为C1,C2,C3。仿前计算可得Bl, B2的决策路径为如下情况。 Bl: B1C1 费用 f(B1)=5+8=13, B2:B2C1 费用 f(B2)= 6+8=14,
在第二阶段,再从B2点出发,对于B2点就有一个可供 例如从B2 若选择 A到 的决策, B的第一阶段中, B2 就是第一阶段在我们决策之下的 A 为起点,终点有 B1 ,为 选择的终点集合 (C1, C2 ,C3) ;若选择由 B2走至 C2 B2 两个,因而这时走的路线有两个选择,一是走到 B1, 结果,它既是第一阶段路线的终点,又是第二阶段路线 第二阶段的决策,则 C2就是第二阶段的终点,同时又 一是走到 的始点。 B2。 是第三阶段的始点。
• 最凶的一名海盗应当提出什么样的分配方案 才能使他获得最多的金子呢? • 我们按照这些海盗的威望值来给他们编号。 最怯懦的海盗为1,最厉害的海盗编号为5。 编号为5的海盗会提出什么分配方案呢?
• 如果从游戏的开头出发进行分析,那是走不了 多远的。 • 其原因在于,所有的战略决策都是要确定: “如果我这样做,那么下一个人会怎样做?” • 因此在你以下海盗所做的决定对你来说是重要 的,而在你之前的海盗所做的决定并不重要, 因为你反正对这些决定也无能为力了。
A
B2
f(A) f(B1) f(C1) f(B2) f(C2) f(C3)
f(D1) 0 f(D2)
B
C1 C1
C
D1 D2
D
E E
E
表二:各城市到E的最短距离
A 19 B 13 14 C 8 7 10 D 5 2 E 0
D2
由表二和表三作出最优决 策:AB2C1D1E
小结及比较
•Fra Baidu bibliotek
与穷举法相比,动态规划的方法有两个明显的 优点: (1)大大减少了计算量 (2)丰富了计算结果
4、数塔问题
有形如下图所示的数塔,从顶部出发,在每一结点可 以选择向左走或是向右走,一直走到底层,要求找出一条路 径,使路径上的值最大。
用暴力的方法,可以吗?
试想一下:
这道题如果用枚举法(暴力思想),在数 塔层数稍大的情况下(如31),则需要列 举出的路径条数将是一个非常庞大的数目 (2^30= 1024^3 > 10^9=10亿)。
• 用枚举法 把所有由A->E可能的每一条路线的距 离算出来,然后互相比较,找出最短 者,相应地得出了最短路线。
• 用动态规划法求解 决策过程: (1)由目标状态E向前推,可以分成四个阶 段,即四个子问题。 DE CE BE AE (2)策略:每个阶段到E的最省费用为本阶 段的决策路径。
•1号海盗知道,如果3号的方案被否决,那么最后 将只剩2个海盗,而1号将肯定一无所获——此外, 3号也明白1号了解这一形势。因此,只要3号的分 配方案给1号一点甜头使他不至于空手而归,那么 不论3号提出什么样的分配方案,1号都将投赞成票。 因此3号需要分出尽可能少的一点金子来贿赂1号海 盗
• 4号的分配方案应是:99块金子归自己,3 号一块也得不到,2号得1块金子,1号也是 一块也得不到。
7 5 13 B1
7 6 5 8 7 5
8 C1
3 7 5 3 2
19 A
D1
7 C2
10 C3
5
E
D2
B2 14
7
8
如何用计算机实现上述算法?
• 用数组来存储中间结果,用空间代价换 取时间效率 • 先自底向上构造中间结果,再自顶向下 作出最优决策
表一:
A B C D E
表三:各城市的最优后继 (使其到E 最近)
拒绝暴力,倡导和谐~
考虑一下:
从顶点出发时到底向左走还是向右走 应取决于是从左走能取到最大值还是从 右走能取到最大值,只要左右两道路径 上的最大值求出来了才能作出决策。 可见,由下层的子问题可以得到上层 的子问题,所以,可从底层开始,层层 递进,最后得到最大值。 结论:自顶向下的分析,自底向上的计算。
• 最厉害的5号海盗需要知道其他4名海盗 是怎么想的.......好难猜! • 对4号海盗来说,如果5号海盗被扔进海 里喂鲨鱼了,他只需要猜透其余3名海盗 的算盘。 • 对3号海盗而言,他只须猜透1号和2号海 盗 • 对2号海盗而言,他只须猜透1号海盗
• 那我们就倒过来,由易到难
• 我们的出发点应当是游戏进行到只剩两 名海盗——即1号和2号——的时候。 • 这时最厉害的海盗是2号,而他的最佳分 配方案是一目了然的:100块金子全归他 一人所有,1号海盗什么也得不到。 • 3号海盗的分配方案:3号海盗分得99块 金子,2号海盗一无所获,1号海盗得1块 金子。
T(n/2)
T(n/2)
算法总体思想
• 但是经分解得到的子问题往往不是互相独立的。不同 子问题的数目常常只有多项式量级。在用递归法求解 时,有些子问题被重复计算了许多次。
T(n)
n/2
=
n/2
n
n/2 n/2
T(n/4)T(n/4)T(n/4)T(n/4) T(n/4)T(n/4)T(n/4)T(n/4) T(n/4)T(n/4)T(n/4)T(n/4) T(n/4)T(n/4)T(n/4)T(n/4
相关文档
最新文档