决策理论与方法(PPT 74页)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第 55页页
《决策理论与方法》
动态规划的主要创始人是美国数学家贝尔曼。20世纪40年代末50年代初,当时在兰德公司 从事研究工作的贝尔曼首先提出了动态规划的概念。1951年贝尔曼首先提出了动态规划中解决 多阶段决策问题的最优化原理,并给出了许多实际问题的解法。1957年贝尔曼出版了他的第一 部著作《动态规划》,标志着运筹学这一重要分支的诞生。该著作成为当时唯一的进一步研究 和应用动态规划的理论源泉。1961年贝尔曼出版了他的第二部著作,并于1962年同杜瑞佛思合 作出版了第三部著作。在贝尔曼及其助手们致力于发展和推广这一技术的同时,其他一些学者 也对动态规划的发展作了巨大的贡献,其中最值得一提的是爱尔思和梅特顿。爱尔思先后于 1961年和1964年出版了两部关于动态规划的著作,并于1964年同尼母霍思尔、威尔德一道创建 了处理分支、循环性多阶段决策系统的一般性理论。梅特顿提出了许多对动态规划后来发展有 着重要意义的基础性观点,并且对明晰动态规划路径的数学性质作出了巨大的贡献。
第 77页页
4.1 动态决策的基本原理
《决策理论与方法》
4.1.1 动态规划
动态规划(dynamic Programming,DP)是解 决多阶段决策过程最优化的一种方法,其基本思路是 将多阶段决策过程转化为一系列相互关联的单阶段问 题,并依次求解。
DP是离散系统最优化的一种有效工具,目前动 态规划已广泛用于工业、农业、工程技术、资源、环 境、经济、社会等领域。
第 33页页
本讲内容
4.1动态决策的基本原理 4.2ቤተ መጻሕፍቲ ባይዱ属性决策
《决策理论与方法》
第 44页页
4.1 多阶段决策问题的提出 《决策理论与方法》
4.1.1 动态规划概述
规划问题的最终目的就是确定各决策变量的取值,以使目标函数达到极大或极小 。在线性规划和非线性规划中,决策变量都是以集合的形式被一次性处理的;然而, 有时我们也会面对决策变量需分期、分批处理的多阶段决策问题。
第 1100页页
r a, E2 f E2
4.1 动态决策的基本原理
《决策理论与方法》
4.1.2 决策树
决策树(decision tree)就是将决策过程各个阶段 之间的结构绘制成一张箭线图,每个决策或事件(即 自然状态)都可能引出两个或多个事件,导致不同的 结果。
S1 k=1 S2 k=2 S3 k=3 S4 k=4 S5
第 99页页
r a, E2 f E2
4.1 动态决策的基本原理
《决策理论与方法》
4.1.1 动态规划
最优性原理(the principle of optimality)也称为 Bellman原理,是R. Bellman提出的DP的基本原理, 其表述为:“一个过程的最优策略具有这样的性质, 即无论初始状态和初始决策如何,对于由前面的决策 所形成的状态来说,其后各阶段的决策序列必定构成 相应子过程的最优策略”。
第 66页页
《决策理论与方法》
动态规划问题的求解却没有统一的方法(类似于单纯形法)。因此在用动态规划求解最优化问 题中,必须对具体问题具体分析,针对不同的问题,使用动态规划最优化原理和方法,建立起 与其相应的数学模型,然后再用动态规划方法去求解。根据动态规划这些特点,要求我们在学 好动态规划的基本原理和方法的同时,还应具有丰富的想象力,只有这样才能建好模型求出问 题的最优解。
教育部高等学校管理科学与工程类学科专业教学指导委员会 推荐教材
决策理论与方法
(Decision Making Theory and Methods)
《决策理论与方法》编写组
《决策理论与方法》
第四章 动态决策分析
第 22页页
学习目的
《决策理论与方法》
▪ 了解多阶段决策、序贯决策的概念及特点;
▪ 掌握动态规划与决策树方法及其在多阶段决策、 序贯决策中的应用。
第 88页页
4.1 动态决策的基本原理
《决策理论与方法》
4.1.1 动态规划
例4-1-1 最优线路问题。由水源地向城市的输水 线路需通过3个控制点,每个控制点均有两个可选方 案,每段线路的输水费用如下图所示。选出一条输水 线路,使得总输水费用最小。
6 E1
6
1 F1
3
G1 4
4
A
B
5
4
2
3
E2 5 F2 4 G2
所谓多阶段决策问题是指这样一类活动过程:它可以分解为若干个互相联系的阶 段,在每一阶段分别对应着一组可供选取的决策集合,即构成过程的每个阶段都需要 进行一次决策。将各个阶段的决策综合起来构成一个决策序列,称为一个策略。显然 ,由于各个阶段选取的决策不同,对应整个过程可以有一系列不同的策略。当过程采 取某个具体策略时,相应可以得到一个确定的效果,采取不同的策略,就会得到不同 的效果。多阶段的决策问题,就是要在所有可能采取的策略中选取一个最优策略,以 便得到最佳的效果。动态规划同前面介绍过的各种优化方法不同,它不是一种算法, 而是考察问题的一种途径。动态规划是一种求解多阶段决策问题的系统技术,可以说 它横跨整个规划领域(线性规划和非线性规划)。当然,由于动态规划不是一种特定 的算法,因而它不像线性规划那样有一个标准的数学表达式和明确定义的一组规则, 动态规划必须对具体问题进行具体的分析处理。在多阶段决策问题中,有些问题对阶 段的划分具有明显的时序性,动态规划的“动态”二字也由此而得名。
动态规划从创立到现在50多年来,无论在工程技术、企业管理还是在工农业生产及军事等 部门都有着广泛的应用,并取得了显著的效果。在管理方面,动态规划可用于资源分配问题、 最短路径问题、库存问题、背包问题、设备更新问题、最优控制问题等等,所以动态规划是现 代管理学中进行科学决策不可缺少的工具。
动态规划的优点在于,它把一个多维决策问题转化为若干个一维最优化问题,而对一维最 优化问题一个一个地去解,这种方法是许多求极值方法所做不到的,它几乎优于所有现存的优 化方法。除此之外,动态规划能求出全局极大或极小,这一点也优于其他优化方法。需要指出 的是,动态规划是求解最优化问题的一种方法,是解决问题的一种途径,而不是一种算法。在 前面我们学习了用单纯形法解线性规划问题,凡是具有线性规划问题那样统一的数学模型都可 以用单纯形法去求解,而
相关文档
最新文档