第四章 动态决策分析PPT课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《决策理论与方法》
4.1.2 决策树
决策树(decision tree)就是将决策过程各个阶段 之间的结构绘制成一张箭线图,每个决策或事件(即 自然状态)都可能引出两个或多个事件,导致不同的 结果。
决策树的构成有四个要素:1)决策结点;2)方案 枝;3)状态结点;4)概率枝。
第 1155页页
ra,E2fE2
第 99页页
ra,E2fE2
4.1 动态决策的基本原理
《决策理论与方法》
4.1.1 动态规划
最优性原理(the principle of optimality)也 称为Bellman原理,是R. Bellman提出的DP的基本原 理,其表述为:“一个过程 的最优策略具有这样的性质 ,即无论初始状态和初始决 策如何,对于由前面的决策 所形成的状态来说,其后各 阶段的决策序列必定构成相 应子过程的最优策略”。
ra,E2fE2
图4-1-3 最优性原理示意图
第 1100页页
《决策理论与方法》
▪ 动态规划的基本思想:
▪ 1、 将多阶段决策问题按照空间或时间顺序划分成相互联 系的阶段,即把一个大问题分解成一族同类型的子问题, 选取恰当的状态变量和决策变量,写出状态转移方程,定 义最优指标函数,写出递推关系式和边界条件。
DP是离散系统最优化的一种有效工具,目前动态规划 已广泛用于工业、农业、工程技术、资源、环境、经济、 社会等领域。 DP也有一定的局限性。没有标准的模型和 算法,必须根据具体的问题来确定其求解方法;当系统状 态变量个数太大时,受计算机存储量和计算速度的限制可 能无法求解。
第 55页页
4.1 动态决策的基本原理
▪ (库存—销售问题) 设某公司计划在1至4月份从事某种商品经营 。已知仓库最多可存储600件这种商品,已知1月初存货200件, 根据预测知1至4月份各月的单位购货成本及销售价格,每月只能 销售本月初的库存,当月进货供以后各月销售,问如何安排进货 量和销售量,使该公司四个月获得利润最大(假设四月底库存为 零)
《决策理论与方法》
4.1.1 动态规划
例4-1-1 最优线路问题。由水源地A向城市B的输水线路需
通过3个控制点,每个控制点均有两个可选方案,每段线路的输
水费用如下图所示。选出一条输水线路,使得总输水费用最小

6
1
E1
F1
G1
6
3
4
E1
4
A
B
4
5
4
2
3
E2 5 F2 4 G2
A 5
F1 1
6
3
6
2
F2 4
第 1122页页
《决策理论与方法》
▪ (生产—库存问题):某工厂要对一种产品制定今后四个时期的 生产计划,据估计在今后四个时期内,市场对该产品的需求量分 别为2,3,2,4单位,假设每批产品固定成本为3千元,若不生 产为0,每单位产品成本为1千元,每个时期最大生产能力不超过 6个单位,每期期末未出售产品,每单位需付存贮费0.5千元,假 定第1期初和第4期末库存量均为0,问该厂如何安排生产与库存 ,可在满足市场需求的前提下总成本最小。
▪ 2、 从边界条件开始,由后向前逐段递推寻找最优,在每 一个阶段的计算中都要用到前一阶段的最优结果,依次进 行,求得最后一个子问题的最优解就是整个问题的最优解 。
▪ 3、 在多阶段决策过程中,确定阶段k的最优决策时,不是 只考虑本阶段最优,而是要考虑本阶段及其所有后部子过 程的整体最优,也就是说,它是把当前效益和未来效益结 合起来考虑的一种方法。
决策理论与方法
(Decision Making Theory and Methods)
《决策理论与方法》
第四章 动态决策分析
第 22页页
学习目的
《决策理论与方法》
▪ 了解多阶段决策、序贯决策的概念及特点;
▪ 掌握动态规划与决策树方法及其在多阶段决策、 序贯决策中的应用。
第 33页页
本讲内容
4.1 动态决策的基本原理 4.2 多阶段决策 4.3 序贯决策
《决策理论与方法》
第 44页页
4.1 动态决策的基本原理
《决策理论与方法》
4.1.1 动态规划
动态规划(dynamic Programming,DP)是解决多阶 段决策过程最优化的一种方法,是考察问题的一种途径, 而不是一种算法,不像LP那样有一个标准的数学表达式 和明确定义的一组规则,必须具体问题具体分析。其基本 思路是将多阶段决策过程转化为一系列相互关联的单阶段 问题,并依次求解。DP的适用范围比较广,对目标函数 和约束条件没有严格的要求。
第 111页页
《决策理论与方法》
▪ 动态规划问题的典型例子: ▪ 机器负荷问题:某工厂有100台机器,拟分四个周期使用,
在每一个周期有两种生产任务。据经验,把机器x1台投入第 一种生产任务,则在一个生产周期中将有1/3x1台机器报废 ;余下的机器全部投入第二种生产任务,则有1/10的机器报 废,如果干第一种生产任务每台机器可以收益10,干第二 种生产任务每台机器可以收益7,问怎样分配机器使总收益 最大? ▪ 资源分配问题 假设有一种资源其数量为a,现将它分配给n 个使用者。若分配给第i个使用者的数量为xi(i=1,…,n) ,产生的相应收益为gi(xi),问如何分配使总收益最大?
F1 1 3
4
G1
4
G2
3
G1 4 G2 3
G1 4 G2 3
B 费用:
B
16
B
16
B
17
B
14
B
S1 k =1 S2 k =2 S3 k=3 S4 k =4 S5
E2
5
2
B
16
G1 4
F2 4
G2 3
B
17
第 66页页
《决策理论与方法》
第 77页页
《决策理论与方法》
第 88页页
《决策理论与方法》
第 1133页页
《决策理论与方法》
▪ 背包问题 有人携带背包上山,其可携带物品的重量限度为 a公斤,现有n种物品可供选择,设第i种物品的单件重量为 ai公斤,其在上山过程中的价值是携带数量xi的函数ci(xi) ,问应如何安排携带各种物品的数量,使总价值最大。
第 1144页页
ra,E2fE2
4.1 动态决策的基本原理
4.1 动态决策的基本原理
4.1.2 决策树
方案枝
决策 结点
方案枝
状态结点 状态结点
《决策理论与方法》
概率枝 概率枝 概率枝 概率枝 概率枝 概率枝
第 1166页页
பைடு நூலகம் 4.1 动态决策的基本原理
《决策理论与方法》
4.1.2 决策树 决策树法的决策程序如下: 1)绘制树状图,根据已知条件排列出各个方案和
相关文档
最新文档