动态决策分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
决策理论与方法
(Decision Making Theory and Methods)
《决策理论与方法》
第四章 动态决策分析
第 22页页
学习目的
《决策理论与方法》
▪ 了解多阶段决策、序贯决策的概念及特点;
▪ 掌握动态规划与决策树方法及其在多阶段决策、 序贯决策中的应用。
第 33页页
本讲内容
《决策理论与方法》
更准确地了解市场情况,正式投产前可进行产品试销 ,但需是消费500元。试销状态可分为受欢迎 H 1 、一 般 H 2 或不受欢迎 H 3 三种,其条件概率分别见下表右 。如不买此项技术,把这笔经费应用在其他地方,在 同样的时期内,可获利15000元,那么公司应如何决 策?公司要确定:1)是否卖技术?2)如果买技术, 是否采取试销方式?3)如果不试销,应大批、中批 还是小批生产?如果试销又如何根据试销状态决定其 行动 。
4.1 动态决策的基本原理
《决策理论与方法》
4.1.1 动态规划
例4-1-1 最优线路问题。由水源地向城市的输水 线路需通过3个控制点,每个控制点均有两个可选方 案,每段线路的输水费用如下图所示。选出一条输水 线路,使得总输水费用最小。
6 E1
6
1 F1
3
G1 4
4
A
B
5
4
2
3
E2
5
F2
4
G2
S1 k = 1 S2 k = 2 S3 k= 3 S4 k = 4 S5
动态规划(dynamic Programming,DP)是解 决多阶段决策过程最优化的一种方法,其基本思路是 将多阶段决策过程转化为一系列相互关联的单阶段问 题,并依次求解。
DP是离散系统最优化的一种有效工具,目前动 态规划已广泛用于工业、农业、工程技术、资源、环 境、经济、社会等领域。
第 55页页
4.2.2 多阶段决策问题的决策方法
84
73
60
45
5元
10
12
15
20
25
84
73
60
45
6元
12
13
16
20
24
84
73
60
45
7元
14
14
16
18
18
84
73
60
45
8元
16
15
15
14
14
例4-2-1决策图
第 1155页页
4.2 多阶段决策
4.2.2 多阶段决策问题的决策 方法
例4-2-1 某公司考虑为某新产品定 价,该产品的单价拟从每件5元 、6元、7元、8元这四个价格中 选取其中之一,每年年初允许变 动价格,但幅度不能超过1元。 该公司预计该产品畅销只有五年 ,五年后将被淘汰,另据销售情 况的预测,在价格不同的情况下 各年的预计利润额见右表。
每一方案的各种自然状态。 2)将各状态概率及损益值标于概率枝上。 3)计算各方案期望值并将其标于该方案对应的状
态结点上。 4)进行剪枝,比较各个方案的期望值,并标于方
案枝上,将期望值小的(即劣等方案剪掉)所剩的最后 方案为最佳方案。
第 1100页页
4.2 多阶段决策
《决策理论与方法》
多阶段决策有以下三个特点,
第 1133页页
4.2 多阶段决策
《决策理论与方法》
4.2.2 多阶段决策问题的决策方法
多阶段决策问题包括确定型与随机型两大类,在 确定型多阶段决策中,目标值都是确定值,在风险型 多阶段决策中,目标值用期望值作为评价的标准。
下面分别以两个例子说明其决策方法。
第 1144页页
4.2 多阶段决策
《决策理论与方法》
第 77页页
4.1 动态决策的基本原理
《决策理论与方法》
4.1.2 决策树
决策树(decision tree)就是将决策过程各个阶段 之间的结构绘制成一张箭线图,每个决策或事件(即 自然状态)都可能引出两个或多个事件,导致不同的 结果。
决策树的构成有四个要素:1)决策结点;2)方案 枝;3)状态结点;4)概率枝。
第 88页页
4.1 动态决策的基本原理
4.1.2 决策树
方案枝 决策结 点
状态结点
方案枝
状态结点
《决策理论与方法》
概率枝 概率枝 概率枝 概率枝 概率枝 概率枝
第 99页页
4.1 动态决策的基本原理
《决策理论与方法》
4.1.2 决策树 决策树法的决策程序如下: 1)绘制树状图,根据已知条件排列出各个方案和
4.1动态决策的基本原理 4.1.1动态规划 4.1.2决策树
4.2多阶段决策 4.2.1多阶段决策过程的基本概念 4.2.2多阶段决策问题的决策方法
4.3序贯决策 4.3.1序贯决策的基本概念 4.3.2序贯决策的决策方法
第 44页页
4.1 动态决策的基本原理
《决策理论与方法》
4.1.1 动态规划
(2)状态-系统在发展过程中某个阶段所有可能发生的情况 ,称为该阶段的状态。
(3)决策与策略-某阶段状态给定以后,从该状态演变到下 一阶段某个状态的选择称为决策;策略是一个决策序列。
(4)指标函数与目标函数-对于多阶段决策过程的某一阶段 ,从初始状态做出决策而转移到下一状态时所产生的效应的 衡量指标,称为该阶段的指标函数;目标函数是全过程指标 函数的最优值。
第 66页页
4.1 动态决策的基本原理
《决策理论与方法》
4.1.1 动态规划
最优性原理(the principle of optimality)也称为 Bellman原理,是R. Bellman提出的DP的基本原理, 其表述为:“一个过程的最优策略具有这样的性质, 即无论初始状态和初始决策如何,对于由前面的决策 所形成的状态来说,其后各阶段的决策序列必定构成 相应子过程的最优策略”。
《决策理论与方法》
第 1166页页
4.2 多阶段决策
《决策理论与方法》
4.2.2 多阶段决策问题的决策方法
例4-2-2 某公司考虑是否花10000元从某科研机关 购买某项技术,然后产销新产品。如果卖技术ቤተ መጻሕፍቲ ባይዱ可以
进一行般大a 批2 或生滞产销,可a 3 能三出种现,的其市收场益情矩况阵也见分下为表畅左销。为a 1 、了
第一,决策者需要做出时间上有先后之别的多个 决策;
第二,前一次决策的选择将直接影响到后一次决 策,后一次决策的状态取决于前一次决策的结果;
第三,决策者关心的是多次决策的总结果,而不 是各次决策的即时后果。
第 111页页
4.2 多阶段决策
《决策理论与方法》
4.2.1 多阶段决策过程的基本概念
(1)阶段-表示研究对象在发展过程中所处的时段或步骤。
(5) 多阶段决策过程-对整个过程进行分阶段决策,得到 一个最优策略,使系统总体指标函数达到最优值。
第 1122页页
4.2 多阶段决策
《决策理论与方法》
4.2.2 多阶段决策问题的决策方法 主要方法是决策树法和动态规划法。 分析步骤 1、根据具体问题适当划分阶段 2、确定各阶段的状态变量,寻找各阶段 间的联系 3、由后到前用逆序归纳法进行决策分析
(Decision Making Theory and Methods)
《决策理论与方法》
第四章 动态决策分析
第 22页页
学习目的
《决策理论与方法》
▪ 了解多阶段决策、序贯决策的概念及特点;
▪ 掌握动态规划与决策树方法及其在多阶段决策、 序贯决策中的应用。
第 33页页
本讲内容
《决策理论与方法》
更准确地了解市场情况,正式投产前可进行产品试销 ,但需是消费500元。试销状态可分为受欢迎 H 1 、一 般 H 2 或不受欢迎 H 3 三种,其条件概率分别见下表右 。如不买此项技术,把这笔经费应用在其他地方,在 同样的时期内,可获利15000元,那么公司应如何决 策?公司要确定:1)是否卖技术?2)如果买技术, 是否采取试销方式?3)如果不试销,应大批、中批 还是小批生产?如果试销又如何根据试销状态决定其 行动 。
4.1 动态决策的基本原理
《决策理论与方法》
4.1.1 动态规划
例4-1-1 最优线路问题。由水源地向城市的输水 线路需通过3个控制点,每个控制点均有两个可选方 案,每段线路的输水费用如下图所示。选出一条输水 线路,使得总输水费用最小。
6 E1
6
1 F1
3
G1 4
4
A
B
5
4
2
3
E2
5
F2
4
G2
S1 k = 1 S2 k = 2 S3 k= 3 S4 k = 4 S5
动态规划(dynamic Programming,DP)是解 决多阶段决策过程最优化的一种方法,其基本思路是 将多阶段决策过程转化为一系列相互关联的单阶段问 题,并依次求解。
DP是离散系统最优化的一种有效工具,目前动 态规划已广泛用于工业、农业、工程技术、资源、环 境、经济、社会等领域。
第 55页页
4.2.2 多阶段决策问题的决策方法
84
73
60
45
5元
10
12
15
20
25
84
73
60
45
6元
12
13
16
20
24
84
73
60
45
7元
14
14
16
18
18
84
73
60
45
8元
16
15
15
14
14
例4-2-1决策图
第 1155页页
4.2 多阶段决策
4.2.2 多阶段决策问题的决策 方法
例4-2-1 某公司考虑为某新产品定 价,该产品的单价拟从每件5元 、6元、7元、8元这四个价格中 选取其中之一,每年年初允许变 动价格,但幅度不能超过1元。 该公司预计该产品畅销只有五年 ,五年后将被淘汰,另据销售情 况的预测,在价格不同的情况下 各年的预计利润额见右表。
每一方案的各种自然状态。 2)将各状态概率及损益值标于概率枝上。 3)计算各方案期望值并将其标于该方案对应的状
态结点上。 4)进行剪枝,比较各个方案的期望值,并标于方
案枝上,将期望值小的(即劣等方案剪掉)所剩的最后 方案为最佳方案。
第 1100页页
4.2 多阶段决策
《决策理论与方法》
多阶段决策有以下三个特点,
第 1133页页
4.2 多阶段决策
《决策理论与方法》
4.2.2 多阶段决策问题的决策方法
多阶段决策问题包括确定型与随机型两大类,在 确定型多阶段决策中,目标值都是确定值,在风险型 多阶段决策中,目标值用期望值作为评价的标准。
下面分别以两个例子说明其决策方法。
第 1144页页
4.2 多阶段决策
《决策理论与方法》
第 77页页
4.1 动态决策的基本原理
《决策理论与方法》
4.1.2 决策树
决策树(decision tree)就是将决策过程各个阶段 之间的结构绘制成一张箭线图,每个决策或事件(即 自然状态)都可能引出两个或多个事件,导致不同的 结果。
决策树的构成有四个要素:1)决策结点;2)方案 枝;3)状态结点;4)概率枝。
第 88页页
4.1 动态决策的基本原理
4.1.2 决策树
方案枝 决策结 点
状态结点
方案枝
状态结点
《决策理论与方法》
概率枝 概率枝 概率枝 概率枝 概率枝 概率枝
第 99页页
4.1 动态决策的基本原理
《决策理论与方法》
4.1.2 决策树 决策树法的决策程序如下: 1)绘制树状图,根据已知条件排列出各个方案和
4.1动态决策的基本原理 4.1.1动态规划 4.1.2决策树
4.2多阶段决策 4.2.1多阶段决策过程的基本概念 4.2.2多阶段决策问题的决策方法
4.3序贯决策 4.3.1序贯决策的基本概念 4.3.2序贯决策的决策方法
第 44页页
4.1 动态决策的基本原理
《决策理论与方法》
4.1.1 动态规划
(2)状态-系统在发展过程中某个阶段所有可能发生的情况 ,称为该阶段的状态。
(3)决策与策略-某阶段状态给定以后,从该状态演变到下 一阶段某个状态的选择称为决策;策略是一个决策序列。
(4)指标函数与目标函数-对于多阶段决策过程的某一阶段 ,从初始状态做出决策而转移到下一状态时所产生的效应的 衡量指标,称为该阶段的指标函数;目标函数是全过程指标 函数的最优值。
第 66页页
4.1 动态决策的基本原理
《决策理论与方法》
4.1.1 动态规划
最优性原理(the principle of optimality)也称为 Bellman原理,是R. Bellman提出的DP的基本原理, 其表述为:“一个过程的最优策略具有这样的性质, 即无论初始状态和初始决策如何,对于由前面的决策 所形成的状态来说,其后各阶段的决策序列必定构成 相应子过程的最优策略”。
《决策理论与方法》
第 1166页页
4.2 多阶段决策
《决策理论与方法》
4.2.2 多阶段决策问题的决策方法
例4-2-2 某公司考虑是否花10000元从某科研机关 购买某项技术,然后产销新产品。如果卖技术ቤተ መጻሕፍቲ ባይዱ可以
进一行般大a 批2 或生滞产销,可a 3 能三出种现,的其市收场益情矩况阵也见分下为表畅左销。为a 1 、了
第一,决策者需要做出时间上有先后之别的多个 决策;
第二,前一次决策的选择将直接影响到后一次决 策,后一次决策的状态取决于前一次决策的结果;
第三,决策者关心的是多次决策的总结果,而不 是各次决策的即时后果。
第 111页页
4.2 多阶段决策
《决策理论与方法》
4.2.1 多阶段决策过程的基本概念
(1)阶段-表示研究对象在发展过程中所处的时段或步骤。
(5) 多阶段决策过程-对整个过程进行分阶段决策,得到 一个最优策略,使系统总体指标函数达到最优值。
第 1122页页
4.2 多阶段决策
《决策理论与方法》
4.2.2 多阶段决策问题的决策方法 主要方法是决策树法和动态规划法。 分析步骤 1、根据具体问题适当划分阶段 2、确定各阶段的状态变量,寻找各阶段 间的联系 3、由后到前用逆序归纳法进行决策分析