运筹学-第3版-课件-第9章 决策分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

am
rm1
rm 2
表9.1.1

rmn
第10页
风险型决策分析

进行风险型决策分析的基本条件和方法
基本条件 风险型决策分析方法

决策树
基本概念 例题
第11页
进行风险型决策分析的基本条件
风险型决策是指决策者对未来的情况无法做出肯 定的判断,但可以借助于统计资料推算出各种情 况发生的概率。 被决策的问题应具有下列条件: (1) 存在决策者希望达到的一个明确目标; (2) 存在着两种或两种以上的自然状态; (3) 存在着可供决策者选择的不同方案; (4) 可以计算出各种方案在各种自然状态下 的报酬值; (5) 可以确定各种自然状态产生的概率。
:
max{min{R(a, x)}}
aA xS
第25页
基本方法—乐观系数法

乐观系数法
乐观系数法也称 Hurwiez 决策法。 Hurwiez 认为决策者不应该是 完全乐观的。否则,就仿佛生活在一个完全理想的世界中。为了克 服完全乐观的情绪,他引入了乐观系数的概念。这就意味着决策者 不但要考虑最大和最小的报酬值, 而且要根据一些概率因素权衡它 们的重要性。用这种方法进行决策分析首先确定一个乐观系数 , 使 0 1 。他表示决策者的客观程度。当 0 时,决策者感 到完全悲观。当 1 时,决策者感到完全乐观。然后认为最有利 状态发生的概率为 ,最不利状态发生的概率为 1 。决策准则 为
RV (a, x) max{R(a, x)} R(a, x)
aA
后悔值法的决策准则是在所有方案的最大后悔值中选取最小值所 对应的方案为最优方案,即决策准则为
:
min{max{R(a, x)}}
aA xS
第27页
基本方法—等可能法

等可能法
等可能法也称 Laplace 决策法。这个方法假定各种自然状态 都有相同的机会发生,即它们发生的概率都相同。这样就把一个不 确定型决策化为一个风险型决策来进行分析。 选择期望报酬值最大 的方案为最优方案。 假定状态集 S {x1 , x2 ,..., xn } ,决策集 A {a1 , a2 ,..., am } ,报 酬函数为 R(ai , x j ) ,则决策准则为
E ( R(a, x)) p( x) R(a, x)
xS
当状态变量 x 是连续型随机变量且其概率密度函数是 p ( x) 时,则
E ( R(a, x)) p( x) R(a, x)dx
S
在第 6 步中决策准则为
:

max{E(R(a, x))}
aA
:
min{E( R(a, x))}
利润
种蔬菜 种小麦 种棉花
如果用最大可能法我们自然会选择中棉花, 而用期望值法我们会发现,种棉花的期望值 最大,为5000元,我们也会选择种棉花。
第16页
决策树
决策树是如图9.2.1所示的 一棵水平的树。图中的方 框,即树的根,成为决策 点,从该点引出的m个分 支称为方案枝,表示各种 可行方案。各方案枝末端 的圆圈称为状态点。从该 点引出的几个分支称为概 率枝,上面标出每个状态 发生的概率。概率枝的末 端的三角符号表示报酬, 它后面的数字表示某个方 案在某种状态下的报酬值。
:
1 n { R(ai , x j )} min n j 1 ai A
第28页
例题
例1 电视机厂,99年产品更新方案: A1:彻底改型 A2:只改机芯,不改外壳 A3:只改外壳,不改机芯 问:如何决策?
第29页
收益矩阵
事件
方案
高 S1 20
中 S2 1
低 S3(万元) -6
A1
A2
A3
:
max{ max{R(a, x)} (1 )min{R(a, x)}}
aA xS xS
第26页
基本方法—后悔值法

后悔值法
后悔值法也称 Savage 决策法。 Savage 指出决策者在他已经做出 了决策并且自然状态发生了以后,可能会后悔。他可能希望选一个 完全不同的决策方案。于是 Savage 提出了一种使后悔值尽量小 的决策分析方法,即后悔值法。采取某种方案的后悔值等于某个状 态下的最大报酬值减去某方案的报酬值。即在状态 x 下方案 a 的 后悔值为
运 筹 学 课 件
运 筹 帷 幄 之 中 Decision Analysis
决 胜
决策分析
千 里 之 外
第 1页
决策分析

决策分析的基本概念


风险型决策分析 不确定型决策分析
效用函数和信息的价值
第 2页

决策分析的基本概念

决策分析的基本概念
决策的定义 决策分类 基本概念

决策的数学模型
第 3页
9
6
8
5
0
4
第30页
(一) 乐观法(最大最大法则)
S1 A1 A2 A3 20 9 6
S2 1 8 5
S3 -6 0 4 选A1
Vi =max{Vij } 20 9 6
maxVi =20
i
第31页
(二) 悲观法(最大最小法则)
S1 A1 A2 20 9
S2 1 8
S3 -6 0
Vi =min{Vij }
:
max{R(a, x
aA
j0
)}

min{R(a, x
aA
j0
)}
第14页
决策分析方法—期望值法
期望值法是进行风险型决策分析常用的一种方法。 用这种方法进行 决策是选择期望报酬最大(或最小)的方案为最优方案。与最大可 能法比较,进行决策分析的前面 4 步相同。在第 5 步中列出决策 表后,要计算每个方案的期望报酬值 E ( R(a, x)) 。当状态变量 x 是 离散型随机变量时 ,则
第18页
例题
S1 S2
电视机厂试生产三种
电视机Ai(i=1,2,3)。 A1 A2
0.4 0.6
100 -20 75 10
市场大、小Sj (j=1,2)。
生产哪种?
A3
50
30
第19页
例题的解(1)
解:
100 A1 2 0.6 0.4 -20 75 10 0.4 4 0.6 30
第20页
1
A2
A3
3
0.6
50
例题的解(2)
28 2 A1 38 A2 36 3 0.4 0.6 100
0.6
-20 75
1
A3
38 4 0.4 0.6
10
50
30
第21页
不确定型决策分析
不确定型决策分析的条件
不确定型决策分析的基本方法 乐观法 悲观法 乐观系数法 后悔值法 等可能法 例题
第22页
不确定型决策分析的条件
x3 , p ( x3 ) x1 , p( x1 ) x2 , p ( x2 )

am

x3 , p ( x3 ) x1 , p( x1 ) x2 , p ( x2 )

x3 , p ( x3 )
图9.2.1
第17页
决策树
用决策树来表示一个风险型决策模型,比 较直观,便于对问题未来的发展情况进行 预测,能随意删去非最优方案分支。在增 加新的情况时也可随时增添新的分支。利 用决策树进行决策分析的方法称为决策树 法,它实际上是期望值法的图解形式。
第 8页
基本概念—决策准则

决策准则 决策者为了寻找最佳决策方案而采取的准 则称为决策准则,记为 。最优值是目标的数 目标志。最优值对应的方案称为最优方案。一 般选取决策准则使收益尽可能大而损失尽可能 小。
第 9页
决策的数学模型
R(ai , x j ) rij 。 A {a1 , a2 ,..., am}, 设 S {x1 , x2 ,..., xn } , 令 p( x j )
不确定型决策分析是指决策者对未来的情况 虽有一定了解,但又无法确定各种自然状态发生 的概率。这时的决策分析就是不确定型决策分析。 进行不确定型决策分析时,被决策者的问题应具 有下列条件: (1)存在决策者希望达到的一个明确目标; (2)存在着两个或两个以上的自然状态; (3) 存在着可供决策者选择的不同方案; (4)可以计算出各种方案在各种自然状态下 的报酬值

第12页
决策分析方法—最大可能法

最大可能法 最大可能法是将风险型决策化为确定性决策而进 行决策分析的一种方法。一个事件的概率越大, 它发生的可能性就越大。基于这种思想,在风险 型决策中选择一个概率最大的自然状态进行决策, 把这种自然状态发生的概率看作1,而其他的自然 状态发生的概率看为0,这样,认为系统只存在一 种确定的自然状态,用确定型决策分析方法来进 行分析。
第 5页
基本概念—状态集

状态集 把决策的对象统称为一个系统。系统 处于不同的状况称为状态。它是由不可控 制的自然因素所引起的结果,成为自然状 态。把自然状态数量化得到一个状态变量, 也成为随机变量。所有的自然状态所构成 的集合称为状态集,记为S={x},其中x是 状态变量。系统中每种状态发生的概率记 为P(x)。
第13页
最大可能法步骤
第 1 步: 明确决策目标,收集与决策问题有关的信息; 第 2 步:找出可能出现的自然状态 S {x} ,并根据有关资料和经 验确定各种自然状态发生的概率 p ( x) ; 第 3 步:列出可供选择的不同方案 A {a} ; 第 4 步:确定报酬函数 R (a, x) ; 第 5 步:建立决策模型,通常列出决策表。计算出每个方案在概 率最大的自然状态,如 x j0 ,下的报酬值 R(a, x j0 ) ; 第 6 步:确定决策准则,找出最优方案。决策准则通常为
第 6页
基本概念—决策集

决策集 为了达到预想的目标提出的每一个行 动方案成为决策方案,简称为方案。将其 数量化后成为决策变量,记为a。决策变量 的全体构成的集合称为决策集,记为A={a}。
第 7页
基本概念—报酬函数

报酬函数
报酬函数是定义在 A S 上的一个二元实值 函数 R(a, s) 。根据决策问题的实际意义, 报酬函数 R(a, s ) 可以表示在状态 x 出现时, 决策者采取方案 a 所得到的收益值或损失 值。
表示状态 x j 产生的概率。通常可用表 9.1.1 的决策表来表示一个 决策问题的数学模型。
R ( a, x ) S
x1
x2


xn
p ( xn ) r1n r2 n

A
a1 a2

p ( x1 ) p ( x2 ) r11 r12 r21 r22
aA
第15页
例题
例9.2.1 某农场要在一块地里种一种农作物, 有三种可供选择的 方案,根据过去的经验和大量调查研究发现天气干燥、 正常、多雨的概率分别为 0.2,0.7,0.1。每种农作物 在三种天气下的获利情况如表 9.2.1 所示。 天气干旱 天气正常 天气多雨 0.2 1000 2000 3000 0.7 4000 5000 6000 0.1 7000 3000 2000
j
-6 0 maxVi =4
i
A3
6
5
4
选A3
4
第32页
(三)、乐观系数法 加权系数α(0 α1) max{α(maxVij )+(1-α)(minVij )}
i j j
第23页
基本方法—乐观法

乐观法
决策者从最乐观的观点出发,对每个方案 按最有利的状态发生来考虑问题,即求出 每个方案在各种自然状态下的最大报酬值 ,然后从中选取最大报酬值最大的方案为 最优方案,即决策准则为:
:
max{max{R(a, x)}}
aA xS
第24页
ห้องสมุดไป่ตู้
基本方法—悲观法

悲观法
悲观法也称 Wald 决策法。决策者从最保守的观点出发,对客观 情况做最坏的估计,对每个方案按最不利的状态发生来考虑问题, 然后再最坏的情况下选出最优方案。用这种方法进行决策分析,首 先计算出每个方案在各种自然状态下的最小报酬值, 然后从中选出 最大者对应的方案为最优方案,决策准则为
x1 , p( x1 ) x2 , p ( x2 )

R(a1 , x1 ) R(a1 , x2 ) R(a1 , xn ) R(a2 , x1 ) R (a2 , x2 ) R ( a2 , x n ) R (am , x1 ) R(am , x2 ) R(am , xn )
a1 a2

决策的定义
决策是指人们为了达到某一目标从几 种不同的行动方案中选出最优方案作出的 抉择。决策分析研究从多种可供选择的行 动方案中选择最优方案的方法。 一个完整的决策过程通常包括以下几 个步骤:确定目标,收集信息,制定方案, 选择方案,执行决策并利用反馈信息进行 控制。
第 4页
决策分类
确定性决策 不确定性决策 非确定性决策 风险决策
相关文档
最新文档