决策理论
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
d2
d21
d22
0.25 θ1
0
0 -10000
0.02 θ2 0.73 θ3
0 -60000 -60000
0
0
0
先不考虑搬走费用及筑护堤费用,放到决策树 中。
决策树:
0
d1 -1700
1
2 -1800
d2
-1700
3
0
d21 -500
d22
-1200 θ1(0.25) 4 θ2(0.02) θ3(0.73)
2、决策(方案):是一种行动,一种方案, 指两个或两个以上可供选择的方案。记为 dj(j=1,2,…,n)
3、状态(事件):指决策实施以后可能遇到 的客观状态。例如服装投入市场以后的销售 量大、中、小。记为θ i(i=1,2,…,m)
4、状态概率:是各个状态可能发生的概率(可 能性大小的估计),为主观的估计,根据历史 数据、相关资料、经验得到。记为P(θ i)
在结局结点后标明损益值;
各结点的标号从左至右,从上到下依次标出;
决策树起始于决策结点,结束于结局结点。
3、决策步骤: 计算损益表;
绘制决策树;
从右至左计算各方案的期望值,将计算结果 标在决策分支右端状态结点处;
根据最大收益期望值准则对各方案期望值进 行比较,删去期望值小的方案——“剪支”, 留下来的分支即为最优方案;
1、后悔值(机会损失值,OL):并非决策
者受到的具体损失,而是未采用最优决策以
至于能得而未得到的收益。
2、后悔值表(机会损失表)
dj θ i rij
其中, rij
max j
u
i
j
uij
即在每个状态下对各方案的收益值取最
大值,再用它减去该状态下的各收益值,从
而得到相应的后悔值。
3、原则:min-max原则(坏中取好)
1
θ3
6
0
评价值
6
40
d*=d1 f(d*)=6
思考:若已知损失表,则后悔值如何计算?
rij
u ij
min j
ui j
第三节 风险型决策
一、期望值准则
1、思想:通过损益值或机会损失值及状态 概率求出各方案相应的期望值,从而寻找最 优方案。
2、原则:最大收益期望值准则
最小机会损失期望值准则
θ1(0.25) -3700
5 θ2(0.02) θ3(0.73)
0 -60000 0 -10000 -60000 0
最优方案为不搬走施工机械并且筑护堤,花费 1700元。
三、贝叶斯决策
1、基本思想: 在风险型决策中,对自然状态发生的概率
(先验概率)估计的正确程度直接影响决策 的结果; 为了更好地进行决策,在条件许可的情况下 往往需进一步补充新信息(B),可以通过调 查、试验、咨询得到,但需支付一定费用; 根据补充信息重新计算(贝叶斯公式)概率 得到新概率(后验概率); 利用新概率来进行决策。
第二章 决策理论
第一节 概述
决策: 起源于英语”Decision Making”,意思为 “决策制定”。中文中理解为“决定策 略”,可以指重大问题的决策,也可以指 日常工作、生活、学习中的决策。
行为的选择。
决策的制定强调的是选择最优决策方案的 过程而不是结果。
一、决策问题的组成
1、决策者:可以是某一个人,也可以是某一 个团体。例如股份制公司中的董事会;国企 中的厂长。
2、原则:折衷原则
3、公式:f (d*) 4、步骤:
max{ j
max i
u
ij
(1
)
min i
u
ij}
对每一个方案在各状态下的最大收益值×α+ 在各状态下的最小收益值×(1-α)作为该方 案的评价值;
选择各方案中评价值最大的方案为最优方案。
例:α =0.4
dj θi
200 300
x1, x 2 0
决策: X=(x1,x2)T
状态: 给定的三种资源的限制。
损益: 决策方案对应的总收入Z。
2、不确定型决策: 状态不止一个且状态已知,每个方案在不同 状态下的损益值可以计算出来的决策问题。
具体有两种类型:
完全不确定型决策:状态概率未知;
2、贝叶斯决策解决的问题:
如何根据补充信息对原有的状态概率进行修 正从而得到后验概率,并用其进行决策;
补充新信息是否值得。
3、决策步骤:
(1)先验分析:在没有进行补充信息之前, 根据先验概率进行决策(期望值准则)得到 最大收益期望值,记为EMV*(先)。
计算损益表;
m
计算各方案的收益期望值;E(d j) P(i )uij
选择最大收益期望值。
max j
E(d
j
)
i1
EMV
*
(先)
例:
dj P (θi) θi
d1
d2
0.2
θ1
80
40
0.5
θ2
20
7
0.3
θ3
-5
1
E(dj)
24.5
11.8
EMV *(先) 24.5
(2)预验分析:对补充信息是否值得作出 分析,从而决定是否补充新信息。
完全信息:能够准确无误地预报将发生某种 状态的信息。即这种信息预报某种状态发生, 则在实际中必定出现这种状态。
max j
min i
u
i
j
4、步骤:
对每一个决策方案在各个状态下的收益值取 最小值作为该方案的评价值;
选择各方案中评价值最大的方案作为最优方
案。 例:
dj θi
d1
d2
θ1
80
40
θ2
20
7
θ3
-5
1
评价值
-5
1
d*=d2 f(d*)=1
二、乐观法
1、思想:决策者对事物抱有乐观和冒险的 态度,决策是在各种最好的可能结果中选 择最好的方案为最优决策方案。
f
(d*
)
max j
E(d
j
)
4、步骤:
求出各状态发生的概率;
计算各方案的收益期望值;
选择收益期望值最大的方案为最优方案。
例:
dj
P (θi) θi
d1
d2
1/3
θ1
80
40
1/3
θ2
20
7
1/3
θ3
-5
1
E(dj)
95/3
16
d*=d1 f(d*)=95/3
五、最小后悔值法
用决策分析的术语描述该问题。
解:
决策:
d1:增加设备投资, d2:维持现状; 状态:
θ1:销售量大,θ2:销售量中,θ3:销售量小
损益表:
dj θi
d1
d2
θ1
80
40
θ2
20
7
θ3
-5
1
二、决策问题的分类
1、确定型决策: 只可能有一种确定的状态,每个方案在这个 状态下的损益值可以计算出来。 例如线性规划问题就是一个确定型的决策问 题。
例:
dj P (θi) θi
d1
d2
0.2
θ1
80
40
0.5
θ2
0.3
θ3
E(dj)
20
7
-5
1
24.5
11.8
d*=d1 f(d*)=24.5
机会损失表:
P(θi) θi
dj
d1
0.2 θ1
0
0.5 θ2
0
0.3 θ3
6
EOL(dj)
1.8
d2
40 13 0 14.5
d*=d1 f(d*)=1.8
风险型决策:状态概率已知(可以事先计算 或估计出来)
第二节 完全不确定型决策
决策的前提已知收益表(损失表)
一、悲观法
1、思想:决策者对事物抱有悲观和保守的 态度,决策是在各种最坏的可能结果中选择 最好的方案为最优决策方案。
2、原则:max-min原则(坏中取好)
3、公式:
f
(d*
)
d2 40 7 1
E(d1)=24.5 E(d2)=11.8 d*=d1,f(d*)=24.5
某工程队承担一座桥梁施工任务,由于施工 地区夏季多雨需停工3个月,在停工期间施工 队可将施工机械搬走或留在原处。若搬走需 搬运费1800元,若留在原处则有两种方案, 一种为花500元筑护堤防止河水上涨发生高水 位侵袭,另一种不筑护堤。若不筑护堤发生 高水位侵袭时损失1万元;若下暴雨发生洪水 时则无论是否筑护堤施工机械留在原处都将 受到6万元损失。据历史资料,该地区夏季高 水位发生概率25%,洪水发生概率2%。试用 决策树法进行决策。
2、原则:max-max原则(好中取好)
3、公式:
f
(d*
)
max j
max i
u
i
j
4、步骤:
对每一个决策方案在各个状态下的收益值取 最大值作为该方案的评价值;
选择各方案中评价值最大的方案为最优方案。
例:
dj θi
d1
d2
θ1
80
40
θ2
20
7
θ3
-5
1
评价值
80
40
d*=d1 f(d*)=80
与悲观法的结果完全相反
三、乐观系数法
1、思想:决策者对事物既不悲观也不乐观, 而是用一个乐观系数(折衷系数)α来从中平 衡,进行决策。( 0≤ α ≤1) α是根据历史数据或经验估计而得。 当情况比较乐观时α应取的大一些; 当情况比较悲观时α应取的小一些。 α=1时即为乐观法; α=0时即为悲观法。
每个状态应有对应的一个状态概率,且P(θ 1)+ P(θ 2) +…+ P(θ m) =1
5、结局(损益、后果):指某个决策方案dj实 施以后遇到某个状态θ i时可能会带来的损益值。 记为Uij 损益包括收益(利润)和损失(成本)。
通常用二维表(矩阵)的形式表示——损益表 (损益矩阵)
P(θi) θi dj
d1
d2
…
P(θ1) θ1
u11
u12
…
P(θ2) θ2
u21
u22
…
… ……
…
P(θm) θm
um1 um2
…
dn u1n u2n …
umn
表中损益值的个数为m×n 注意:行、列所表示的含义。
例:某厂需要对明年的生产投资做出决策: 是增加设备投资还是维持现状。该厂产品明 年在市场上的销售情况可能有三种:销售量 大、中、小。若增加设备投资遇到各种情况 后的收益(万元)分别为80、20、-5;若维 持现状遇到各种情况后的收益(万元)分别 为40、7、1。
解:为两个阶段的决策问题
方案:第一阶段:d1施工机械搬走;d2不搬走
第二阶段:不搬走时d21筑护堤;d22不筑护堤
状态:θ 1高水位; θ 2洪水; θ 3其它水位
状态概率:P(θ 1)=0.25; P(θ 2)=0.02;
P(θ 3)=0.73
损益表:
P(θi)
dj θi
d1
结局结点:用 表示,表示某个方案在某个 状态下的结局(损益值),无分支,位于树的 末梢处。
例:
d1
2
1
d2
3
注意问题:
θ 1 P(θ 1)
u11
θ 2 P(θ 2)
u21
θ 1 P(θ 1) u12
θ 2 P(θ 2)
u22
在决策分支上标明决策方案;
在状态分支上标明状态及状态概率;
两种准则所得的结果完全一致,符合客观规律。 Nhomakorabea 二、决策树
1、思想:用树形结构的形式来描述决策问题 的决策过程及结果。
2、结构:决策树由结点和分支组成 决策结点:用 表示,引出的分支称为决策 分支,每个分支表示一个决策方案;
状态结点:用 表示,引出的分支称为状态 分支,每个分支表示一种自然状态;
4、公式:f (d*)
5、步骤:
min j
max i
rij
计算后悔值表;
对每一个方案在各状态下的后悔值取最大 值作为该方案的评价值;
选择各方案评价值最小的方案为最优方案。
例:收益表
后悔值表
dj θi
d1
d2
dj θi
d1
d2
θ1
80
40
θ1
0
40
θ2
20
7
θ2
0
13
θ3
-5
例:某厂计划生产甲、乙两种产品,决定生 产方案,使总收入最大。
甲
煤(t) 9
电(kw.h) 4
油(t) 3
单位价格 (万元)
7
乙 资源限量 4 360 5 200 10 300
12
maxZ 7x1 12x2
9x1 4x2 360
34xx11
5x2 10x2
m
3、公式:f
(d*
)
max j
[E(d
j
)]其中E(d
j
)
P(i )uij
i1
m
f (d*)
min j
[EOL
(d
j
)]其中
EOL
(d
j
)
i1
P(i )rij
4、步骤:
计算损益表或机会损失表;
计算各方案的收益期望值或机会损失期望值;
选择收益期望值最大或机会损失期望值最小 的方案为最优方案。
将最大的期望值标在决策结点处。
例:收益表:
dj
P (θi) θi
d1
0.2
θ1
80
0.5
θ2
20
0.3
θ3
-5
决策树:
24.5
θ 1 (0.2)
80
24.5 d1
2
θ 2 (0.5)
20
θ 3 (0.3)
-5
1
11.8
d2
3
θ 1 (0.2) θ 2 (0.5)
40 7
θ 3 (0.3)
1
d1
d2
θ1
80
40
θ2
20
7
θ3
-5
1
评价值
29
16.6
d*=d1 f(d*)=29
四、等可能法
1、思想:决策者认为各状态发生的概率均 相同,并按照最大期望值准则进行决策。
2、原则:平均原则
3、公式:
P(i )
1 (i 1,2,...,m) m
m
E(d j) P(i )uij ( j 1,2,..., n) i1