第11章 统计决策
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
后验概率(修正先验概率),并在此基础上对备选方案
进行评价的一种决策方法。 利用贝叶斯决策方法,将先验信息和补充信息结合 在一起进行分析判断,提高了决策的可靠性;同时还 可以对信息的价值及是否需要采集新的补充信息作出
科学的判断。
11 - 22
统计学 贝叶斯公式与后验概率的估计
STATISTICS
设某种状态θj 的先验概率为P(θj),通过调
11 - 20
统计学
STATISTICS
11.4
贝叶斯决策
一、什么是贝叶斯决策
二、贝叶斯公式与后验概率的估计
三、先验分析与后验分析
四、完全信息价值与补充信息价值 五、后验预分析
11 - 21
统计学
STATISTICS
什么是贝叶斯Bayses决策
自然状态的概率分:先验概率、后验概率;
贝叶斯决策,是利用补充信息根据贝叶斯公式来估计
EVPI是完全信息价值的期望值,maxi Q(Ai,θj )表示 各方案在状态θj 下的最大收益值,Q(A*,θj )表示 先验分析中的最佳方案在状态θj 下的收益值。EVPI
越大表明通过收集补充信息使决策效益提高的余地越
大。同时,它也代表了为取得该项情报可付出的代价 的上限。
11 - 26
统计学
STATISTICS
第11章 统计决策
11.1 统计决策的基本概念 11.2 完全不确定型决策 11.3 一般风险型决策
11.4 贝叶斯决策
11 - 1
统计学
STATISTICS
学习目标
1. 2. 3. 4. 5. 6.
统计决策的基本概念、基本工具和基本步骤; 完全不确定决策的基本准则及其使用场合; 风险型决策的基本准则及其应用; 贝叶斯决策的概念; 后验概率计算与后验分析; 完全信息价值与补充信息价值的概念及其应用
P 389 11.12
统计学 完全信息价值与补充信息价值(续)
STATISTICS
补充信息ek 的价值VAI的计算公式如下:
VAI(ek) = 先验EVPI - 后验EVPI(ek)
先验EVPI是根据状态的先验概率计算的完全信息价
值的期望值,后验 EVPI(ek)是在了解补充信息ek后,
利用根据该信息修正的后验概率计算的完全信息价值 的期望值。 VAI(ek)的取值与ek 有关。为了综合反映补充信息 的价值,还需计算补充信息价值的期望值EVAI。
二、各种准则的特点和适用场合
11 - 8
统计学
STATISTICS
完全不确定型决策的准则
(一)最大的最大收益值准则(乐观准则)
在决策时,先选出各种状态下每个方案的最大收益
值,然后再从中选择最大者,并以其相对应的方案作
为所要选择的方案。
(二)最大的最小收益值准则(悲观准则)
在决策时,先选出各种状态下每个方案的最小收益 值,然后再从中选择最大者,并以其相对应的方案作 为所要选择的方案。
收益矩阵的元素qij反映在状态θj下,采用行
动方案 Ai 得到的收益值。
这里所说的收益是广义收益指标。
收益是行动方案和自然状态的函数,可用下
式表示:
qij = Q (Ai , θj )
11 - 7
i =1,2,„,m; j=1,2,„n
统计学
STATISTICS
11.2
完全不确定型决策
一、完全不确定型决策的准则
2
V a r ( Ai ) E Q ( Ai )
统计学
STATISTICS
风险型决策的准则(续)
(三)最大可能准则(P 382 11.7)
在最可能状态下,可实现最大收益值的方案为最佳方案。
最大可能准则是将风险条件下的决策问题,简化为确定条件下
的决策问题。只有当最可能状态的发生概率明显大于其他状态 时,应用该准则才能取得较好效果。
11 - 23
统计学
STATISTICS
先验分析与后验分析
先验分析是利用先验概率进行决策,而后验 分析是利用后验概率作为选择与判断合适方案 的依据。很多时候,两种分析所得的结论是不 一致的。后验分析中不仅利用了先验信息,还 利用了补充信息。因此一般来说,只要补充信 息是准确的,后验分析的结论更为可靠。
(四)选择“最佳”或“满意”的方案
11 - 5 (五)实施方案
统计学
STATISTICS
收益矩阵表
表11-1 收益矩阵表
状态 概率
θ1 P1 q11 q21
„
θ2 P2 q12 q22
„
„
θn Pn q1n q2n
„
„ „ „
„
A1
方 案
A2 „ Am
qm1
qm2
„
qmn
11 - 6
统计学
STATISTICS
11 - 27
统计学 完全信息价值与补充信息价值(续)
STATISTICS
E V A I E V A I ( e k ) P (ek )
V A I (e
k 1
T
k
) P (ek )
P (
j 1
n
j
) P ( ek j )
ek 出 现 的 概 率 , 且
P (e
11 - 25
统计学 完全信息价值与补充信息价值(续)
STATISTICS
其计算公式如下:
E V P I E M ax Q Ai , j Q A , j i
n
j 1
P ( j ) M ax Q Ai , j Q A , j i
(四)满意准则(P 382 11.8)
利用这一准则进行决策,首先要给出一个满意水平。然后, 将各种方案在不同状态下的收益值与目标值相比较,并以收益值 不低于目标值的累积概率最大的方案作为所要选择的方案。利用 该准则的决策结果,与满意水平的高低有很大关系。 11 - 18
统计学
STATISTICS
利用决策树进行风险型决策
或者难以承受决策失误损失的场合。
最小的最大后悔值准则:适用于不愿放过较大的获利机会,
同时又对可能出现的损失有一定承受力的场合。
折衷准则和等可能性准则都是以各种方案的收益的期望值作
为选择方案的标准。折衷准则事实上是假定未来可能发生的 状态只有两种:即最理想状态和最不理想状态。前者发生的 概率是α,后者发生的概率是(1-α)。当α=1时,该准 则等价于乐观准则,而当α=0时,该准则等价于悲观准则。
对抗型决策:对策论/博弈论(多个主体) 非对抗型决策:决策论/决策分析(一个主体) 决策类型:确定型决策、不确定型决策
不确定型决策:完全不确定型(对状态概率一无所知)
风险型决策(对状态概率有所了解);
11 - 4
统计学
STATISTICS
统计决策的基本步骤
(一)确定决策目标
决策目标是在一定条件制约下,决策者希望达到的结果。反映决策目标 的变量,称为目标变量。
然状态的历史资料推算或按照随机实验的结果计
算出来的。
主观概率是决策者基于自身的学识和经验作
出的对某一事件发生可能性的主观判断。
11 - 15
统计学
STATISTICS
风险型决策的准则
(一)期望值准则(应用最广)
以各方案收益的期望值的大小为依据,来选择合适 的方案,一般采用期望收益值最大准则。
E Q ( Ai )
方案作为所要选择的方案。 P 375-377 11.1 11.2 11.3 11.4 11.5
11 - 12
统计学
STATISTICS
各种准则的特点和适用场合
最大的最大收益值准则:一般只有在客观情况确实很乐观,
或者即使决策失误,也完全可以承受损失的场合才采用。
最大的最小收益值准;适用于对未来的状态非常没有把握,
决策树是一种将决策问题模型化的树形图。 决策树由决策点、方案枝、机会点、概率枝、
结果点组成。
利用决策树对方案进行比较和选择,一般采用
逆向分析法,即从树形结构的末端的条件结果开
始,从后向前逐步分析。 决策树适用于求解复杂的多阶段决策问题。
11 - 19
统计学
STATISTICS
图11-2
例 11-9 的决策树图
种状态下每个方案的最大后悔值,然后再从中选择最
小者,并以其相对应的方案作为所要选择的方案。
11 - 10
统计学 完全不确定型决策的准则(续)
STATISTICS
(四)折衷准则
根据经验和判断确定一个乐观系数α(0≤α≤1),
以α和1-α分别作为最大收益值和最小收益值的权数,
计算各方案的期望收益值E(Q(ai))
收益的期望值只反映了一种平均趋势,还要考虑方
差的大小,方差大则风险大。因此在期望值达到一定
数额的前提下,以变异系数较低的方案作为所要选择
的方案。方差Var(Ai)和变异系数V的计算公式如下:
V a r Ai Vi
11 - 17
q
j 1
n
i, j
E Q ( Ai ) p j i 1, 2 , , m
k 1
T
k
)=1
EVAI是判断收集补充信息是否有利的标准。在收集 补充信息之前,应将EVAI与收集补充信息的费用加以
比较,只有当收集补充信息的费用小于EVAI时,平均
来看,收集补充信息才有利可图。
11 - 28
P 391
11.13
统计学
STATISTICS
后验预分析
在正式进行补充信息的调查之前,需要先估 算完全信息价值的期望值和补充信息价值的期 望值,将其与收集补充信息所需的费用和收益 相对比,就是否值得进一步收集补充信息的问 题作出判断,并选择最佳的收集补充信息的方 案。这一环节被称为后验预分析。
11 - 2
统计学
STATISTICS
11.1
统计决策的基本概念
一、什么是统计决策
二、统计决策的基本步骤
三、收益矩阵表
11 - 3
统计学
STATISTICS
什么是统计决策
瓦尔德(A.Wald)1950年发表专著<统计决策函数> 广义:所有利用统计方法和统计信息的决策;
狭义:研究非对抗型和不确定型决策问题的科学的 定量分析方法。
11 - 9
统计学 完全不确定型决策的准则(续)
STATISTICS
(三)最小的最大后悔值准则
后悔值是由于决策失误而造成的最大可能的收益值
与实际收益值之差。方案Ai 在状态θj 下的后悔值,可
按下式计算:rij = max Q (Ai ,θj ) - qij ≥0 max Q(Ai ,θj )是在第j 种状态下,正确决策有可 能得到的最大收益,qij是收益矩阵的元素。 决策准则:应在求出后悔矩阵的基础上,先选出各
E(Q(Ai)) =α max{ qij } + (1-α) min {qij }
并以期望收益值最大的方案作为所要选择的方案。 注意:此时只考虑两种极端状态。
11 - 11
统计学 完全不确定型决策的准则(续)
STATISTICS
(五)等可能性准则
该准则假定各种状态可能出现的概率相同,在此基
础上求各方案收益的期望值,并以期望收益值最大的
查获得的补充信息ቤተ መጻሕፍቲ ባይዱek ,θj 给定时ek的条件概
率为P(ek|θj) ,则在给定信息ek的条件下,θj
的条件概率即后验概率可用以下公式计算
P ( ek ) P ( j ) P ( e k j ) P 387 1 1 .1 0
j
n
P ( j ) P ( e k j )
j 1
(二)拟定备选方案
备选方案是决策者实现目标的各种可能途径。备选方案中所调控的变量 称为行动变量。所有备选方案的集合称为行动空间。
(三)列出自然状态
自然状态是指实施行动方案时,可能面临的客观条件(天气的晴雨)。 所有可能出现的状态的集合称为状态空间,而相应的各种状态可能出现的 概率的集合称为状态空间的概率分布。
P 388 11.11
11 - 24
注:先验分析:前面介绍的准则
统计学 完全信息价值与补充信息价值
STATISTICS
完全信息,是指在对某一问题进行决策时, 对于所有可能出现的状态都可以提供完全确切 的情报。完全信息的价值,可以由掌握完全信 息前后,所采取的不同行动方案的收益值的差 额来表示。不同状态下收益值的差额有所不 同,所以用收益值差额的期望值来综合反映完 全信息的价值(EVPI)。
q
j 1
n
i, j
Pj
( i 1, 2, , m )
式中,E(Q(Ai))是方案i 的收益的期望值,是方案i 在j 状态出现时的收益值;Pj是j 状态出现的概率。
注意: 期望收益,只是平均意义来说,并不是真实的收益.
11 - 16
统计学
STATISTICS
风险型决策的准则(续)
(二)变异系数准则(离散系数 P 381 11.6)
11 - 13
统计学
STATISTICS
11.3 一般风险型决策
一、自然状态概率分布的估计
二、风险型决策的准则
三、利用决策树进行风险型决策
11 - 14
统计学
STATISTICS
自然状态概率分布的估计
风险型决策不同于完全不确定型决策,它是在
估计出状态空间的概率分布的基础上进行决策.
客观概率是一般意义上的概率,通常是由自