现代信息决策方法-贝叶斯决策

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

m a(a a , )x Q (a o,p) t
称为在状态变量为 时的完全信息值 H i 的价值。
如果补充信息值
H
对每一个状态值
i
都是完全信息值,则完
全信息值 H i 对状态 的期望收益值称为完全信息价值的期望值
简称完全信息价值,可表示为 EVPI 。
2.完全信息价值的计算
值 H 的完全信息价值 EVPI,可以通过下式对 求数学期望
E(a2)0
最大期望收益值 E(aop|tH1)7.937
当 HH2时
E ( a 1 ) 0 . 2 1 3 0 . 5 5 6 1 0 0 . 2 9 ( 6 5 ) 2 . 5 51
E(a2)0
最大期望收益值 当 HH3时
E(aop|tH 2)2.519
E ( a 1 ) 0 . 0 1 5 0 . 1 5 5 1 9 0 . 7 ( 9 6 4 ) 3 . 4 65
似然矩阵
假定得到市场调查表的费用为0.6万元,试问: (1)补充信息(市场调查表)价值多少? (2)如何决策可以使利润期望值最大?
解:第一步,验前分析。该厂生产新产品有两种方案,即生 产方案 (a1) 、不生产方案 (a2),产品市场有三种状态,即好(1)、
中(2)、坏 (3),状态的先验概率为
于是,
得到。即
E E m V a , ) Q ( a o P a , ) p E ( x t I a , m ) ( E ( Q ) ( a o , ) a p)
从上面的公式可以看出,完全信息价值 EVPI,实际上是掌 握完全信息与未掌握完全信息时,决策者期望收益值的增加量。
例2 某厂生产某种产品,若市场畅销,可以获得利润15 000元,若市场滞销,将亏损5 000元。根据以往的市场调查情 况,该产品畅销的概率为0.8,滞销的概率为0.2。为了准确地掌 握该产品的销售情况,可以聘请某咨询公司进行市场调查和分 析,它对产品畅销预测的准确率为0.95,滞销预测的准确率为 0.9。
➢该企业进行市场调查,如果销路好,就应该选择 生产;
➢如果销路情况中等,也应该生产;如果销路差, 就选择不生产。
看课本P40例3,实验课带课本
(三)贝叶斯决策分析的信息价值
从理论上分析,可以利用补充信息来修正先验概 率,使决策的准确度提高,从而提高决策的科学 性和效益性。如果获得情报后收益比花费的代价 大,那么获取情报就是正确的决策,如果收益抵 不上代价,那么显然,就不必做试验了。
当 H 2 发生时,P ( H 2 ) 0 . 0 0 . 8 5 0 . 9 0 . 2 0 0 . 0 0 . 1 4 0 . 2 8
P (1|H 2 ) 0 .0 0 .2 5 0 .8 2 0 .18 8P ( 1 2|H 2) 0 .1 0 . 7 0 .2 8 0 .82 1
进行风险决策最常用的数学方法是Bayes(又
称期望值)分析法。
贝叶斯决策
❖根据已有信息和经验估计出的概率(分布) 叫做先验概率(分布)。
❖为提高先验概率分布的准确性和客观性,人 们常设计一些抽样调查,质量检验等方法, 借以收集新信息来修正先验概率分布。被修 正后得到的概率分布叫做后验概率分布。
贝叶斯决策
如果咨询公司预测市场畅销,那么是否应该生产?如果预测 为滞销,是否应该进行生产?
解:第一步,验前分析。先验分布如下表所示
先Байду номын сангаас分布表
每种方案的期望收益:
E ( a 1 ) 1 0 5 0 0 . 8 5 0 0 0 0 . 2 1 01 00
E(a2)0 所以应该进行生产。
第二步,预测分析 现在用 H1 和 H 2分别表示咨询公司提供畅销和滞销这两个情 报,根据给定的条件,其概率分布如表所示。
取得最大利润期望值的最优策略是进行市场调查,如果调 查结果是新产品销路好或中等,则进行生产,否则就不生产。
第三步,验后分析。
➢ 综上所述,如果市场调查费用不超过1.56万元, 就应该进行市场调查,从而使企业新产品开发决策 取得较好的经济效益。如果市场调查费用超过1.56 万元,就不应该进行市场调查。
获得补充信息用已发生的随机事件 H 或已取值的随机变量
表示,称 H或 为信息值。信息值的可靠程度用在状态变量
的条件下,信息值 H 的条件分布用 P(H) 表示,在离散的
情况下,取 n个值 j(j1,2, ,n) H取m个值 H i(i1 ,2, ,m )
则条件分布矩阵
p(H11) p(H12)p(H1n)
或者当状态值≠ 时0 ,总有
P(|Hi)0
则称信息值 H i 为完全信息值。
设决策问题的收益函数为QQ (a,),其中 a为行动方案,为
状态变量,H
为完全信息值,掌握了
i
H
i
的最满意行动方案为
a(Hi
)
其收益值为 Q (a(H i),)ma,x ),(验前最满意行动方案aopt 的收
益值为 Q(aop,t) ,掌握了完全信息值 H i 前后收益值的增加量.
p(H)
后验概率 n p(H/i) p(i)
p(H/j) p(j)
j1
包含的意义? ( i 1,2,,n; p(H) 0)
p(i) 为事件 i 的先验概率,而称p(i /H)为事件 i 的后验概率.
(二)贝叶斯决策的基本方法
设风险型决策问题的状态变量为 ,通过市场调查分析所
❖风险型决策的基本方法是将状态变量看成随机 变量,用先验状态分布表示状态变量的概率分布 ,用期望值准则计算方案的满意程度。但是在实 际生活中,先验概率分布往往与实际情况存在误 差。
❖为了提高决策质量,需要通过市场调查, 来收集有关状态变量的补充信息,对先验 分布进行修正,然后用后验状态分布来决 策,这就是贝叶斯决策。
j
|
P(H1| H1)
j)P(
P(H 1)
j)
j1,2,3
计算后验概率
当 H1 发生时,P ( H 1 ) 0 . 9 0 . 8 5 0 . 1 0 . 2 0 0 . 7 0 . 0 6 0 . 7 28
P (1|H 1)0 .9 0 .7 5 0 .8 8 0 .97 44 P (2|H 1)0 .1 0 . 7 0 .2 8 0 .02 65
充分信息,用贝叶斯公式求出在信息值 H或 发生的条件下,
状态变量 的条件分布 p( H)。经过修正的状态变量 的
分布,称为后验分布,后验分布能够更准确地表示状态变量 概率分布的实际情况。 其次,利用后验分布对风险型决策问题 做出决策分析,并测算信息的价值和比较信息的成本,从而提 高决策的科学性和效益性。贝叶斯决策的关键在于依据似然分布 用贝叶斯公式求出后验分布。贝叶斯决策的基本步骤如下:
1.验前分析
依据统计数据和资料,按照自身的经验和判断,应用 状态分析方法测算和估计状态变量的先验分布,并计算 各可行方案在不同自然状态下的条件结果值,利用这些 信息,根据某种决策准则,对各可行方案进行评价和选
择,找出最满意的方案,称之为验前分析。
2.预验分析
考虑是否进行市场调查和补充收集新信息,决策 分析人员要对补充信息可能给企业带来的效益和补充 信息所花费的成本进行权衡分析,比较分析补充信息 的价值和成本,称为预验分析。
所以下面将分析如何在进行试验或抽样前来估计情报 价值的问题。
1.完全情报的价值 通常,将能够提供状态变量真实情况的补充信息称为完全信 息,即在获得补充情报后就完全消除了风险情况,把这种情况称 为完全情报,掌握了完全情报,风险决策就转化为确定型决策。 (1)信息价值的意义
设H i 为补充信息值,若存在状态值 0 ,使得条件概率P(0|H i)1
如果获取补充的费用很小,甚至可以忽略不计, 本步骤可以省略,直接进行调查和收集信息,并依据 所获得的补充信息转入下步骤。
3.验后分析
➢ 经过预验分析,决策分析人员做出补充信息的决定, 并通过市场调查和分析补充信息,为验后分析做准备。
➢验后分析的关键是利用补充信息修正先验分布,得到 更加符合市场实际的后验分布。然后,利用后验分布进 行决策分析,选出最满意的可行方案。
第二步,预测分析。要计算调查后的各个时期值,必须计算
概 率 P(Hi ) 和后验概率 P(j |Hi)。计算概率 P(Hi ) ,可把先
验概率 P(j ) 和条件概率 P(Hi |j) 代入全概率公式,求得
P ( H i ) P ( 1 ) P ( H i |1 ) P ( 2 ) P ( H i |2 ) P ( 3 ) P ( H i |3 )
➢验后分析和预验分析都是通过贝叶斯公式修正先验分 布,不同之处在于,预验分析是依据可能的调查结果, 侧重于判断是否补充信息,验后分析是根据实际调查结 果,侧重于选出最满意的方案。
4.序贯分析
社会经济实际中的决策问题,情况都比较复杂, 可适当地将决策分析的全过程划分为若干阶段,每一 个阶段都包括先验分析、预验分析和后验分析等步骤。 这样多阶段互相连接,前阶段决策结果是后阶段决策 的条件,形成决策分析全过程,称之为序贯决策。序 贯决策属于多阶段决策。
p(H21) p(H22)p(H2n)
p(Hm1) p(Hm2)p(Hmn)
称为贝叶斯决策的似然分布矩阵。此矩阵完整的描述了在不同状态值 j 的条件下,信息值H i 的可靠程度 。
贝叶斯决策的基本方法
基本方法:首先,利用市场调查获取补充信息 H或 ,去
修正状态变量 的先验分布,即依据似然分布矩阵所提供的
有关的概率公

设有完备事件组{θj}(j=1, 2, …, n),满
足:
i j, i,j ( 1 ,2 , ,n ;i j)
n
j
j1
则对任一随机事件H,有全概率公式:
n
pH p(H /j)p(j) (p (j) 0)
j1
先验概率
有关的概率公

贝叶斯公式:
pi
/ H
p(H/i) p(i)
现代信息决策方法
2-5 贝叶斯决策
2012.3.29
第三节 风险型决策
常用的风险型决策方法: (一)最大可能法 (二)期望值决策 (三)决策树决策 (四)贝叶斯决策 (五)效用决策
(一)贝叶斯决策
设不确定型决策问题的状态 i 出现的概
率为
P
(或
i
P ( i ),)连续时记为
f
(
)。
已知 P i 的不确定型决策是风险型决策。
预测似然分布表
其中 P(2)0.2,P(1)0.8, 1 为畅销,2为滞销。
P ( H i ) P ( 1 ) P ( H i|1 ) P ( 2 ) P ( H i|2 )
P ( H i ) P ( 1 ) P ( H i|1 ) P ( 2 ) P ( H i|2 ))
P(
P(1)0.25 P(2)0.3 P(3)0.45
E ( a 2 ) 0 . 2 0 0 5 . 3 0 0 . 4 0 0 5
E ( a 1 ) 0 . 2 1 5 0 . 3 5 1 0 . 4 ( 6 ) 5 1 . 35
由风险型决策的期望值准则得到验前最满意方案:无论市场结果 如何,都要生产,最大期望收益值为 1.35 万元。
计算后验概率 P(j |Hi),用贝叶斯公式
P(
j
|
P(H1| H1)
j)P(
P(H 1)
j)
j1,2,3
将上述有关概率值代入贝叶斯公式得下表
后验概率 矩阵
由以上可以求得:当市场调查为 HH1时,每个方案 的期望收益为:
E ( a 1 ) 0 . 5 1 7 0 . 2 5 5 1 6 0 . 1 6 ( 6 5 ) 7 . 9 937
例1 某工厂计划生产一种新产品,产品的销售情况有好 1)、中(2)、和差( 3)三种,据以往的经验 ,估计 三种情况的概率分布和利润如下表所示。
先验概率
为进一步摸清市场对这种产品的需求情况,工厂通过调 查和咨询等方式得到一份市场调查表。销售情况也有好 (H1)、中( H 2 )、差( H 3 )三种,其概率列在下表中。
E(a2)0
最大期望收益值 E(aop|tH 3)0
该企业通过市场调查所得的期望收益值
E 0 . 2 5 7 . 9 8 0 . 2 3 2 0 2 . 5 6 7 0 . 4 1 5 5 0 5 2 9 . 9 2 1
由上可知,补充信息的价值是 2 .9 1 .3 5 1 .5(6 万元),取 市得场调查表这个补充信息的费用是 0.6万元,因此取得补充信 息是值得的。
相关文档
最新文档