贝叶斯决策模型及实例分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

贝叶斯决策模型及实例分析

一、贝叶斯决策的概念

贝叶斯决策,是先利用科学试验修正自然状态发生的概率,在采用期望效用最大等准则来确定最优方案的决策方法。

风险型决策是根据历史资料或主观判断所确定的各种自然状态概率(称为先验概率),然后采用期望效用最大等准则来确定最优决策方案。这种决策方法具有较大的风险,因为根据历史资料或主观判断所确定的各种自然状态概率没有经过试验验证。为了降低决策风险,可通过科学试验(如市场调查、统计分析等)等方法获得更多关于自然状态发生概率的信息,以进一步确定或修正自然状态发生的概率;然后在利用期望效用最大等准则来确定最优决策方案,这种先利用科学试验修正自然状态发生的概率,在采用期望效用最大等准则来确定最优方案的决策方法称为贝叶斯决策方法。

二、贝叶斯决策模型的定义

贝叶斯决策应具有如下内容

贝叶斯决策模型中的组成部分:

)

(

θP

S

A

a及

∈。概率分布S

P∈

θ

θ)

(表示决策

者在观察试验结果前对自然θ发生可能的估计。这一概率称为先验分布。

一个可能的试验集合E,E

e∈,无情报试验e0通常包括在集合E之内。

一个试验结果Z取决于试验e的选择以Z0表示的结果只能是无情报试验e0的结果。

概率分布P(Z/e,θ),Z

z∈表示在自然状态θ的条件下,进行e试验后发生z结果的概

率。这一概率分布称为似然分布。

c 以及定义在后果集合C的效用函数u(e,Z,a,θ)。

一个可能的后果集合C,C

每一后果c=c(e,z,a,θ)取决于e,z,a和θ。.故用u(c)形成一个复合函数u{(e,z,a,θ)},并可写成u(e,z,a,θ)。

三、贝叶斯决策的常用方法

3.1层次分析法(AHP)

在社会、经济和科学管理领域中,人们所面临的常常是由相互关联,相互制约的众多因素组成的复杂问题时,需要把所研究的问题层次化。所谓层次化就是根据所研究问题的性质和要达到的目标,将问题分解为不同的组成因素,并按照各因素之间的相互关联影响和隶属关系将所有因素按若干层次聚集组合,形成一个多层次的分析结构模型。

3.1.1层次分析模型

最高层:表示解决问题的目的,即层次分析要达到的目标。

中间层:表示为实现目标所涉及的因素,准则和策略等中间层可分为若干子层,如准则层,约束层和策略层等。

最低层:表示事项目标而供选择的各种措施,方案和政策等。

3.1.2层次分析法的基本步骤

(l) 建立层次结构模型

在深入分析研究的问题后,将问题中所包括的因素分为不同层次,如目标层、指标层和措施层等并画出层次结构图表示层次的递阶结构和相邻两层因素的从属关系。

(2) 构造判断矩阵

判断矩阵元素的值表示人们对各因素关于目标的相对重要性的认识。在相邻的两个层次中,高层次为目标,低层次为因素。

(3) 层次单排序及其一致性检验

判断矩阵的特征向量W经过归一化后即为各因素关于目标的相对重要性的排序权值。利用判断矩阵的最大特征根,可求CI和CR值,当CR<0.1时,认为层次单排序的结果有满意的一致性;否则,需要调整判断矩阵的各元素的取值。

(4) 层次总排序

计算某一层次各因素相对上一层次所有因素的相对重要性的排序权值称为层次总排序。由于层次总排序过程是从最高层到最低层逐层进行的,而最高层是总目标,所以,层次总排序也是计算某一层次各因素相对最高层(总目标)的相对重要性的排序权值。

设上一层次A包含m个因素A1,A2,…,A m其层次总排序的权值分别为a1,a2,…,a m;下一层次B包含n个因素B1,B2,…,B n,它们对于因素A j(j=1,2,…,m)的层次单排序权值分别为:b1j,b2j,…,b nj(当B k与A j无联系时,b kj=0),则B层次总排序权值可按下表计算。

层次总排序权值计算表

层次总排序的一致性检验,这一步也是从高到低逐层进行的。如果B 层次若干因素对于上一层次某一因素A j 的单排序一致性检验指标为CI j ,相应的平均随机一致性指标为RI j ,

则B 层总排序随机一致性比率为∑∑===

m

j j

j

m

j j

j

RI a

CI

a CR 1

1类似地,当CR<0.01时,认为层次总排序

结果具有满意的一致性;否则,需要重新调整判断矩阵的元素值。 3.2 盈亏转折分析法(又称平均值法)

该方法的关键在于找出盈亏平衡的状态转折点θb ,在此状态转折点上各行为等价(即有相同的收益和费用,各行为的优劣一样)。故只能用于求解两行为问题。下面只对收益型问题推导该算法公式。费用型问题可以依此类推。

假设在第i 个状态θj 发生时两行为的收益函数分别为

),...,2,1(,222111m i b m Q b m Q i i i i =+=+=θθ

式中,Q ij >=0,θi >=0,其概率p i >=0(i=1,2,…,m;j=1,2)。且设问题有解,即θb >0存在。在不失一般性的情况下,又为叙述方便,还设m 1>m 2(否则可调换两行为顺序标号),则必有b 1

所以211

2m m b b b --=θ。另一方面,状态θj 的均值记为θ,并有∑==m

i i i P 1

θθ

行为j(j=1,2)的期望收益额∑==+=+=

m

i j

j j i

j

i

j j j b m b m p EMV 1

)2,1()(θθ

要判断两行为的优劣,必须比较它们的期望收益值的大小。由于

)

)(()(1)()()

()()]()[()

()(21211

22121211

1

21211

212111

221121b m i m

i i i i m

i i i m i m

i i i i i m m m m b b m m b b m m b b p p m m b b m m p b m p b m p EMV EMV θθθθθθθθ--=⎥⎦

⎤⎢⎣⎡----=⨯-+-=-+-=-+-=+-+=-∑∑∑∑∑=====加

加上一开始假定的条件m 1>m 2

所以有下列结论: