不确定型决策问题与风险型决策问题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章贝叶斯分析
Bayesean Analysis
§4.0引言
一、决策问题的表格表示——损失矩阵
对无观察(No-data)问题 a=δ
(损失):
a
1
…a j…a m
π(θ
1)l
11
l
j1
l
m
1
…
π(θ
i )l
i1
l
ij
…
π(θ
n )l
m1
l
nm
或
π(θ
1)…π(θ
i
)…π(θ
n
)
a 1l
11
l
i1
l
n1
…
a
j l ij
…
a m l
m1
l
mn
损失矩阵直观、运算方便
二、决策原则
通常,要根据某种原则来选择决策规则δ,使结果最优(或满意),这种原则就叫决策原则,贝叶斯分析的决策原则是使期望效用极大。
本章在介绍贝叶斯分析以前先介绍芙他决策原则。
三、决策问题的分类:
1.不确定型(非确定型)
自然状态不确定,且各种状态的概率无法估计.
2.风险型
自然状态不确定,但各种状态的概率可以估计.
四、按状态优于:
l ij ≤l
ik
I, 且至少对某个i严格不等式成立, 则称行动a
j
按状态优于a
k
§4.1 不确定型决策问题
一、极小化极大(wald)原则(法则、准则) a
1a
2
a
4
min
j max
i
l (θ
i
, a
j
) 或max
j
min
i
u
ij
例:
各行动最大损失: 13 16 12 14
其中损失最小的损失对应于行动a
3
.
采用该原则者极端保守, 是悲观主义者, 认为老天总跟自己作对.
二、极小化极小
min
j min
i
l (θ
i
, a
j
) 或max
j
max
i
u
ij
例:
各行动最小损失: 4 1 7 2
其中损失最小的是行动a
2
.
采用该原则者极端冒险,是乐观主义者,认为总能撞大运。
三、Hurwitz准则
上两法的折衷,取乐观系数入
min
j [λmin
i
l (θ
i
, a
j
)+(1-λ〕max
i
l (θ
i
, a
j
)]
例如λ=0.5时
λmin
i l
ij
: 2 0.5 3.5 1
(1-λ〕max
i l
ij
: 6.5 8 6 7
两者之和: 8.5 8.5 9.5 8其中损失最小的是:行动a
4
四、等概率准则(Laplace)
用
i
∑l ij来评价行动a j的优劣
选min
j
i
∑l ij
上例:
i
∑l ij : 33 34 36 35 其中行动a1的损失最小五、后梅值极小化极大准则(svage-Niehans)
定义后梅值s
ij =l
ij
-min
k
l
ik
其中min
k l
ik
为自然状态为θ
i
时采取不同行动时的最小损失.
构成后梅值(机会成本)矩阵 S={s
ij }
m n
⨯
,使后梅值极小化极大,即:
min max j i s ij
例:损失矩阵同上, 后梅值矩阵为:
3 1 0 2
3 0 8 1
1 4 0 2
0 3 2 4
各种行动的最大后梅值为: 3 4 8 4
其中行动a1 的最大后梅值最小,所以按后梅值极小化极大准则应采取行动1.
六、Krelle准则:
使损失是效用的负数(后果的效用化),再用等概率(Laplace)准则.
七、莫尔诺(Molnor)对理想决策准则的要求(1954)
1.能把方案或行动排居完全序;
2.优劣次序与行动及状态的编号无关;
3.若行动a
k 按状态优于a
j
,则应有a
k
优于a
j
;
4.无关方案独立性:已经考虑过的若干行动的优劣不因增加新的行动而改变;
5.在损失矩阵的任一行中各元素加同一常数时,各行动间的优劣次序不变;
6.在损失矩阵中添加一行,这一行与原矩阵中的某行相同,则各行动的优劣次序不变。
§4.2 风险型决策问题的决策原则
一、最大可能值准则
令π(θ
k )=maxπ(θ
i
)
选a
r 使 l(θ
k
,a
r
)=min
j
l(θ
k
,a
j
)
例:
π(θ
i )a
1
a
2
a
3
θ
1
0.27 6.56
θ
2
0.5345
θ
3
0.3410
π(θ
2
) 概率最大, 各行动损失为 3 4 5
∴应选行动a
1
二、贝叶斯原则
使期望损失极小:
min
j {
i
∑l(θi , a j) π(θi) }
上例中,各行动的期望损失分别为 4.1 3.6 3.7, 对应于a
2
的期望损失3.6最小
∴应选a
2
.
三、贝努利原则
损失函数取后果效用的负值,再用Bayes原则求最优行动.
四、E—V(均值—方差)准则
若Eπl
ij ≤Eπl
ik
且σσ
j k
≤则a
j
优于a
k
通常不存在这样的a
j
上例中:
a 1a
2
a
3
E 4.1 3.6 3.7
V(σ2) 2.29 3.79 5.967
不存在符合E—V准则的行动, 这时可采用f(μ,σ)的值来判断(μ为效益型后果的期望)
μ-ασ
f( μ,σ)=μ-ασ2
μ-α(μ2+σ2)
f越大越优.
五、不完全信息情况下的决策原则(Hodges-Lehmann原则)
状态概率分布不可靠时, 可采用:
φ(a
j )=λu
ij
i
i
∑⋅π + min
i
u
ij
i=1,2,… ,m j=1,2,…,n
φ越大越优.
§4.3贝叶斯定理
一、条件概率
1.A、B为随机试验E中的两个事件 P(A|B)=P(AB)/P(B)
由全概率公式: A j j=1,2,…,n 是样本空间的一个划分, P(B)=j
∑
P(B|A j )P(A j )
得Bayes 公式
P(A i |B)=P(B|A i )·P(A i )/P(B) = P(B|A i )·P(A i )/
j
∑
P(B|A j )P(A j )
2. 对Θ,Χ两个随机变量 ·条件概率密度
f(θ| x)=f(x |θ)f(θ)/f(x) ·在主观概率论中
π(θ| x)=f(x |θ)π(θ)/m(x) 其中:π(θ)是θ的先验概率密度函数
f(x |θ)是θ出现时,x 的条件概率密度,又称似然函数. m(x)是x 的边缘密度, 或称预测密度. m(x)=
Θ
⎰
f(x |θ)π(θ) d θ
或
i
∑
p(x|θi )π(θi )
π(θ|x)是观察值为x 的后验概率密度。
例:A 坛中白球30%黑球70% B 坛中白球70%黑球30%
两坛外形相同,从中任取一坛,作放回摸球12次,其中白球4次,黑球8次,求所取为A 坛的概率.
解:设观察值4白8黑事件为x ,记取A 坛为 θ1, 取B 坛为θ2 在未作观察时,先验概率p(θ1)=p(θ2)=0.5 则在作观察后,后验概率 P(θ
1|x)=p(x|θ1)p(θ1)p(x|θ1)p(θ1)+p(x|θ2)p(θ2) =034.×078.×0.5(034.×078.×0.5+074.×038.×0.5)
=074.(074.×034.)
=0.2401
0.2482
=0.967
显然, 通过试验、观察、可修正先验分布.
§4.4 贝叶斯分析的正规型与扩展型
一、正规型分析
由Baysean 原则:先验分布为π(θ)时,最优的决策规则δ是贝叶斯规则δπ,使贝叶斯风险
r(π, δπ)=inf δ∈∆
r(π,δ(x))
其中:r(π,δ(x))= E πR(θ,δ(x)) =E π[E x θ l(θ,δ(x)) =
θ
⎰x
⎰
l(θ,δ(x)) f(x |θ)dx π(θ) d θ (1)
据(1)式,选δπ使r(π,δ)达到极小,这就是正规型的贝叶斯分析。
在解实际问题时,求使(1)式极小的δ(x)往往十分困难,尤其在状态和观察值比较复杂时,Δ集中的策略数目很大,穷举所有的δ(x)有困难,且计算量颇大。
实际上可用下法:
二、扩展型贝叶斯分析(Extensive Form Analysis)
在(1)式中因l(θ,δ)>-∞,f(x |θ),π(θ)均为有限值。
∴由Fubini 定理,积分次序可换 即r(π,δ(x))= θ⎰x
⎰
l(θ,δ(x)) f(x |θ)dx π(θ) d θ
=
x
⎰θ
⎰
l(θ,δ(x)) f(x |θ)π(θ) d θdx (2)
显然,要使(2)式达到极小,应当对每个x ∈X ,选择δ, 使 θ
⎰
l(θ,δ(x)) f(x |θ)π(θ) d θ (2’)
为极小
∵δ(x)=a ∴若对给定的x,选a ,使 θ
⎰
l(θ,δ(x)) f(x |θ)π(θ) d θ 为极小
亦即,
使
1
m x ()θ
⎰
l(θ,a) f(x |θ)π(θ) d θ
=
θ
⎰
l(θi ,a) π(θi |x) d θ 或
θi ∈∑
Θ
l(θi ,a)p(θi |x) (3) 达
极小,即可使(1)式为极小. ·结论:
对每个x ,选择行动a ,使之对给定x 时θ的后验分布π(θ|x)的期望损失为极小,即可求得贝叶斯规则。
这种方法叫贝叶斯分析的扩展型,由此确定的贝叶斯规则叫formal Bayesean Rule ——Raiffa Sehlaifer,1961年提出。
·Note
·使(3)式达极小的行动可能不只一个,即可能有多个贝叶斯规则; ·扩展型比正规型更直观,也容易计算,故更常用; ·许多分析人员只承认扩型,理由是:
i ,π(θ|x)描述了试验后的θ的分布,比π(θ)更客观,因此,只要损失函数是由效用理论导出的(即考虑了DMer 的价值判断、风险偏好),在评价行动a 的优劣时就应当用后验期望损失。
ii, r(π,δ)是根据π(θ)求出的,而用先验分布π(θ)来确定行动a 并不一定适当。
从根本上讲,这种观点是正确的。
·无论从何种观点来进行贝叶斯分析,从理论上讲,结果是一样的,所以采用何种方法可视
具体问题,据计算方便而定。
·已经证明,形式贝叶斯分析对一类非随机性决策规则是成立的,也可以证明它对随机性决策规则同样成立。
使所有x上后验期望损失极小的贝叶斯规则也是随机性规则集Δ*中的Bayes规则,因此,总可以找到一验期望损失极小的非随机性规则。
三、例(先看无观察问题)
农民选择作物问题,设某地旱年θ
1占60%,正常年景θ
2
占40%; a
1
种植耐旱作物
a
2
种不耐旱作物,后果矩阵为:
a 1a 2
θ
1
20 0
θ
2
60 100
决策人的效用函数 u(y)=
1
0865
.
(1-e y
-002
.)
解:i令:l(y)=1-u(y)
ii,作决策树:
a 1
a 2
πθ()
1
πθ()
1
πθ()
260 .81 .19
y u l
20 .38 .62
0 0 1
100 1 0
iii, 在无观察时, R=l, r=
11
=∑
n
l(θi ,a)π(θi )
r(π, a 1)=l(θ1,a 1)π(θ1)+l(θ2,a 1)π(θ2) =0.62 ×0.6+0.19 ×0.4 =0.448
r(π, a 2)= l(θ1,a 2)π(θ1)+l(θ2,a 2)π(θ2) =1.0 ×0.6+0 ×0.4 =0.6
风险r 小者优, ∴δ=a 1,是贝叶斯规则, 即贝叶斯行动.即应选择耐旱作物。
四、例(续上)
设气象预报的准确性是0.8,即p(x 1|θ1)=0.8 p(x 2|θ2)=0.8 其中,x 1预报干旱 x 2预报正常年景
则 m(x 1)=p(x 1|θ1)π(θ1)+p(x 1|θ2)π(θ2) =0.8 ×0.6+0.2 ×0.4=0.56 m(x 2)=0.44
π(θ1|x 1)=p(x 1|θ1)π(θ1)m(x 1) =0.8 ×0.6/0.56=0.86 π(θ1|x 2)=p(x 2|θ1)π(θ1)m(x 2) =0.2 ×0.6/0.44=0.27 π(θ2|x 1)=0.14 π(θ2|x 2)=0.73 1. 正规型分析
①策略δ1: a 1= δ1(x 1) a 2=δ1(x 2)
r(π, δ1)=
i
∑j
∑
l (θi ,δ1(x j ))p(x j |θi )π(θi )
4-7
= l (θ1,a 1)p(x 1|θ1)π(θ1)+l (θ1,a 2)p(x 2|θ1)π(θ1) + l (θ2,a 1)p(x 1|θ2)π(θ2)+l (θ2,a 2)p(x 2|θ2)π(θ2)
=0.62×0.8×0.6+1.0 ×0.2×0.6+0.19 ×0.2×0.4+0.0× 0.8×0.4 =0.4328
②策略δ2: a 1=δ2(x 2) a 2=δ2(x 1) r(π, δ2)=
i
∑j
∑
l (θi ,δ2 (x j ))p(x j |θi )π(θi )
= l (θ1,a 1)p(x 2|θ1)π(θ1)+l (θ1,a 2)p(x 1|θ1)π(θ1) + l (θ2,a 1)p(x 2|θ2)π(θ2)+l (θ2,a 2)p(x 1|θ2)π(θ2) = 0.62×0.2×0.6+1.0×0.8×0.6+0.19×0.8× 0.4+0.0×0.8× 0.4 =0.6152
③策略δ3: a 1= δ3(x 1) a 1=δ3(x 2) r(π, δ3)=0.45
④策略δ4: a 2=δ4(x 1) a 2=δ4(x 2) r(π, δ4)=0.6
∵r(π, δ1) <r(π, δ3) <r(π, δ4) <r(π, δ2) ∴ δ1
δ3
δ4
δ2 δ1是贝叶斯行动。
x 1
a 1
x 2
1
a 1
a
2
a
2
πθ(|)
11x πθ(|)
21x πθ(|)
21x πθ(|)
22x πθ(|)
22x πθ(|)
11x πθ(|)
12x πθ(|)11x πθ(|)
12x
4-82.扩展型之一:据(2’) :
θ⎰l(θ,δ(x)) f(x |θ)π(θ) dθ记作r’
①给定x
1
(预报干旱):
采用a
1
r‘=
i
∑l (θi,a1)p(x1|θi)π(θi)
= l (θ
1,a
1
)p(x
1
|θ
1
)π(θ
1
) + l (θ
2
,a
1
)p(x
1
|θ
2
)π(θ
2
)
= 0.62×0.8×0.6+0.19 ×0.2×0.4 =0.3128
采用a
2r’= l (θ
1
,a
2
)p(x
1
|θ
1
)π(θ
1
) + l (θ
2
,a
2
)p(x
1
|θ
2
)π(θ
2
)
=0.48
∵风险小者优∴给定x
1应选a
1
②给定x
2
(预报天气正常)
采用a
1r’= l (θ
1
,a
1
)p(x
2
|θ
1
)π(θ
1
) + l (θ
2
,a
1
)p(x
2
|θ
2
)π(θ
2
)
=0.62×0.2×0.6 + 0.19× 0.8× 0.4 =0.135
采用a
2r’= l (θ
1
,a
2
)p(x
1
|θ
1
)π(θ
1
) + l (θ
2
,a
2
)p(x
1
|θ
2
)π(θ
2
)
=1.0×0.2×0.6 + 0 =0.12
∴给定x
2应选a
2
由此得形式Bayes规则δπ: a
1= δπ(x
1
) a
2
=δπ(x
2
)
3.扩展型之二:据(3)式即
θ⎰l(θ
i
,a) π(θ
i
|x) dθ或
θ
i
∈
∑
Θ
l(θ
i
,a)π
(θ
i
|x)(记作r”)
①给定x
1
,
采用a
1
r”=
θi ∈
∑
Θl(θ
i
,a
1
)π(θ
i
|x
1
)
= l(θ
1,a
1
)π(θ
1
|x
1
) + l(θ
2
,a
1
)π(θ
2
|x
1
)
=0.62 ×0.86 + 0.19 ×0.14 =0.56
采用a
2r”= l(θ
1
,a
2
)π(θ
1
|x
1
) + l(θ
2
,a
2
)π(θ
2
|x
1
)
= 1.0 ×0.86 + 0× 0.14 =0.86
∴给定x
1,应选行动a
1
.
②给定x
2
采用a
1
r”=
θi ∈
∑
Θl(θ
i
,a
1
)π(θ
i
|x
2
)
= l(θ
1,a
1
)π(θ
1
|x
2
) + l(θ
2
,a
1
)π(θ
2
|x
2
)
=0.62 ×0.27 + 0.19 ×0.73 = 0.3061 采用a
2
r”=
θi ∈
∑
Θl(θ
i
,a
2
)π(θ
i
|x
2
)
= l(θ
1,a
2
)π(θ
1
|x
2
) + l(θ
2
,a
2
)π(θ
2
|x
2
)
=1.0 ×0.27 + 0 ×0.73 =0.27
∴给定x
2应选择行动a
2
.
∴形式Bayes规则δπ: a
1= δπ(x
1
) a
2
=δπ(x
2
)
§4.5 非正常先验与广义贝叶斯规则
一、非正常先验(Improper Prior)
概率测度的三个条件:
i,规范性:P(Ω)=1
ii,非负性:0≤P(A)≤1
iii,可列可加性
在设定先验分布时,若不满足规范性,则称为非正常先验.
二、广义贝叶斯规则(General Bayesean Rule)
1.定义:
决策问题的损失函数为l(θ,a),π(θ)为非正常先验分布,对给定的θ
i
,使
i,
θ⎰l(θ,δ(x)) f(x |θ)π(θ) dθ为极小,或者
ii, 0<m(x)<-∞时,使
θ⎰l(θ
i
,a) π(θ
i
|x) dθ为极小的策略(行动),构成广义贝叶
斯规则.
2.Nole:①在许多重要场合,所有允许的都是GBR
②在无法得到正常先验时,除此别无良策;
③GBR不一定是最好的决策规则
§4.6 一种具有部分先验信息的贝叶斯分析法
一、概述
1.思路:在部分先验信息难以唯一地确定π(θ)时,抛开唯一性要求,转而确定与已知先验信息相符的先验分布的集。
2.符号
i, Θ和A为有限集:Θ={θ
1,θ
2
,…,θn}
A={a 1,a 2,…,a m } 损失矩阵L={l ij }n m ⨯ l ij =l (θi ,a j ) ii,根据贝叶斯分析的扩展型 给定x ,应从集合A 中选一行动 a k ,使 q(a)=
i
∑
l (θi ,a) p(x 1|θi )π(θi ) 为极小,亦即
a k = arg min a A
∈q(a) 或 q(a k )≤q(a j ) j=1,2,…,m (4) 则 a k 为贝叶斯行动.
记p(x 1|θi )为p i (x) , π(θi ) 为πi L k =[l k 1,l k 2,…,l nk ]T π={π1,π2,…,πn } 则
i
∑
l (θi ,a) p(x 1|θi )π(θi )=L j T
[diag{p i (x) }π]
(4)式可表示成 L k T
[diag{p i (x)}π]≤L j T
[diag{p i (x) }π] i=1,2, …,n (5) j=1,2, …,m
(5)式即 [ (L T -1 L k T
) diag{p i (x) }] π ≥0 (5’)
记 (L T
-1 L k T
) diag{p i (x) } 为D k (x), 式(5’)可表示为:
D k (x) π ≥0 (5”) 3. (5”)式的含义
(1)给定x ,先验分布为π时,应选 a k 使5(即5’, 亦即5”)式成立。
(2) 对给定的x ,要使 a k 成为贝叶斯行动,π应满足 5(即5’, 亦即5”)式. 由(2)可以定义
∏k (x)={ π∈Π| D k (x) π ≥0 ;π
i
i
=∑1, πi ≥0 }
式中, Π是先验分布的所有可能的集,
∏k (x) 是Π的一个子集,它能i,使 对给定x 为Bayes 行动 ii,满足规范性和非负性
二、分析步骤 1. 确定∏k (x)
2. 确定先验信息对先验分布π(θ)的约束: Q={ π∈Π| A π≥0,
π
i
i
=∑1, πi ≥0}
式中, A π≥0是先验信息对先验分布π(θ)的约束. 3.结论:
当 ∏k (x) 与Q 有非空交集时,a k 为Bayes 行动.
三、例
已知:i, Q={ π∈Π| π1≥0.5,π2 ≥π3, π3≥104-,
π
i
i
=∑1}
ii,由已往的统计资料,三种病患者的白血球计数: f(x| θ1)= N( 3000, 10002 ) f(x| θ2)= N( 3000, 10002 ) f(x| θ3)= N( 3000, 10002 ) iii,观察:x=5000 要求判定:患者得什么病 解:p(x|θ1)= p(5000|θ1)
=
4950
5050
⎰
121
πσe
-
-()x μσ22
2dx 令x *
=
x -μσ1
1
=
195
205
..⎰
1
2π
e --x *22
dx
=0.9798 - 0.9744 = 0.0054 同理可得:
p(x| θ2)=0.0091 p(x| θ3)=0.0000105
∵L=011101110⎡⎣⎢⎢⎢⎤
⎦
⎥⎥⎥ , 1 l T 1= []111011*********⎡⎣⎢⎢⎢⎤⎦⎥⎥⎥=⎡⎣⎢⎢⎢⎤⎦⎥⎥⎥ , ∴L T
-1 l T 1=000110101------⎡⎣⎢⎢⎢⎤⎦⎥⎥⎥ ,
diag{p i (x)}=541011001911100101017......⎡⎣⎢⎢⎢⎤⎦⎥⎥⎥ D 1= 00054910540017------------⎡⎣⎢⎢⎢⎤⎦
⎥⎥⎥.... D 1(5000)· π≥0 即---⎡⎣⎢⎢⎢⎤⎦⎥⎥⎥05491540017123....ππππ≥000⎡⎣⎢⎢⎢⎤⎦
⎥
⎥⎥
∴∏1(5000)= { π∈Π| π1-1.69π2 ≥0, π1-0.00315π3≥0, π
i
i
=∑1}
同理可得∏2(5000)和 ∏3(5000)
三、几何意义
1.由πi
i =
∑1
2.Q: 由先验信息确定红框内为Q
3.从D
k (x) π≥0 得∏
1
,∏
2
, ∏
3
.。