贝叶斯统计复习
贝叶斯统计复习
贝叶斯统计习题1. 设θ是一批产品的不合格率,从中抽取8个产品进行检验,发现3个不合格品,假如先验分布为 (1)U 0,1θ:()(2)21-0<<1=0,θθπθ⎧⎨⎩(),()其它 求θ的后验分布。
解:()()()()()111335368362(|)(1)*2(1)112(1)15(|)840(1),01m x p x d C d d p x x m x θπθθθθθθθθθθπθπθθθθ==--=-===-<<⎰⎰⎰2. 设12,,,n x x x L 是来自均匀分布U 0,θ()的一个样本,又设θ的先验分布为Pareto 分布,其密度函数为+1000/>=0,αααθθθθπθθθ⎧⎨≤⎩,()其中参数0>0,>0θα,证明:θ的后验分布仍为Pareto 分布。
解:样本联合分布为:1(),0np x x θθθ=<<1000/,()0,αααθθθθπθθθ+⎧>=⎨≤⎩{}110101()()()/1/,max ,,,n n n x p x x x αααπθθπθαθθθθθθ++++∝=∝>=L因此θ的后验分布的核为11/n αθ++,仍表现为Pareto 分布密度函数的核即1111()/,()0,n n n x αααθθθθπθθθ+++⎧+>=⎨≤⎩即得证。
3. 设12,,,n x x x L 是来自指数分布的一个样本,指数分布的密度函数为-(|)=,>0xp x e x λλλ,(1) 证明:伽玛分布(,)Ga αβ是参数λ的共轭先验分布。
(2) 若从先验信息得知,先验均值为0.0002,先验标准差为0.0001,确定其超参数,αβ。
解:()()()111()1()()()()(),.nii x nn n x n n x p x ee ex p x e Ga n nx λλααβλαβλλλλβπλλαλπλλπλλαβ=----+--+∑===Γ∝∝++样本的似然函数:参数的后验分布服从伽马分布220.0002(2)4,20000.0.0001αβαβαβ⎧=⎪⎪⇒==⎨⎪=⎪⎩4. 设一批产品的不合格品率为θ,检查是一个接一个的进行,直到发现第一个不合格品停止检查,若设X 为发现第一个不合格品是已经检查的产品数,则X 服从几何分布,其分布列为 ()-1(=|)=1-,=1,2,x P X x x θθθL假如θ只能以相同的概率取三个值1/4, 2/4, 3/4,现只获得一个观察值=3x ,求θ的最大后验估计ˆMDθ。
贝叶斯统计-习题答案)
第一章 先验分布与后验分布1.1 解:令120.1,0.2θθ==设A 为从产品中随机取出8个,有2个不合格,则22618()0.10.90.1488P A C θ== 22628()0.20.80.2936P A C θ== 从而有5418.03.02936.07.01488.07.01488.0)()|()()|()()|()|(2211111=⨯+⨯⨯=+=θπθθπθθπθθπA P A P A P A 4582.0)|(1)|(4582.03.02936.07.01488.03.02936.0)()|()()|()()|()|(122211222=-==⨯+⨯⨯=+=A A or A P A P A P A θπθπθπθθπθθπθθπ1.2 解:令121, 1.5λλ==设X 为一卷磁带上的缺陷数,则()XP λ∴3(3)3!e P X λλλ-==R 语言求:)4(/)exp(*)3(^gamma λλ-1122(3)(3)()(3)()0.0998P X P X P X λπλλπλ∴===+== 从而有111222(3)()(3)0.2457(3)(3)()(3)0.7543(3)P X X P X P X X P X λπλπλλπλπλ==========1.3 解:设A 为从产品中随机取出8个,有3个不合格,则3358()(1)P A C θθθ=-(1) 由题意知 ()1,01πθθ=<< 从而有.10,)1(504)|(504)6,4(/1)6,4(1)6,4()1()1()1()1()1()1()1()()|()()|()|(535311614531535315338533810<<-==-=--=--=--==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求(2).10,)1(840)|(840)7,4(/1)7,4(1)7,4()1()1()1()1()1()1(2)1()1(2)1()()|()()|()|(63631171463163631533853381<<-==-=--=--=----==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求1.5 解:(1)由已知可得.5.125.11,110110/1)()|()()|()|(,2010,101)(5.125.111)|(2112211)|(12,2121,1)|(5.125.11201011111111<<===<<=<<=+<<-==+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθd d x p x p x x p x p x x x p ,,即,时,当(2)由已知可得.6.115.11,1010110/1)()|,,()()|,,(),,|(,2010,101)(6.115.111)|,,(,219.1121,214.1121,211.1121,217.1121215.11212112211)|,,(9.11,4.11,1.11,7.11,5.11,0.12,6,2,1,2121,1)|,,(6.115.112010621621621621621654321621<<===<<=<<=+<<-+<<-+<<-+<<-+<<-+<<-========+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθθθθθθθθθθθd d x x x p x x x p x x x x x x p x x x p x x x x x x i x x x x p i ,即,,时,当【原答案:由已知可得 ()1,0.50.5P x x θθθ=-<<+1(),102010πθθ=<< 11.611.51()0.0110m x d θ==⎰从而有()()()10,11.511.6()P x x m x θπθπθθ==<< 】1.6 证明:设随机变量()XP λ,λ的先验分布为(,)Ga αβ,其中,αβ为已知,则即得证!),(~),,|()()|,,(),,|(,0,)()(,!!)|,,(121)(121211112111βαλπλλπλλπλλαβλπλλλλβαβλααλλ++∑∑∝•∝>Γ=∑===+--+--=-=-==∏∏n x Ga x x x ex x x p x x x e x e x e x x x p ni i n n x n n ni in x ni i x n ni i ni ii【原答案: (),0!x e P x x λλλλ-=>1(),0()e ααβλβπλλλα--=>Γ 因此 11(1)()()()x x x P x e e e λαβλαβλπλλπλλλλ---+--+∝•∝= 所以 (,1)x Ga x λαβ++】 1.7 解:(1)由题意可知.1},max{,1)/(1)/(122)()|,,()()|,,(),,|(,10,1)(,,2,1,10,22)|,,(121},max{221},max{2121121212112122111<<∝===<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθπθθπθθπθθπθθθθn nx x nn x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 ()1,01πθθ=<< 因此122()12(1)xxm x d x θθ=•=-⎰因此 2()()1(),1()1P x x x x m x x θπθπθθθ==<<-(实质是新解当n=1的情形)】 (2) 由题意可知.1},max{,1)/(1)/(13232)()|,,()()|,,(),,|(,10,3)(,,2,1,10,22)|,,(12-21},max{2-22-21},max{2212211212121212122111<<∝=⨯⨯==<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθθθπθθπθθπθθθπθθθθn n x x n n x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 1222()36xm x d x θθθ=•=⎰因此 ()()()1,01()P x x m x θπθπθθ==<<】 1.8 解:设A 为100个产品中3个不合格,则3397100()(1)P A C θθθ=-由题意可知 199(202)()(1),01(200)πθθθθΓ=-≤≤Γ 因此 3971994296()()()(1)(1)(1)A P A πθθπθθθθθθθ∝•∝--=- 由上可知)297,5(~)|(Be A θπ1.9 解:设X 为某集团中人的高度,则2(,5)XN θ∴25(,)10XNθ ∴2(176.53)5()p x θθ--=由题意可知 2(172.72)5.08()θπθ--=又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222(176.53)(172.72)(174.64)55.0821.26eeeθθθ------⨯∝•∝因此 (174.64,1.26)x N θ1.10 证明:设22(,),,N u u θσσ其中为已知又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222222251()()11252()11225252u x x u eeeσθθθσσσ+----+⨯--⨯+⨯∝∝因此 222251(,)112525u x xN σθσσ+++又由于21112525σ≤+ 所以 θ的后验标准差一定小于151.11 解:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)X U θ.8,861)/(1192192)()|,,()()|,,(),,|(,4,192)(.81)|,,(8,8,5.3,2,1,0,1)|,,(768778774321321321433213213321>⨯====≥=>=====<<=⎰⎰⎰∞∞∞θθθθθθθθθθπθθπθθπθθθπθθθθθθd d d x x x p x x x p x x x x x x p x x x i x x x x p i ,时,当【原答案:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)XU θ∴1(),0p x x θθθ=<<当8θ>时,31()p x θθ=43819211()8192m x d θθθ+∞==⎰从而有 7()()3()()128p x x m x θπθπθθ==, 计算错误】1.12 证明:由题意可知 1(),0,1,2,...,i np x x i n θθθ=<<=从而有 ()()()()x x p x πθπθθπθ∝•00111n n n ααααθθθθθ++++∝•∝ 因此 θ的后验分布仍是Pareto 分布。
贝叶斯统计ppt课件
29
二 参数的Bayes点估计
(3)后验中位数估计
若 Me是后验分布h(θ| x )的中位数, 则 Me称为θ的后验中位数估计。即若
u0.5 h( x)d 0.5
则后验分布中位数估计
Me u0.5
30
二 参数的Bayes点估计
以上三种估计统称θ的Bayes估计,记为
或简记B 为 。它们 皆是样本观察值
18
历史迭代图
不收敛 收敛
19
(2)观察自相关性图 (m)
自相关性图用于描述(m)序列在不同迭代
延迟下的相关性,延迟i的自相关性是指相 距i步的两迭代之间的相关性。具有较差的 性质的链随着迭代延迟的增加会表现出较 慢的自相关衰弱。
20
21
22
23
Bayes Bayes统计推断
Bayes统计推断概述 参数的Bayes点估计 Bayes区间估计 Bayes假设检验
选择检验统计量,确定抽样分布,等等。
41
四 Bayes假设检验
Bayes假设检验不同型:
简单假设 简单假设
复杂假设 复杂假设 假单假设 复杂假设
42
四 Bayes假设检验
Bayes因子
设两个假设Θ0,Θ1的先验概率分布为π0与π1,
即:
0 P( 0 ),1 P( 1)
则 0 1 称为先验概率比。
3
(一)预备知识
4
5
(二)基本思想
6
(三)常用MCMC算法 Gibbs抽样(吉布斯采样算法)
7
8
立即更新的Gibbs抽样
每次迭带的时候 的一些元素已经被跟新了,如果在更
新其他的元素时不使用这些更新后的元素会造成一定程度 的浪费。事实上, Gibbs抽样 可通过在每一步都利用近似 得到的其他元素的值来获得更好的效果。这种方法改进了 练的混合,换句话说,链能更加迅速,更加详尽的搜索目 标分布的支撑空间。
贝叶斯统计习题答案
第一章 先验分布与后验分布1.1 解:令120.1,0.2θθ==设A 为从产品中随机取出8个,有2个不合格,则22618()0.10.90.1488P A C θ== 22628()0.20.80.2936P A C θ== 从而有5418.03.02936.07.01488.07.01488.0)()|()()|()()|()|(2211111=⨯+⨯⨯=+=θπθθπθθπθθπA P A P A P A 4582.0)|(1)|(4582.03.02936.07.01488.03.02936.0)()|()()|()()|()|(122211222=-==⨯+⨯⨯=+=A A or A P A P A P A θπθπθπθθπθθπθθπ1.2 解:令121, 1.5λλ==设X 为一卷磁带上的缺陷数,则()XP λ∴3(3)3!e P X λλλ-==R 语言求:)4(/)exp(*)3(^gammaλλ- 1122(3)(3)()(3)()0.0998P X P X P X λπλλπλ∴===+== 从而有111222(3)()(3)0.2457(3)(3)()(3)0.7543(3)P X X P X P X X P X λπλπλλπλπλ==========1.3 解:设A 为从产品中随机取出8个,有3个不合格,则3358()(1)P A C θθθ=-(1) 由题意知 ()1,01πθθ=<< 从而有.10,)1(504)|(504)6,4(/1)6,4(1)6,4()1()1()1()1()1()1()1()()|()()|()|(535311614531535315338533810<<-==-=--=--=--==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求(2).10,)1(840)|(840)7,4(/1)7,4(1)7,4()1()1()1()1()1()1(2)1()1(2)1()()|()()|()|(636311714631636315338533810<<-==-=--=--=----==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求1.5 解:(1)由已知可得.5.125.11,110110/1)()|()()|()|(,2010,101)(5.125.111)|(2112211)|(12,2121,1)|(5.125.11201011111111<<===<<=<<=+<<-==+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθd d x p x p x x p x p x x x p ,,即,时,当(2)由已知可得.6.115.11,1010110/1)()|,,()()|,,(),,|(,2010,101)(6.115.111)|,,(,219.1121,214.1121,211.1121,217.1121215.11212112211)|,,(9.11,4.11,1.11,7.11,5.11,0.12,6,2,1,2121,1)|,,(6.115.112010621621621621621654321621<<===<<=<<=+<<-+<<-+<<-+<<-+<<-+<<-========+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθθθθθθθθθθθd d x x x p x x x p x x x x x x p x x x p x x x x x x i x x x x p i ,即,,时,当【原答案:由已知可得 ()1,0.50.5P x x θθθ=-<<+1(),102010πθθ=<< 11.611.51()0.0110m x d θ==⎰从而有()()()10,11.511.6()P x x m x θπθπθθ==<< 】1.6 证明:设随机变量()XP λ,λ的先验分布为(,)Ga αβ,其中,αβ为已知,则即得证!),(~),,|()()|,,(),,|(,0,)()(,!!)|,,(121)(121211112111βαλπλλπλλπλλαβλπλλλλβαβλααλλ++∑∑∝•∝>Γ=∑===+--+--=-=-==∏∏n x Ga x x x ex x x p x x x e x e x ex x x p ni i n n x n n ni in x ni i x n ni i ni ii【原答案: (),0!x e P x x λλλλ-=>1(),0()e ααβλβπλλλα--=>Γ因此 11(1)()()()x x x P x e e e λαβλαβλπλλπλλλλ---+--+∝•∝= 所以 (,1)x Ga x λαβ++】 1.7 解:(1)由题意可知.1},max{,1)/(1)/(122)()|,,()()|,,(),,|(,10,1)(,,2,1,10,22)|,,(121},max{221},max{2121121212112122111<<∝===<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθπθθπθθπθθπθθθθn nx x nn x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 ()1,01πθθ=<< 因此122()12(1)xxm x d x θθ=•=-⎰因此 2()()1(),1()1P x x x x m x x θπθπθθθ==<<- (实质是新解当n=1的情形)】 (2) 由题意可知.1},max{,1)/(1)/(13232)()|,,()()|,,(),,|(,10,3)(,,2,1,10,22)|,,(12-21},max{2-22-21},max{2212211212121212122111<<∝=⨯⨯==<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθθθπθθπθθπθθθπθθθθn n x x n n x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 1222()36xm x d x θθθ=•=⎰因此 ()()()1,01()P x x m x θπθπθθ==<<】1.8 解:设A 为100个产品中3个不合格,则3397100()(1)P A C θθθ=-由题意可知 199(202)()(1),01(200)πθθθθΓ=-≤≤Γ 因此 3971994296()()()(1)(1)(1)A P A πθθπθθθθθθθ∝•∝--=- 由上可知)297,5(~)|(Be A θπ1.9 解:设X 为某集团中人的高度,则2(,5)XN θ∴25(,)10XN θ∴2(176.53)5()p x θθ--= 由题意可知 2(172.72)5.08()θπθ--=又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222(176.53)(172.72)(174.64)55.0821.26eeeθθθ------⨯∝•∝因此 (174.64,1.26)xN θ1.10 证明:设22(,),,N u u θσσ其中为已知又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222222251()()11252()11225252u x x u eeeσθθθσσσ+----+⨯--⨯+⨯∝∝因此 222251(,)112525u x xN σθσσ+++又由于21112525σ≤+ 所以 θ的后验标准差一定小于151.11 解:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)X U θ.8,861)/(1192192)()|,,()()|,,(),,|(,4,192)(.81)|,,(8,8,5.3,2,1,0,1)|,,(768778774321321321433213213321>⨯====≥=>=====<<=⎰⎰⎰∞∞∞θθθθθθθθθθπθθπθθπθθθπθθθθθθd d d x x x p x x x p x x x x x x p x x x i x x x x p i ,时,当【原答案:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)X U θ∴1(),0p x x θθθ=<<当8θ>时,31()p x θθ=43819211()8192m x d θθθ+∞==⎰从而有 7()()3()()128p x x m x θπθπθθ==, 计算错误】 1.12 证明:由题意可知 1(),0,1,2,...,i np x x i n θθθ=<<=从而有 ()()()()x x p x πθπθθπθ∝•00111n n n ααααθθθθθ++++∝•∝ 因此 θ的后验分布仍是Pareto 分布。
贝叶斯统计复习
贝叶斯统计习题1. 设θ是一批产品的不合格率,从中抽取8个产品进行检验,发现3个不合格品,假如先验分布为 (1)U 0,1θ()(2)21-0<<1=0,θθπθ⎧⎨⎩(),()其它 求θ的后验分布。
解:()()()()()111335368362(|)(1)*2(1)112(1)15(|)840(1),01m x p x d C d d p x x m x θπθθθθθθθθθθπθπθθθθ==--=-===-<<⎰⎰⎰2. 设12,,,n x x x 是来自均匀分布U 0,θ()的一个样本,又设θ的先验分布为Pareto 分布,其密度函数为+1000/>=0,αααθθθθπθθθ⎧⎨≤⎩,() 其中参数0>0,>0θα,证明:θ的后验分布仍为Pareto 分布。
解:样本联合分布为:1(),0np x x θθθ=<<1000/,()0,αααθθθθπθθθ+⎧>=⎨≤⎩{}110101()()()/1/,max ,,,n n n x p x x x αααπθθπθαθθθθθθ++++∝=∝>=因此θ的后验分布的核为11/n αθ++,仍表现为Pareto 分布密度函数的核即1111()/,()0,n n n x αααθθθθπθθθ+++⎧+>=⎨≤⎩即得证。
3.设12,,,n x x x 是来自指数分布的一个样本,指数分布的密度函数为-(|)=,>0x p x e x λλλ,(1) 证明:伽玛分布(,)Ga αβ是参数λ的共轭先验分布。
(2) 若从先验信息得知,先验均值为0.0002,先验标准差为0.0001,确定其超参数,αβ。
解:()()()111()1()()()()(),.nii x nn n x n n x p x ee ex p x e Ga n nx λλααβλαβλλλλβπλλαλπλλπλλαβ=----+--+∑===Γ∝∝++样本的似然函数:参数的后验分布服从伽马分布220.0002(2)4,20000.0.0001αβαβαβ⎧=⎪⎪⇒==⎨⎪=⎪⎩4. 设一批产品的不合格品率为θ,检查是一个接一个的进行,直到发现第一个不合格品停止检查,若设X 为发现第一个不合格品是已经检查的产品数,则X 服从几何分布,其分布列为 ()-1(=|)=1-,=1,2,x P X x x θθθ假如θ只能以相同的概率取三个值1/4, 2/4, 3/4,现只获得一个观察值=3x ,求θ的最大后验估计ˆMDθ。
第六章 贝叶斯统计初步
4i i 2 (1 ) 5 4
它的概率分布为
P( i / 4 X 2)
1/4
9/20
2/4
8/20
3/4
3/20
根据定理4知,在0-1损失函数下,的贝叶斯 ˆ 1 ,因为这是后验分布的众数。 估计应是
4
贝叶斯学派与经典学派的区别:
(1)贝叶斯学派的出发点与经典学派不同,后 者的出发点是样本分布的频率函数 p ( x; ) 。 (2)在给定样本等于x时,对 ( x) 或 f ( x; ) 的含义的解释上也不同,前者在贝叶斯学派眼 中是关于 的(条件)频率函数;而后者在经 典学派眼中(作为 的函数)并没有概率的含 义在里面,因而称为似然函数。
结论:对于随机变量X, (1)若 EX 2 ,则
E( X EX )2 mina E( X a)2
(2)若 E X ,M(X)为X的中位数,则
E X M ( X ) mina E X a
2 ˆ ˆ 定理2 在平方损失函数 L( , ) ( ) 下 , 的贝叶斯估计为后验分布 ( x) 的条件期望,
h( x, ) ( x)m( x) ~ ~ ~ 其中 m ( x )是 x 的边缘密度函数,公式为 ~
~
~
m( x) h( x, )d p ( x ) ( )d
~
它与 无关,或者说 m ( x )中不含 任何信息。 ~ 因此能用来对作出推断的仅是条件分布,它的 计算公式为
这就是参数为x+1和n-x+1的 分布B(x+1,n-x+1)。
第二节 贝叶斯估计
一、损失函数(lost function)
STAT
(完整版)贝叶斯统计-习题答案)
第一章 先验分布与后验分布1.1 解:令120.1,0.2θθ==设A 为从产品中随机取出8个,有2个不合格,则22618()0.10.90.1488P A C θ== 22628()0.20.80.2936P A C θ== 从而有5418.03.02936.07.01488.07.01488.0)()|()()|()()|()|(2211111=⨯+⨯⨯=+=θπθθπθθπθθπA P A P A P A 4582.0)|(1)|(4582.03.02936.07.01488.03.02936.0)()|()()|()()|()|(122211222=-==⨯+⨯⨯=+=A A or A P A P A P A θπθπθπθθπθθπθθπ1.2 解:令121, 1.5λλ==设X 为一卷磁带上的缺陷数,则()XP λ∴3(3)3!e P X λλλ-==R 语言求:)4(/)exp(*)3(^gamma λλ-1122(3)(3)()(3)()0.0998P X P X P X λπλλπλ∴===+== 从而有111222(3)()(3)0.2457(3)(3)()(3)0.7543(3)P X X P X P X X P X λπλπλλπλπλ==========1.3 解:设A 为从产品中随机取出8个,有3个不合格,则3358()(1)P A C θθθ=-(1) 由题意知 ()1,01πθθ=<< 从而有.10,)1(504)|(504)6,4(/1)6,4(1)6,4()1()1()1()1()1()1()1()()|()()|()|(535311614531535315338533810<<-==-=--=--=--==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求(2).10,)1(840)|(840)7,4(/1)7,4(1)7,4()1()1()1()1()1()1(2)1()1(2)1()()|()()|()|(636311714631636315338533810<<-==-=--=--=----==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求1.5 解:(1)由已知可得.5.125.11,110110/1)()|()()|()|(,2010,101)(5.125.111)|(2112211)|(12,2121,1)|(5.125.11201011111111<<===<<=<<=+<<-==+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθd d x p x p x x p x p x x x p ,,即,时,当(2)由已知可得.6.115.11,1010110/1)()|,,()()|,,(),,|(,2010,101)(6.115.111)|,,(,219.1121,214.1121,211.1121,217.1121215.11212112211)|,,(9.11,4.11,1.11,7.11,5.11,0.12,6,2,1,2121,1)|,,(6.115.112010621621621621621654321621<<===<<=<<=+<<-+<<-+<<-+<<-+<<-+<<-========+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθθθθθθθθθθθd d x x x p x x x p x x x x x x p x x x p x x x x x x i x x x x p i ,即,,时,当【原答案:由已知可得 ()1,0.50.5P x x θθθ=-<<+1(),102010πθθ=<< 11.611.51()0.0110m x d θ==⎰从而有()()()10,11.511.6()P x x m x θπθπθθ==<< 】1.6 证明:设随机变量()XP λ,λ的先验分布为(,)Ga αβ,其中,αβ为已知,则即得证!),(~),,|()()|,,(),,|(,0,)()(,!!)|,,(121)(121211112111βαλπλλπλλπλλαβλπλλλλβαβλααλλ++∑∑∝•∝>Γ=∑===+--+--=-=-==∏∏n x Ga x x x ex x x p x x x e x e x ex x x p ni i n n x n n ni in x ni i x n ni i ni ii【原答案: (),0!x e P x x λλλλ-=>1(),0()e ααβλβπλλλα--=>Γ 因此 11(1)()()()x x x P x e e e λαβλαβλπλλπλλλλ---+--+∝•∝= 所以 (,1)x Ga x λαβ++】 1.7 解:(1)由题意可知.1},max{,1)/(1)/(122)()|,,()()|,,(),,|(,10,1)(,,2,1,10,22)|,,(121},max{221},max{2121121212112122111<<∝===<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθπθθπθθπθθπθθθθn nx x nn x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 ()1,01πθθ=<< 因此122()12(1)xxm x d x θθ=•=-⎰因此 2()()1(),1()1P x x x x m x x θπθπθθθ==<<- (实质是新解当n=1的情形)】(2) 由题意可知.1},max{,1)/(1)/(13232)()|,,()()|,,(),,|(,10,3)(,,2,1,10,22)|,,(12-21},max{2-22-21},max{2212211212121212122111<<∝=⨯⨯==<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθθθπθθπθθπθθθπθθθθn n x x n n x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 1222()36xm x d x θθθ=•=⎰因此 ()()()1,01()P x x m x θπθπθθ==<<】 1.8 解:设A 为100个产品中3个不合格,则3397100()(1)P A C θθθ=-由题意可知 199(202)()(1),01(200)πθθθθΓ=-≤≤Γ 因此 3971994296()()()(1)(1)(1)A P A πθθπθθθθθθθ∝•∝--=- 由上可知)297,5(~)|(Be A θπ1.9 解:设X 为某集团中人的高度,则2(,5)XN θ∴25(,)10XNθ ∴2(176.53)5()p x θθ--=由题意可知 2(172.72)5.08()θπθ--=又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222(176.53)(172.72)(174.64)55.0821.26eeeθθθ------⨯∝•∝因此 (174.64,1.26)x N θ1.10 证明:设22(,),,N u u θσσ其中为已知又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222222251()()11252()11225252u x x u eeeσθθθσσσ+----+⨯--⨯+⨯∝∝因此 222251(,)112525u x xN σθσσ+++又由于21112525σ≤+ 所以 θ的后验标准差一定小于151.11 解:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)X U θ.8,861)/(1192192)()|,,()()|,,(),,|(,4,192)(.81)|,,(8,8,5.3,2,1,0,1)|,,(768778774321321321433213213321>⨯====≥=>=====<<=⎰⎰⎰∞∞∞θθθθθθθθθθπθθπθθπθθθπθθθθθθd d d x x x p x x x p x x x x x x p x x x i x x x x p i ,时,当【原答案:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)XU θ∴1(),0p x x θθθ=<<当8θ>时,31()p x θθ=43819211()8192m x d θθθ+∞==⎰从而有 7()()3()()128p x x m x θπθπθθ==, 计算错误】1.12 证明:由题意可知 1(),0,1,2,...,i np x x i n θθθ=<<=从而有 ()()()()x x p x πθπθθπθ∝•00111n n n ααααθθθθθ++++∝•∝ 因此 θ的后验分布仍是Pareto 分布。
贝叶斯统计1.4-1.6
k 1 2 S2 ( ) i k 1 i 1
然后令其分别等于贝塔分布Be(α,β) 的期望与方差
2 S 2 ( 1)
2
(1 ) ˆ 1 2 S 解之,可得参数α与β的估计值 (1 ) ˆ (1 ) S 2 1
2 2 2
1 (vn / 2 1) 2 2 1 ( 2) exp v K ( u u ) n n 2 n n 2 这与 ( , 2 ) ( | 2 ) ( 2 ) 1 (vn / 2 1) 2 2 1 ( 2) exp v K ( u u ) 0 0 2 n n 2 形式相同
假如根据先验信息可获得先验均值和p分位数p,则 可列出下列方程的 p ( ) 1 (1 ) 1d p 0 ( )( ) 解之,可得参数α与β的估计值。 四、其它方法 假如根据先验信息可获得先验均值,令
例如用两个上下四分位数U和L来确定α与β
L
0 1
U
( ) 1 1 (1 ) d 0.25 ( )( ) ( ) 1 (1 ) 1d 0.25 从这两个方程 ( )( ) 解出α与β
5
三、利用先验矩和先验分位数
(1 , 2 x ) p( x 1 , 2 ) (1 , 2 )
8
在多参数问题中,人们关心的常常是其中一个或少数几 个参数,这时其余参数常被称为讨厌参数或多余参数。
在处理讨厌参数上,贝叶斯方法要比经典方法方便得多。 例如讨厌参数2,为了获得1的边际后验密度,只要对 讨厌参数积分即可。
贝叶斯统计1.3
5
二、后验分布的计算
参数 的后验分布为 ( | x ) p( x | ) ( ) / m( x ) 由于m(x)不依赖于 ,在计算的后验分布中仅起到 一个正则化因子的作用。假如把m(x)省略,把贝叶斯 公式改写为如下等价形式
( | x ) p( x | ) ( )
设X服从伽玛分布Ga(,),其中>0为形状参数, >0为尺度参数,其密度函数为 1 x p( x , ) x e ,x0 ( ) Y=1/X的密度函数为 1
1 p( y , ) ( ) y
e ,y0
故 ( x) ~ (a xi , n )
i 1 n
.
17
若后验分布( x)与( )属于同一个分布族, 则称该分布族是 的共轭先验分布(族)。 二项分布b(n, )中的成功概率 的共轭先验分布 是贝塔分布Be(α,β); 泊松分布P( )中的均值 的共轭先验分布是伽玛 分布Ga(,); 指数分布中均值的倒数 的共轭先验分布是伽玛 分布Ga(,); 在方差已知时,正态均值 的共轭先验分布是正 态分布N(, 2); 在均值已知时,正态方差 2的共轭先验分布是 倒伽玛分布IGa(,)。 18
n1
2 样本x的边际密度函数为 m( x ) h( x , )d k2 A2 1/ 2 ( B / A) 2 exp , 参数 的后验分布为 ( x ) 2/ A A
12
2的正态分布 这是参数为μ1, 和 τ 1
8
三、共轭先验分布的优缺点
共轭先验分布的有两个优点 1.计算方便。 2.共轭先验分布的一些参数可以得到很好的解释。 例1.3.3 “正态均值(方差已知)的共轭先验分布是正态 分布”的例子中,其后验均值为 2
【贝叶斯统计答案】第二章+第三章
【贝叶斯统计答案】第二章+第三章第二章,,tpte(),,,2.2 解: 由题意,变量t服从指数分布:,,tni,pTe(),,,样本联合分布,,,,1,,,~(,),0Gae,,且, E()0.2,,Var()1,,,,,,,,(),由伽玛分布性质知:,,0.2,,,,0.04,0.2,,, ,,,,,1,2,,,t,3.8 又已知 n=20,nnnt,,,,,,20.04,76.2t,,,203.876,i,i ,所以 ,1,1ii由于伽玛分布是指数分布参数的共轭先验分布,而且后验分布,,,,,,tt(),,,,,nn,,,11,,ii()()()tpTeee,,,,,,,,,,, GantGa(,)(20.04,76.2),,,,,即后验分布为 ,i,,n20.04,|TE()0.263,,,, ,t76.2,,i,1IGantIGa(,)(20.04,76.2),,,,,服从倒伽玛分布 ,,,,i,,t,i,,||1,TT()()4.002EE,,,,, 1,,n,11,,2.3可以算出的后验分布为,的后验期望估计的后验方差为. Ga(11,4)16 n,362.5只有个别人算错了,答案是.2.6大家差不多都做对了.,,,1,,,,,,/,,00,2.7的先验分布为:(), ,,,0,,,,0,,,,max,,,xx令 ,,101n,,,,,nn1,()/,,,,,,,,n11可得后验分布为:()x, ,,,0,,,,,1(),,,n1,Ex(),则的后验期望估计为:, ,n,,1,2(),,,n1后验方差为:. Varx(),,2(1)(2)nn,,,,,,n1,,,2.8由xGaIGa~(,),~(,)可以得出 22,n12()1n,,1x,2,22 pxxex,,,(),0n,()2,,,,(1),,,,(),0,,e ,,,,,(),,(1)的后验分布为:x,2,n,,,,(1),22, ,,,,,,()()()xpxe,,nxIGa(,),,,,即为倒伽玛分布的核。
贝叶斯统计原理及方法优秀-2022年学习资料
伽玛分布-如果随机变量X具有概率密度函数-e-D-Fa-x-1-x≥0-0,-x<0-则称X服从伽玛分布, 作X~Gaa,入.-其中a>0为形状参数,入>0为尺度参数,-6
EX=于-」e=iara,-Ta+11o-To2-aa+1-EX2=-22-C-VrX=EX2-[EX]2 -7
贝塔函数-Ba,b=[x"1-x-dx-称为贝塔函数,其中参数a>0,b>0-贝塔函数的性质:1Ba,b= b,a-TaTb-2Ba,b=-Ta+b-10
Bayesian Statistics-贝叶斯统计-1
贝叶斯统计-预修要求:已修过概率论与数理统计-基本教材:-茆诗松编,贝叶斯统计-中国统计出版社,2005年
[1]贝叶斯统计与决策.Berger J O.中国统计出版-社.1998-[2]现代贝叶斯统计.Kotz ,吴喜之.中国统计出版-社.1999-[3]贝叶斯统计推断.张尧庭、陈汉峰.科学出版-社.1991
经典统计学:基于以上两种信息进行的统计推断被-称为经典统计学。-•说明:它的基本观点是把数据(样本)看成是 自-具有一定概率分布的总体,所研究对象是这个总体而-不局限于数据本身。-据现有资料看,这方面最早的工作是高 和勒让德-德误差分析、正态分布和最小二乘法。从十九世纪末-期到二十世纪中叶,经皮尔逊、费歇和奈曼等人杰出工作创立了经典统计学。-²随着经典统计学的持续发展与广泛应用,它本身的-缺陷也逐渐暴露出来了。-23
贝叶斯方法Bayesian approach-贝叶斯方法是基于贝叶斯定理而发展起来用于系-统地阐述和解决统 问题的方法Samuel Kotz和-吴喜之,2000。-贝叶斯推断的基本方法是将关于未知参数的先-验信息与 本信息综合,再根据贝叶斯定理,得-出后验信息,然后根据后验信息去推断未知参数-茆诗松和王静龙等,1998年 -“贝叶斯提出了一种归纳推理的理论(贝叶斯定-理,以后被一些统计学者发展为一种系统的统计-推断方法,称为贝 斯方法.”一摘自《中国大百-科全书》(数学卷)-16
浙江财经贝叶斯复习文档
例1.6 正态均值(方差已知)的共轭先验分布是正态分布。
设x1, x2,…,xn是来自正态分布N(θ,2σ) 的一个样本观察值。
其中2σ已知样本的似然函数为:2211(|)e x p()2nniip x xθθσ=⎧⎫⎛=--⎨⎬⎝⎩⎭∑取另一正态分布N(μ, 2τ)作为正态均值θ的先验分布,即221()()e x p,2θμπθθτ⎧⎫-=--∞<<+∞⎨⎬⎩⎭其中μ, 2τ为已知。
由此可以写出样本x与参数θ的联合密度函数22221122212(,)e x p2niin n x xnh x kθθθμθμθστ=⎧⎫⎡⎤-+⎪⎪⎢⎥-+⎪⎪⎢⎥=-+⎨⎬⎢⎥⎪⎪⎢⎥⎪⎪⎣⎦⎩⎭∑其中(1)/211(2)n nkπτσ-+--=,1niixxn==∑。
若在记220nσσ=,2211Aστ=+,22xBμστ=+,222211niiC xμστ==+∑,则有211(,)e x p22h x k A B Cθθθ⎧⎫⎡⎤=--+⎨⎬⎣⎦⎩⎭22(/)e xp2/B AkAθ⎧⎫-=-⎨⎬⎩⎭样本x的边际密度函数为1222()(,)m x h x d kAπθθ+∞-∞⎛⎫== ⎪⎝⎭⎰参数θ的后验分布为1/222(/)()e x p,2/B AxA Aπθπθ-⎧⎫-⎛⎫=-⎨⎬⎪⎝⎭⎩⎭这是参数为μ1, 21τ和的正态分布22122222010111,xBAσμτμσττστ----+===++例 1.7 二项分布中的成功概率θ的共轭先验分布是贝塔分布,设总体中X ~b (n ,θ ),先验分布Be(α,β),θ的后验分布解:设总体中X ~b (n ,θ ),先验分布Be (α,β),θ的后验分布为这是贝塔分布Be (α+x ,β+n -x ) 的核. θ的后验分布1.2 设一卷磁带上的缺陷数服从泊松分布)(λP ,其中λ可取1.0和1.5中的一个,又设λ的先验分布为6.0)5.1(,4.0)0.1(==ππ,假如检查一卷磁带发现了3个缺陷,求θ的后验分布。
贝叶斯统计3.4,3.5
), 这类密度组成
位置 尺度参数族, 称为位置 尺度参数.(如N ( , 2 ))
设 和 相互独立, 故其的联合分布为 ( , ) 1 1 1 ,
例 Weibull密度函数
x 1 x p ( x; , ) ( ) exp[ ( ) ],
n
2
2
,: ( ) 1;
1
当已知, I ( ) 2n , ( ) ; 当 和 独立, ( , ) 1.
28
例3.4.10 设θ为成功概率,则在n次独立试验中成功次数 n X服从二项分布,即: P( X x) (1 ) , x 0,1,2,, n
1
p( ), 这类密度
x
设想要X 改变比例, 即Y cX (c 0), 类似地定义 c , 则Y的密度 函数为 1
p( ).因此( X , )问题与(Y , )问题的统计结构相同.
y
设 的先验密度为 ( ),的先验密度为 * ( ), 有 ( ) * ( ),同时 1 1 ( ) ( ), 则 ( ) ( ). c c c c 1 取 c, 则有 (c) (1), 取c , 则 ( ) 1. c
Jeffreys先验
l (3)对数似然 l lnp(x | )对 i 的偏导数 , i 1,..., p, 都存 i
在,常称随机向量
S (x) (
l l ' ,..., ) i p
为记分向量或记分函数; (4)对p(x|θ )的积分与微分运算可以交换; (5)对一切 1 i, j p ,有
贝叶斯统计知识整理
贝叶斯统计知识整理第⼀章先验分布和后验分布统计学有两个主要学派,频率学派与贝叶斯学派。
频率学派的观点:统计推断是根据样本信息对总体分布或总体的特征数进⾏推断,这⾥⽤到两种信息:总体信息和样本信息;贝叶斯学派的观点:除了上述两种信息以外,统计推断还应该使⽤第三种信息:先验信息。
贝叶斯统计就是利⽤先验信息、总体信息和样本信息进⾏相应的统计推断。
1.1三种信息(1)总体信息:总体分布或所属分布族提供给我们的信息(2)样本信息:从总体抽取的样本提供给我们的信息(3)先验信息:在抽样之前有关统计推断的⼀些信息1.2贝叶斯公式⼀、贝叶斯公式的三种形式(⼀)贝叶斯公式的事件形式假定k A A ,,1 是互不相容的事件,它们之和i ki A 1= 包含事件B ,即i ki A B 1=? 则有:∑==ki ii i i i A B P A P A B P A P B A P 1)()()()()((⼆)贝叶斯公式的密度函数形式1.贝叶斯学派的⼀些具体思想假设I :随机变量X 有⼀个密度函数);(θx p ,其中θ是⼀个参数,不同的θ对应不同的密度函数,故从贝叶斯观点看,);(θx p 是在给定θ后的⼀个条件密度函数,因此记为)(θx p 更恰当⼀些。
在贝叶斯统计中记为)(θx p 它表⽰在随机变量θ给定某个值时,总体指标X 的条件分布。
这个条件密度能提供我们的有关的θ信息就是总体信息。
假设II :当给定θ后,从总体)(θx p 中随机抽取⼀个样本X1,…,Xn ,该样本中含有θ的有关信息。
这种信息就是样本信息。
假设III :从贝叶斯观点来看,未知参数θ是⼀个随机变量。
⽽描述这个随机变量的分布可从先验信息中归纳出来,这个分布称为先验分布,其密度函数⽤)(θπ表⽰。
2.先验分布定义1:将总体中的未知参数Θ∈θ看成⼀取值于Θ的随机变量,它有⼀概率分布,记为)(θπ,称为参数θ的先验分布。
3.后验分布(1)从贝叶斯观点看,样本x =(1x ,…,n x )的产⽣要分两步进⾏。
贝叶斯统计-习题答案)
第一章 先验分布与后验分布1.1 解:令120.1,0.2θθ==设A 为从产品中随机取出8个,有2个不合格,则22618()0.10.90.1488P A C θ== 22628()0.20.80.2936P A C θ== 从而有5418.03.02936.07.01488.07.01488.0)()|()()|()()|()|(2211111=⨯+⨯⨯=+=θπθθπθθπθθπA P A P A P A 4582.0)|(1)|(4582.03.02936.07.01488.03.02936.0)()|()()|()()|()|(122211222=-==⨯+⨯⨯=+=A A or A P A P A P A θπθπθπθθπθθπθθπ1.2 解:令121, 1.5λλ== 设X 为一卷磁带上的缺陷数,则()XP λ∴3(3)3!e P X λλλ-==R 语言求:)4(/)exp(*)3(^gamma λλ-1122(3)(3)()(3)()0.0998P X P X P X λπλλπλ∴===+== 从而有111222(3)()(3)0.2457(3)(3)()(3)0.7543(3)P X X P X P X X P X λπλπλλπλπλ==========1.3 解:设A 为从产品中随机取出8个,有3个不合格,则3358()(1)P A C θθθ=-(1) 由题意知 ()1,01πθθ=<< 从而有.10,)1(504)|(504)6,4(/1)6,4(1)6,4()1()1()1()1()1()1()1()()|()()|()|(53531161453153531533853381<<-==-=--=--=--==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求(2).10,)1(840)|(840)7,4(/1)7,4(1)7,4()1()1()1()1()1()1(2)1()1(2)1()()|()()|()|(63631171463163631533853381<<-==-=--=--=----==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求1.5 解:(1)由已知可得.5.125.11,110110/1)()|()()|()|(,2010,101)(5.125.111)|(2112211)|(12,2121,1)|(5.125.11201011111111<<===<<=<<=+<<-==+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθd d x p x p x x p x p x x x p ,,即,时,当(2)由已知可得.6.115.11,1010110/1)()|,,()()|,,(),,|(,2010,101)(6.115.111)|,,(,219.1121,214.1121,211.1121,217.1121215.11212112211)|,,(9.11,4.11,1.11,7.11,5.11,0.12,6,2,1,2121,1)|,,(6.115.112010621621621621621654321621<<===<<=<<=+<<-+<<-+<<-+<<-+<<-+<<-========+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθθθθθθθθθθθd d x x x p x x x p x x x x x x p x x x p x x x x x x i x x x x p i ,即,,时,当【原答案:由已知可得 ()1,0.50.5P x x θθθ=-<<+1(),102010πθθ=<< 11.611.51()0.0110m x d θ==⎰从而有()()()10,11.511.6()P x x m x θπθπθθ==<< 】1.6 证明:设随机变量()XP λ,λ的先验分布为(,)Ga αβ,其中,αβ为已知,则即得证!),(~),,|()()|,,(),,|(,0,)()(,!!)|,,(121)(121211112111βαλπλλπλλπλλαβλπλλλλβαβλααλλ++∑∑∝•∝>Γ=∑===+--+--=-=-==∏∏n x Ga x x x ex x x p x x x e x e x e x x x p ni i n n x n n ni in x ni i x n ni i ni ii【原答案: (),0!x e P x x λλλλ-=>1(),0()e ααβλβπλλλα--=>Γ 因此 11(1)()()()x x x P x e e e λαβλαβλπλλπλλλλ---+--+∝•∝= 所以 (,1)x Ga x λαβ++】 1.7 解:(1)由题意可知.1},max{,1)/(1)/(122)()|,,()()|,,(),,|(,10,1)(,,2,1,10,22)|,,(121},max{221},max{2121121212112122111<<∝===<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθπθθπθθπθθπθθθθn nx x nn x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 ()1,01πθθ=<< 因此122()12(1)xxm x d x θθ=•=-⎰因此 2()()1(),1()1P x x x x m x x θπθπθθθ==<<- (实质是新解当n=1的情形)】(2) 由题意可知.1},max{,1)/(1)/(13232)()|,,()()|,,(),,|(,10,3)(,,2,1,10,22)|,,(12-21},max{2-22-21},max{2212211212121212122111<<∝=⨯⨯==<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθθθπθθπθθπθθθπθθθθn n x x n n x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 1222()36xm x d x θθθ=•=⎰因此 ()()()1,01()P x x m x θπθπθθ==<<】1.8 解:设A 为100个产品中3个不合格,则3397100()(1)P A C θθθ=-由题意可知 199(202)()(1),01(200)πθθθθΓ=-≤≤Γ 因此 3971994296()()()(1)(1)(1)A P A πθθπθθθθθθθ∝•∝--=- 由上可知)297,5(~)|(Be A θπ1.9 解:设X 为某集团中人的高度,则2(,5)XN θ∴25(,)10XN θ∴2(176.53)5()p x θθ--=由题意可知 2(172.72)5.08()θπθ--=又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222(176.53)(172.72)(174.64)55.0821.26eeeθθθ------⨯∝•∝因此(174.64,1.26)x N1.10 证明:设22(,),,N u u θσσ其中为已知又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222222251()()11252()11225252u x x u eeeσθθθσσσ+----+⨯--⨯+⨯∝∝因此 222251(,)112525u x xN σθσσ+++又由于21112525σ≤+ 所以 θ的后验标准差一定小于151.11 解:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)X U θ.8,861)/(1192192)()|,,()()|,,(),,|(,4,192)(.81)|,,(8,8,5.3,2,1,0,1)|,,(768778774321321321433213213321>⨯====≥=>=====<<=⎰⎰⎰∞∞∞θθθθθθθθθθπθθπθθπθθθπθθθθθθd d d x x x p x x x p x x x x x x p x x x i x x x x p i ,时,当【原答案:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)XU θ∴1(),0p x x θθθ=<<当8θ>时,31()p x θθ=43819211()8192m x d θθθ+∞==⎰从而有 7()()3()()128p x x m x θπθπθθ==, 计算错误】1.12 证明:由题意可知 1(),0,1,2,...,i np x x i n θθθ=<<=从而有 ()()()()x x p x πθπθθπθ∝•00111n n n ααααθθθθθ++++∝•∝ 因此 θ的后验分布仍是Pareto 分布。
贝叶斯统计2.1-2.2
Var ( X ) 2 ( ) ( 1)
11
E( X )
例2.2.2 为了估计不合格品率 ,今从一批产品中随机 抽取n件,其中不合格品数X b(n, ), 的先验分布取 Be(α,β),它的后验分布为Be(α+x,β+n-x). 所以
后验分布( x)对 是非减的,又因为 的取值 ˆ x. 不能超过x,故 的最大后验估计为 MD
15
二、贝叶斯估计的误差
ˆ 是一个 设 ˆ 是 的一个贝叶斯估计,在样本给定后,
数,在综合各种信息后, 是按 ( x ) 取值,所以评价一个 贝叶斯估计的误差的最好而又简单的方式是用对 ˆ的后验 均方差或平方根来度量,定义如下:
2
3. 条件方法与频率方法的区别:(以对估计的无偏性 认识为例)例如经典统计学认为参数的无偏估计应 满足:
ˆ( x ) E
x
ˆ( x) p ( x | )dx
其中平均是对样本空间中所有可能出现的样本而 求的,可实际中样本空间中绝大多数样本尚为出现 过,而多数从未出现的样本也要参与平均是实际工 作者难以理解的。故在贝叶斯推断中不用无偏性, 而条件方法是容易被实际工作者理解和接受的。
4
例2.6.2
Pratt(1962)一位工程师在对电子管的一个随机样本 测量板极电压时,所用测量仪器极其精密,以致误差 可忽略不计。一位统计学家检查了测量值,看上去为 正态分布,变化范围为75到99伏特,均值为87,标准 差为4。他进行了统计分析,给出正态均值的置信区 间。后来他到实验室发现,电压计读数至多为100伏 特。于是认为总体是“截尾的”,应重新处理数据。 但工程师说,他有另一台电压计,同样精度,能测到 1000伏特。如果电压超过100伏特,就会用这一台测 量。这使频率派统计学家感到放心,因为这表明总体 毕竟是完整的,无须重新处理数据。 第二天工程师打电话说:“我刚刚发现那台高量 程的电压计坏了。”统计学家查明,那台高量程的 电压计修复之前,试验没有停止,故通知工程师, 数据需要重新分析。 5
贝叶斯分析汇总讲解
第一章先验分布与后验分布§1.1三种信息统计学中有二个主要学派:频率学派和贝叶斯学派。
一、总体信息即总体分布或总体所属分不足给我们的信息,譬如,“总体是正态分布”这一句话就带给我们很多信息:它的密度函数是一条钟形曲线;它的一切距都存在;有关正态变量(服从正态分布的变量)的一些事件的概率可以计算,有正态分布可以导出2χ分布、t分布和F分布等重要分布;还有许多成熟的点估计、区间估计和假设检验方法可供我们选用。
二、样本信息即从总体抽取的样本给我们提供的信息。
这是最“新鲜”的信息,并且越多越好。
我们希望通过对样本信息的加工和处理对总体的某些特征作出较为精确的统计推断。
没有样本就没有统计学而言。
基于上述信息进行的统计推断被称为经典统计学,它的基本观点是把数据(样本)看成是来自具体一定概率分布的总体,所研究的对象是这个总体而不是局限于数据本身。
三、先验信息即在抽样之前有关统计问题的一些信息,一般说来,先验信息主要来源于经验和历史资料。
例如,英国统计学家(1961)Savage曾考察如下实验,一位常饮牛奶加茶的妇女称,她能辨别先倒进杯子里的是茶还是牛奶。
对此作了十次试验,她都正确地说出了。
假如被实验者是在猜测,每次成功的概率为0.5,那么十次-=,这是一个很小的概率,是几乎不可能发生的,都猜中的概率为1020.0009766所以“每次成功的概率为0.5”的假设应被拒绝。
被实验者每次成功的概率要比0.5大很多,这正是她的经验帮了她的忙活,所以先验信息在推断中不可忽视。
基于上述三种信息进行的统计推断被称为贝叶斯统计学。
它与经典统计学的最主要的差别在于是否利用先验信息。
在使用样本信息上也是有差异的。
贝叶斯学派很重视已出现的样本观察值,而对尚未发生的样本观察值不予考虑,贝叶斯学派很重视先验信息的收集、挖掘和加工,使它数量化,形成先验分布,参加到统计推断中来,以提高统计推断的质量。
贝叶斯学派最基本的观点是:任何一个未知量θ都可看作一个随机变量,应用一个概率分布去描述对θ的未知状况。
贝叶斯统计老师划的课后复习题
1.1设θ是一批产品的不合格率,已知它不是0.1就是0.2,且其先验分布为 π(0.1)=0.7 π(0.2)=0.3.假如从这批产品中随机抽取8个进行检查,发现有两个不合格品。
求θ的后验分布。
解:令120.1,0.2θθ==设A 为从产品中随机取出8个,有2个不合格,则22618()0.10.90.1488P A C θ== 22628()0.20.80.2936P A C θ== 从而有1111122()()()0.4582()()()()P A A P A P A θπθπθθπθθπθ==+2221122()()()0.5418()()()()P A A P A P A θπθπθθπθθπθ==+1.2 设一卷磁带上的缺陷数服从泊松分布P (λ),其中λ可取1和1.5中的一个,又设λ的先验分布为π(1)=0.4 π(1.5)=0.6.假如检查一卷磁带发现了3个缺陷,求λ的后验分布。
解:令121, 1.5λλ==设X 为一卷磁带上的缺陷数,则()X P λ:∴3(3)3!e P X λλλ-==1122(3)(3)()(3)()0.0998P X P X P X λπλλπλ∴===+== 从而有111222(3)()(3)0.2457(3)(3)()(3)0.7543(3)P X X P X P X X P X λπλπλλπλπλ==========1.3 设θ是一批产品的不合格率,从中抽取8个产品进行检验,发现3个不合格品,假如先验分布为 (1)θ~u(0,1) (2)θ~π(θ)={10 )1(2else0<<-θθ解:设A 为从产品中随机取出8个,有3个不合格,则3358()(1)P A C θθθ=-(1) 由题意知 ()1,01πθθ=<< 从而有 351()()()504(1),01()()P A A P A d θπθπθθθθθπθθ==-<<⎰(2)361()()()47040(1),01()()P A A P A d θπθπθθθθθπθθ==-<<⎰1.10 从正态总体N (0,4)中随机抽取容量为100的样本,又设θ的先验分布为正态分布。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
贝叶斯统计习题
1. 设θ是一批产品的不合格率,从中抽取8个产品进行检验,发现3个不合格品,假如
先验分布为 (1)U 0,1θ()
(2)21-0<<1=0,θθπθ⎧⎨
⎩(),()其它 求θ的后验分布。
解:
2. 设12,,
,n x x x 是来自均匀分布U 0,θ()的一个样本,又设θ的先验分布为Pareto 分布,
其密度函数为 其中参数0>0,>0θα,证明:θ的后验分布仍为Pareto 分布。
解:样本联合分布为:
因此θ的后验分布的核为11/n αθ++,仍表现为Pareto 分布密度函数的核 即1111()/,()0,n n n x αααθθθθπθθθ+++⎧+>=⎨≤⎩
即得证。
3. 设12,,,n x x x 是来自指数分布的一个样本,指数分布的密度函数为-(|)=,>0x p x e x λλλ,
(1) 证明:伽玛分布(,)Ga αβ是参数λ的共轭先验分布。
(2) 若从先验信息得知,先验均值为0.0002,先验标准差为0.0001,确定其超参数,αβ。
解:
4. 设一批产品的不合格品率为θ,检查是一个接一个的进行,直到发现第一个不合格品停止检查,若设X 为发现第一个不合格品是已经检查的产品数,则X 服从几何分布,其分布列为 ()-1(=|)=1-,=1,2,x P X x x θθ
θ
假如θ只能以相同的概率取三个值1/4, 2/4, 3/4,现只获得一个观察值=3x ,求θ的最大后
验估计ˆMD
θ。
解:θ的先验分布为
在θ给定的条件下,X=3的条件概率为
联合概率为
X=3的无条件概率为
θ的后验分布为
5。
设x 是来自如下指数分布的一个观察值,
取柯西分布作为θ的先验分布,即
求θ的最大后验估计ˆMD
θ。
解 后验密度
6. 设12=(,,,)n x x x x 是来自均匀分布(0,)U θ的一个样本,又设θ服从Pareto 分布,密度函数为
求θ的后验均值和后验方差。
解:θ的先验分布为:1000/,()0,αααθθθθπθθθ+⎧>=⎨≤⎩
令{}101max ,,,n x x θθ= 可得后验分布为:1111
()/,()0,n n n x αααθθθθπθθθ+++⎧+>=⎨≤⎩ 则θ的后验期望估计为:1()()1
n E x n αθθα+=+-, 后验方差为:212()()(1)(2)
n Var x n n αθθαα+=+-+-. 7. 设x 服从伽玛分布1(,)22n Ga θ
,θ的分布为倒伽玛分布(,)IGa αβ, (1) 证明:在给定x 的条件下,θ的后验分布为倒伽玛分布(+,+)22
n x IGa αβ。
(2) 求θ的后验均值与后验方差。
解:由1~(,),~(,)22n x Ga IGa θαβθ
可以得出 (1)θ的后验分布为: 即为倒伽玛分布(,
)22
n
x IGa αβ++的核。
所以θ的后验分布为(,)22
n x IGa αβ++ (2)后验均值为22()2212
x x E x n n ββθαα++==+-+- 后验方差为2
2()2()(1)(2)22x Var x n n βθαα+=+-+- 8. 对正态分布(,1)N θ作观察,获得三个观察值:2,3,5,若θ的先验分布为(3,1)N ,求
θ的0.95可信区间。
9. 设某电子元件的失效时间X 服从指数分布,其密度函数为
若未知参数θ的先验分布为倒伽玛分布(1,0.01)IGa 。
计算该种元件在时间200之前失效的边缘密度。
解:
10. 设12,,,n X X X 相互独立,且(),=1,,i i X P i n θ。
若12,,,n θθθ是来自伽玛分布(),Ga αβ的一个样本,找出对12=(,,
,)n X x x x 的联合边缘密度。
解: 11. 某厂准备一年后生产一种新产品,如今有三个方案供选择:改建本厂原有生产线(1a ),从国外引进一条自动化生产线(2a );与兄弟厂协助组织“一条龙”生产线(3a )。
厂长预计一年后市场对此产品的需求量大致可分为三种:较高(1θ);一般(2θ);较低(3θ)。
假设其收益矩阵为(单位:万元),700980400=250-50090-200-800-30Q ⎛⎫ ⎪ ⎪ ⎪⎝⎭
假设厂长根据自己对一年后市场需求量是高,中,低,给出的主观概率分别为0.6,0.3,0.1。
求在悲观准则,乐观准则,和先验期望准则下的最优行动。
解:悲观准则下:首先行动1a ,2a ,3a 的最小收益分别为-200,-800,-30,。
然后选出其中
最大的收益为-30,从而最优行动为3a
乐观准则下:首先行动1a ,2a ,3a 的最大收益分别为700,980,400,。
然后选出其中
最大的收益为980,从而最优行动为2a 。
先验期望准则下:各行动的先验期望收益为
从而最优行动为1a 。
12. 某水果店准备购进一批苹果投放市场,市场需求量和采购量都在500至2000公斤之间,已知其收益函数为0.8-0.38,5000.9(,)0.34,
0.92000a a Q a a a θθθθ≤≤⎧=⎨≤≤⎩,假设θ的先验分布为 []500,2000上的均匀分布,该店应购进多少苹果可使先验期望收益最大?
解:先验期望收益为
当a=1343时,先验期望达到最大,故应购进1343公斤苹果。