【贝叶斯统计】第一章 先验分布与后验分布
贝叶斯统计-习题答案)

第一章 先验分布与后验分布1.1 解:令120.1,0.2θθ==设A 为从产品中随机取出8个,有2个不合格,则22618()0.10.90.1488P A C θ== 22628()0.20.80.2936P A C θ== 从而有5418.03.02936.07.01488.07.01488.0)()|()()|()()|()|(2211111=⨯+⨯⨯=+=θπθθπθθπθθπA P A P A P A 4582.0)|(1)|(4582.03.02936.07.01488.03.02936.0)()|()()|()()|()|(122211222=-==⨯+⨯⨯=+=A A or A P A P A P A θπθπθπθθπθθπθθπ1.2 解:令121, 1.5λλ==设X 为一卷磁带上的缺陷数,则()XP λ∴3(3)3!e P X λλλ-==R 语言求:)4(/)exp(*)3(^gamma λλ-1122(3)(3)()(3)()0.0998P X P X P X λπλλπλ∴===+== 从而有111222(3)()(3)0.2457(3)(3)()(3)0.7543(3)P X X P X P X X P X λπλπλλπλπλ==========1.3 解:设A 为从产品中随机取出8个,有3个不合格,则3358()(1)P A C θθθ=-(1) 由题意知 ()1,01πθθ=<< 从而有.10,)1(504)|(504)6,4(/1)6,4(1)6,4()1()1()1()1()1()1()1()()|()()|()|(535311614531535315338533810<<-==-=--=--=--==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求(2).10,)1(840)|(840)7,4(/1)7,4(1)7,4()1()1()1()1()1()1(2)1()1(2)1()()|()()|()|(63631171463163631533853381<<-==-=--=--=----==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求1.5 解:(1)由已知可得.5.125.11,110110/1)()|()()|()|(,2010,101)(5.125.111)|(2112211)|(12,2121,1)|(5.125.11201011111111<<===<<=<<=+<<-==+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθd d x p x p x x p x p x x x p ,,即,时,当(2)由已知可得.6.115.11,1010110/1)()|,,()()|,,(),,|(,2010,101)(6.115.111)|,,(,219.1121,214.1121,211.1121,217.1121215.11212112211)|,,(9.11,4.11,1.11,7.11,5.11,0.12,6,2,1,2121,1)|,,(6.115.112010621621621621621654321621<<===<<=<<=+<<-+<<-+<<-+<<-+<<-+<<-========+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθθθθθθθθθθθd d x x x p x x x p x x x x x x p x x x p x x x x x x i x x x x p i ,即,,时,当【原答案:由已知可得 ()1,0.50.5P x x θθθ=-<<+1(),102010πθθ=<< 11.611.51()0.0110m x d θ==⎰从而有()()()10,11.511.6()P x x m x θπθπθθ==<< 】1.6 证明:设随机变量()XP λ,λ的先验分布为(,)Ga αβ,其中,αβ为已知,则即得证!),(~),,|()()|,,(),,|(,0,)()(,!!)|,,(121)(121211112111βαλπλλπλλπλλαβλπλλλλβαβλααλλ++∑∑∝•∝>Γ=∑===+--+--=-=-==∏∏n x Ga x x x ex x x p x x x e x e x e x x x p ni i n n x n n ni in x ni i x n ni i ni ii【原答案: (),0!x e P x x λλλλ-=>1(),0()e ααβλβπλλλα--=>Γ 因此 11(1)()()()x x x P x e e e λαβλαβλπλλπλλλλ---+--+∝•∝= 所以 (,1)x Ga x λαβ++】 1.7 解:(1)由题意可知.1},max{,1)/(1)/(122)()|,,()()|,,(),,|(,10,1)(,,2,1,10,22)|,,(121},max{221},max{2121121212112122111<<∝===<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθπθθπθθπθθπθθθθn nx x nn x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 ()1,01πθθ=<< 因此122()12(1)xxm x d x θθ=•=-⎰因此 2()()1(),1()1P x x x x m x x θπθπθθθ==<<-(实质是新解当n=1的情形)】 (2) 由题意可知.1},max{,1)/(1)/(13232)()|,,()()|,,(),,|(,10,3)(,,2,1,10,22)|,,(12-21},max{2-22-21},max{2212211212121212122111<<∝=⨯⨯==<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθθθπθθπθθπθθθπθθθθn n x x n n x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 1222()36xm x d x θθθ=•=⎰因此 ()()()1,01()P x x m x θπθπθθ==<<】 1.8 解:设A 为100个产品中3个不合格,则3397100()(1)P A C θθθ=-由题意可知 199(202)()(1),01(200)πθθθθΓ=-≤≤Γ 因此 3971994296()()()(1)(1)(1)A P A πθθπθθθθθθθ∝•∝--=- 由上可知)297,5(~)|(Be A θπ1.9 解:设X 为某集团中人的高度,则2(,5)XN θ∴25(,)10XNθ ∴2(176.53)5()p x θθ--=由题意可知 2(172.72)5.08()θπθ--=又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222(176.53)(172.72)(174.64)55.0821.26eeeθθθ------⨯∝•∝因此 (174.64,1.26)x N θ1.10 证明:设22(,),,N u u θσσ其中为已知又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222222251()()11252()11225252u x x u eeeσθθθσσσ+----+⨯--⨯+⨯∝∝因此 222251(,)112525u x xN σθσσ+++又由于21112525σ≤+ 所以 θ的后验标准差一定小于151.11 解:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)X U θ.8,861)/(1192192)()|,,()()|,,(),,|(,4,192)(.81)|,,(8,8,5.3,2,1,0,1)|,,(768778774321321321433213213321>⨯====≥=>=====<<=⎰⎰⎰∞∞∞θθθθθθθθθθπθθπθθπθθθπθθθθθθd d d x x x p x x x p x x x x x x p x x x i x x x x p i ,时,当【原答案:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)XU θ∴1(),0p x x θθθ=<<当8θ>时,31()p x θθ=43819211()8192m x d θθθ+∞==⎰从而有 7()()3()()128p x x m x θπθπθθ==, 计算错误】1.12 证明:由题意可知 1(),0,1,2,...,i np x x i n θθθ=<<=从而有 ()()()()x x p x πθπθθπθ∝•00111n n n ααααθθθθθ++++∝•∝ 因此 θ的后验分布仍是Pareto 分布。
第1章先验分布与后验分布完整版本

最新课件
22
贝叶斯学派的基本观点:任一未知量 都可看作一个随
机变量,应该用一个概率分布去描述,这个分布称为先 验分布;在获得样本之后,总体分布、样本与先验分布
通过贝叶斯公式结合起来得到一个关于未知量 新的分 布—后验分布;任何关于 的统计推断都应该基于 的
后验分布进行。
因为任一未知量都有不确定性,而在表述不确 定性程度时,概率与概率分布是最好的语言。
最新课件
39
4.0 是未知的,它是按先验分布( )产生的。为把先 验信息综合进去,不能只考虑0,对的其它值发生 的可能性也要加以考虑,故要用( )进行综合。这 样一来,样本x=(x1 , …, xn)和参数 的联合分布为: h(x, ) = p(x )( ),
3.从贝叶斯观点看,样本 x=(x1, x2 , …, xn )的产
生分两步进行:首先从先验分布( )产生一个样本
0,然后从P (x |0)中产生一个样本x=(x1, x2 , …,
xn
)
。这时样本的联合条件密度函数为 n
p(x|0) p(xi |0)
i1
这个分布综合了总体信息和样本信息,常称为似然函数。
可见历史资料在统计推断最中新课应件 加以利用
21
贝叶斯统计与经典统计学的差别:是否利用先验信息。
贝叶斯统计在重视使用总体信息和样本信息的同时, 还注意先验信息的收集、挖掘和加工,使它数量化,形 成先验分布,参加到统计推断中来,以提高统计推断的 质量。
在使用样本信息上也是有差异的.贝叶斯学派重视已出现 的样本观察值,而对尚未发生的样本观察值不予考虑.
Byaes统计学派与经典统计学派虽然有很大区 别,但是它们各有优缺点,各有其适用的范围,作 为研究者一定要博采众长,以获得一种更适合解决 实际问题的方法。而且,在不少情况下,二者得出 的结论在形式上是相同的。
贝叶斯统计习题答案

第一章 先验分布与后验分布1.1 解:令120.1,0.2θθ==设A 为从产品中随机取出8个,有2个不合格,则22618()0.10.90.1488P A C θ== 22628()0.20.80.2936P A C θ== 从而有5418.03.02936.07.01488.07.01488.0)()|()()|()()|()|(2211111=⨯+⨯⨯=+=θπθθπθθπθθπA P A P A P A 4582.0)|(1)|(4582.03.02936.07.01488.03.02936.0)()|()()|()()|()|(122211222=-==⨯+⨯⨯=+=A A or A P A P A P A θπθπθπθθπθθπθθπ1.2 解:令121, 1.5λλ==设X 为一卷磁带上的缺陷数,则()XP λ∴3(3)3!e P X λλλ-==R 语言求:)4(/)exp(*)3(^gamma λλ-1122(3)(3)()(3)()0.0998P X P X P X λπλλπλ∴===+== 从而有111222(3)()(3)0.2457(3)(3)()(3)0.7543(3)P X X P X P X X P X λπλπλλπλπλ==========1.3 解:设A 为从产品中随机取出8个,有3个不合格,则3358()(1)P A C θθθ=-(1) 由题意知 ()1,01πθθ=<< 从而有.10,)1(504)|(504)6,4(/1)6,4(1)6,4()1()1()1()1()1()1()1()()|()()|()|(535311614531535315338533810<<-==-=--=--=--==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求(2).10,)1(840)|(840)7,4(/1)7,4(1)7,4()1()1()1()1()1()1(2)1()1(2)1()()|()()|()|(636311714631636315338533810<<-==-=--=--=----==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求1.5 解:(1)由已知可得.5.125.11,110110/1)()|()()|()|(,2010,101)(5.125.111)|(2112211)|(12,2121,1)|(5.125.11201011111111<<===<<=<<=+<<-==+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθd d x p x p x x p x p x x x p ,,即,时,当(2)由已知可得.6.115.11,1010110/1)()|,,()()|,,(),,|(,2010,101)(6.115.111)|,,(,219.1121,214.1121,211.1121,217.1121215.11212112211)|,,(9.11,4.11,1.11,7.11,5.11,0.12,6,2,1,2121,1)|,,(6.115.112010621621621621621654321621<<===<<=<<=+<<-+<<-+<<-+<<-+<<-+<<-========+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθθθθθθθθθθθd d x x x p x x x p x x x x x x p x x x p x x x x x x i x x x x p i ,即,,时,当【原答案:由已知可得 ()1,0.50.5P x x θθθ=-<<+1(),102010πθθ=<< 11.611.51()0.0110m x d θ==⎰从而有()()()10,11.511.6()P x x m x θπθπθθ==<< 】1.6 证明:设随机变量()XP λ,λ的先验分布为(,)Ga αβ,其中,αβ为已知,则即得证!),(~),,|()()|,,(),,|(,0,)()(,!!)|,,(121)(121211112111βαλπλλπλλπλλαβλπλλλλβαβλααλλ++∑∑∝•∝>Γ=∑===+--+--=-=-==∏∏n x Ga x x x ex x x p x x x e x e x ex x x p ni i n n x n n ni in x ni i x n ni i ni ii【原答案: (),0!x e P x x λλλλ-=>1(),0()e ααβλβπλλλα--=>Γ 因此 11(1)()()()x x x P x e e e λαβλαβλπλλπλλλλ---+--+∝•∝= 所以 (,1)x Ga x λαβ++】 1.7 解:(1)由题意可知.1},max{,1)/(1)/(122)()|,,()()|,,(),,|(,10,1)(,,2,1,10,22)|,,(121},max{221},max{2121121212112122111<<∝===<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθπθθπθθπθθπθθθθn nx x nn x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 ()1,01πθθ=<< 因此122()12(1)xxm x d x θθ=•=-⎰因此 2()()1(),1()1P x x x x m x x θπθπθθθ==<<- (实质是新解当n=1的情形)】(2) 由题意可知.1},max{,1)/(1)/(13232)()|,,()()|,,(),,|(,10,3)(,,2,1,10,22)|,,(12-21},max{2-22-21},max{2212211212121212122111<<∝=⨯⨯==<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθθθπθθπθθπθθθπθθθθn n x x n n x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 1222()36xm x d x θθθ=•=⎰因此 ()()()1,01()P x x m x θπθπθθ==<<】 1.8 解:设A 为100个产品中3个不合格,则3397100()(1)P A C θθθ=-由题意可知 199(202)()(1),01(200)πθθθθΓ=-≤≤Γ 因此 3971994296()()()(1)(1)(1)A P A πθθπθθθθθθθ∝•∝--=- 由上可知)297,5(~)|(Be A θπ1.9 解:设X 为某集团中人的高度,则2(,5)XN θ∴25(,)10XNθ ∴2(176.53)5()p x θθ--=由题意可知 2(172.72)5.08()θπθ--=又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222(176.53)(172.72)(174.64)55.0821.26eeeθθθ------⨯∝•∝因此 (174.64,1.26)x N θ1.10 证明:设22(,),,N u u θσσ其中为已知又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222222251()()11252()11225252u x x u eeeσθθθσσσ+----+⨯--⨯+⨯∝∝因此 222251(,)112525u x xN σθσσ+++又由于21112525σ≤+ 所以 θ的后验标准差一定小于151.11 解:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)X U θ.8,861)/(1192192)()|,,()()|,,(),,|(,4,192)(.81)|,,(8,8,5.3,2,1,0,1)|,,(768778774321321321433213213321>⨯====≥=>=====<<=⎰⎰⎰∞∞∞θθθθθθθθθθπθθπθθπθθθπθθθθθθd d d x x x p x x x p x x x x x x p x x x i x x x x p i ,时,当【原答案:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)XU θ∴1(),0p x x θθθ=<<当8θ>时,31()p x θθ=43819211()8192m x d θθθ+∞==⎰从而有 7()()3()()128p x x m x θπθπθθ==, 计算错误】1.12 证明:由题意可知 1(),0,1,2,...,i np x x i n θθθ=<<=从而有 ()()()()x x p x πθπθθπθ∝•00111n n n ααααθθθθθ++++∝•∝ 因此 θ的后验分布仍是Pareto 分布。
先验分布和后验分布的比较研究

先验分布和后验分布的比较研究一、引言在贝叶斯统计推断中,先验分布和后验分布是两个重要的概念,其作用在于帮助我们利用先验知识来更新推断结论。
先验分布指在考虑样本信息之前所假设的分布,而后验分布则指在考虑样本信息后得到的分布。
两种分布都是贝叶斯统计学中推断结论的关键。
本文将着重探讨先验分布与后验分布之间的比较研究,并详细介绍在不同情况下它们的意义、作用和优缺点。
二、正文1. 先验分布与后验分布的定义先验分布是指在推断结果之前,我们对假设的随机变量的概率分布所进行的假设,它通常是由主观或客观的先验经验所建立的,因此也被称为先验知识。
先验分布常常是一个简单的概率分布,而且往往是由一个或几个参数来描述的。
后验分布是指在考虑了样本信息后在先验分布上得到的分布,它通常是更贴近真实概率分布的一个更新版的概率分布。
在贝叶斯推断中,我们会把先验权重和样本信息反应在后验分布中。
2. 先验分布与后验分布的应用场景先验分布的选择并不像后验分布那么高要求,因为先验分布很大程度上是由我们个人主观判断决定的。
通常,我们会选择一个简单的分布作为先验,例如Beta分布、Gamma分布、正态分布等。
在贝叶斯分析过程中,先验分布起到了约束和规定后验分布的重要作用。
后验分布则是由先验分布及样本信息的考虑而得到的。
相当于我们把自己先前对随机变量的主观想法与样本数据作了一个结合,形成了一个更可信、更合理的可视化概率分布。
在经济预测、科学分析和金融产品等领域中,后验分布非常重要。
3. 先验分布与后验分布的比较就分布的形态来说,前者大多数情况下是平滑、单峰分布,甚至有些分布既可以是随机变量的概率分布,也可以是某些问题上的信息分布。
而后者则相对比较灵活,更适应于样本信息的变化。
在选择先验分布的过程中,需要根据具体任务的需求来确定,例如要求先验均值尽可能接近后验均值,需要选择一种适当的先验分布。
就作用而言,先验分布相当于清除了一些不太可能的情况,让后验分布更加稳定;而后验分布则是更加贴合实际情况的一种分布,更大程度上说明了与样本数据相关的知识。
第一章 先验分布与

先验信息:即在抽样之前有关统计推断的 一些信息。譬如,在估计某产品的不合格率时, 假如工厂保存了过去抽检这种产品质量的资料, 这些资料(包括历史数据)有时估计该产品的 不合格率是有好处的。这些资料所提供的信息 就是一种先验信息。又如某工程师根据自己多 年积累的经验对正在设计的某种彩电的平均寿 命所提供的估计也是一种先验信息。由于这种 信息是在“试验之前”就已有的,故称为先验 信息。
• 基于总体信息和样本信息进行的统计推断 被称为经典统计学,它的基本观点是把数 据(样本)看成是来自具有一定概率分布 的总体,所研究的对象是这个总体而不局 限于数据本身。
• 基于总体信息、样本信息和先验信息这三 中信息进行的统计推断称为贝叶斯统计学。 它的基本观点是:任一个未知量θ都可看作 一个随机变量,应用一个概率分布去描述 对θ的未知状况。这个概率分布是在抽样前 就有的关于θ的先验信息的概率陈述。这个 概率分布被称为先验分布。
h( x1 ,, xn , ) ( x1 ,, xn ) m( x1 ,, xn ) p( x1 ,, xn ) ( )
p( x1 ,, xn ) ( )d
这就是贝叶斯公式的密度函数形式,其中
( x1,, xn )称为θ 的后验密度函数,或后验 分布。而 :
( )
1, 0 1 0, others
2.计算样本X与参数 的联合分布:
h( x, ) Cnx x (1 )nx , x 0,1,, n, 0 1
此式在定义域上与二项分布有区别。
3.计算X的边际密度为:
( x 1)(n x 1) m ( x ) h( x, )d C , x 0,1,, n 0 (n 2)
贝叶斯统计
先验分布与后验分布

(
x1,
, xn )
h(x1, , m(x1,
xn , )
, xn )
p(x1, , xn ) ( ) p(x1, , xn ) ( )d
这就是贝叶斯公式的密度函数形式,其中 ( x1, , xn )
称为θ的后验密度函数,或后验分布。而 :
m(x1, , xn ) p(x1, , xn ) ( )d
j
假如总体X也是离散的,则只须将p(x|θ)
换成P(X=x|θ)即可。
10
二、后验分布是三种信息的综合
前面的分析总结如下:人们根据先验信息对参数
θ已有一个认识,这个认识就是先验分布π(θ)。通
过试验,获得样本。从而对θ的先验分布进行调整,
调整的方法就是使用上面的贝叶斯公式,调整的结果
就是后验分布 ( x1, , xn) 。后验分布是三种信息的 综合。获得后验分布使人们对θ的认识又前进一步,
P( 0.5/ x)
(n 2)
0.5
x
(1
)n
x
d
1.15 1042
( x 1)(n x 1) 0
故他断言男婴诞生的概率大于0.5。
13
注:1.伽玛分布与贝塔分布简介:
(s) xs1e xdx, s 0, (n 1) n! 0
B( p,q) 1 x p1(1 x)q1dx, p 0,q 0 0
26
例1.9 对例1.7中后验分布的均值和方差的解释。 分析:后验分布Be(α+x, β+n-x)的均值和方差可写为:
27
28
29
四、 常用的一些共轭先验分布
共轭先验分布选取的一般原则: 是由似然函数L(θ)=p(x|θ)中所含的因式所 决定的,即选与似然函数具有相同核的分布作 为先验分布。
贝叶斯统计_第二版_茆诗松_汤银才_编著

第一章 先验分布与后验分布1.1 解:令120.1,0.2θθ==设A 为从产品中随机取出8个,有2个不合格,则22618()0.10.90.1488P A C θ== 22628()0.20.80.2936P A C θ== 从而有1111122()()()0.4582()()()()P A A P A P A θπθπθθπθθπθ==+2221122()()()0.5418()()()()P A A P A P A θπθπθθπθθπθ==+1.2 解:令121, 1.5λλ==设X 为一卷磁带上的缺陷数,则()XP λ∴3(3)3!e P X λλλ-==1122(3)(3)()(3)()0.0998P X P X P X λπλλπλ∴===+== 从而有111222(3)()(3)0.2457(3)(3)()(3)0.7543(3)P X X P X P X X P X λπλπλλπλπλ==========1.3 解:设A 为从产品中随机取出8个,有3个不合格,则3358()(1)P A C θθθ=-(1) 由题意知 ()1,01πθθ=<< 从而有 351()()()504(1),01()()P A A P A d θπθπθθθθθπθθ==-<<⎰(2)361()()()47040(1),01()()P A A P A d θπθπθθθθθπθθ==-<<⎰1.5 解:由已知可得 ()1,0.50.5P x x θθθ=-<<+1(),102010πθθ=<< 11.611.51()0.0110m x d θ==⎰从而有()()()10,11.511.6()P x x m x θπθπθθ==<<1.6 证明:设随机变量()X P λ,λ的先验分布为(,)Ga αβ,其中,αβ为已知,则 (),0!x e P x x λλλλ-=> 1(),0()e ααβλβπλλλα--=>Γ 因此 11(1)()()()x x x P x e e e λαβλαβλπλλπλλλλ---+--+∝∙∝=所以 (,1)xG a x λαβ++ 1.7 解:(1)由题意可知 ()1,01πθθ=<< 因此122()12(1)xxm x d x θθ=∙=-⎰因此 2()()1(),1()1P x x x x m x x θπθπθθθ==<<- (2) 由题意可知 1222()36xm x d x θθθ=∙=⎰因此 ()()()1,01()P x x m x θπθπθθ==<< 1.8 解:设A 为100个产品中3个不合格,则3397100()(1)P A C θθθ=-由题意可知 199(202)()(1),01(200)πθθθθΓ=-≤≤Γ 因此 3971994296()()()(1)(1)(1)A P A πθθπθθθθθθθ∝∙∝--=- 由上可知 (5,297)A Be θ1.9 解:设X 为某集团中人的高度,则2(,5)X N θ∴25(,)10XN θ∴2(176.53)5()p x θθ--=由题意可知 2(172.72)5.08()θπθ--=又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝∙222(176.53)(172.72)(174.64)55.0821.26eeeθθθ------⨯∝∙∝因此 (174.64,1.26)xN θ1.10 证明:设22(,),,N u u θσσ其中为已知又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝∙22222251()()11252()1225252u x x u e eeσθθθσσσ+----+⨯--⨯+⨯∝∝因此 222251(,)112525u x xN σθσσ+++又由于21112525σ≤+ 所以 θ的后验标准差一定小于151.11 解:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)X U θ∴1(),0p x x θθθ=<<当8θ>时,31()p x θθ=43819211()8192m x d θθθ+∞==⎰从而有 7()()3()()128p x x m x θπθπθθ==1.12 证明:由题意可知 1(),0,1,2,...,i np x x i n θθθ=<<=从而有 ()()()()x x p x πθπθθπθ∝∙00111n n n ααααθθθθθ++++∝∙∝ 因此 θ的后验分布仍是Pareto 分布。
贝叶斯统计第二版茆诗松汤银才编著

贝叶斯统计第⼆版茆诗松汤银才编著第⼀章先验分布与后验分布1.1 解:令120.1,0.2θθ==设A 为从产品中随机取出8个,有2个不合格,则22618()0.10.90.1488P A C θ== 22628()0.20.80.2936P A C θ== 从⽽有1111122()()()0.4582()()()()P A A P A P A θπθπθθπθθπθ==+2221122()()()0.5418()()()()P A A P A P A θπθπθθπθθπθ==+1.2 解:令121, 1.5λλ==设X 为⼀卷磁带上的缺陷数,则()XP λ∴3(3)3!e P X λλλ-==1122(3)(3)()(3)()0.0998P X P X P X λπλλπλ∴===+== 从⽽有111222(3)()(3)0.2457(3)(3)()(3)0.7543(3)P X X P X P X X P X λπλπλλπλπλ==========1.3 解:设A 为从产品中随机取出8个,有3个不合格,则3358()(1)P A C θθθ=-(1)由题意知 ()1,01πθθ=<< 从⽽有 351()()()504(1),01()()P A A P A d θπθπθθθθθπθθ(2)361()()()47040(1),01()()P A A P A d θπθπθθθθθπθθ==-<1.5 解:由已知可得 ()1,0.50.5P x x θθθ=-<<+1(),102010πθθ=<< 11.611.51()0.0110m x d θ==?从⽽有()()()10,11.511.6()P x x m x θπθπθθ==<<1.6 证明:设随机变量()X P λ,λ的先验分布为(,)Ga αβ,其中,αβ为已知,则 (),0!x e P x x λλλλ-=>1(),0()e ααβλβπλλλα--=>Γ因此 11(1)()()()x x x P x e e e λαβλαβλπλλπλλλλ---+--+∝?∝= 所以 (,1)x Ga x λαβ++ 1.7 解:(1)由题意可知 ()1,01πθθ=<< 因此122()12(1)xxm x d x θθ=?=-?因此 2=<<- (2)由题意可知 1222()36xm x d x θθθ=?=?因此 ()()()1,01()P x x m x θπθπθθ==<<1.8 解:设A 为100个产品中3个不合格,则3397100()(1)P A C θθθ=-由题意可知 199(202)()(1),01(200)πθθθθΓ=-≤≤Γ因此 3971994296()()()(1)(1)(1)A P A πθθπθθθθθθθ∝?∝--=- 由上可知 (5,297)A Be θ1.9 解:设X 为某集团中⼈的⾼度,则2(,5)XN θ∴25(,)10XN θ∴2(176.53)5()p x θθ--=由题意可知 2(172.72)5.08()θπθ--=⼜由于X 是θ的充分统计量,从⽽有()()()()x x p x πθπθθπθ=∝?2(176.53)(172.72)(174.64)55.0821.26eeeθθθ------∝?∝因此 (174.64,1.26)x N θ1.10 证明:设22(,),,N u u θσσ其中为已知⼜由于X 是θ的充分统计量,从⽽有()()()()x x p x πθπθθπθ=∝?222222251()()11252()11225252u x x u e eeσθθθσσσ+----+?--+∝∝因此 222251(,)11⼜由于21112525σ≤+ 所以θ的后验标准差⼀定⼩于151.11 解:设X 为某⼈每天早上在车站等候公共汽车的时间,则(0,)X U θ∴1(),0p x x θθθ=<<当8θ>时,31()p x θθ=43819211()8192m x d θθθ+∞==?从⽽有 7()()3()()128p x x m x θπθπθθ==1.12 证明:由题意可知 1(),0,1,2,...,i np x x i n θθθ=<<=从⽽有 ()()()()x x p x πθπθθπθ∝?00111++++∝?∝因此θ的后验分布仍是Pareto 分布。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6. 在 是离散随机变量时,先验分布可用先验分布列 ( ) , i 1,2,..., 表示。这时后验分布也是离散形式。
( i x)
p( x
j
p( x i )
j
) ( j )
, i 1,2,....
(1.2)
假如总体 X 也是离散的,那只要把(1.1)或(1.2)中的密度 函数 p( x ) 看作为概率函数 P( X x ) 即可。
其中 m( x ) 是 x 的边缘密度函数。
m( x) h( x, )d p( x ) ( )
它与 无关,或者说, m( x) 中不含 的任何信息。因此能用来对 做 出推断的仅是条件分布 ( x) 。它的计算公式是
( x)
h ( x, ) m( x ) p ( x ) ( )
第一章 先验分布与后验分布 1.1 三种信息
一、 总体信息,即总体分布或总体所属分布族给我们的信息,譬如, “总体是 正态分布”这一句话就给我们带来很多信息:它的密度函数是一条钟形曲线;它 的一切阶矩都存在;有关正态变量(服从正态分布的随机变量)的一些事件的概 率可以计算;有关正态分布可以导出 2 分布、t 分布和 F 分布等重要分布;还 有许多成熟的点估计、区间估计和假设检验方法可供我们选用。总体信息是很 重要的信息,为了获取此种信息往往耗资巨大。
p( x ) ( )d
(1.1)
这就是贝叶斯公式密度函数形式。这个在样本 x 给定下, 的条件分 布被称为 的后验分布。它是集中了总体、样本和先验等三种信息中 有关 的一切信息,而又是排除一切与 无关信息之后所得到的结果。 故基于后验分布 ( x) 对 进行统计推断是更为有效,也是最合理的。
这就是似然函数。假如在试验前我们对事件 A 没有什么了解,从而 对其发生概率 也说不出是大是小。在这种场合,用均匀分布 U(0,1)作为 的先验分布。这时 的先验分布为
0 1 1, ( ) 0,其它场合
(1.3)
为了综合抽样信息和先验信息,可利用贝叶斯公式,为此计算样 本 X 与参数 的联合分布
第二,图1.1中的概率0.90不是在大量重复试 验中获得的。而是学生们根据自己的生活经历的积 累对该事件发生可能性所给出的信念,这样给出的 概率在贝叶斯统计中是允许的,并称为主观概率。 它与古典概率和用频率确定的概率有相同的含义, 只要它符合概率的三条公理即可。贝叶斯学派认为 引入主观概及由此确定的先验分布至少把概率与统 计的研究与应用范围扩随意的,而是 要求当事人对所观察的事件有较透彻的了解和丰富 的经验,甚至是这一行的专家,在这个基础上确定 的主观概率就能符合实际。
二、样本信息,即从总体抽取的样本给我们 提供的信息。这是最“新鲜”的信息,并 且愈多愈好。人们希望通过对样本的加工 和处理对总体的某些特征做出较为精确的 统计推断。没有样本就没有统计学可言。 这是大家都理解的事实。 基于上述两种信息进行的统计推断被称为 经典统计学,它的基本观点是把数据(样 本)看成是来自具有一定概率分布的总体, 所研究的对象是这个总体而不局限于数据 本身。
三、先验信息,即在抽样之前有关统计问题的一些 信息,一般说来,先验信息主要来源于经验和历 史资料。先验信息在日常生活和工作中也经常可 见,不少人在自觉地或不自觉地使用它。看下面 二个例子。 例1.1 英国统计学家Savage(1961)曾考察如下二个 统计实验: A.一位常饮牛奶的妇女声称,她能辨别先倒进 杯子里的是茶还是牛奶。对此做了十次试验,她 都正确地说出了。 B.一位音乐家声称,他能从一页乐谱辨别出是 海邓(Haydn)还是莫扎特(Mozart)的作品。 在十次这样的试验中,他都能正确辨别。
贝叶斯学派的最基本的观点是:任一个未知量 都可看作一个随机 变量,应用一个概率分布去描述对 的未知状况。这个概率分布是在抽 样前就有的关于 的先验信息的概率陈述。这个概率分布被称为先验分 布、有时还简称为先验(Prior) 。因为任一未知量都有不确定性,而在表 述不确定性程度时,概率与概率分布是量好的语言。例 1.2 中产品不合格 率 是未知量,但每天都有一些变化,把它看作一个随机变量是合适的, 用一个概率分布去描述它也是很恰当的。即使是一个几乎不变的未知量, 用一个概率分布去描述它的不确定性也十分合理的。
二.后验分布是三种信息的综合
先验分布 ( ) 是反映人们在抽样前对 的认识,后验分布 ( x) 是 反映人们在抽样后对 的认识。之间的差异是由于样本 x 出现后人们 对 认识的一种调整。所以后验分布 ( x) 可以看作是人们用总体信 息和样本信息(综合称为抽样信息)对先验分布 ( ) 作调整的结果。
1.2 贝叶斯公式(定理)
一、贝叶斯公式的密度函数形式 1. 依赖于参数 的密度函数在经典统计中记为 p( x; ) 或 p ( x) ,它表示在 参数空间 { } 中不同的 对应不同的分布。可在贝叶斯统计中记为 p ( x ) , 它表示在随机变量 给定某个值时,总体指标 X 的条件分布。 2. 根据参数 的先验信息确定先验分布 ( ) 。 3. 从贝叶斯观点看,样本 x ( x1 ,..., xn ) 的产生要分二步进行。首先设想从 先验分布 ( ) 产生一个样本 ,第二步是从总体分布 p ( x ) 产生一个样本
基于上述三种信息(总体信息、样本信息 和先验信息)进行的统计推断被称为贝叶 斯统计学。它与经典统计学的主要差别在 于是否利用先验信息。在使用样本信息上 也是有差异的。贝叶斯学派重视已出现的 样本观察值,而对尚未发生的样本观察值 不予考虑,贝叶斯学派很重视先验收集、 挖掘和加工,使它数量化,形成先验分布, 参加到统计推断中来,以提高统计推断的 质量。忽视先验信息的利用,有时是一种 浪费,有时还会导致不合理的结论。
贝叶斯统计学 Bayesian Statistics
开课的话
历史悠久:R. T. Bayes(1701-1761) P. C. Laplace(1749-1827) 争论不休:经典学派VS贝叶斯学派 困难所在:模型复杂,计算量巨大 应用广泛:不但在统计本身而且在许多其它学科上 都有重要应用 欣欣向荣:电子计算机;算法;近二十多年来大发展
n x n x h( x, ) ( 1 ) , x 0,1,..., n.0 1. x
此式在定义域上与二项分布有差别。再计算 X 的边缘分布
n1 x n ( x 1)(n x 1) 1 n x m( x) h( x,0)d ( 1 ) d , x x ( n 2 ) n 1 0 0 x 0,1,..., n.
在这两个统计试验中,假如认为被实验者 是在猜测,每次成功的概率为0.5,那么十 次都猜中的概率为 2 10 0.0009766 ,这是一 个很小的概率,是几乎不可能发生的,所 以“每次成功概率为0.5”的假设应被拒绝。 被实验者每次成功概率要比0.5大得多。这 就不是猜测,而是他们的经验在帮他们的 忙。可见经验(先验信息的一种)在推断 中不可忽视,应加以利用。
第一,按图 1.1 所示的概率分布我们可谈论未知量 位于某个区间的概率。 譬如, 位于 37 到 43 岁间的概率为 0.90,即
P(37 43) 0.90
可这个概率陈述在经典统计中是不允许的,因为经典统计认为 是常量, 它要么是 37 到 43 岁之间(概率为 1) ,要么在这个区间之外(上述事件概率 为零 0) ,不应有 0.9 的概率。可在实际中类似的说法经常听到。譬如“某逃 犯的年龄大约 35 岁左右” 、 “明日降水概率为 0.85” 、 “某学生能考上大学的概 率为 0.95” 、 “这场足球赛甲队能胜的概率只有 0.6 左右” 。这样的概率陈述能为 大多数人理解、接受和采用。
例 1.4 设事件 A 的概率为 ,即 (A) 。为了估计 而作 n 次 独立观察,其中事件 A 出现次数为 X,显然,X 服从二项分布
b(n, ) ,即
n x n x P( X x ) x (1 ) , x 0,1,..., n .
x ( x1 ,..., xn ) ,这个样本是具体的,人们能看得到的,此样本 x 发生概率
是与如下联合密度函数成正比:
p ( x ) p ( xi ' )
' i 1 n
这个联合密度 函数是综合了总体信息和样本信息,常称为似然 函数,记为 L( ' ) 。频率学派和贝叶斯学派都承认似然函数,二 派认为:在有了样本观察值 x ( x1 ,..., xn ) 后,总体和样本中所含
的信息都被包含在似然函数 L( ' ) 之中。
4. 由于 ' 是设想出来的,它仍然是未知的,它是按先验分布
( ) 而产生的,要把先验信息进行综合,不能只考虑 ' ,而应对
的一切可能加以考虑。故要用 ( ) 参与进一步综合。这样一来, 样本 x 和参数 的联合分布
h( x, ) p ( x ) ( )
课堂纪律:有病有事一律向系里请假,而不是向我 请假。有系里批准的假条给我,我都没异议。每次 上课都点名,出勤率关系到你的成绩。 学习态度:强烈的求知(非求职)欲望。 作业:每次作业都有登记评分,另有贝叶斯统计英 译中作业(12月31日完成上交。期末考试将有英 语题)。 问与答:没有愚蠢的问题,只有愚蠢的回答。任何 问题都可向我提出,我会尽自己的能力,回答你们 的问题。如果没有提问,则认定你已经懂了所教内 容。
例 1.2“免检产品”是怎样决定的?某厂的产品每天都要抽检几件,获得 不合格率 的估计。经过一段时间后就积累大量的资料,根据这些历史资料 (先验信息的一种)对过去产品的不合格率可构造一个分布:
i P( ) i , n