先验分布的确定
第3章先验分布的确定
m(
x)
p( x
|
)
(
)d, 为连续时
p( x | ) ( ), 为离散时
(3.1)
当先验分布含有未知参数时,譬如π(θ)=π(θ|λ),那么
边缘分布m(x)依赖于λ,可记为m(x|λ).
例 设总体X~N(, σ2) 其中σ2已知。
取另一正态分布N(μπ,τπ2)作为正态均值的先验分布 , 则可以算得X的边缘分布为N(μπ,τπ2+σ2)
2.若还有σ2 (θ)= σ2(与θ无关的常数 ),则
m2 2 2
其中
2
E
2
例3.14 设X
~
N
(
,1),的先验分布类为{N
(
,
2
)}
主观经验预测X的均值为1, 方差为3,即m
10和
2 m
3,
试确定其先验分布.
解 :已知m
1;
2 m
3,由X
~
N ( ,1)知 2
1,利用推论1,
( ) m 10
2.注意的问题
(1)所咨询专家应是声誉良好的和富有经验的
(2)这两个方法相比,决策者更愿意使用变分度法.
§3.3利用边缘分布m(x)确定先验密度
一、边缘分布m(x)
设总体X的密度函数为p(x|θ),它含有未知参数θ,若θ 的先验分布选用形式已知的密度函数π(θ),则可算得 X的边缘分布(即无条件分布)
取
d
d
2
[ln
(
2
)]
2(
2
n
2
)
ns2
2(
2
2
)2
0
得
2
变分分布和先验分布
变分分布和先验分布概述变分分布和先验分布是贝叶斯推断中重要的概念。
变分分布是一种优化方法,它用于近似贝叶斯推断中的后验分布。
先验分布是在观测数据之前,对模型参数分布的一种知识或假设。
变分分布和先验分布可以帮助我们处理模型选择、泛化能力以及推断等问题。
变分分布变分分布是一种优化方法,它用于近似复杂的后验分布。
变分分布通过定义一类可分解的概率分布族来寻找后验分布的最优近似。
这些分布可以由一些参数控制,这些参数可以通过最小化一种度量来优化。
变分分布可以进一步分为均值场变分方法(mean-field variational inference)和全局变分方法(global variational inference)两种。
均值场变分方法假设后验分布可以被分解为一系列独立的分布的乘积。
这些分布通常称为因子分布,可以通过最小化一个变分下界来找到近似的后验分布。
全局变分方法中,不再需要假设后验分布具有可分解的因子分布。
相反,它假设后验分布可以通过各种非参数的方式表示。
这种方法通常需要更复杂的计算,但是可以获得更精确的近似结果。
先验分布先验分布是在观测数据之前,对模型参数分布的一种知识或假设。
先验分布可以用来约束模型参数的取值,以确保模型具有良好的泛化能力。
根据贝叶斯推断的定义,先验分布和后验分布的结合,会给出一个完整的贝叶斯模型。
先验分布可以分为共轭先验和非共轭先验两类。
共轭先验是指先验分布和似然函数满足同一种分布类型,这种先验分布可以简化贝叶斯推断的计算。
常见的共轭先验包括高斯分布、伽马分布和狄利克雷分布等。
非共轭先验没有和似然函数同种分布类型,这种先验分布通常比较复杂,需要使用其他的推断方法,如马尔可夫链蒙特卡罗(MCMC)等。
应用变分分布和先验分布可以应用于很多贝叶斯模型中。
对于混合模型(mixture models),我们通常需要选择模型的数量以及每个模型的参数。
可以使用具有狄利克雷分布先验的以分配法(dirichlet process)来自动选择模型数量。
贝叶斯估计的计算过程
贝叶斯估计的计算过程
贝叶斯估计是一种基于贝叶斯定理的统计推断方法。
它将先验概率和样本数据结合起来,得到后验概率,从而进行参数估计或者预测。
具体的计算过程包括以下几个步骤:
1. 确定先验分布。
先验分布是指在观测到任何数据之前对参数的概率分布的猜测。
通常选择一个合适的先验分布是非常重要的,因为它会对后续的推断结果产生影响。
2. 计算似然函数。
似然函数是指在给定参数值的情况下,观测到数据的概率。
它是样本数据的函数,它描述了数据与参数之间的关系。
3. 计算后验分布。
后验分布是指在观测到数据后,对参数的概率分布的更新。
根据贝叶斯定理,后验分布等于先验分布和似然函数的乘积再除以标准化常量。
4. 计算后验分布的期望值。
后验分布的期望值是对参数的估计值。
它可以用来进行预测或者进行决策。
贝叶斯估计在许多领域中被广泛应用,比如机器学习、生物统计学、金融学、医学等。
它的优点是可以处理不确定性,同时也可以将经验信息纳入到统计推断中,从而得到更准确的结果。
- 1 -。
先验分布的确定
先验分布的确定幻灯⽚67 其步骤如下:(1)写出样本的对数似然函数∑∏====ni i n i i x p x p x l 11)|(ln )|(ln )|(θθθ(2)求样本的信息阵pj i l E I j i x ,...,2,1,,)(2|=-=θθθθ2|2(),x l I Eθθθ=-??在单参数(p=1)场合,(3)Θ的⽆信息先验密度为2/1)]([det )(θθπI =1/2()[()]I πθθ=在单参数(p=1)场合,幻灯⽚682122(,,...,)(,),(,).n X x x x N Jeffreys µσθµσ==设是来⾃正态分布的⼀组样本试求的先验2211:()ln[]2i x ni l x e µσθπσ--==∑写出样本的对数似然函数22111(,)ln(2)ln ().22ni i l n x µσπσµσ=?=---∑22222222()()0:(,);20()()ll nE E Fisher I n ll E E µµσσµσσµσσ-- ??==?? -- ??其信息阵42),(det -=?σσµn I22,(,):(,)2.Jeffreys n µσπµσσσ--=∝所以的先验为幻灯⽚6911:,(),:()1;,()2,();,(,);nI I n σµπµσµσσπσσµσπµσσ---=∝=∝∝注当已知当已知当和独⽴幻灯⽚70 例3.22关于成功概率的⽆信息先验分布⾄今已有4种π1(θ)=1 ——正常π2(θ)=θ-1(1-θ)-1 ——不正常π3(θ)=θ-1/2(1-θ)-1/2 ——正则化后可成为正常π4(θ)=θθ(1-θ)(1-θ) ——正则化后可成为正常注意:1.⼀般说来,⽆信息先验不是唯⼀的.但它们对贝叶斯统计推断的影响都很⼩,很少对结果产⽣较⼤的影响2.任何⽆信息先验都可以采⽤。
先验分布与后验分布
(
x1,
, xn )
h(x1, , m(x1,
xn , )
, xn )
p(x1, , xn ) ( ) p(x1, , xn ) ( )d
这就是贝叶斯公式的密度函数形式,其中 ( x1, , xn )
称为θ的后验密度函数,或后验分布。而 :
m(x1, , xn ) p(x1, , xn ) ( )d
j
假如总体X也是离散的,则只须将p(x|θ)
换成P(X=x|θ)即可。
10
二、后验分布是三种信息的综合
前面的分析总结如下:人们根据先验信息对参数
θ已有一个认识,这个认识就是先验分布π(θ)。通
过试验,获得样本。从而对θ的先验分布进行调整,
调整的方法就是使用上面的贝叶斯公式,调整的结果
就是后验分布 ( x1, , xn) 。后验分布是三种信息的 综合。获得后验分布使人们对θ的认识又前进一步,
P( 0.5/ x)
(n 2)
0.5
x
(1
)n
x
d
1.15 1042
( x 1)(n x 1) 0
故他断言男婴诞生的概率大于0.5。
13
注:1.伽玛分布与贝塔分布简介:
(s) xs1e xdx, s 0, (n 1) n! 0
B( p,q) 1 x p1(1 x)q1dx, p 0,q 0 0
26
例1.9 对例1.7中后验分布的均值和方差的解释。 分析:后验分布Be(α+x, β+n-x)的均值和方差可写为:
27
28
29
四、 常用的一些共轭先验分布
共轭先验分布选取的一般原则: 是由似然函数L(θ)=p(x|θ)中所含的因式所 决定的,即选与似然函数具有相同核的分布作 为先验分布。
贝叶斯统计3.4,3.5教材
27
例3.22
关于成功概率的无信息先验分布至今已有4种 π1(θ)=1 π2(θ)=θ-1(1-θ)-1 π3(θ)=θ-1/2(1-θ)-1/2 ——正常 ——不正常 ——正则化后可成为正常
π4(θ)=θθ(1-θ)(1-θ) ——正则化后可成为正常
注意:1.一般说来,无信息先验不是唯一的.
但它们对贝叶斯统计推断的影响都很小,很少对结 果产生较大的影响
2.任何无信息先验都可以采用。
28
总结
1. 掌握贝叶斯假设
2.掌握位置参数和尺度参数的无信息先验分布
3.会用Fisher信息阵确定无信息先验
29
§3.5 多层先验
一、多层先验 二、多层模型
30
一、多层先验
1.定义
当所给先验分布中超参数难于确定时,可以对超参数 再给出一个先验,第二个先验称为超先验。由先验和 超先验决定的一个新先验称为多层先验。
试求分布参数 与的无信息先验.
取为位置参数, 为尺度参数, 令 1, ln( ), w ln( x), 则有
p( w; , )
1
w
d * 由随机变量函数知, ( ) ( ) 1 , 2 ( ) 1 , d
浙江财经学院本科教学课程经济数学三概率统计精品文档贝叶斯统计34352第三章先验分布的确定31主观概率32利用先验信息确定先验分布33利用边缘分布mx确定先验密度34无信息先验分布35多层先验334无信息先验分布一贝叶斯假设二位置尺度参数族的无信息先验三用fisher信息阵确定无信息先验4所谓参数??的无信息先验分布是指除参数??的取值范围和??在总体分布中的地位之外再也不包含??的任何信息的先验分布
例3.23 设对某产品的不合格品率了解甚少,只知道 它比较小。现需要确定θ的先验分布。决策人经过 反复思考,最后把他引导到多层先验上去,他的思 路是这样的: (1)开始他用(0,1)上的均匀分布U(0,1)作为θ的先 验分布。
第三章 先验分布的确定
则称该分布族{p(x | , )} 为Cramer-Rao正则分布族,简称 C—R正则族。
在C—R正则族前提下,记分向量S (x) 的方差协方差阵
' 称为该分布族中参数 (1 ,..., p ) 的Fisher信息阵,简称θ 的信息阵。
二、Jeffreys先验 设总体密度函数为p(x | , ) ,又设参数θ 的无信息先验 ( ) ,由于一一 为π (θ )。若对参数θ 作一一对应变换; 对应变换不会增加或减少信息,故新参数η 的无信息先验 * ( ) 与 ( ) 在结构上应完全相同,即 ( ) * ( ) 。另一方 面,按随机变量函数的运算规则,θ 与η 的密度函数间应满 足如下关系式
假如混合样本 x (x1 , x 2 ,..., x n ) 所涉及的先验密度函数的形式 已知,未知的仅是其中的超参数,即先验密度函数族可表示 如下:
{ ( | ), }
ˆ 使得 这时寻求ML-II先验是较为简单的事,只要寻求这样的
这可用最大化似然函数方法来实现。
第一节 主观概率 第二节 利用先验信息确定先验分布 第三节 利用边际分布m(x) 确定先验密度 第四节 无信息先验分布 第五节 多层先验
3.1.1 主观概率 贝叶斯统计中要使用先验信息,而先验信息主要是指经验和 历史资料。因此如何用人们的经验和过去的历史资料确定概 率和先验分布是贝叶斯学派要研究的问题。 贝叶斯学派认为:一个事件的概率是人们根据经验对该事件 发生可能性所给出个人信念。这样给出的概率称为主观概率。
此外σ 的参数空间与η 的参数空间都为 R ,可见(X,σ )问题 ( ) 与(y,η )问题的统计结构完全相同,故σ 的无信息先验 与η 的无信息先验 * ( ) 应相同,即 ( ) * ( ) 另一方面,由变换 c 可以得η 的无信息先验
确定岩体力学参数先验分布的随机加权Bayes方法
文 章 编 号 :6 3一O 6 ( 0 9 0 0 0 0 17 O 2 2 0 )4— 0 9— 5
确 定 岩体 力学 参 数 先 验 分 布 的 随 机 加权 B ys 法 ae 方
毕 忠伟 , 丁德 馨
(. 1清华 大学 水利水 电工程系 , 京 10 8 2 南华 大学 城市建设学 院 , 北 00 4;. 湖南 衡 阳 4 10 ) 2 0 1
BI Zho ng— i . I we D NG . i De xn2
( . eat n f y rui E g er g Tig H nvr t, e ig10 8 , hn ; 1 D pr me t da l ni ei ,s h aU i s y B in 0 4 C ia oH c n n n ei j 0 2 S ho f ra o s ut n U i r t o o t hn , e ga g Hu a 2 0 1 C ia . c ol bnC n t ci , nv s y f uhC ia H n yn , n n4 1 0 , hn ) oU r o e i S
摘
要: 岩体 力学参 数在 进行 Bys 统计 时必 须利 用先 验 分布 , 经 常 出现 先验 信 ae 法 但
息 少 而不 能确 定先验 分 布 的情 况. 了解 决 小样本 条 件 下先验 分 布确 定 的 问题 , 用 为 采
随机 加权 重 采样 技 术 , 生岩 体 力 学参 数 再 生样本 来模 拟 先验 信 息 的总体 分 布 , 而 产 从 获得 岩体 力学参 数 先验 信 息统 计分 布 的 均值 与 方差 , 其 与 当前 样 本 分 布信 息代 入 将 贝叶 斯公 式 , 而 实现 了对岩 体 力 学参 数 后 验 分 布 的确 定. 真 算例 证 明 ห้องสมุดไป่ตู้ 种 方 法 从 仿 这 在 进行 岩 体 力 学参 占 时 比经典 参数 估 计 方法 有更 高的精 确性 . 计
贝叶斯统计_先验分布的确定
第三章 先验分布的确定3.1 主观概率3.1.1概率的公理化定义定义:设Ω为一个样本空间,F 为Ω的某些子集组成的一个事件域,如果对任一事件A ∈F ,定义在F 上一个实值函数P(A)满足下列条件:(1)非负性公理:对于每一事件A ,有P(A)≥0;(2)正则性(规范性)公理:P(Ω)=1;(3)可列可加性(完全可加性)公理:设A 1,A 2,…是互不相容的事件,即对于i≠j ,A i A j =∅,i ,j=1,2,…,则有11()()i i i i P A P A ∞∞===∑ 则称P (A )为事件A 的概率(Probability) ,称三元素(Ω, F ,P)为概率空间(Probability space) 。
概率是定义在σ-域F 上的一个非负的、正则的、可列可加的集函数。
3.1.2 主观概率在经典统计中,概率是用三条公理定义的:1)非负性;2)正则性;3)可加性。
概率确定方法有两种:1)古典方法;2)频率方法。
实际中大量使用的是频率方法,所以经典统计的研究对象是能大量重复的随机现象,不是这类随机现象就不能用频率的方法去确定其有关事件的概率。
这无疑把统计学的应用和研究领域缩小了[1]。
在经典统计中有一种习惯,对所得到的概率都要给出频率解释,这在有些场所是难于做出的。
譬如,天气预报:“明天下雨的概率是0.8”。
贝叶斯统计中要使用先验信息,而先验信息主要是指经验和历史资料。
因此如何用人们的经验和过去的历史资料确定概率和先验分布是贝叶斯学派要研究的问题。
贝叶斯学派是完全同意概率的公理化定义,但认为概率也是可以用经验确定。
这是与人们的实践活动一致。
这就可以使不能重复或不能大量重复的随机现象也可谈及概率。
同时也使人们积累的丰富经验得以概括和应用。
贝叶斯学派认为:一个事件的概率是人们根据经验对该事件发生可能性所给出个人信念。
这样给出的概率称为主观概率。
下面举几个例子:一个企业家认为“一项新产品在未来市场上畅销”的概率是0.8,这里的0.8是根据他自己多年的经验和当时一些市场信息综合而成的个人信念。
先验分布的选择的概念
先验分布的选择的概念
先验分布是在贝叶斯统计学中一个重要的概念,它是指在进行统计推断时,对于待估计的未知量可能取值的预先概率分布。
先验分布的选择对贝叶斯分析的结果有着至关重要的影响。
在这篇文章中,我们将分步骤阐述先验分布的选择的概念。
1. 了解先验分布的作用
在进行贝叶斯分析时,我们需要先指定一个先验分布。
这个先验分布代表了我们关于待估计量的先有知识和信念。
这个先验分布将与我们要估计的数据相结合,得到一个后验分布。
后验分布是我们对待估计量真实值的置信度分布。
2. 考虑问题的具体情况
在选择先验分布时,需要考虑到具体的问题情况。
例如,如果我们要对某一物种的平均寿命进行估计,那么我们可以选择一个均值为50岁,方差为10岁的正态分布作为先验分布。
这是因为我们已经知道的关于这个物种寿命的知识是它大概位于50岁附近,并且可能有一些波动。
3. 考虑领域知识
在选择先验分布时,领域知识会起到重要的作用。
以医学统计学为例,医生可能会选择一个先验分布,该分布已经考虑了疾病的流行率和其他相关因素。
这样的选定的先验分布可能会使得后验分布更加准确。
4. 更替先验分布
如果我们发现后验分布并不准确,那么我们应该考虑更换先验分布。
我们可以通过先验分布的灵活性,比如选择一个更加宽松的先验分布,来看看是否有更好的结果。
在贝叶斯统计学中,选择先验分布是一个非常关键的环节,它直接影响到后验分布和加权决策的准确性和可靠性。
因此,在选择先验
分布时,我们需要考虑问题所涉及的具体情况和领域知识,以及不断更替先验分布,以寻找效果更好的方法。
一先验分布和后验分布
i 1
i 1
第二种方法 设总体X的分布密度为p(x|),统计量
T ( X ) T ( X1X2 , , X n )是参数的充分统计量,则有
定理3.1 设f ( )为任一固定的函数,满足条件
(1) f ( ) 0, ,
(2) 0 gn(t | ) f ( )d
则
D f
{
gn (t | ) f ( ) gn (t | ) f ( )d
由第一小节内容可知,给定损失函数以后,风险函数定 义为
R( , d ) E (L( , d( X ))
L( , d( x))q( x | )dx
此积分仍为的函数,在给定的先验分布()时,定义
R(d ) E (R( , d ))
R( , d )π( )d
为决策函数d在给定先验分布()下的贝叶斯风险,简 称为d的贝叶斯风险.
X N (9.80, 0.12 )
这个信息就是重力加速度的先验信息.
在统计学中,先验信息可以更好的帮助人们解决 统计决策问题. 贝叶斯将此思想应用于统计决策中,形成了 完整的贝叶斯统计方法.
2、先验分布
对未知参数的先验信息用一个分布形式()来 表示,此分布()称为未知参数的先验分布.
例如 例1中重力加速度的先验分布为
则的贝叶斯估计为
d*( x) E(( ) | x) E(( ) | x)
证明略,此证明定理3.2的证明类似.
定理3.4 设参数为随机向量,先验分布为()
和损失函数为二次损失函数
L( , d ) (d )T Q(d )
1:改进生产设备后,高质量产品可占90%,
:改进生产设备后,高质量产品可占70%,
2
经理根据以往的经验,两个顾问建议可信度分别为
主观概率和先验分布
第二章主观概率和先验分布Subjective Probability and Prior Distribution 本章主要参考文献:60,52,上帝怎样掷骰子§2-1 基本概念一、概率(probability)1. 频率f n(A)==N a/NP (A)==limf n(A)…古典概率的定义n2. Laplace在《概率的理论分析》(1812)中的定义P(A)==k/N式中,k为A所含基本事件数,N为基本事件总数适用条件 1.基本事件有限2.每个基本事件等可能3.公理化定义E是随机试验,S是E的样本空间,对E的每一事件A,对应有确定实数P(A),若满足:①非负性:0≤P(A)≤1②规范性: P(S)=1③可列可加性:对两两不相容事件A k (k=1,2…) (A i∩A j=φ)P(∪A k)=∑P(A k)则称P(A)为事件A发生的概率二、主观概率(subjective probability, likelihood)1. 为什么引入主观概率。
有的自然状态无法重复试验如:明天是否下雨新产品销路如何明年国民经济增长率如何能否考上博士生。
试验费用过于昂贵、代价过大例:洲导弹命中率战争中对敌方下一步行动的估计2.主观概率定义:合理的信念的测度某人对特定事件会发生的可能的度量。
即他相信(认为)事件将会发生的可能性大小的程度。
这种相信的程度是一种信念,是主观的,但又是根据经验、各方而后知识,对客观情况的了解进行分析、推理、综合判断而设定(Assignment)的,与主观臆测不同。
例:考博士生、掷硬币、抛图钉三、概率的数学定义对非空集Ω,元素ω,即Ω={ω},F是Ω的子集A所构成的σ-域(即Ω∈F;若A∈F则A∈F;若A i∈F i=1,2,…则∪A i∈F)若P(A)是定在F上的实值集函数,它满足①非负性 P(A)≥0②规范性 P(Ω)=1③可列可加性则称P(A)为直的(主以或客观)概率测度,简称概率ω为基本事件A为事件三元总体(Ω,F,P)称为概率空间注意:主观概率和客观概率(objective probability)有相同的定义四、主客观概率的比较(一) 基本属性:O:系统的固有的客观性质,在相同条件下重复试验时频经的极限 S:概率是观察者而非系统的性质,是观察者对对系统处于某状态的信任程度(二)抛硬币:正面向上概率为1/2O:只要硬币均匀,抛法类似,次数足够多,正面向上的概率就是1/2,这是简单的定义。
统计决策与贝叶斯分析第三章先验分布的确定
使用直方图法时应注意
在实际绘制直方图时,需要考虑区间如何划分才比较恰当,而关于 分多少个区间以及每个区间的大小没有统一的标准。如果划分太细,会 增加估计概率的困难程度;如果划分太粗,则绘制的密度函数将会很粗 糙。因此,要根据问题的实际情况来确定如何划分。另外,借助直方图
得到的密度函数曲线 ( ) 是由各区间上的光滑曲线连接而成,因而并
不好处理。再者,它只适用于有限区间的情形,所以得到的只是截尾的 密度函数,尾部的小概率并未能得到估计。
2.累计概率曲线估计(定分度法和变分度法)
累计概率曲线估计法主要借助咨询专家意见以及决策者的主观 判断确定一些特殊点的概率,然后画出相应的概率曲线,最后利用这 条曲线近似估计其它点的概率。通常分为定分度法和变分度法。
(二)参数 为连续时
当参数 为连续时,我们可以借助已有的信息,根据以下几种方法获 得参数 的先验密度(或先验分布)。
1.直方图法 当参数 的取值空间 为实数轴的一个有限区间时,最简单的方法 是把 分成一些小区间,在每个区间上给出主观概率,然后绘制直方图(如
图 3.1.1),由直方图可以画出光滑的密度 ( ) 的草图。
观似然性,最后由此相对似然性描绘出先验密度。这种方法获得的先 验密度图形的精确度会随着点的增多而提高。
4.设定先验密度,估计未知参数
这种方法思路是:先选定一个先验密度(其中含有未知参数, 即超参数),然后根据已有信息计算先验密度中的未知参数,最后得 到参数的先验密度。
【例 3.1.4 】 假设对某种商品的需求量 选取先验分布为
合已有经验,通过对事件的比较,决定它们的相对似然性。
【例 3.1.1】 想要计算事件的概率,只要将 E 与例如 Ec 做比较, 如 果 决 策 者 根 据 经 验 认 为 E 的 发 生 机 会 是 Ec 的 三 倍 , 亦 即
名义尺度总体的共轭先验分布中参数的确定
可知 f( f是 Be0,- 0 p) (f0 /  ̄ / i )
下 面我们 分别 就几 种情 况讨论 如何确 定参 数 a ,。 …0. a , / 由前 面 的讨论知 道狄 里赫 利分 布的 边缘 分布 r 为Bt ea分布 , 故在这 里 , 我是通 过 B t ea分布 的参数估 计来 确定狄 里赫 利参数 d , 。…d 的 , 体如 下 : d , , 具
=
( i -P 1= = )( 一=二二 i = 2 I 一= = 二
= ∞
)d== 一i = =
… (p - a- 1 。 . r1 - . + - a Z
JP d ” l , 。户 P - 1
=
r( z a ) a t
+a + ( 口 锩 3 +) r 3 +) ∞ 、 口 3z ( 口 口… ( 口… ‘ 2而 ) 口 + , +r ) 2 + + a+ 一 2 +
数 口 ,:… , , 就是本 文所要 讨论 的主要 问题 . 。口 , 这
2 解 决 问题
我们设 狄里 赫利分 布为 D(。口, t , a,:…a) 即
=
斋 珥
一1 P>o ,, }
户 =1 P>o p I , , ED, . D= { . P ) P. . , I ,
a : )
口
b )
,
, r …
先验分布:(一)认识先验概率
先验分布:(⼀)认识先验概率⼀、先验概率的定义假设有随机变量θ,其取值仅为0或1;另有事件X,其取值仅为a或b。
我们⼜令当θ = 0时,X = a;当θ = 1时,X = b。
也就是说,θ的取值决定了X的取值。
现在,我们做⼀个游戏,游戏要求我们在不知道θ是多少(0或1)的情况下,估计X的值。
怎么办?由于θ的取值决定了X的取值,只要我们知道θ的取值,问题迎刃⽽解。
θ可以取0,也可以取1。
直观感觉告诉我们,θ有50%的机会等于0,另外50%的机会等于1。
换句话说,在估计X的值之前(不知道X会是多少),我们假设了θ有50%的机会等于0,另外50%的机会等于1。
⽽这两个50%的概率,就是先验概率。
⼆、先验概率分布我们已经知道,先验概率就是在知道结果之前,对原因的概率的估计。
要注意的是,这⾥并不是对原因的估计,⽽是对原因的概率的估计。
就像上⾯的例⼦,在不知道X会是多少的情况下,我们估计θ等于0的概率是50%,θ等于1的概率是50%。
在这个例⼦中,θ(的取值)服从(0 - 1)分布,也就是:θ要么是0,要么是1,只有两个值,统计学上记为Θ ~ (0 - 1)。
当然,⽆论出于何种原因,有⼈会觉得θ有60%的机会等于0,另外40%的机会等于1。
这样可以吗?可以,⽽且完全合理,因为我们没有任何经验证明θ有多少机会取0,有多少机会取1。
接下来,我们改⼀下⽂章⼀开头的假设:假设有随机变量θ,其取值为0、1或2;另有事件X,其取值为a、b、c。
我们⼜令当θ = 0时,X = a;当θ = 1时,X = b;当θ = 2时,X = c。
X的取值还是⼜θ决定。
现在要做的游戏也类似,即在不知道θ是多少(0或1或2)的情况下,估计X的值。
这次我们假设,θ有60%的机会等于0,30%的机会等于1,10%的机会等于3。
换⾔之,这就是在这种假设下的我们主观确定的先验概率分布。
要注意的是,我们这⾥假设X等于某个值的原因只有⼀个,也就是θ的其中⼀种取值。
先验分布:(二)选取先验概率分布
先验分布:(⼆)选取先验概率分布⼀、结合实际应⽤之前讲到,当不知道原因的概率的时候,可以选取⼀种相对灵活的概率分布表⽰先验概率的分布。
⽽选取哪种分布往往取决于实际应⽤或问题是什么。
在继续介绍该如何选取分布类型之前,我们先以⼀个简单的例⼦描述⼀下我们需要解决的问题:假设有两枚硬币C1和C2,C1硬币抛出正⾯的概率是0.6,C2硬币抛出正⾯的概率是0.3。
现在,我们做⼀个实验:每次取两枚硬币中的⼀枚,抛出这枚硬币,连抛10次,记录正⾯和反⾯出现的次数。
此为1次试验。
我们做5次。
实验结果如下:试验编号所⽤硬币试验结果1?5+:5-2?6+:4-3?3+:7-4?4+:6-5?6+:4-先不管所⽤硬币是哪枚,单单就试验结果⽽⾔,试验结果是服从⼆项分布的,即每⼀次抛硬币的结果⾮正即反。
然⽽,实际的情况是,试验中所⽤硬币对试验结果是有影响的,因为两枚硬币抛出正⾯的概率是不⼀样的。
因此,试验结果可以看作是先选取硬币,再抛选到的硬币。
也就是说,选硬币是原因,试验结果是这个原因所导致的结果。
现在,我们要根据这5次试验结果推断每次试验⽤的是哪枚硬币。
现在的情况是,我们不知道选到哪枚硬币的概率是多少,即选取硬币的概率未知。
为了推断每次试验⽤的是哪枚硬币,我们需要根据试验结果倒推,寻找能让这5次试验结果——这⼀组合出现概率最⼤的那个选硬币的概率。
如此,我们就有充分的信⼼相信,要使这5次试验结果的组合的出现概率最⼤,每次试验之前应该选哪枚硬币。
既然是倒推,就需要设定⼀个初始的选硬币的概率(先验概率),然后再根据倒推的结果(后验概率)调整选硬币的概率,这个过程可表⽰为:设选到硬币的事件为θ,每次试验硬币朝上的次数为X。
先假定选硬币的概率(如选到C1的概率为0.7,即p(θ=C1) = 0.7) →计算在已经选到硬币的基础上,在⼀次试验中出现X = 5的概率p(X=5|θ=C1),此即为似然函数的值 →根据公式:后验概率 = 似然函数 × 先验概率,计算在X = 5的情况下,选到的硬币是C1的概率, 表⽰为p(θ=C1|X=5),即后验概率 →根据这个后验概率调整(或替代)之前的先验概率事实上,在很多情况下,通过上述步骤得到的后验概率并不是最理想的结果,也就是说,如果⽤这个后验概率作为先验概率,再⼀次通过上述步骤计算出第⼆个后验概率,如果通过某些度量,发现第⼆个后验概率⽐第⼀个后验概率更好,则应该⽤第⼆个后验概率调整(或替代)第⼀个后验概率。
2 主观概率和先验分布
2.1 概率的基本概念 2.2 先验分布及其设定 2.3 设定主观概率的案例 2.4 “埃尔斯伯格悖论” (Ellsberg paradox)
2.1 概率的基本概念
1)概率的三种定义 2)主观概率 3)主观概率定义 4)主/客观概率的比较 5)小结:主/客观概率
2.1 概率的基本概念
图2.3 明年国民经济的增长率的概率分布直方图
·
缺点:①子区间的划分没有标准 ②赋值不易 ③尾部误差过大
(2)相对似然率法
•适用范围:同1 • 步骤:①离散化 ②赋值:给出各区间似然的相对比值 ③规范化:
(2)相对似然率法
(2)相对似然率法
示例4: 问题同示例3,用解法a) 求解。
首先由决策人判断似然率最大的子区间是哪一个,比如是7%,即明 年国民经济增长率最大可能性在6%~7%之间。 然后告诉他,把明年国民经济增长率在6%~7%之间的可能性记作10; 并要求他判断明年国民经济增长率在7%~8%之间的可能性有多大,设经 过交谈后定为8.5,由分析人员记入表2.1; 然后再开始判断下一个子区间的相对似然率,直到所有子区间的相对 似然率都设定为止。
(1)直方图法
该法适用于自然状态θ取值是实轴的的某个区间 的情况. 步骤:①将区间划分子区间θi…离散化; ②设定每个子区间的似然率π(θi)…赋值; ③变换成概率密度曲线.
例如:明年国民经济的增长率
0.2 0.15 0.1 0.05 0 2% 3% 4% 5% 6% 7% 8% 9% 10% 11% 12% 13% 14% 15% 柱形图 1
打赌法设事件e发生时收入p0e不发生设事件e发生时收入p0e不发生的收入为1调整p使决策人感到两者无差异为止连续型随机变量的先验分布的设定4与给定形式的分布函数相匹配1直方图法该法适用于自然状态取值是实轴的的某个区间的情况的情况
贝叶斯统计_先验分布的确定
贝叶斯统计_先验分布的确定第三章先验分布的确定3.1 主观概率3.1.1概率的公理化定义定义:设Ω为⼀个样本空间,F 为Ω的某些⼦集组成的⼀个事件域,如果对任⼀事件A ∈F ,定义在F 上⼀个实值函数P(A)满⾜下列条件:(1)⾮负性公理:对于每⼀事件A ,有P(A)≥0;(2)正则性(规范性)公理:P(Ω)=1;(3)可列可加性(完全可加性)公理:设A 1,A 2,…是互不相容的事件,即对于i≠j ,A i A j =?,i ,j=1,2,…,则有11()()i i i i P A P A ∞∞===∑U则称P (A )为事件A 的概率(Probability),称三元素(Ω,F ,P)为概率空间(Probability space)。
概率是定义在σ-域F 上的⼀个⾮负的、正则的、可列可加的集函数。
3.1.2主观概率在经典统计中,概率是⽤三条公理定义的:1)⾮负性;2)正则性;3)可加性。
概率确定⽅法有两种:1)古典⽅法;2)频率⽅法。
实际中⼤量使⽤的是频率⽅法,所以经典统计的研究对象是能⼤量重复的随机现象,不是这类随机现象就不能⽤频率的⽅法去确定其有关事件的概率。
这⽆疑把统计学的应⽤和研究领域缩⼩了[1]。
在经典统计中有⼀种习惯,对所得到的概率都要给出频率解释,这在有些场所是难于做出的。
譬如,天⽓预报:“明天下⾬的概率是0.8”。
贝叶斯统计中要使⽤先验信息,⽽先验信息主要是指经验和历史资料。
因此如何⽤⼈们的经验和过去的历史资料确定概率和先验分布是贝叶斯学派要研究的问题。
贝叶斯学派是完全同意概率的公理化定义,但认为概率也是可以⽤经验确定。
这是与⼈们的实践活动⼀致。
这就可以使不能重复或不能⼤量重复的随机现象也可谈及概率。
同时也使⼈们积累的丰富经验得以概括和应⽤。
贝叶斯学派认为:⼀个事件的概率是⼈们根据经验对该事件发⽣可能性所给出个⼈信念。
这样给出的概率称为主观概率。
下⾯举⼏个例⼦:⼀个企业家认为“⼀项新产品在未来市场上畅销”的概率是0.8,这⾥的0.8是根据他⾃⼰多年的经验和当时⼀些市场信息综合⽽成的个⼈信念。
贝叶斯统计第二版第三章答案
第三章 先验分布的确定3.1 大学生中戴眼镜的比例是0.7 3.6 (1)由题意可知因此,该密度既不是位置密度也不是尺度密度。
(2)由题意可知令 ,则因此,该密度是尺度密度。
(3)由题意可知令 ,则因此,该密度是尺度密度。
3.8 解:(1)由题意可知设12,,...,n X X X 是来自X 的简单随机样本,则对上式分别求一阶导、二阶导得(2)由题意可知 设,,...,X X X 是来自X 的简单随机样本,则1,11()20x p x θθθ⎧-<<+⎪=⎨⎪⎩ 其他2221111()1p x x x βθπβπββ==+⎛⎫+ ⎪⎝⎭2111x x ϕβπβ⎛⎫= ⎪⎝⎭⎛⎫+ ⎪⎝⎭1()x p x θϕββ⎛⎫= ⎪⎝⎭()1000(),a a x p x x x x x θ-+⎛⎫=> ⎪⎝⎭()100a x x a x x ϕ-+⎛⎫⎛⎫= ⎪ ⎪⎝⎭⎝⎭0001(),x p x x x x x θϕ⎛⎫=> ⎪⎝⎭()!x e p x x θθθ-=()11111ln ()lnln ln !!nii x n nnn i i i ni i i ii e l x p x x n x x θθθθθθ=-====∑===--∑∏∏∏11n i i l x n θθ=∂=-∂∑22211n i i l x θθ=∂=-∂∑22211()nx x i i l nI E E x θθθθθθ=⎡⎤∂⎡⎤=-==⎢⎥⎢⎥∂⎣⎦⎣⎦∑()πθ=()(1)x xn xn p x C θθθ-=-()21111ln ()ln ln ()ln(1)i n n n nx i ni i i i i i l x p x C x n x θθθθ======++--∑∑∑∏对上式分别求一阶导、二阶导得(3)由题意可知 1()(1)x m x x m p x C θθθ+-=- 设12,,...,n X X X 是来自X 的简单随机样本,则()1111ln ()ln ln ln(1)ii nnnx i x m i i i i l x p x Cnm x θθθθ+-=====++-∑∑∏对上式分别求一阶导、二阶导得(4)由题意可知 设12,,...,n X X X 是来自X 的简单随机样本,则()()()111ln ()ln ln 1ln nnni i i i i i l x p x n n x x αθαλααλ=====-Γ+--∑∑∏对上式分别关于α求一阶导、二阶导得(5)设,,...,X X X 是来自X 的简单随机样本,则21111ni n i i i n x l x θθθ==-∂=-∂-∑∑()221222111nini i i n x l x θθθ==-∂=--∂-∑∑()222122211()(1)1ni nx x i i i n x l n I E E x θθθθθθθθ==⎡⎤-⎢⎥⎡⎤∂⎢⎥=-=+=⎢⎥∂--⎢⎥⎣⎦⎢⎥⎣⎦∑∑()πθ=111n i i l nm x θθθ=∂=-∂-∑()212221n i i x l nm θθθ=∂=--∂-∑()212222()(1)1ni x x i x l nm nm I E E θθθθθθθθ=⎡⎤⎢⎥⎡⎤∂⎢⎥=-=+=⎢⎥∂--⎢⎥⎣⎦⎢⎥⎣⎦∑()πθ=1()ln ln ()nii l n n x αλαα='∂Γ=-+∂Γ∑()()()()()222l n αααααα''''ΓΓ-ΓΓ∂=-∂Γ()1(),0xp x x e x ααλλαα--=>Γ()()()()()()()()()()2222()x x l I E E n n αααααααααααααα⎡⎤''''''''ΓΓ-ΓΓΓΓ-ΓΓ⎡⎤∂=-==⎢⎥⎢⎥∂ΓΓ⎣⎦⎣⎦()πα=,0xe x λ->()()()111ln ()ln ln 1ln n n ni i i i i i l x p x n n x x λθαλααλ=====-Γ+--∑∑∏对上式分别关于λ求一阶导、二阶导得(6)由题意可知 设12,,...,n X X X 是来自X 的简单随机样本,则()()()111,ln ()ln ln 1ln nnni i i i i i l x p x n n x x αλθαλααλ=====-Γ+--∑∑∏对上式分别关于λ求导得令(),θαλ=,则3.9 证明:由题意可知 ()()ln i i i i i l x p x θθ=()i i πθ=1nii l n x αλλ=∂=-∂∑222l n αλλ∂=-∂2222()x x l n n I E E λλααλλλλ⎡⎤∂⎡⎤=-==⎢⎥⎢⎥∂⎣⎦⎣⎦()πλ=222l n αλλ∂=-∂()()()()()()()()()()()22222det 1nn n I nn αααααααααλθαλααλλ''''ΓΓ-ΓΓ-⎡⎤''''ΓΓ-ΓΓΓ==-⎢⎥Γ⎣⎦-()1(,),0xp x x e x ααλλαλα--=>Γ()()()()()222l n αααααα''''ΓΓ-ΓΓ∂=-∂Γl n αλλ∂=∂∂()()()()()()()()()()2222l E E n n ααααααααααα⎡⎤''''''''ΓΓ-ΓΓΓΓ-ΓΓ⎡⎤∂-==⎢⎥⎢⎥∂ΓΓ⎣⎦⎣⎦2222l n n E E ααλλλ⎡⎤∂⎡⎤-==⎢⎥⎢⎥∂⎣⎦⎣⎦()l n E αλλ∂-=-∂∂()2n πθα⎡=⎢()()22i i i i l x I E θθθ⎛⎫∂=- ⎪ ⎪∂⎝⎭由于各i X 独立,因此有()()1211(,,...,)ln ln kkk i i i i i i i i l x x x p x p x θθθ====∑∏由上式可得出因此有 ()()1d e t ki i I I θθ==∏所以3.10 解: 由题意可知 ()0.0120.01,0e θπθθθ--=>因此有 所以有3.11解:由题意可知所以有 ()(,)()h x p x θθπθ= 进而有()()2222i i i i i l x l x θθθθ∂∂=∂∂()20i i j l x θθθ∂=∂∂()()()()11det k k kiii i I I πθθθπθ======∏∏()0.010.01123(,)()e0.010.01e,0x xh x p x e x θθθθθπθθθθθ+------===>>0.010.010.01300111()0.01eee 0.010.01x x x xx x m x d x x θθθθθθ+++----⎡⎤==+=⎢⎥++⎣⎦⎰121211(,,...,,,...,)()!iix n ni n n i i i i i e p x x x p x x θθθθθθ-====∏∏()()()11112111,,...,()niii n nnnn i i i n i i i e eαααβθβθαββπθθθπθθθαα=----===∑⎛⎫=== ⎪ΓΓ⎝⎭∏∏∏()12121212(0,)()(,,...,,,...,),,...,...n n n nm x p x x x d d d θθθπθθθθθθ+∞=⎰。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
②若从混合分布抽取一个容量为n的样本 x1,x2,…,xn,则约有nπ(θ1)个来自F(x |θ1),约 有nπ(θ2)个来自F(x |θ2)。 (3)实例分析:
25
26
三、先验选择的ML-Ⅱ方法 定义:设 { ( | ), } 为所考虑的先 验类,且x=(x1,x2,…,xn)是来自边缘分布 ˆ ) 满足(对观 ˆ ( 中的样本,若存在 n 测数据x): ˆ ) sup m(x | m( xi | )
8
4.充分利用历史资料,考虑现有信息加以修正
9
注意事项:(1)不管按照什么方法确定的主 观概率必须满足概率的三条公理: ①非负性公理:对任意事件A,0≤P(A)≤1。 ②正则性公理:必然事件的概率为1 ③可列可加性公理:对可列个互不相容的事件A1, A2,…,有
P( Ai ) P( Ai )
5
2.利用专家意见确定主观概率
6
3.向多位专家咨询确定主观概率
7
在座人员根据自己的经验各写了两个数,经理 在计算了两个平均值后,稍加修改,提出自己看 法:在上述两种情况下,本公司新产品畅销率各 为0.9和0.4,这是经理在征求多位专家意见后所 获得的主观概率。另据本公司情报部门报告,外 厂正忙于另一项产品开发,很可能无暇顾及生产 此新产品。经理据此认为,外厂将生产此新产品 的概率为0.3,不生产此产品的概率为0.7. 利用上述四个主观概率,由全概率公式可得本 公司生产此新产品获畅销的概率为 0.9*0.7+0.4*0.3=0.75
41
二、位置-尺度参数族的无信息先验
定义:设密度函数中有两个参数μ与σ,且密度具有 下述形式: 1 x p( x; , ) f , (, ) , (0, ) 其中f(x)是一个完全确定的函数,它相应于μ=0, σ=1时的密度,μ称为位置参数,σ称为尺度参数, 这类分布族称为位置-尺度参数族。如正态分布、指 数分布、均匀分布等都属于这一类。 特别σ=1时称为位置参数族,而μ=0时称为尺度参 数族。
E x| ( x m ( )) 2 ( | )d
2 2 2 x| x| 2
E ( x m ( ))
E ( x ( ) ( ) m ( ))
2 x|
E ( x ( )) E ( ( ) m ( ))
40
2.应用贝叶斯假设时所出现的问题
(1)当θ的取值范围为无限区间时,就无法在Θ 上定义一个正常的均匀分布。 定义3.1 设总体X~f(x|θ),θ∈Θ。若θ的先 验分布π(θ)满足下列条件: ①π(θ)≥0,且 ( )d ②由此决定的后验密度π(θ|x)是正常的密度函 数,则称π(θ)为θ的广义先验密度。 (2)贝叶斯假设不满足变换下的不变性。
计算其样本均值和样本方差,即: n 1 n 1 2 ˆ m x xi , ˆm ( xi x )2 n i 1 n i 1 再用样本矩代替边际分布的矩,列出如下方程
| ˆ m E [ ( )]
ˆ ( ) E [ ( )] E [ ( ) m ( )]
30
2.计算边缘密度m(x|λ) 的期望μm(λ) 2 和方差 m ( ) ,其中:
m ( ) E ( X ) xm( x | )dx
x| x
x p ( x | ) ( | )ddx
x
x
xp( x | )dx ( | )d
44
例3.18 设x是从正态总体N(θ,σ2)抽取的容量为 1的样本,其中σ2已知,θ未知,但知其为正, 试求参数θ的估计。 解:这是一种带约束条件的估计问题,用贝叶 斯方法解决这类问题比较容易。取参数θ的无 信息先验分布为(0,∞)上的均匀分布,即: π(θ)=I(0,∞)(θ) 由此可得后验密度:
ˆ 被称为Ⅱ型极大似然先验,或简称为ML则 Ⅱ先验。 说明:这里将m(x)看成似然函数
27
i 1
28
29
四、先验选择的矩方法
在选择π ∈Г 时,可用矩方法代替极大似然方法。 矩方法应用于当Г有“已知函数形式”。即可利用 先验矩与边缘分布矩之间的关系寻求超参数的估计。 这种方法称为先验选择的矩方法。该方法的具体步 骤是: 1.计算总体分布p(x|θ )的期望μ (θ )和方差σ 2(θ ), 即 μ (θ )=Ex|θ (X), σ 2(θ )= Ex|θ [X-μ (θ )]2 Ex|θ 表示用θ 给定下的条件分布p(x|θ )求期望。
18
§3.3 利用边缘分布m(x)确定先验密度
一、边缘分布m(x)
二、混合分布 三、先验选择的ML-II方法
四、先验选择的矩方法
19
一、边缘分布m(x) 设总体X的密度函数为p(x|θ ),它含有未 知参数θ ,若θ 的先验分布选用形式已知的 密度函数π (θ ),则可算得X的边缘分布(即 无条件分布): 当为连续时 p( x | ) ( )d , m( x) p ( x | ) ( ) , 当 为离散时
i 1 i 1
(2)如果发现所确定的主观概率与上述三个公理 及其推出的性质相悖,必须立即修正。直到两者一 致为止。(例3.5)
10
11
§3.2 利用先验信息确定先验分布
一、直方图法 二、选定先验密度函数形式再估计其超参数 三、定分度法与变分度法
12
一、直方图法
基本步骤: 1.把参数空间分成一些小区间; 2.在每个小区间上决定主观概率或依据历史数 据确定其频率; 3.绘制频率直方图; 4.在直方图上作一条光滑曲线,此曲线即为先 验分布()。 例3.6 某药材店记录了吉林人参的每周销售量, 现要寻求每周平均销售量θ的概率分布。
1 ( | , ) e , 0 ( ) 2 ˆ m 和方差 ˆm 现有混合样本的均值 ,试求超参数, 的矩估计。
解:
34
35
36
37
例3.14 设总体X~N(θ ,1),其中参数θ的先验分 2 布取共轭先验 N ( , ) 。试估计两个参数的值。 解:
( ) ( | )d E | [ ( )]
31
2 m ( ) E x| [ X m ( )]2
( x m ( )) 2 p( x | ) ( | )ddx
x
其中: x|
x
2 ( x ( )) p( x | )dx ( | )d m
3
二、确定主观概率的方法
1.利用对立事件的比较确定主观概率(例3.1); 2.利用专家意见确定主观概率(例3.2) ; 3.向多位专家咨询确定主观概率(例3.3) ; 4.充分利用历史资料,考虑现有信息加以修正,才 能得到比较切合实际的主观概率(例3.4) 。
4
1.利用对立事件的比较确定主观概率
14
15
16
Hale Waihona Puke 说明:如果有两个甚至多个先验分布都满足给定的先 验信息,则要看情况选择:假如这两个先验分布差异 不大,对后验分布影响也不大,则可任选一个;如果 我们面临着两个差异极大的先验分布可供选择时,一 17 定要根据实际情况慎重选择。
三、定分度法与变分度法
基本概念: (1)定分度法:把参数可能取值的区间逐次分 为长度相等的小区间,每次在每个小区间上 请专家给出主观概率. (2)变分度法:该法是把参数可能取值的区间 逐次分为机会相等的两个小区间,这里的分 点由专家确定. 例3.2.3(自学)
2 m 2
|
|
2
解此方程组,可得超参数 (1 , 2 ) 的估计 ˆ) ˆ ( ˆ , ˆ ) 从而获得先验分布 ( |
1 2
33
例3.13设总体X ~ Exp( ),其密度函数为 x p( x | ) e , x 0, 参数的先验分布取伽玛分布 Ga( , ),其密度函数
23
(2)混合样本的概念:从混合分布中抽出的样本称为
混合样本。 注:①从混合分布F(x)中抽取一个样品x1,相当于 如下的二次抽样: 第一次:从π(θ)中抽取一个样品θ。 第二次:若θ=θ1,则从F(x |θ1)中再抽一个样品, 这个样品就是x1; 若θ=θ2,则从F(x |θ2)中再抽一个样品,这个样品 就是x1
38
§3.4 无信息先验分布
一、贝叶斯假设 二、位置—尺度参数族的无信息先验
三、用Fisher信息阵确定无信息先验
39
一、贝叶斯假设
1.贝叶斯假设的基本含义 无信息先验分布应选取在θ(同等无知,无 偏爱)取值范围内的均匀分布,即: c, ( ) 0,
这种看法被称为贝叶斯假设。 说明:贝叶斯假设在很多情况下都是合理的。
当先验分布含有未知参数,譬如π(θ )= π(θ |λ ),那 么边缘分布m(x)依赖于λ,可记为m(x|λ ),这种边缘分 布在寻求后验分布时常遇到。
20
21
22
二、混合分布
(1)混合分布的概念:设随机变量X以概率π 在总体F1 中取值,以概率1-π 在总体F2中取值。若F(x|θ 1)和 F(x|θ 2)分别是这两个总体的分布函数,则X的分布 函数为:F(x)= π F(x |θ 1)+(1-π )F(x|θ 2) 或用密度函数(或概率密度)表示: p(x)= π p(x |θ 1)+ (1-π )p(x|θ 2) 这个分布F(x)称为F(x |θ 1)和F(x|θ 2)的混合分布。 这里的π 和1-π 可以看作一个新随机变量θ 的分布, 即: P(θ =θ 1)=π =π (θ 1), P(θ =θ 2)=1-π =π (θ 2)
代入上式得:
2 m