贝叶斯估计在抽样调查中的应用(PPT39页)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11
• 后验分布是三种信息的综合,先验分布反应人们 在抽样前对参数的认识,后验分布反应人们在抽 样后对参数的认识
• Bayes统计推断原则:对参数 所作任何推断( 参数估计,假设检验等)都必须建立在后验分布基 础上.
12
共轭分布法
13
定义:设是总体分布中的参数(或参数向量) ,是的先验密度函数,假如由抽样信息算得的 后验密度函数与有相同的密度函数形式,则称 是的(自然)共轭先验分布。
数 和 为权数的加权算术平均,实际上此
方差的
倒数是估计精度的倒数,即方差的值越大, 其
倒数便越小,则相应平均数作为估计的精度 就
越低,通俗的讲是该平均数的代表性越差;
反之,方差越小,其倒数越大,相应平均数 的估计精度越高。
23
贝叶斯估计量方差的意义是先验 指标和抽样指标精度之和的倒数。 而以上估计式有非常直观的含义: 贝叶斯估计量的精度为先验指标精 度与抽样指标精度之和,这意味着 贝叶斯估计量的精度要高于 中任何一个作为估计量的估计精度 ,即:
3
第一章先验分布与后验分布
统计学有两个主要学派:频率学派与贝叶斯学派. 它们之间有异同,贝叶斯统计是在与经典统计的争论中 发展起来,主要的争论有: 1.未知参数可否作为随机变量? 2.事件的概率是否一定的频率解释? 3.概率是否可用经验来确定?
………. §1.1 先介绍三种信息的概念
经典统计学派规定统计推断使用两种信息: 总体信息 样本信息
贝叶斯估计在抽样调查 中的应用(PPT39页)
2021年8月6日星期五
(Bayes,Thomas)(1702─1761) 贝叶斯是英国数学家.1702年生于伦敦;
1761年4月17日卒于坦布里奇韦尔斯. 贝叶斯是一位自学成才的数学家.曾助理宗
教事务,后来长期担任坦布里奇韦尔斯地方教 堂的牧师.1742年,贝叶斯被选为英国皇家学 会会员.
P(32≤X≤38)=0.90
8
9
三种信息
基于上述三种信息(总体信息、样本信息 和先验信息)进行的统计推断被称为贝叶斯统 计学。它与经典统计学的主要差别在于是否利 用先验信息。贝叶斯统计学派把任意一个未知 参数都看成随机变量,应用一个概率分布去描 述它的未知状况,该分布称为先验分布。
10
贝叶斯的信息处理路径
而贝叶斯学派认为是三种信息: 总体信息 样本信息 先验信息
4
总体信息
即总体分布或总体所属分布族给我们的信 息。 譬如,“总体是正态分布”就给我们带来很 多信息:密度函数是一条钟形曲线;一切一阶 距都存在;有关正态变量(服从正态分布随机 变量)的一些事件的概率可以计算;由正态分 布可以导出分布,分布和分布等重要分布,还 有许多成熟的点估计、区间估计和假设检验方 法可供我们选用。总体信息是很重要的信息, 为了获得此信息,往往耗资巨大。
20
设,欲对总体均值 进行估计,根据该总 体以往的资料有该指标的平均数 和方差 ,现从总体N中抽出容量为n的样本,计 算得样本平均数 和该平均数的方差 ,则总体均值的贝叶斯估计法的估计量为 :
21
• 其中:
估计量的方差为:
22
显然
是相关的同一指标的两个取值
水平,则上式的 可以看做是以方差的倒
贝叶斯推断的基本方法是将关于未知参数的先验 信息与样本信息综合,再根据贝叶斯定理,得出后验 信息,然后根据后验信息去推断未知参数(茆诗松和王 静龙等,1998年)。
“贝叶斯提出了一种归纳推理的理论(贝叶斯定理) ,以后被一些统计学者发展为一种系统的统计推断方 法,称为贝叶斯方法.”──摘自《中国大百科全书》( 数学卷)
24
例如,某市有居民家庭共 97670户,根据上年的统计,居民 人均月货币收入为2580元,其方 差为5804.22,现从该总体中随机 抽出100户,调查目前居民人均收 入水平情况,有关调查结果和计算 见表8.
25
26
27
28
29
30
31
32
33Biblioteka 4353637
38
应该着重指出,共轭先验分布是对某一分 布中的参数而言的。如正态均值、正态方差、 泊松均值等。离开指定参数及其所在的分布去 谈论共轭先验分布是没有意义的。
14
正态均值(方差已知)的共轭先验分布是正态分 布
15
16
17
常用共轭先验分布
18
共轭先验分布的优点
19
贝叶斯估计在抽样推断中的应 用
贝叶斯估计法也是一种需要利用与 调查变量相关的辅助变量(先验信息)进 行估计的方法,但其方法和思路与其他方 法相比有自己的特色。贝叶斯估计法的基 本思路是,要对某一指标或目标进行估计 ,则总体以前该指标的水平,即先验指标 与目前欲估计的指标(即目标量)也称后 验指标有关,可以利用先验指标对后验指 标进行估计。
5
样本信息
从总体中抽取的样本给我们提供的信息 。
这是最“新鲜”的信息,并且愈多愈好 。人们希望对样本的加工和处理对总体的 某些特征作出较为精确的统计推断。没有 样本就没有统计学可言。这是大家都理解 的事实。
6
基于上述两种信息进行的统计推断称为经典 统计学,它的基本观点是把数据(样本)看成 是具有一定概率分布的总体,所研究的对象是 这个总体而不局限于数据本身。这方面最早的 工作是高斯(Gauss,C.F.1777~1855)和勒让德 (Legendre,A.M.1752~1833)的误差分析, 正态分布和最小二乘法。从十九世纪末到二十 世纪上半叶,经皮尔逊( Pearson,K.1857~1936)、费歇( F i s h e r, R . A . 1 8 9 0 ~ 1 9 6 2 ) 奈 曼 ( N e y m a n . J . ) 等人的杰出工作创立了经典统计学。随着经典 统计学的持续发展与广泛的应用,它本身的缺 陷也逐渐暴露出来了。
如今在概率、数理统计学中以贝叶斯姓氏 命名的有贝叶斯公式、贝叶斯风险、贝叶斯决 策函数、贝叶斯决策规则、贝叶斯估计量、贝 叶斯方法、贝叶斯统计等等.
2
贝叶斯方法(Bayesian approach )
贝叶斯方法是基于贝叶斯定理而发展起来用于系 统地阐述解决统计问题的方法(Samuel Kotz和吴喜之 ,2000)。
7
先验信息
即在抽样之前有关统计问题的一些信息,一般 说来,先验信息主要来源于经验和历史资料。
例1:有一英国妇女,对奶茶能辨别出先倒进茶 还是先倒进奶,做十次试验她都正确说出。
某学生第一次看到他的数学老师,即有反应:老师30岁 到40之间,极可能35岁左右(左右可理解为正负3岁,极可 能可理解为90%的可能).
• 后验分布是三种信息的综合,先验分布反应人们 在抽样前对参数的认识,后验分布反应人们在抽 样后对参数的认识
• Bayes统计推断原则:对参数 所作任何推断( 参数估计,假设检验等)都必须建立在后验分布基 础上.
12
共轭分布法
13
定义:设是总体分布中的参数(或参数向量) ,是的先验密度函数,假如由抽样信息算得的 后验密度函数与有相同的密度函数形式,则称 是的(自然)共轭先验分布。
数 和 为权数的加权算术平均,实际上此
方差的
倒数是估计精度的倒数,即方差的值越大, 其
倒数便越小,则相应平均数作为估计的精度 就
越低,通俗的讲是该平均数的代表性越差;
反之,方差越小,其倒数越大,相应平均数 的估计精度越高。
23
贝叶斯估计量方差的意义是先验 指标和抽样指标精度之和的倒数。 而以上估计式有非常直观的含义: 贝叶斯估计量的精度为先验指标精 度与抽样指标精度之和,这意味着 贝叶斯估计量的精度要高于 中任何一个作为估计量的估计精度 ,即:
3
第一章先验分布与后验分布
统计学有两个主要学派:频率学派与贝叶斯学派. 它们之间有异同,贝叶斯统计是在与经典统计的争论中 发展起来,主要的争论有: 1.未知参数可否作为随机变量? 2.事件的概率是否一定的频率解释? 3.概率是否可用经验来确定?
………. §1.1 先介绍三种信息的概念
经典统计学派规定统计推断使用两种信息: 总体信息 样本信息
贝叶斯估计在抽样调查 中的应用(PPT39页)
2021年8月6日星期五
(Bayes,Thomas)(1702─1761) 贝叶斯是英国数学家.1702年生于伦敦;
1761年4月17日卒于坦布里奇韦尔斯. 贝叶斯是一位自学成才的数学家.曾助理宗
教事务,后来长期担任坦布里奇韦尔斯地方教 堂的牧师.1742年,贝叶斯被选为英国皇家学 会会员.
P(32≤X≤38)=0.90
8
9
三种信息
基于上述三种信息(总体信息、样本信息 和先验信息)进行的统计推断被称为贝叶斯统 计学。它与经典统计学的主要差别在于是否利 用先验信息。贝叶斯统计学派把任意一个未知 参数都看成随机变量,应用一个概率分布去描 述它的未知状况,该分布称为先验分布。
10
贝叶斯的信息处理路径
而贝叶斯学派认为是三种信息: 总体信息 样本信息 先验信息
4
总体信息
即总体分布或总体所属分布族给我们的信 息。 譬如,“总体是正态分布”就给我们带来很 多信息:密度函数是一条钟形曲线;一切一阶 距都存在;有关正态变量(服从正态分布随机 变量)的一些事件的概率可以计算;由正态分 布可以导出分布,分布和分布等重要分布,还 有许多成熟的点估计、区间估计和假设检验方 法可供我们选用。总体信息是很重要的信息, 为了获得此信息,往往耗资巨大。
20
设,欲对总体均值 进行估计,根据该总 体以往的资料有该指标的平均数 和方差 ,现从总体N中抽出容量为n的样本,计 算得样本平均数 和该平均数的方差 ,则总体均值的贝叶斯估计法的估计量为 :
21
• 其中:
估计量的方差为:
22
显然
是相关的同一指标的两个取值
水平,则上式的 可以看做是以方差的倒
贝叶斯推断的基本方法是将关于未知参数的先验 信息与样本信息综合,再根据贝叶斯定理,得出后验 信息,然后根据后验信息去推断未知参数(茆诗松和王 静龙等,1998年)。
“贝叶斯提出了一种归纳推理的理论(贝叶斯定理) ,以后被一些统计学者发展为一种系统的统计推断方 法,称为贝叶斯方法.”──摘自《中国大百科全书》( 数学卷)
24
例如,某市有居民家庭共 97670户,根据上年的统计,居民 人均月货币收入为2580元,其方 差为5804.22,现从该总体中随机 抽出100户,调查目前居民人均收 入水平情况,有关调查结果和计算 见表8.
25
26
27
28
29
30
31
32
33Biblioteka 4353637
38
应该着重指出,共轭先验分布是对某一分 布中的参数而言的。如正态均值、正态方差、 泊松均值等。离开指定参数及其所在的分布去 谈论共轭先验分布是没有意义的。
14
正态均值(方差已知)的共轭先验分布是正态分 布
15
16
17
常用共轭先验分布
18
共轭先验分布的优点
19
贝叶斯估计在抽样推断中的应 用
贝叶斯估计法也是一种需要利用与 调查变量相关的辅助变量(先验信息)进 行估计的方法,但其方法和思路与其他方 法相比有自己的特色。贝叶斯估计法的基 本思路是,要对某一指标或目标进行估计 ,则总体以前该指标的水平,即先验指标 与目前欲估计的指标(即目标量)也称后 验指标有关,可以利用先验指标对后验指 标进行估计。
5
样本信息
从总体中抽取的样本给我们提供的信息 。
这是最“新鲜”的信息,并且愈多愈好 。人们希望对样本的加工和处理对总体的 某些特征作出较为精确的统计推断。没有 样本就没有统计学可言。这是大家都理解 的事实。
6
基于上述两种信息进行的统计推断称为经典 统计学,它的基本观点是把数据(样本)看成 是具有一定概率分布的总体,所研究的对象是 这个总体而不局限于数据本身。这方面最早的 工作是高斯(Gauss,C.F.1777~1855)和勒让德 (Legendre,A.M.1752~1833)的误差分析, 正态分布和最小二乘法。从十九世纪末到二十 世纪上半叶,经皮尔逊( Pearson,K.1857~1936)、费歇( F i s h e r, R . A . 1 8 9 0 ~ 1 9 6 2 ) 奈 曼 ( N e y m a n . J . ) 等人的杰出工作创立了经典统计学。随着经典 统计学的持续发展与广泛的应用,它本身的缺 陷也逐渐暴露出来了。
如今在概率、数理统计学中以贝叶斯姓氏 命名的有贝叶斯公式、贝叶斯风险、贝叶斯决 策函数、贝叶斯决策规则、贝叶斯估计量、贝 叶斯方法、贝叶斯统计等等.
2
贝叶斯方法(Bayesian approach )
贝叶斯方法是基于贝叶斯定理而发展起来用于系 统地阐述解决统计问题的方法(Samuel Kotz和吴喜之 ,2000)。
7
先验信息
即在抽样之前有关统计问题的一些信息,一般 说来,先验信息主要来源于经验和历史资料。
例1:有一英国妇女,对奶茶能辨别出先倒进茶 还是先倒进奶,做十次试验她都正确说出。
某学生第一次看到他的数学老师,即有反应:老师30岁 到40之间,极可能35岁左右(左右可理解为正负3岁,极可 能可理解为90%的可能).