第六章点估计教案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
为用 估计 而产生的系统误差.
定理1设 为取自总体X的样本,总体X的均值为 ,方差为 .则
(1)样本均值 是 的无偏估计量;
(2)样本方差 是 的无偏估计量;
(3)样本二阶中心矩 是 的有偏估计量.
2.有效性
定义2设 和 都是参数 的无偏估计量,若
,
则称 较 有效.
注:在数理统计中常用到最小方差无偏估计,其定义如下:
参数估计问题的一般提法:
设有一个统计总体,总体的分布函数为 ,其中 为未知参数( 可以是向量).现从该总体中随机地抽样,得一样本
,
再依据该样本对参数 作出估计,或估计参数 的某已知函数
第一节点估计问题概述
一、点估计的概念
设 是取自总体X的一个样本, 是相应的一个样本值. 是总体分布中的未知参数,为估计未知参数 ,需构造一个适当的统计量
课堂练习
已知某地区农户人均生产蔬菜量为X(单位:kg),且 现随机抽取9个农户,得人均生产蔬菜量为
75, 143, 156, 340, 400, 287, 256, 244, 249
问该地区农户人均生产蔬菜量最多为多少 ?
第六章习题课
1、知识总结:
1、点估计问题概述
(1)点估计概念
(2)评价估计量的标准:无偏性、有效性、相合性(一致性)
1、置信区间的概念
定义1设 为总体分布的未知参数, 是取自总体X的一个样本,对给定的数 ,若存在统计量
使得
则称随机区间 为 的 双侧置信区间,称 为置信度,又分别称 与 为 的双侧置信下限与双侧置信上限.
注:1.置信度 的含义:在随机抽样中,若重复抽样多次,得到样本 的多个样本值 ,对应每个样本值都确定了一个置信区间 ,每个这样的区间要么包含了 的真值,要么不包含 的真值.根据伯努利大数定理,当抽样次数充分大时,这些区间中包含 的真值的频率接近于置信度(即概率) ,即在这些区间中包含 的真值的区间大约有 个,不包含 的真值的区间大约有 个.例如,若令 ,重复抽样100次,则其中大约有95个区间包含 的真值,大约有5个区间不包含 的真值.
然后用其观察值
来估计 的值.
称 为 的估计量.称 为 的估计值.在不致混淆的情况下,估计量与估计值统称为点估计,简称为估计,并简记为 .
注:估计量 是一个随机变量,是样本的函数,即是一个统计量,对不同的样本值, 的估计值 一般是不同的.
例1
设X表示某种型号的电子元件的寿命(以小时计),它服从指数分布:
例2设总体 的均值 及方差 都存在,且有 ,但 均为未知,又设 是来自 的样本.试求 的矩估计量.
例3设总体X的概率分布为
其中 为未知参数.现抽得一个样本 求 的矩估计值.
课堂练习
设总体 在 上服从均匀分布, 未知. 是来自
的样本,试求 的矩估计量.
课后作业:P142 T 2
第三节置信区间
在区间估计理论中,被广泛接受的一种观点是置信区间,它由奈曼(Neymann)于1934年提出。
第六章参数估计
在实际问题中,当所研究的总体分布类型已知,但分布中含有一个或多个未知参数时,如何根据样本来估计未知参数,这就是参数估计问题.
参数估计问题分为点估计问题与区间估计问题两类.
点估计就是用某一个函数值作为总体未知参数的估计值;
区间估计就是对于未知参数给出一个范围,并且在一定的可靠度下使这个范围包含未知参数.
(2)n多大方能使 的90%置信区间的长度不超过1?
(3)n多大方能使 的95%置信区间的长度不超过1?
例3有一大批糖果.现从中随机地取16袋,称得重量(以克计)如下:
506 508 499 503 504 510 497 512
514 505 493 496 506 502 509 496
设袋装糖果的重量近似地服从正态分布,试求总体均值 的置信水平为0.95的置信区间.
3、单正态总体方差的置信区间
上面给出了总体 的区间估计,在实际问题中要考虑精度或稳定性时,需要对正态总体的方差 进行区间估计.
例1设总体 为已知, 为未知,设 是来自X的样本,求 的置信水平为 的置信区间.
例2设总体 为未知参数, 是取自总体X的简单随机样本,如果以区间 作为 的置信区间,那么置信度是多少?
2、寻求置信区间的方法
寻求置信区间的基本思想:在点估计的基础上,构造合适的函数,并针对给定的置信度导出置信区间.
一般步骤:
设总体 其中 , 未知, 是取自总体X的一个样本.求方差 的置信度为 的置信区间. 的无偏估计为 ,从第五章第三节的定理知,
,
对给定的置信水平 ,由
于是方差 的 置信区间为
而方差 的 置信区间
例4为考察某大学成年男性的胆固醇水平,现抽取了样本容量为25的一样本,并测得样本均值 样本标准差 .假定所论胆固醇水平 与 均未知.试分别求出 以及 的90%置信区间.
求矩估计的方法:
设总体 的分布函数 中含有k个未知参数 ,则
(1)求总体 的前k阶矩 ,一般都是这k个未知参数的函数,记为
(*)
(2)从(*)中解得
(3)再用 的估计量 分别代替上式中的 ,即可得 的矩估计量:
注:求 类似于上述步骤,最后用 代替 ,求出矩估计 。
例1设总体X的概率密度为
其中 是未知数, 是取自X的样本,求参数 的矩估计.
(1)选取未知参数 的某个较优估计量 ;
(2)围绕 构造一个依赖于样本与参数 的函数
(3)对给定的置信水平 ,确定 与 ,使
通常可选取满足 的 与 ,在常用分布情况下,这可由分位数表查得;
(4)对不等式作恒等变形化后为
,
则 就是 的置信度为 的双侧置信区间。
例3设总体X的密度为
未知参数 为取自X的样本.
2、单正态总体均值的置信区间(2)
设总体 其中 , 未知, 是取自总体X的一个样本.
此时可用 的无偏估计 代替 ,构造统计量
,
从第五章第三节的定理知
对给定的置信水平 ,由
,
即
因此,均值 的 置信区间为
例2某旅行社随机访问了25名旅游者,得知平均消费额 元,子样标准差 元,已知旅游者消费额服从正态分布,求旅游者平均消费额 的95%置信区间.
(1)证明 是 的无偏估计;
(2)求
例3设 为来自总体X的样本, , 均为总体均值 的无偏估计量,问哪一个估计量有效?
例4设总体 , 为其样本.试证样本方差 是 的相合估计量.
课堂练习
设总体X的k阶矩 存在,又设 是X的一个样本.试证明不论总体服从什么分布,k阶样本矩 是k阶总体矩 的无偏估计量.
课后作业:P137 T 3、4
2.置信区间 也是对未知参数 的一种估计,区间的长度意味着误差,故区间估计与点估计是互补的两种参数估计.
3.置信度与估计精度是一对矛盾.置信度 越大,置信区间 包含 的真值的概率就越大,但区间 的长度就越大,对未知参数 的估计精度就越差.反之,对参数 的估计精度越高,置信区间 长度就越小, 包含 的真值的概率就越低,置信度 越小.一般准则是:在保证置信度的条件下尽可能提高估计精度.
为未知参数, .现得样本值为
168, 130, 169, 143, 174, 198, 108, 212, 252,
试估计未知参数 .
2、评价估计量的标准
估计量的评价一般有三条标准:
无偏性;有效性;相合性(一致性).
1.无偏性
定义1设 是未知参数 的估计量,若
则称 为 的无偏估计量.
注:无偏性是对估计量的一个常见而重要的要求,其实际意义是指估计量没有系统偏差,只有随机偏差.在科学技术中,称
设 是取自总体X的一个样本, 是未知参数 的一个估计量,若 满足:
来自百度文库(1) 即 为 的无偏估计;
(2) 是 的任一无偏估计.
则称 为 的最小方差无偏估计(也称最佳无偏估计).
3.相合性(一致性)
定义3设 为未知参数 的估计量,若 依概率收敛于 ,即对任意 ,有
或
则称 为 的(弱)相合估计量.
例2设总体 , 是来自这一总体的样本.
2.设总体X服从均匀分布U ,它的密度函数为
求未知参数 的矩估计量
3.设总体X的概率分布为
其中 为未知参数.现抽得一个样本 求 的最大似然估计值.
4.设总体的期望 和方差 均存在,如何求 的置信区间为 的置信区间.
5.设总体 其中 未知, 为其样本.
(1)当 时,试求置信度分别为0.9及0.95的 的置信区间的长度.
(1)试证
(2)试求 的 置信区间.
第4节正态总体的置信区间(1)
1、单正态总体均值的置信区间(1)
设总体 其中 已知,而 为未知参数, 是取自总体X的一个样本.对给定的置信水平 ,由上节例1已经得到 的置信区间
例1某旅行社为调查当地一旅游者的平均消费额,随机访问了100名旅游者,得知平均消费额 元.根据经验,已知旅游者消费服从正态分布,且标准差 元,求该地旅游者平均消费额 的置信度为95%的置信区间.
第二节点估计的常用方法(1)
1、矩估计法
矩估计法的基本思想是用样本矩估计总体矩.因为由在大数定理知,当总体的k阶矩存在时,样本的k阶矩依概率收敛于总体的k阶矩.例如,可用样本均值 作为总体均值 的估计量,一般地,记
总体k阶矩
样本k阶矩 ;
总体k阶中心矩
样本k阶中心矩
用相应的样本矩去估计总体矩的方法就称为矩估计法.用矩估计法确定的估计量称为矩估计量.相应的估计值称为据估计值.矩估计量与矩估计值统称为矩估计.
2、点估计的常用方法
(1)矩估计
(2)最大似然估计
3、置信区间
(1)置信区间的概念
(2)寻求置信区间的方法
4、正态总体的置信区间
(1)单正态总体的置信区间
(2)双正态总体的置信区间
2、典型例题讲解
1.设总体X在区间 上服从均匀分布, 是取自总体X的简单随机样本, 求常数 使 均为 的无偏估计,并比较其有效性.
定理1设 为取自总体X的样本,总体X的均值为 ,方差为 .则
(1)样本均值 是 的无偏估计量;
(2)样本方差 是 的无偏估计量;
(3)样本二阶中心矩 是 的有偏估计量.
2.有效性
定义2设 和 都是参数 的无偏估计量,若
,
则称 较 有效.
注:在数理统计中常用到最小方差无偏估计,其定义如下:
参数估计问题的一般提法:
设有一个统计总体,总体的分布函数为 ,其中 为未知参数( 可以是向量).现从该总体中随机地抽样,得一样本
,
再依据该样本对参数 作出估计,或估计参数 的某已知函数
第一节点估计问题概述
一、点估计的概念
设 是取自总体X的一个样本, 是相应的一个样本值. 是总体分布中的未知参数,为估计未知参数 ,需构造一个适当的统计量
课堂练习
已知某地区农户人均生产蔬菜量为X(单位:kg),且 现随机抽取9个农户,得人均生产蔬菜量为
75, 143, 156, 340, 400, 287, 256, 244, 249
问该地区农户人均生产蔬菜量最多为多少 ?
第六章习题课
1、知识总结:
1、点估计问题概述
(1)点估计概念
(2)评价估计量的标准:无偏性、有效性、相合性(一致性)
1、置信区间的概念
定义1设 为总体分布的未知参数, 是取自总体X的一个样本,对给定的数 ,若存在统计量
使得
则称随机区间 为 的 双侧置信区间,称 为置信度,又分别称 与 为 的双侧置信下限与双侧置信上限.
注:1.置信度 的含义:在随机抽样中,若重复抽样多次,得到样本 的多个样本值 ,对应每个样本值都确定了一个置信区间 ,每个这样的区间要么包含了 的真值,要么不包含 的真值.根据伯努利大数定理,当抽样次数充分大时,这些区间中包含 的真值的频率接近于置信度(即概率) ,即在这些区间中包含 的真值的区间大约有 个,不包含 的真值的区间大约有 个.例如,若令 ,重复抽样100次,则其中大约有95个区间包含 的真值,大约有5个区间不包含 的真值.
然后用其观察值
来估计 的值.
称 为 的估计量.称 为 的估计值.在不致混淆的情况下,估计量与估计值统称为点估计,简称为估计,并简记为 .
注:估计量 是一个随机变量,是样本的函数,即是一个统计量,对不同的样本值, 的估计值 一般是不同的.
例1
设X表示某种型号的电子元件的寿命(以小时计),它服从指数分布:
例2设总体 的均值 及方差 都存在,且有 ,但 均为未知,又设 是来自 的样本.试求 的矩估计量.
例3设总体X的概率分布为
其中 为未知参数.现抽得一个样本 求 的矩估计值.
课堂练习
设总体 在 上服从均匀分布, 未知. 是来自
的样本,试求 的矩估计量.
课后作业:P142 T 2
第三节置信区间
在区间估计理论中,被广泛接受的一种观点是置信区间,它由奈曼(Neymann)于1934年提出。
第六章参数估计
在实际问题中,当所研究的总体分布类型已知,但分布中含有一个或多个未知参数时,如何根据样本来估计未知参数,这就是参数估计问题.
参数估计问题分为点估计问题与区间估计问题两类.
点估计就是用某一个函数值作为总体未知参数的估计值;
区间估计就是对于未知参数给出一个范围,并且在一定的可靠度下使这个范围包含未知参数.
(2)n多大方能使 的90%置信区间的长度不超过1?
(3)n多大方能使 的95%置信区间的长度不超过1?
例3有一大批糖果.现从中随机地取16袋,称得重量(以克计)如下:
506 508 499 503 504 510 497 512
514 505 493 496 506 502 509 496
设袋装糖果的重量近似地服从正态分布,试求总体均值 的置信水平为0.95的置信区间.
3、单正态总体方差的置信区间
上面给出了总体 的区间估计,在实际问题中要考虑精度或稳定性时,需要对正态总体的方差 进行区间估计.
例1设总体 为已知, 为未知,设 是来自X的样本,求 的置信水平为 的置信区间.
例2设总体 为未知参数, 是取自总体X的简单随机样本,如果以区间 作为 的置信区间,那么置信度是多少?
2、寻求置信区间的方法
寻求置信区间的基本思想:在点估计的基础上,构造合适的函数,并针对给定的置信度导出置信区间.
一般步骤:
设总体 其中 , 未知, 是取自总体X的一个样本.求方差 的置信度为 的置信区间. 的无偏估计为 ,从第五章第三节的定理知,
,
对给定的置信水平 ,由
于是方差 的 置信区间为
而方差 的 置信区间
例4为考察某大学成年男性的胆固醇水平,现抽取了样本容量为25的一样本,并测得样本均值 样本标准差 .假定所论胆固醇水平 与 均未知.试分别求出 以及 的90%置信区间.
求矩估计的方法:
设总体 的分布函数 中含有k个未知参数 ,则
(1)求总体 的前k阶矩 ,一般都是这k个未知参数的函数,记为
(*)
(2)从(*)中解得
(3)再用 的估计量 分别代替上式中的 ,即可得 的矩估计量:
注:求 类似于上述步骤,最后用 代替 ,求出矩估计 。
例1设总体X的概率密度为
其中 是未知数, 是取自X的样本,求参数 的矩估计.
(1)选取未知参数 的某个较优估计量 ;
(2)围绕 构造一个依赖于样本与参数 的函数
(3)对给定的置信水平 ,确定 与 ,使
通常可选取满足 的 与 ,在常用分布情况下,这可由分位数表查得;
(4)对不等式作恒等变形化后为
,
则 就是 的置信度为 的双侧置信区间。
例3设总体X的密度为
未知参数 为取自X的样本.
2、单正态总体均值的置信区间(2)
设总体 其中 , 未知, 是取自总体X的一个样本.
此时可用 的无偏估计 代替 ,构造统计量
,
从第五章第三节的定理知
对给定的置信水平 ,由
,
即
因此,均值 的 置信区间为
例2某旅行社随机访问了25名旅游者,得知平均消费额 元,子样标准差 元,已知旅游者消费额服从正态分布,求旅游者平均消费额 的95%置信区间.
(1)证明 是 的无偏估计;
(2)求
例3设 为来自总体X的样本, , 均为总体均值 的无偏估计量,问哪一个估计量有效?
例4设总体 , 为其样本.试证样本方差 是 的相合估计量.
课堂练习
设总体X的k阶矩 存在,又设 是X的一个样本.试证明不论总体服从什么分布,k阶样本矩 是k阶总体矩 的无偏估计量.
课后作业:P137 T 3、4
2.置信区间 也是对未知参数 的一种估计,区间的长度意味着误差,故区间估计与点估计是互补的两种参数估计.
3.置信度与估计精度是一对矛盾.置信度 越大,置信区间 包含 的真值的概率就越大,但区间 的长度就越大,对未知参数 的估计精度就越差.反之,对参数 的估计精度越高,置信区间 长度就越小, 包含 的真值的概率就越低,置信度 越小.一般准则是:在保证置信度的条件下尽可能提高估计精度.
为未知参数, .现得样本值为
168, 130, 169, 143, 174, 198, 108, 212, 252,
试估计未知参数 .
2、评价估计量的标准
估计量的评价一般有三条标准:
无偏性;有效性;相合性(一致性).
1.无偏性
定义1设 是未知参数 的估计量,若
则称 为 的无偏估计量.
注:无偏性是对估计量的一个常见而重要的要求,其实际意义是指估计量没有系统偏差,只有随机偏差.在科学技术中,称
设 是取自总体X的一个样本, 是未知参数 的一个估计量,若 满足:
来自百度文库(1) 即 为 的无偏估计;
(2) 是 的任一无偏估计.
则称 为 的最小方差无偏估计(也称最佳无偏估计).
3.相合性(一致性)
定义3设 为未知参数 的估计量,若 依概率收敛于 ,即对任意 ,有
或
则称 为 的(弱)相合估计量.
例2设总体 , 是来自这一总体的样本.
2.设总体X服从均匀分布U ,它的密度函数为
求未知参数 的矩估计量
3.设总体X的概率分布为
其中 为未知参数.现抽得一个样本 求 的最大似然估计值.
4.设总体的期望 和方差 均存在,如何求 的置信区间为 的置信区间.
5.设总体 其中 未知, 为其样本.
(1)当 时,试求置信度分别为0.9及0.95的 的置信区间的长度.
(1)试证
(2)试求 的 置信区间.
第4节正态总体的置信区间(1)
1、单正态总体均值的置信区间(1)
设总体 其中 已知,而 为未知参数, 是取自总体X的一个样本.对给定的置信水平 ,由上节例1已经得到 的置信区间
例1某旅行社为调查当地一旅游者的平均消费额,随机访问了100名旅游者,得知平均消费额 元.根据经验,已知旅游者消费服从正态分布,且标准差 元,求该地旅游者平均消费额 的置信度为95%的置信区间.
第二节点估计的常用方法(1)
1、矩估计法
矩估计法的基本思想是用样本矩估计总体矩.因为由在大数定理知,当总体的k阶矩存在时,样本的k阶矩依概率收敛于总体的k阶矩.例如,可用样本均值 作为总体均值 的估计量,一般地,记
总体k阶矩
样本k阶矩 ;
总体k阶中心矩
样本k阶中心矩
用相应的样本矩去估计总体矩的方法就称为矩估计法.用矩估计法确定的估计量称为矩估计量.相应的估计值称为据估计值.矩估计量与矩估计值统称为矩估计.
2、点估计的常用方法
(1)矩估计
(2)最大似然估计
3、置信区间
(1)置信区间的概念
(2)寻求置信区间的方法
4、正态总体的置信区间
(1)单正态总体的置信区间
(2)双正态总体的置信区间
2、典型例题讲解
1.设总体X在区间 上服从均匀分布, 是取自总体X的简单随机样本, 求常数 使 均为 的无偏估计,并比较其有效性.