第九章 参数估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数理统计已经证明,样本均值和样本成 数分别是总体均值和总体成数的有效估 计量,但修正样本方差并不是总体方差 的有效估计量,只有在大样本条件下, 可以认为是渐近有效的。
总之,如果一个估计量 满足无偏性、一致性和 有效性这三个标准,就 可称其为最佳估计量。
例1,某县某年水稻播种面积为2.78万亩,从中 不重复抽样调查了100亩,实测后,样本平均 亩产量为600千克,样本标准差为15.2千克。要 求用点估计确定全县平均亩产量和总产量。
Z
那么 x Z x ; p Z p 则:x Z x x Z x p Z p P p Z p
x
x
或Z
p
p
表9-3
概率度与概率关系表 概率P(Z) 误差范围△
0.50σ 1.00 σ 1.50 σ 1.64 σ 1.96 σ 2.00 σ 3.00 σ 4.00 σ 5.00 σ
总体均值μ的置信区间为:
x Z x,x Z x
需要指出的是,参数估计时,总体方差往 往是未知的。在总体方差未知的情况下, 则可用以往的、类似的、估计的总体方 差代替,也可用样本方差代替, 只要样本容量足够大(大样本),就可 用Z分布来估计总体均值的置信区间。
②小样本(n<30),用t分布估计 若样本容量n<30,且总体方差未知, 需要用样本方差来代替总体方差,则不 能采用标准正态分布来估计总体均值的 置信区间,需用t分布来进行区间估计。 因此,给定概率1-α,抽样极限误差为: S x t / 2 (n 1) , n 1 由此可得总体均值的置信区间为:
1 1 1 1 ,( x1 x2 ) tS ( x1 x2 ) tS n1 n2 n1 n2
2、总体成数的区间估计 参数P的区间估计和参数μ的区间 估计方法和思路完全相同。
⑴单一总体成数的区间估计 若样本容量n≥30,而且np和n(1-p)均大于5 时,样本成数的抽样分布近似服从正态分布的。 因此,可用Z统计量来构造总体成数P的置信区间。 但是,在实际工作中总体成数往往是未知的,就 需要用样本成数p来代替P。这样,在1-α的置信 水平下,总体成数P的置信区间为:
第二节 常用参数的区间估计
常用参数主要有总体均值、 总体成数和总体方差。
1、总体均值的区间估计 ⑴单个总体均值的区间估计 ①大样本(n≥30),用Z分布估计 若总体方差已知,则可采用标准正 态分布(Z分布)进行区间估计。 根据区间估计的定义有:
P ( x Z x x Z x ) 1
置信度为1-α的置信区间。
ˆ ˆ 该区间的两个端点1和 2
分别称为置信下限和置信上限。 α为显著性水平,1-α称为置信度。
区间估计的具体做法是:从点估计值开始, 向两侧展开一定倍数的抽样平均误差,并估 计总体参数很可能就包含在这个区间之内。
置信区间的大小主要由Z 和(或 p) x 这两个量所决定,并为2 Z(或2 Z p)。 x
2 2 12 2 12 2 ,( x1 x2 ) Z / 2 ( x1 x2 ) Z / 2 n1 n2 n1 n2
②两个小样本总体均值之差,用t分布估计
对于两个服从正态分布的总体,若采 用小样本抽样(n<30)时,如果总 体方差未知但相等,则应采用t分布进 行两个总体均值之差的区间估计。 首先应根据两个样本方差用加权平均 法求出二者的共同方差作为总体方差 的无偏估计量。即:
S S ,x t / 2 (n 1) x t / 2 (n 1) n 1 n 1
⑵两个总体均值之差的区间估计 ①两个大样本总体均值之差,用Z分布估计 当两个总体方差已知时(对于大样本, 若两个总体方差未知,可用样本方差替 代),可采用标准正态分布进行区间估 计。对于给定的置信水平(1-α)有: P ( Z Z / 2 ) 1 从而可得到:
⑵抽样平均误差 ①抽样平均误差的概念 抽样平均误差是指所有可能组成样本的抽样指 标(包括抽样平均数和抽样成数)与总体指标 (包括总体平均数和总体成数)的平均离差, 也就是一系列抽样平均数(或抽样成数)与总 体平均数(或总体成数)的标准差。
抽样平均误差通常用希腊字母 σ来表示,为便于区别,通常
用 x 表示抽样平均数的抽样平均误差,
p (1 p ) n
对参数μ的区间估计的步骤: ⑴首先从总体抽取一个样本,根据 收集的样本资料求出它的均值。 ⑵根据合乎实际的置信水平查表求得概率度。 ⑶根据总体标准差和样本容量求出抽样平均误差。 ⑷以样本均值为基准,向两侧展 开Z倍的抽样平均误差的区间。 参数P和σ 的区间估计步骤和参数 μ的区间估计步骤相类似。
p 表示抽样成数的抽样平均误差。
它反映抽样平均数(或抽样成数)与 总体平均数(或总体成数)的平均误 差程度,因此也称为抽样标准差。
②抽样平均误差的计算方法 抽样调查可分为简单随机抽样、等距抽样、 分类抽样和整群抽样等几种组织形式。 不同的组织形式,计算抽样平均误差的方法 也是不同的。其中,简单随机抽样的抽样平 均误差的计算是最基本的。
(一)区间估计的相关知识
1、精确性和可靠性 (也即效度和信度)
效度和信度之间既有密切联系,又有
明显区别,是相互矛盾的两个方面。
效度和信度之间的关系有四种类型: ⑴信度高,效度未必高 ⑵信度低,效度必然低 ⑶效度高,信度必然高 ⑷效度低,信度未必低 总之,信度是效度的基础,是效度的必要条 件而非充分条件;效度是信度的目的和归宿, 没有效度的信度会失去其本来的意义。
(n1 1) S ( n2 1) S S n1 n2 2
2 2 1
2 2
然后根据给定的置信水平(1-α)
和自由度(n1 n2 2)查t分布表,
求满足P( t t / 2 (n1 n2 2)) 1 的t值,
从而得出( 1 2 )的估计区间为:
第九章 参数估计
本章重点: 1、评价估计量的标准 2、抽样误差 3、常用参数的区间估计 本章难点: 1、评价估计量的标准 2、抽样误差
第一节 参数估计的基本方法
参数估计也叫抽样估计,就是根 据样本统计量对总体参数进行估 计或推断的统计过程和统计方法。 参数估计的基本方法主要包括点 估计和区间估计两种。
x x
p p P
将上面等式经过变换,可以得到下列不等式:
x x x
P p p P p
实际推断公式:
x x x x
p p P p p
用抽样极限误差除以抽样平均误差, 表示抽样极限误差为抽样平均误差 的若干倍,这个倍数在数理统计中 称为概率度,用Z表示。即:
2、抽样误差 ⑴抽样误差的概念 在抽样调查中,误差的来源可分为 非抽样误差和抽样误差两大类。
①非抽样误差 非抽样误差是指在实际进行抽 样调查时,由随机因素以外的 其他因素所造成的误差。 ②抽样误差 抽样误差是指由于随机抽样的 偶然因素所产生的样本统计量 与总体参数之间的差别。
抽样误差越小,说明抽样指标代表 性越高,推断的精确度就越高; 反之,抽样误差越大,说明抽样指标 代表性越低,推断的精确度就越低。
p Z / 2
p Z / 2
p(1 p) P p Z / 2 n
p(1 p) n
p(1 p) n (1 ) n N
p(1 p) n (1 ) P p Z / 2 n N
⑵两个总体成数之差的区间估计 若n1 p1、n1 (1 p1 )、n2 p2、n2 (1 p2 ) 都大于或等于5时,就可以认为是大样本。 因而可用标准正态分布估计其置信区间。 当总体成数未知,样本容量很大时,可用 样本成数代替总体成数进行区间估计。置 信区间为: p1 (1 p1 ) p2 (1 p2 ) , ( p1 p2 ) Z / 2 n1 n2
差是P(1-P) 。 ⑵在其他条件相同时,不重复抽样的抽 样误差要小于重复抽样的抽样误差。 ⑶当N很大时,不论用重复抽样还是用 不重复抽样公式计算抽样平均误差,其 结果相差很小。 ⑷抽样调查的组织方式也会影响到抽样 平均误差的大小。 ⑸在统计实践中,经常采用以下几种方 法来代替总体标准差。
⑶抽样极限误差 抽样极限误差就是变动的抽样指标与确定的 总体指标之间抽样误差的可能范围,也称为 允许误差,一般用符号△表示。
解:由题意知,N 2.78万亩 则
n 100亩
x 600千克
600千克 总产量 ห้องสมุดไป่ตู้ N 2.78 600 1668 (万千克)
点估计的优点是: 简便易行,原理直观, 常为实际工作所采用。 其缺点是: 无法知道估计的准确程度有多大, 误差可能有多大。
二、区间估计
参数的区间估计就归结为分别不同的抽 样分布计算概率度和分别不同的抽样组 织方式计算抽样平均误差这两者 。
在实际进行区间估计时,如果总体标准差 未知,只要用样本标准差代替就可以了。
S S x Z / 2 n x Z / 2 n p (1 p ) 或:p Z P p Z / 2 /2 n
ˆ 则称 为的无偏估计量。
2、一致性 一致性是指当n→∞时,估计量依
概率收敛于总体参数的真实值。 即当样本容量n充分大时,估计量将在概率 意义下越来越接近于被估计的参数本身, 则该估计量是被估计参数的一致估计量。
ˆ 设 是未知参数的估计量, 对于任意小的正数,如果有 ˆ lim P( )=1
ˆ ( ˆ 若由样本统计量 x1, ,xn) 确定的两个估计值
设总体的某一未知参数为,
ˆ ˆ 1 x1, ,xn)及(x1, ,xn), ( 2
对于给定的α(0<α<1),满足:
ˆ ˆ P(1 2 ) 1 ˆ ˆ 则称随机区间(1, 2 )是的
一、点估计
点估计也叫点值估计或定值估计, 就是选择一个最适当的样本统计量 来直接代表总体的参数值。 点估计的评价标准有: 无偏性、一致性和有效性三个标准
1、无偏性 无偏性是指如果估计量的期望值等 于被估计的参数本身,则该估计量 就是被估计参数的无偏估计量。
ˆ 设 为未知参数的估计量,若
ˆ E ( )
n
ˆ 则称估计量 为参数的一致估计量。
例如,样本均值、成数、方差 分别是总体均值、成数以及方 差的一致估计量。
3、有效性 有效性是指估计量是无偏的而且 具有最小的方差。 即如果一个估计量除了满足无偏 性外,其方差比其他估计量的方 差小,则该估计量是被估计参数 的有效估计量。
ˆ 设 是总体的未知参数, 是的一个估计量。如果满足: ˆ ˆ (1)E ( ) ,即 是的无偏估计量; ˆ ˆ ˆ (2)V ( )V ( ),这里 是的任何一个其他的无偏估计量。 ˆ ˆ ˆ 则称 为的有效估计量,或者说估计量比 有效。
当总体为N,样本容量为n时,抽样 平均误差的计算公式如表9-1所示 表9-1 抽样平均误差的计算公式
抽样方法
重复抽样
不重复抽样
x
n
2
2
n (1 ) n N
P
P (1 P ) n
P (1 P ) n (1 ) n N
对于上述公式需要说明的几点是:
⑴成数的平均数是成数本身,成数的方
概率度Z
0.50 1.00 1.50 1.64 1.96 2.00 3.00 4.00 5.00
0.3829 0.6826 0.8864 0.9000 0.9500 0.9545 0.9973 0.9994 0.99999
(二)区间估计的方法
区间估计就是用一个取值区间及其 出现的概率来估计未知参数。 其概率称为置信概率,概率的大小(即 可靠程度)称为置信度,被估计参数可 能存在的区间范围称为置信区间。