(04)第4章 参数估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
B A
较小的样本容量
5 - 13
ˆ
统计学
STATISTICS
评价估计量的标准
样本平均数作为总体平均数的估计量、样 本比例作为总体比例的估计量,都具有上 述三个优良性质。
5 - 14
统计学
STATISTICS
考试题
、 、
1.评价估计量好坏的三个标准是 和 。
2.在参数估计中,要通过样本的估计量来估计总体 参数,评价估计量标准之一是使估计量的标准 差越小越好。这种评价标准称为( )。 A. 无偏性 C. 一致性 B. 有效性 D. 充分性
投保人平均年龄90%的置信区间为37.37岁~41.63岁
5 - 23
统计学
STATISTICS
68.27% 95.45% 99.73%
-3σ -2σ -σ
+σ
+2σ +3σ
x
图3-12 常用的正态概率值
90% 95% 99%
2.58 x 1.65 x
没有给出估计值接近总体参数程度的信息
5-6
统计学
STATISTICS
评价估计量的标准
统计学
STATISTICS
评价估计量的标准
假设我们想估计一个总体参数,如总体均值µ,可 以用一个样本统计量进行估计,如,用样本均值 或是样本中位数m。哪一个较好? 什么样的估计量才算是一个好的估计量呢?需要有 一定的评价标准。
n n 是估计总体均值时的允许误差,或称估计误差 n
x z /2
x z 2
若 5 - 20 未知,可以用样本标准差s代替。
统计学
STATISTICS
总体均值的区间估计
【例】保险公司从投保人中随机抽取36人,计算得36人的平 均年龄 x 39.5 岁,已知投保人年龄近似服从正态分布,标 准差为7.2岁,试求全体投保人平均年龄的置信水平为99%的 置信区间
统计学
STATISTICS
总体均值的区间估计
统计学
STATISTICS
大样本的估计方法
不论总体是不是服从正态分布,在大样本 (n 30)时,样本均值均服从正态分布。 若已知 2 x
x ~ N ( ,
总体均值 在1- 置信水平下的置信区间为
n
)
z
n
~ N (0,1)
z 2
x z /2
n
x z 2
n
与大样本时相同。
5 - 26
统计学
STATISTICS
小样本的估计方法
若总体方差2未知时,使用 t 分布统计量
x t ~ t (n 1) S n
总体均值 在1- 置信水平下的置信区间为
S S x t 2 (n 1) x t 2 (n 1) n n
置信度为 1- 的置信区间也就是以1- 的可能性包含了 未知总体参数的区间
常用的有0.01,0.05,0.10
相应的置信水平值为 99%, 95%, 90%
5 - 17
统计学
STATISTICS
4.2 一个总体参数的区间估计
4.2.1 总体均值的区间估计 4.2.2 总体比率的区间估计 4.2.3 总体方差的区间估计
5 - 15
统计学
STATISTICS
区间估计
(interval estimate)
区间估计就是根据样本估计量以一定可靠程度推断 总体参数所在的区间范围,该区间由样本统计 量加减抽样误差而得到。 比如,某汽车电池的平均寿命在50.5~53.5 之间,置信水平是95%
置信区间
样本统计量 (点估计)
5 - 16
置信下限
置信上限
统计学
STATISTICS
区间估计
设是未知参数, L、U为由样本确定的两个统计量,对 于给定的(01),若满足: P( L< <U) 1 则称( L,U) 为参数的置信度为 1- 的置信区间。 L、 U分别称为置信下限和置信上限,通称为置信限。 称为 显著性水平,1称为置信度(或置信水平)。
5-8
统计学
STATISTICS
无偏性
(unbiasedness)
无偏性:是指估计量抽样分布的数学期望等于被 估计的总体参数。 ˆ 如果 E ( ) ,称 为θ 的无偏估计量。 ˆ ˆ P( )
无偏 有偏
A
B
5-9
ˆ
统计学
STATISTICS
无偏性 (unbiasedness)
5 - 27
统计学
STATISTICS
t 分布
t 分布是类似标准正态分布的一种对称分布,它通常 要比标准正态分布平坦和分散。一个特定的分布依 赖于称之为自由度的参数。随着自由度的增大,分 布也逐渐趋于标准正态分布
标准正态分布 标准正态分布
t (df = 13)
t 分布
t (df = 5)
z
x t - 28 5 分布与标准正态分布的比较
不同自由度的t分布
t
统计学
STATISTICS
小样本的估计方法
【例】已知某种灯泡的寿命服从正态分布,现从一 批灯泡中随机抽取16只,测得其寿命的均值为 1490小时,标准差为24.77小时。试求该批灯泡平 均使用寿命95%的置信区间。 解:已知n=16, 1- = 95%, =0.05 , 1490, s 24.77 x
统计学
STATISTICS
第 4 章 参数估计
4.1 参数估计的基本原理 4.2 一个总体参数的区间估计 4.4 样本容量的确定
5-1
统计学
STATISTICS
4.1 参数估计的一般问题
4.1.1 估计量与估计值 4.1.2 点估计与区间估计 4.1.3 评价估计量的标准
统计学
STATISTICS
统计学
STATISTICS
4.2.2 总体比率的区间估计
样本容量足够大时,样本比率p的抽样分布可以由 正态分布来近似 (1 ) p ~ N ( , ) n p z ~ N (0,1) 使用正态分布统计量 (1 ) n
总体比率π 在1-置信水平下的置信区间为
p z 2
大样本 小样本
σ 未知
σ 已知
x z /2
n
x z /2
σ 已知
s s x z / 2 x t / 2 n n n
σ 未知
σ 已知
σ 未知
x z /2
5 - 30
n
x t / 2
s n
统计学
STATISTICS
总体均值的区间估计 (练习)
为了解某银行营业厅办理某项业务的办事效率,调 查人员观察了该银行营业厅办理该业务的柜台办 理每笔业务的时间,随机记录了15名客户办理业 务的时间,测得平均办理时间为12分钟,样本标 准差为4.1分钟,则:
t0.025(14)=2.1448。
x t
2
s 4.1 12 2.1448 n 15 12 2.27 ( 9.73,14.27 )
平均办理时间的95%的置信区间是(9.73,14.27)分 (2)1- = 99%, =0.01 , t0.005(14)=2.9768。 s 4.1 x t 2 12 2.9768 n 15 5 - 32 12 3.15 ( 8.85,15.15)
估计量与估计值
(estimator & estimated value)
参数估计:用样本统计量去估计总体的参数
估计量:用于估计总体参数的随机变量 如样本均值,样本比率、样本方差等 例如: 样本均值x就是总体均值 的一个估计量
ˆ 总体参数笼统地用 表示,估计量用 表示
估计值:估计参数时计算出来的估计量的具体值
统计学
STATISTICS
大样本的估计方法
【例】一家保险公司收集到由36个投保人组成的随 机样本,得到每个投保人的年龄(周岁)数据如下表。 试建立投保人年龄均值的90%的置信区间
36个投保人年龄的数据
23 36
35 42
39 46
27 43
36 31
44 33
42
34 39 34
5 - 22
53
28 49 39
5-3
统计学
STATISTICS
点估计与区间估计
统计学
STATISTICS
参数估计的方法
估 计 方 法
点
估
计
区间估计
5-5
统计学
STATISTICS
点估计
(point estimate)
ˆ 用样本估计量 的值直接作为总体参数 的估 计值
例如:为了考察下岗职工再就业的比例,随 机抽取200名下岗职工进行跟踪调查,得到 再就业率为68%,以此作为全国下岗职工再 就业率的估计。
样本均值是总体均值的无偏估计量,样本 比率是总体比率的无偏估计量。 总体方差的无偏估计量为
1 2 ˆ ( xi x ) n 1 i 1
2
n
而样本二阶中心矩不具备无偏性,所以通 常把上式右端定义为样本方差 S2
5 - 10
统计学
STATISTICS
有效性
(efficiency)
5 - 24
1.96 x
图4.1 区间估计示意图
1.65 x 2.58 x 1.96 x
x
统计学
STATISTICS
作业
P144——1、2、3 样本均值的抽样标准误差即样本均值的标准 差.
5 - 25
统计学
STATISTICS
小样本的估计方法
总体必须服从正态分布,此时,样本均值 x 也服从 正态分布。 若总体方差2已知,则总体均值的置信区间为
有效性:对同一总体参数的两个无偏点估计量, 有更小标准差的估计量更有效
ˆ P( )
ˆ1 的抽样分布
B A
ˆ2 的抽样分布
ˆ
5 - 11
ˆ ˆ1 是比 2 更有效,是一个更好的估计量
统计学
STATISTICS
有效性
(efficiency)
x1 x2 x3 样本均值 x 3 x1 2 x2 3x3 和 x1 6
查表得 t0.025(15)=2.1315。
x t
2
s 24.77 1490 2.1315 1490 13.2 n 16
5 - 29
即(1476.8,1503.2),该种灯泡平均使用寿命 95%的置信区间为(1476.8,1503.2)小时。
统计学
STATISTICS
样本均值的置信区间
都是总体均值的无偏估计量。但
D( x ) D( x1 )
所以 x 是比 x1 更有效的估计量
5 - 12
统计学
STATISTICS
一致性
(consistency)
一致性:随着样本容量的增大,估计量的值越来 越接近被估计的总体参数。即一个大样本给出 的估计量更接近总体的参数。
ˆ P( )
较大的样本容量
45
39 38 45
54
36 34 48
47
44 48 45
24
40 50 32
统计学
STATISTICS
总体均值的区间估计
(例题分析)
解:已知n=36, 1- = 90%, 查表得z/2=1.645。 根据样本数据计算得: x
39.5 s 7.77
x z
2
s 7.77 39.5 1.645 n 36 39.5 2.13 ( 37.37, 41.63)
解:已知n=36, 1- = 99%,z/2=2.576,
x 39.5
7.2 x z 2 39.5 2.576 39.5 3.08 n 36 故全体投保人平均年龄的置信水平为99%的置 信区间为(36.42,42.58)
5 - 21
x z 2
x z 2 n n
统计学
STATISTICS
总体均值的区间估计
(例题分析)
s 4.1 12 2.0227 n 40 12 1.31 (10.7,13.3)
(3) n=40, t0.025(39)=2.0227
x t 2
5 - 33
统计学
STATISTICS
作业
P145——5
5 - 34
5 - 35
p(1 p) p(1 p) p z 2 n n
统计学
STATISTICS
总体比率的区间估计
(例题分析)
解:已知 n=100,p=65% , 1- = 95%, z/2=1.96 p (1 p ) p z 2 n
【 例 4.4】 某 城 市想要估计下岗 职工中女性所占 的比率,随机地 抽 取 了 100 名 下 岗职工,其中65 人为女性职工。 试以95%的置信 水平估计该城市 下岗职工中女性 比率的置信区间
(1)平均办理时间的95%的置信区间是多少?
(2)99%的置信区间是多少?
(3)若样本容量为40,而观测的数据不变,则 95%的置信区间又是多少?
5 - 31
统计学
STATISTICS
总体均值的区间估计
(例题分析)
12, s 4.1
解:(பைடு நூலகம்)已知n=15, 1- = 95%, =0.05 ,x