第7章_参数估计

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.区间估计
在点估计的基础上,给出总体参数估计 的一个区间范围,该区间通常由样本统计量 加减估计误差得到。对样本统计量与总体参 数的接近程度给出一个概率度量。
例如: 总体均值落在50~70之间,置信度为95%
置信区间
样本统计量 (点估计)
置信下限
置信上限
X = Zx
x_
- 2.58x
-1.65 x
X
2.有效性
对同一总体参数的两个无偏估计量,有 更小标准差的估计量更有效。
与其他估计量相比 ,样本均值是一个更 有效的估计量
均值的抽样分布
P(X )
B
中位数的抽样分布
A
X
3.一致性
随着样本量的增大,点估计量的值越来 越接近被估总体参数。
较大的样本容量
P(X )
A
B
较小的样本容量
X
7.2 一个总体参数的区间估计
s12=16.63 s22=18.92 n1= n2=10 1212
自由度 f 为
2
16.36 18.92
f 10
10
17.9 18
16.36
10
2
1 9
18.92
10
2
1 9
1- 2置信度为95%的置信区间为
22.2 28.5 2.1009 16.36 18.92
解:已知 x=26, =6,n=100,1- = 0.95,Zα/2=1.96
x Z 2
n , x Z 2
n
26 1.96
6 ,26 1.96 100
6 100
源自文库
24.824,27.176
2.正态总体、方差未知、小样本 用样本方差代替总体方差,这时用 t 统
计量进行估计。
t
x s
n
第7章 参数估计
7.1 参数估计的基本原理
7.1.1 估计量与估计值 参数估计就是用样本统计量去估计总体参 数。 用于估计总体参数的统计量称为估计量, 根据样本计算出来的估计量的数值称为估 计值。
被估计的总体参数
一个总体 两个总体
总体参数
均值 比例 方差 均值之差 比例之差 方差比
符号表示
P
2
1 2
间为
2 2
,
2 1 2
【例】对某种金属的10个样品组成的一个随 机样本作抗拉强度试验。从实验数据算出 的方差为4。试求2的95%的置信区间。
解:已知n=10,s2 =4,1-=95%
2置信度为95%的置信区间为
10 14
19.0228
,
10 14
2.7004
1.8925, 13.3314
x1 x2 sp
1 2
11 n1 n2
: t n1 n2 2
s
2 p
n1 1 s12 n1 n2
n2 1 2
s22
两个总体均值之差1-2在1- 置信水平 下的置信区间为
x1 x2 t 2 n1 n2 2sp
11 n1 n2
【例】为比较两位银行职员为新顾客办理个
人结算账目的平均时间长度,分别给两位职 员随机安排了10位顾客,并记录下为每位顾 客办理账单所需的时间(单位:分钟),相 应的样本均值和方差分别为:x1=22.2, s12=16.63,x2=28.5,s22=18.92。假定每位职 员办理账单所需时间均服从正态分布,且方
0.95,Z/2=1.96
pˆ Z 2
pˆ (1 pˆ ) n
0.7 1.96 0.7(1 0.7) 200
0.636, 0.764
7.2.3 总体方差的区间估计
对于正态总体方差的估计,可以用
2
=
n
1
2
s
2
~
2
n 1 统计量进行估计
总体方差在 1-α置信水平下的置信区
n 1 s2 n 1 s2
x1 x2 z 2
s12 s22 n1 n2
86 78 z0.025
5.82 7.22
46 33
8 1.961.52
(2)小样本的估计 在两个样本都是小样本的情况下,为估
计两个总体的均值之差,需要做出以下假定
➢ 两个总体都服从正态分布 ➢ 两个随机样本独立的分别抽自两个总体
则两个样本均值之差必定服从正态分布
s22 n2
2
2
n1
s22
2 n2
n1 1
n2 1
两个总体均值之差1-2在1- 置信水平
下的置信区间为
x1 x2
t 2 (v)
s12 s22 n1 n2
【例】为比较两位银行职员为新顾客办理个
人结算账目的平均时间长度,分别给两位 职员随机安排了10位顾客,并记录下了为 每位顾客办理账单所需的时间(单位:分
7.3 两个总体参数的区间估计
7.3.1 两个总体均值之差的区间估计
总体1
1 1
2 2
总体2
抽取简单随机样 样本容量 n1 计算 X1
计算每一对样本 的X1-X2
抽取简单随机样 样本容量 n2 计算X2
所有可能样本 的X1-X2
1 2
抽样分布
1.两个总体均值之差的估计:独立样本
如果两个样本是从两个总体中独立抽取 的,即一个样本中的元素与另一个样本中的 元素相互独立,则称为独立样本
水平下的置信区间为: x1 x2 z 2
s12 s22 n1 n2
某地区教育管理部门想估计两所中学的学生 高考时的英语平均分数之差,为此在两所学 校独立抽取两个随机样本,有关数据如下:
n1 46n2 33 x1 86x2 78 s1 5.8s2 7.2
建立两所学校高考英语平均分之 差95%的置信区间
总 态分体布服。从试方求差分A-别为B的区A2=间25估00计和B2=3600的正
(1)置信度为95%
(2)置信度为99%
解:已知
XA~N(A,2500) XB ~N(B,3600)
xA=4500, xB=3250,
A2 =2500 B2 =3600
nA= nB =25
(1) A- B置信度为95%的置信区间为
~
t
n
1
总体均值 在 1- 置信水平下的置信
区间
x
t
2
sn1 n
,
x
t
2
sn1 n
【例】从一个正态总体中抽取一个随机样本,n =
25 ,其均值x = 50 ,标准差 s = 8。 建立总体均值
的95%的置信区间。
解:已知X~N(,2),x=50, s=8, n=25, 1- =
0.95,t/2=2.0639。
(4500 3250) 1.96 2500 3600 25 25
= 1219.78 , 1280.62
(2) A- B置信度为99%的置信区间为
(4500 3250) 2.58 2500 3600 25 25
= 1209.7 ,1290.3
2)总体方差未知但相等 使用 t 分布统计量
t
本条件,可以用样本方差代替总体方差,即
x
Z
2
s n
【例】某种零件长度服从正态分布,从该批产品中 随机抽取9件,测得其平均长度为21.4 mm。已知总 体标准差0.15mm,试建立该种零件平均长度的置信 区间,给定置信水平为0.95。
解:已知X~N(,0.152),x=2.14, n=9, 1- = 0.95, Z/2=1.96
P1 P2
12
2 2
用于估计的 样本统计量
x pˆ
s2 x1 x2 pˆ1 pˆ2 s12 s22
7.1.2 点估计与区间估计
1.点估计 用样本统计量 $的某个取值直接作为总
体参数 的估计值。
例如: 用样本均值 x 作为总体未知均值 的估
计值就是一个点估计
点估计没有给出估计值接近总体未知参 数程度的信息
x
t
2
sn1 n
,x
t
2
sn1 n
50 2.0639
8 ,50 2.0639 25
8 25
46.69,53.3
7.2.2 总体比例的区间估计
总体服从二项分布,样本量足够大,样
本比例的抽样分布可用正态分布近似时,对
总体比例的区间估计,使用统计量
z
p
1
n
~
N 0,1 ,
总体比例 p 的置信区间为 p Z 2
(1)大样本的估计
如果两个都是正态分布,或两个都是大样本(n≥30),则 有
z x1 x2 1 2 ~ N 0,1
2 1
2 2
n1 n2
当两个总体的方差已知时,两个总体均值之差在 1-α置信
水平下的置信区间为: x1 x2
z 2
2 1
2 2
n1 n2
当两个总体的方差未知时,两个总体均值之差在 1-α置信
差相等。试求两位职员办理账单的服务时间 之差的95%的区间估计。
解:已知
X1~N(1,2) X2 ~N(2,2)
x1=22.2, x2=28.5,
s12=16.63 s22=18.92 n1= n2=10 12= 12
sp
n1 1s12 n2 1s22
n1 n2 2
10 116.36 10 118.92 4.2
+1.65x
+ 2.58x
X
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
置信水平:
1. 置信区间中包含总体参数真值的次数所占 比例
2. 表示为 (1 -
– 为显著性水平,是总体参数未在区间内的 概率
3. 常用的显著性水平值有 99%, 95%, 90%
– 相应的 为0.01,0.05,0.10
7.2.1 总体均值的区间估计
1.正态总体、方差已知,或非正态总体、大样本
总体服从正态分布,且总体方差(2)已知 如果不是正态分布,可以由正态分布来近似 (n≥30)
使用正态分布统计量
z
x n
~
N
0,1
进行估计
总体均值

1-
置信水平下的置信区间为
x
Z
2
n

如果方差未知,或总体不服从正态分布的情况下,只要满足大样
10 10 2
1- 2置信度为95%的置信区间为
22.2 28.5 (2.1)(4.2) 1 1
10 10 (10.2,2.4)
3)当两个总体方差未知且不相等 使用的统计量为
t ( X1 X 2 ) (1 2 ) ~ t(v)
s12 s22 n1 n2
v
s12
s12 n1
总体均值的置信区间为
x
Z
2
n
,
x
Z
2
n
21.4
1.96
0.15 9
,
21.4
1.96
0.15 9
21.302, 21.498
【例】某大学从该校学生中随机抽取100人,调查到 他们平均每天参加体育锻炼的时间为26分钟。试以 95%的置信水平估计该大学全体学生平均每天参加 体育锻炼的时间(已知总体方差为36小时)
1)总体方差已知 使用正态分布统计量Z
Z ( X1 X 2 ) (1 2 ) ~ N (0,1)
2 1
2 2
n1 n2
两个总体均值之差1-2在1- 置信水平 下的置信区间为
(x1 x2 ) Z 2
2 1
2 2
n1 n2
【例】一个银行负责人想知道储户存入两家 银行的钱数。他从两家银行各抽取了一个由 25个储户组成的随机样本,样本均值如下: 银行A:4500元;银行B:3250元。设已知两个
10
10
(10.25,2.35)
2.两个总体均值之差的估计:匹配样本
匹配样本:一个样本中的数据与另一个样本中 的数据相对应,可以消除样本指定的不公平
(1)大样本
两个总体均值之差 1-2 在 1- 置信水平下的置信区间为
d
z
2
d
n
其中:d 表示两个匹配样本对应数据的差值
d 表示各差值的均值
d 表示各差值的标准差,当总体 d 未知时,可以用样
p 1 p
n
【例】某企业在一项关于职工流动原因的研究中,从该企业 前职工的总体中随机选取了200人组成一个样本。在对其进 行访问时,有140人说他们离开该企业是由于同管理人员不
能融洽相处。试对由于这种原因而离开该企业的人员的真正 比例构造95%的置信区间。 解:已知 n=200 ,µp=0.7 , n =140>5, n(1- µp )=60>5,=
本差值的标准差 sd 代替
(2)小样本 假定两个总体个观察之的配对差服从正态分布,
两个总体均值之差 1-2 在 1- 置信水平下的置信 区间为
d
t
2 n 1
sd n
7.3.2 两个总体比例之差的区间估计
1. 假定条件
▪ 两个总体是独立的 ▪ 两个总体服从二项分布 ▪ 可以用正态分布来近似
2. 两个总体比例之差P1-P2在1-置信水平下 的置信区间为
区间与置信水平
均值的抽样分布
x
/2
1 -
/2
X
x
(1 - ) % 区间包含了 % 的区间未包含
7.1.3 评价估计量的标准
1.无偏性 估计量抽样分布的数学期望等于被估计
的总体参数,E $ 。则称$为 的无偏估计量。
x, p, s2 分别是 , , 2 的无偏估计量
P( X )
无偏 有偏
A
C
钟),相应的样本均值和方差分别为: x1=22.2,s12=16.63,x2=28.5,s22=18.92 。假定每位职员办理账单所需时间均服从
正态分布,但方差不相等。试求两位职员 办理账单的服务时间之差的95%的区间估计 。
解:已知
X1~N(1,2) X2 ~N(2, 2)
x1=22.2, x2=28.5,
相关文档
最新文档