概率论第18讲

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

§7.4 正态总体的区间估计(一)
前面讨论了参数的点估计。点估计就是 利用样本计算出的值(即实轴上点) 来估计未 知参数。其优点是:可直地告诉人们 “未知 参数大致是多少”;缺点是:并未反映出估 计的误差范围 (精度)。故,在使用上还有不 尽如人意之处。而区间估计正好弥补了点估 计的这一不足之处 。
,
9 0.0583 2.7
[ 0.028,0.194 ]
为 2的置信水平为1 的区间估计。
小结
本讲首先介绍了估计量的评优准则,包 括:无偏性和均方误差准则;然后介绍了区 间估计的基本概念,详细讨论了正态总体均 值和方差的区间估计。
作业:p150,7.6至7.9。
取值范围内都成立 E[ˆ(X1, X 2 , , X n )] .
例如:若 指的是正态总体N(, 2)的均值 ,则其一切可能取值范围是(-∞, ∞)。若 指的 是方差2,则其一切可能取值范围是(0, ∞)。
例7.3.1 设 X1, X2, …, Xn 为抽自均值为 的 总体X的随机样本,考虑 的估计量:
解 n = 6, = 0.05,z/2 = z0.025 = 1.96, 2=0.22 . 通过计算,得 X 14.95,
所求置信区间为
X
n z 2,
X
n
z
2
14 .79,
15.11 .
II. 和 2均未知时
● µ的区间估计
当方差未知时,取
t
X S/
,则 t
n
~
tn1.
对给定的置信系数1,取分位点tn1( / 2),
例如:在估计正态总体均值µ的问题中, 若根据一组实际样本,得到µ的极大似然估 计为 10.12。
实际上,µ的真值可能大于10.12,也可 能小于10.12。
一个可以想到的估计办法是:给出一个 区间,并告诉人们该区间包含未知参数 µ的 可靠度 (也称置信系数)。
也就是说,给出一个区间,使我们能以 一定的可靠度相信区间包含参数 µ。
,
X

n
这个区间可能包含,也可能不包含。
但(7.4.1)式表明:对置信系数为1 的置信 区间[ˆ1,ˆ2 ],它包含 的概率是1 。
7.4.2 正态总体参数的区间估计
I. 2 已知时 的区间估计
设 X1, X 2, , X n 是正态总体N (, 2 ) 的一个简单样本, 2已知。
根据基本定理 (见定理6.3.1) ,知
估计量的优良性准则就是:评价或衡量一个 估计 “好”与“坏”的标准。
7.3.1 无偏性
设总体的分布参数为,ˆ( X1, X 2, , X n ) 简记为ˆ 是 的一个估计(注意! 它是一个统计
量,是随机变量)。对样本 X1,X2,…,Xn的不同 取值, ˆ取不同的值)。
如果 ˆ 的均值等于,即
E[ˆ( X1, X 2, , X n )]
X
n
z
2,X
n
z
2 .
也可简记为
X
n z 2 .
( 7.4.4)
例7.4.1 某厂生产的零件长度X~N(, 0.04),
现从该厂生产的零件中随机抽取6个,其长度的 测量值如下(单位: 毫米)
14.6, 15.l, 14.9, 14.8, 15.2, 15.1.
求µ 的置信系数为0.95的置信区间。
E(
X
)
E
1 n
n
i1
Xi
1 n
n
i1
E(Xi
)
1 n
n

另一方面,因
n
(Xi
X )2
n
X
2 i
n
2(
Xi)X
nX
2
i1
i1
i1
n
X
2 i
nX
2,
i1
注意到
E(X
2
)
Var( X
)
[E( X )]2
2
2,
n
E(
X
2 i
)
Var( Xi
)
ห้องสมุดไป่ตู้
[E(Xi
)]2
2
2,
于是,有
E(S
2)
n
1
1
in1
经计算,得X 10.05, S2 0.0583, S 0.2415,
X
S n
t n1 (
/
2),
X
S n
tn1
(
/
2)
10.05
0.2415 10
2.2622,10.05
0.2415 10
2.2622
9.87,10.22
为 的置信系数为 0.95 的置信区间。
例7.4.3(续例7.4.2) 求2的置信系数为0.95 的置信区间。

1 P| t | tn1( / 2)
PX
S n
t n1 (
/
2)
X
S n
tn1
(
/
2)
.
于是,µ 的置信系数为1-α 的区间估计为
X
S n
tn1
(
/
2),
X
S n
tn1 (
/
2)
.
也可简记为
X
S n
tn1 (
/
2)
.
(7.4.6)
● σ 2 的区间估计

(n 1)S 2
2
~
n21,对给定的置信系数 1 ,
概率论与数理统计 第十八讲
主讲教师:程维虎教授 北京工业大学应用数理学院
§7.3 估计量的优良性准则
从前面两节的讨论中可以看到:
● 同一参数可有多种不同的估计,这时就需要 判断采用哪一种估计为好的问题。
● 另一方面,对于一个参数,用矩法和极大似 然法即使得到的是同一个估计, 也存在衡量 这个估计优劣的问题。
1 n 1
n j 1
X
j.
ji
我们看到:显然两个估计都是 的无偏估
计,下面计算二者的方差。
Var(ˆ ) Var(X ) 2 ,
n
Var(ˆ i
)
n
1
2
1
n
Var( X
j 1
j
)
2
. n 1
ji
于是,X 比 ˆi 方差小,X 优于ˆi 。
这表明:当用样本均值去估计总体均值 时,使用全样本总比不使用全样本要好。
ˆ1 X1, 因 E(ˆ1) E( X1) , 故ˆ1是的无偏估计;
ˆ 2
X1
X2 2
,
因 E(ˆ2 ) ,故ˆ2是 的无偏估计;
ˆ 3
X1
X2
X n1 4
Xn
是 的无偏估计;
(n 4)
ˆ4 2X1 是有偏估计;
ˆ5
X1
3
X2
是有偏估计。
定理7.3.1 设总体X的均值为,方差为2,
书末附有χ2分布、t 分布、F分布的上侧 分位数表可供使用。需要注意的地方在教材 上均有说明。
现在我们回到寻找置信区间问题上来。
7.4.1 置信区间的定义
定义7.4.1 设 是未知常数,给定0 1,
若由样本 X1,X 2, ,X n确定的两个统计量ˆ1, ˆ2
满足
P{ˆ1 ˆ2} 1 .
如果ˆ 是参数 的一个估计,我们通常用 g(ˆ)
作为g( )的估计。但必须注意的是:即使ˆ 是 的
无偏估计,g(ˆ)也未必是g( )的无偏估计。
例7.3.2 样本标准差 S 不是总体标准差
的无偏估计。
证明 因 E(S2) = 2, 所以,Var(S) +[E(S)]2 = 2,
由 Var(S)>0,知
X ~ N(, 2 / n) 或 X ~ N(0,1). / n
令 U X ,则 n
令 U X ,则 n
P{z / 2 U z / 2}
1.

z / 2
U
z / 2
就是
z / 2
X
/
n
z / 2 ,
等价于
X
n
z / 2
X
n z / 2 .
Pˆ1 ˆ2 1 .
于是,µ 的置信区间为
这里的“可靠度”是用概率来度量的,
称为置信系数,常用1 表示 (0 1)。
置信系数的大小常根据实际需要来确定,
通常取0.95或0.99,即 0.05 或 0.01。
根据实际样本,由给定的置信系数,可
求出一个尽可能短的区间 [ˆ1,ˆ2 ],使
P{ˆ1 ˆ2} 1 .
称区间[ˆ1, ˆ2 ] 为 的置信系数为1 的 置信区间。其中ˆ1与ˆ2为两个统计量(由样本 完全确定的已知函数,ˆ1 ˆ2。
互抵消,我们先将误差平方后再求均值,并称
其为均方误差,记成 MSE (ˆ) ,即
MSE(ˆ) E(ˆ )2.
对 的两个估计ˆ1 和ˆ2 , 哪个估计的均方
误差小,就称哪个估计比较优,这种判定估计 优劣的准则为“均方误差准则”。
注意:均方误差可分解成两部分:
MSE(ˆ) Var(ˆ) [E(ˆ) ]2.
解 n=10, = 0.05, S2=0.0583, 查附表得,
2 (1 / 2) 2 (0.975) 2.70,
n 1
9
2 ( / 2) 2 (0.025) 19.023.
n 1
9
于是,
(n 1)S 2
2 n1
(
/
2)
,
(n 1)S
2 n1
(1
2
/
2)
9
0.0583 19.023
注意:如果一个估计量是无偏的,则第二
部分是零,则有:MSE(ˆ) Var(ˆ)。
如果两个估计都是无偏估计,这时哪个估 计的方差小,哪个估计就较优。这种判定估计 量优劣的准则称为方差准则。
例7.3.3 设 X1, X2, …, Xn为抽自均值为 的总体,考虑 的如下两个估计的优劣:
ˆ X ,
ˆ i
确定
分位数n21
(1
/
2)

2 n1
(
/
2),使

1
P
2 n1
(1
/ 2)
(n
1)S 2
2
2 n1
(
/ 2)
P
(n 1)S 2
2 n1
(
/
2)
2
(n 1)S 2
n21(1 /
2)
所以, 2的置信系数为1 的区间估计为
(n 1)S 2
2 n1
(
/
2)

(n 1)S
2 n1
(1
2
/
[E(S)]2 = 2 - Var(S)< 2. 所以,E(S)< . 故,S 不是 的无偏估计。
II. 均方误差准则
用估计量 ˆ(X1, X 2, , X n )估计,估计误差 ˆ(X1, X2, , Xn ) 是随机变量,通常用其均值
衡量估计误差的大小。 要注意: 为了防止求均值时正、负误差相
2)
.
(7.4.7)
例7.4.2 为估计一物体的重量 μ,将其称 量10次,得重量的测量值 (单位: 千克) 如下
10.l, 10.0, 9.8, 10.5, 9.7, l0.l, 9.9, 10.2, 10.3, 9.9.
设它们服从正态分布N( , 2)。求 的置信系
数为0.95的置信区间。
解 n=10, =0.05, t9 (0.025) = 2.2622,
(7.4.1)
则称区间[ˆ1,ˆ2 ] 为 的置信系数为1 的置 信区间,其中ˆ1与ˆ2为两个统计量,ˆ1 ˆ2。 ˆ1与ˆ2分别称为置信下限和置信上限。
P{ˆ1 ˆ2} 1 .
(7.4.1)
需要特别强调的是:区间 [ˆ1, ˆ2 ] 是一个
随机区间,对于一个给定的样本X1,
X 2 ,
证 MSE(ˆ) E(ˆ )2 E{[ˆ E(ˆ)] [E(ˆ) ]}2 E[ˆ E(ˆ)]2 [E(ˆ) ]2 2[E(ˆ) ] E[ˆ E(ˆ)] Var(ˆ) [E(ˆ) ]2.
MSE (ˆ) Var(ˆ) [E(ˆ) ]2
上式表明,均方误差由两部分构成:第一 部分是估计量的方差,第二部分是估计量的偏 差的平方和。
X1,X2,…,Xn为抽自总体X 的随机样本,记 X与 S 2分别为样本均值与样本方差,即
X
1 n
n
i1
X
i
,
S2
n
1
1
n
i1
(
X
i
X
)2.
则 E(X ) , E(S2) 2.
即样本均值和样本方差分别是 总体均值 和总体方差的无偏估计。
证明 因为X1, X2, …, Xn 独立同分布,且 E(Xi )=μ , 所以
为确定置信区间,我们先回顾前面给出 的随机变量的上α 分位点的概念。
设 0 1,对随机变量 X,称满足 P{X x }
的点 x 为 X 的上 分位点。
z
例如:z0.05 1.645,z0.025 1.96.
例如:32 (0.025) 9.348, 32 (0.975) 0.216 .
对一切可能的 成立,则称 ˆ为 的无偏估计。
说明
无偏性的意义:用估计量 ˆ估计参数,有
时可能估计偏高,有时可能偏低,但是平均起
来等于。
“一切可能的 ”是指:在参数估计问题中, 参数 一切可能的取值。
我们之所以要求对一切可能的 都成立,
是因为在参数估计问题中, 我们并不知道参数
的真实取值。自然地要求它在 的一切可能
E
(
X
2 i
)
nE( X
2 )
n
1
1
n(
2
2)
n
2
n
2
2.
前面两节中,我们曾用矩法和极大似然法
分别求得了正态总体N(μ, σ2)中参数σ2的估计,
均为
ˆ 2
1 n
n
(Xi
i1
X
)2.
很显然,它不是σ2 的无偏估计。这正是我们为
什么要将其分母修正为 n-1,获得样本方差 S2
来估计σ 2的理由。
相关文档
最新文档