数理统计 区间估计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
解 (1) X ~ N ( , 0.06 / 6) 即 N ( ,0.01)
X 0.1 ~ N (0,1) u u 0.025 1.96
2
由给定数据算得 x
1
x 6
i 1
6
i
14.95
由公式 (3) 得 的置信区间为
( 14.95 1.96 0.1 , ( 14.75 , 15.15 ) 14.95 1.96 0.1 )
(2) 取 T

X S 6
~ t (5)
查表
t0.025 (5) 2.5706
由给定数据算得
s
2
x 14.95
2
1 5
( xi 6 x ) 0.051.
2 i 1
6
s 0.226
由公式 (4) 得 的置信区间为
(X S 6 ( 14.71, t 0.025 (5), 15.187 )
X 1 ~ N 0 , 1 X ~ N , U 1 5 5
取 查表得
0.05
u / 2 1.96
这说明
X P 1.96 0.05 1 5

P X 1.96 1 X 1.96 1 0.95 5 5
2
~ ( n 1)
2
~ N (0,1)

2

2
2
~ ( m 1)
2
2

( n 1) S1

( m 1) S2

2
~ ( n m 2)
2
( X Y ) ( 1 2 ) 1 n 1 m ( n 1) S1 ( m 1) S2
2 2
~ t ( n m 2)
2
X
S 6
t 0.025 (5) )
(3) 选取枢轴量
2

5S
2

2
~ (5) ,
2
S 0.051.
2
2
查表得 0.025 (5) 12.833 , 0975 (5) 0.831 由公式 (5) 得 2 的置信区间为
( 5S
2 2
0.025 (5)
,
5S
2
2
0.975 (5)
(2)
例2 自一大批产品中抽取100个样品, 其中 有60个一级品, 求这批产品的一级品率 p 的 置信度为0.95的置信区间.
解 将
n 100 , m 60 , u 1.96
2
代入(2)式得

m 1 m m m 1 m m u u 1 , 1 n 2 2 n n n n n n n
置信概率为 1

1 , 2
2
2
已知, 考虑 1 2的置信区间
1
n
2
X ~ N ( 1 ,
), Y ~ N ( 2 ,
2
m
2
)
X ,Y
相互独立,
( X Y ) ( 1 2 )
1
n
2

2
m
2
~ N (0,1)
1 2
的置信区间为
2 2 2 2 (X Y ) u 1 2 , (X Y ) u 1 2 2 2 n m n m
在介绍区间估计之前,我们先看一个例子.
引例 已知 X ~ N ( ,1), 的无偏、有效点估计为 X
常数
随机变量
不同样本算得的 的估计值不同, 因此除了给出 的点估计外, 还希望根据 所给的样本确定一个随机区间, 使其包含 参数真值的概率达到指定的要求.
如引例中,要找一个区间,使其包含 的 真值的概率为0.95. ( 设 n = 5 )
g( X 1 , X 2 , , X n , )
取枢轴量
g ( X 1 , X 2 , , X n , ) X 1/ 5
~ N (0, 1)
给定置信度 1 ,定出常数 a , b ,使得
P (a g( X 1 , , X n , ) b) 1
1
• 2
2
4
6
8


2
2
10
2

(5)
例3 某工厂生产一批滚珠, 其直径 X 服从 正态分布 N( 2), 现从某天的产品中随机 抽取 6 件, 测得直径为 15.1 , 14.8 , 15.2 , 14.9 , 14.6 , 15.1
(1) 若 2=0.06, 求 的置信区间 置信概率 2未知,求 的置信区间 (2) 若 均为0.95 (3) 求方差 2的置信区间.
n m2
P
( X Y ) ( 1 2 ) 1 n 1 m ( n 1) S1 ( m 1) S2
2 2
n m2
t 1 2
1 2 的置信区间为
1 1 ( X Y ) t (n m 2) W 2 n m (7)
X
2
1
X n
i 1
n
i

m n
2
2
m m m S X i X 1 n i 1 n n n n
1
n
2
m
代入(1)式得
m u n 2 1 m m m u 1 , 2 n n n n 1 m m 1 n n n
这时, 2 1 往往增大, 因而估计精度降低.
确定后, 置信区间 的选取方法不唯一,
常选最小的一个.
处理“可靠性与精度关系”的原 则 先
求参数 置信区间 保 证 可靠性

提 高 精 度
求置信区间的步骤
寻找一个子样的函数
— 称为枢轴量 它含有待估参数, 不含其它未知参数, 它的分布已知, 且分布不依赖于待估参 数 (常由 的点估计出发考虑 ). 例如 X~N ( , 1 / 5)
(3) 当 未知时, 方差 2 的置信区间 选取
2
2

( n 1) S
2

2
~ ( n 1)
2
0.15
则由

2
0.1
P ( 1
2
( n 1) S
2

2
) 1
2
2
0.125
0.075 0.05 0.025
得 2 的置信区间为

-2
2
2 ( n 1) S 2 ( n 1) S , 2 2 ( n 1) ( n 1) 1 2 2
推导
由 P
选取枢轴量
X
T
X S /
*
~ t ( n 1)
n
t ( n 1) 2 S*/ n
确定 t (n 1)

2

S* S* 的置信区间为 X t 2 (n 1) n , X t 2 (n 1) n
P(1 2 ) 1

则称 (1 , 2 )为 的置信概率为1 - 的
置信区间或区间估计. 1 置信下限 2 置信上限
几点说明
置信区间的长度 2 1 反映了估计精度
2 1越小,
估计精度越高.
反映了估计的可靠度, 越小, 越可靠. 越小, 1- 越大, 估计的可靠度越高,但
0 / n
~ N (0,1)

X P / n 0
u 2
确定 u

2

X
0 /
u
2
n
得 的置信概率为 1 的置信区间为
( X u
2
0
n
,
X u
2
0
n
)
(2) 方差 2未知 , 的置信区间
S* S* , X t ( n 1) X t ( n 1) 2 2 n n (4)
取百度文库
U
X 近似 S/ n
~
N ( 0 , 1)
由 P ( U u / 2 ) 1 得 的置信区间
( X u
2
S n
, X u
2
S n
)
(1)
例1 从学校新生中随机地选50名,进行田径 项目测试, 由测试成绩得样本均值 x 75.8 , 样本方差s 2 144 . 72 . 求全校新生平均田径 成绩的置信区间, 置信概率为95%. 解 u u 0.05 1.96 , s 12.03 . 由(1)式得
) ( 0.0199 ,
0.3069 )
(二) 两个正态总体的情形
( X 1 , X 2 , , X n )为取自总体
N ( 1 12 ) 的样本,
N ( 2 22 ) 的样本,
( Y1 , Y2 ,, Ym )为取自总体
X , S1 ; Y , S2
2
2
分别表示两子样的均值与方差
( 0.504, 0.696 )
注 另一解法见后面附录
二. 正态总体的情形 (一) 一个正态总体的情形 (1) 方差 2已知, 的置信区间
( X u
2
0
n
, X u
2
0
n
)

(3)
推导 由 X
~ N ( ,
0
n
2
)
选取枢轴量
X
g ( X 1 , X 2 , , X n , )

(6)
② 1 , 2 未知( 但 1 2 ) 1 2的置信区间
2 2
2 2 2
X Y ~ N ( 1 2 , ( X Y ) ( 1 2 ) 1 n 1 m

2


2
( n 1) S1
2
)
n
m
2 ( m 1) S2
( 引例中 a 1.96, b 1.96 )
由 a g( X1 , , X n , ) b 解出 1 , 2
得置信区间(1 , 2 )
引例中
( 1 , 2 ) ( X 1.96 1 , 5 X 1.96 1 ) 5
置信区间常用公式
一. 非正态总体的情形 (大样本) 设总体的期望 EX 与方差 DX 2 均未知, 用大样本( n 30 )对 作区间估计.
X 1.96 1 , 5 X 1.96 1 5
称随机区间
为未知参数 的置信度为0.95的置信区间.
置信区间的意义
反复抽取容量为5的样本,都可得 一个区间,此区间不一定包含未知参数 的真值, 而包含真值的区间占95%.
若测得 一组样本值, 算得 x 1.86 则得一区间(1.86 – 0.877, 1.86 + 0.877) 它可能包含也可能不包含 的真值, 反复 抽样得到的区间中有95%包含 的真值.
§6.4
区间估计
在前面我们讨论了参数的点估计,参数的点 估计的优点是,它的形式是确定的估计量,因而 可以进行运算.只要给定样本观察值,就能算出参 数的估计值.但用点估计的方法得到的估计值不一 定是参数的真值,即使与真值相等也无法肯定这 种相等(因为总体参数本身是未知的),也就是 说,由点估计得到的参数估计值对估计的精度与 可靠性没有做明确的回答,而在实际问题中,不 仅需要知道未知参数的估计值,往往还需要知道 这些估计值的精度与可靠性.要解决这些问题就要 引入参数的区间估计.

2
置信下限 置信上限
x u
2
s n s n
75.8 1.96 75.8 1.96
12.03 50 12.03 50
72.465 , 79.135 ,
x u
2
所求置信区间为 ( 72.465 , 79.135 )
若总体 X ~ B(1, p ) , 容量为 n 的样本中 恰有 m 个1,试对 p 作区间估计.
2 2
1 2 u
2
0.2
0.1
-2 u1
-1
3.92
2
0.4
0.3
0.2
u 2 u1 1.84 (2.13)
3 3
0.1
3.97
1
-2 u1
-1
u 22
3
3
置信区间的定义
设 为待估参数, 是一给定的数, ( 0<<1). 若能找到统计量 1 , 2 , 使
问题 1. n 与 确定后,置信区间是否唯一? 2.为何要取 u / 2 ?
答复
1. 不唯一.
2. 当置信区间为 ( X u 区间的长度为 2u

2

2
1 5
, X u
2
1 ) 时, 5
1 5
—— 达到最短.
0.4
0.3
取 = 0.05
u u1 1.96 (1.96)
相关文档
最新文档