参数区间估计.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 1
2
1)S 2 } (n 1)
1
(n 1)S 2 (n 1)S 2
于是
[ 2 2 (n 1) ,
2 1
2 (n
] 1)
即为所求.
2、两个正态总体参数的区间估计
给定置信度为1 ,并设X1 , X 2 ,, X n1为 第一个总体 N (1 , 12 )的样本,Y1 ,Y2 , ,Yn2 为第二 个总体 N (2 , 22 )的样本, X ,Y分别是第一、二个 总体的样本均值 , S1 2 , S2 2分别是第一、二个总体 的修正样本方差 .两总体相互独立
的分布,确定常数a, b,使得
P(a ≤S(T, )≤b)= 1 5. 对“a≤S(T, )≤b”作等价变形,得到如下 形式: P{ˆ1 ˆ2} 1
则[ˆ1,ˆ2 ]就是 的100(1 )%的置信区间.
可见,确定区间估计很关键的是要寻找
一个待估参数 和估计量T 的函数S(T, ), 且S(T,)的分布为已知, 不依赖于任何未知
ˆ1 ˆ1( X1, X2,, Xn),ˆ2 ˆ2( X1, X2,, Xn)
(ˆ1 ˆ2 ) 满足 P{ˆ1 ˆ2} 1
则称区间 [ˆ1,ˆ2 ]是 的置信水平(置信度、 置信概率)为1 的置信区间.
ˆ1和ˆ2 分别称为置信下限和置信上限.
可见,
对参数 作区间估计,就是要设法找出
寻找未知参数的
取 U 明确X 问 题n 置,~是N信求(水0什,平1么)是参多数少的?一置个信良区好间估? 计.
寻找一个待估参数和 估计量的函数 ,要求 其分布为已知.
有了分布,就可以求出 U取值于任意区间的概率.
对于给定的置信水平(大概率), 根据U的分布, 确定一个区间, 使得U取值于该区间的概率为 置信水平.
对给定的置信水平1 ,
查正态分布表得 u 2 ,
使
P{|
X
n
|
u
2}
1
为什么 这样取?
对给定的置信水平1 ,
查正态分布表得 u /2 ,
使
P{|
X
n
|
u
2}
1
从中解得
P{X
n
u
2
X
n
u
2}
1
P{X
n u
2
X
n
u
2}
1
于是所求 的 置信区间为
[ X n u 2 , X n u 2 ]
也可简记为
引言
前面,我们讨论了参数点估计. 它 是用样本算得的一个值去估计未知参数. 但是,点估计值仅仅是未知参数的一个 近似值,它没有反映出这个近似值的误 差范围. 区间估计正好弥补了点估计的 这个缺陷 .
一、 置信区间定义:
设 是 一个待估参数,给定 0,
若由样本X1,X2,…Xn确定的两个统计量
讨论两个总体均值差和方差比的估计问题.
I. 两个总体均值差1 2 的置信区间
(1)
2 1
和
2
2
均为已知,
1 2的一个置信度为1 的置信区间
X
Y
u / 2
2 1
n1
2 2
wk.baidu.com
n2
.
推导过程如下:
因为 X , Y 分别是 1, 2 的无偏估计,
所以 X Y 是 1 2 的无偏估计,
由 X , Y 的独立性及
Sn
对给定的置信度1 ,确定分位数 t 2 (n 1),
使 P{| t | t 2 (n 1)} 1
即
P{|
X S
n
| t
2 (n 1)} 1
从中解得
P{X
S n
t
2 (n
1)
X
S n
t
2
(n
1)}
1
[X
S n
t
2 (n
1),
X
S n
t
2
(n
1)]
即为
均值 的置信水平为1 的区间估计.
再求方差 2的置信水平为1 的区间估计.
1 2的一个置信度为1 的近似置信区间
X
Y
u / 2
S1 2 n1
取枢轴量
(n 1)S2
2
~
2(n 1)
对给定的置信度 1, 确定分位数
2 1
2 (n
1)
,
2
2 (n
1)
,
使
P{12
2 (n 1)
(n 1)S 2
2
2
2 (n 1)} 1
从中解得
P{
(n
2
1)S 2(n
2
1)
2
(n
2 1
2
1)S 2 } (n 1)
1
P{
(n
2
1)S 2(n
2
1)
2
(n
X
n u 2
从例1解题的过程,我们归纳出求置 信区间的一般步骤如下:
1. 明确问题, 是求什么参数的置信区间?
置信水平 1 是多少?
2. 寻找参数 的一个良好的点估计
T (X1,X2,…Xn)
3. 寻找一个待估参数 和估计量T的函数
S(T, ),且其分布为已知.
称S(T, )为枢轴量.
4. 对于给定的置信水平1 ,根据S(T, )
2. 估计的精度要尽可能的高. 如要求区间
长度 ˆ2 ˆ1 尽可能短,或能体现该要求的其
它准则. 可靠度与精度是一对矛盾, 一般是在保证可靠度的条件下 尽可能提高精度.
二、置信区间的求法
例1 设X1,…Xn是取自N (, 2 )的样本, 2已知,
求参数 的置信度为 1 的置信区间.
解: 选 的点估计为 X
参数 (这样我们才能确定一个大概率区间).
而这与总体分布有关,所以,总体分布的 形式是否已知,是怎样的类型,至关重要.
置信区间是一个随机区间,样本的每 一个观测值都确定一个对应的区间.
这里,我们主要讨论总体分布为正态 的情形. 若样本容量很大,即使总体分布 未知,应用中心极限定理,可得总体的近 似分布,于是也可以近似求得参数的区间 估计.
两个只依赖于样本的界限(构造统计量)
ˆ1 ˆ1(X1,…Xn) ˆ2 ˆ2(X1,…Xn)
(ˆ1 ˆ2 )
一旦有了样本,就把 估计在区间[ˆ1,ˆ2 ]
内. 这里有两个要求:
1. 要求 以很大的可能被包含在区间[ˆ1,ˆ2 ]
内,就是说,概率P{ˆ1 ˆ2}要尽可能大.
即要求估计尽量可靠.
X
~
N 1,
2 1
n1
,
Y
~
N
2
,
2 2
n2
,
可知
X
Y
~
N
1
2
,
2 1
n1
22
n2
,
或 X Y 1 2 ~ N 0, 1,
2 1
2 2
n1 n2
于是得 1 2的一个置信度为1 的置信区间
X
Y
u
/2
2 1
n1
2 2
n2
.
(2) 12和 22均为未知,
只要n1和n2都很大(实用上 50即可), 则有
例2 已知某地区新生婴儿的体重X~N (, 2 ), , 2未知,
…
随机抽查100个婴儿 得100个体重数据 X1,X2,…,X100
求 和 2的区间估计(置信水平为1- ).
解:这是单总体均值和方差的估计
已知X ~ N (, 2), , 2未知
先求均值 的区间估计.
因方差未知,取 t X ~ t(n 1)
2
1)S 2 } (n 1)
1
(n 1)S 2 (n 1)S 2
于是
[ 2 2 (n 1) ,
2 1
2 (n
] 1)
即为所求.
2、两个正态总体参数的区间估计
给定置信度为1 ,并设X1 , X 2 ,, X n1为 第一个总体 N (1 , 12 )的样本,Y1 ,Y2 , ,Yn2 为第二 个总体 N (2 , 22 )的样本, X ,Y分别是第一、二个 总体的样本均值 , S1 2 , S2 2分别是第一、二个总体 的修正样本方差 .两总体相互独立
的分布,确定常数a, b,使得
P(a ≤S(T, )≤b)= 1 5. 对“a≤S(T, )≤b”作等价变形,得到如下 形式: P{ˆ1 ˆ2} 1
则[ˆ1,ˆ2 ]就是 的100(1 )%的置信区间.
可见,确定区间估计很关键的是要寻找
一个待估参数 和估计量T 的函数S(T, ), 且S(T,)的分布为已知, 不依赖于任何未知
ˆ1 ˆ1( X1, X2,, Xn),ˆ2 ˆ2( X1, X2,, Xn)
(ˆ1 ˆ2 ) 满足 P{ˆ1 ˆ2} 1
则称区间 [ˆ1,ˆ2 ]是 的置信水平(置信度、 置信概率)为1 的置信区间.
ˆ1和ˆ2 分别称为置信下限和置信上限.
可见,
对参数 作区间估计,就是要设法找出
寻找未知参数的
取 U 明确X 问 题n 置,~是N信求(水0什,平1么)是参多数少的?一置个信良区好间估? 计.
寻找一个待估参数和 估计量的函数 ,要求 其分布为已知.
有了分布,就可以求出 U取值于任意区间的概率.
对于给定的置信水平(大概率), 根据U的分布, 确定一个区间, 使得U取值于该区间的概率为 置信水平.
对给定的置信水平1 ,
查正态分布表得 u 2 ,
使
P{|
X
n
|
u
2}
1
为什么 这样取?
对给定的置信水平1 ,
查正态分布表得 u /2 ,
使
P{|
X
n
|
u
2}
1
从中解得
P{X
n
u
2
X
n
u
2}
1
P{X
n u
2
X
n
u
2}
1
于是所求 的 置信区间为
[ X n u 2 , X n u 2 ]
也可简记为
引言
前面,我们讨论了参数点估计. 它 是用样本算得的一个值去估计未知参数. 但是,点估计值仅仅是未知参数的一个 近似值,它没有反映出这个近似值的误 差范围. 区间估计正好弥补了点估计的 这个缺陷 .
一、 置信区间定义:
设 是 一个待估参数,给定 0,
若由样本X1,X2,…Xn确定的两个统计量
讨论两个总体均值差和方差比的估计问题.
I. 两个总体均值差1 2 的置信区间
(1)
2 1
和
2
2
均为已知,
1 2的一个置信度为1 的置信区间
X
Y
u / 2
2 1
n1
2 2
wk.baidu.com
n2
.
推导过程如下:
因为 X , Y 分别是 1, 2 的无偏估计,
所以 X Y 是 1 2 的无偏估计,
由 X , Y 的独立性及
Sn
对给定的置信度1 ,确定分位数 t 2 (n 1),
使 P{| t | t 2 (n 1)} 1
即
P{|
X S
n
| t
2 (n 1)} 1
从中解得
P{X
S n
t
2 (n
1)
X
S n
t
2
(n
1)}
1
[X
S n
t
2 (n
1),
X
S n
t
2
(n
1)]
即为
均值 的置信水平为1 的区间估计.
再求方差 2的置信水平为1 的区间估计.
1 2的一个置信度为1 的近似置信区间
X
Y
u / 2
S1 2 n1
取枢轴量
(n 1)S2
2
~
2(n 1)
对给定的置信度 1, 确定分位数
2 1
2 (n
1)
,
2
2 (n
1)
,
使
P{12
2 (n 1)
(n 1)S 2
2
2
2 (n 1)} 1
从中解得
P{
(n
2
1)S 2(n
2
1)
2
(n
2 1
2
1)S 2 } (n 1)
1
P{
(n
2
1)S 2(n
2
1)
2
(n
X
n u 2
从例1解题的过程,我们归纳出求置 信区间的一般步骤如下:
1. 明确问题, 是求什么参数的置信区间?
置信水平 1 是多少?
2. 寻找参数 的一个良好的点估计
T (X1,X2,…Xn)
3. 寻找一个待估参数 和估计量T的函数
S(T, ),且其分布为已知.
称S(T, )为枢轴量.
4. 对于给定的置信水平1 ,根据S(T, )
2. 估计的精度要尽可能的高. 如要求区间
长度 ˆ2 ˆ1 尽可能短,或能体现该要求的其
它准则. 可靠度与精度是一对矛盾, 一般是在保证可靠度的条件下 尽可能提高精度.
二、置信区间的求法
例1 设X1,…Xn是取自N (, 2 )的样本, 2已知,
求参数 的置信度为 1 的置信区间.
解: 选 的点估计为 X
参数 (这样我们才能确定一个大概率区间).
而这与总体分布有关,所以,总体分布的 形式是否已知,是怎样的类型,至关重要.
置信区间是一个随机区间,样本的每 一个观测值都确定一个对应的区间.
这里,我们主要讨论总体分布为正态 的情形. 若样本容量很大,即使总体分布 未知,应用中心极限定理,可得总体的近 似分布,于是也可以近似求得参数的区间 估计.
两个只依赖于样本的界限(构造统计量)
ˆ1 ˆ1(X1,…Xn) ˆ2 ˆ2(X1,…Xn)
(ˆ1 ˆ2 )
一旦有了样本,就把 估计在区间[ˆ1,ˆ2 ]
内. 这里有两个要求:
1. 要求 以很大的可能被包含在区间[ˆ1,ˆ2 ]
内,就是说,概率P{ˆ1 ˆ2}要尽可能大.
即要求估计尽量可靠.
X
~
N 1,
2 1
n1
,
Y
~
N
2
,
2 2
n2
,
可知
X
Y
~
N
1
2
,
2 1
n1
22
n2
,
或 X Y 1 2 ~ N 0, 1,
2 1
2 2
n1 n2
于是得 1 2的一个置信度为1 的置信区间
X
Y
u
/2
2 1
n1
2 2
n2
.
(2) 12和 22均为未知,
只要n1和n2都很大(实用上 50即可), 则有
例2 已知某地区新生婴儿的体重X~N (, 2 ), , 2未知,
…
随机抽查100个婴儿 得100个体重数据 X1,X2,…,X100
求 和 2的区间估计(置信水平为1- ).
解:这是单总体均值和方差的估计
已知X ~ N (, 2), , 2未知
先求均值 的区间估计.
因方差未知,取 t X ~ t(n 1)