估计量的评选标准与区间估计
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
式的估计称为区间估计。
置信区间 设总体X的分布函数F(x;)含有一个未知 参数. 对于给定值a(0<a<1), 若由样本X1 ,X2 ,…,Xn确定 的两个统计量 ( X1, X 2 ,..., X n )和 ( X1, X 2 ,..., X n ) 满足
P{ ( X1, X 2 ,..., X n ) ( X1, X 2 ,..., X n )} 1 a, 则称随机区间 ( , )是的置信度为1 a的置信区间,和 分
n 1
S 2
1 n 1
n
(Xi
i 1
X 2 ).
这就是说S2是2的无偏估计,因此,一般都是取S2作为 方差2的估计量。
例3 设总体X服从参数为的指数分布,概率密度为
f
( x,
பைடு நூலகம்
ex /
,
x 0,
0,
其它。
其中>0为未知,又设X1 ,X2 ,…,Xn是来自X的样本,试证
都是统计量 , 那么( , )就是的一个置信度为1 a的置信区间。
函数Z(X1 ,X2,…,Xn ; )的构造, 可以从 的点估计着 手考虑。
(三)单个总体N(,2)的情况
设已给定置信度为1-a, 并设X1 ,X2,…,Xn为总体N(,2)
的样本. X, S2分别是样本均值和样本 方差。
2的无偏估计为S2 由第六章2定理一知
(n 1)S 2 ~ 2 (n 1), 2
故
P{
2 1-a/2
(n
1)
(n 1)S 2
2
2 a/2
(n
1)}
1
a,
即
(n 1)S 2
P{
2 a/2
(n
1)
2
(n 1)S 2
2 1a/2
(n
} 1)
1
a,
k ),其中g为连续函数,则的矩估计量ˆ g(ˆ1, ˆ2,....,ˆk )
=g(A1 ,A2 ,…,Ak)是的一致估计量。
由极大似然估计法得到的估计量,在一定条件下也
具有一致性。 二 区间估计
对于未知参数,除了求出它的点估计ˆ外,还必须给 出一个范围,并知道这个范围包含真值的可信度,这样 的范围用区间给出,并给出范围含的可信程度。这种形
例2 对于均值,方差20都存在的总体,若, 2均为
未知,则2的估计量
ˆ 2
1 n
i
n (X
1
i
X )2
是有偏的。
证
ˆ 2
1 n
i
n
X 1
2 i
X
2
A2 X 2
E( A2 ) 2 2 2 , 又 E( X 2 ) D( X ) [E( X )]2 2 / n 2 , 故
1)均值的置信区间 (a) 2为已知,由例 4采用函数 X ,已得到的1 a的
/ n
置信区间为(X
n
za / 2 ).
(b) 2为未知。这时,不能用 a),因其内含 ,而S 2是 2
的无偏估计 ,又 X ~ t(n 1), 且t(n 1)不依赖于任何未知参数 ,
X / n
z } 0.01 0.95,
即
P{ X
n
z0.01 X
n
z0.04} 0.95.
故
( X n z0.01 , X n z0.04 )
(7)
也是的置信度为95%的置信区间。
比较(5)和(7)则区间长度分别为
l1 2
n z0.025 3.92
506 508 499 503 504 510 497 512
514 505 493 496 506 502 509 496
设袋装糖果的重量近似服从正态分布,试求总体均值 的置信区间。
解 这里 1-a=0.95, a/2=0.025, n-1=15,
t0.025 (15) 2.1315 x 503.75, s=6.2022.
别称为置信度为1-a的双侧置信区间的置信下限和置信上 限,1-a称为置信度。
意义:若反复抽样多次(容量都是n),每个样本确定一 个区间,其中包含 真值的约占100(1-a)%。
例4 设总体X~N(,2), 2为已知, 为未知, 设X1 ,X2, …,Xn 是来自X的样本, 求的置信度为1-a的置信区间。
布,k阶样本矩
Ak
1
n
n i 1
X
k i
是k阶总体矩k的无偏估计。
证 X1 ,X2 ,…,Xn与X同分布,故有
E(Xik)=E(Xk) = k ,
i=1,2,…,n.
即有
E( Ak )
1 n
n i 1
E
(
X
k i
)
k .
特别,不论总体服从什么分布,只要它的数学期望存在
X 总是总体X的数学期望1=E(X)的无偏估计量。
,
x 0,
0,
其它。
故知
E(Z ) , E(nZ ) .
n
即nZ也是参数的无偏估计量。
由此可见一个未知参数可以有不同的无偏估计量。
事实上X1 ,X2 ,…,Xn均可。
(二)有效性
现在来比较的两无偏估计量.
定义 设ˆ1 ˆ1(X1, X2,...,Xn )与ˆ2 ˆ2 (X1, X2,...,Xn )都是
X和nZ n[min( X 1 , X 2 ,..., X n )]都是的无偏估计量 证 因E( X ) E( X ) 故X是的无偏估计。
而Z=min(X1 ,X2 ,…,Xn)服从参数为/n的指数分布, 即具有概率密度
f min ( x;
n
e nx /
估计量的评选标准与区 间估计
一 估计量的评选标准
(一) 无偏性
定义 若估计量ˆ= ˆ(X1 ,X2 ,…,Xn)的数学期望E(ˆ)
存在,且对于任意∈有
E(ˆ)=, 则称ˆ是的无偏估计。
在科学技术中E(ˆ)-称为以ˆ作为的估计的系统误
差,无偏估计的实际意义就是无系统误差。
例1 设总体X的的k阶矩k=E(Xk)(k1)存在,又设X1 ,X2 ,…,Xn是X的一个样本。试证明不论总体服从什么分
再者,若由一个样本值 获得X 0.52,则有
(5.20 0.49), 即 (4.71, 5.69 ).
这已不是随机区间, 但仍称为95%的置信区间,含义 是该区间属于那些包含的区间的可信程度为95%, 或
区间包含”的可信度为95%.
注意:置信区间不唯一,上例给定a=0.05, 则还有
P{ z0.04
(X
n
za /2 , X
n
za /2 )
(5)
常写成
(X
n
za /2 )
如果取a=0.05, 即1-0.05=0.95, 又若 =1, n=16, 查表
得za/2 =z0.025 =1.96. 于是得到置信度为0.95的置信区间
( X 1 1.96), 即 ( X 0.49). 16
E(ˆ 2 ) E( A2 X 2 )
E( A2 )
E(X
2)
n 1
n
,
所以ˆ 2是有偏的。
若以 n 乘ˆ 2,所得的估计量就是无偏的了:
n 1
E( n ˆ 2 ) n E(ˆ 2 ) .
n 1
n 1
n ˆ 2就是第六章中定义的样本方差S 2 :
(三) 一致性
定义 设ˆ(X1 ,X2 ,…,Xn)为参数的估计量,若对于 任意,当n时ˆ(X1 ,X2 ,…,Xn)依赖收敛于,则称 ˆ为的一致估计量。
由第六章2知,样本k(k≥1)阶矩是总体X的k阶矩
k=E(Xk)的一致估计量,进而若待估参数=g(1 , 2 ,…,
S/ n
得
P{ta/2 (n 1)
X
S/ n
ta/2 (n 1)} 1 a,
即
P{X -
S n
ta/2 (n
1)
X
S n
t a /2
(n
1)}
1
a.
于是得的置信度为1-a的置信区间
(X
S n
ta
/
2
(n
1)).
例5 有一大批糖果,现从中随机地取16袋,称得重量为
这就是2的置信度为1-a的置信区间
(n 1)S 2
2 a/2
(n
1)
,
(n 1)S 2
2 1a/2
(n
1)
.
还可得标准差的置信区间。
(n 1)S 2 ,
2 a/2
(n
1)
,
(n 1)S 2
2 1a/2
(n
1)
例6 求例5中的置信度为0.95置信区间。 解 a/2=0.025, 1-a/2=0.975, n-1=15, 20.025(15)=27.488, 20.975(15) =6.262, S=6.2022. 由上式得 的置信区间为(4.58,9.60).
它包含待估参数 ,而不含其它未知参数,且Z的分布不 依赖其它未知参数。(当然不依赖于待估参数 )
2)对给定置信度1-α ,定出两常数a, b,使
P{a<Z(X1 ,X2,…,Xn;)<b}=1- α 3)若能从a< Z(X1 ,X2,…,Xn;)<b得到等价的不等式 , 其中 ( X1, X 2 ,..., X n ), ( X1, X 2 ,..., X n )
于是根据
(X
S n
ta / 2 (n 1))
得均值的0.95置信区间
(503.75 6.2022 2.1315 ). 16
即
(500.4, 507.1).
若以此区间任一值作的近似值,其误差不大于
6.2022 2.1315 2 6.61克,且可信度为 95%. 16
2)方差2的置信区间(只介绍为未知)
解 已知X是的无偏估计,且有
X ~ N (0,1). / n 且它不依赖于任何未知参数, 按标准正态分布的上a分位 点的定义,有(如图)
P{ X / n
za / 2} 1 a.
即
P{ X
n
za / 2
X
n
za / 2} 1 a.
这就得到了的一个置信度为1-a的置信区间
的无偏估计量,若有
D(ˆ1 ) D(ˆ2 ) 则称 ˆ1较ˆ2 有效。
例4 (续例3)试证当n>1时,的无偏估计量X 较的无 偏估计量nZ有效。
证 由于D(X)=2,故有D(X )= 2 /n, 再者,由于D(Z)==2/n2 , 故有D(nZ)= 2.
当n>1时 D(nZ)>D(X),故X较nZ有效。
, n
l2
n
( z0.04
z0.01 )
4.48
.
n
在例4中, 设置信区间的长度
n
( 2
L
za/2 )2 ,
L
2
n
z a /2
可见, L随n的增大而减小(当a给定时)。
解出n,
我们可以 确定n , 使置信区间具有预先给定的长度。
寻求参数 的置信区间的具体做法步骤:
1)寻求一个样本X1 ,X2,…,Xn的函数: Z=Z(X1 ,X2,…,Xn ; ),
置信区间 设总体X的分布函数F(x;)含有一个未知 参数. 对于给定值a(0<a<1), 若由样本X1 ,X2 ,…,Xn确定 的两个统计量 ( X1, X 2 ,..., X n )和 ( X1, X 2 ,..., X n ) 满足
P{ ( X1, X 2 ,..., X n ) ( X1, X 2 ,..., X n )} 1 a, 则称随机区间 ( , )是的置信度为1 a的置信区间,和 分
n 1
S 2
1 n 1
n
(Xi
i 1
X 2 ).
这就是说S2是2的无偏估计,因此,一般都是取S2作为 方差2的估计量。
例3 设总体X服从参数为的指数分布,概率密度为
f
( x,
பைடு நூலகம்
ex /
,
x 0,
0,
其它。
其中>0为未知,又设X1 ,X2 ,…,Xn是来自X的样本,试证
都是统计量 , 那么( , )就是的一个置信度为1 a的置信区间。
函数Z(X1 ,X2,…,Xn ; )的构造, 可以从 的点估计着 手考虑。
(三)单个总体N(,2)的情况
设已给定置信度为1-a, 并设X1 ,X2,…,Xn为总体N(,2)
的样本. X, S2分别是样本均值和样本 方差。
2的无偏估计为S2 由第六章2定理一知
(n 1)S 2 ~ 2 (n 1), 2
故
P{
2 1-a/2
(n
1)
(n 1)S 2
2
2 a/2
(n
1)}
1
a,
即
(n 1)S 2
P{
2 a/2
(n
1)
2
(n 1)S 2
2 1a/2
(n
} 1)
1
a,
k ),其中g为连续函数,则的矩估计量ˆ g(ˆ1, ˆ2,....,ˆk )
=g(A1 ,A2 ,…,Ak)是的一致估计量。
由极大似然估计法得到的估计量,在一定条件下也
具有一致性。 二 区间估计
对于未知参数,除了求出它的点估计ˆ外,还必须给 出一个范围,并知道这个范围包含真值的可信度,这样 的范围用区间给出,并给出范围含的可信程度。这种形
例2 对于均值,方差20都存在的总体,若, 2均为
未知,则2的估计量
ˆ 2
1 n
i
n (X
1
i
X )2
是有偏的。
证
ˆ 2
1 n
i
n
X 1
2 i
X
2
A2 X 2
E( A2 ) 2 2 2 , 又 E( X 2 ) D( X ) [E( X )]2 2 / n 2 , 故
1)均值的置信区间 (a) 2为已知,由例 4采用函数 X ,已得到的1 a的
/ n
置信区间为(X
n
za / 2 ).
(b) 2为未知。这时,不能用 a),因其内含 ,而S 2是 2
的无偏估计 ,又 X ~ t(n 1), 且t(n 1)不依赖于任何未知参数 ,
X / n
z } 0.01 0.95,
即
P{ X
n
z0.01 X
n
z0.04} 0.95.
故
( X n z0.01 , X n z0.04 )
(7)
也是的置信度为95%的置信区间。
比较(5)和(7)则区间长度分别为
l1 2
n z0.025 3.92
506 508 499 503 504 510 497 512
514 505 493 496 506 502 509 496
设袋装糖果的重量近似服从正态分布,试求总体均值 的置信区间。
解 这里 1-a=0.95, a/2=0.025, n-1=15,
t0.025 (15) 2.1315 x 503.75, s=6.2022.
别称为置信度为1-a的双侧置信区间的置信下限和置信上 限,1-a称为置信度。
意义:若反复抽样多次(容量都是n),每个样本确定一 个区间,其中包含 真值的约占100(1-a)%。
例4 设总体X~N(,2), 2为已知, 为未知, 设X1 ,X2, …,Xn 是来自X的样本, 求的置信度为1-a的置信区间。
布,k阶样本矩
Ak
1
n
n i 1
X
k i
是k阶总体矩k的无偏估计。
证 X1 ,X2 ,…,Xn与X同分布,故有
E(Xik)=E(Xk) = k ,
i=1,2,…,n.
即有
E( Ak )
1 n
n i 1
E
(
X
k i
)
k .
特别,不论总体服从什么分布,只要它的数学期望存在
X 总是总体X的数学期望1=E(X)的无偏估计量。
,
x 0,
0,
其它。
故知
E(Z ) , E(nZ ) .
n
即nZ也是参数的无偏估计量。
由此可见一个未知参数可以有不同的无偏估计量。
事实上X1 ,X2 ,…,Xn均可。
(二)有效性
现在来比较的两无偏估计量.
定义 设ˆ1 ˆ1(X1, X2,...,Xn )与ˆ2 ˆ2 (X1, X2,...,Xn )都是
X和nZ n[min( X 1 , X 2 ,..., X n )]都是的无偏估计量 证 因E( X ) E( X ) 故X是的无偏估计。
而Z=min(X1 ,X2 ,…,Xn)服从参数为/n的指数分布, 即具有概率密度
f min ( x;
n
e nx /
估计量的评选标准与区 间估计
一 估计量的评选标准
(一) 无偏性
定义 若估计量ˆ= ˆ(X1 ,X2 ,…,Xn)的数学期望E(ˆ)
存在,且对于任意∈有
E(ˆ)=, 则称ˆ是的无偏估计。
在科学技术中E(ˆ)-称为以ˆ作为的估计的系统误
差,无偏估计的实际意义就是无系统误差。
例1 设总体X的的k阶矩k=E(Xk)(k1)存在,又设X1 ,X2 ,…,Xn是X的一个样本。试证明不论总体服从什么分
再者,若由一个样本值 获得X 0.52,则有
(5.20 0.49), 即 (4.71, 5.69 ).
这已不是随机区间, 但仍称为95%的置信区间,含义 是该区间属于那些包含的区间的可信程度为95%, 或
区间包含”的可信度为95%.
注意:置信区间不唯一,上例给定a=0.05, 则还有
P{ z0.04
(X
n
za /2 , X
n
za /2 )
(5)
常写成
(X
n
za /2 )
如果取a=0.05, 即1-0.05=0.95, 又若 =1, n=16, 查表
得za/2 =z0.025 =1.96. 于是得到置信度为0.95的置信区间
( X 1 1.96), 即 ( X 0.49). 16
E(ˆ 2 ) E( A2 X 2 )
E( A2 )
E(X
2)
n 1
n
,
所以ˆ 2是有偏的。
若以 n 乘ˆ 2,所得的估计量就是无偏的了:
n 1
E( n ˆ 2 ) n E(ˆ 2 ) .
n 1
n 1
n ˆ 2就是第六章中定义的样本方差S 2 :
(三) 一致性
定义 设ˆ(X1 ,X2 ,…,Xn)为参数的估计量,若对于 任意,当n时ˆ(X1 ,X2 ,…,Xn)依赖收敛于,则称 ˆ为的一致估计量。
由第六章2知,样本k(k≥1)阶矩是总体X的k阶矩
k=E(Xk)的一致估计量,进而若待估参数=g(1 , 2 ,…,
S/ n
得
P{ta/2 (n 1)
X
S/ n
ta/2 (n 1)} 1 a,
即
P{X -
S n
ta/2 (n
1)
X
S n
t a /2
(n
1)}
1
a.
于是得的置信度为1-a的置信区间
(X
S n
ta
/
2
(n
1)).
例5 有一大批糖果,现从中随机地取16袋,称得重量为
这就是2的置信度为1-a的置信区间
(n 1)S 2
2 a/2
(n
1)
,
(n 1)S 2
2 1a/2
(n
1)
.
还可得标准差的置信区间。
(n 1)S 2 ,
2 a/2
(n
1)
,
(n 1)S 2
2 1a/2
(n
1)
例6 求例5中的置信度为0.95置信区间。 解 a/2=0.025, 1-a/2=0.975, n-1=15, 20.025(15)=27.488, 20.975(15) =6.262, S=6.2022. 由上式得 的置信区间为(4.58,9.60).
它包含待估参数 ,而不含其它未知参数,且Z的分布不 依赖其它未知参数。(当然不依赖于待估参数 )
2)对给定置信度1-α ,定出两常数a, b,使
P{a<Z(X1 ,X2,…,Xn;)<b}=1- α 3)若能从a< Z(X1 ,X2,…,Xn;)<b得到等价的不等式 , 其中 ( X1, X 2 ,..., X n ), ( X1, X 2 ,..., X n )
于是根据
(X
S n
ta / 2 (n 1))
得均值的0.95置信区间
(503.75 6.2022 2.1315 ). 16
即
(500.4, 507.1).
若以此区间任一值作的近似值,其误差不大于
6.2022 2.1315 2 6.61克,且可信度为 95%. 16
2)方差2的置信区间(只介绍为未知)
解 已知X是的无偏估计,且有
X ~ N (0,1). / n 且它不依赖于任何未知参数, 按标准正态分布的上a分位 点的定义,有(如图)
P{ X / n
za / 2} 1 a.
即
P{ X
n
za / 2
X
n
za / 2} 1 a.
这就得到了的一个置信度为1-a的置信区间
的无偏估计量,若有
D(ˆ1 ) D(ˆ2 ) 则称 ˆ1较ˆ2 有效。
例4 (续例3)试证当n>1时,的无偏估计量X 较的无 偏估计量nZ有效。
证 由于D(X)=2,故有D(X )= 2 /n, 再者,由于D(Z)==2/n2 , 故有D(nZ)= 2.
当n>1时 D(nZ)>D(X),故X较nZ有效。
, n
l2
n
( z0.04
z0.01 )
4.48
.
n
在例4中, 设置信区间的长度
n
( 2
L
za/2 )2 ,
L
2
n
z a /2
可见, L随n的增大而减小(当a给定时)。
解出n,
我们可以 确定n , 使置信区间具有预先给定的长度。
寻求参数 的置信区间的具体做法步骤:
1)寻求一个样本X1 ,X2,…,Xn的函数: Z=Z(X1 ,X2,…,Xn ; ),