第3章参数估计理论讲解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3章 参数估计理论
参数估计的基本方法:点估计,区间估计
点估计:以样本的某一函数值作为总体中未知参数的估计值。
区间估计:把总体中的参数确定在某一区间内。
第1节 点估计
点估计就是以样本的某一函数值作为总体中未知参数的估计值。
设θ是总体X 的待估参数,用样本12,,,n X X X 构造一个合适的统计量12(,,,)n T X X X 来估计参数θ,通常记为ˆθ,即
12
ˆ=(,,,)n T X X X θ,称为参数θ的估计量。
对样本的一组观测值
12(,,
,)n x x x ,统计量T 的值12
ˆ=(,,,)n T x x x θ称为参数θ的估计值。
点估计的问题就是要找一个作为待估参数θ的估计量
12(,,
,)n T X X X 的问题。
点估计的方法:数字特征法(矩估计法)、极大似然估计法、Bayes 估计法、最小二乘法等等。
第2节 矩估计法
矩估计法由英国统计学家K.Person 在20世纪初提出,基本思想就是用样本矩去估计相应的总体矩。
理论依据是大数定律。
例1 设总体X 服从参数为θ的指数分布,即
11,0
(,)0,0x e x f x x θ
θθ
-⎧>⎪=⎨⎪≤⎩
12,,,n X X X 为取自总体
X 的样本,求参数θ的矩估计量。
例2 设总体2
~(,)X N μσ,12,,,n X X X 为取自总体X 的样本,求
参数2,μσ的矩估计量。
例3 设总体2
~(0,)X N σ,12,,,n X X X 为取自总体X 的样本,求
参数2σ的矩估计量。
例4 设总体~(,)X U a b ,12,,,n X X X 为取自总体X 的样本,求参数,a b 的矩估计量。
ˆˆ=a X b X =+ 例5 设总体~()X P λ,12,,,n X X X 为取自总体X 的样本,求参数
λ的矩估计量。
第3节 极大似然估计法
极大似然估计法最初由德国数学家C.F.Gauss 于1821年提出,英国统计学家R.A.Fisher 于1922年再次提出极大似然的思想,并探讨了它的性质。
假设总体~(4,)X B p ,其中参数p 未知,现抽取容量为3的样本123,,X X X ,如果样本观察值为1、2、1,我们来估计参数p 。
极大似然估计法的步骤:
● 对一组样本12,,,n X X X ,写出似然函数12(,,,)n L x x x ; ● 将似然函数12(,,,)n L x x x 取对数12ln (,,,)n L x x x ;
● 令ln =0L θ
∂∂,求出ˆθ,即为θ的极大似然估计。
例1 设总体~()X P λ,12,,,n X X X 为取自总体X 的样本,求参数λ的极大似然估计量。
例2设总体~(,)X B m p ,12,,,n X X X 为取自总体X 的样本,求参数p 的极大似然估计量。
例3 设总体2
~(,)X N μσ,12,,,n X X X 为取自总体X 的样本,求
参数2,μσ的极大似然估计量。
例4 设总体~(,)X U a b ,12,,,n X X X 为取自总体X 的样本,求参数,a b 的极大似然估计量。
定理 1 设ˆθ是参数θ的极大似然估计,若()g τθ=存在唯一的反函
数,则ˆˆ()g τ
θ=是()g τθ=的极大似然估计。
例5 设总体
2~(,)X N μσ,2,μσ未知,12,,,n X X X 为取自总体X 的样本,求{1}P X >的极大似然估计。
第4节 Bayes 估计
Bayes 公式
1
()()(|)
(|)()()(|)
i i i i n
i i i P A B P A P B A P A B P B P A P B A ===∑
例 对以往数据分析结果表明,当机器调整良好时,产品的合格品率为90%,而当机器发生故障时产品的合格品率为30%。
每天早上机器开动时机器调整得良好的概率为75%。
试求已知某日早上第一件产品是合格品时机器调整得良好的概率是多大?
解:设事件A 为“产品为合格品”,事件B 为“机器调整得良好”。
则()0.75,()0.25,(|)0.9,(|)0.3P B P B P A B P A B ====
|0.750.9(|)0.90||0.750.90.250.3
P B P A B P B A P B P A B P B P A B ⨯===+⨯+⨯()()()()()()
一、决策理论的基本概念
统计决策理论是著名统计学家A.Wald (1902-1950)在20世纪40年代建立起来的(Wald.A. Statistical decision function. New York :John Wileysons , 1950.中译本:王福宝译,统计决策函数,上海教育出版社,1963)。
统计决策理论与经典统计学的差别在于是否涉及后果。
经典统计学重在推断上,而不考虑用在何处以及效果如何,统计决策理论引入损失函数,用来度量效益的大小,评价统计推断结果的优劣。
Bayes 分析是英国学者T.Bayes (1702-1761)首先提出,在20世纪后半叶迅速发展,它与经典统计学的差别在于是否使用先验信
息。
1、决策问题与决策空间
例 1 设甲乙两人进行一种游戏,甲手中有三张牌,分别标有
123θθθ、、,乙手中也有三张牌,分别标有123a a a 、、。
游戏规则是双
方各自独立地出牌,按下表记甲的得分与乙的失分:
描述这类决策问题有三要素:
● 状态集={}θΘ:状态集表示自然界或社会所有可能状态的全体。
也称为参数集或参数空间。
如本例的123={}θθθΘ、、。
● 行动集{}A a =:行动集表示决策者可能采取的行动的全体。
也称为决策集或决策空间。
如本例的123{}A a a a =、、
● 收益函数(,)Q a θ:收益函数表示自然界或社会处于状态θ时,决策者采取行动a 所获的收益。
如本例的得分。
当Θ和A 都是有限集时,(,)Q a θ成为收益矩阵。
(1)先验信息:人们在过去对自然界或社会的各种状态所获得的信息。
(2)样本的信息:从与自然界或社会的状态θ有关的环境中抽样,从获得的样本中了解当今状态θ的最新信息。
如果在一个决策问题中只利用样本的信息,这种问题称为统计决
策问题;如果在一个决策问题中不仅利用样本的信息,还利用先验信息,这样的问题称为Bayes 决策问题。
例2 某工厂生产的产品每100件装成一箱运交顾客,在向顾客交货前面临如下两个行动:
a 1:一箱中逐一检查; a 2:一箱中都不检查
若工厂选择行动a 1,则可保证交货时每件产品都是合格品。
但因每件产品检查费为0.8元,为此工厂要支付检查费80元/箱;若工厂选择行动a 2,工厂可免付每箱检查费80元,但顾客发现不合格品时,按合同不仅允许更换,而且每件还要支付12.5元的赔偿金。
2、损失函数
(,)()(||)L a g a θλθθ=-
()0λθ>且有限,它反映决策中由于θ的不同,即使同一个偏差
||a θ-造成的危害性常不一样,而()g t 是t 的非降函数。
最常见的形
式是(,)()||k
L a a θλθθ=-,k 取非负整数。
常用的损失函数:
(1)平方损失函数:2
(,)()L a a θθ=- 或加权平方损失函数:2
(,)()()L a a θλθθ=-
(2)线性损失函数:01
(),(,)(),k a a L a k a a θθ
θθθ-≤⎧=⎨->⎩
其中,0 k 和1k 是两个大于0的常数,它们的选择常反映行动a 低于状态θ和高于状态θ的相对重要性。
当01k k =时,得绝对损失函数(,)||L a a θθ=- 若0 k 和1k 是θ的函数,则称为加权线性损失函数
01()(),(,)()(),k a a L a k a a θθθ
θθθθ
-≤⎧=⎨->⎩
(3)0-1损失函数:0,||(,)1,||a L a a θε
θθε-≤⎧=⎨->⎩
这里的ε是正数。
这种损失函数常在两行动决策问题中使用,这里的0和1并不是损失的大小,是有无损失之意。
类似的有
0,||(,),||a L a k a θε
θθε-≤⎧=⎨->⎩
或0,
||(,)(),||a L a k a θεθθθε-≤⎧=⎨->⎩
(4)多元二次损失函数:当θ和a 是多维向量时
(,)()()T L a a A a θθθ=--
其中,1212(,,,),(,,,),T T
n n a a a a A θθθθ==为n n ⨯阶正定矩阵。
在实际问题中,我们的愿望是选择一个估计量a ,使损失函数(,)L a θ达到最小。
3、决策函数
4、风险函数 (,)[(,)]R T E L a θθ= 二、Bayes 估计量 1、先验分布
例3 英国统计学家Savage.L.J.曾考虑如下两个问题: (1)一位常饮牛奶和茶的妇女声称,她能辨别先倒进杯子里的是茶还是牛奶,对此作了十次试验,全都成功;
(2)一位音乐家声称,他能从一页乐谱辨别出是海顿(Haydn )的还是莫扎特(Mozart )的作品,在十次试验中全部成功。
2、后验分布
(1)在经典统计中总体X 的分布依赖于参数θ和X 的取值 x ,即总体X 的分布为()f x θ,,而Bayes 学派认为函数()f x θ,是在随机变量θ给定某个值时X 的条件分布,所以应该记为(|)f x θ (2)根据参数θ的先验信息确定θ的先验分布()πθ
(3)从总体X 中抽取样本12,,,n X X X ,则样本的联合分布为
121
(,,
,|)(|)(|)n
n i i f x x x f x f x θθθ∆
===∏
这个联合分布综合了样本的信息,又称为似然函数。
(4)考虑参数θ的先验信息,即把参数θ的先验信息()πθ与样本的信息12(,,,|)n f x x x θ综合到一起,得到样本与参数的联合分布
1
(,)()()(|)()n
i i h x f x f x θθπθθπθ===∏|
(5)将样本的信息分离出来。
如果用(|)x πθ表示θ的后验分布,
()g x 表示样本12(,,,)n X X X X =的分布,它是样本的分布,与θ无关,即
()g x 不含θ的任何信息,亦即分解(,)h x θ,分解成
1212(,)(|,,
,)(,,
,)(|)()n n h x x x x g x x x x g x θπθπθ==
其中, ()(,)d ()()d g x h x f x θθθπθθΘ
Θ
==⎰⎰|(连续型)
或 ()()()g x f x θπθΘ
=∑|(离散型)
从而得到后验分布
()()
(|)=
()
f x x
g x θπθπθ| (|)x πθ是离散性还是连续型,取决于θ的先验分布是离散性还是连续
型。
从上述5个过程不难看出,当从总体获得样本后,公式把人们对θ的认识从()πθ调整到(|)x πθ,这个调整过程可以形象地表示为 先验信息⊕样本信息=后验信息 即 ()()=(|)f x x πθθπθ⊕|
例4 设总体~(1,)X B p ,其中参数p 未知,且设p 在区间(0,1)上服从均匀分布,12,,,n X X X 是来自总体X 的样本,试求p 的后验分布。
解:(1)X 的条件概率函数为
1(|)(1),
0,1,01x x f x p p p x p -=-=<<
(2)p 的先验分布为
1,
01()0,
p p π<<⎧=⎨
⎩其它
(3)样本12,,,n X X X 的联合分布为
1
1
1121
1
(,,
,|)(|)(1)
(1)
n
n
i
i
i
i
i i n n
x n x x x n i i i f x x x p f x p p p p
p ==-
-==∑∑==-=-∏∏(4)样本12,,,n X X X 和p 的联合分布为
11
(1)01(,)(|)()0,
n n
i i i i x n x p p p h x p f x p p π==-⎧∑∑⎪-<<==⎨
⎪⎩,其它
(5)样本12,,,n X X X 的分布为
11
1
1
1
1
1
1
1
(1)(1)
()!()!
()(1)
d (1)!
(2)
n
n
i
i
i i n n
n n
i i i i x n x i i i i n n
i i i i x n x x n x g x p p p n x n x ==-
======Γ+Γ-+-∑
∑=-=
=
+Γ+-+∑∑∑∑⎰∑∑注意,B 函数
1
110
()()
(,)(1)d ,(1)!()
m n m n m n x x x n n n m --ΓΓB =-=
Γ+=Γ+⎰
所以p 的后验分布
1
11()()(|)=(1)()
n n
i
i i i x n x f x p p p x C p p g x ππ==-
-∑∑=-|
其中,
1
1
()!()!
(1)!
n n
i i i i x n x C n ==-=+∑∑
即p 的后验分布为1
1
(,)n
n
i i i i x n x ==B -∑∑
3、Bayes 估计量
定理 设总体X 的概率密度函数为(,)f x θ,其中参数θ未知,且假
定θ的先验分布为πθ(),12,,,n X X X 为取自总体X 的样本,如果损
失函数为2
(,)()L T T θθ=-,则对样本的任何一组观察值12,,,n x x x ,
Bayes 估计量为()(|)(|)d T x E x x θθπθθ+∞
-∞==⎰
例5设总体~(1,)X B p ,其中参数p 未知,且设p 在区间(0,1)上服从均匀分布,12,,,n X X X 是来自总体X 的样本,给定损失函数
2(,)()L p T p T =-,
试求p 的Bayes 估计量。
解:由例4知,p 的后验分布为1
1
1(|)=(1)n
n
i
i
i i x n x p x C p
p π==-
-∑
∑-
由定理知,
1
1
11
11
()(|)(|)d (1)
d n
n
i
i
i i x n x T x E p x p p x p C
p
p p π==+
-
-∑∑===-⎰⎰
1
1
1
1
1
(2)(1)
(3)
n n
i i i i n n
i i i i x n x C x n x -====Γ+Γ-+=Γ+-+∑∑∑∑
1
1
1
1
(1)!()!1
(2)!
2
n n
n
i i
i
i i i x n x x C n n -===+-+==++∑∑∑ 即p 的Bayes 估计量为1
1
ˆ2n
i
i x
p n =+=+∑
例6设总体~(,1)X N μ,其中参数μ未知,且设μ服从(0,1)N ,
12,,
,n X X X 是来自总体X 的样本,对损失函数2
(,
)()L T T μμ=-,
试求μ的Bayes 估计量。
解:(1)X 的条件概率函数为
2
()2
1(|),
(,)x f x x μμ--
=
∈-∞+∞
(2)μ的先验分布为
2
2
1),(,)μπμμ-
=
∈-∞+∞(
(3)样本12,,,n X X X 的联合分布为
121
(,,
,|)(|)n
n i i f x x x f x μμ==∏
2
21
1
()()22
1
=n
i i i x n
x n
i e
e
μμ=--
--
=∑
=
(4)样本12,,,n X X X 和μ的联合分布为
2211()22+1
1(,)(|)()n
i i x n h x f x e
μμμμπμ=---∑
==
(5)样本12,,,n X X X 的分布为
2211
11
2+1
22
()(,)d d n
i i n x nx n g x h x e
e
μμμμμ=+--
++∞+∞-∞
-∞
∑
==⎰
⎰
222111
1exp{[]}
21n
n i i n
x x n ==
--+∑ 所以μ的后验分布
()()
(|)=()
f x x
g x μπμπμ|
2221=
exp{[]}
21n n i i x x n =--+∑
2221=1[]}
21n i i n x x n =--+
∑
2
1()}21
n nx n μ+--+ (6)由定理
211()(|)exp{()}d =211
n n nx n
T x E x x n n μμμμ+∞-∞++==
--++⎰ 对样本的任意一组观察值,μ的Bayes 估计量为
1
1ˆ()11n
i i n T X X X n n μ====++∑ 第5节 估计量的优良性
一、无偏性
定义1 设12
ˆˆ=,,,n X X X θθ()是参数θ的一个估计量,若ˆE θ
θ= 则称ˆθ为θ的一个无偏估计量,否则称ˆθ是有偏的。
如果ˆlim n
E θθ→∞
=,则称ˆθ
为θ的渐近无偏估计量。
例 1 设总体X 的均值EX μ=,方差2=DX σ,12,,,n X X X 为取自于总体X 的样本,证明样本均值X 为μ的无偏估计,样本方差2S 为2σ的
无偏估计,但样本的二阶中心矩2
21
1()n i i B X X n ==-∑是2σ的有偏估计,
但是2σ的渐近无偏估计。
证明:由第1章的第2节的定理1和定理2,知道EX EX μ==,22ES σ=所以样本均值X 为μ的无偏估计,样本方差2S 为2σ的无偏估计。
22211
111()[()]{[()]}1n n i i
i i n E B E X X E X X n n n ==-=-=--∑∑
22
11{}n n E S n n
σ--==
所以样本的二阶中心矩2
21
1()n i i B X X n ==-∑是2σ的有偏估计。
由于22
2
1lim ()lim =n n n E B n
σσ→∞→∞-= 所以样本的二阶中心矩2
21
1()n i i B X X n ==-∑是2σ的渐近无偏估计。
例2 设总体~()X P λ,其中参数λ未知,12,,,n X X X 为取自总体X 的样本,求λ与2λ的无偏估计量。
解:EX λ=,EX EX λ==,说明X 是λ的无偏估计量。
又DX λ=,2ES DX λ==
说明2
21
1=()1n
i i S X X n =--∑也是λ的无偏估计量。
从而X 和2S 都是λ的无偏估计量。
由于
22
22111
111()[][][]n n n i i i i i i E A E X E X E X n n n ======∑∑∑
2
2211
11[()][]n n i i i i DX EX n n λλλλ===+=+=+∑∑ 2222()()()E A X E A E X λλλλ-=-=+-=
所以2A X -是2λ的一个无偏估计量。
又
222222()()()E A S E A E S λλλλ-=-=+-=
所以22A S -是2λ的一个无偏估计量。
从而2A X -和22A S -都是2λ的无偏估计量。
这说明一个参数的无偏估计不是唯一的。
二、有效性与有效估计量
定义2 设总体~(,)X F x θ,其中参数θ是未知参数,12,,,n
X X X 为取自总体X 的样本,112ˆ,,,n X X X θ()与212
ˆ,,,n X X X θ()都是
参数θ的无偏估计量,若12ˆˆD D θθ≤,则称1ˆθ比2ˆθ更有效。
即在θ的无偏估计量中,方差越小越有效。
例 3 设总体X 的期望EX μ=,方差2=DX σ,12,,,n X X X 为取自于总体X 的样本,若(1,2,,)i a i n =为已知常数,且1
1n
i i a ==∑,证明1
n
i i
i a X =∑
为μ的无偏估计量,并问在这些无偏估计量中,当(1,2,,)i a i n =为何值时最有效。
解:11
1
1
[][]n
n
n
n
i i i i i i i i i i E a X a E X a a μμμ========∑∑∑∑
这说明1
n
i i i a X =∑为μ的无偏估计量。
22
2
2
2
1
1
1
1
[][]i i
n n n
n
i i i
i i i i i D a X a D X a a
σσ
=======∑∑∑∑
记 2
2
1
1
(1)i
n
n
i i i F a
a σ
λ===+-∑∑
令2
1
20,1,2,,1i i n
i i F a i n
a a σλ=∂⎧=+==⎪∂⎪⎨⎪=⎪⎩∑
可得121
n a a a n
====
所以当121
n a a a n ==
==时,1
[]n i i i D a X =∑最小,说明在诸无偏估计量
1
n
i i i a X =∑中,11n
i i X X n ==∑是最有效的。
在有效性的定义中,我们说若12ˆˆD D θθ≤,则称1ˆθ比2ˆθ更有效。
一个自然的问题是,在θ的无偏估计中是不是永远都只有“更好”而没有“最好”呢?
正则性条件:设总体X 的概率密度函数为(,)f x θ(离散型时为概率分布律),(,)f x θ关于未知参数θ可导,且θ的取值与(,)f x θ的非零区域无关,即{|(,)0}x f x θ>与θ无关,对(,)f x θ的积分和微分可交换。
为了将问题一般化,考虑参数θ的函数()q θ的无偏估计量
12,,,n T X X X ()的方差,并假定()q θ关于θ可导。
设12,,
,n X X X ()为取自总体~(,)X f x θ的样本,则
12,,,n X X X ()的联合密度函数为
121
(,,
,,)(,)n
n i i f x x x f x θθ==∏
由于12,,,n T
X X X ()是()q θ无偏估计,所以
121212
1
[,,
,,,
,(,)d d d n
n n i n
i E T X X X T x x x f x x x x θ+∞+∞-∞
-∞
=∏⎰⎰
()]=()
=()q θ
两边对θ求导,有
121211
ln (,),,
,(,)d d d ()
n
n
i n i n i i f x T x x x f x x x x q θθθθ+∞+∞-∞
-∞
==∂'=∂∑∏⎰
⎰
()引进记号 1
l n (,)
n
i i f X Y θθ=∂=∂∑ 则上式可以写成
()=()E YT q θ'
而
l n (,)l n (,)
=(,)d i i i i f X f x EY E
f x x θθθθ
θ
+∞-∞∂∂
=∂∂⎰
(,)
d [(,)d ]0
i i i i f x x f x x θθθ
+∞+∞-∞
-∞∂'===∂⎰
⎰ 所以 1
l n (,)
0n
i i f X EY E
θθ
=∂==∂∑
于是(,)()()()Cov T Y E YT ETEY E YT q θ'=-==
由柯西---许瓦兹不等式
2(,)()()C o v T Y D T D Y
≤
2
[()]()()q D T D Y θ'≤ 2
11
ln (,)ln (,)[]n
n i i i i f X f X DY D E θθθθ==∂∂==∂∂∑∑
记2
ln (,)()=[
]i f X I E θθθ
∂∂,则()DY nI θ=
2
[()]()q DT nI θθ'≥
若()q θθ=,2[()]1=()()q DT nI nI θθθ'≥
2
[()]()
q DT nI θθ'≥和1()DT nI θ≥称为Rao--Cramer 不等式。
()I θ称为参数θ的信息量。
定义 3 如果()q θ的无偏估计12,,,n T
X X X ()达到了
Rao--Cramer 不等式的下界,即2
[()]=()q DT nI θθ',则称12,,
,n T X X X ()为()q θ的有效估计量。
定义 4 设12,,,n T
X X X ()为()q θ的一个无偏估计量,称
2
[()]()()()q e T nI D T θθ'=为12,,,n T
X X X ()的有效率。
性质 22
l n (,
)
()=
[]
i f X I E θθθ∂-∂
例4 设总体X 服从参数为θ的指数分布,概率密度函数为
11,0
(,)0,0x e x f x x θ
θθ
-⎧>⎪=⎨⎪≤⎩
试求θ的信息量()I θ。
解:1
ln (,)ln f X X
θθθ
=--
,
2dln (,)11
d f X X θθθθ
=-+
22
23d l n (,)12
d f X X θθθθ
=-
2
2232d ln (,)121
()=[
]+=
d f X I E θθθθθθθ-=-
例5 设总体2
~(,)X N μσ,其中参数μ未知,
2σ已知,12,,,n X X X 为取自总体X 的样本,证明1
1n
i i X X n ==∑为μ的有效估计量。
例6 设总体~(,)X B m p ,12,,,n X X X 为取自总体X 的样本,p 为
未知参数,证明1
X m
是p 的有效估计量。
定理 设总体X 的概率函数(,)f x θ(连续型时为概率密度函数,离
散型时为概率函数)关于θ可导,其中θ为未知参数,
{|(,)0}C x f x θ=>与θ无关,12,,,n X X X 为取自总体X 的样本,如果
ln (,)
()[()()]i i f X a T X q θθθθ
∂=-∂
其中()a θ与()q θ只与θ有关,则121
1(,,,)()n
n i i T X X X T X n ==∑为()q θ的
无偏有效估计量。
例7 设总体2
~(,)X N μσ,其中参数μ未知,
2
σ已知,12,,,n X X X 为取自总体X 的样本,求参数μ的无偏有效估计量。
例8 设总体~(,)X B m p ,12,,,n X X X 为取自总体X 的样本,p 为未知参数,求参数p 的有效估计量。
三、相合性(一致性)
定义 设12(,,,)n n n T T X X X =是未知参数θ的估计序列,如果{}n T 依概率收敛于θ,即对任意的0ε>,有
lim {||}1n n P T θε→∞
-<=
则称n T 是θ的相合估计或一致估计。
定理 设n T 是θ的一个估计量,若lim ()n n
E T θ→∞
=,且l i m ()n n D T →∞
=,则n T 是θ的相合估计。
切比雪夫不等式的推广:22
1
{||}[()]P X a E X a εε-≥≤-
四、充分统计量
定义 设总体X 的分布函数为(,)F x θ,12,,,n X X X 为取自总体X 的样本,12(,,,)n n n T T X X X =为一个统计量。
当给定T t =时,若样本的条件分布与θ无关,即
1212(,,,|)(,,,|)n n f x x x T t f x x x T t θ===
(离散型时为概率函数,连续型时为密度函数),则称T 为θ的充分统计量。
定理1(因子分解定理) 设总体X 的概率密度函数或概率函数为
(,)f x θ,其中参数θ未知, 一个统计量12(,,,)n T T X X X =为θ的充分
统计量的充要条件为12,,,n X X X 的联合概率密度(或概率)函数
121(,,
,)(,)n
n i i f x x x f x θθ==∏,可以分解为
12121
(,,
,)(,)(,,
,(,)n
n i n i f x x x f x u x x x v T θθθ===∏,)
其中12(,,
,n u x x x )是仅依赖于12,,,n x x x 而与θ无关的非负函数,v 是
θ与12(,,
,)n T x x x 的非负函数。
例1 设总体~(1,)X B p ,12,,,n X X X 为取自总体X 的样本,p 为未知参数,证明1n
i i Y X ==∑是p 的充分统计量。
例2 设总体~()X P λ,其中参数λ未知,
12,,,n X X X 为取自总体X 的样本,求参数λ的充分统计量。
例3 设总体~(,1)X N μ,其中参数μ未知,12,,,n X X X 为取自总体X 的样本,求参数μ的充分统计量。
定理2 设12(,,,)n T T X X X =为θ的充分统计量,()f t 是单值可逆函数,则()f T 也是θ的充分统计量。
第6节 参数的置信区间
一、参数的置信区间的定义
定义1 设θ是未知参数,对于给定的(01)αα<<,若由样本构造的两个统计量112(,,,)n T X X X 和212(,,,)n T X X X ,且12T T <,使
12{}1P T T θα<<≥-,对一切θ,则称1α-为置信水平,称随机区间
12T T (,)是参数θ的置信水平为1α-的双侧置信区间,1T 和2T 分别称为
置信水平为1α-的双侧置信区间的置信下限和置信上限。
定义 2 对于给定的(01)αα<<,若由样本构造的统计量
12(,,
,)u n T X X X ,使{}1u P T θα<≥-,称随机区间u T -∞(,)是参数θ的
置信水平为1α-的单侧置信区间,
u T 称为置信水平为1α-的单侧置信上限。
若由样本构造的统计量12(,,,)l n T X X X ,使{}1l P T θα>≥-,称随机区
间l T ∞(,+)是参数θ的置信水平为1α-的单侧置信区间,l T 称为置信
水平为1α-的单侧置信下限。
二、正态总体参数的置信区间 1.单正态总体参数的置信区间
设12,,,n X X X 为取自于正态总体2
~(,)X N μσ的样本,样本均值和
样本方差分别为11n i i X X n ==∑,22
1
1()1n i
i S X X n ==--∑ 求μ和2σ的置信区间。
(1)μ的置信区间
①若2σ已知,μ
的置信区间为/2X z α±
②若2
σ未知,μ
的置信区间为/2(1)X n α±
-
例1设总体2
~(,0.25)X N μ,其中参数μ未知,124,,,X X X 为取自
总体X 的样本,对样本进行观察,得一组观察值为 6.92 7.34 7.26 6.88,求参数μ的置信水平为0.95的置信区间。
解:μ的置信水平为0.95的置信区间为
/20.0250.025(,)( 1.96, 1.96)
X z X z X z X X α==+
(0.245,0.245)X X =-+
(0.245,0.245)(7.100.245,7.100.245)(6.855,7.345)
x x -+=-+=例2 从某商店一年来的发票存根中随机抽取26张,计算得平均金额78.5元,样本标准差为20元。
假设发票金额数服从正态分布
2~(,)X N μσ,其中μ和2
σ未知,试求该商店一年来发票平均金额
数μ的0.90的置信区间。
解:μ的0.90
的置信区间为/2(1)X n α-
/20.05(1)78.5(25)78.5 1.7081(71.8,85.2)
x n α-==±
=
(2)2σ的置信区间
①若μ已知,2σ的置信区间为2
2
1
1
2
2/21/2()
()(,
)()
()
n
n
i i i i X X n n ααμμχχ==---∑∑
②若μ
未知, 2σ的置信区间为22
22/21/2
(1)(1)(,)(1)(1)n S n S n n ααχχ-----
例3 某汽车电池制造商声称其生产的电池平均寿命为3年,标准差为1年,这些电池中有5个使用寿命为1.9 2.4 3.0 3.5 4.2年。
试求总体方差2σ的0.95的置信区间,并判定制造商声称=1σ是否有效。
假定电池寿命近似服从正态分布。
(1)=3μ已知;(2)μ未知。
解:(1)=3μ已知,2σ的0.95置信区间为2
21
1
22
/21/2
()
()(
,
)()
()
n
n
i
i
i i X
X
n n ααμμχχ
==---∑∑
5
5
2
2
2
2
1
1
1
1
2
2
22/21/2
0.025
0.975
()
()
(3)
(3)
(,
)(,
)()
()
(5)
(5)
n
n
i
i
i
i
i i i i x x x x n n ααμμχχ
χ
χ
====-----=∑∑∑∑
1.57 1.57=(,)=(0.122, 1.889)1
2.8330.831
σ的0.95
置信区间为
1.37)
该区间包含=1σ,可以认为制造商声称=1σ有效。
(2)μ
未知,2σ的置信区间为22
22/21/2
(1)(1)(,)(1)(1)n S n S n n ααχχ-----
2222
/21/2(1)(1)40.81540.815
(,)(,)(0.293, 6.736)11.1430.484(1)(1)
n s n s n n ααχχ---⨯⨯==-- σ
的0.95置信区间为
2.592)=
也可以认为制造商声称=1σ有效。
例5 从一批电视显像管中随机抽取6个测试其使用寿命,(单位:Kh ):15.6 14.9 16.0 14.8 15.3 15.5,假设显像管寿命
2~(,)X N μσ,
其中μ和2
σ未知,试求
(1)μ的0.95单侧置信下限; (2)2σ的0.90单侧置信上限。
解:(1)因为2
σ
未知,选取X t =
由(1)}1X P t n αα<-≥-
得μ的0.95
单侧置信下限为(1)X n αμ=-下
(1)15.35 2.0214.98x n αμ=-
-==下
即μ的0.95单侧置信区间为
14.98+)∞(, (2)因为μ未知,选取2
2
22
(1)~(1)n S n χχσ-=
-
2
212
(1){
(1)}1n S P n αχασ-->-≥-
得2σ的0.90单侧置信上限为2
2
2
1(1)(1)n S n ασχ--=-上
22
21(1)50.2030.631.61(1)
n s n ασχ--⨯===-上
即2σ的0.90单侧置信区间为(0,0.63) 2.双正态总体均值差和方差比的置信区间 设112,,
,n X X X 是来自于总体
211(,)N μσ的简单随机样本,X 和2
1S 分别是样本均值和样本方差;212,,
,n Y Y Y 是来自于总体2
22(,)
N μσ
的简单随机样本,Y 和2
2S 分别是样本均值和样本方差。
且两样本相互独立。
(1)12μμ-的置信区间
①若2
21
2
σσ,已知,12μμ-
的置信区间为/2X Y α-±
②若2212=σσ未知,12μμ-的置信区间为
/212(2)X Y n n -±
+- 例 5 两台机床生产同一型号的滚珠,从甲机床生产的滚珠中抽取8
个,得2
115.05,0.0457x s ==;从乙机床生产的滚珠中抽取9个,得2
214.9,0.0575y s ==,设两台机床生产的滚珠直径(毫米)服从正态
分布。
(1)若两台机床生产的滚珠直径的标准差分别是12=0.18=0.24σσ,,求12μμ-的0.90的置信区间。
(2)若2
2
12=σσ未知,求12μμ-的0.90的置信区间。
解:(1)2212σσ,已知,12μμ-
的置信区间为/2X Y α-±
/2
15.0514.9 1.645x y α-±
=-±
=(-0.018,0.318)
(2)2
2
12=σσ未知,12μμ-的置信区间为
/212(2)X Y n n -±
+-
/212(2)x y n n -±
+-
=15.0514.09 1.7531-±
=(-0.044,0.344)
(2)方差比2
2
12/σσ的置信区间 ①12μμ,已知,2
2
12/σσ的置信区间为
1
1
2
2
2
221211
12
2
/2121/21212121
1
()
()1
1
(
,
)
(,)
(,)()()n n i i i i n n i i i i n X n X F n n F n n n Y n Y ααμμμμ==-==--⋅
⋅
--∑∑∑∑
1
1
2
2
2
2212111/2212
2
/212121211()()1
=(
,
(,))
(,)
()
()
n n i i i i n n i i i i n X n X F n n F n n n Y n Y ααμμμμ====--⋅
⋅--∑∑∑∑
②12μμ,未知,2
2
12/σσ的置信区间为
221122/2121/2122211(,)(1,1)(1,1)
S S F n n F n n S S αα-⋅⋅----
2211/22122/21222
1=(,(1,1))(1,1)S S F n n F n n S S αα⋅⋅---- 例6两台机床生产同一型号的滚珠,从甲机床生产的滚珠中抽取8个,
得2
115.05,0.0457x s ==;从乙机床生产的滚珠中抽取9个,得2
214.9,0.0575y s ==,设两台机床生产的滚珠直径(毫米)服从正态
分布。
(1)若12=15.0=14.9μμ,,求2
2
12/σσ的0.90的置信区间。
(2)若12μμ,未知,求2
212/σσ的0.90的置信区间。
解:(1)12μμ,已知,2
2
12/σσ的置信区间为
1
1
2
2
2
22121112
2
/2121/212121211()
()1
1
(
,
)
(,)
(,)()()n n i i i i n n i i i i n X n X F n n F n n n Y n Y ααμμμμ==-==--⋅
⋅
--∑∑∑∑
1
1
2
2
2
22121112
2
/2121/21212121
1()
()1
1
(
,
)
(,)
(,)()()n n i i i i n n i i i i n x n x F n n F n n n y n y ααμμμμ==-==--⋅
⋅
--∑∑∑∑
90.34190.34
(
, 3.39)(0.257,2.819)80.46 3.2380.46
⨯⨯=⋅⋅=⨯⨯ (2)12μμ,未知,2
2
12/σσ的置信区间为
221122/2121/2122211(,)(1,1)(1,1)S S F n n F n n S S αα-⋅⋅---- 221122/2121/2122211(,)(1,1)(1,1)s s F n n F n n s s αα-⋅⋅----
0.045710.04571
=(
,)=0.227 2.9650.0575 3.50.05750.268
⨯⨯(,) 三、非正态总体参数的置信区间
对小样本情况,求参数的置信区间不很容易。
在大样本情形,一般最好样本容量30n ≥,可由中心极限定理得到样本函数近似服从正态分布,从而得到参数的近似置信区间。
设总体X 的分布中含有一个未知参数θ,且2(),()EX DX μθσθ==,
12,,
,n X X X 为取自总体X 的样本,由中心极限定理知,当n
充分大时,
()
~(0,1)n
i
X
n X Z N μθ-=
=
∑近似
对给定的置信水平α,由
/2/2{}1X P Z Z ααα-<
<=-
可得θ的近似的置信区间。
例7 一工厂生产的显像管的寿命X 服从参数为λ的指数分布,其中
0λ>为未知参数,从中抽取5个测试其使用寿命(单位:Kh ),经计
算得样本均值为15.4x =,试求数学期望EX 的置信水平为0.95的置信区间。
解:,0()0,0x e x f x x λλ-⎧>=⎨≤⎩
,1
=EX λ λ的置信区间为22
1/2/2(10)
(10)
(
,
)1010X
X
ααχχ-
22
1/2/2(10)
(10)
3.24720.483
(
,
)(,)10101015.41015.4
x
x
ααχχ-=⨯⨯ 1
=
EX λ
的置信区间为1015.41015.4
(
,)(7.518,47.428)20.483 3.247
⨯⨯= 例8 设总体~(1,)X B p ,其中参数p 未知,12,,,n X X X 是来自于总体
X 的样本,试求p 的置信水平为0.95的置信区间。
解:1
~(,)n
i i X nX B n p ==∑
~01
n
i
X
np
N -∑近似
(,)
,
~01X N 近似
(,)
由/2/2{}1X P Z Z ααα-<
<=-
得p 的置信水平为1α-的近似置信区间为12p p (,),
其中
/22122/21=
(22()
p nX Z n Z αα+±+,
这个公式非常复杂,因此常选
*~01X Z N =
近似
(,)
由此得p 的置信水平为1α-的近似置信区间为
/2X α±
例9 设一大批产品的合格品率为p ,从中任取100件,经检验有92件合格品,试求p 的0.95置信区间。
解:p 的置信水平为0.95的近似置信区间为
0.025=0.92 1.96=0.870.97X ±±(,)。