第七章参数估计内容提要
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i =1
i =1
d ln L = 0 ,求得似然函数 L 的极大值θˆ ,即为未知参数θ 的极大似然估计.其思 dθ
想是:在已知总体 X 概率分布时,对总体进行 n 次观测,得到一个样本,选取概
率最大的θ 值θˆ 作为未知参数θ 的真值的估计是最合理的.
(4)估计量的优劣标准
1)无偏性.设θˆ = θˆ( X1, X 2 ,Λ , X n ), E(θˆ) 存在,且 E(θˆ) = θ ,则称值θˆ 是 θ 的无偏估计量.否则称为有偏估计量.
计量.
2、参数的区间估计
设总体 X 的分布 F (x;θ ) 中含有未知参数θ ,若存在样本的两个函数
θ ( X1, X 2 ,Λ , X n ) 和θ ( X 1, X 2 ,Λ , X n ) ,使对于给定的α (0 < α < 1) ,有
P{θ < θ < θ} = 1 − α ,则随机区间(θ ,θ )称为参数θ 的置信度为1 − α 的双侧
~
F (n1 −1, n2
− 1) , σ 12
σ
2 2
的
置信度为1 − α 的置信区间为:
⎜⎛ ⎜ ⎝
S
2 2
⋅
Fα
2
S12 (n1 − 1, n2
− 1)
,
S
2 2
⋅
F1− α 2
S12 (n1 − 1, n2
−
1)
⎟⎞ ⎟ ⎠
.
5
解:由α = 0.02 ,查表得:
F0.01 (24,7)
=
6.07, F0.99 (24,7)
【例 3】某厂生产的钢丝.其抗拉强度 X ~ N (µ,σ 2 ) ,其中 µ,σ 2 均未知,从中
任取 9 根钢丝,测得其强度(单位:kg)为: 578,582,574.568,596,572,570,584,578
求总体方差σ 2 、均方差σ 的置信度为 0.99 的置信区间.
分析:由于参数
µ,σ
2
均未知,故取统计量
(n
− 1)S σ2
2
~
χ 2 (n − 1) ,从而得σ 2 、
σ 置信度为1 − α 的置信区间分别为
4
⎜⎛ ⎜ ⎝
(n − 1)S 2
χ
2
α
(n
−
1)
2
,
(n − 1)S
χ2 1− α
(n
−
2
2
1)
⎟⎞ ⎟ ⎠
、
⎜⎛ ⎜⎜⎝
(n − 1)S 2 ,
χ
2
α
(
n
−
1)
2
(n − 1)S
疑难分析
1、有了点估计为什么还要引入区间估计?
点估计是利用样本值求得参数θ 的一个近似值,对了解参数θ 的大小有一定
的参考价值,但没有给出近似值的精确程度和可信程度,因此在使用中意义不大.
而区间估计是通过两个(或一个)统计量θ ,θ (θ ≤ θ ) ,构成随机区间(θ ,θ ), 使此区间包含未知参数θ 的概率不小于事先设定的常数α (0 < α < 1) .1 − α 的值
2)有效性.设θˆ1 和θˆ2 均为参数θ 的无偏估计量,如果 D(θˆ1 ) < D(θˆ2 ) ,则称
估计量θˆ1 比θˆ2 有效.
3)一致性(相合性).设θˆ 为θ 的估计量,θˆ 与样本容量 n 有关,记为θˆ = θˆn ,
对于任意给定的 ε > 0 ,都有
lim
n→∞
P{θˆn
−θ
< ε} = 1 ,则称θˆ 为参数θ 的一致估
估计与极大似然估计. 分析:根据矩估计与极大似然估计方法直接进行估计.
解:(1)因为 E( X ) = 1/ p ,所以 p 的矩估计为 pˆ = 1/ X ;
n
∏ (2)似然函数为:L(x1, x2 ,Λ xn ; p) =
n
[ p(1 −
p) xi −1 ]
=
(1 −
∑ xi −n p) i=1
计.
分析:证明无偏性,可直接按定义: E(θˆ) = θ 进行证明. 证明:由 D(θˆ) = E(θˆ2 ) − (Eθˆ)2 ,及 E(θˆ) = θ (由题意), 而 D(θˆ) > 0 ,可以得出 E(θˆ2 ) = D(θˆ) + (Eθˆ)2 = θ 2 + D(θˆ) ≠ θ 2 , 因此,θˆ 2 不是θ 2 的无偏估计.
=
1 F0.01 (7,24)
=
0.2857
,所以,
σ
2 1
σ
2 2
的置信度
为 0.98 的置信区间为:(0.2152,4.5714).
6
χ2
1−
α 2
(n
−
2
1)
⎟⎞ ⎟⎟⎠
.
∑ ∑ 解: x
=
1 9
9 i =1
xi
=
578 , S 2
=
1 8
9 i =1
( xi
−
x)2
=
1 × 592 8
=
74 ,
α
=
0.01,
χ
2
α(nBiblioteka −1)=χ
2 0.005
(8)
=
21.955,
χ
2 1−
α
(n −1)
=
χ
2 0.995
(8)
= 1.344 ,
越大,则(θ ,θ )包含θ 真值的概率越大,即由样本值得到的区间(θ ,θ )覆盖 未知参数θ 的可信程度越大,而(θ ,θ )的长度越小,又反映估计θ 的精确程度
2
越高.所以区间估计不仅是提供了θ 的一个估计范围,还给出了估计范围的精确与
可信程度,弥补了点估计的不足,有广泛的应用意义.
2、怎样理解置信度1 − α 的意义? 置信度1 − α 有两种方式的理解. 对于一个置信区间(θ ,θ )而言, 1 − α 表示随机区间(θ ,θ )中包含未知
置信区间.
若有 P{θ < θ} = 1 − α 或 P{θ < θ} = 1 − α ,则定义 (θ , ∞) 或 (−∞,θ ) 为θ 的
置信度为1 − α 的单侧置信区间.
(1)单个正态总体均值与方差的置信区间(见表 7-1) 表 7-1
估计的 参数的 参数 情况
统计量
置信度为1 − α 的置信区间
而区间估计是通过两个或一个统计量使此区间包含未知参数的概率不小于事先设定的常数包含真值的概率越大即由样本值得到的区间覆盖未知参数的可信程度越大而的长度越小又反映估计的精确程度越高
第七章 参数估计
内容提要
1、参数的点估计及其求法 根据总体 X 的一个样本来估计参数的真值称为参数的点估计.
(1)估计量
根据总体 X 的一个样本 X 1, X 2 ,Λ , X n 构造的用其观察值来估计参数θ 真值
2
2
所以方差σ 2 的置信度为 0.99 的置信区间为:
⎜⎛ 592 , 592 ⎟⎞ ,即(26.96,440.48); ⎝ 21.955 1.344 ⎠
均方差σ 的置信度为 0.99 的置信区间为:
⎜⎜⎝⎛
592 , 21.955
592 1.344
⎟⎟⎠⎞
,即(5.19,20.99).
【例 4】设有两个正态总体, X
2
σ
2 1
+
σ
2 2
)
n1
n2
( X − Y − tα (n1 + n2 − 1) ⋅
2
1 n1
+
1 n2
,X
−Y
+
tα (n1
2
+
n2
− 1) ⋅
1+ 1) n1 n2
µ1 , µ 2 未知
⎜⎛ ⎜ ⎝
S
2 2
S 12 ⋅ F α ( n1 − 1, n 2
2
,
− 1)
S
2 2
S12 ⋅ F1− α ( n1 − 1, n 2
参数的概率不小于事先设定的数值1 − α . 对于区间估计而言,1 − α 表示在样本容量不变的情况下反复抽样得到的全部
区间中,包含θ 真值的区间不少于100(1 − α )% .
3、怎样处理区间估计中精度与可靠性之间的矛盾?
区间估计量(θ ,θ )的长度称为精度,1 − α 称为(θ ,θ )的可靠程度.长度 越短,精确程度越高;1 − α 越大,可靠程度越大.但在样本容量固定时,两者不
能兼顾.因此,奈曼指出的原则是,先照顾可靠程度,在满足可靠性
P{θ < θ < θ} = 1 − α 时,再提高精度.否则,只有增加样本容量,才能解决.
例题解析
【例 1】设总体 X 服从几何分布,分布律为:P{X = x} = (1 − p) x−1 p, x = 1,2,Λ ,
其中 p 为未知参数,且 0 ≤ p ≤ 1.设 X1, X 2 ,Λ , X n 为 X 的一个样本,求 p 的矩
的统计量θˆ( X1, X 2 ,Λ , X n ) 称为估计量,θˆ(x1, x2 ,Λ , xn ) 称为估计值.
(2)矩估计法 用样本矩作为相应的总体矩估计来求出估计量的方法.其思想是:如果总体中
有 k 个未知参数,可以用前 k 阶样本矩估计相应的前 k 阶总体矩,然后利用未知
参数与总体矩的函数关系,求出参数的估计量. (3)极大似然估计法
2
,
i =1
χ1−α 2 (n)
2
⎟ ⎟ ⎟
⎝
⎠
(2)两个正态总体均值差与方差比的置信区间(见表 7-2) 表 7-2
估计的 参数
参数的情况
置信度为1 − α 的置信区间
µ1 − µ2
σ
2 1
,σ
2 2
已知
σ 12
=
σ
2 2
未知
(X − Y − Z α ⋅
2
σ
2 1
+
σ
2 2
,
X
−Y
+ Zα
⋅
n1
n2
2
⎟⎞
−
1)
⎟ ⎠
σ 12
σ
2 2
µ1 , µ 2 已知
⎜⎛
n
∑ n2 ( X i − µ1)2
n
∑ n2 ( X i − µ1)2
⎟⎞
∑ ∑ ⎜
⎜ ⎜ ⎝
i =1
n
n1Fα (n1, n2 )
2
i =1
(Yi
−
µ2)2
,
n1
F 1−
α
2
i =1
(n1, n2 )
n i =1
(Yi
−
µ2 )2
⎟ ⎟ ⎟ ⎠
pn ,
i =1
3
n
∑ 取对数: ln L = ( xi − n) ln(1 − p) + n ln p , i =1
n
∑ 求导,令 d ln L
=
−(
i =1
xi
− n)
+
n
=
0,
dp
1− p
p
解得, p 的极大似然估计为 pˆ = 1/ X .
【例 2】设θˆ 是参数θ 的无偏估计,且有 D(θˆ) > 0 ,试证明θˆ2 不是θ 2 的无偏估
~
N (µ1,σ 12 ),Y
~
N
(
µ
2
,
σ
2 2
)
.分别从
X
和Y
抽
取容量为 n1 = 25 和 n2 = 8 的两个样本,并求得 S1 = 8, S2 = 7 .试求两正态总体
方差比
σ
2 1
σ
2 2
的置信度为
0.98
的置信区间.
分析:由于
µ1,
µ2
均未知,故取统计量
S12
S
2 2
/
σ
2 1
/
σ
2 2
⎜⎛ ⎜ ⎝
(n − 1) S 2
χ
2
α
(n
−
1)
2
,
(n − 1)S
χ2 1− α
(n
−
2
2
1)
⎟⎞ ⎟ ⎠
1
µ 已知
n
∑ (X i − µ)2
χ 2 = i=1 σ2
~ χ 2 (n)
∑ ∑ ⎜⎛ n ( X i − µ )2 n ( X i − µ )2 ⎟⎞
⎜ i =1
⎜ ⎜
χα 2(n)
设总体 X 的密度函数为 p(x,θ ) ,其中θ 为未知参数, X1, X 2 ,Λ , X n 是取
自总体 X 的样本, x1, x2 ,Λ , xn 为一组样本观测值,则总体 X 的联合密度函数称
n
n
∏ ∑ 为似然函数,记作 L = p(xi ,θ ) ,取对数 ln L = ln p(xi ,θ ) ,由
σ 2 已 U = X − µ ~ N (0,1)
µ知
σ 2 /n
σ2未
知
t = X − µ ~ t(n −1) S/ n
(X − Zα ⋅ σ , X + Zα ⋅ σ )
2
n
2
n
( X − tα (n − 1) ⋅ S , X + tα (n − 1) ⋅ S )
2
n
2
n
σ2
µ 未知
χ 2 = ( n − 1) S 2 ~ χ 2 ( n − 1) σ2