点估计的评价标准
点估计的评价标准
第三讲点估计的评价标准副教授主讲教师叶宏在前两讲中我们介绍了两种点估计法,发现了点估计的不唯一性,即对于同一个未知参数,不同的方法得到的估计量可能不同,于是提出问题:应该选用哪一种估计量?用何标准来评价一个估计量的好坏?常用标准(1) 无偏性(3) 一致性(2) 有效性这一讲我们介绍估计量是随机变量,对于不同的样本值会得到不同的估计值. 我们希望估计值在未知参数真值附近摆动,而它的期望值等于未知参数的真值. 这就导致无偏性这个标准.(1) 无偏性θθ=)ˆ(E 则称为的无偏估计.θˆθ),,(ˆ1n X X θ设是未知参数的估计量,若θ.真值∙∙∙∙∙∙∙∙∙∙∙∙∙∙),,,(21n X X X 是总体X 的样本,证明: 不论X 服从什么分布(但期望存在),是k μ的无偏估计量.证∑∑====n i k i n i k i k X E n X n E A E 11)(1)1()(例设总体X 的k 阶矩)(k k X E =μ存在,因而ni X E k k i ,,2,1)( ==μ由于k k n n μμ=⋅⋅=1∑==n i k i k X n A 11特别地样本二阶矩∑==n i i X n A 1221是总体二阶矩是总体期望E ( X ) 的X 样本均值无偏估计量)(22X E =μ的无偏估计量例设总体X 的期望与方差存在,X 的样本为),,,(21n X X X (1) 不是D ( X )的无偏估计; ∑=-=n i i n X X n S 122)(1(2) 是D ( X ) 的无偏估计. ∑=--=n i i X X n S 122)(11原样本方差样本修正方差2221)(σσ≠-=nn S E n ()22σ=S E 2221lim ()lim n n n n E S nσσ→∞→∞-==是D ( X )的渐进无偏估计2n S无偏估计以方差小者为好, 这就引进了有效性的概念12ˆˆ,θθ一个参数往往有不止一个无偏估计, 若θ都是参数的无偏估计量,我们可以比较的大小来决定谁更优.21)ˆ(θθ-E 和22)ˆ(θθ-E 211)ˆ()ˆ(θθθ-=E D 由于222)ˆ()ˆ(θθθ-=E D (2) 有效性(2) 有效性D ( )< D ( )2ˆθ1ˆθ则称较有效.2ˆθ1ˆθ都是参数的无偏估计量,若有),,(ˆ11n X X θ),,(ˆˆ122n X X θθ==1ˆθ设和θ*1ˆˆ()()D D θθ≤*ˆθ是的任一无偏估计.θ则称为的最小方差无偏估计.θθˆ若321232111254131ˆ)(31ˆX X X X X X ++=++=μμ都是μ的无偏估计量1ˆμ最有效例如X ~ N ( μ,σ2) ,样本是.,,321X X X μμμ==)ˆ()ˆ(21E E 22217225)ˆ(31)ˆ(σμσμ=<=D D 推广i n i i X c ∑==1ˆμ是μ的无偏估计量X X c i ni i 中∑==1ˆμ最有效11n i i c ==∑当时ˆlim ()1n P θθε→∞-<=则称θˆ是参数θ的一致(或相合)估计量.(3) 一致性(相合性)即,0>∀ε一致性估计量仅在样本容量n 足够大时,才显示其优越性.定义设是总体参数θ),,,(ˆˆ21n X X X θθ=θˆ的估计量. 若n →∞时, 依概率收敛于θ,关于一致性的常用结论样本k 阶矩是总体k 阶矩的一致性估计量由大数定律可证明矩法得到的估计量一般为一致估计量为方便鉴别有效性,引进定理: 1lim (),lim ()(,,0)n n nn n n n X X E D θθθθθθ→∞→∞=== 设是未知参数的估计量,若定理 n θθ则是的一个相合估计量.212221~(,),,,1()1n n i i X N X X X S X X n μσσ==--∑ 设总体是的样本则是的一致例估计量.22211()1ni i S X X n σ==--∑是的一致估计量.证明2222(1)(1)1,2(1)n S n S E n D n σσ⎛⎫⎛⎫--=-=- ⎪ ⎪⎝⎭⎝⎭()222lim (),lim 0n n E S D S σ→∞→∞⇒==222(1)~(1)n S n χσ-- ()()42222,1E S D S n σσ=∴=-由卡方分布性质知。
《教育统计学》复习题及答案
《教育统计学》复习题及答案一、填空题1.教育统计学的研究对象是.教育问题。
2.一般情况下,大样本是指样本容量.大于30 的样本。
3.标志是说明总体单位的名称,它有.品质标志和数量标志两种。
4.统计工作的三个基本步骤是:、和。
5.集中量数是反映一组数据的趋势的。
6.“65、66、72、83、89”这组数据的算术平均数是。
7.6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是。
8.若某班学生数学成绩的标准差是8分,平均分是80分,其标准差系数是。
9.参数估计的方法有和两种。
10.若两个变量之间的相关系数是负数,则它们之间存在。
11.统计工作与统计资料的关系是和的关系。
12.标准差越大,说明总体平均数的代表性越,标准差越小,说明总体平均数的代表性越。
13.总量指标按其反映的内容不同可以分为和。
二、判断题1、教育统计学属于应用统计学。
()2、标志是说明总体特征的,指标是说明总体单位特征的。
()3、统计数据的真实性是统计工作的生命()4、汉族是一个品质标志。
()5、描述一组数据波动情况的量数称为差异量数。
()6、集中量数反映的是一组数据的集中趋势。
()7、在一个总体中,算术平均数、众数、中位数可能相等。
()8、同一总体各组的结构相对指标数值之和不一定等于100%。
()9、不重复抽样误差一定大于重复抽样误差。
()10. 一致性是用样本统计量估计统计参数时最基本的要求。
()三、选择题1.某班学生的平均年龄为22岁,这里的22岁为( )。
A.指标值B.标志值C.变量值D.数量标志值2.统计调查中,调查标志的承担者是( )。
A.调查对象B.调查单位C.填报单位D.调查表3.统计分组的关键是( )。
A.确定组数和组距B.抓住事物本质C.选择分组标志和划分各组界限D.统计表的形式设计4.下列属于全面调查的有( )。
A.重点调查B.典型调查C.抽样调查D.普查5.统计抽样调查中,样本的取得遵循的原则是( )。
2.3点估计的评价标准(1)
均方误差 ˆ 评价一个估计 X 好坏的一个度量标准是该估 ˆ ˆ 计 X 偏离实际参数的绝度偏差 X 。 ˆ 偏离值 X 小的估计比偏离值大的要好。 但是,这个标准在实际中不可取,因为: ˆ 1) X 是随机变量,因为样本X 是随机的; ˆ 2) 是未知的,算不出 X 的具体数值。
例2.3.1 设总体X 的期望和方差分别为, 2, X 1 , , X n是总体X 的一个样本,则样本均值X 和样本方差S 2分别是参数, 2的无偏估计。 证明:因为 1 1 n 1 n E X E X i EX i n , n n i 1 n i 1 1 n 2 1 n ES 2 E ( X i X )2 E X i nX 2 n 1 i 1 n 1 i 1 1 n EX i2 nEX 2 n 1 i 1 2 1 2 2 2 n( ) n n 1 n 2
* 2
但是,对估计的仅有无偏性 要求是不够的。因为 1)无偏估计不一定存在。 2)偏估计不一定存在 设X B n, ,0 1,参数g 没有无偏估计。 若T ( X )是g 的无偏估计,则ET ( X ) g ( ). n i 1 n i 而 T (i ) 1 ET ( X ) g ( ) , 1 i 0 i n n i n i 1 即 T (i ) 1 1 0, i 0 i 由于上式左端是关于的一个n+1次多项式,无论
i 1 i 1 n n
ˆ 能否确定ci使得估计量的方差最小? ˆ ˆ 解:首先是的无偏估计,因为E=。 ˆ ˆ 其次 Var 2 ci2 , 欲使 Var 达到最小,只需在
点估计的评价标准
例6.2.7 均匀总体U(0, )中 的极大似然估计是x(n) 由于 ,所以x(n)不是 的无偏估计,而是 的渐近无偏估计。经过修偏后可以得到 的一个无 偏估计: 。且
另一方面,由矩法我们可以得到 的另一个无偏 估计 ,且 由此,当n>1时, 比 有效。
6.2.4
均方误差
无偏估计不一定比有偏估计更优。 评价一个点估计的好坏一般可以用:点估计值 与参 数真值 的距离平方的期望,这就是下式给出的均方 误差
量序列,相合性就是 依概率收敛于,所以证明
估计的相合性可应用依概率收敛的性质及各种
大数定律。
在判断估计的相合性时下述两个定理是很有用的。 定理6.2.1 设ˆn ˆn ( x1 , , x n ) 是 的一个估计量, ˆn ˆn ( x1 , , x n ) 若 lim E ˆn , lim Var ˆn 0,
由定理6.2.1可知,x(n)是 的相合估计。
由大数定律及定理6.2.2,我们可以看到: 矩估计一般都具有相合性。比如:
样本均值是总体均值的相合估计;
样本标准差是总体标准差的相合估计;
样本变异系数是总体变异系数的相合估计。
6.2.2
无偏性
定义6.2.2
设 ˆ ˆ ( x , , x ) 是 的一个估计, 1 n 的参数空间为Θ,若对任意的∈Θ,有
均方误差是评价点估计的最一般的标准。我们希望 估计的均方误差越小越好。
注意到
MSE ( ) Var( ) ( E )
ˆ )=Var( ˆ )+(E ˆ - )2 . MSE(
2
(1)
若 ˆ是 的 无 偏 估 计 , 则 M SE ((ˆ ) Var) (ˆ ), ) Var( ˆ M SE
7-3点估计的优劣标准
数理统计
设总体X的均值 例1 设总体 的均值
未知, 未知,
X 1 ,… , X n是取自
n 1 n 的样本, 于X的样本,则统计量 X = ∑ X i , Y = ∑ ai X i , X 1 的样本 n i =1 i =1 n 的无偏估计量, 为常数, 均为 的无偏估计量,其中 a1,…, an为常数,且 ∑ ai = 1
未知, 未知,
( X 1 ,… , X n )为来自 的样本,则 X 是 为来自X的样本 的样本,
的优效估计量. 的优效估计量.
数理统计
估计量的无偏性,有效性是在样本容量 一定的 估计量的无偏性,有效性是在样本容量n一定的 条件下来考虑的,实践证明,样本容量 越大越能精 条件下来考虑的,实践证明,样本容量n越大越能精 确地估计未知参数,因此自然想到,随着样本容量 确地估计未知参数,因此自然想到,随着样本容量n 的无限增大, 的无限增大,一个好的估计量与被估计的参数任意接 近的可能性会越大.由此得出一致性的概念. 近的可能性会越大.由此得出一致性的概念.
这就产生无偏性这个标准是未知参数的估计量若数理统计例如用样本均值作为总体均值的估计时虽无法说明一次估计所产生的偏差但这种偏差随机地在0的周围波动对同一统计问题大量重复使用不会产生系统偏差设总体x的均值未知是取自于x的样本则统计量均为的无偏估计量其中为常数且数理统计所以无偏估计以方差小者为好这就引进了有效性这一概念都是参数的无偏估计量我们可以比较数理统计二有效性都是参数的无偏估计量若对任意且至少对于某个上式中的不等号成立设总体x的均值未知是取自于x的样本则统计量作为的估计量更有效当总体的概率密度函数关于参数且微分和积分次序可以交换时有以下罗克拉默不等式
数理统计
常用的几条标准是: 常用的几条标准是:
62 点估计的评价标准
通过此例题,我们看到,要证明一个估计量具有相 合性,必须证明它依概率收敛,这有时很麻烦.因此,我们 下面我们不加证明的给出一个相合性的判定定理.
17
ˆ 是的 定 理 6 .1 设 个 估 计 量 ,若 n 一 ˆ ) ˆ )0 lim E ( , 且 lim V a r (
2 C (X X ) i 1 i i 1 n 1
为Var (X)的无偏估计. 分析 需选择C,使
2 E [ C ( X X )] V a rX ( ) i 1 i i 1 n 1
6
2 2 C E ( X X ) E [ C ( X X ) ] 解 i1 i i 1 i
证
k k 故有 E ( X ) E ( X ) ,i 1 , 2 , , n . i k
因为 X , X , , X 与 X 同分布, 1 2 n
1n k k. 即 E ( A ) E ( X k i) n i 1
故 k 阶 样 本 矩 A 是 k 阶 总 体 矩 的 无 偏 估 计 . k k
16
故B A X 2 2
2
2 2 依概率收敛于 E ( X ) [ E ( X )] 2,
所 以 B 是 的 相 合 估 计 量 . 2 n 又 lim 1 , n n 1 n 2 2 所 以 S B 也 是 的 相 合 估 计 量 . n 2 n 1
2
V a r ( X X ) V a r ( X ) V a r ( X ) 2 V a r ( X ) i 1 i i 1 i
E ( X X ) E ( X ) E ( X ) 0 i 1 i i 1 i
点估计的评价标准共40页
估计量
Ch7-49
例2 设总体 X 的期望 与方差存在, X 的
样本为 (X1,X2,,Xn) (n > 1) . 证明
(1)
Sn2
1 n
n i1
(Xi
X)2不是 D(
X
)的无偏估量;
(2) S2n11in1(Xi X)2是 D( X ) 的无偏估计量.
证 前已证 n 1i n1(Xi X)2n 1i n1Xi2X2 E ( X i ) E ( X ) ,D ( X i ) D ( X ) 2 E (X)E (X),D (X)2 n
则
Ak
1 n
n i1
Xik
是 k 的无偏估计量.
证 由于 E (Xik)k i1,2,,n因而
E(Ak)E(1 ni n1Xik)1 ni n1E(Xik)
1nnk k
Ch7-48
特别地
样本均值 X 是总体期望 E( X ) 的 无偏估计量
样本二阶原点矩
A2
1 n
n i1
Xi2是总体
二阶原点矩 2 E(X2) 的无偏
i1
i1
n
n
Ch7-58
(2) D(ˆ1) ci2D(Xi)2 ci2
i1
i1
n
2n
而
1
ic
ic 2
2
ic jc
i1 i1
1i jn
n
n
ci2 (ci2c2 j)n ci2
i1
1ijn
i1
n
i 1
c
2 i
1 n
D(ˆ)1n2D(ˆ1)
结论 算术均值比加权均值更有效.
Ch7-59
Ch7-57
第六章假设检验1
H0 为不真
正确概率 1-
第二类错误概率
拒绝 H0 第一类错误概率
正确概率1-
【注意】(1) 两类错误概率的关系 两类错误是互相关联的,当样本容量n 固定时,
一类错误概率的减少将导致另一类错误概率的增加。 一般采取的原则:在控制犯第一类错误的概率的
条件下, 尽量使犯第二类错误 小。 要同时降低两类错误的概率、(或者要在不变
(3)多个随机变量关系假设 如 H0:它们有相同分布 H0:它们相互独立
10
统计假设: 关于总体(参数,分布,特征等)的各种假设.
参数假设—总体分布函数形式已知,对其所包含的参数所作 的假设,如(1) 非参数假设--总体分布函数形式未知,对分布函数形式或特 征所作的假设,如(2)(3)
原(零)假设(null hypothesis) H0 :在假设检验中,根据 需要所作的基本假设,是整个检验推理的出发点。如(1)中H0 备择(对立)假设 (alternative hypothesis) H1:指原假设 H0 的对立假设。如(1)中H1。
n
L L( x1, x2 ,...xn;1,...,m ) p( xi;1,...,m ) i 1
1
三、区间估计、置信度、置信区间
四、常见类型总体均数及总体比率的区间估计
X Z / 2 n
S X Z /2 n
x t / 2(n 1)
S n
pˆ Z / 2
p (1 p) n
2
利用从总体抽样得到的样本 来估计总体的某些参数。
假设检验
单侧假设检验
双侧假设检验
拒绝域位于数轴一端, 即V0 =(-∞,a]或[b,+ ∞) 假设形如:
H0: ≥0 H1: <0 (完备的) H0: =0 H1: <0 (不完备)
点估计的几种方法
如果某统计量 ˆ ˆ(x1, x2满, 足, xn)
L ˆ max L( ),
则称 是ˆ 的极(最)大似然估计,简记为MLE
(Maximum Likelihood Estimate)。
求极大似然估计通常分如下两种情形:
1. 总体X 的取值范围与未知参数无关; 2. 总体X 的取值范围与未知参数有关。
现做了n次试验,观测到三种结果发生的次数 分别为 n1 , n2 , n3 (n1+ n2+ n3 = n)。求的最大 似然估计。
例6.1.7 设(X1,X2,…,Xn)是来自正态总体X~N(μ,σ2)的一 个样本,μ,σ2未知,求μ,σ2的极大似然估计。
解 设(x1,x2,…,xn)为样本(X1,X2,…,Xn)的一个观察值,则
现在我们来介绍一类重要的统计推断问题
参数估计问题是利用从总体抽样得到的信息 来估计总体的某些平均体重
估计废品率 估计湖中鱼数
估计平均降雨量
… …
第六章 参数估计
§6.1 点估计的几种方法 §6.2 点估计的评价标准 §6.3 最小方差无偏估计 §6.4 贝叶斯估计 §6.5 区间估计
ˆjˆj j(aj1(,a1 ,,ak ),, ak )j,1,j ,k1,, , k,
其中a jaj n1in1n1 xiijn1 xij为j阶样本原点矩.
矩法的步骤:
设总体X的分布为F(x;θ1,θ2,…,θk),k个参数θ1,θ2,…,θk待 估计,(X1,X2,…,Xn)是一个样本 。
Xk
1 n
n j 1
X
k j
从中解出方程组的解,记为 ˆ1,ˆ2,,ˆk
则 ˆ1,ˆ2,,ˆk 分别为参数θ1,θ2,…,θk的矩估计。
6.2点估计的评价标准
Var ( x( n ) ) ?
三、有效性
ˆ ˆ 比较参数 的两个无偏估计量1 和 2 , 如果 ˆ 在样本容量 n 相同的情况下 , 1 的观察值在真值 ˆ ˆ ˆ 的附近较 2 更密集 , 则认为1 较 2 有效 .
由于方差是随机变量取值与其数学期望的 偏离程度, 所以无偏估计以方差小者为好.
又因为 E ( X 2 ) D( X ) [ E ( X )]2
2 2
2
n
2,
2
所以 E ( ) E ( A2 X ) E ( A2 ) E ( X ) ˆ
n 1 2 2 2 , 所以 是有偏的. ˆ n
( n 1) 2 ˆ E ( ) n
2
n 2 若以 乘 , 所得到的估计量就是无 偏的. ˆ n 1
(这种方法称为无偏化).
n n 2 E E ( 2 ) 2 . ˆ ˆ n 1 n 1 1 n n ( X i X 2 ), 因为 2 S 2 ˆ n 1 i 1 n 1
n n n n
ˆ 则 n 是的相合估计
n
证明 lim E(ˆn ) , 当n充分大时, | E(ˆn ) |
ˆ ˆ 如果有 | n - E( n ) | ,则 2
n
ˆ lim P(| n | ) 0
X 总是总体 X 的数学期望 1 E ( X ) 的无偏 估计量.
练习:299页1(1)
例3
对于均值 , 方差 2 0 都存在的总体, 若
1 n , 2 均为未知, 则 2 的估计量 2 ( X i X )2 ˆ n i 1 是 有偏的(即不是无偏估计). 1 n 2 证 2 X i X 2 A2 X 2 , ˆ n i 1 因为 E ( A2 ) 2 2 2 ,
6-2点估计的评价标准
的总体, 例12. 设x1,x2 ,… ,xn为抽自均值为 的总体,考
里 表示去掉第i个样品 这 i表示去掉第 个样品
后,对其余n-1个样品所求的样 对其余 个样品所求的样 本均值. 本均值.
显然两个估计都是的无偏估计.再计算其方差: 显然两个估计都是的无偏估计.再计算其方差:
设一个试验有三种可能结果, 例3. 设一个试验有三种可能结果, 其发生的概率分别为
p1 = θ 2 , p2 = 2θ (1 θ ) , p3 = (1 θ )2 ,
现做了n次试验, 现做了 次试验,观测到三种结果发生的次数分别 次试验 则用频率替换法得到的θ 为n1, n2, n3,则用频率替换法得到的θ的估计为相 合估计. 合估计. ( P295)
2
1 ∑c > n i=1
2 i
n
1 2 Var() = σ < Var(1 ) n 例如 X ~ N( ,σ 2 ) , ( x 1, x 2 ) 是一个样本.
2 1 1 = x1 + x2 3 3 1 3 2 = x1 + x2 4 4 1 1 3 = x1 + x2 2 2
都是 的无偏估ቤተ መጻሕፍቲ ባይዱ量
i k
的无偏估计( 有偏). 注1: x和 2是和σ2的无偏估计(而S*2有偏).因此 S n
称为无偏方差. S2称为无偏方差. 样本二阶原点矩a2 =
n 1 2 1 n * 2 前面已证 E(x) = E(S ) = E ∑(xi x) = σ n n i=1 n 1 2 2 E(S ) = E (xi x) = σ 2 ∑ n 1 i=1
二、无偏性
(Unbiasssed Estimate)
无偏性的意义是:用一个估计量去估计未知参数θ 无偏性的意义是:用一个估计量去估计未知参数θ, 有 时候可能偏高,有时候可能偏低 但是平均来说它等于θ 有时候可能偏低, 时候可能偏高 有时候可能偏低 但是平均来说它等于θ.
16-第16讲 点估计的方法及其评价标准ppt
例4 设样本X1,X2,…,Xn来自总体X, 其密度函数为
求q 1,q 2的矩估计. 解 由
得方程组:
解此方程组,得到矩估计量:
二、最大似然估计法 若总体X属离散型, 其分布律P{X=x}=p(x;q), qQ的形式为 已知, q为待估参数, Q是q的可能取值范围. 设X1,X2,...,Xn 是来自X的样本, 则X1,X2,...,Xn的联合分布律为
2), m, s2为未知参数, x ,x ,...,x 是来自X的一个样 设 X ~ N ( m , s 1 2 n 例5
本值. 求m, s2的最大似然估计值. 解 X的概率密度为
θ)dθ f(x ;
i i1
n
其值随q的取值而变化. 与离散型的情况一样,
ˆ q 取q 的估计值 使概率(1.3)最大, 考虑函数
L( q ) L( x1 , x 2 , , x n ;q ) f ( xi ;q )
i 1 n
的最大值. 这里 L(q )称为样本的似然函数. 若
参数估计
理解总体、个体、简单随机样本和统计量的概念,掌握 样本均值、样本方差及样本矩的计算。 了解卡方分布、t分布和F分布的定义及性质,了解分布 分位数的概念并会查表计算。 了解正态总体的某些常用统计量的分布。 理解点估计的概念。 掌握矩估计法和极大似然估计法。 了解估计量的评选标准(无偏性、有效性、一致性)。 理解区间估计的概念。 会求单个正态总体的均值和方差的置信区间。 了解两个正态总体的均值差和方差比的置信区间。
第七章
参数估计
第二节 点估计的方法 第三节 点估计的评价标准
一、矩估计法 二、最大似然估计法 三、无偏性 四、有效性 五、一致性
对给定的统计问题,在建立了统计模型以后,我们的任务就
6.2点估计的评价标准
6.2点估计的评价标注我们已经看到,点估计有各种不同的求法,为了在不同点估计间进行比较选择,就必须对各种点估计的好坏给出评价标准.数理统计中给出了众多的估计量评价标准,对同一估计量实用不同的评价标准可能会得到完全不同的结论,因此在评价某一个估计好坏时首先要说明是在哪一个标准下,否则所论好坏则毫无意义.但不管怎么说,有一个基本标准时所有的估计都应该满足的,它是衡量一个估计是否可行的必要条件,这就是估计的相合性,我们就从相合性开始。
6.2.1 相合性我们知道,点估计是一个统计量,因此它是一个随机变量,在样本量一定的条件下,我们不可能要求它完全等同于参数的真实取值。
但如果我们有足够的观测值,根据格里文科定理,随着样本量的不断增大,经验分布函数逼近真实分布函数,因此完全可以要求估计量随着样本量的不断增大而逼近参数真值,这就是相合性,严格定义如下:定义6.2.1 设θ∈Θ为未知参数,()12,,,n n n x x x θθ∧∧= 是θ的一个估计量,n 是样本容量,若对任何一个0ε>,有()ˆlim 0nn P θθε→∞->= 则称ˆnθ为参数θ的相合估计。
相合性被认为是对估计的一个最基本的要求,如果一个估计量,在样本量不断增大时,它都不能把被估参数估计到任意指定的精度,那么这个估计值是很值得怀疑的。
通常,不满足相合性要求的估计一般不予考虑。
证明估计的相合性一般可应用大数定律或直接由定义来证。
若把依赖于样本量n 的估计量ˆn θ看作一个随机变量序列,相合性就是ˆnθ依概率收敛于θ,所以证明估计的相合性可应用依概率收敛的性质以及各种大数定律。
例6.2.1 设12,,x x 是来自正态总体()2,N μσ的样本,则有辛钦大数定律及依概率收敛的性质知:x 是μ的相合估计;*2s 是2σ相合估计;2s 也是2σ的相合估计。
由此可见参数的相合估计不止一个。
在判断估计的相合性时下述两个定理是很有用的。
概率统计6.2__点估计的评价标准
6.2 点估计的评价标准1,总体X U (θ,2θ)是未知参数,又1x ,…..,nx为取自该总体的样本,_x 为样本均值。
(1)证明 θ =23x --是参数θ的无偏估计和相和估计;(2)求θ的最大似然估计,它是无偏估计吗?是相和估计吗? 解 (1)总体X U(θ,2θ),则 2123(),()2nE X Var X θθ==-,从而123()2E x θ=, ()212Var x n θ=于是,E (θ )=_2()3E x =θ,这说明θ =_23x 是参数θ的无偏估计。
进一步,224()091227Var n nθθθ=⨯=→这就证明了θ也是θ的相和估计。
(2)似然函数为(1)()()(2),1()n nL I x x θθθθ=<<<显然()L θ是θ的减函数,且θ的取值范围为()(1)2n xx θ<<,因而θ的最大似然估计为()2n mlexθ=下求mleθ的均值与方差,由于()n x 的密度函数为1()()n f x n x θθ-=-。
1θ=1()n n nx n θ--,(2x θθ<<),故2112(1)021()(),1()n n n nnn E xdx t dt n x n x t θθθθθθθ--+==+=+-⎰⎰2221222482()(1)(2)(1)()n n nE dx n n n x n x xθθθθ-++==++-⎰22()(2)(1)n n Var n x n θ=++,从而()121()()22(1)n n E E n n x θθθ+==→→+∞+ ,这说明mleθ不是θ的无偏估计,而是θ的渐进无偏估计。
又22()1()()0()44(2)(1)n n V Var n n x n θθ==→→+∞++, 因而mleθ是θ的相和估计。
2,设123,,x x x 是取自某总体的容量为3的样本,试证下列统计量都是该总体均值μ的无偏估计,在方差存在时指出哪一个估计的有效性最差?(1) 1123111233x x x μ=++ (2) 2123111333x x x μ=++ (3) 3123112663x x x μ=++ 解 先求三统计量的数学期望,1123111111()()()(),236236E E E E x x x μμμμμ=++=++= 2123111111()()()()333333E E E E x x x μμμμμ=++=++= 3123112112()()()()663663E E E E x x x μμμμμ=++=++= 这说明它们都是总体均值μ的无偏估计,下面求它们的方差,不妨设总体的方差为2σ则222211231111117()()()()4936493618V a r V a r V a r V a r x x x μσσσσ=++=++=222221231111111()()()()9999993Var Var Var Var x x x μσσσσ=++=++=222231231141141()()()()36369363692Var Var Var Var x x x μσσσσ=++=++= 不难看出(1,)(,)L M x L M x += 213()()()Var Var Var μμμ<<。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
N(u1,σ )和 (u2 ,σ ) N
2 1 2 2
本问题实际是检验甲组总体的均值是 否比乙组总体的均值偏小? 若是,这个差异范围有多大? 前一问 题属假设检验,后一问题属区间估计.
Ch7-72
由于两个总体的方差未知,而甲组 的样本容量较小,因此采用大样本下两 总体均值比较的U—检验法似乎不妥. 故 采用方差相等 (但未知) 时,两正态总体 均值比较的t—检验法对第一个问题作出 回答. 为此 , 利用样本先检验两总体方差 是否相等,即检验假设
Fα / 2 (5,45) = F0.95(5,45) =1/ F0.05(45,5) = 0.22 1
19 F的观察值F0 = 2 = 1.41, 得 16 F0.95 (5,45) < F0 < F0.05 (5,45)
2
Ch7-74
未落在拒绝域内,故接受 H0 . 即可认为 两总体方差相等. 下面用 t — 检验法检 验 1 是否比 2 显著偏小? 即检验假设
求θ 的极大似然估计量, 并判断它是否达到 方差下界的无偏估计量. 解 由似然函数
L(θ ) = 1
θ
e n
i=1
∑xi
θ
n
ln L(θ ) = nlnθ i=1
∑xi
n
θ
∑xi 令 d n i=1 ln L(θ ) = + 2 =0 dθ θ θ
n
Ch7-63
1n θ = ∑xi = x n i=1
Ch7-67
1 θ e 例8 X ~ f (x;θ ) = θ 0
x
x > 0, x≤0
θ > 0 为常数
则 X 是θ 的无偏、有效、一致估计量. 证 由例7 知 X 是θ 的无偏、有效估计量.
lim D( X ) =lim
n→∞
θ
2
n→∞
n
=0
所以 X 是 θ 的一致估计量, 证毕.
Ch7-68
当 D(θ) = D0 (θ ) 时, 称 θ 为达到方差下界的 无偏估计量, 此时称 θ 为最有效的估计量, 简称有效估计量.
例7 设总体 X 的密度函数为
x 1 θ e f (x;θ ) = θ 0
Ch7-62
x > 0, x ≤0
θ > 0 为常数
(x1, x2 ,, xn ) 为 X 的一个样本值.
一致性估计量仅在样本容量 n 足够大时,才显示其优越性.
Ch7-66
关于一致性的两个常用结论 1. 样本 k 阶矩是总体 k 由大数定律证明 阶矩的一致性估计量. 2. 设θ 是 θ 的无偏估计 量, 且 lim D(θ ) = 0, 则 用切贝雪夫不 n→∞ 等式证明 是θ 的一致估计量. θ 矩法得到的估计量一般为一致估计量 在一定条件下, 极大似然估计具有一致性
H0 : u1 = u2;
T= X1 X 2 Sw 1 1 + n1 n2
H1 : u1 < u2
~ t(n1 + n2 2)
当 H0 为真时,检验统计量
Ch7-75
若 E(θ ) =θ 则称 θ是θ 的无偏估计量.
定义的合理性
我们不可能要求每一次由样本得到的 估计值与真值都相等,但可以要求这些估 计值的期望与真值相等.
Ch7-48
例1 设总体X 的 k 阶矩 k = E( X )存在 ( X1, X2 ,, Xn ) 是总体X 的样本,
k
证明: 不论 X 服从什么分布(但期望存在), 1 n k 则 Ak = ∑Xi 是 k 的无偏估计量. . n i=1 证 由于 E( Xik ) = k i = 1,2,, n 因而
2
故X 是达到方差下界的无偏估计量.
定义
一致性 设 θ = θ( X1, X2 ,, Xn ) 是总体参数θ
Ch7-65
的估计量. 若对于任意的θ ∈ Θ , 当n→ ∞时,
θ 依概率收敛于θ , 即 ε > 0, lim P(θ θ ) ≥ ε ) = 0
n→∞
则称θ 是总体参数θ 的一致(或相合)估计量.
1 n k 1 n k E( Ak ) = E( ∑Xi ) = ∑E( Xi ) n i=1 n i=1 1 = n k = k n
Ch7-49
特别地 样本均值 X 是总体期望 E( X ) 的 无偏估计量
1 2 样本二阶原点矩 A2 = ∑Xi 是总体 n i=1
n
二阶原点矩 2 = E( X ) 的无偏
=1 P( X1 > z)P( X2 > z)P( Xn > z)
Ch7-56
有效性
定义 设 θ1 =θ1( X1, X2 ,, Xn )
θ2 =θ2 ( X1, X2 ,, Xn )
都是总体参数θ 的无偏估计量, 且
D(θ1) < D(θ2 )
则称 θ1比 θ2更有效.
Ch7-57
1 n 1 n 2 2 2 证 前已证 ∑( Xi X ) = ∑Xi X n i=1 n i=1
E( Xi ) = E( X ) = , D( Xi ) = D( X ) = σ 2 σ E( X ) = E( X ) = , D( X ) =
n
2
Ch7-51
因而
1n 1n 2 2 2 E ∑( Xi X ) = ∑E( Xi ) E( X ) n i=1 n i=1 2 σ 2 2 2 = (σ + ) ( + ) n n 1 2 2 = σ ≠σ n 1 n 2 2 故 E ∑( Xi X ) = σ 证毕. n 1 i=1
∑(c
2 i
+ c ) = n∑c
2 j i=1
n
2 i
1 ∑c > n i=1
2 i
n
1 2 D() = σ < D(1) n
结论
算术均值比加权均值更有效. .
Ch7-60
例如 X ~ N( ,σ 2 ) , ( X 1 ,X 2 ) 是一样本.
2 1 1 = X1 + X2 3 3 1 3 2 = X1 + X2 4 4 1 1 3 = X1 + X2 2 2
Ch7-46
§7.2 点估计的评价标准
对于同一个未知参数,不同的方法得 到的估计量可能不同,于是提出问题 应该选用哪一种估计量? 应该选用哪一种估计量? 用何标准来评价一个估计量的好坏? 用何标准来评价一个估计量的好坏? (1) 无偏性 常用 标准 (2) 有效性 (3) 一致性
Ch7-47
无偏性 定义
H0 :σ = σ ;
2 1 2 2
H1 :σ ≠ σ
2 1
2 1 2 2
2 2
S 当 H0 为真时,统计量 F = ~ F(5,45) S
Ch7-73
拒绝域为
F ≤ Fα / 2 (5,45)或F ≥ F / 2 (5,45) 1 α 取α = 0.1 F / 2 (5,45) = F0.05(5,45) = 2.43 α
估计量 证
1 X ~ E θ E( X ) =θ
故 E( X ) = E( X ) = θ X 是θ 的无偏估计量.
令
FZ (z) =1 P( X1 > z, X2 > z,, Xn > z)
n
Z = m X1, X2 ,, Xn } in{
Ch7-55
z <0 0 nz =1 ∏(1 P( Xi ≤ z)) = 1 e θ i=1 z ≥0 z <0 0 nz f Z (z) = n θ e z ≥0 θ θ n Z ~ E E(Z) = E(nZ) =θ 即 n θ 故 n Z 是θ 的无偏估计量.
Ch7-52
例3 设 ( X1, X2 ,, Xm ) 是总体 X 的一个样本 , X~B(n , p) n > 1 , 求 p 2 的无偏估计量. 解 由于样本矩是总体矩的无偏估计量 以及数学期望的线性性质, 只要将未知 参数表示成总体矩的线性函数, 然后用样 , 本矩作为总体矩的估计量, 这样得到的未 知参数的估计量即为无偏估计量. 令 X = E( X ) = np 1 m 2 2 2 ∑Xi = E(X ) = (np) + np(1 p) m i=1
1n θ 的极大似然估计量为 θ = ∑ X = X i n i=1 它是θ 的无偏估计量.
1 n θ2 D(θ ) = D( ∑Xi ) = n i=1 n
而 ln f (x,θ ) = lnθ
2
x
2
Ch7-64
θ
ln f (x,θ ) = 1 + x θ θ θ2
2
ln f ( X,θ ) = E 1 + X = 1 E θ θ2 θ2 θ 2 1 θ = = D(X ) 2 ln f ( X,θ ) n nE θ
Ch7-70
智商 组别
人数
智商平均数
样本标准差
甲组 乙组
n 6
46
x 78
99
s
19 16
由此结果推断母亲嗜酒是否影响下一 代的智力?若有影响,推断其影响程度有 多大? 提示 前一问题属假设检验问题 后一问题属区间估计问题
Ch7-71
解 智商一般受诸多因素的影响.从而可以
假定两组儿童的智商服从正态分布.
Ch7-53
1 2 故 (n n) p = ∑Xi X m i=1
2 2
m
因此, p 2 的无偏估计量为
1 1 m 2 p = 2 ∑Xi X n n m i=1
1 ∑Xi (Xi 1) m i=1 = n(n 1)
m
∧ 2
例4 设总体 X 的密度函数为
Ch7-54