估计量的评价标准
第十八讲 估计量的评选标准及区间估计
第十八讲 估计量的评选标准及区间估计1. 估计量的评价标准判断估计量好坏的标准是:有无系统偏差;波动性的大小;伴随样本容量的增大是否是越来越精确,这就是估计的无偏性,有效性和相合性。
(1)无偏性设∧θ是未知参数θ的估计量,则∧θ是一个随机变量,对于不同的样本值就会得到不同的估计值,我们总希望估计值在θ的真实值左右徘徊,即其数学期望恰等于θ的真实值。
定义: 设∧∧=θθ(n X X X ,,,21 )是未知参数θ的估计量,若)(∧θE 存在,且对Θ∈∀θ有)(∧θE =θ,则称∧θ是θ的无偏估计量,称∧θ具有无偏性。
在科学技术中,)(∧θE -θ称为以∧θ作为θ的估计的系统误差,无偏估计的实际意义就是无系统误差。
例1:设总体X 的k 阶中心矩)(kk X E =μ)1(≥k 存在,),,,(21n X X X 是X 的一个样本,证明:不论X 服从什么分布,∑==n i ki k X n A 11是k μ的无偏估计量。
证明:n X X X ,,21与X 同分布,n i X E X E k k ki ,,2,1)()( ===∴μ第七章 参数估计第3节 估计量的评选标准从上一节得到:对于同一参数,用不同的估计方法求出的估计量可能不相同,用相同的方法也可能得到不同的估计量,也就是说,同一参数可能具有多种估计量,而且,原则上讲,其中任何统计量都可以作为未知参数的估计量,那么采用哪一个估计量为好呢?这就涉及到估计量的评价问题。
对定义的理解:设Θ∈θ是总体X 的分布参数,Θ∈∀θ,即服从某一分布形式的任意总体分布,参数θ的估计量∧∧=θθ(,,21X X n X , )(是简单随机样本的函数)的数学期望都等于θ。
k n i ki k X E n A E μ==∴∑=1)(1)(特别,不论X 服从什么分布,只要)(X E 存在,X 总是)(X E 的无偏估计。
例2:设总体X 的2)(,)(σμ==X D X E 都存在,且02>σ,若2,σμ均为未知,则2σ的估计量∑=-=ni i X X n 122)(1ˆσ是有偏的。
估计量的评选标准
p(x,θ ),g(θ )为待估参数,设 gˆ(X1)为 g(θ) 的
任意无偏估计,考虑
Var(gˆ(X1)) 的下界?
注:积分形式的 Cauchy 不等式:
uvdx 2 u2dx v2dx
1、 Fisher信息量的定义.
设总体 X 的概率函数为 p (x; ), ,且满足一定条件:
ln p(x;) x ln ln x! x!
I ()
E[ d ln
p( X ; )]2 d
E[ X
1]2
E(X )2 2
1
故 1 , nI () n
显然,Var(x) 1 ,
nI ()
所以, x是的有效估计.
例1 设 X1, X2,… Xn 是取自总体 X ~ N( 0,σ2) 的一个 样本,试证:
两者不同!
对于同一个未知参数,用不同的方法得到 的估计量可能不同,于是提出问题:
应该选用哪一种估计量? 用何标准来评价一个估计量的好坏?
ˆ( X1,..., Xn ) 越接近 越好!
如何刻画?
例:估计农大12级本科生高数的平均成绩:
方案一:设计一个抽样方案,取200个同学 的高数成绩,计算出他们的平均成绩,作为 真实成绩的估计; 方案二:随便取一个同学的成绩作为真实成 绩的估计。
1 n
Var (ˆ )
1
n
2
Var(ˆ1)
例如 X ~ N( , 2 ) , ( x 1, x 2 ) 是一个样本.
ˆ1
2 3
x1
1 3
x2
估计量的三个评价标准
估计量的三个评价标准估计量是统计学中非常重要的概念,它在实际应用中有着广泛的用途。
在进行估计量的评价时,我们通常会采用一些评价标准来衡量其优劣,从而选择最适合的估计量。
本文将从三个方面来介绍估计量的评价标准。
首先,我们来看估计量的无偏性。
无偏性是评价估计量优劣的重要标准之一。
一个估计量如果是无偏的,意味着在重复抽样的情况下,其期望值等于被估计的参数真值。
换句话说,无偏估计量不会出现系统性的偏差,能够在一定程度上准确地估计参数的真值。
因此,无偏性是评价估计量优劣的重要标准之一。
其次,我们来讨论估计量的一致性。
一致性是另一个重要的评价标准。
一个估计量如果是一致的,意味着当样本容量趋于无穷大时,估计量收敛于被估计的参数真值。
换句话说,一致估计量能够在大样本情况下稳定地接近参数的真值,具有较高的精确度和可靠性。
因此,一致性也是评价估计量优劣的重要标准之一。
最后,我们来考虑估计量的效率。
效率是评价估计量优劣的另一个重要标准。
一个估计量如果是有效的,意味着在所有无偏估计量中具有最小的方差,能够以最小的误差估计参数的真值。
换句话说,有效估计量具有最佳的精确度和准确性,能够在给定的样本容量下提供最优的估计结果。
因此,效率也是评价估计量优劣的重要标准之一。
综上所述,无偏性、一致性和效率是评价估计量优劣的三个重要标准。
在实际应用中,我们需要综合考虑这三个标准,选择最合适的估计量来进行参数估计。
只有在估计量具有较高的无偏性、一致性和效率时,我们才能够更准确地估计参数的真值,从而得到更可靠的统计推断结果。
因此,在统计学中,对于估计量的评价标准是非常重要的,它直接影响着我们对于总体参数的估计和推断的准确性和可靠性。
7.2(估计量的评价标准)
σ
2
~ χ 2 (n − 1)
可得
E (S ) = σ ,
2 2
2σ 4 2 D( S ) = n −1
由切比雪夫不等式, 由切比雪夫不等式,当 n → ∞,对任意 ε > 0,
P{| S 2 − σ 2 |< ε } ≥ 1 − D( S 2 )
ε2
2σ 4 = 1− →1 2 (n − 1)ε
n−1 n−1 2 E ( B2 ) = E(S ) = D( X ) ≠ D( X ). n n
7.2
估计量的评价标准
所以,B2不是总体方差D(X)的无偏估计,尽管B2是 所以, 不是总体方差 的无偏估计,尽管 的无偏估计 D(X)的矩估计量. 的矩估计量. 的矩估计量
1 n n 2 看作对B 我们可以把 S = ∑ ( X i − X ) = n − 1 B2 看作对 2的 n − 1 i =1
P{ X = k } =
λk
k!
e −λ , k = 0,1, 2, L
分别是E(X) =λ和D(X)=λ 的矩估计量, 的矩估计量, 由于 X 和B2分别是 ˆ ˆ 于是得到λ 的两个不同的矩估计量 λ1 = X 和 λ2 = B2
7.2
估计量的评价标准
既然估计量不是唯一的, 那么, 究竟孰优孰劣就 既然估计量不是唯一的 , 那么 , 要有一个评价标准. 要有一个评价标准 . 评价估计量的好坏一般从以下 三个方面考虑: 有无系统偏差; 波动性的大小; 三个方面考虑 : 有无系统偏差 ; 波动性的大小 ; 当 样本容量增大时是否越来越精确. 样本容量增大时是否越来越精确 . 这些就是估计量 的无偏性,有效性和相合性. 的无偏性,有效性和相合性.
常用估计量的评价标准
常用估计量的评价标准
常用估计量的评价标准有:
1. 偏差(Bias):估计量的期望值与真实值之间的差距。
偏差越小越好。
2. 方差(Variance):估计量的离散度,即估计量与其期望值之间的差异。
方差越小越好。
3. 平均绝对误差(MAE):估计量的绝对误差的平均值。
MAE越小越好。
4. 均方误差(MSE):估计量的误差的平方的平均值。
MSE越小越好。
5. 均方根误差(RMSE):MSE的平方根。
RMSE越小越好。
6. 相对误差(Relative Error):估计量的误差与真实值之间的比率。
相对误差越小越好。
7. 系数相关度(Correlation Coefficient):估计量与真实值之间的相关程度。
系数相关度越大越好。
8. 准确率(Accuracy):估计量正确的比率。
准确率越高越好。
9. 召回率(Recall):真实值中被正确估计量估计到的比率。
召回率越高越好。
10. F1得分(F1 Score):综合考虑准确率和召回率的得分。
F1得分越高越好。
估计量的评价标准例
例1 2,S X 分别是μ, σ2无偏估量量;μμ=⋅==⎪⎪⎭⎫⎝⎛=∑∑==n n EX n X n E X E n i i n i i 11111 因为 21σn X D =,2221122*********)(1111)()(11)())((2)(11)]()[(11)(11σσσμμμμμμμμ=⋅--=⎪⎪⎭⎫ ⎝⎛--=⎭⎬⎫⎩⎨⎧----=⎭⎬⎫⎩⎨⎧-+-----=⎭⎬⎫⎩⎨⎧----=⎪⎪⎭⎫ ⎝⎛--=∑∑∑∑∑∑======n n n n X nD DX n X nE X E n X n X X X E n X X E n X X n E ESn i i n i i n i ni i i n i i n i i 而对于样本二阶中心矩∑=-=n i i X X n B 122)(1()2222111σn n ES n n S n n E B E -=-=⎪⎭⎫ ⎝⎛-= 可见, 2B 是2σ有偏估量, 故通常总是取S 2作为2σ估量量.例2 设总体()λP X ~, 未知参数λ>0, X 1为X 样本.试证: 1)2()(ˆ1X X g -=是λ3-e 无偏估量量. 证实λλλλλλλ3201!)2(!)2()2()(ˆ1---∞=-∞=-=⋅=-=⋅-=-=∑∑e e e k e e k E X gE k k k k k X这证实了1)2(X-确是λ3-e 无偏估量量; 但03>-λe , 而X 1取奇数值时, 估量值1)2(X -为负数.所以这是一个有显著弊病无偏估量量.例3 设m X X X ''',,,21 和n X X X '''''',,,21 是来自总体X 容量分别为n m ,两个样本, 其样本均值分别为∑='='mi i X m X 11和∑=''=''ni i X n X 11.若n m<, 试比较它们哪个有效?例4设总体X 均值μ, 方差2σ都存在, n X X X ,,,21 是X 一个样本, 试证实: X 是μ相合估量量.证实 易知21,σμn X D X E ==由Chebyshev 不等式, 有}{lim 1}{lim 1}{:1}{22=≥-⇔=<-⇒≤<--≥<-∞→∞→εμεμεμεσεμX p X p X p nX p n n 而 即μpX →, X 是μ相合估量量.。
评价估计量的标准
评价估计量的标准
1.准确性:估计量应该尽可能接近真实值。
2.精确度:估计量应该具有足够的精度,以支持正确的决策。
3.一致性:估计量应该在相同的背景下多次测量所得到的结果是一致的。
4.可靠性:估计量应该具有足够的可靠性,以在不确定的环境中使用。
5.效度:估计量应该具有足够的效度,以反映所评估的属性或变量。
6.适用性:估计量应该适用于特定的变量或场景,并且在不同场景下使用时应该具有相似的表现。
7.可解释性:估计量应该能够被易于理解的方式解释并解释。
8.稳定性:估计量应该对于不同的操作者、时间和环境条件变化不敏感。
9.可比性:估计量应该具有足够的可比性,以支持不同实验结果的比较。
估计量的评价标准
计量是有偏的,称 E ˆ 为估计量ˆ的偏差 .
例1 设总体X的一阶和二阶矩存在,分布是任
意的,记E X ,D( X ) 2.
证明:样本均值X 是的无偏估计.
样本方差Sn2是 2的渐近无偏估计.
修正样本方差Sn2是 2的无偏估计.
证
E X ,
E
Sn2
n 1 2,
n
E Sn2 2
定义6.4 设ˆ1和ˆ2均为的无偏估计量,若对任意
样本容量n有D ˆ1 D ˆ2 ,则称ˆ1比ˆ2有效.
如果存在 一个无偏估计量 ˆ0 ,使对 的任意无偏 估计量 ˆ ,都有
Dˆ0 Dˆ
则称ˆ0 是 的最小方差无偏估计(量).
缩写为MVUE. 最小方差无偏估计是一种最优估计.
例3 设总体 X 服从区间 0, 上的均匀分布,
1
2
E[
ˆn Eˆn
2
2
ˆn Eˆn
Eˆn
Eˆn
2
]
1
2
[
Dˆn
Eˆn
2
]
令 n , 由定理的假设得
lim
n
P{ ˆn
}0
即 ˆn 是 的相合估计.
例9 若总体 X 的 EX和 DX都存在 , 证明 X 是总体
均值 EX 的相合估计.
证 因为 EX EX
DX DX 0 n
n
定理6.2设ຫໍສະໝຸດ ˆn是的一个估计量,
若 lim
n
E
ˆn
,
且
lim
n
D(ˆn
)
0,
则
ˆn 是
的相合估计(或一致估计).
证明 由于
0 P{ˆn }
估计量的 评价标准
估计量的评价标准
1.1 无偏性
(2)由于
D( X i
)
2
,
D( X
)
2 n
,所以
因此
E(
X
2 i
)
D( Xi
)
[E( X i
)]2
2
2
,
E(X
2
)
D( X
)
[E( X
)]2
2
2
.
n
E(ˆ 2 )
E(S 2 )
1 n 1
E
n i 1
X
2 i
nX
2
1 n 1
n i 1
E(
X
2 i
)
nE ( X
2
)
n
1
1
n(
2
2
)
n
2 n
2
n
1 1
n
2
2 n
n
2 .
由无偏估计量的定义可知, ˆ 2 S 2 是 2 的无偏估计量.
参数估计
估计量的评价标准
1.2 有效性
ˆ 围绕 的真值波动幅度越小越好.下面我们将会看到,同一个参数满足无偏性要求的
估计值往往也不止一个.无偏性只对估计量波动的平均值提出了要求,但是对波动的“振
概率论与数理统计
参数估计
估计量的评价标准
由上节可知,对于总体 X 的同一参数,用不同的估计方法求出的估计量可 能不相同,而且即使用相同的方法也可能得到不同的估计量.也就是说,同一 参数可能有多种不同的估计量.原则上来说,任何统计量都可以作为未知参数 的估计量.确定估计量好坏必须在大量观察的基础上从统计的意义来评价,即 估计量的好坏取决于估计量的统计性质.
6.2 估计量的评选标准
所以, X 是 的无偏估计量:
ˆ X.
n n 1 2 1 2 2 2 ( X i n X ) . (Xi X ) (2) S n 1 i 1 n 1 i 1
而 E ( X i2 ) D( X i ) [ E ( X i )]2 2 2 , i 1 ,2 , , n . 2 1 n 2 E ( X ) D( X ) [ E ( X )] D( X i ) 2 n i 1 2 1 n 2 1 2 2 2 . 2 D( X i ) 2 n n n i 1 n n 1 2 由此得 2 2 E ( S ) E[ ( X i n X )] n 1 i 1 2 2 1 2 2 2 . [n( ) n( )] n 1 n 所以,S 2 是 2的无偏估计量:
[例1] 设总体 X 的均值 E ( X ) , 方差 D( X ) 2 ,证明:
1 n (1)样本均值 X X i 是总体均值 的无偏估计量; n i 1 n 1 2 2 (2)样本方差 S 2 ( X X ) 是总体方差 的 i n 1 i 1 无偏估计量.
由于方差是随机变量取值与其数学期望的偏 离程度的度量, 所以无偏估计以方差小者为好.
ˆ1 ( X 1 , X 2 ,, X n )与 ˆ1 ˆ2 ˆ2 ( X 1 , X 2 ,, X n ) 设
都是 的无偏估计量 ,
ˆ1 ) D( ˆ2 ) , 则称 ˆ1 较 ˆ2 有效. 若有 D(
体 X 的 k 阶矩 k E ( X k )的一致估计量, 进而若待
估参数 g ( 1 , 2 ,, n ), 其中g 为连续函数 ,
4估计量的评价标准
所以,样本方差S02不是总体方差 2的无偏估计
对此,有如下两点说明:
(1) 当样本量趋于无穷时,有E(S02) 2, 我们称 S02 为 2的渐近无偏估计。
(2) 修正的样本方差S2 为 2的无偏估计。
例. 设总体X~U[0, ],讨论 的矩估计和极大 似然估计的无偏性 (书P349例3)
解: 的矩估计和极大似然估计分别为:
ˆ 2X
ˆ X L ( n)
ˆ 容易验证 E 所以 的矩估计是无偏估计
ˆ 而 E L
xpX( n ) ( x )dx
0 x 其它
x n 1 1 n n 1 pX ( n ) ( x ) nFX ( x ) pX ( x ) 0
空间为Θ,若对任意的∈Θ,有
ˆ) E (
则称 ˆ是 的无偏估计,否则称为有偏估计。
对任一总体而言,样本均值是总体均值的无 偏估计。当总体k阶矩存在时,样本k阶原点 矩Ak是总体k阶原点矩 k的无偏估计。 但对中心矩则不一样,譬如,由于
E ( S0 2 ) n 1 2 n
随机误差
系统误差
均方误差准则:估计量的均方误差越小越好
ˆ ) D( ˆ ) [b( ˆ )]2 记号: r(
常用的几条标准是: 1.无偏性 2.有效性
3.相合性
这里我们重点介绍前面两个标准 .
一. 无偏性
ˆ ˆ( X , , X ) 设 定义: 1 n 是 的一个估计, 的参数
ˆ 2 比 ˆ1 有效。这表明用全部数据 显然,只要 n>1, 的平均估计总体均值要比只使用部分数据更有效。
三. 相合性
ˆ ˆ( X , , X ) 设 定义: 1 n 是 的一个估计, 的参数
估计量的评选标准
故 的无偏估计量 X 较 nX (1)有效.
ˆ 2X 例6 (续例3) 在 例 3中 已 证 明 1 n1 ˆ 和 2 max{X 1 , X 2 , , X n }都 是的 无 偏 估 n ˆ 较 ˆ 有效 计 量, 现 证 当 n 2时, .
2 1
2 4 ˆ1 ) 4 D( X ) D( X ) , 证明 由于 D( n 3n 2 n 1 n 1 ˆ D( 2 ) D X ( n) DX ( n ) , n n
所以 nX (1) 也是 的无偏估计量.
x0 其它
由以上两例可知,同一个参数可以有不同的无 偏估计量.
无偏性虽然是评价估计量的一个重要标 准,而且在许多场合是合理的, 必要的.然而, 有时对同一个参数可以有多个无偏估,如上 例.这些说明仅有无偏性要求是不够的.于是, 人们又在无偏性的基础上增加了对方差的要 求.若估计量的方差越小,表明该估计量的取 值(即估计值)围绕着待估参数的波动就越 小,也就是更为理想的估计量.为此,引入最 小方差无偏估计。
2 的相合估计量.
六、小结
无偏估计 估计量的评选的三个标准 最小方差无偏估计 相合估计 相合性是对估计量的一个基本要求, 不具备 相合性的估计量是不予以考虑的. 由最大似然估计法得到的估计量, 在一定条 件下也具有相合性. 估计量的相合性只有当样本 容量相当大时,才能显示出优越性, 这在实际中 往往难以做到,因此,在工程中往往使用无偏性和 有效性这两个标准.
即 S 2是 2 的无偏估计, 故通常取S 2作 2的估计量.
例3 设总体 X 在 [0, ]上服从均匀分布 , 参数 0,
X 1 , X 2 , L , X n 是来自总体 X 的样本,试证明 2 X 和 n 1 max( X 1 , X 2 , L , X n ) 都是 的无偏估计 . n 证 因为 E ( 2 X ) 2 E ( X ) 2 E ( X ) 2 , 2 所以 2 X 是 的无偏估计量.
第一节 估计量的评价标准
三、有效性
ˆ ˆ 定义2 的两个无偏估计量, 定义2 设 θ1 , θ 2 是θ 的两个无偏估计量,
ˆ ˆ 若: D (θ1 ) < D (θ 2 )
则称前者较后者有效. 则称前者较后者有效. 由于方差是随机变量取值与其数学期望的偏离 程度, 所以无偏估计以方差小者为好. 程度, 所以无偏估计以方差小者为好
例2 对于均值 µ , 方差 σ > 0 都存在的总体, 若µ, σ
2
2
n −1 2 1 n 2 2 2 ˆ S是 均为未知, 则 σ 的估计量 σ = ∑ ( X i − X ) = n i =1 n 1 n 有偏的(即不是无偏估计);而S 2 = ( X i − X )2才是 ∑ n −1 i =1
存在, 设E ( X ) = µ , D( X ) = σ 2 > 0存在,( X 1 , X 2 )是 例3
来自总体X的样本, 来自总体 的样本,问:下列三个对µ 的无偏估 的样本 计量哪一个最有效? 计量哪一个最有效?
3 1 注 一般地,在µ 的 一般地, ˆ µ1 = X 1 + X 2 , 4 4 无偏估计量 n n 1 1 ˆ µ2 = X 1 + X 2 , ∑ Ci X i (∑ Ci = 1) 2 2 i =1 i =1 2 1 µ3 = X 1 + X 2 . ˆ 中,X 最有效 . 3 3 9 1 2 5 2 ˆ 解 D( µ1 ) = ( + )σ = σ , 16 16 8
下面介绍几个常用标准: 下面介绍几个常用标准: 1)无偏性; )无偏性; 2)有效性; )有效性; 3) 一致性 ) 一致性.
二、总体 X 的一个样本, 的一个样本,
θ ∈ Θ 是包含在总体 X 的分布中的待估参数 ,
估计量的评价标准(ppt 29页)
一、问题的提出 二、无偏估计 三、最小方差无偏估计 四、有效估计 五、相合估计(一致估计)
一、问题的提出
对于总体分布中的同一个未知参数,
若采用不同的估计方法,可能得到不同的
估计量 ˆ 。
究竟采用哪一个估计量更好呢?这就 产生了如何评价与比较估计量的好坏的问 题,我们从估计量的数学期望及方差这两 个数字特征出发,引入无偏性,有效性, 最小方差无偏估计和相合性等概念。
计量是有偏的,称 E ˆ 为估计量ˆ的偏差 .
例1 设总体X的一阶和二阶矩存在,分布是任
意的,记E X ,D( X ) 2.
证明:样本均值X是的无偏估计.
样本方差Sn2是 2的渐近无偏估计.
修正样本方差Sn2是 2的无偏估计.
证
E X ,
E
Sn2
n 1 2,
n
E Sn2 2
定义6.4 设ˆ1和ˆ2均为的无偏估计量,若对任意
样本容量n有D ˆ1 D ˆ2 ,则称ˆ1比ˆ2有效.
如果存在 一个无偏估计量 ˆ0 ,使对 的任意无偏 估计量 ˆ ,都有
Dˆ0 Dˆ
则称ˆ0 是 的最小方差无偏估计(量).
缩写为MVUE. 最小方差无偏估计是一种最优估计.
例3 设总体 X 服从区间 0, 上的均匀分布,
X1,X2, ,Xn 是总体 X 的一个样本,矩
估计
ˆ1
2 X 和修正的最大似然估计ˆ2
n1 n
Xn
均为 的无偏估计,ˆ1和 ˆ2哪个更有效?
解
D ˆ1
D 2X
4D X
4 D( X ) 4 2 2
n 12n 3n
D ˆ2
D
n n
1
简述评价估计量好坏的标准
简述评价估计量好坏的标准估计量是指通过一定的方式来预测或者评估某种特定的情况,同时估计量是统计学中重要的概念。
在进行估计量之后需要对估计的准确性进行评价,以确定估计量的好坏。
本文将描述评价估计量好坏的标准。
2. 偏差(Bias)和方差(variance)偏差和方差是评价估计量好坏的最基本的标准之一。
偏差是指估计量的期望值与真实值之间的差异,而方差是指估计量的值在各个试验之间的差异情况。
一个好的估计量应该在偏差与方差之间平衡,即期望值和各个试验之间的差异都应该小。
3. 置信区间(Confidence interval)置信区间是对估计量的成功率进行评价的方式。
在确定估计量值之后,可以尝试通过一个置信区间来对这个值进行确认。
置信区间的计算方法在不同的情况下可能会有不同的方法,但绝大部分基于样本、标准误差和显著性水平这些指标。
一个好的估计量应该拥有一个较小的置信区间,这意味着它通常会预测正确的结果。
4. 精度(Accuracy)精度是估计量成功率的另一种评价方式。
在确定你的估计值之后,您可以评估它的准确性,即与真实值之间的差异。
估计量的精度越高,则在大量试验中得到正确的结果的可能性就越大。
5. 可解释性(Interpretability)可解释性是估计量的另一个重要的评价标准。
在许多情况下,一个估计量的易于解释性能够对结果影响甚至超过准确性。
一个易于解释的估计量能够更容易地被他人理解和应用,这也能够促进估计量的进一步发展。
同时,可解释性也需要结合实际的应用场景。
将清楚地定义评估结果的成功指标,往往能够进一步提升估计量的可解释性。
6. 时效性(Timeliness)时效性是评价估计量的一个重要方面,尤其在紧急情况下。
在某些情况下,对估计量的准确和及时的预测是非常重要的,尤其是在医疗、军事、安全等领域中。
缺乏时效性的估计量可能会导致严重的后果,因此在这些情况下,时效性非常重要。
7. 可重复性(Reproducibility)可重复性是用于检验估计量准确性的一个重要方面,它确保了试验的复制和估计量值的可靠性。
估计量的评价标准
估计量的评价标准估计量是统计学中一个非常重要的概念,它在研究中起着至关重要的作用。
在统计学中,我们经常需要对总体参数进行估计,而估计量就是用来估计总体参数的。
在实际应用中,我们需要对估计量进行评价,以确定其准确性和可靠性。
本文将从准确性、一致性、有效性和偏倚性四个方面对估计量的评价标准进行详细介绍。
首先,准确性是评价估计量的重要标准之一。
一个好的估计量应当具有较高的准确性,即与总体参数的真值相近。
通常情况下,我们会使用均方误差(MSE)来评价估计量的准确性,MSE越小,表示估计量的准确性越高。
其次,一致性也是评价估计量的重要标准之一。
一个一致的估计量是指当样本容量增大时,估计量趋向于总体参数的性质。
在实际应用中,我们通常会使用一致性的渐近分布来评价估计量的一致性。
有效性是评价估计量的又一重要标准。
一个有效的估计量应当具有较小的方差,即在估计总体参数时具有较高的精确度。
通常情况下,我们会使用标准误差(SE)来评价估计量的有效性,SE越小,表示估计量的有效性越高。
最后,偏倚性也是评价估计量的重要标准之一。
一个好的估计量应当是无偏的,即在重复抽样的情况下,估计量的期望值等于总体参数的真值。
在实际应用中,我们通常会使用置信区间来评价估计量的偏倚性,置信区间越窄,表示估计量的偏倚性越小。
综上所述,对于估计量的评价标准,我们需要从准确性、一致性、有效性和偏倚性四个方面进行综合考量。
在实际应用中,我们可以根据具体问题的特点,选择合适的评价标准来评估估计量的质量。
希望本文对大家对估计量的评价标准有所帮助。
Ch7.2估计量的评选标准
由于
D(ˆ1) E(ˆ1 )2 D(ˆ2 ) E(ˆ2 )2
所以无偏估计以方差小者为好, 这就引进了有 效性这一概念 .
二、有效性
设 ˆ1 ˆ1( X1,, Xn) 和 ˆ2 ˆ2( X1,, Xn)
都是参数 的无偏估计量,若对任意 θ ,
所以 X 是参数 θ 的无偏估计量 . 而
Z min( X1, , Xn ) 具有概率密度
fmin x;θ
n enx θ
θ,
x
0,
0 , 其它,
故知 E Z θ , E nZ θ
n 即 nZ 也是参数 θ 的无偏估计量 .
一个参数往往有不止一个无偏估计, 若 ˆ1和 ˆ2
都是参数 的无偏估计量,我们可以比较 E(ˆ1 )2
第二节 估计量的评选标准
无偏性 有效性 相合性 小结 布置作业
问题的提出 从前面可以看到, 对于同一个参数, 用不同的
估计方法求出的估计量可能不相同, 而且, 很明显, 原则上任何统计量都可以作为未知参数的估计量.
这就需要讨论以下问题: (1)对于同一个参数究竟采用哪一个估计量好?
(2)评价估计量的标准是什么?
n 1 2 2 , 所以ˆ 2 是有偏的.
n
若以 n 乘 ˆ 2 , 所得到的估计量就是无偏的.
n1
(这种方法称为无偏化).
E n ˆ 2 n E(ˆ 2 ) 2 .
n1 n1
因为
n ˆ 2
n1
S
2
1 n
1
n i 1
(Xi
X 2 ),
即 S2是 2 的无偏估计,故通常取S2作 2的估计量.
故有
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
标准三: 相合性(一致性)
设统计量ˆ 是未知参数 的点估
计量,样本容量为 n , 若对任意 0,
lim
P
|
|
1,
则称
ˆ为
的相合
n估计, 又称一致估计.
相合性表明:当样本容量充分大时,事件
“相合估计量充分接近被估计未知参数的概率” 接近于1,换言之,当样本容量充分大时,事件 “相合估计量与被估未知参数偏离较大”的概 率接近于零.以后,将概率很小的事件被称为小 概率事件.
均方误差准 则 用估计量 ˆ( X1, X2 , , Xn )去估计,
产生误差为:
ˆ .
由于它是随机变量,我们通常是通过对它求 均值来看看误差有多大.
注意:为了防止求均值时正误差和负误差相互 抵消,我们先将其平方再求均值,并将其称为均
方误差,记为MSE(), 即
MSE (ˆ) E(ˆ )2
均方误差准则 假如有的两个估计:ˆ1和ˆ2 . 这时两个估计中哪一个估计的均方误 差小,我们就把哪一个估计看作比较优,这 种判定估计量的准则叫均方误差准则. 说明 均方误差能够分解成两部分:
MSE (ˆ) D(ˆ) [E(ˆ) ]2
证明: MSE (ˆ) E(ˆ )2 E{[ˆ E(ˆ)] [E(ˆ) ]}2
E[ˆ E(ˆ)]2 2[E(ˆ) ] E[ˆ E(ˆ)] [E(ˆ) ]2
E[ˆ E(ˆ)]2 [E(ˆ) ]2
D(ˆ) [E(ˆ) ]2
第7.2节 估计量的评价标准
容易明白, 对同一个未知参数, 采用不同的方 法找到的点估计可能不同. 那么, 自然要问: 究竟是用哪一个更“好”些呢? 这里介绍三个 评价标准.
常用 标准
(1) 无偏性 (2) 有效性 (3) 相合性(或一致性)
标准一: 无偏性 假设总体分布的参数为. 设ˆ 为θ的一个点估计,若 E(ˆ) , 则称ˆ为θ的一个无偏估计.
期望的点估计:
选择估计量
X
1 n
n i1
Xi
(1)无偏性 (2)样本容量越大,估计值 越有效
方差的点估计:
选择估计量
如果E(ˆ ) ,那么E(ˆ ) 称为 ˆ 的偏差. 若 lim E(ˆ) 则称 ˆ 是θ的 渐近无偏估计.
n
例
7.2.1
验证:
S2
1 n
n 1 i1 ( X i
X )2
是总体X方差DX=σ2
解的:一第E个六(iSn无章12()我 偏X i们估E证计Xn 1明 );21过 Sinn12:i(n1X(n1iXiniE1X2((X)X2i2)XXin)Xn21,不X1DEiX是(2X2i方n))1n(X差X2ni的2 X无)2偏 估计.
ˆ
更有效.
2
证明: E1 EX
E 2
E( 1 k
1 E( kn
Xi )
i1
n
i 1
Xi)
1 k
k
1 n
n
D 1
DX
D( 1 n
n i1
Xi )
1 n2
nDXi
2 n
样本 容量 越大, 样本 均值 估计
D 2
D( 1 k
k i1
Xi )
1 k2
k
DXi
2 k
值越 有效.
D 1 D 2,
1 n1
E in1
X
2 i
2X
n
i 1
Xi
nX
2
i1nn1n11EEXin21
X i2nnn1XE2(X
2
)
nnn111[
n
iD1XE
(X(
i2E)X
)n2
n1DEX(
2
X(
E) X
)2
]
1 n
1
n
{D( Xi
i 1
)
[En(nX1i )[]2D} X
nnD1nX{D]( X=)DX[E( X
)]2 }
/
3,
1, 2
Eˆ 3
1 2
EX1
2 3
EX 2
1 3
EX 3
为无偏估计量,D 1
D2
,
5 EX 5 66
2 更有效.
例7.23 设总体X 的方差存在,X1, X2,…, Xn k
是来自X的s.r.s,试证:
ˆ1
X , ˆ2
1 k
Xi ,(k n)
i 1
为E(X)=μ的无偏估计,
且
ˆ 1比
关于相合性的两个常用结论
1. 样本 k 阶矩是总体 k 阶矩的相合性估计量.
由大数定律证明
2.设 ˆ 是 的无偏估计
量, 且 lim D(ˆ ) 0, 则 n
ˆ 是 的相合估计量.
用切贝雪夫不 等式证明
3.期望和方差的点估计
在实际中,常常以样本均值作为总体均值的
点估计,以样本方差作为总体方差的点估计.
MSE (ˆ) D(ˆ) [E(ˆ) ]2
上式表明,均方误差由两部分构成: 第一部分是估计量的方差. 第二部分是估计量的偏差E(ˆ) 的平方.
注意:如果一个估计量是无偏的,则第 二部分是零.即有: MSE (ˆ) D(ˆ)
方差准则 如果限定在无偏估计里考虑 问题,这时两个估计中哪一个估计的方差 小, 我们就把哪一个估计看作比较优,这 种判定估计量的准则叫方差准则.
ˆ 3
1 2
X1
2 3
X2
1 3
X3
解:
Eˆ 1
E[ 1 2
X1
1 2
X2 ]
1 2
EX1
1 2
EX 2
=EX=μ
Dˆ 1
D[
1 2
X1
1 2
X
2
]
1 4 DX1
1 4 DX2
=DX/2=σ2/2
同理
Eˆ 2
1 3
EX1
1 3
EX 2
1 3
EX 3
EX
,
Dˆ 2
1 9
DX1
1 9
DX2
1 9
DX3
2
而S2为σ2的无偏估计.
注意
如果ˆ是参数的一个估计.我们通常总是用
g(ˆ)为g( )的估计. 但是必须注意的是 :
当ˆ是的无偏估计时, g(ˆ)却未必是g( )的无偏估计.
例 求证:样本标准差S不是总体标准差的 无偏估计.
证明: ∵E(S2)=2 ∴就是D(S)+[E(S)]2 =2 ∵D(S)≥0 ∴[E(S)]2 =2 -D(S)≤2 ∴E(S)≤. 即:一般说S不是的无偏估计.
标准二: 有效性(方差最小性) D(ˆ 1) 设D(ˆˆ 21和)则ˆ称2是ˆ1比的ˆ两2更个有无效偏.估计,若
例7.2.2. 设X1,X2,X3为来自总体X的简单随机样
本, EX=μ,DX=σ2, 验证下列统计量哪个更有效.
ˆ 1
1 2
X1
1 2
X2 ,
ˆ 2
1 3
X1
1 3
X2
1 3
X3 ,
n ( 2 2 ) n 1 2 2 2
n1
n1 n
即
n
解:
ES2=
σ2。 而i1
(X Sn
2i 2
n2X1i X S
n
2,
X
2
)
故
2
n
估计所.n 以n 1,[
DSX
2
n
D不X是] σ2的n 无[偏DX估计DX,
n1
n
但] 其=D是Xσ2的渐近无偏