估计量评选标准,区间估计
统计学培训课件
1 0.153.
6.54
现S12
3.325,
S
2 2
2.225,
S
2 1
/
S
2 2
1.49,
即有0.153
S 12
/
S
2 2
6.54,
故接受H 0 ,故认为总体方差相等 .
两总体方差相等也称 为两总体具有方差齐性 .
§4. 分布的拟合检验
一. 2检验法:
设X1 , X2 ,, Xn是给定的样本值 , 现在问题是根据这组 样本值,检验总体X的分布函数是否为 F(x).
k
( fi
i1
n pi )2 n
pi
k i1
( fi
npi )2 也应该比较小,其中, npi
n pi 起"平衡"作用,否则,当pi很小时,即使 n pi 与pi的差
相对比较大时,( fi n pi )2 仍然是很小的.
取2 k ( fi npi )2 作为检验统计量 .由下面的定理给出假
为真时
1
,
E(S12
)
2 1
2 2
E(S
2 2
),
故F
S
2 1
S
2 2
有偏大的趋势
,
因而拒绝域的形式为
S S
2 1 2 2
k,
而对于给定的(0 1)k由下式决定,
P{拒绝H 0 | H 0为真} PH0 {F k}
即P{F F (n1 1, n2 1)} .
拒绝域为F F (n1 1,n2 1).
A k
i1 i
, Ai A j
, i
j,i, j
1,2,, k ).
估计量的评价标准
估计量的评价标准估计量是统计学中一个非常重要的概念,它在实际应用中有着广泛的用途。
在统计分析中,我们经常需要根据样本数据来估计总体参数,比如平均值、方差、比例等。
而估计量的好坏直接影响到我们对总体参数的准确性和可靠性。
因此,对估计量的评价标准至关重要。
首先,我们来看估计量的无偏性。
一个估计量如果是无偏的,意味着在重复抽样的情况下,估计量的期望值等于总体参数的真值。
这是一个非常重要的性质,因为它保证了估计量在平均意义下是准确的。
如果一个估计量是有偏的,那么在多次抽样的情况下,估计量的平均值会偏离总体参数的真值,这会导致我们对总体参数的估计产生偏差。
其次,我们需要考虑估计量的一致性。
一个一致的估计量是指当样本容量逐渐增大时,估计量趋向于总体参数的真值。
这意味着随着样本容量的增加,估计量的波动会逐渐减小,最终收敛到总体参数的真值附近。
一致性是估计量的重要性质之一,它保证了在大样本情况下,我们可以获得准确的估计。
此外,我们还需要关注估计量的有效性。
一个有效的估计量是指在所有可能的样本中,估计量的方差最小。
换句话说,有效的估计量能够提供最精确的估计,它的估计误差最小。
有效性是评价估计量优劣的重要标准之一,它直接影响到我们对总体参数的精确度。
最后,我们要考虑估计量的置信区间。
一个好的估计量应该能够提供一个置信区间,该区间能够包含总体参数的真值,并且置信水平越高越好。
置信区间是对估计量精确度的一种度量,它告诉我们关于总体参数的估计有多可靠。
总之,对于估计量的评价标准,我们需要考虑其无偏性、一致性、有效性和置信区间的性质。
一个好的估计量应该在这些方面表现出色,从而能够提供准确可靠的总体参数估计。
在实际应用中,我们需要根据具体问题和数据特点来选择合适的估计量,并且对其进行充分的评价和检验,以确保我们得到的估计是准确可靠的。
参数的矩估计及评价标准
概率论与数理统计(第三版)龙永红
目录
上一页
下一页
返回
结束
衡量点估计量好坏的标准
概率论与数理统计(第三版)龙永红
目录
上一页
下一页
返回
结束
1.无偏性
ˆ ˆ( X1, X 2 ,, X n ) 的数学期望 设参数 的估计量 存在且等于 ,即 ˆ) , E (
则称 ˆ 是 的无偏估计量.
目录 上一页 下一页 返回 结束
概率论与数理统计(第三版)龙永红
复习知识点
1. 事件间的关系与运算,概率的公理化定义, 概率的性质,古典概率,条件概率,乘法公式, 全概率公式、贝叶斯公式,事件的独立性; 书上相关内容,例题1.9,1.11,1.15, 1.16, 1.20 , 1.23, 1.25, 1.26及课后练习P14 4、5, P20 3, P29 9,P35 习题一 7.
ˆ2 有效. ˆ1 比 则称
ˆ) 最小, 则 如果对于给定的样本容量n ,ˆ 的方差 D( 称 ˆ 是 的有效估计量.
概率论与数理统计(第三版)龙永红
目录
上一页
下一页
返回
结束
3.一致性(不作要求)
如果 n 时,ˆn 按概率收敛于 , 即对于任意给定 的正数 ,有
n
ˆn ) 1, lim P(
ˆ( X1 , X 2 ,, X n ) 作为未知参数的估计量; 选择适当的统计量
ˆ( x1 , x2 ,, xn ) 作为未知参数 的估计值. 相应的观测值
概率论与数理统计(第三版)龙永红
目录
上一页
下一页
返回
结束
1.矩估计法
设总体 X 的分布中含有未知参数 1 , 2 ,, m , 假定 总体X 的 1 ,2 , ,m 阶原点矩都存在,
应用数理统计——参数估计
这就是矩法估计的理论依据。
三、正态总体参数的区间估计 前面讨论了未知参数的点估计问题,它是用估计
量 θ 的值作为未知参数θ的估计。然而不管θ 是一 个怎样优良的估计量,它也只是一定程度的精确, 至于如何反映精确度,参数的点估计并没有回答。 由于θ 是一随机变量,需说明用θ 去估计θ的精度, 也就是要说明在一定概率意义下, 与θ的误差有 θ 多大。即确定具有特定概率意义的区间,使它以 相当大的概率包含未知参数的真值,以表明总体 参数真值所处的范围。
α
α
α
2
− uα
σ
n } = 1−α ) = 1−α
2
2
2
uα
2
σ
n
< µ < X + uα 2 < µ < x − uα 2
于是P{x − uα 2
σ
n
σ
n
例6:见教材82页例1。
(2)总体方差σ 2未知时,正态总体均值µ的区间估计
X −µ 因为若X服从N ( µ , σ ),则T = 服从t (n − 1) S n
2 2
小结:学习了
1、点估计法——矩法 2、评价估计量优劣的标准——无偏性、有效性 和一致性 3、正态总体的区间估计——均数和方差的区间估计 作业:教材98页第4题。 教材99页第10、13题。 教材100页第17、18题。
3、正态总体方差σ 的区间估计
2
因为若X服从N ( µ , σ 2 ),则χ 2 = 由附表4知P{χ12−α 2 < (n − 1) S 2
(n − 1) S 2
σ2
服从χ 2 (n − 1)
σ2
2 < χα 2 } = 1 − α
西北工业大学《概率论与数理统计》课件-第六章 参数估计
(2) 似然函数
定义6.1 设总体X的分布密度(或分布律)为 p(x; ), 其中 (1, 2, ,m )为未知参数. 又设
( x1, x2,, xn ) 为自总体X的样本(X1,X2,…,Xn) 的一 个观察值,则称样本的联合分布
n
L( ) p(x1, x2, … , xn; ) p( xi; )
2º似然估计方程组与最大似然估计之间没有必 然
从中解得 pˆ k n
参数 p的估计值
这时, 对一切 0< p <1, 均有
P{Y k; pˆ } P{Y k; p}
综上所述: 设某试验的可能结果为: A1, A2 , ···, Ai , ···
若在一次试验中,某结果 Ai 出现,则应选择参 数使Ai 出现的概率最大.
以上这种选择一个参数使得实验结果具有
(k 1,2,, m)
(4) 求最大似然估计(MLE)的步骤:
1 写出似然函数
(1, 2 , ,m )
n
L( ) L( x1, x2,, xn; ) p( xi; )
n
i 1
2 取对数 ln L( ) ln p( xi; )
i 1
3 解似然方程(组)
ln L
ln L
2
为来自总体X的简单随机样本. 矩估计法的具体步骤:
1 求出k E( X k ) (1,2,,m ), k 1,2,,m;
2 要求k Ak , k 1,2,, m
这是一个包含 m个未知参数1,2 ,,m的方程组.
3 解出其中1,2,,m , 用ˆ1,ˆ2,,ˆm表示.
4 用方程组的解ˆ1, ˆ2 , ,ˆm 分别作为 1,2 ,,m的估计量,这个估计量称为
估计量的评选标准
估计量的评选标准估计量是指在缺乏准确数据的情况下,根据一定的方法和经验,对某一现象或数值进行估算的过程。
在实际生活和工作中,我们经常需要对各种各样的数据进行估计,比如市场需求量、产品销售额、人口数量等等。
而估计量的准确性和可靠性对于决策和规划具有重要意义。
因此,对估计量的评选标准也显得尤为重要。
首先,估计量的评选标准应当包括准确性。
准确性是估计量的基本要求,也是最为重要的一个方面。
一个准确的估计量应当尽可能接近真实数值,能够反映出实际情况。
在评选估计量时,需要对比不同估计量的准确度,选择最为接近真实情况的估计量作为最终结果。
其次,估计量的评选标准还应当考虑到可靠性。
可靠性是指估计量的稳定性和一致性,即在不同条件下得到的估计量应当是相近的。
一个可靠的估计量应当具有较小的误差范围,能够在不同情况下保持一致性。
在评选估计量时,需要对其可靠性进行充分的考量,选择稳定性和一致性较高的估计量作为最终结果。
此外,估计量的评选标准还应当考虑到数据来源和方法的科学性和合理性。
一个科学合理的估计量应当基于充分的数据支撑和合理的估算方法,能够经得起推敲和验证。
在评选估计量时,需要对其数据来源和估算方法进行审查,选择数据充分、方法科学的估计量作为最终结果。
最后,估计量的评选标准还应当考虑到应用的实际性和适用性。
一个优秀的估计量应当能够满足实际应用的需求,能够为决策和规划提供有力支持。
在评选估计量时,需要对其实际应用价值进行评估,选择能够最大程度满足实际需求的估计量作为最终结果。
综上所述,估计量的评选标准应当包括准确性、可靠性、数据来源和方法的科学性和合理性,以及应用的实际性和适用性。
只有在综合考量这些方面的因素之后,我们才能够选择出最为合适的估计量,为决策和规划提供可靠的支持。
因此,在进行估计量的评选时,需要全面考量各方面因素,以确保选择出最为优秀的估计量。
估计量的评价标准
计量是有偏的,称 E ˆ 为估计量ˆ的偏差 .
例1 设总体X的一阶和二阶矩存在,分布是任
意的,记E X ,D( X ) 2.
证明:样本均值X 是的无偏估计.
样本方差Sn2是 2的渐近无偏估计.
修正样本方差Sn2是 2的无偏估计.
证
E X ,
E
Sn2
n 1 2,
n
E Sn2 2
定义6.4 设ˆ1和ˆ2均为的无偏估计量,若对任意
样本容量n有D ˆ1 D ˆ2 ,则称ˆ1比ˆ2有效.
如果存在 一个无偏估计量 ˆ0 ,使对 的任意无偏 估计量 ˆ ,都有
Dˆ0 Dˆ
则称ˆ0 是 的最小方差无偏估计(量).
缩写为MVUE. 最小方差无偏估计是一种最优估计.
例3 设总体 X 服从区间 0, 上的均匀分布,
1
2
E[
ˆn Eˆn
2
2
ˆn Eˆn
Eˆn
Eˆn
2
]
1
2
[
Dˆn
Eˆn
2
]
令 n , 由定理的假设得
lim
n
P{ ˆn
}0
即 ˆn 是 的相合估计.
例9 若总体 X 的 EX和 DX都存在 , 证明 X 是总体
均值 EX 的相合估计.
证 因为 EX EX
DX DX 0 n
n
定理6.2设ຫໍສະໝຸດ ˆn是的一个估计量,
若 lim
n
E
ˆn
,
且
lim
n
D(ˆn
)
0,
则
ˆn 是
的相合估计(或一致估计).
证明 由于
0 P{ˆn }
7.1 点估计
1 xi
n n i 1
0 x i 1 的最大值
n
n ln L ln 2
1 ln xi
i 1
求导数
0 xi 1
令 d ln L n 1 d 2 2
n i 1
ln xi 0
解似然方程
ˆ 故θ的极大似然估计量为 极 大
而 ln L 与
6
4
2
L 在同一 处达到最大值,
取对数
求导数
即
ln L ln 4 6 ln 2 ln1 2 4 ln1
d ln L 6 2 8 令 0 d 1 1 2
7 13 解方程:6-28+24 ² =0 得 1,2 2 7 13 1 ˆ 参数 的极大似然估计值为 极大 12 2
6 28 24 2 0 1 1 2
极大似然估计法定义
定义
若似然函数 则称
L( x1 , x 2 ,, x n ; )
ˆ 取到最大值, 在
ˆ 为 的极大似然估计.
设总体X 的概率密度为:
x 1 , f ( x) 0,
其中 1
X1,X2,…,Xn是X 的一个样本,.
求θ的估计量.
X~B(n,p)
X~ P (λ),
X~E(θ), X~U(a,b)
2 X~N(μ,σ )
7.1 点估计 (point estimate)
点估计就是由样本x1,x2,…xn构造一个统计 量 ,用它来估计总体的未知参数 ,称为总体 参数的估计量。
样本一阶原点矩
2
用A1 代替1 得: 1
概率论与数理统计--- 估计量的评选标准
15
例3 设总体 X 的均值和方差均存在 ,nX1, „, Xn 是总体 X 的样本, C1 , C2 ,„ ,Cn 为不全相同且满足 C i 1 的任一组常数,
证明: (1) 样本的线性函数 Ci X i 是总体均值 的无偏估计量 ; i 1 n n 1 X 较 C X 有效. (2) 总体均值的无偏估计量 X n i i i i 1 i 1 n n n 证(1) E ( C i X i ) C i EX i C i
24
譬如,在估计湖中鱼数的问题中, 若我们根据一个 实际样本得到鱼数 N 的极大似然估计为 1000 条.
但实际上, N 的真值可能大于 1000 条, 也可能小于1000条. 若我们能给出一个区间, 在此区间内我们合 理地相信 N 的真值位于其中, 这样对鱼数的估计就有 把握多了.
也就是说, 我们希望确定一个尽可能小的区间, 使我们能以 • 比较高的可靠程度相信它包含真参数值.
i 1 j 1
n
m
解:(1) E(T)=an+bm =(na+mb) 当na+mb=1时, E(T)=
此时,T是的无偏估计
(2) D(T)=a2n+b24m
1 na 2 na 4m( ) m 2 4(1 na ) 2 na m 8n(1 na ) dD 0 0 2na 令 m da 4 (4n+m)a=4 a 4n m D(a)>0 此时D(T)最小,即T最有效 4 1 a , b 4n m 4n m
定义:设ˆ (X1,X2,…,Xn)为的估计量,若E(ˆ) 存在,且有 ˆ E ( ) , 则称ˆ 为的无偏估计量
吴赣昌编-概率论与数理统计-第6章(new)
ˆ , ˆ ,, ˆ 从中解出 1 2 m
在例6.4中,
n xi n xi n i 1 i 1 xi ln n xi ln(1 ) ln L( ) ln (1 ) i 1 i 1
1 n 解得矩法估计量为 ˆ Xi X n i 1
注:1
n n n 1 1 1 2 2 1 2 2 2 X 2 X X X i i (Xi X ) (Xi 2Xi X X ) n n n i 1 i 1 i 1 n i 1 n i 1 n n
i 1 n
xi !
e
e
n
x!
i 1 i
n
x
i
n
x
i 1
1
n
i 1
i
0
n 1 ˆ xi n i 1
d2 1 n n (ln L ( )) x 0 2 2 i d i 1 x ˆx
ˆx 所以
ˆ X L
二、极大似然估计法(R.A.Fisher费歇)
先看一个简单例子: 某位同学与一位猎人一起 外出打猎 . 一只野兔从前方窜过 . 只听一声枪响,野兔应声倒下 . 如果要你推测, 是谁打中的呢? 你会如何想呢?
1、极大似然估计法的基本思想
由样本的具体取值,选择参数θ的估计量 ˆ 使得取该样本值发生的可能性最大。 一般说,事件A发生的概率与参数有关,取
n 2 i 2 i 1
n n n 1 ln L( , 2 ) ln 2 ln 2 ( xi 2 2 2 2 i 1 ln L( , 2 ) 1 n 2 ( xi ) 0 i 1 解得 2 n ln L ( , ) n 1 2 2 ( xi ) 0 2 4 2 2 i 1
估计量的评选标准
估计量的评选标准估计量是指在缺乏完全准确数据的情况下,根据一定的方法和标准,对某一特定数量进行估算的过程。
在实际生活和工作中,估计量的使用是非常普遍的,比如市场调研中对某一产品的销量进行估计、工程项目中对材料和人工成本的估算等。
因此,对估计量的评选标准进行明确和规范,对于保证估计结果的准确性和可靠性具有重要意义。
首先,估计量的评选标准应当包括数据来源的可靠性。
数据来源的可靠性是估计量准确性的基础,只有在数据来源可靠的前提下,才能得到准确可靠的估计结果。
因此,在评选估计量时,需要对数据来源进行严格的审核和验证,确保数据的真实性和可靠性。
其次,估计量的评选标准还应当考虑估计方法的科学性和合理性。
不同的估计方法可能会得到不同的估计结果,因此在评选估计量时,需要对所采用的估计方法进行评估和比较,选择科学合理的估计方法,并对其进行合理性验证,以确保估计结果的准确性和可靠性。
另外,估计量的评选标准还应当考虑估计结果的稳定性和可靠性。
估计结果的稳定性是指在不同条件下得到的估计结果是否具有一致性和可比性,而可靠性则是指估计结果是否能够得到重复验证和确认。
在评选估计量时,需要对估计结果的稳定性和可靠性进行评估和验证,确保估计结果具有一定的稳定性和可靠性。
最后,估计量的评选标准还应当考虑估计结果的可比性和适用性。
估计结果的可比性是指在不同条件下得到的估计结果是否可以进行比较和分析,而适用性则是指估计结果是否能够满足具体的应用需求。
在评选估计量时,需要对估计结果的可比性和适用性进行评估和验证,确保估计结果具有一定的可比性和适用性。
综上所述,估计量的评选标准应当包括数据来源的可靠性、估计方法的科学性和合理性、估计结果的稳定性和可靠性,以及估计结果的可比性和适用性。
只有在这些方面都得到合理的保证和验证,才能够确保估计结果的准确性和可靠性,从而为实际生活和工作提供有力的支持和保障。
第七章 参数估计(复习二)
求正态总体参数置信区间的解题步骤: 求正态总体参数置信区间的解题步骤:
(1) 根据实际问题构造样本的函数,要求仅 根据实际问题构造样本的函数, 含待估参数且分布已知; 含待估参数且分布已知; (2) 令该函数落在由分位点确定的区间里的 令该函数落在由分位点确定 函数落在由分位点确定的区间里的 概率为给定的置信度 −α,要求区间按几何对称 概率为给定的置信度1−α,要求区间按几何对称 给定的置信度 −α 或概率对称; 或概率对称; (3)解不等式得随机的置信区间; 解不等式得随机的置信区间; 解不等式得随机的置信区间 (4)由观测值及α值查表计算得到所求的置信 由观测值及α值查表计算得到所求的置信 由观测值及 区间. 区间
P {θ < θ < θ } = 1 − α ,
*
置信度为1−α −α的 则称随机区间 (θ ,θ ) 为θ的置信度为 −α的置信区间
θ 和θ 分别称为置信度 1 − α 的置信下限和置信上限 .
注:F(x;θ)也可换成概率密度或分布律. θ 也可换成概率密度或分布律
18
7.4
正态总体参数的区间估计
(1) 做似然函数
iid
^
^
L(θ ) = L( x1 , L , x n ; θ ) = ∏ f ( x i ; θ )
i =1
8
n
L(θ ) = L( x1 , L , x n ; θ ) = ∏ f ( x i ; θ )
i =1
n
(2) 做对数似然函数
ln L(θ ) = L( x1 , L , x n ; θ ) = ∑ ln f ( x i ; θ )
令 p{ T < tα / 2 (n1 + n2 − 2)} = 1 − α .
估计量的评价标准(ppt 29页)
一、问题的提出 二、无偏估计 三、最小方差无偏估计 四、有效估计 五、相合估计(一致估计)
一、问题的提出
对于总体分布中的同一个未知参数,
若采用不同的估计方法,可能得到不同的
估计量 ˆ 。
究竟采用哪一个估计量更好呢?这就 产生了如何评价与比较估计量的好坏的问 题,我们从估计量的数学期望及方差这两 个数字特征出发,引入无偏性,有效性, 最小方差无偏估计和相合性等概念。
计量是有偏的,称 E ˆ 为估计量ˆ的偏差 .
例1 设总体X的一阶和二阶矩存在,分布是任
意的,记E X ,D( X ) 2.
证明:样本均值X是的无偏估计.
样本方差Sn2是 2的渐近无偏估计.
修正样本方差Sn2是 2的无偏估计.
证
E X ,
E
Sn2
n 1 2,
n
E Sn2 2
定义6.4 设ˆ1和ˆ2均为的无偏估计量,若对任意
样本容量n有D ˆ1 D ˆ2 ,则称ˆ1比ˆ2有效.
如果存在 一个无偏估计量 ˆ0 ,使对 的任意无偏 估计量 ˆ ,都有
Dˆ0 Dˆ
则称ˆ0 是 的最小方差无偏估计(量).
缩写为MVUE. 最小方差无偏估计是一种最优估计.
例3 设总体 X 服从区间 0, 上的均匀分布,
X1,X2, ,Xn 是总体 X 的一个样本,矩
估计
ˆ1
2 X 和修正的最大似然估计ˆ2
n1 n
Xn
均为 的无偏估计,ˆ1和 ˆ2哪个更有效?
解
D ˆ1
D 2X
4D X
4 D( X ) 4 2 2
n 12n 3n
D ˆ2
D
n n
1
点估计中两种方法的分析和比较
点估计中两种常用方法的比较与分析楚尚坤河南理工大学数学与信息科学学院信息与计算科学专业2005级3班摘 要:本文首先介绍矩估计法和极大似然估计法,然后对于同一分布和同一参数,用这两种不同的方法求出矩估计量和极大似然估计量,利用估计量的三条评选标准:无偏性、有效性和一致性来判断哪个估计量在这种情况下与该参数的真实值更相近,从而选择相应的点估计法。
关键词:矩估计 极大似然估计 无偏性 有效性 一致性§1 引言当我们碰到这样的问题:假设总体分布函数的形式已知(它可由理论分析和过去经验得到,或者从抽样数据的直方图和概率纸描点初步估计出),但它的一个或多个参数未知,借助于总体的一个样本值,构造适当的样本函数来估计总体未知参数的问题,我们称之为点估计问题。
点估计是数理统计学中内容很丰富的一个分支,其中两种最常用的构造的估计量的方法是矩估计法和极大似然估计法。
当对于同一分布和同一参数时,先用矩估计法和极大似然估计法分别求得矩估计量和极大似然估计量,然后用无偏性、有效性和一致性对这两个估计量进行衡量,当样本容量足够大时,从而选出一个估计量使得这个估计量既在未知参数的真实值附近,又与未知参数真实值的偏离程度很小,而且随着样本容量n 的增大估计量与被估计参数的偏差越来越小,进而选择相应的点估计法。
§2 相关概念2.1 参数估计所谓参数估计,是指从样本),,,(21n X X X 中提取有关总体X 的信息,即构造样本的函数——统计量),,,(21n X X X g ,然后用样本值代入,求出统计量的观测值12(,,,)n g x x x ,用该值来作为相应待估参数的值。
此时,把统计量),,,(21n X X X g 称为参数的估计量,把),,(,21n x x x g 称为参数的估计值。
2.2 参数估计的类型参数估计问题常有两类:点估计和区间估计。
(1) 点估计:指对总体分布中的参数θ,根据样本),,,(21n X X X 及样本值),,,(21n x x x ,构造一统计量),,,(21n X X X g ,将),,(,21n x x x g 作为θ的估计值,则称),,,(21n X X X g 为θ的点估计量,简称点估计,记为∧θ=),,,(21n X X X g 。
《概率论与数理统计》课件第七章 参数估计
03
若存在, 是否惟一?
添加标题
1
2
3
4
5
6
对于同一个未知参数,不同的方法得到的估计量可能不同,于是提出问题
应该选用哪一种估计量? 用何标准来评价一个估计量的好坏?
常用标准
(1)无偏性
(3)一致性
(2)有效性
7.2 估计量的评选标准
无偏性
一致性
有效性
一 、无偏性
定义1 设 是未知参数θ的估计量
09
则称 有效.
10
比
11
例4 设 X1, X2, …, Xn 是X 的一个样本,
添加标题
问那个估计量最有效?
添加标题
解 ⑴
添加标题
由于
添加标题
验证
添加标题
都是
添加标题
的无偏估计.
都是总体均值
的无偏估计量.
故
D
C
A
B
因为
所以
更有效.
例5 设总体 X 的概率密度为
关于一致性的两个常用结论
1. 样本 k 阶矩是总体 k 阶矩的一致性估计量.
是 的一致估计量.
由大数定律证明
用切比雪夫不 等式证明
似然函数为
其中
解得参数θ和μ的矩估计量为
2
时
3
令
1
当
6
,故
5
,表明L是μ的严格递增函数,又
4
第二个似然方程求不出θ的估计值,观察
添加标题
所以当
01
添加标题
从而参数θ和μ的最大似然估计值分别为
03
添加标题
时L 取到最大值
02
添加标题
3、区间估计
sn 1
的95%的置信区间为:
sn1 Z0.05/2 s sn1 Z0.05/2 s
5 1.96 0.635 5 1.96 0.635
3.76 6.24
例3:从某年高考中随机抽取102份作文试卷,算得平均分数为26,标准 差为1.5,试估计全部考生作文成绩95%的置信区间。
解: 未知,总体平均数的区间估计公式为:
s s X t0.05/2 X t0.05/2 n-1 n-1
由于是大样本,故可作近似处理:
s s X Z 0.05/2 X Z 0.05/2 n n
ns 2
2 .025
2
ns 2
2 .975
2 2 (n 1 )sn ( n 1 ) s 2 1 n 1 2 2
.025
.975
9 0.286 9 0.286 2 0.135 2 0.95 19 2.7
2的95%置信区间为: 0.135 2 0.95
有效性
若多个统计量均可作为总体参数的无偏估计量,则变异最小
的那个样本统计量估计总体参数,有效性最高。
一致性
当n无限增大时,样本统计量越来越接近总体参数,估计值越 来越接近真值。
当N , X 2 2 当N , sn 1
充分性
指一个容量为n的样本统计量是否充分地反映了全部n个数据
X 2.58 X X 2.58 X 置信度为99%,犯错误的概率为1%
平均数区间估计的计算
1、σ 已知(总体若为正态,不管n的大小;总体若为非正态, 必须是大样本)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
15
进一步,如果以L记为(3)的长度,即有
s L 3.92 n
(5)
从(5)看出区间长度随n的增大而减小,因此 可以通过改变样本容量n, 使置信区间达到所 给定的精度,若将(5)式变形为
s n 3.92 L 则对给定的精度可求出样本容量n的大小。这 在设计调查方案时是十分有用的。
s s 则所确定的区间 X u 2 , X u1 都是 n n m的置信度为 95%的置信区间,
13
例如,取2=0.02, 1=0.03, 得置信区间为 s s , X 1.88 (4) X 2.06 n n 在众多区间中,应取哪一个?注意到置信度 相同的置信区间的长度往往不同,例如,区 间(3)的长度和区间(4)的长度分别为
5
在对参数作区间估计时,常常提出以下两个 要求: (1) 可信度高,即随机区间 ( , ) 要以很大的 概率包含真值; (2) 估计精度高, 即要求区间长度 尽可能 小,或某种能体现这一要求的其他准则. 这两个要求往往是相互矛盾的,区间估计的 理论和方法的基本问题就是在已有的样本信 息下,找出较好的估计方法,以尽量提高可 信度和估计精度。奈曼提出的原则是:先保 证可信度,在这个前提下使精度提高。
ˆ 只是一个假设(假说, 参数是未知的, 假想),它可能是真,也可能是假,是真是假 有待于用样本进行验证(检验)。 下面将通过几个问题分析给出假设检验的有 关概念,然后总结给出假设检验的思想和方 法
29
一、统计假设 问题1 某大米加工厂用自动包装机将大米装 袋,每袋的标准重量规定为10kg,每天开工 时,需要先检验一下包装机工作是否正常。 根据以往的经验知道,自动包装机装袋重量 X服从正态分布N(m,s2). 某日开工后,抽取了 8袋,如果根据这8袋的重量判断“自动包装 机工作是正常的”这个命题是否成立?
2
s s x t 37.55, x t 39.45 2 2 n n 所求总体均值的区间估计为(37.55, 39.45)
26
第八章 假设检验
27
第一节 假设检验问题
28
本章讨论另一类统计推断问题——假设检验. 在参数估计中我们我们按照参数的点估计方 法建立了参数的估计公式, 并利用样本值确 ˆ, ˆ . 由于 定了一个估计值 认为参数真值
10
2
由此,我们给出求未知参数的置信区间的具 体做法如下: ˆ(X1,X2,…,Xn), 构造 (1) 利用的无偏估计量 一个样本 X1,…,Xn 的函数:G(X1,X2,…,Xn,). 在此函数中,包含待估参数, 而不含其他未 知参数,并且 G 的分布已知且不依赖于任何 未知参数. (2) 对于给定的置信度 1, 选取两个常数 a 和 b,使对一切, 有 P{a<G(X1,X2,…,Xn,)<b}=1.
33
问题4 某种疾病,不用药时其康复率为=0, 现发明一种新药(无不良反应),为此抽查n位 病人用新药的治疗效果,设其中有s人康复, 根据这些信息,能否断定“该新药有效”?
记H0:>0, H1:0, 则问题等价于检验H0成立, 还是H1成立.
3
定义 设总体 X 的分布中含有未知参数, (X1,X2,…,Xn)和 (X1,X2,…,Xn)是由样本 X1,X2,…,Xn 确定的两个统计量. 对给定的数 (0<<1), 如果对参数的任何值,都有 P{ } 1 (1) 则称随机区间 ( , ) 为参数的置信度为 1 的置信区间, , 分别称为的双侧置信区间 的置信下限和置信上限.
32
问题 3 某种电子元件的使用寿命 X 服从参数 为的指数分布, 现从一批元件中任取 n 个测 得其寿命值(样本), 如何判定 “元件的平均寿 命不小于 5000 小时”这个命题是否成立?
1 1 , H1 : 记: H 0 : . 则问题等价 5000 5000 于检验 H0 成立,还是 H1 成立.
4
P{ } 1 (1) (1)式的意义如下:若反复抽样多次(各次得到 的样本容量均为 n),每次样本值确定一个区 间( , ) ,每个这样的区间要么包含的真值, 要么不包含的真值,按伯努利大数定理,在 这样多的区间中,包含的真值的区间个数约 占 100(1)%. 如=0.05, 反复抽样 100 次, 得 100 个区间,其中包含真值的约占 95 个, 不包含真值的约占 5 个.
6
二、估计方法 例1 设总体X~N(m,s2), s2已知,m未知, X1,X2,…,Xn是来自总体X的样本,求m的置信 度为1的置信区间. 解 样本均值 X 是总体均值m的无偏估计, X的 取值比较集中于m附近,显然以很大概率包含 m的区间也应包含 X ,基于这种想法,我们从 X 出发,来构造m的置信区间,由于 X m ~ N (0,1) s/ n
8
由
X m u 2 s/ n
| m X |
得 mX u 2 s/ n
s
n
u
2
s
n
u m X
2
s
n
u
2
X
s
n
u m X
2
s
n
u
2
9
s s u , X u X n 2 n 2
f(x)
பைடு நூலகம்
2
2
u
2
O
u
x
16
2
第四节 正态总体参数的区间估计
17
由于服从正态分布的总体的广泛存在,而且 很多统计量的极限分布是正态分布,因此, 下面专门介绍正态总体N(m,s2)中的参数m和 s2的区间估计。
18
一、一个正态总体均值的区间估计 1. s2已知时,m的区间估计 从例1的求解中可以得到置信度为1的置信 区间为 s s u , X u (1) X n 2 n 2
2
分位点t ( n 1) 使下式成立:
2
P{| T | t ( n 1)} 1
2
22
X m P t (n 1) 1 2 2 S /n
/2
t ( n 1)
2 2
/2
t ( n 1)
23
X m S /n
31
问题2 一架天平标定的误差方差为104(克2), 重量为m的物体用它称得的重量X服从N(m,s2), 某人怀疑天平的精度,拿一物体称n次,得n 个数据, 由这些数据(样本)如何判断“这架天 平的精度是104(克2)”这个命题是否成立? 记H0: s2=104, 其H1:s2104. 则问题等价于检 验H0成立,还是H1成立.
和
s s 2 1.96 3.92 n n s s (1.88 2.06) 3.94 n n
14
由于区间越长,估计值分散的可能性越大, 所以区间长度是估计精度的反映. 为此,我们 在置信水平一定的前提下,选取区间长度最 短的一个,一般说来,若分布是对称的,单 峰的,那么关于峰点对称的置信区间的长度 最短,所以,对于例1,区间(3)是长度最短 的。
7
X m ~ N (0,1) s/ n
所以
X m P u 1 2 s / n
s s 即 PX u m X u 1 , n 2 n 2 其中 u/2 为标准正态分布的上 分位点, 这样 2 我们得到了m的置信度为 1的置信区间
( , ) 即是的置信度为 1的置信区间.
12
满足同一置信度的置信区间可能有很多个, 如例 1 中, 置信度为 95%(=0.05)的置信区间 s s , X 1.96 (3) 为 X 1.96 n n 对 于 任 给 的 1,2(0<2,1<1) 只 要 1+2 ==5%, 记相应的上 1,2 分位点为 u1 和 u 2
19
例 1 假设某地区放射性服从正态分布 2 N(m,7.3 ), 现取一大小为 49 的样本,其样本 均值 x 28.8, 求m的置信水平为 0.95(=0.05) 和 0.99(=0.01 的置信区间. 解 这里 n=49, s=7.3, =0.05. 查 N(0,1)分布 表得上 0.025 分位点 u0.025=1.96,
7.3 x u 28.8 1.96 26.8, 2 n 49 s 7.3 x u 28.8 1.96 30.8 2 n 49
20
s
因此,m的置信水平为0.95置信区间为 (26.8,30.8). 当=0.01时,查表得上0.005分位点u0.005=2.57, s 7.3 x u 28.8 2.57 26.12, 2 n 49 s 7.3 x u 28.8 2.57 31.48 2 n 49 因此,m的置信水平为0.99置信区间为 (26.12,31.48).
2
t (n 1)
2
S | X m | t ( n 1) n 2 S | m X | t ( n 1) n 2 S S t ( n 1) m X t ( n 1) n 2 n 2 S S X t ( n 1) m X t ( n 1) n 2 n 2
11
由此,我们给出求未知参数的置信区间的具 体做法如下:
(2) 对于给定的置信度 1, 选取两个常数 a 和 b,使对一切, 有 P{a<G(X1,X2,…,Xn,)<b}=1. (3) 将 a<G(X1,X2,…,Xn,)<b 变形为 ( X 1 , X 2 , , X n ) ( X 1 , X 2 , , X n ) ,
30
引号内的命题可能是真,也可能是假,只有 通过验证才能确定。如果根据抽样结果判断 它是真,则我们接受这个命题,否则就拒绝 接受它,此时实际上我们接受了“机器工作 不正常”这样一个命题。若用H0表示 “m=10”,用H1表示其对立面,即“m10”, 则问题等价于检验H0: m=10是否成立,若H0 不成立,则H1: m10成立.