PowerPoint Presentation - 西南民族大学

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
16
区间估计 Jerzy Neyman 在20世纪30年代建立了 一种区间估计方法: 在一定的概率基础上, 用一个区间去估 计未知参数,即将未知参数值估计在某个界 限之间, 从而提高了参数估计的精度与可靠 性.
17
区间估计的原理: 区间估计的原理
设x1 ,L , xn是来自于概率密度f ( x : θ ) 的样本, 对给定的α , 0 < α < 1, 如果找到 两个统计量θ1 ( x1 ,L , xn )及θ 2 ( x1 ,L , xn ), 使得 P{θ1 ( x1 ,L , xn ) ≤ θ ≤ θ 2 ( x1 ,L , xn )} = 1 − α 则称1 − α为置信度或置信概率;
1 n 2 2 2 = ∑ E ( X i − µ ) − 2nE ( X − µ ) + nE ( X − µ ) n i =1 σ 2 n − 1 2 1 2 σ . = nσ − n = n n n
8
2 2 E ( Sn ) ≠ σ 2 ⇒ Sn 不是σ 2的无偏估计量.
26
例7.1 某种零件的长度服从正态分布, 从该批产品中随机抽取9件,测得其平 均长度为21.4mm。已知总体标准差为 σ=0.15mm, 试建立该零件平均长度 的置信水平为95%的置信区间。
27
解: 已知X~N(µ,0.152), x = 2 . 14 n=9, , 1-α=0.95, zα/2=1.96。 因此, 总体均值µ的置信区间为
2
11
ˆ ˆ 即 MSE (θ ) = D (θˆ) + B (θ ) . ˆ 当θ 是θ 的无偏估计时, B(θˆ) = 0, 则 MSE (θˆ) = D (θˆ). 因此, 寻找极小方差无偏估计MVUE ( Minimum Variance Unbiased Estimate). ˆ 3. 设θˆ ,θ 是θ 的两个无偏估计值, 若
3
点估计的优良性准则
(一) 无偏性 一 无偏性(unbiasedness) ˆ 若估计量 θ 的数学期望等于未知参数θ 的真实值, 即
ˆ E (θ ) = θ ˆ 则称 θ 为θ 的无偏估计量。 无偏性的实质: 无偏性的实质 对一个估计量,多次变更数 据反复求估计值时,估计值的平均值与真实值 ˆ 一致,即尽管 θ 有时比θ大, 有时比θ 小,但总的 来看,它的”平均值”就是θ 。
18
α: 显著性水平( significance level ); [θ1 ( x1 ,L , xn ), θ 2 ( x1 ,L , xn )]是置信 度为1 − α的置信区间.
19
区间估计的理解: 区间估计的理解:
wenku.baidu.com
1. 如果 [θ1 ( x1 , x2 ,L, xn ), θ 2 ( x1 , x2 ,L, xn )] 是置信度为0.95的置信区间, 只要反复从 f ( x;θ )中抽样, 每次都由样本x1 , x2 ,L, xn去 计算区间 [θ1 ( x1 , x2 ,L, xn ), θ 2 ( x1 , x2 ,L, xn )], 则区间[θ1 ,θ 2 ]不完全相同. 有些区间包含真
4
θˆ 的抽样分布
θˆ 的抽样分布
偏差
E (θˆ) = θ
无偏估计量
θ
E (θˆ)
有偏估计量
5
例7.1 证明: (1)样本均值 X是总体均值µ的无偏估计量, (2)样本方差s2是总体方差σ2的无偏估计量. 注: 总体方差的估计量除了s2外,还有一种:
1 2 S = ∑ ( xi − x ) n i =1
无偏性只考虑估计值的平均结果是否等于 无偏性 待估计参数的真值, 而不考虑每个估计值与待 估参数真值之间偏差的大小和散布程度。 均方误差(mean square error )MSE 均方误差
1. θˆ 的偏差 : 2. 均方误差 :
B (θˆ ) = E (θˆ − θ ); ˆ ) = E (θˆ − θ ) 2 . MSE (θ
24
构造均值µ 构造均值µ的置信区间
对给定的显著性水平α, 有
P{− β < X − µ < β }= 1 − α →
( 5.43) P 137
β β 5.41) P 136 − Φ − = 1 − α ( → Φ σ n σ n β β α = 2 − α ⇒ Φ = 1− , 2Φ σ n σ n 2
7
1 n 2 2 E ( Sn ) = E ∑ ( X i − X ) n i =1 1 n 2 = E ∑ [( X i − µ ) + ( X − µ )] n i =1
n 1 n 2 2 = E ∑ ( X i − µ ) − 2 ∑ ( X i − µ )( X − µ ) + nE ( X − µ ) n i =1 i =1
22
§7.2 一个总体参数的区间估计
1. 对于一个总体的参数进行估计时,主要的 估计对象是总体均值µ、总体方差σ2、总体 µ σ 比例π。 2. 在进行区间估计时, 必须要考虑到样本的容 量大小, 并针对不同容量的样本构造不同 的区间估计。
23
一、总体均值的区间估计
正态总体, 已知, 1. 正态总体,方差σ 2已知 当X~N(µ,σ 2)时,抽自该总体的简单随机 样本X1, X2,…,Xn 的样本均值服从数学期望为 µ ,方差为σ 2/n的正态分布,即 σ2 X ~ N (µ , ) n X −µ Z= ~ N(0,1) 则 σ n
X −µ t= ~t(n-1) S n 总体均值µ在置信水平1-α下的置信区间为:
S S , X + tα 2 ( n − 1) ⋅ X − tα 2 (n − 1) ⋅ n n
29
例7.2 某大学从该校学生中随机抽取 100人, 调查到他们平均每天参加体育 锻炼的时间为26分钟, 试以95%的置 信水平估计该大学全体学生平均每天 参加体育锻炼的时间(已知总体方差 为36) 。
30
解: 总体的分布形式未知, 但由于样本 容量较大, 可认为 X ~N ( µ , σ 2 n ) , 1-α=0.95, x = 26,zα/2=1.96,n=100。 因此, 总体均值µ的置信区间为 σ σ
x − zα
σ
2
n
, x + zα
σ
2
n
0.15 0.15 = 21 .4 − 1.96 ⋅ , 21 .4 + 1.96 ⋅ 9 9 = ( 21 .302 , 21 .498 )
28
若总体不是正态总体, 若总体不是正态总体,但样本为大样本 时的总体均值的区间估计 在概率论中,已经证明,对于从非正态分 布总体中抽取的样本,只要样本容量足够大 样本容量足够大, 样本容量足够大 则其样本均值的抽样分布是近似于正态分布 的。在这种条件下,仍然可用前面的方法构 造总体均值的置信区间.
10
Q E (θˆ − Eθˆ)( Eθˆ − θ ) ˆ ˆ = ( Eθ − θ ) E (θˆ − Eθ ) = 0 ˆ) = E (θ − Eθˆ + Eθˆ − θ ) 2 ˆ ∴ MSE (θ ˆ − Eθˆ) 2 + ( Eθˆ − θ ) 2 = E (θ + 2 E (θˆ − Eθˆ)( Eθˆ − θ ) ˆ − Eθˆ) 2 + ( Eθˆ − θ ) 2 = E (θ = D (θˆ) + B(θˆ)
x − zα
2
n
, x + zα
2
n
6 6 , 26 + 1 .96 ⋅ = 26 − 1 . 96 ⋅ 100 100 = ( 24 . 824 , 27 .176 ).
31
2.正态总体, 未知, 2.正态总体,方差σ 2未知,小样本 正态总体
简单随机样本X1, X2,…,Xn抽自正态 总体N(µ, σ 2),若方差σ2未知,则
但是, 1 2 E(s ) = E ∑( Xi − X ) n − 1 i =1 n n −1 2 n 2 2 = E Sn = ⋅ σ =σ , n −1 n −1 n
n 2
∴ s 2是σ 2的无偏估计量.
9
(二)有效性 二 有效性 有效性(efficiency)
n →∞
或 lim P(| θˆ − θ |≥ ε ) = 0.
n →∞
则称θˆ 是θ 的一致估计.
14
较大样本容量 的θˆ 的抽样分布
较小样本容量 的θˆ 的抽样分布
θ
θˆ
两个不同样本容量统计量的抽样分布
15
2. 区间估计 区间估计(interval estimate)
点估计的不足: 点估计的不足 ˆ 即使 θ 是θ 的无偏有效估计值量,但由于 一次只能随机抽取一个样本,因样本的变化,估 计值也会有很大的差异.即由一次只随机抽样 一个样本所得的点估计值不能恰当地代表所 要估计的总体参数。 点估计的主要不足是没有解决参数估计的 没有解决参数估计的 精度和可靠性问题。 精度和可靠性问题。
20
真值θ ,有些区间不包含真值θ .不过 包含真值θ 的区间的频率应该在0.95 左右. 2.置信区间表达了区间估计的精确性, 置信概率则表明了区间估计的可靠性 它是区间估计的可靠概率;显著性水平 表明了区间估计的不可靠的概率。
21
3.置信概率是区间估计中事前按一定 的要求指定的标准,常用的有三种: 1-α =0.95 即 α =0.05 或 1-α =0.99 即 α =0.01 或 1-α =0.999 即 α =0.001. 4.区间估计中精确性与可靠性是相互 矛盾的.
25
令 zα 2 = 从而
β σ
n
, 则有Φ (zα 2 ) = 1 −
α
2
,
β = zα 2 ⋅
σ
n
, 因此,
σ σ P X − zα 2 ⋅ < µ < X + zα 2 ⋅ = 1−α, n n 即 在给定显著性水平α下, 总体均值µ在1 − α
置信水平下的置信区间为
σ σ , X + zα 2 ⋅ X − zα 2 ⋅ n n
第7章 参数估计
1
§7.1参数估计的一般问题 7.1参数估计的一般问题
一、估计量与估计值 1. 参数估计 参数估计(parameter estimation) 用样本统计量去估计总体的参数。 ˆ 2 将总体参数用 θ 表示,并用 θ 表示由样本 得到的估计量 估计量; 估计量 ˆ 3 称 θ 的具体值为估计值 估计值(estimated 估计值 value) 。
2 n
6
n
证明: 证明 由于X1, X2,…, Xn表示次观察结果的n 个独立随机变量, 且这n个独立随机变量来自 于同一总体, 因而具有相同的分布律,即有相 同的期望值和方差: E(X1)=E(X2)=…=E(Xn)=µ, D(X1)=D(X2)=…=D(Xn)=σ2。 因此,
1 E ( X ) = E ( X 1 + X 2 + L + X n ) n 1 nµ = [E ( X 1 ) + E ( X 2 ) + L + E ( X n )] = =µ n n
1 2
[
]
2
ˆ ˆ ˆ ˆ D (θ1 ) < D (θ 2 ), 则θ1是比θ 2有效的估计值.
12
θˆ1 的抽样分布
θˆ2 的抽样分布
θ
两个无偏估计量的抽样分布
θˆ
13
3.一致性(consistency) 3.一致性(consistency) 一致性
若θˆ 是未知参数θ 的估计值, 当n → ∞时, 若θˆ 按概率收敛于θ . 即 lim P(| θˆ − θ |< ε ) = 1
2
二、点估计与区间估计 1.点估计 点估计(point estimate) 点估计 ˆ 用样本估计量 θ 作为总体参数θ的估计值:
(1)用s2作为总体方差σ2的估计值; (2)用部分同学的某次考试分数的平均值作为 该次考试的总体分数的平均值µ的估计值; (3)中央电视台每周的质量检查报告中给出的 某种产品的抽样合格率 p=85% 作为该类产品 的整体合格率π的估计值;
相关文档
最新文档