概率论与数理统计第七章2

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 1 2 2
1,两个总体均值差m1-m2的置信区间
( a ) s 1 , s 2 均为已知 因X , Y 分别为m 1 , m 2的无 .
2 2
偏估计, 故X - Y 是m 1 - m 2的无偏估计 由X , Y , 的独立性以及 ~ N ( m 1 , s 1 n), X
2
Y ~ N ( m 2 , s 2 n)得

s s X z 0.01 , X z 0.04 n n
( 4.8)
• 也是置信水平为0.95的置信区间.
而比较两个置信区间
s s z0.025 , X z0.025 X n n s s 和 X z0.01 , X z0.04 n n 前者的区间长度为3.92 为4.08
这样就得到了m的一个置信水平为1-a的置信区间
s s X za / 2 , X za / 2 . n n
(4.5)
• 常写成
X
s
za / 2 . n
(4.6)
s X za / 2 . n
(4.6)
如果取a=0.05, 即1-a=0.95, 又若s=1, n=16, 查表 得za/2=z0.025=1.96. 于是得到一个置信水平为0.95 的置信区间
( 5.6)'
2 2 ( n - 1) S 2 P 1-a / 2 ( n - 1) a / 2 ( n - 1) 1 - a 2 s
a/2

2 1-a / 2
a/2
( n - 1)
a / 2 ( n - 1)
2
2 2 ( n - 1) S 2 P 1-a / 2 ( n - 1) a / 2 ( n - 1) 1 - a 2 s
( n - 1) S 2 即 P 2 s a / 2 ( n - 1)
2
1-a 2 1-a / 2 ( n - 1) ( n - 1) S
2
( 5.6)'
得到方差s2的一个置信水平为a的置信区间
( n - 1) S ( n - 1) S 2 . , 2 ( n - 1) ( n - 1) 1-a / 2 a /2
(2) 对于给定的置信水平1-a, 定出两个常数a,b, 使 P{a<W(X1,X2,...,Xn;q)<b)1-a;
(3) 若能从a<W(X1,X2,...,Xn;q)<b得到等价的不等式q
< q <`q, 其中q=q(X1,X2,...,Xn), `q =`q(X1,X2,...,Xn)都是统计量, 那么(q,`q)就是q的 一个置信水平为1-a的置信区间.
2 2
(5.7)
( n - 1) S 2 P 2 s a / 2 ( n - 1)
2Hale Waihona Puke Baidu
1-a 2 1-a / 2 ( n - 1) ( n - 1) S
2
( 5.6)'
由(5.6)'式还可得到标准差s的1-a置信区间为
n - 1S , 2 1-a / 2 ( n - 1) n - 1S (5.8)
当X是连续型随机变量时, 对于给定的a, 总是 按要求P(q < q <`q)=1-a求出置信区间, 而当X 是离散型随机变量时, 对于给定的a, 常常找不 到区间(q ,`q)使得P(q < q <`q)恰为1-a. 此时 去找区间(q ,`q)使得P(q < q <`q)至少为 1-a, 且尽可能地接近1-a.
(4.1)式的含义为:若反复抽样多次(各次得到的样本 的容量相等, 都是n), 每个样本值确定一个区间 (q ,`q), 每个这样的区间要么包含q的真值, 要么不 包含q的真值, 按大数定律, 包含q真值的约占 100(1-a)%, 不包含q真值的约占100a%, 例如, 若 a=0.01, 反复抽样1000次, 则得到的1000个区间中 不包含q真值的约仅为10个.
概率论与数理统计
福建师范大学福清分校数计系
第七章 参数估计
第2讲
§3 区间估计
对一个未知量, 人们在测量或计算时, 常不以 得到近似值为满足, 还需估计误差, 即要求知 道近似值的精确程度(亦即所求真值所在的范 围). 类似地, 对于未知参数q, 除了求出它的点 ˆ q 估计 外, 还希望估计出一个范围, 并希望知道 这个范围包含参数q真值的可信程度. 这样的 范围通常以区间的形式给出, 同时还给出此区 间包含参数q真值的可信程度. 这种形式的估 计称为区间估计.
2 2 2 s1 s2 X - Y ~ N m1 - m 2 , n1 n2

( X - Y ) - ( m1 - m 2 )
按标准正态分布的上a分位点的定义, 有
X -m P za / 2 1 - a , n s
(4.3)
a/2
-za/2
0
a/2
za/2
X -m P za / 2 1 - a , n s
(4.3)
s s PX za / 2 m X za / 2 1 - a . (4.4) n n
2 0.975
(15) 6.262,
• 又s=6.2022, 由(5.8)式得所求的标准差s的一个 置信水平为0.95的置信区间为 • (4.58, 9.60)
(二)两个总体N(m1,s12), N(m2,s22)的情况
设已给定置信水平为 - a , 并设 1 X 1 , X 2 , , X n1 是来自第一个总体的样 ; 本 Y1 , Y2 , , Yn2 是来自第二个总体的样 , 本 这两个样本相互独立且设X , Y 分别为第一 , , 二个总体的样本均值 S , S 分别是第一 二 , , 个总体的样本方差 .
s X za / 2 n
(5.1)
(b) s2为未知, 由第六章定理三, 知
X -m S n ~ t ( n - 1), (5.2)
• 右边的分布t(n-1)不依赖于任何未知参数, 可得
X -m P - ta / 2 ( n - 1) ta / 2 ( n - 1) 1 - a S n (5.3)
X -m P - ta / 2 ( n - 1) ta / 2 ( n - 1) 1 - a S n (5.3)
a/2
-ta/2(n-1) 0
a/2
ta/2(n-1)
X -m P - ta / 2 ( n - 1) ta / 2 ( n - 1) 1 - a S n ( 5.3) 即 S S PX ta / 2 ( n - 1) m X ta / 2 ( n - 1) 1 - a . n n
置信区间 设总体X的分布函数F(x;q)含有一个未知 参数q, q(是q的可能取值范围), 对于给定值 a(0<a<1), 若由样本X1,X2,...,Xn确定的两个统计量 q = q(X1,X2,...,Xn)和 `q =`q(X1,X2,...,Xn)(q <`q), 对于任意q 满足 P{q(X1,X2,...,Xn) < q <`q(X1,X2,...,Xn)}1-a (4.1) 则称随机区间(q ,`q)是q的置信水平为1-a的置信 区间, q 和`q分别称为置信水平为1-a的双侧置信 区间的置信下限和置信上限.
s
n
, 后者的区间长度
s
n
,比前者要大.
易知, 象N(0,1)分布那样其概率密度的图形是单峰且对 称的情况, 当n固定时, 以形如(4.5)那样的区间其长度 为最短. 我们自然选用它. 通过上例, 可看到求未知参数q的置信区间的具体做法 如下
(1)寻求一个样本X1,X2,...,Xn的函数: W=W(X1,X2,...,Xn;q), 它包含待估的参数q, 而不含其它未知参数, 并且W 的分布已知且不依赖于任何未知参数(当然不依赖 于待估参数q);
X 1 1.96 , 即( X 0.49). 16
( 4.7 )
• 再者, 若由一个观察值算得样本均值的观察值`x =5.20, 则得到一个区间 • (5.200.49), 即 (4.71, 5.69)
最后得到的区间(4.71,5.69)已经不是随机区间了, 但我们仍称它为置信水平为0.95的置信区间. 其含 义是: 若反复抽样多次, 每个样本值(n=16)按(4.7) 式确定一个区间, 按上面的解释, 在这么多的区间 中, 包含m的约占95%, 不包含m的约仅占5%. 现在 抽样得到区间(4.71,5.69), 则该区间属于那些包含m 的区间的可信程度为95%, 或"该区间包含m"这一 陈述的可信度为95%.
于是得m的一个置信水平为1-a的置信区间
S X ta / 2 ( n - 1) . n
(5.4)
例1 从一大批糖果中随机取16袋, 称得重量(克) 为:506,508,499,503,504,510,497,512,514, 505,493,496,506,502,509,496 设袋装糖果重量近 似服从正态分布, 求总体均值m的置信水平为0.95 的置信区间.
a / 2 (n - 1)
2
• 在密度函数不对称时, 如2分布和F分布, 习惯上 仍是取对称的分位点来确定置信区间的.
例2 求例1中总体标准差s的置信水平为0.95的置 信区间. 解 现在a/2=0.025, 1-a/2=0.975, n-1=15, 查表得

2 0.025
(15) 27.488,
函数W(X1,X2,...,Xn;q)的构造, 通常可以从q的点估计 着手考虑. 常用的正态总体参数的置信区间可以用 上述步骤推得.
§4 正态总体均值与 方差的区间估计
(一)单个总体N(m,s2)的情况 设已给定置信水平为 1-a, 并设X1,X2,...,Xn为总体N(m,s2)的样本. `X, S2 分别是样本均值和样本方差. 1,均值m的置信区间 (a) s2为已知, 此时由例1采用(4.2)的函数, 已得到m 的置信水平1-a的置信区间为
然而, 置信水平为1-a的置信区间并不是惟一的. 以 上例来说, 若给定a=0.05, 则又有
X -m P - z 0.04 z0.01 0.95, s n
s s PX z 0.01 m X z 0.04 0.95. n n
区间估计的图示
q
例 设总体X~N(m,s2), s2为已知, m为未知, 设 X1,X2,...,Xn是来自X的样本, 求m的置信水平为1-a 的置信区间.

我们知道X是m的无偏估计 且有 , X -m ~ N ( 0,1).
X -m
s
n
s n • 参数.
所服从的分布 (0,1)不依赖于任何未知 N
( n - 1) S
2 2
s • 上式右端分布不依赖任何参数, 故有
2 2 ( n - 1) S 2 P 1-a / 2 ( n - 1) a / 2 ( n - 1) 1 - a 2 s
~ ( n - 1),
2
( 5.6)
2 ( n - 1) S 2 ( n - 1) S 2 即 P 2 s 2 1-a 1-a / 2 ( n - 1) a / 2 ( n - 1)
解 1-a=0.95, a/2=0.025, n-1=15, t0.025(15)=2.1315, 算得`x=503.75, s=6.2022. 由 (5.4)式算得置信区间为
6.2022 503.75 2.1315 , 16
• 即
(500.4, 507.1).
2, 方差s2的置信区间(m未知) s2的无偏估计为S2, 由第六章§2定理二知
相关文档
最新文档