置信区间原理及单正态总体
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2) 当 0.05 时, u / 2 u0.025 1.96,
附表2-2
计算得 的95% 的置信区间为 (497.26, 508.58).
当置信水平1 较大时, 置信区间也较大; 当置信水可平靠1度 ,较但小区时间, 置估信计区精间确也度较小. .
例3 设总体X ~ N (, 2 ),其中未知, 2 4.设( X1,, Xn )
( X1, X2 ,, Xn )和 ( X1, X2 ,, Xn ) 使得 P{ } 1 ,则称随机区间( , )是 的
置信水平为的置信区间.
置信度为1
置信上限
X 1.96
1 5
,
X 1.96
1 5
包含真值的区间占95%.
例如算得 x 1.86则得(1.86 – 0.877, 1.86 + 0.877)
附表5-2
于是
t (n 1)
2
s n
152.52 2.201 7.85, 12
得的 95%的置信区间 (495.07, 510.77).
0.15
2. 方差 2 的置信区间 为未知,0.125
0.1
方差 2 的置信水平为 1 的置信区间0.075
2
P187
(n 1)S 2 (n 1)S 2
为其一个样本.
(1) 当n 16时,试求置信水平为0.9的的置信区间的长度;
(2) n多大才能使的90%的长度不超过1?
解 (1) 2, n 16, 查表得 u u0.05 1.645,
2
的 置信区间为 X u , X u .
n 2
n
2
区间长度为 2 u 2 1.645 2 1.645.
n
16
2
(2) 欲使 1,即 2 u 1,有 n (2u )2
n 2
2
(22 1.645)2 43
故样本容量n至少为43.
(2) 2为未知, 估计 选择有无 2的统计量
条 件 使用的统计量 统计量
置信区间
服从的分布
(1) 2已知
U
X
n
U ~ N( 0,1 )
X u
2
n
,X
u
2
n
解答
从某超市一年来的发票存根中随即抽取26张,算得平均金额
如何
40置信区间长度 反映了估计的 精确度.
越小,估计精度越高.
可靠度与精度是一对矛盾, 一般是在保证可靠度的条件下尽可能提高精度.
考虑?
例1 设 X1, X 2,, X n 是来自正态总体 N (, 2 ) 的样本, 其中 2 为已知, 为未知, 求 的置信度
为1 的置信区间.
解X 令U
为1 的置信区间.
解 X 是 的无偏估计, X ~ N (, 2 ),
令 U X ~ N (0,1),
n
/ n
由标准正态分布的上 分位点的定义知
P
X
/
n
u
2
1,
解得
P{ X
n
u
2
X
n
u
2
}
1
于是得的一个置信水平
X u , X u .
为 1 的置信区间
n 2
n
2
例1 设 X1, X 2,, X n 是来自正态总体 N (, 2 ) 的样本, 其中 2 为已知, 为未知, 求 的置信度
513,521,520,512,485. 假设重量服从正态分布,
且标准差为 10, 试求糖包的平均质量 的1
置信区间 (分别取 0.10 和 0.05).
506,500,495,488,504,486,505, 5X13,521u,5,20X,512,4u85
10, 取 0.10 和 0.05.
N (, 2 )的样本, X , S 2 分别是样本均值和样本方差.
1. 均值 的置信区间
(1) 2为已知, 的一个置信水平为1 的置信区间
X u , X u .
n 2
n
2
例2 包糖机某日开工包了12包糖,称得质量(单位:克)
分别为506,500,495,488,504,486,505,
是
X
的无~偏N估(0计明,1),确, X问~题N置,是(信求,水n什2平)么, 是参多数少的?置信区间?
/ n
寻找未知参数的
一个良好估计.
寻找一个待估参数和 估计量的函数 ,要求 其分布为已知.
有了分布,就可以求出 U取值于任意区间的概率.
例1 设 X1, X 2,, X n 是来自正态总体 N (, 2 ) 的样本, 其中 2 为已知, 为未知, 求 的置信度
2 1
/
2
(n
1)
1
,
P{a u b} 1 . P{u a} P{u b}
2
P{X } 为X水平的上侧分位数
标准正态分布的
上 分位数 u
自由度为n的
2分布的上
分位数
2
(
n)
在密度函数对称时, 如 正态分布和 t分布,取 u 2和t 2;
在密度函数不对称时, 如 2 分布和F分布,
为1 的置信区间.
解 X 是 的无偏估计, X ~ N (, 2 ),
令U
X
/
n
~
N (0,1),
P a
U
n
b 1 ,
P
X
/
n
u
2
1,
解得
P{ X
n
u
2
X
n
u
2
}
1
于是得的一个置信水平
X u , X u .
为 1 的置信区间
n 2
n
2
二、正态总体参数的置信区间
设给定置信水平为 1 , 并设 X1, X2,, Xn 为总体
X u
2
n
,
X
u
2
n
(2) 2 未知
2.估计 2
未知
T X
S n
2
(n
1)S 2
2
T ~ t( n1)
X
t
2
n
1
S n
,
X
t n
2
1
S n
2
~ 2(n 1)
(n 1)S 2 (n 1)S 2
2
2
(n
1)
,
2 1 2
(n
1)
三、求置信区间的一般步骤(共4步)
1.明确问题;
6 i 1
xi
14.95
s2
查表
得
1 5
(
6 i 1
xi2
6
x
2
)
0.051.
s
t0.025(5) 2.5706
的置信区间为 ( x t0.025
0.22(n6 1)S2 (n 1)S2
2
2
(
n
1)
,
2 1
(
n
1)
2
(5) s , 6
x t0.025(5)
s) 6
.
(14.71, 15.187 )
n 2
n
2
解 10, n 12, 计算得 x 502.92,
(1) 当 0.10 时, 查表得 u u0.05 1.645,
附表2-1
x
n
u
2
502.92
10
2
1.645 498.17,
12
x
n
u
2
502.92
10 1.645 507.67, 12
即 的 90% 的置信区间为 (498.17, 507.67).
(估计 or 2,已知or未知,置信水平?)
2.确定适当的公式; 3.计算x or s2,代入公式得置信区间.
四、大样本情形的渐近置信区间
若总体 X 的分布未知, 但样本容量很大,
由中心极限定理, 可近似地视
X
~
N(,
2
)
n
思考题
从某超市一年来的发票存根中随即抽取26张,算得平均金额 为78.5元,样本标准差为20元,假设发票金额服从正态分布, 则该超市一年来发票平均金额的90%的置信区间为 _________.
(2) 2 未知
T X
S n
T ~ t( n1)
X
t
2
n
1
S n
,
X
t
2
n
1
S n
X ~ N(, 2)
n
X
~
N
(0,1)
n
(n
1)S 2
2
~
2(n
1)
X ~ t(n 1)
S n
定理6.3
例4 包糖机某日开工包了12包糖,称得质量(单位:克)
分别为506,500,495,488,504,486,505,
引例 已知 X ~ N ( ,1),
的无偏、有效点估计为 X
常数
随机变量
不同样本算得的 的估计值不同,
根据所给的样本确定一个随机区间, 使其包含参数
真值的概(率1)明达确到问指题定,的是要求求什.么参数的置信区间的? 真值
置信水平
置信水平是多少[?• ]
引例中,要找一个区间,使其包含 的真值的概率
6 i1
xi
14.95
2
的置信区间为 ( 14.95 1.96 0.1 , 14.95 1.96 0.1 )
( 14.75, 15.15 )
(2)s2
1( 5
6 i 1
xi2
6x2)
0.051.
s 0.226
查表 t0.025(5) 2.5706
2 0.06,n 6,
x
1 6
为0.95. (设 n = 5 )
Xi ~ N ,
1
(2) X
~
N
,
1 5
X ~ N 0,
1 5
1
P{ X a} 0.95
Xi ~ N ,
1 X ~ N ,
(3)
1 5
X ~ N 0,
1 5
1
P{ X a} 0.95 P{ a X a } 0.95
(3)查表得
2 0.025
(5)
源自文库
12.833,
02975(5) 0.831
得 2 的置信区间为
5 s2
( 02.025(5) ,
5 s2
02.975(5)
)
( 0.0199,
0.3069 )
Ex.假设人的身高服从正态分布.今从高三毕业班中随机抽查十名女 生,测其身高如下:
162, 159.5, 168,160, 157, 162, 163.4, 158.5, 170.3, 166 (单位:厘米)求高三女 生身高EX的0.95的置信区间.
查
2 (n
1)
分布表可知
:
2 0.025
(11)
21.920,
02.975(11) 3.816,
附表3-1 附表3-2
方差 2 的置信区间 (78.97, 453.64);
标准差 的置信区间 (8.87, 21.30).
例6 某工厂生产一批滚珠, 其直径 X 服从正态分布
N( 2), 现从某天的产品中随机抽取6件,测得直径
10 反复抽样多次(各次的样本容量相同),得到多个区间
其中包含真值的约占100(1 )%,不包含的约占 100%.
20 置信区间不唯一.
U ~ N(0,1), P{|U | } 0.95
,
P1 U 2 0.95 1, 2
30 反映了估计的可靠度 ,即 越小, 越可靠.
越小, 1- 越大, 估计的可靠度越高.
0(
a 1
) 0(
5
a 1
) 0.95
2(0
5
a ) 1 0.95 1
5
a 1
1.96 即 P{X a X a} 0.95
5
(4) P X 1.96
1 5
X
1.96
1 5
0.95
称随机区间
X 1.96
1 5
,
X 1.96
1 5
为未知参数 的置信水平为0.95的置信区间.
n 10, x 162.67
s2
1 9
10 i 1
xi2
10 x 2
18.43
0.05 t (9) 2.262
2
EX 的置信水平为0.95的置信区间(159.60,165.74).
1.估计 P145
条 件 使用的统计量 统计量 服从的分布
置信区间
(1) 2已知
U
X
n
U ~ N( 0,1 )
为 (1)
(2)
15.1 若
若
22,未=10知4.0.86,求,, 求15.的2的,置置1信4信.9区区,间间1X4.6tX2, 置n均15信u为.112水0Sn.9n平, X5,
Xtnu
22
1nSn
(3) 求方差 2的置信区间.
解
(1) 2
u
0.06,n 6, x
u0.025 1.96
1 6
置信区间
真值的“区间估计”问题 在一定的置信水平要求下,求真值的置信区间问题.
本节知识要点:
1.了解区间估计的概念及置信区间、置信水平的概率意义; 2. 熟练求解单个正态总体的均值和方差的置信区间.
一、置信区间
1.Def .设为总体X的一个未知参数, 对给定 (0 1),
若由样本X1, X2 ,, Xn 确定的两个统计量
513,521,520,512,485. 假设重量服从正态分布
N ( , 2 ), 试求糖包重量 的 95%的置信区间.
解 此时未知, n 12, 0.05, x 502.92,
X
t n 1
2
S ,X n
t n
2
1
S n
s 2
1 11
12 i 1
xi2
12x2
152.52,
查表可知: t0.025(11) 2.201,
习惯上仍取对称的分位点来
确定置信区间(如图).
(n 1)S 2 (n 1)S 2
例5
(续例4)
求例4中总体方差
2
和
2
2
(n
1)
,
2 1 2
(n
1)
.
标准差 的 置信水平为 0.95 的置信区间.
解 此时,未知, n 12, 0.05, x 502.92, s2 152.52,
2
2
(
n
1)
,
2 1 2
(n
1)
.
0.05
0.025
-2
2
• • 2
4
6
8 10
2
1
2
2 2
S 2 是 2 的无偏估计,
(n
1)S 2
2
~
2(n 1),
则
P
12 / 2(n 1)
(n
1)S 2
2
2 / 2(n
1)
1 ,
即
P
(n
2 /
1)S 2(n
2
1)
2
(n 1)S 2