可信区间
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11 12 13 14 15
0.25 0.50
1.000 0.816 0.765 0.741 0.727
0.718 0.711 0.706 0.703 0.700
0.697 0.695 0.694 0.692 0.691
0.20 0.40
1.376 1.061 0.978 0.941 0.920
0.906 0.896 0.889 0.883 0.879
X t0.05,11 s X 253.05 2.201 27.18 312.87(g / g)
即口腔癌患者发锌含量总体均数的95%可信区间为:193.23~ 321.87(g/g)。用该区间估计口腔癌患者发锌含量总体均数的可 信度为95%。
自由度
单侧 双侧
1
2 3 4 5
6 7 8 9 10
1000
0.675 0.842 1.282 1.646 1.962 2.330 2.581 2.813 3.098 3.300
0.6745 0.8416 1.2816 1.6449 1.9600 2.3264 2.5758 2.8070 3.0902 3.2905
正确理解可信区间的涵义
可信区间一旦形成,它要么包含总体参数,要么不包 含总体参数,二者必居其一,无概率可言。所谓95% 的可信度是针对可信区间的构建方法而言的。
即该地12岁男孩平均身高的90%可信区间为:141.77~143.57(cm), 可认为该地12岁男孩平均身高在141.77~143.57(cm)之间。
-t
0
t
自由度
单侧 双侧
1
2 3 4 5
0.25 0.50
1.000 0.816 0.765 0.741 0.727
0.20 0.40
1.376 1.061 0.978 0.941 0.920
以均数的可信区间为例,其涵义是:如果重复100次 抽样,每次样本含量均为n,每个样本均按 X t0.05, sX 构建可信区间,则在此100个可信区间内,理论上有 95个包含总体均数,而有5个不包含总体均数。
在区间估计中,总体参数虽未知,但却 是固定的值(且只有一个),而不是随 机变量值 。
-2
0.0025 0.001
0.005 0.002
127.321 318.309
14.089 7.453 5.598 4.773
22.327 10.215 7.173 5.893
0.0005 0.001
636.619 31.599 12.924 8.610 6.869
3.707 3.499 3.355 3.250 3.169
s X
例4.1 随机抽取12名口腔癌患者,检测其发锌含量,得均数为 253.05g/g,标准差为27.18g/g,求发锌含量总体均数95%的可信 区间。
本例自由度=12-1=11,经查表得t0.05,11=2.201,则
X t0.05,11 s X 253.05 2.201 27.18 193.23(g / g)
P(X t, sX X t, sX ) 1
总体均数的(1- )可信区间定义为:
X
t,
s X
,X
t,
s X
当样本含量较大时,例如n>100,t分布近似 标准正态分布,此时可用标准正态分布代替t 分布,作为可信区间的近似计算。相应的
100(1-)%可信区间为:
X
u
s X
,
X
u
信区间 。这种估计方法称为区间估计。
可信区间的确切涵义
可信度为95% 的可信区间的确切涵义是: 每100个样本所算得的100个可信区间, 平均有95个包含了总体参数 。
可信区间的两个要素
可靠性
–反映为可信度1- 的大小
精确性
–用区间长度CU-CL衡量
均数的可信区间
P(t, t t, ) 1
范围包含了95%的正常人。
可信区间
抽样研究:从总体到样本 实际工作:由样本推断总体 统计推断(statistical inference)就是根据样本所
提供的信息,以一定的概率推断总体的性质。
参数估计(parameter estimation)
由样本信息估计总体参数
–点估计(point estimation) –区间估计(interval estimation)
-1
0
1
2
图4.1 100个来自N(0,1)的样本所估计的可信区间示意
可信区间与参考值范围的区别
可信区间用于估计总体参数,总体参数只有一个 。 参考值范围用于估计变量值的分布范围,变量值可能
很多甚至无限 。 95%的可信区间中的95%是可信度,即所求可信区间
包含总体参数的可信程度为95% 95%的参考值范围中的95%是一个比例,即所求参考值
0.876 0.873 0.870 0.868 0.866
0.10 0.20
3.078 1.886 1.638 1.533 1.476
1.440 1.415 1.397 1.383 1.372
1.363 1.356 1.350 1.345 1.341
附表2 t 界值表
概 率,P
0.05 0.025 0.01
0.005 0.01
63.657 9.925 5.841 4.604 4.032
0.0025 0.005
127.321 14.089 7.453 5.598 4.773
0.001 0.002
318.309 22.327 10.215 7.173 5.893
0.0005 0.001
636.619 31.599 12.924 8.610 6.869
0.10 0.20
3.078 1.886 1.638 1.533 1.476
附表2 t 界值表
概 率,P
0.05
0.025 0.01
0.10
0.05
0.02
6.314 12.706 31.821
2.920 2.353 2.132 2.015
4.303 3.182 2.776 2.571
6.965 4.541 3.747 3.365
点估计
直接用样本统计量作为总体参数的估计值
–方法简单,但未考虑抽样误差的大小 –在实际问题中,总体参数往往是未知的,但它们
是固定的值,并不是随机变量值。而样本统计量 随样本的不同而不同,属随机的。
区间估计
按一定的概率或可信度(1- )用一个区间估计
总体参数所在范围,这个范围称作可信度为1-
的可信区间(confidence interval, CI),又称置
3.143 2.998 2.896 2.821 2.764
1.796 1.782 1.771 1.761 1.753
2.201 2.179 2.160 2.145 2.131
2.718 2.681 2.650 2.624 2.602
-t
0
t
0.005 0.01
63.657 9.925 5.841 4.604 4.032
4.437 4.318 4.221 4.140 4.073
例4.2 某地120名12岁男孩身高均数为142.67cm,标准差为 0.5477cm,计算该地12岁男孩身高总体均数90%的可信区间。
因n=120>100,故可以用标准正态分布代替t分布,u0.10=1.64
X u0.10 s X 142.67 1.64 0.5477 141.77(cm) X u0.10 s X 142.67 1.64 0.5477 143.57(cm)
0.10 0.05 0.02
6.314 12.706 31.821
2.920 2.353 2.132 2.015
4.303 3.182 2.776 2.571
6.965 4.541 3.747 3.365
1.943 1.895 1.860 1.833 1.812
Fra Baidu bibliotek
2.447 2.365 2.306 2.262 2.228
4.317 4.029 3.833 3.690 3.581
5.208 4.785 4.501 4.297 4.144
5.959 5.408 5.041 4.781 4.587
3.106 3.055 3.012 2.977 2.947
3.497 3.428 3.372 3.326 3.286
4.025 3.930 3.852 3.787 3.733
100
0.677 0.845 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390
200
0.676 0.843 1.286 1.653 1.972 2.345 2.601 2.839 3.131 3.340
500
0.675 0.842 1.283 1.648 1.965 2.334 2.586 2.820 3.107 3.310