07总体均数的估计与假设检验2
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
u /2S X, X
u
/
2
S
)
X
例3-3 某地抽取正常成年人200名,测得其血清胆固醇
的均数为3.64mmol/L,标准差为1.20mmol/L,估 计该地正常成年人血清胆固醇均数的95%可信区间。
解:
未知。但n足够大,可以按u分布计算
n 200, X 3.64, S 1.20
SX
S 1.20 0.0849 n 200
公式 区间范围
X
窄
t0.05
/
2 ,
S
X
估计错误的概率 大(0.05)
99%可信区间
X
宽
t0.01/
2 ,
S
X
小(0.01)
在可信度确定的情况下,增加样本含量可减小区间宽度。
四、总体均数的可信区间与参考值范围的区别
区别
总体均数可信区间
参考值范围
按预先给定的概率,确定的未知参数 的可能 含 范围。实际上一次抽样算得的可信区间要么包含了 “正常人”的解剖,生理,生化某
用途 总体均数的区间估计
正态分布: X u / 2S 偏态分布:PX~P100X 绝大多数(如 95%)观察对象某项指 标的分布范围
作业:
1.用自己的数据,计算年龄的总体均数的双侧95% 可信区间。 2.按性别分组,计算年龄总体均数之差的双侧95% 可信区间。 要求:按例题格式写出相应的公式及步骤。
0.05, u0.05/ 2 1.96
(3.64 1.96 0.0849, 3.64 1.96 0.0849)
(3.47, 3.81)
在该地正常成人血清胆固醇均数的双侧95%的 可信区间为(3.47,3.81)mmol/L。
2.两总体均数之差的可信区间
从总体标准差相等,但总体均数不等的两个正态总体
实际工作中,我们只根据一次抽样结果估计总体 均数的可信区间,可以认为这个区间有95%的可能 性包含了总体均数,即估计正确的概率为95%。
可信区间估计的评价:
一是可信度1,愈接近1愈好,如99%的可信度比95%的可
信度要好;
二是区间的宽度,区间愈窄愈好。当样本含量为定值时, 上述两者互相矛盾。
95%可信区间
100(1 )%可信区间为(X
t / 2, S X,X
t
/
2 ,
S
)
X
或写成X t / 2, S X
在单尾概率为的情况下:
1
P
X
S X
t ,
t ,Байду номын сангаас
单侧1-可信区间(下限): X t , S X
1
P
X
S X
t ,
t ,
单侧1-可信区间(上限): X t , S X
例3-2
在例3-1中抽得第15号样本均数 X 166.95cm , 标准差 S 3.64cm ,求其总体均数的95%可信区间。
在双尾概率为的情况下:
/2
u / 2
/2
1
P u
2
X
X
u
2
u / 2
100(1 )%可 信 区 间 为 ( X
u
/ 2
X,X
u / 2
)
X
② 未知,但n足够大(如n>60)时,
在双尾概率为的情况下:
1
P u
2
X
S X
u
2
100(1 )%可 信 区 间 为 ( X
N (1, 2 )和 N (2 , 2 )进行随机抽样,求两总体均数之差
1 2可信区间。
1,
2 ,
X1, S1
1 2 ?
n1
X2, S2 n2
2.两总体均数之差的可信区间
( X 1 X 2 ) t / 2, S X1 X 2
其中自由度 (n1 1) (n2 1) n1 n2 2
总体均数,要么不包含。但可以说:当=0.05 时, 项指标的波动范围。 义 95%CI 估计正确的概率为 0.95,估计错误的概率小
于或等于 0.05,即有 95%的可能性包含了总体均数。
总体均数的可能范围
个体值的波动范围
计算 未知: X t /2, SX 公式 已知或未知但 n>60:X u /2SX
直接估计总体参数 、
区间估计:按预先给定的概率(1-) 所确定的包含未知总体参数的一个范围 ,这个范围称为参数的可信区间( Confidence interval, CI)
可信度与可信区间
预先给定的概率1- 称为可信度或置信度 (confidence level),常取95%或99%。没有特别说明, 一般取双侧95%。
可信区间有可信下限(lower limit, L)和可信上 限(upper limit, U),一般表示为(L,U)。
二、总体均数可信区间的计算
1.单一总体均数的可信区间
, ?
X,S
未知总体
样本
(1) 未知,按t分布计算。
/2
t / 2,
/2
1
P t
2,
X
S X
t
2,
t / 2,
X t 2, S X X t 2, S X
第三章
总体均数的估计与假设检验(2)
1.抽样误差
2.标准误 / n X
SX
S n
3.抽样试验
X
j
~
N
(,
2 X
)
4. t分布 t X X ,
S X
Sn
n 1
5. t分布曲线下面积
t ,
t ,
/2
t / 2,
/2
t / 2,
第三节 总体均数的估计
参数的估计
点估计:由样本统计量 X 、 S
令取双尾0.05, =n1+n2 -2=59
S X1 X 2
(29 1) 7.022 (32 1) 8.462 1 1
( ) 2.0023
29 32 2
29 32
t0.05/ 2,60 2.000
1 2 双侧可信区间为:
(20.10 16.89) 2.000 2.0023
n 1 9, 0.05 t0.05/ 2,9 2.262
SX
S 3.64 1.1511(cm) n 10
双侧95%可信区间:X t / 2, S X
(166.95 2.262 1.1511, 166.95 2.262 1.1511)
(164.35,169.55)cm。
(2) 已知或 未知但n足够大(如n>60)时,按u分布计算。 ①当 已知时
SX1X2 为两均数之差的标准误。
S X1 X 2
S
2 c
(
1 n1
1 n2
)
Sc2
(n1
1) S12
(n2
1)
S
2 2
n1 n2 2
其中 Sc2 称为合并方差
例3-4
为了解甲氨蝶呤(MTX)对外周血IL-2水平的影响,某 医生将61名哮喘患者随机分为两组。其中对照组29例(n1), 采用安慰剂;试验组32例(n2 ),采用小剂量甲氨蝶呤治疗。 测得对照组治疗前IL-2的均数为20.10IU/ml( X1 ),标准差 为7.02IU/ml( S1 );试验组治疗前IL-2的均数为 16.89IU/ml( X2 ),标准差为8.46IU/ml( S2 )。问两组治疗 前基线的IL-2总体均数相差有多大?
即(-0.79,7.21) IU/ml
三、可信区间的确切涵义
观察表3-1:
当1=95%时,在算得的100个可信区间中,有95个
可信区间包含了总体均数,而另外5个(表3-1中第 20号、31号、54号、76号和82号)不包括。
三、可信区间的确切涵义
如果能够进行重复抽样试验,平均有1(如95%) 的可信区间包含了总体参数,而不是总体参数落在 该范围的可能性为1。