医学统计学 定量资料的分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
26/50
t
X
1
X
2
2
2 1
s X 1 X 2
t X1 X s
X1X
2
27/50
s
X 1 X
2
sc
2
1 1 n n2 1
2
2
sc
2
n 1 1 s1
n 2 1 s2
n1 n 2 2
32/50
在两个样本均数比较时,若两组样本含量都很大, 可用 u 检验(t 检验的近似),其计算公式为:
u
X s
1
X
2
2
s1
2
X
1
X
2 2
X 1 X
n1 s 2
n2
u为标准正态离差,按正态分布界定 P 值并作出结 论。
33/50
例6.5 某市于1973年和1993抽查部分12岁男童 对其发育情况进行评估,其中身高的有关资 料如下,试比较这两个年度12岁男童身高均 数有无差别。 1973 年:n1=120 =139.9cm s1=7.5cm; 1993 年:n2=153 =143.7cm s2=6.3cm。
第6章
定量资料的分析
1/50
样本均数与总体均数比较的t检验
配对样本的t检验
两个样本均数的t检验 t检验的正确应用
2/50
6.1 样本均数与总体均数的比较 (one sample t-test) 目的: 推断该样本是否来自某已知总体;样本均数代表的 总体均数与0是否相等。 总体均数0一般为理论值、标准值或经大量观 察所得并为人们接受的公认值、习惯值。 实例分析:以例6.1为例介绍
单侧 =0.05。
23/50
t sd
d n
0.0441 0.05716 7
2.0412
按= n-1=7-1=6查t界值表,得单侧t0.05,6=1.943,t>t0.05,6, 则P<0.05,差别有统计学意义,可以认为脑缺氧可造成
钙泵含量的降低。
24/50
6.2 两样本均数比较的t检验 (independent samples t-test)
31/50
t
271 .89 235 .21 163 .3679 1 12 1 15
7.402
=n1+n2-2=12+15-2=25
按自由度25查附表2,t界值表得t0.001/2,25=3.725,
t>t0.001/2, 25,P<0.001,差别有统计学意义,可
以认为病毒性肝炎患者的转铁蛋白含量较低。
264.4
273.2 270.8 260.5
235.9
215.4 251.8 224.7 228.3 231.1 253.0 221.7
218.8
233.8 230.9 240.7 256.9 260.7 224.4
29/50
H0 :1=2,正常人与病毒性肝炎患者的转铁蛋白 含量相等; H1 :1≠2 ,正常人与病毒性肝炎患者的转铁蛋白 含量不等。 双侧 =0.05
7/50
假设检验 先假设 等于0,再判断样本提供的信息是否 支持这种假设,若不支持,则可推断该样本并 非来自已知均数的总体。
8/50
例6.1 25例患者的血红蛋白含量均值为150g/L, 标准差16.5g/L。
问题:是否和正常女性的Hb均值132g/L有差别?
9/50
H0 : =132,病人与正常人的平均血红蛋白含量 相等;
3/50
例6.1 25例患者的血红蛋白含量均值为150g/L,标准 差16.5g/L。 问题:是否和正常女性的Hb均值132g/L有差别?
4/50
目标总体
抽样
样本
,
2
?
已知总体
x ,s , n
2
0 ,
2
5/50
解决思路:
区间估计
判断样本信息估计的总体均数 之可信区间是否覆 盖已知的总体均数 0? 若不覆盖,则可推断该 样本并非来自已知均数的总体。
2
0 .0 0 6 3 2 0 0 .0 0 2 9 7 0 0 .0 1 7 6 8 9 0 .0 0 1 6 0 0 0 .0 0 1 8 5 8 0 .0 0 2 4 5 0 0 .0 0 0 3 2 4 0 .0 3 3 2 11
22/50
H0:d=0,即两组乳猪脑组织钙泵含量相等;
H1:d>0,即对照组乳猪脑组织钙泵含量高于实验组。
39/50
(3) T 检验与 u 检验
公式 t 较复杂 u 简单
查表 需 否
与n关系 计算精度 无关 精确 n较大 近似
40/50
(4)结论:不能绝对化 t 检验的结果不但取决于被研究事物有无本质差 异,而且还受抽样误差的大小(它又取决于个体 差异的程度和样本含量的大小)和选用检验水准 高低的影响 6.3.2 6.3.3
15/50
配对设计的形式
自身配对
同一对象接受两种处理,如同一标本用两种方法
进行检验,同一患者接受两种处理方法;同一对
象处理前后。
异体配对 将条件相近的实验对象配对,并分别给予两种处 理。
16/50
基本思想
若两处理因素的效应无差别,差值 d 的总体均数
d应该为0,故可将该检验理解为样本均数与总体
被测者号 (1 ) 1 2 3 4 5 6 7 8 9 10 11 12 合计 W ri g h t 法 (2 ) 490 397 512 401 470 415 431 429 420 275 165 421 M ini 法 (3 ) 525 415 508 444 500 460 390 432 420 227 268 443 差值 d (4 )= (3 )-(2 ) 35 18 -4 43 30 45 -4 1 3 0 -4 8 103 22 206 d (5 ) 1225 324 16 1849 900 2025 1681 9 0 2304 10609 484 21426
2
18/50
H0:d=0,两仪器检验结果相同; H1:d≠0,两仪器检验结果不同。
双侧 =0.05。
19/50
已知
n=12
d
d
n
2
206
12
2
17 . 17 ( L
min
)
差值标准差
sd
d
d
2
n
n 1 21426 206 12 1 12 4 0 .3 3 L / m in
20/50
t sd
d n
17.17 40.33 / 12
1.48
按 = n-1=12-1=11查t值表, t0.05/2, 11=2.201,t0.20/2, 11=1.363,t0.10/2, 11=1.796, ?? t0.10/2, 11>t>t0.20/2, 11 则0.20>P>0.10,差别无统计学意义,尚不能认为 两种仪器检查的结果不同。
均数d =0的比较
配对 t 检验的实质就是检验样本差值的总体均数
是否为0;也就是执行一个单样本的 t 检验。
17/50
例6.2 现用两种测量肺活量的仪器对12名妇女测得最大呼 气率(PEER)(L/min),资料如表6.1,问两种方法的检测结果 有无差别? 表 6 .1 用 两 种 方 法 对 1 2 名 妇 女 的 最 大 呼 气 率 检 测 结 果 (L /m in )
H1:≠132,病人与正常人的平均血红蛋白含量不 等。
=0.05
10/50
X 0 t X 0 s n
/
s
2
n
n 1 2 n 1
11/50
t
X 0 s n 5 .4 5 4 5
150 132 1 6 .5 25
12/50
P P
t 5 .4 5 4 5
13/50
∵t>t0.05/2,24=2.064 ∴ P <0.05
按 =0.05的水准,拒绝H0,接受H1,差别有统 计学意义。认为该病女性患者的Hb含量高于正
常女性的Hb含量。
14/50
6.1.2 配对设计 t 检验(paired design t-test) 配对设计使用条件: 当个体间的差异不均匀时,将差异较小的个体配 成对子,分别给予不同的处理,以保证两组间的 均衡可比性。
41/50
5.5.1 假设检验中的两类错误
假设检验的核心是推断H0:
当H0是真实的,拒绝H0就是错误的;
当H0是不真实的,不拒绝H0则是错误的。
42/50
I 型错误和 II 型错误
(1)H0 成立,但由于样本的随机性,拒绝了原本正 确的H0 所犯的错误称第一类错误或Ⅰ型错误或 拒 真 错 误 。 犯 第 一 类 错 误 的 概 率 记 作 α(0.05)
37/50
(2)应用t检验对两样本均数进行比较时,要求原始 数据满足如下三个条件: 独立性(independence) 正态性(normality):稳健 方差齐性(homogeneity) ?
38/50
何谓方差齐?
1
2 1
2
2 2Leabharlann ??2怎么判断? 方差齐性检验
21/50
例6.3 某医生研究脑缺氧对脑组织中生化指标的影响,将 乳猪按出生体重配成7对,一组为对照组,一组为脑缺氧模 型组。试比较两组猪脑组织钙泵的含量有无差别。
表 6 .2 乳猪号 1 2 3 4 5 6 7 合计 对照组 0 .3 5 5 0 0 .2 0 0 0 0 .3 1 3 0 0 .3 6 3 0 0 .3 5 4 4 0 .3 4 5 0 0 .3 0 5 0 两 组 乳 猪 脑 组 织 钙 泵 含 量 ( g /g ) 实验组 0 .2 7 5 5 0 .2 5 4 5 0 .1 8 0 0 0 .3 2 3 0 0 .3 11 3 0 .2 9 5 5 0 .2 8 7 0 差值 d 0 .0 7 9 5 -0 .0 5 4 5 0 .1 3 3 0 0 .0 4 0 0 0 .0 4 3 1 0 .0 4 9 5 0 .0 1 8 0 0 .3 0 8 6 d
28/50
例6.4 某医生研究转铁蛋白对病毒性肝炎诊断的临床意义,测得12名正常人 和15名病毒性肝炎患者血清转铁蛋白含量(g/dl),结果见例4.3。问患者和 正常人转铁蛋白含量是否有差异? 正常人(X1) (n1=12) 病毒性肝炎患 者(X2) (n2=15) 265.4 271.5 284.6 291.3 254.8 275.9 281.7 268.6
u
X1 X sX 1 X 2
2
139 . 9 143 . 7 0 . 8533
4 . 4353 u 0 .01 2 . 58
P<0.01,差别有统计学意义,可认为该市1993 年12岁男童平均身高比1973年高。
36/50
6.3 t 检验的正确应用 (1)资料的代表性与可比性 所谓代表性是指该样本从相应总体中经随机抽样 获得,能够代表总体的特征; 所谓可比性是指各对比组间除了要比较的主要因 素外,其它影响结果的因素应尽可能相同或相近 为了保证资料的可比性,必须要有严密的实验设 计,保证样本随机抽取于同质总体,这是假设检 验得以正确应用的前提 。
30/50
X X
1
X1
3 2 6 2 .7 12 3 5 2 8 .1 15
2 7 1 .8 9 2 3 5 .2 1
2
n1 X n2
2
s12=10.382
sc
2
s22=14.392
2
11 10 . 38
14 14 . 39
2
12 15 2
163 . 3679
6/50
X
总体均数的(1- )可信区间定义为:
t / 2 , s X , X t / 2 , s X
t 0 .0 5 / 2 ,2 4 = 2 .0 6 4 1 5 0 2 .0 6 4 1 6 .5 / 25
1 4 3 .1 2 , 1 5 6 .8 1
有些研究的设计既不能自身配对,也不便异体
配对,而只能把独立的两组相互比较。例如手
术组与非手术组、新药组与对照组。
目的:在于推断两个样本所代表的两总体均数
1和2是否相等。
25/50
总体1
1 , 1
2
抽样
样本1
x 1 , s1 , n 1
2
=?
总体2
1
抽样
2 , 2
样本2 2 x 2 , s2 , n 2
34/50
H0 :1=2,该市两个年度12岁男童平均身高相 等; H1 : 1≠2 ,该市两个年度12岁男童平均身高不 等。 双侧 =0.05。
35/50
s X 1 X 2 s1 n1 s 2 n 2 7.5 / 120 6.3 / 153 0.85
2 2 2 2