03.计量资料的统计推断-t检验和方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基本思想:某些资料不服从正态分布,两样本所 代表的总体方差也可能不齐,但进行变量变换后
(对数变换),则服从正态分布,相应的两总体
方差也可能具有齐性。数据变换后两组间的关系
并没有改变。
也可用秩和检验!
选甲型流感病毒血凝抑制抗体滴度(倒数)小于5者24人,随机 分为2组,每组12人。用甲型流感病毒活疫苗进行免疫,一组 用气雾法,另一组用鼻腔喷雾法,免疫一个月后,分别测定血 凝抑制抗体滴度,结果如下表,问两种方法免疫的效果有无差 别?
有两组小白鼠分别饲以高蛋白和低蛋白饲料,4周后记录小白鼠 体重增加量(g)如下表,问两组动物体重增加量的均数是否相等?
X 1 4 5.7 5 X 2 3 6.5 4
2 S 1 1 7.6 59 2 S 2 3.2 69
t 7.017 p 0.000
完全随机设计两样本几何均数比较的t检验
12名儿童分别用两种结核菌素的皮肤浸润反应结果(mm)
编号 (1) 1 2 标准品 (2) 12.0 14.5 新制品 (3) 10.0 10.0 差值d (4)=(2)(3) 2.0 4.5
3
4 … 8
15.5
12.0 … 7.5
12.5
13.0 … 6.5
3.0
-1.0 … 1.0
9
10 11 12
应用条件:差值服从正态分布!
假设检验的步骤
1. 建立检验假设,确定检验水准;
H 0 : d 0, H 1 : d 0,
0.05(双侧)
2. 计算统计量;
d 0 ~ t , n 1 Sd n
t
X 0 X 0 t , n 1 SX S n
目的:比较两总体均数是否相同。
特点
设计简单易行。常用于个体变异较小、同质性较好 的资料。
应用条件
两样本来源于正态分布的总体;
两总体方差相同,即方差齐性。 独立样本。
方差齐性检验 (homogeneity of variance
test)
方差齐性时
x x ( t
1 2
X 0 X 0 t , n 1 SX S n
, n1 n2 2
x1
x2 )
S x x 1 2
方差不齐时
t
'
检验统计量为:
X1 X 2 s s n1 n 2
2 1 2 2
1 n1 1, 2 n2 2
校正临界值为:
什么是方差?
方差 变异
样本方差 总体方差
自由度 离均差平方和(SS)
例6.1 为探讨不同剂型和不同给药途径与药物在食管癌病人体内分
布的关系,用微量放射性核素标记化疗药物,通过放射性活度反映体
内药物浓度.试分析不同给药方法之间食管癌病人肿物处药物浓度是 否相同?
不同方式给药1小时后测得食管癌病人肿物处放射性活度比较
单样本t检验
One sample t-test
试验设计
一组样本均数(代表未知总体均数)与已知总体均 数(一般为理论值、标准值或经过大量观察所 得稳定值等)的比较。
X 0 X 0 t , n 1 SX S n
应用条件:样本来自正态分布的总体 且为随机样本!
例:根据大量调查,已知健康成年男子的脉搏
静脉点滴 PYM 0.19 0.21 0.66 …… 0.18 12 0.36 食管肿物 处注入 PYM 1.34 1.04 1.05 …… 1.52 12 1.21 食管肿物 处注入 PYM-CH 5.36 4.98 5.08 …… 4.95 12 5.02
X ij
例数 均数
2.20
X
Xi
分析资料的基本情况
t检验中应注意的事项
假设检验的前提是要有严密的抽样研究设计
这是假设检验的前提。组间应均衡,具有可 比性,也就是除对比的主要因素(如临床试 验用新药和对照药)外,其它可能影响结果 的因素(如年龄、性别、病程、病情轻重等) 在对比组间应相同或相近。保证均衡性的方 法主要是从同质总体中随机抽取样本,或随 机分配样本。
t 4.5195 v 12 1 11 P 0.001 0.05
3. 确定P值,下结论。
两独立样本t检验
Two independent sample t-test
试验设计
完全随机设计
将受试对象完全随机地分配到两组中,分别接受不 同的处理;或者从两个总体完全随机地抽取一部分个 体进行研究。
X1 X2
X3
X
( n1 X 1 X )
2
(X n2 2 X )
2
( X 3 X )2 n3
2
SS Between ni ( X i X )
组内变异(within group variation )
每组的原始数据与该组均数 X i 的差异。
在同一处理组内,虽然每个受 试对象接受的处理相同,但测量值 仍各不相同,这种变异称为组内变 异。SS组内仅仅反映了随机误差的 影响。也称SS误差
i
变异的分解
组间变异 组内变异
总变异
三种“变异”之间的关系
SS总 = SS 组间 + SS 组内 ,
且
ν总 =ν组间 +ν组内
组内变异 SS 组内: 随机误差 组间变异 SS 组间:处理因素 + 随机误差
变异程度除与离均差平方和的大小有关外, 因此各部分离均差平方和不能直接比较,须将 各部分离均差平方和除以相应自由度,其比值 称为均方差,简称均方(mean square,MS)。组 间均方和组内均方的计算公式为:
x 0 74.2 72 t = = .854 1 6.5 s/ n 30
3. 确定P值,下结论。
P=0.07>0.05,不拒绝H0,差异无统计学意义。尚不能认为该山 区成年男子脉搏数与一般男子不同。
配对样本t检验
Paired design t-test
试验设计
配对设计
将受试对象按照某些重要特征(主要是非处理因素) 配成对子,每对中的两个受试对象随机分配到两处理组。
还与其自由度有关,由于各部分自由度不相等,
MS组间
SS组间
组间
MS组内
SS组内
组内
分析变异
方差比的分布!
F
MS 组间 MS 组内
处理因素变异 误差变异 误差变异
ANOVA 由英国统计学家
R.A.Fisher首创,为纪念
Fisher,以F命名,故方
差分析又称 F 检验 (F
t 检验
t-distribution
本章结构
单样本t检验
配对样本t检验
两独立样本t检验
t检验中的注意事项 假设检验中两类错误
t检验(student t检验),它以t分布为基础,是计 量资料中最常用的假设检验的方法.包括单样 本t、两独立样本t和配对样本t检验。学习时, 要熟悉每种t检验它所对应的实验设计、适用 条件、注意事项! 理论上,t检验的应用条件是样本来自正态分 布的总体,两样本均数比较时,还要求两总体 方差齐同。在实际工作中,与上述条件略有偏 离,只要其分布为单峰且近似对称分布,也可 应用。当样本含量比较大时,可用u检验。
正确理解差别有无统计意义
例如:有人欲比较A、B两种降压药物的降压效果, 随机抽取了高血压病人各100名,分别测定两组 病人服药后舒张压的改变值,得两组舒张压改变 值之差的平均数为0.83 mmHg (0.11kPa)。 作两大样本u检验得u=6.306,P<<0.001, 有统计学意义。但因A、B两组高血压病人服药后 舒张压改变值之差较小,仅0.83 mmHg,未达 到有临床意义的差值5mmHg(0.67kPa),故 最终结论没有意义。相反,若统计结论无意义, 而专业结论有意义,那就应当检查设计是否合理、 样本含量是否足够。
结论不能绝对化
因统计结论具有概率性质,故“肯定”、 “一定”、“必定”等词不要使用。在报告 结论时,最好列出检验统计量的值,尽量写 出具体的P值或P值的确切范围,如写成 P=0.040或0.02<P<0.05,而不简单写成 P<0.05,以便读者与同类研究进行比较或 进行循证医学时采用Meta分析。
t
'
s t ,1 s t , 2
2 X1
s成2组,甲组单纯用药物治疗,乙组 采用药物治疗合并饮食疗法,2个月后测空腹血糖(mmol/L), 问两组血糖值是否相同?
t=2.639 P=0.015
15.21 10.85
8.0
15.0 13.0 10.5
5.5
8.0 6.5 9.5
3.5
7.0 6.5 1.0 39/12=3.25
配对设计下的数据具有一一对应的特征,人们关心 的变量是对子的效应差值而不是各自的效应值。把 两种处理后的数据之差看作处理效果的一个样本, 假定这种差值服从正态分布,那么其总体均数为0, 即表明该处理没有作用。问题转化为单组完全随机 化设计资料总体均数为零的检验。
均数为72次/分。某医生在某山区随机调查
30名健康男子,求得脉搏均数为74.2次/
分,标准差为6.5次/分。能否认为该山区 的成年男子的脉搏均数高于一般成年男子的 脉搏均数?
1. 建立检验假设,确定检验水准;
H 0 : 0, H1 : 0
0.05 (双侧)
2. 确定检验方法,(在HO成立条件下)计算统计量;
方差分析
Analysis of Variance (ANOVA)
本章结构
方差分析的思想
完全随机设计的方差分析
完全随机区组设计的方差分析
多个样本均数的多重比较
ANOVA的应用
多组计量资料间均数的比较
ANOVA的思想
将全部观察值的总变异按影响实 验结果的诸因素分解为若干部分 变异,构造出反映各部分变异的 统计量,之后构造假设检验统计 量F,实现对总体均数的推断。
test)。用于推断多个总 体均数有无差异
方差分析的应用条件
1.各样本是相互独立的随机样本;
2.各样本来自正态总体;
3.各处理组总体方差相等,即方差齐性。
完全随机设计资料的方差分析
Completely Random Design of ANOVA One-way ANOVA
选用的假设检验方法应符合其应用条件
应根据分析目的、资料类型以及分布、设计 方案的种类等选用适当的检验方法。如:配 对设计的计量资料采用配对t检验。而完全 随机设计的两样本计量资料,若为小样本且 方差齐,则选用两样本t检验;若方差不齐, 则选用近似t检验(Cochran & Cox法或 Satterthwaite法)。
正确理解差别有无统计意义
统计“显著性”与医学/临床/生物学“显著性” 统计“显著性”对应于统计结论,而医学/临 床/生物学“显著性”对应于专业结论。假设 检验是为专业服务的,统计结论必须和专业结 论有机地相结合,才能得出恰如其分、符合客 观实际的最终结论。若统计结论和专业结论一 致,则最终结论就和这两者均一致(即均有或均 无意义);若统计结论和专业结论不一致,则最 终结论需根据实际情况加以考虑。若统计结论 有意义,而专业结论无意义,则可能由于样本 含量过大或设计存在问题,那么最终结论就没 有意义。
X
SST X X
2
组间变异( between group variation )
各组的均数 X i 与总均数
X 间的差异。
i j
SS组间反映了各组均数 X i 间的变异程度
组间变异=①随机误差+②处理因素效应
组间变异 SSB
Sum of squares between groups
特点
控制较多的个体变异,可比性好, 常用于个体变异较 大的资料。
类型
1. 2. 将受试对象配成特征相近的对子,随机接受两种处理; 同一受试对象或同一份样品分成两份,随机分别接受不同处理;
3.
同一受试对象处理前后的结果比较。
12名接种卡介苗的儿童,8周后用两批不同结核菌素,一批是标准结核菌素,一批 是新制结核菌素,分别注射在儿童的前臂,两种结核菌素的皮肤浸润反应平均直径 如下表,问两种结核菌素的反应性有无差别?
处理因素:不同方式给药
因素水平:静脉点滴PYM、食管肿物处注入PYM、
食管肿物处注入PYM-CH
观测指标:肿物处药物浓度 目 的:通过比较不同给药方式后肿物处药物浓 度存在的差异,从而判断不同剂型和不同给药途径 与药物在食管癌患者体内分布是不同的。
试验数据中存在的变异
总变异(Total variation)
(对数变换),则服从正态分布,相应的两总体
方差也可能具有齐性。数据变换后两组间的关系
并没有改变。
也可用秩和检验!
选甲型流感病毒血凝抑制抗体滴度(倒数)小于5者24人,随机 分为2组,每组12人。用甲型流感病毒活疫苗进行免疫,一组 用气雾法,另一组用鼻腔喷雾法,免疫一个月后,分别测定血 凝抑制抗体滴度,结果如下表,问两种方法免疫的效果有无差 别?
有两组小白鼠分别饲以高蛋白和低蛋白饲料,4周后记录小白鼠 体重增加量(g)如下表,问两组动物体重增加量的均数是否相等?
X 1 4 5.7 5 X 2 3 6.5 4
2 S 1 1 7.6 59 2 S 2 3.2 69
t 7.017 p 0.000
完全随机设计两样本几何均数比较的t检验
12名儿童分别用两种结核菌素的皮肤浸润反应结果(mm)
编号 (1) 1 2 标准品 (2) 12.0 14.5 新制品 (3) 10.0 10.0 差值d (4)=(2)(3) 2.0 4.5
3
4 … 8
15.5
12.0 … 7.5
12.5
13.0 … 6.5
3.0
-1.0 … 1.0
9
10 11 12
应用条件:差值服从正态分布!
假设检验的步骤
1. 建立检验假设,确定检验水准;
H 0 : d 0, H 1 : d 0,
0.05(双侧)
2. 计算统计量;
d 0 ~ t , n 1 Sd n
t
X 0 X 0 t , n 1 SX S n
目的:比较两总体均数是否相同。
特点
设计简单易行。常用于个体变异较小、同质性较好 的资料。
应用条件
两样本来源于正态分布的总体;
两总体方差相同,即方差齐性。 独立样本。
方差齐性检验 (homogeneity of variance
test)
方差齐性时
x x ( t
1 2
X 0 X 0 t , n 1 SX S n
, n1 n2 2
x1
x2 )
S x x 1 2
方差不齐时
t
'
检验统计量为:
X1 X 2 s s n1 n 2
2 1 2 2
1 n1 1, 2 n2 2
校正临界值为:
什么是方差?
方差 变异
样本方差 总体方差
自由度 离均差平方和(SS)
例6.1 为探讨不同剂型和不同给药途径与药物在食管癌病人体内分
布的关系,用微量放射性核素标记化疗药物,通过放射性活度反映体
内药物浓度.试分析不同给药方法之间食管癌病人肿物处药物浓度是 否相同?
不同方式给药1小时后测得食管癌病人肿物处放射性活度比较
单样本t检验
One sample t-test
试验设计
一组样本均数(代表未知总体均数)与已知总体均 数(一般为理论值、标准值或经过大量观察所 得稳定值等)的比较。
X 0 X 0 t , n 1 SX S n
应用条件:样本来自正态分布的总体 且为随机样本!
例:根据大量调查,已知健康成年男子的脉搏
静脉点滴 PYM 0.19 0.21 0.66 …… 0.18 12 0.36 食管肿物 处注入 PYM 1.34 1.04 1.05 …… 1.52 12 1.21 食管肿物 处注入 PYM-CH 5.36 4.98 5.08 …… 4.95 12 5.02
X ij
例数 均数
2.20
X
Xi
分析资料的基本情况
t检验中应注意的事项
假设检验的前提是要有严密的抽样研究设计
这是假设检验的前提。组间应均衡,具有可 比性,也就是除对比的主要因素(如临床试 验用新药和对照药)外,其它可能影响结果 的因素(如年龄、性别、病程、病情轻重等) 在对比组间应相同或相近。保证均衡性的方 法主要是从同质总体中随机抽取样本,或随 机分配样本。
t 4.5195 v 12 1 11 P 0.001 0.05
3. 确定P值,下结论。
两独立样本t检验
Two independent sample t-test
试验设计
完全随机设计
将受试对象完全随机地分配到两组中,分别接受不 同的处理;或者从两个总体完全随机地抽取一部分个 体进行研究。
X1 X2
X3
X
( n1 X 1 X )
2
(X n2 2 X )
2
( X 3 X )2 n3
2
SS Between ni ( X i X )
组内变异(within group variation )
每组的原始数据与该组均数 X i 的差异。
在同一处理组内,虽然每个受 试对象接受的处理相同,但测量值 仍各不相同,这种变异称为组内变 异。SS组内仅仅反映了随机误差的 影响。也称SS误差
i
变异的分解
组间变异 组内变异
总变异
三种“变异”之间的关系
SS总 = SS 组间 + SS 组内 ,
且
ν总 =ν组间 +ν组内
组内变异 SS 组内: 随机误差 组间变异 SS 组间:处理因素 + 随机误差
变异程度除与离均差平方和的大小有关外, 因此各部分离均差平方和不能直接比较,须将 各部分离均差平方和除以相应自由度,其比值 称为均方差,简称均方(mean square,MS)。组 间均方和组内均方的计算公式为:
x 0 74.2 72 t = = .854 1 6.5 s/ n 30
3. 确定P值,下结论。
P=0.07>0.05,不拒绝H0,差异无统计学意义。尚不能认为该山 区成年男子脉搏数与一般男子不同。
配对样本t检验
Paired design t-test
试验设计
配对设计
将受试对象按照某些重要特征(主要是非处理因素) 配成对子,每对中的两个受试对象随机分配到两处理组。
还与其自由度有关,由于各部分自由度不相等,
MS组间
SS组间
组间
MS组内
SS组内
组内
分析变异
方差比的分布!
F
MS 组间 MS 组内
处理因素变异 误差变异 误差变异
ANOVA 由英国统计学家
R.A.Fisher首创,为纪念
Fisher,以F命名,故方
差分析又称 F 检验 (F
t 检验
t-distribution
本章结构
单样本t检验
配对样本t检验
两独立样本t检验
t检验中的注意事项 假设检验中两类错误
t检验(student t检验),它以t分布为基础,是计 量资料中最常用的假设检验的方法.包括单样 本t、两独立样本t和配对样本t检验。学习时, 要熟悉每种t检验它所对应的实验设计、适用 条件、注意事项! 理论上,t检验的应用条件是样本来自正态分 布的总体,两样本均数比较时,还要求两总体 方差齐同。在实际工作中,与上述条件略有偏 离,只要其分布为单峰且近似对称分布,也可 应用。当样本含量比较大时,可用u检验。
正确理解差别有无统计意义
例如:有人欲比较A、B两种降压药物的降压效果, 随机抽取了高血压病人各100名,分别测定两组 病人服药后舒张压的改变值,得两组舒张压改变 值之差的平均数为0.83 mmHg (0.11kPa)。 作两大样本u检验得u=6.306,P<<0.001, 有统计学意义。但因A、B两组高血压病人服药后 舒张压改变值之差较小,仅0.83 mmHg,未达 到有临床意义的差值5mmHg(0.67kPa),故 最终结论没有意义。相反,若统计结论无意义, 而专业结论有意义,那就应当检查设计是否合理、 样本含量是否足够。
结论不能绝对化
因统计结论具有概率性质,故“肯定”、 “一定”、“必定”等词不要使用。在报告 结论时,最好列出检验统计量的值,尽量写 出具体的P值或P值的确切范围,如写成 P=0.040或0.02<P<0.05,而不简单写成 P<0.05,以便读者与同类研究进行比较或 进行循证医学时采用Meta分析。
t
'
s t ,1 s t , 2
2 X1
s成2组,甲组单纯用药物治疗,乙组 采用药物治疗合并饮食疗法,2个月后测空腹血糖(mmol/L), 问两组血糖值是否相同?
t=2.639 P=0.015
15.21 10.85
8.0
15.0 13.0 10.5
5.5
8.0 6.5 9.5
3.5
7.0 6.5 1.0 39/12=3.25
配对设计下的数据具有一一对应的特征,人们关心 的变量是对子的效应差值而不是各自的效应值。把 两种处理后的数据之差看作处理效果的一个样本, 假定这种差值服从正态分布,那么其总体均数为0, 即表明该处理没有作用。问题转化为单组完全随机 化设计资料总体均数为零的检验。
均数为72次/分。某医生在某山区随机调查
30名健康男子,求得脉搏均数为74.2次/
分,标准差为6.5次/分。能否认为该山区 的成年男子的脉搏均数高于一般成年男子的 脉搏均数?
1. 建立检验假设,确定检验水准;
H 0 : 0, H1 : 0
0.05 (双侧)
2. 确定检验方法,(在HO成立条件下)计算统计量;
方差分析
Analysis of Variance (ANOVA)
本章结构
方差分析的思想
完全随机设计的方差分析
完全随机区组设计的方差分析
多个样本均数的多重比较
ANOVA的应用
多组计量资料间均数的比较
ANOVA的思想
将全部观察值的总变异按影响实 验结果的诸因素分解为若干部分 变异,构造出反映各部分变异的 统计量,之后构造假设检验统计 量F,实现对总体均数的推断。
test)。用于推断多个总 体均数有无差异
方差分析的应用条件
1.各样本是相互独立的随机样本;
2.各样本来自正态总体;
3.各处理组总体方差相等,即方差齐性。
完全随机设计资料的方差分析
Completely Random Design of ANOVA One-way ANOVA
选用的假设检验方法应符合其应用条件
应根据分析目的、资料类型以及分布、设计 方案的种类等选用适当的检验方法。如:配 对设计的计量资料采用配对t检验。而完全 随机设计的两样本计量资料,若为小样本且 方差齐,则选用两样本t检验;若方差不齐, 则选用近似t检验(Cochran & Cox法或 Satterthwaite法)。
正确理解差别有无统计意义
统计“显著性”与医学/临床/生物学“显著性” 统计“显著性”对应于统计结论,而医学/临 床/生物学“显著性”对应于专业结论。假设 检验是为专业服务的,统计结论必须和专业结 论有机地相结合,才能得出恰如其分、符合客 观实际的最终结论。若统计结论和专业结论一 致,则最终结论就和这两者均一致(即均有或均 无意义);若统计结论和专业结论不一致,则最 终结论需根据实际情况加以考虑。若统计结论 有意义,而专业结论无意义,则可能由于样本 含量过大或设计存在问题,那么最终结论就没 有意义。
X
SST X X
2
组间变异( between group variation )
各组的均数 X i 与总均数
X 间的差异。
i j
SS组间反映了各组均数 X i 间的变异程度
组间变异=①随机误差+②处理因素效应
组间变异 SSB
Sum of squares between groups
特点
控制较多的个体变异,可比性好, 常用于个体变异较 大的资料。
类型
1. 2. 将受试对象配成特征相近的对子,随机接受两种处理; 同一受试对象或同一份样品分成两份,随机分别接受不同处理;
3.
同一受试对象处理前后的结果比较。
12名接种卡介苗的儿童,8周后用两批不同结核菌素,一批是标准结核菌素,一批 是新制结核菌素,分别注射在儿童的前臂,两种结核菌素的皮肤浸润反应平均直径 如下表,问两种结核菌素的反应性有无差别?
处理因素:不同方式给药
因素水平:静脉点滴PYM、食管肿物处注入PYM、
食管肿物处注入PYM-CH
观测指标:肿物处药物浓度 目 的:通过比较不同给药方式后肿物处药物浓 度存在的差异,从而判断不同剂型和不同给药途径 与药物在食管癌患者体内分布是不同的。
试验数据中存在的变异
总变异(Total variation)