5第五讲方差分析与秩和检验2009
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0.82 0.73 0.43 0.41 0.68 0.614
0.65 0.54 0.34 0.21 0.43 0.434
0.51 0.66 0.23 0.50 0.28 0.35 0.31 0.31 0.24 0.45 0.314
1、资料特点分析
• 是配对设计的扩展。具体做法是:先按影响 试验结果的非处理因素(如性别、体重、年 龄、职业、病情、病程等)将受试对象配成 区组(block),再分别将各区组内的受试对象 随机分配到各处理或对照组。
建立假设:
H0:三组矿工用力肺活量的总体均数相等, 1=2=3
H1:三组矿工用力肺活量的总体均数不等或不全等 12=3, 1=23, 1= 3 2, 123
=0.05
构筑统计量:F=组间变异/组内变异 =MS组间/MS组内
如何判断 P 值
假设无效假设成立的情况下,干预无效应, 即MS组间与MS组内接近,则F值接近于1, 在1附近出现的机率多,而出现较大F值的 机率小,当F值大到一定界值时,根据小概 率事件原则,就有理由认为无效假设不成立, 从而拒绝H0,而接受H1。
方差分析与秩和检验
第五讲
•两两比较次数与I型 错误率
•指标数
方差分析的基本思想
根据资料的设计类型,即变异的不同来 源,将全部观察值总的离均差平方和以 及自由度分解为两个或多个部分,每个 部分的变异与自由度组成均方(MS), 均方比值服从F分布,由此做出统计推断, 从而了解各因素对观察指标影响有无统 计学意义。
组数减1为第一自由度,合并例数减组数为 第二自由度.
根据F统计量与一、二自由度确定F分布,计 算P值.
1.792.313.4(三组) 推断总体
H0三总体均数相等 1=2=3
三总体均数不等/不全等
12=3, 1=23, 1= 3 2, 123
P值 小概率事件
拒绝H0 不拒绝H0
3、假设检验的步骤
Sum of Sq ua re s
9. 2 66 1. 5 34 10 . 800
ANOVA
df 2
28 30
Mean Square 4. 6 33 . 05 5
F 84 . 544
Sig. . 00 0
4、方差分析及两两比较
方差分析只能表明三组工人的用力肺活量的 总体均数有差别,还不能说明任何两组间是 否有差别,还需做两两比较检验。
11
1、方差分析过程
变异原因
变异表现
统计量
干预效应 随机因素
组间变异 组内变异
组间均方
F值
组内均方
总变异
3、成组设计方差分析的变异分解
总变异=组间变异+组内变异
(1.8-2.51) = … …
(1.79-2.51) + … …
(1.8-1.79) … …
表1 三组石棉矿工的用力肺活量
石棉肺患者
1 10,2 10
2F
3
4
方差分析的理论基础:F分布
F分布是方差分析的基础,通过F分布 确定P值。
F分布也是一簇连续性分布,分布类型 与第一、二自由度有关。
当第一、二自由度固定时,F值越大, 其对应的P值越小;反之亦然。
方差分析的概述
方差分析的核心是变异的分解:将所有 观察值之间的变异分解成几部分,每一 部分均反映了特定的内容(如某因素的作 用、交互作用)。
12=3; 1=3 2 1 = 2 3; 1 2 3
两两比较:任两个均数比较以及多个实验组 与一个对照组比较两个类型。
计算组间比较的均数差值及95%可信区间。
5、两两比较与95%可信区间
间效 应 量 及 其 95
可 信 区
%
5、成组设计的方差分析资料特点
本例资料为成组设计的单因素计量资料, 进行多组均数间比较。
Within group variance is small compared to variability between means. Clear separation of means.
yy y
-- 4 - 4 - 3 - - 3 - 2 4 - - 2 - 1 3 - 1 0 2 0 - 1 1 1 2 0 2 3 1 3 4 2 4 34
可疑患者
非患者
1.8
2.3
2.9
1.4
2.1
3.2
1.5
2.1
2.7
2.1
2.1
2.8
1.9
2.6
2.7
1.7
2.5
3.0
1.8
2.3
3.4
1.9
2.4
3.0
1.8
2.4
3.4
1.8
3.3
2.0
3.5
均数 1.79
2.31
3.4 2.51(合)
例数 11
9
11
第一组第一例变异(1.8-1.79)+(1.79-2.51)
x x
x
Within group variance is large compared to variability between means.
Unclear separation of means.
1.4 f( F)
1.2
1.0
0.8
0.6
0.4
0.2
0.0
0
1
1 1,2 5
1 5,2 5
第一部分 方差分析 Analysis Of Variance(ANOVA)
R Fisher(1890-1962)
在20世纪30年代发表以F 分布为基础的用于多组 计量资料均数比较假设 检验----方差分析,有时 又被称为变异分析或 F 检验等。
R A Fisher, the founder of statistical inference, working on a mechanical calculator
方差分析主要用途
推断两个及以上总体均数有无区别; 分析两个或多个研究因素主效应及其
交互作用; 回归方程的线性假设检验。
一、成组设计资料的方差分析 (实例分析)
例1、某医院对31名石棉矿工中的石棉肺 患者、可疑患者、非患者进行了用力肺 活量测定,结果见下,问三组石棉矿工 的用力肺活量有无差别?
总变异
31名矿工的用力肺活量的测试值大 小不等,这种变异称为总变异。其 大小SS总=(Xij -X )2 ,即每个观察 值与总均数X 的离均差平均和。
组内变异
每个组内的个体测量值也大小不等,这种 变异称为组内变异(SS组内),反映了随机 误差的大小。
SS组内=(Xij -Xi )2 ,因SS组内与样本例数 有关,为排除其影响,用组内均方代替: MS组内=SS组内/(N-K)
.533
14
a. R Squared = .857 (Adjusted R Squared = .749)
F 7.964 323.742 5.978 11.937
Si g. .005 .000 .016 .004
Partial Eta Squared .857 .976 .749 .749
组内变异 药物变异
通过变异间的相互比较,并构建统计量F 值,计算P值。
方差分析的用途很广,按照设计类型又 可细为很多亚型。
方差分析的主要设计类型
成组设计(完全随机设计):单因素多组 配伍设计:研究因素/配伍因素多组 交叉设计:多个因素 析因设计:两因素及其交互作用 正交试验设计:多因素,多水平。 。。。。。。
1、资料特点分析
研究因素有两个: A:药物因素-不同药物组的重量是否 有差别? B:个体变异因素-不同个体间重量有否差 别?
方差分析变异的分解: SS总=SS组间+SS组内+SS配伍, 总=组间+组内+配伍
2、变异的分解
组
异组
间
内
变
变
异
总变异
配伍变异
3、方差分析过程
建立假设:
假设1:药物因素
药物因素(不同药物):两两比较的q检验 及其均数差值的95%可信区间。
Multiple Comparisons
Dep ende nt Vari able : 肉 瘤 重 量 Bonferroni
(I) 药 物 1.00
(J) 药 物 2.00
3.00
M ea n Di ffe re nce
(I-J) .1800
异组 间 变
异组 内 变
总变异
6、方差分析的应用条件
各样本来自正态总体:中等程度、大样本 方差齐性:最好是例数相等,敏感(变量变换、
修剪) 各样本为相互独立的随机样本(独立性,代表性) 均衡性 效应可加性
二、配伍设计多个样本均数比较 的方差分析
区组 A药
B药
C药 均数
1 2 3 4 5 均数
表1 三组石棉矿工的用力肺活量
石棉肺患者
1.8 1.4 1.5 2.1 1.9 1.7 1.8 1.9 1.8 1.8 2.0 均数 1.79
例数 11
可疑患者
2.3 2.1 2.1 2.1 2.6 2.5 2.3 2.4 2.4
2.31 9
非患者
2.9 3.2 2.7 2.8 2.7 3.0 3.4 3.0 3.4 3.3 3.5 3.4 2.51(合)
组间变异
三组间的均数大小不等,称为组间变异 (SS组间),反映了干预效应与随机误差。
SS组间=ni(Xi -X )2, 为排除组数多少的 影响,用组间均方代替: MS组间=SS组间/(K-1)。
变异的分解:SS总=SS组间+SS组内 自由度的分解:总=组间+组内
组间变异(MS组间) / 组内变异(MS组内)=F
配伍变异
确定P值和做出结论
以1 =2,2 =4,查F界值表, 得P<0.05, 按 照=0.05的水准,拒绝H0,而接受H1, 可认为不同药物的肿瘤重量不同。
以1 =4,2 =4,查F界值表, 得P<0.05, 按 照=0.05的水准,拒绝H0,而接受H1, 可认为不同区组的重量不同。
两两比较及计算效应量的95%可信区间
方差分析结果
变异来源 SS MS F
P
总
10.8 30
组间 9.266 2 4.633 84.54 <0.01
组内 1.534 28 0.0548
按照=0.05的水准,拒绝H0,接受H1, 可认为三组矿工的用力肺活量不同。
SPSS分析结果
MEA SURE
Between Βιβλιοθήκη Baiduroups Within Groups Total
95% Confidence Interval
Lower Bound Upper Bound
-.0064
.3664
.1136
.4864
-.3664
.0064
-.0664
.3064
-.4864
-.1136
-.3064
.0664
两两比较及计算效应量的95%可信区间
个体变异因素两两比较的q检验,以及计算 均数差值的95%可信区间。
Std. Error .0 79 7 9 .0 79 7 9 .0 79 7 9 .0 79 7 9 .0 79 7 9 .0 79 7 9 .0 79 7 9 .0 79 7 9 .0 79 7 9 .0 79 7 9 .0 79 7 9 .0 79 7 9
Si g. .7 99 .0 46 .0 23 .3 01 .7 99 .9 69 .4 45
Type III Sum
Source
of Squares
Corrected Model
.456a
df
Mean Square
6
.076
Intercept
3.092
1
3.092
b l ock
.228
4
.057
drug
.228
2
.114
Error
.076
8
.010
T o ta l
3.625
15
Corrected Total
.3000*
Std. Error .06181 .06181
2.00
1.00
-.1800 .06181
3.00
.1200
.06181
3.00
1.00
-.3000* .06181
2.00
-.1200 .06181
Based on observed means.
Si g. .059 .004 .059 .264 .004 .264
M ultiple Comparisons
Dep ende nt Vari able : 肉 瘤 重 量 Bo nfe rro n i
(I) 区 组 1
2
3
4
(J) 区 组 2 3 4 5 1 3 4 5 1 2 4 5 1
M ean Di fference
(I-J) .1 60 0 .3 10 0 * .3 50 0 * .2 10 0 -.16 0 0 .1 50 0 .1 90 0 .0 50 0 -.31 0 0* -.15 0 0 .0 40 0 -.10 0 0
H0:三种药物作用后的肉瘤重量总体均数相等, 1=2=3
不H全1:等三种药物作用后的肉瘤重量总体均数不等或 =0.05
假设2:个体变异因素
H0:5个区组重量的总体均数相等 H1: 5个区组重量的均数不等或不全等 =0.05
Tests of Between-Subj ects Effects
Dep ende nt Vari able: 肉 瘤 重 量