5_第五讲_方差分析与秩和检验20080解析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Within group variance is large compared to variability between means. Unclear separation of means.
1.4 1.2 1.0 0.8 0.6 0.4 0.2 0.0 0
f( F)
1 1, 2 5
1.792.313.4(三组) 推断总体
H0三总体均数相等
三总体均数不等/不全等
12=3, 1=23, 1= 3 2, 123
1=2=3 P值
小概率事件
拒绝H0 不拒绝H0
3、假设检验的步骤
建立假设:
H0:三组矿工用力肺活量的总体均数相等, 1=2=3 H1:三组矿工用力肺活量的总体均数不等或不全等 12=3, 1=23, 1= 3 2, 123
a. R Squared = .857 (Adjusted R Sq uared = .749)
组内变异
药物变异
配伍变异
确定P值和做出结论
以1 =2,2 =4,查F界值表, 得P<0.05, 按 照=0.05的水准,拒绝H0,而接受H1, 可认为不同药物的肿瘤重量不同。 以1 =4,2 =4,查F界值表, 得P<0.05, 按 照=0.05的水准,拒绝H0,而接受H1, 可认为不同区组的重量不同。
(I) 药 物 1.00 2.00 3.00
(J) 药 物 2.00 3.00 1.00 3.00 1.00 2.00
Std. Error .06181 .06181 .06181 .06181 .06181 .06181
Sig . .059 .004 .059 .264 .004 .264
95% Confidence Interval Lower Bound Upper Bound -.0064 .3664 .1136 .4864 -.3664 .0064 -.0664 .3064 -.4864 -.1136 -.3064 .0664
二、配伍设计多个样本均数比较 的方差分析
区组 1 2 3 4 5 A药 0.82 0.73 0.43 0.41 0.68 0.614 B药 0.65 0.54 0.34 0.21 0.43 0.434 C药 0.51 0.23 0.28 0.31 0.24 0.314
1、资料特点分析
• 是配对设计的扩展。具体做法是:先按影响 试验结果的非处理因素(如性别、体重、年 龄、职业、病情、病程等)将受试对象配成 区组(block),再分别将各区组内的受试对象 随机分配到各处理或对照组。
Based on observed means.
两两比较及计算效应量的95%可信区间
个体变异因素两两比较的q检验,以及计算 均数差值的95%可信区间。
Multiple Comparisons Dep endent Variable: 肉 瘤重 量 Bonferroni Mean Difference (I-J) .1600 .3100* .3500* .2100 -.1600 .1500 .1900 .0500 -.3100* -.1500 .0400 -.1000
1、资料特点分析
研究因素有两个: A:药物因素-不同药物组的重量是否 有差别? B:个体变异因素-不同个体间重量有否差 别? 方差分析变异的分解:
SS总=SS组间+SS组内+SS配伍, 总=组间+组内+配伍
2、变异的分解
组 间 变 异 总变异 组 内 变 异
配伍变异
3、方差分析过程
Within group variance is small compared to variability between means. Clear separation of means.
yy y
-4 3 2 1 0 1 2 3 4 4 3 2 1 0 1 2 3 4 4 3 2 1 0 1 2 3 4 x x x
方差分析与秩和检验
第五讲
两两比较次数 与I型错误率
方差分析的基本思想
根据资料的设计类型,即变异的不同来 源,将全部观察值总的离均差平方和和 自由度分解为两个或多个部分,每个部 分的变异与自由度组成均方(MS),均 方比值服从F分布,由此做出统计推断, 从而了解各因素对观察指标影响有无统 计学意义。
1 5, 2 5
1 10, 2 10
1 2 3 4
F
方差分析的理论基础:F分布
F分布是方差分析的基础,通过F分布
确定P值。 F分布也是一簇连续性分布,分布类型 与第一、二自由度有关。 当1、2自由度固定时,F值越大,其对 应的P值越小;反之亦然。
方差分析的概述
方差分析主要用途
推断两个及以上总体均数有无区别;
分析两个或多个研究因素作用及其交
互作用;
回归方程的线性假设检验。
一、成组设计资料的方差分析 (实例分析)
例1、某医院对31名石棉矿工中的石棉肺 患者、可疑患者、非患者进行了用力肺 活量测定,结果见下,问三组石棉矿工 的用力肺活量有无差别?
两两比较及计算效应量的95%可信区间
药物因素(不同药物):两两比较的q检验 及其均数差值的95%可信区间。
Multiple Comparisons
Dep endent Variable: 肉 瘤重 量 Bonferroni Mean Difference (I-J) .1800 .3000* -.1800 .1200 -.3000* -.1200
第一部分 方差分析 Analysis Of Variance(ANOVA)
R Fisher(1890-1962)
在20世纪30年代发表以F 分布为基础的用于多组 计量资料均数比较假设 检验----方差分析,有时 又被称为变异分析或 F 检验等。
R A Fisher, the founder of statistical inference, working on a mechanical calculator
Between Groups Within Groups Total
4、方差分析及两两比较
方差分析只能表明三组工人的用力肺活量的 总体均数有差别,还不能说明任何两组间是 否有差别,还需做两两比较检验。
12=3; 1=3 2 1 = 2 3; 1 2 3
两两比较:任两个均数比较以及多个实验组 与一个对照组比较两个类型。 计算组间比较的均数差值及95%可信区间。
5、两两比较与95%可信区间
效 应 量 及 其 95 可 信 区 间 %
5、成组设计的方差分析资料特点
本例资料为成组设计的单因素计量资料, 进行多组均数间比较。 组 间 变 异 总变异 组 内 变 异
6、方差分析的应用条件
各样本来自正态总体:中等程度、大样本 方差齐性:最好是例数相等,敏感(变量变换、 修剪) 各样本为相互独立的随机样本(独立性,代表性) 均衡性 效应可加性
方差分析结果
变异来源 SS 总 10.8 组间 9.266 组内 1.534 MS F P 30 2 4.633 84.54 <0.01 28 0.0548
按照=0.05的水准,拒绝H0,接受H1, 可认为三组矿工的用力肺活量不同。
SPSS分析结果
ANOVA MEASURE Sum of Squares 9.266 1.534 10.800 df 2 28 30 Mean Square 4.633 .055 F 84.544 Sig. .000
第一组第一例变异(1.8-1.79)+(1.79-2.51)
1、方差分析过程
变异原因
干预效应
变异表现
ห้องสมุดไป่ตู้组间变异
统计量
组间均方
F值
随机因素
组内变异
组内均方
总变异
3、成组设计方差分析的变异分解
总变异=组间变异+组内变异
(1.8-2.51) = … … (1.79-2.51) … … + (1.8-1.79) … …
表1 三组石棉矿工的用力肺活量
石棉肺患者 可疑患者 非患者
1.8 1.4 1.5 2.1 1.9 1.7 1.8 1.9 1.8 1.8 2.0 均数 1.79 例数 11
2.3 2.1 2.1 2.1 2.6 2.5 2.3 2.4 2.4 2.31 9
2.9 3.2 2.7 2.8 2.7 3.0 3.4 3.0 3.4 3.3 3.5 3.4 2.51(合) 11
方差分析的核心是变异的分解:将所有 观察值之间的变异分解成几部分,每一 部分均反映了特定的内容(如某因素的作 用、交互作用)。 通过变异间的相互比较,并构建统计量F 值,计算P值。 方差分析的用途很广,按照设计类型又 可细为很多亚型。
方差分析的主要设计类型
成组设计(完全随机设计):单因素多组 配伍设计:研究因素/配伍因素多组 交叉设计:多个因素 析因设计:两因素及其交互作用 正交试验设计:多因素,多水平。 。。。。。。
=0.05
构筑统计量:F=组间变异/组内变异 =MS组间/MS组内
如何判断 P 值
假设无效假设成立的情况下,干预无效应, 即MS组间与MS组内接近,则F值接近于1, 在1附近出现的机率多,而出现较大F值 的机率小,当F值大到一定界值时,根据 小概率事件原则,就有理由认为无效假设 不成立,拒绝H0,而接受H1。
95% Confidence Interval Lower Bound Upper Bound -.1458 .4658 .0042 .6158 .0442 .6558 -.0958 .5158 -.4658 .1458 -.1558 .4558 -.1158 .4958 -.2558 .3558 -.6158 -.0042 -.4558 .1558 -.2658 .3458 -.4058 .2058
总变异
31名矿工的用力肺活量的测试值大 小不等,这种变异称为总变异。其 大小SS总=(Xij -X )2 ,即每个观 察值与总均数X 的离均差平均和。
组内变异
每个组内的个体测量值也大小不等,这种 变异称为组内变异(SS组内),反映了随机 误差的大小。 SS组内=(Xij -Xi )2 ,因SS组内与样本例数 有关,为排除其影响,用组内均方代替: MS组内=SS组内/(N-K)
建立假设:
假设1:药物因素
H0:三种药物作用后的肉瘤重量总体均数相等, 1=2=3 H1:三种药物作用后的肉瘤重量总体均数不等或 不全等 =0.05
假设2:个体变异因素
H0:5个区组重量的总体均数相等 H1: 5个区组重量的均数不等或不全等 =0.05
Tests of Between-Subj ects Effects Dep endent V ariable: 肉 瘤重 量 Source Corrected Model Intercept block drug Error Total Corrected Total Type III Sum of Squares .456a 3.092 .228 .228 .076 3.625 .533 df 6 1 4 2 8 15 14 Mean Square .076 3.092 .057 .114 .010 F 7.964 323.742 5.978 11.937 Sig . .005 .000 .016 .004 Partial Eta Squared .857 .976 .749 .749
组间变异
三组间的均数大小不等,称为组间变异 (SS组间),反映了干预效应与随机误差。 SS组间=ni(Xi -X )2, 为排除组数多少 的影响,用组间均方代替: MS组间=SS组间/(K-1)。 三种变异的关系:SS总=SS组间+SS组内 , 总=组间+组内
组间变异(MS组间) / 组内变异(MS组内)=F 组数减1为第一自由度,合并例数减组数为 第二自由度 根据F统计量与一二自由度确定P值
(I) 区 组 1
2
3
4
(J) 区 组 2 3 4 5 1 3 4 5 1 2 4 5 1
Std. Error .07979 .07979 .07979 .07979 .07979 .07979 .07979 .07979 .07979 .07979 .07979 .07979
Sig . .799 .046 .023 .301 .799 .969 .445 1.000 .046 .969 1.000 1.000