第四章 方差分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• • • • • • • • • • • • • • • • • • • • • • • •
Data new; Do c=1 to 5; Input n; Do i=1 to n; Input x @@; Output; End; End; Cards; 6 21.5 19.5 20.0 22.0 18.0 20.0 6 16.0 18.5 17.0 15.5 20.0 16.0 5 19.0 17.5 20.0 18.0 17.0 4 21.0 18.5 19.0 20.0 4 15.5 18.0 17.0 16.0 ; Proc anova; Class c; Model x=c; Run;
二.样本含量不相等
• 5个不同品种猪的育肥试验,后期30天增重(kg)如表 6-16所示。试比较品种间增重有无差异。 • 表6-16 5个品种猪30天增重 • 品种 增 重 • B1 21.5 19.5 20.0 22.0 18.0 20.0 • B2 16.0 18.5 17.0 15.5 20.0 16.0 • B3 19.0 17.5 20.0 18.0 17.0 • B4 21.0 18.5 19.0 20.0 • B5 15.5 18.0 17.0 16.0
棉布
府绸
的确凉
尼龙
2.33 2.00 2.93 2.73 2.33
2.48 2.34 2.68 2.34 2.22
3.06 3.06 3.00 2.66 3.06
4.00 5.13 4.61 2.80 3.60
程序如下:
DATA an; DO i=1 TO 4; DO a=1 TO 5; INPUT x @@; OUTPUT; END; END; CARDS; 2.33 2.00 2.93 2.73 2.33 2.48 2.34 2.68 2.34 2.22 3.06 3.06 3.00 2.66 3.06 4.00 5.13 4.61 2.80 3.60 ; PROC ANOVA; CLASS i; MODEL x=i; RUN;
g 3 3 3 3 3 3 3 3
数据步
data aa1;
input x g @@;
cards;
2.79 2.69 3.11 3.47 1.77 2.44 2.83 2.52 1 1 1 1 1 1 1 1 3.83 3.15 4.70 3.97 2.03 2.87 3.65 5.09 2 2 2 2 2 2 2 2 5.41 3.47 4.92 4.07 2.18 3.13 3.77 4.26 3 3 3 3 3 3 3 3
4 、两两比较:可以认为对照与水层RNA组间,对照组 与酚层RNA组间均有差别,而还不能认为水层RNA组与 酚层RNA组间有差别。
单因素方差分析 一.样本含量相等
某劳动卫生教研组研究棉布、府绸、的确凉、 尼龙四种衣料内棉花吸附十硼氢量。每种衣料各做 五次测量,所得数据如表。试检验各种衣料间棉花 吸附十硼氢量有没有显著差别?
GLM过程(General Linear Model)
其实ANOVA过程和GLM过程都是常用的方差分析的两个过程。ANOVA 过程适用于平衡的数据。意思就是如果按所分析的变量将观测值分类, 则每个格子内的观测值数目应相同。而对于某些特殊的设计类型如单因 素方差分析、拉丁设计、完全嵌套设计等,即使不平衡也可用ANOVA。 GLM过程对于平衡或非平衡数据都适用。因此,如果不能判断是否适用 ANOVA,最好改用GLM。特别是现在的临床试验由于病人失访、数据缺 失等很多原因,基本都是不平衡数据,这时GLM就尤其适用了。当然, 要提的一句是ANOVA过程比GLM过程运行速度快,要求的存储空间小, 但对于日益升级的电脑来说,这一点就微不足道了。
常用MODEL语句效应模型如下:
1)主效应模型
MODEL y=a ;(单因素方差分析模型) MODEL y=a b;(二因素方差分析模型) MODEL y=a b c;(三因素方差分析模型) 模型中,a ,b ,c 是主效应,y 是因变量 。
2)交互效应模型
MDOEL y=a b a*b MDOEL y=a b c a*b a*c b*c a*b*c; 模型中, a ,b ,c 是主效应, a*b,a*c ,b*c,a*b*c 是交互效应,y 是因变量。
X 2.79 2.69 3.11 3.47 1.77 2.44 2.83 2.52
g 1 1 1 1 1 1 1 1
表 6.2 资料数据格式 X g X 3.83 2 5.41 3.15 2 3.47 4.70 2 4.92 3.97 2 4.07 2.03 2 2.18 2.87 2 3.13 3.65 2 3.77 5.09 2 4.26
PROC GLM的过程格式
PROC GLM; CLASS 变量表; MODEL 因变量表=效应; MEANS 效应〈/选择项〉;
例1 :
以小鼠研究正常肝核糖核酸(RNA)对癌细胞的生 物学作用,试验分为对照组(生理盐水)、水层 RNA组和酚层RNA组,分别用此三种不同处理诱导肝 细胞的FDP酶活力,得数据如下。该三组资料均服 从正态分布,试比较三组均数有无差别?
MS区组/ MS误


二、 应用条件
独立性: 各样本是相互独立的随机样本 ; 正态性: 各样本来自正态总体; 方差齐性: 各总体方差相等。
不满足条件的处理
(1)轻微
– 允许应用t检验、方差分析来作分析。
(2)严重
– 数据转换
– 非参数统计
五、方差分析所用的过程
ANOVA过程(Analysis Of Variance)
Data new; Do c=1 to 5; Do i=1 to 6; Input x @@; Output; End; End; Cards; 21.5 19.5 20.0 16.0 18.5 17.0 19.0 17.5 20.0 21.0 18.5 19.0 15.5 18.0 17.0 ; Proc anova; Class c; Model x=c; Run;
一、方差分析的基本思想
根据资料的设计类型和研究目的,把全部观察值 的变异(总变异)分解为两个或多个部分,每 部分可以用某因素的作用来解释,将某因素解 释的变异和误差变异进行比较,作出某因素是 否有统计学意义的结论。
完全随机设计的方差分析表
变异来源
组间(处理组间) 组内(误差)
SS SS组间 SS组内
df k-1 N-k
MS
F

SS组间/v组间 MS组间/ MS组 SS组内/v组内

SS总
N-1
随机区组设计的方差分析表
变异来源
处理组
SS SS处理
df k-1
MS SS处理/ k-1 SS区组/ b-1 SS误差/v误差
F MS处理/ MS误

区组
误差
SS区组
SS误差 SS总
b-1
N-k- b+1 N-1
过程步1---正态性检验
proc univariate normal; class g; var x;
run;
过程步2--方差分析
proc anova; class g; model x=g;
run;
过程步3 --方差分析同时输出统计表
proc anova;
class g;
model x=g;
12.0 8.5 8.5 9.8 10.9 9.2 10.4 8.2 10.0
PROC ANOVA; CLASS a b; MODEL x=a b; RUN;
二.有Βιβλιοθήκη Baidu复的两因素方差分析
• 【例6.6】为了研究饲料中钙磷含量对幼猪生长发育的影 响,将钙(A)、磷(B)在饲料中的含量各分4个水平进行交 叉分组试验。先用品种、性别、日龄相同,初始体重基本 一致的幼猪48头,随机分成16组,每组3头,用能量、蛋 白质含量相同的饲料在不同钙磷用量搭配下各喂一组猪, 经两月试验,幼猪增重结果(kg)列于表6-29,试分析钙磷 对幼猪生长发育的影响。
过程步--glm过程
proc glm; /*方差分析*/ class g; model x=g; means g/ hovtest snk ; run;
结果解释:
1、三组数据正态性检验作出判断
2、方差齐性检验:F=1.45,P=0.2567 >0.05,方差齐;
3、方差分析:F=4.28,P=0.0275,拒绝H0,差别有统计学 意义,三组小鼠FDP酶活力不全相等。
(3) MEANS语句是选择语句,计算并输 出所列的效应对应的因变量均数,若指明了 选择项,则将进行主效应均数间的检验。常 用的选择项如下:
• DUNCAN: 对MEANS语句列出的所有主效应均值进行DUNCAN检验。 • SNK: 对MEANS语句列出的所有主效应均值进行Student-Newman-Keuls检验。 • T | LSD: 对MEANS语句列出的所有主效应均值进行两两t检验,它相当于在样本含 量相同时的LSD检验。 • ALPHA= 均值间对比检验的显著水平,缺省值是0.05。当用DUNCAN选项时只能 取0.01、0.05和0.10,对于其它选项,α可取0.0001到0.9999之间的任何值。 • CLDIFF: 在选项T和LSD时,过程将两个均值之差以置信区间的形式输出。 • CLM: 在选项T和LSD时,过程把变量的每一水平均值以置信区间的形式输出。
means g;/*关于均数和标准差的统计表
*/
run;
过程步4--方差分析同时进行方差齐性检验和两两比较
proc anova; class g; model x=g; means g/ snk; run; /*homogeneity of variance*/
过程步(完整)
proc univariate normal; /*正态性检验*/ class g; var x; run; proc anova; /*方差分析*/ class g; model x=g; means g/ hovtest snk ;(HOVTEST选项实现方差齐性检验) run;
高级生物统计
第四章 方差分析
目的与要求: (一)掌握内容 1. anova和glm过程的格式 2.能对SAS程序的输出结果作出合理解释 (二)熟悉内容 snk、Dunnett、Bonfferoni等多重比较方法 在SAS中的实现
过程简介
方差分析在SAS系统中由SAS/STAT模 块来完成,其中我们常用的有ANOVA过程 和GLM过程。前者运算速度较快,但功能较 为有限;后者运算速度较慢,但功能强大。 本章将首先介绍方差分析所用数据集的建立 技巧,然后重点介绍这两个程序步。
表 6.1 对照组 2.79 2.69 3.11 3.47 1.77 2.44 2.83 2.52
三组小鼠的 FDP 酶活力 水层 RNA 组 酚层 RNA 组 3.83 5.41 3.15 3.47 4.70 4.92 3.97 4.07 2.03 2.18 2.87 3.13 3.65 3.77 5.09 4.26
DATA an; DO b=1 TO 8; DO a=1 TO 4; INPUT x @@; OUTPUT; END; END; CARDS;
8.4 12.8 9.6 9.4 15.2 9.1 9.8 12.9 11.2 12.2 14.4 9.8
9.8
8.8 8.4 8.6 8.9 7.9
9.9 8.2 9.9 9.0 8.1
受试者编 号 (区组) 1
2 3 4
处理组
1 2 3 4
8.4 12.8 9.6 9.8
9.4 15.2 9.1 8.8
9.8 12.9 11.2 9.9
12.2 14.4 9.8 12.0
5
6
8.4
8.6
8.2
9.9
8.5
9.8
8.5
10.9
7
8
8.9
8.4
9.0
9.4
9.2
9.8
10.4
10.0
22.0 15.5 18.0 20.0 16.0
18.0 20.0 17.0 . .
20.0 16.0 . . .
两因素方差分析
一.无重复观察值
用4种不同方法治疗8名患者,其血浆凝固时间 的资料如表9-5,试作方差分析。 数据步中,变量a代表不同治疗方法,其水平数 是4,变量b代表区组因素,其水平数是8。过程步 中,用CLASS语句指明两个因素a和b,用MODEL 语句指明二因素的效果模型。
相关文档
最新文档