多个样本及其两两比较的秩和检验SAS程序
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多个样本及其两两比较的秩和检验SAS程序
多个样本及其两两比较的秩和检验SAS程序广东医学院预防医学教研室(524023)丁元林孔丹莉
秩和检验是医学实践中较为常用的一大类非参数统计方法,目前国内几本较具权威性SAS专著11,22,均介绍了秩和检验的一些SAS程序,宇氏132也作了进一步的探讨和总结,但对于不同资料类型和特征的多个样本比较的秩和检验SAS程序阐述得不够全面,而且几乎未涉及到两两比较的SAS程序,但实际工作者往往对两两比较的结果更为感兴趣。
为此,本文结合实例,根据常见类型资料的特点,给出了多个样本及其两两比较的秩和检验SAS程序。
11成组设计的原始数据多个样本及其两两比较
这种类型资料一般为成组设计的定量资料,但各个样本的总体呈偏态分布或方差不齐,且未整理成其他形式(如频数表),检验其总体分布是否相同的常用秩和检验方法是Kruska-l Wallis法,在SAS软件中实现的过程步有以下三种:NPAR1WAY过程、FREQ 过程以及RANK和ANOVA两过程的结合。
各个样本两两比较一般可通过RANK和ANOVA两过程的结合,采用M EANS语句来实现。
对文献142第139页表1中的数据进行Kruska-l Wallis检验及两两比较的SAS程序如下: /*以下为建立数据库*/
data dy1;
do group=1to3;
input x@@;output;
end;
cards;
918016014101211211910162102121310 214215141031121814184113111516510 3171516519319211671441624101316710
;
/*以下为调用F REQ过程*/
proc fr eq;
t ables group*x/scores=rank cmh2noprint;
/*以下为调用N PAR1WAY过程*/
proc npar1way w ilcoxon;
class group;
v ar x;
/*以下为调用RA NK过程*/
proc rank data=dy1out=a;
v ar x;ranks r;
/*以下为调用A NOV A过程*/
proc anova;class group;
model r=group;
means group/lsd;
r un;
以上程序中调用FREQ过程产生的第二个CMH 统计量、NPAR1WAY过程产生的卡方统计量以及ANOVA过程产生的R2与T 总之积,即为为Kruska-l Wallis检验结果。
ANOVA过程步中的M EANS规定采用LSD法进行两两比较。
21成组设计的等级资料或频数表资料多个样本及其两两比较
这种类型的资料为成组设计的等级资料或频数表资料,但为频数表资料时各个样本的总体呈偏态分布或方差不齐,检验其总体分布是否相同的常用秩和检验方法也是Kruska-l Wallis法,在SAS软件中实现的过程步同上,但程序中数据步和过程步的一些细节略有差别。
对文献142第139页表3中的数据进行Kruska-l Wallis检验及两两比较的SAS程序如下:
/*以下为建立数据库*/
data dy1;
do effect=1to4;
do group=1to3;
input f@@;output;end;end;car ds; 102448174165193336478
;
/*以下为调用F REQ过程*/
proc fr eq;
tables group*effect/scores=r ank cmh2noprint;
w eight f;
/*以下为重新定义数据库*/
data a;set dy1;do i=1to f;
output;end;
/*以下为调用N PAR1WAY过程*/
proc npar1way w ilcoxon;
v ar effect;
class group;
/*以下为调用RA NK过程*/
proc rank data=a out=b;
v ar effect;
r anks r;
/*以下为调用A NOV A过程*/
proc anova;
#
313
#
中国卫生统计2002年10月第19卷第5期
class group;model r=group;means group/lsd;r un;
31随机区组设计的多个样本及其两两比较
这种类型资料一般为随机区组设计的定量资料,但各个样本的总体呈偏态分布或方差不齐,检验其总体分布是否相同的常用秩和检验方法是Friedman 法,在SAS 软件中实现的过程步有以下两种:FREQ 过程以及RANK 和GLM 两过程的结合。
各个样本两两比较可通过RANK 和GLM 两过程的结合,采用LSMEANS 语句来实现。
对文献142第141页表2中的数据进行Friedman 检验及两两比较的SAS 程序如下:
/*以下为建立数据库*/data dy1;do block=1to 7;do treat=1to 4;input x @@;output;end;end;cards;
6318813854902382201445430083924514021310054175150 3672300163906420718587;
/*以下为调用F REQ 过程*/proc fr eq;
t ables block *treat *x /scores=rank cmh2noprint;
/*以下为调用SORT 过程*/proc sort data=dy 1out =a;by block;
/*以下为调用RA NK 过程*/proc rank data=a out=b;v ar x;by block;r anks r;
/*以下为调用G LM 过程*/proc glm data=b;class treat block;model r=treat block/ss1;lsmeans treat/stder r pdiff;r un;
以上程序中调用FREQ 过程产生的第二个CMH 统计量和GLM 过程产生的R 2
与(T 总-T 区组)之积,即为Friedman 检验结果。
LSMEANS 语句规定对调整后的样本均数进行两两比较。
参考文献
11高惠璇主编.SAS 系统SAS /S TAT 软件使用手册.北京:中国统计出版社,1997,68-74.
21胡良平主编.现代统计学与SAS 使用.北京:军事医学科学出版社,1996,61-199.
31宇传华,徐勇勇.非参数统计的SAS 计算.中国卫生统计,1999,16(6):367-368.
41杨树勤主编.中国医学百科全书#医学统计学.上海:上海科学技术出版社,1982,129-144.
#简讯#
2002年第一期
高级现代卫生统计学培训班
高级现代卫生管理统计学培训班
优秀学员名单
高级现代卫生统计学培训班:
宋卫亚李琳卓文敏
高级现代卫生管理统计学培训班: 张存仁牟伟益陈林秀汪耘
#314#Chinese Journal of Heal th Stati stics,October 2002,Vol.19,No.5。