采用均数和标准差进行方差分析的方法及SAS实现
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
采用均数和标准差进行方差分析的方法及SAS 实现
深圳市中医院 郭志武
【摘要】目的 探讨采用均数和标准差进行方差分析的方法及SAS 程序。方法 通过推导,得到基于均数和标准差的方差分析计算公式,并用简洁的SAS 程序实现。结果 实现了有关算法及SAS 程序。结论 采用均数和标准差进行方差分析是完全可行的,编制SAS 程序可以有效实现相关的计算,得到可靠的结果。
【关键词】均数 标准差 方差分析 SAS
Algorithm for analysis of variance based on mean and standard deviation and realization of SAS program Guo Zhiwu, Shenzhen Traditional Chinese Medicine Hospital, Shenzhen 518033, Guangdong Province, China.
【Abstract 】 Objective To investigate an algorithm for analysis of variance (ANOV A) based on mean and standard deviation, and to try to write a SAS program for it. Methods To generate the formulas for ANOV A based on mean and standard deviation through mathematical deduction, and to write a pithy SAS program for the calculation. Results The algorithm for ANOV A based on mean and standard deviation was generated successfully, and a SAS program was developed. Conclusion It is feasible to obtain an ANOV A procedure using mean and standard deviation. Compiling the relevant SAS program is effective and reliabe for the calculation.
【Key words 】 Mean Standard deviation Analysis of variance SAS
在实际工作中,通常会遇到一些研究资料只有均数和标准差而缺失原始数据的情况,比如年代久远的研究资料、期刊文献的资料等等。对于这些资料,若需进行t 检验是很容易的,有现成的公式可用;但若需对多个样本资料做方差分析就不易了,现有的计算公式以及统计软件的算法都是基于原始数据的,因此有必要探讨基于均数和标准差的方差分析算法,以满足实际工作的需要。 1.算法的推导
对于单因素方差分析,传统的算法是先计算总变异,然后分别算出组间变异和组内变异,最后求出F 值和对应的P 值。这都是基于原始数据来计算的。若只有均数和标准差,则需要通过推导得出计算组内变异和组间变异的公式。
组间变异组间SS 的理论公式为: ∑=-=
k
i i
i X X
n SS 1
2)(组间 (1)
而∑∑===
k
i i
k
i i
i n
X
n X 1
1,因此:
∑∑∑===-
=
k
i k
i i
k
i i
i i
i n
X
n X
n SS 1
21
1][组间 (2)
我们可以把i n 看作是i X 的权数,从而按照加权离差平方和的计算公式得出:
∑∑∑===-
=
k
i i
k
i i i k
i i
i
n
X n X
n SS 1
2
1
1
2)()(组间 (3)
组内变异组内SS 的理论公式为: ∑∑==-=
k i n i ij
i
X X
SS 11
j 2)(组内 (4)
由于组内标准差1
)(1
2
--=
∑=i n j i ij
i n X X
S i
,因此
)1()(2
1
2-=-∑=i i n j i ij n S X X
i
,从而:
∑=-=
k
i i i
n S
SS 1
2
)1(组内 (5)
这样,通过(3)式和(5)式,可以很方便地计算出组间SS 和组内SS ,从而进一步计算出F 值。
至于双因素方差分析和多因素方差分析,可作类似推导,这里不再赘述。 多个样本的两两比较可以遵照现有公式完成。 2.SAS 程序的实现
下面以《卫生统计学》第四版(倪宗瓒主编)第51页例5.1的数据为例,介绍采用均数和标准差进行方差分析的SAS 程序的实现。
/*建立数据集,输入各组组号、样本例数、均数、标准差*/ data a;
input gp $ n X S; cards;
A 11 105.45 10.87
B 9 102.39 14.55
C 10 122.80 17.07 ;
/*采用sql 过程进行方差分析计算*/ proc sql;
create table b as