基于MATLAB的方差分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于MATLAB 的方差分析
(重庆科技学院 数理学院)
摘要:方差分析是重要的,应用广泛的实验数据统计分析方法,其实质是检验多个变量均
值的一致性。运用MATLAB 软件进行单因子及双因子方差分析。 关键字:方差分析,MATLAB,单因子,双因子。
1 引言
方差分析是分析试验(或观测)数据的一种统计方法。在工农业生产和科学研究中,
经常要分析各种因素及因素之间的交互作用对研究对象某些指标值的影响。在方差分析中,把试验数据的总波动(总变差或总方差)分解为由所考虑因素引起的波动(各因素的变差)和随机因素引起的波动(误差的变差),然后通过分析比较这些变差来推断哪些因素对所考察指标的影响是显著的,哪些是不显著的。
2 单因子方差分析
某个可控制因素A 对结果的影响大小可通过如下实验来间接地反映,在其它所有可控制因素都保持不变的情况下,只让因素A 变化,并观测其结果的变化,这种试验称为“单因素试验”。因素A 的变化严格控制在几个不同的状态或等级上进行变化,因素A 的每个状态或等级成为因素A 的一个水平。若因素A 设定了s 个水平,则分别记为 A 1,A 2,…,A s 。
数学模型:
2(,),1,2,...,.i
i X N i s μσ= (1)
显著性影响问题转化为因素A 不同水平下各随机变量总体的均值是否相等问题,即检验假设
012:s H μμμ==
=是否成立 (2)
记号
ij x :
不同水平下的试验结果,i=1,2,…,s ;j=1,2,…,n i ; n=n 1+n 2+…+n s :试验总数;
总平均:11
1i
n s ij i j x x n ===∑∑;
总离差平方和:22
11
()i
n s T
ij
i j S x
x ===
-∑∑; 组内平方和(误差平方和):2
211()i
n s E
ij
i i j S x
x ===
-∑∑,随机因素的影响;
组间平方和(因素平方和):2
211
()i
n s
A i
i j S x
x ===
-∑∑,水平差异的影响;
H 0的拒绝域为:
2
2
()(1,)(1)A E n s S W F s n s s S α⎧⎫-=>--⎨⎬-⎩⎭
检验结果:
高度显著:2
0.012
()(1,)(1)A
E
n s S F s n s s S ->---; 显著:2
0.010.052
()(1,)(1,)(1)A
E n s S
F s n s F s n s s S ---≥>---; 有一定影响:2
0.050.12
()(1,)(1,)(1)A
E n s S
F s n s F s n s s S ---≥>---; 无显著影响:2
0.12
()(1,)(1)A
E
n s S F s n s s S -≤---。
3 单因子方差分析的MATLAB实现
单因素方差分析是比较两组或多组数据的均值,它返回原假设——均值相等的概率
函数anova1
格式p = anova1(X) %X的各列为彼此独立的样本观察值,其元素个数相同,p为各列均值相等的概率值,若p值接近于0,则原假设受到怀疑,说明至少有一列均值与其余列均值有明显不同.
p = anova1(X,group) %X和group为向量且group要与X对应
p = anova1(X,group,'displayopt') % displayopt=on/off表示显示与隐藏方差分析表图和盒图[p,table] = anova1(…) % table为方差分析表
[p,table,stats] = anova1(…) % stats为分析结果的构造
说明anova1函数产生两个图:标准的方差分析表图和盒图.
方差分析表中有6列:第1列(source)显示:X中数据可变性的来源;第2列(SS)显示:用于每一列的平方和;第3列(df)显示:与每一种可变性来源有关的自由度;第4列(MS)显示:是SS/df 的比值;第5列(F)显示:F统计量数值,它是MS的比率;第6列显示:从F累积分布中得到的概率,当F增加时,p值减少.
例一位教师想要检查3种不同的教学方法的效果,为此随机地选取水平相当的15位学生。把他们分为3组,每组5人,每一组用一种方法教学,一段时间以后,这位教师给15位学生进行统考,成绩见下表1。问这3种教学方法的效果有没有显著差异。
Matlab中可用函数
调用格式:p=anova1(X)
含义:比较样本m×n的矩阵X中两列或多列数据的均值。其中,每一列表示一个具有m 个相互独立测量的独立样本。
返回:它返回X中所有样本取自同一总体(或者取自均值相等的不同总体)的零假设成立的概率p。
解释:若p值接近0(接近程度有解释这自己设定),则认为零假设可疑并认为至少有一个样本均值与其它样本均值存在显著差异。
Matlab程序:
Score=[75 62 71 58 73;81 85 68 92 90;73 79 60 75 81]’;
P=anova1(Score)
方差分析表
盒型图
由于p值小于0.05,拒绝零假设,认为3种教学方法存在显著差异。