一元方差分析讲解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一元方差分析(one way ANOVA)
Part 1 原理
概念:
一元:输入X(分散性数据)只有一个,但有不同的水平;输出Y(连续型数据)只有一个, 不同的X对于一个Y
目的:检验在不同输入水平下,对应的Y值的均值是否都相等。
前提:
1)当输入变量x只有一个且为离散型数据,y也只有一个,且为连续
型数据;
2)X有m个水平,每个水平下做了n个样本;
3)每个Xi水平下的,所做的n个结果(Yi1, yi2, yij, …,Yin) 服从正态分布;
4) m组数据的方差都相等,即:
σ12=σ22=σi2=…=σm2
目的:检验H0: u1=u2=…=ui=…=um 是否成立,即m组数据的均值是否相等,
H1: u1, u2, …, ui, …, um 至少有一个不等
容易知道,总共有m*n个数据,那么这些数据总的离散程度SST为:
ΣΣ(yij-y)2= ΣΣ[ ( yij-yi )+(yi-y )]2
= ΣΣ(( yij-yi )2+ ΣΣ (yi-y ))2+ 2 ΣΣ(yij-y) (yi-y )
﹛ (a+b)2=a2+b2+2ab , 容易理解吧﹜
容易证明2 ΣΣ(yij-y) (yi-y )=0
所以,上式= ΣΣ(( yij-yi )2+ ΣΣ (yi-y ))2
不难看出,ΣΣ(( yij-yi )2正好是组内离散度的总和,即SSE(error);
而ΣΣ (yi-y ))2正好是组间离散度的总和,即SSF(factor)
所以,SST=SSE+SSF
记m*n=N, SST, SSF, SSE的自由度和平均值分别为:
此时,一元方差分析里有个F值怎么算呢?
F=MSF/MSE, 得到一个F的数值,F的自由度为(m-1, N-m),这样查F函数,就能得到一
个P值。
如果查到到这个F<Fα(m-1, N-m),那么就应该接受H0,否则接受H1;
用P值来判断,如果P>α,那么就应该接受H0, 否则接受H1.
Part 2 用minitab 做一元方差分析
第一步:输入数据。将同一个X水平下所获得的Y的数值放入到mimitab的同一列中,得
到n列数据。
第二步:堆叠数据。点击“数据”---“堆叠”---列---选中这n列数---选中“当前工作表的列”,在这两个对话框中分布键入“Y,X”---点击“确认”
第三步:分析数据的稳定性。点击“统计”---“控制图”---“单值的变量控制图”---“I-MR”---变量选“Y“---点击“ I-MR 选项”---点击“阶段”—在“用此变量定义阶段”里选“X”列---确认
第四步:正态性检验。点击“图形”—“概率图”—“多个”,确定----“图形变量”选Y---“用于分组的类别变量”选X---确定。如果各列数据的P值都大于0.05,说明数据的正
态性比较好。
第五步:等方差检验。点击“统计”---“方差分析”---“等方差检验”—“响应”选Y,
“因子”选X—确认—点击minitab上面的工具栏图标,返回到minitab的对话框—
可以看到P值,如果P值大于0.05,那么说明其方差是相等的。
第六步:等均值检验。前面的五步,都是为了验证做一元方差分析所必须满足的前提,到了这步才是我们真正想知道的。点击“方差分析”—“单因子”---“响应”选Y—“因子”选X---确定。这时会看到minitab的主对话框,可以依据几个参数对原假设H0进行判断:a)P 值,如果P值低于0.05,则拒绝原假设,所谓if P value is low, Ho must go.
b) 各个u的置信区间,如果没有相互重叠的区域,则拒绝H0,否则接受H0.
如果想知道是哪几个u不等,可以在minitab中执行以下操作:
同时按下ctrl 键和E键,这时会跳出刚才操作的界面,点击“图形”----点击“比较”---选
择“Fisher”---确认。这时,minitab会逐一地比较各个u 值的差异,就可以知道哪些是不相等的了。
还可以看看其残差如何。点击“图形“—选择“四合一”—确定。这时会跳出一个残差图,分别由“正态概率图”、“与拟合值”、“直方图”、“与顺序”四个图组成。
更进一步,看ε2检验。ε2=SSF/SST. SSF是组间(因子)的变异,SSE是组内(噪音)的变异,SST=SSE+SSF。如果ε2大于0.8,那么说明变异主要是人员造成的。