统计学双因素方差分析论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关于林业部门对松树的不同树种在不同地区的生长情况的数据分析———--—-统计学双因素方差分析
摘要:
松树,又名常青树,顾名思义它四季都是绿色的,使人们四季都能有春天的感觉。
它不仅有很高的观赏价值,还很坚固顽强,常年不死。
因此如果在城市种植的话,不但可以供市民观赏,而且它的存活机率高,便于林业部门打理。
但它的种类繁多,而且不同地区的土壤也是有差别的,林业部门想根据其生长的直径,考虑不同的树种和不同的地区对它的生长状况有怎样的影响。
采用双因素方差分析方法。
关键词:双因素方差分析直径 SPSS软件
正文:
一、引文:
松树,又名常青树,顾名思义它四季都是绿色的,使人们四季都能有春天的感觉.它不仅有很高的观赏价值,还很坚固顽强,常年不死。
但它的种类繁多,而且不同地区的土壤也是有差别的,林业部门想根据其生长的直径,考虑不同的树种和不同的地区对它的生长状况有怎样的影响。
采取的分析方法:有重复双因素方差分析,单因素方差分析。
分析过程应用了Excel 2003 软件和SPSS 统计学软件。
二、统计学分析方法的理论依据:
方差分析(ANOVA)是通过检验各总体均值是否相等来判断分类型数据自变量对数值型因变量是否有显著影响。
双因素方差分析法是一种统计分析方法,这种分析方法可以用来分析两个因素的不同水平对结果是否有显著影响,以及两因素之间是否存在交互效应。
因为在实际应用中,一个试验结果(试验指标)往往受多个因素的影响。
不仅这些因素会影响试验结果,而且这些因素的不同水平的搭配也会影响试验结果。
一般运用双因素方差分析法,先对两个因素的不同水平的组合进行设计试验,要求每个组合下所得到的样本的含量都是相同的。
在本分析中,我们所研究的因素是地区和松树种类,水平是不同的地区和不同的松树。
本分析中使用的有重复双因素方差分析方法即有交互作用的双因素方差分析方法。
有交互作用的双因素方差分析处理方法:把交互作用当成一个新因素来处理,即把每种搭配A i B j看作一个总体X ij .
基本假设:(1)X ij 相互独立;
(2)X ij ~ N(μi j,σ2),(方差齐性)。
线性统计模型
其中 所有期望值的总平均
水平Ai 对试验结果的效应
ﻩ 水平Bj 对试验结果的效应 交互效应
ﻩ试验误差
特性: ﻩ
要判断因素A ,B及交互作用A ⨯B 对试验结果是否有显著影响,即为检验如下假设是否成立:
总离差平方和: 可分解为: SS A 称为因素A的离差平方和,反映因素A 对试验指标的影响.
S SB 称为因素B 的离差平方和,反映因素B 对试验指标的影响。
SS A⨯B 称为交互作用的离差平方和,反映交互作用A ⨯B对试验指标的影响. SS E 称为误差平方和,反映试验误差对试验指标的影响。
若“各因素、 各水平及其交互作用的影响无统计意义"的假设成立,则X ijk ~N (μ,σ2)。
可推得:
则
()ijk i j ijk ij X μαβαβε=++++11
1a b
ij
i j ab μμ===∑∑1
1b
i ij i j a αμμμμ
==-=-∑1
1
a j
ij
j
i b
βμμμμ==-=-∑()ij i j
ij
αβμμαβ=---ijk ijk ij X εμ=-1
1
0; 0; a
b i
j i j αβ====∑∑()()()
21
1
0; 0; ~0,a b
ijk ij ij i j N αβαβεσ====∑∑0112:0
a H ααα====0212:0
b H βββ====()()
03:0 1,2,,;1,2,
,ij H i a j b αβ===()
2
111a
b
n
T ijk i j k SS X X
====-∑∑∑T A B A B E
SS SS SS SS SS
⨯=+++()()()
2222
2
2
~1,
~1,
~1A
B
T
SS SS SS a b abn χχχσσσ
---()()()()()
2222~11,~1A B E SS SS a b ab n χχσσ
⨯---()()~1,1A A A
A E E E
SS df MS F F a ab n SS df MS ==--
由F A,FB ,FA ×B 作右侧假设检验来考察各因素及因素间的交互作用对试验指标的影响力。
双因素(有重复)试验方差分析表
三、数据采集与整理:
原始资料直接来源于林业部门针对4个地区、3种松树的生长直径的数据资料。
如下表所示:
方差来源 因素A 总和
平方和 A SS B SS T
SS 自由度 A df E
df T
df 均方和
A
A A
SS MS df =E E E
SS MS df =
F 值
A
A E
MS F MS =
F 值临介值
()()(1,1)
F a ab n α--因素B
误差 E
SS B
df B B B
SS MS df =
B
B E
MS F MS =
()()(1,1)
F b ab n α--A B ⨯A B
SS
⨯A B
df ⨯A B A B A B
MS SS df ⨯⨯⨯=A B A B
E
MS F MS ⨯⨯=
()()()(11,
1)
F a b ab n α---()()
~1,1B B B
B E E E SS df MS F F b ab n SS df MS ==--()()()()
~11,1A B A B A B A B
E E E
SS df MS F F a b ab n SS df MS ⨯⨯⨯⨯==---
用Excel将表格整理为如下表:
四、双因素方差分析:
1、提出假设:
0A :μ1=μ2=μ3 树种类型对于松树的生长直径没有显著影响。
1A: μi(i=1,2,3)不全相等树种类型对松树的生长直径有显著影响。
0B:μ1=μ2=μ3=……=μ4 种植地区对于松树的生长直径没有显
著影响.
H1B: μj(j=1,2,…4)不全相等种植地区对松树的生长直径有显著影响。
H0C :μij=0(i=1,2,3,j=1,2,….4)树种类型和种植地区对于松树的生长直径没有显著影响.
H1C:μij(i=1,2,3,j=1,2,…4)不全相等树种类型和种植地区对于松树的生长直径有显著影响。
2、运用SPSS软件进行分析
(1)将表中数据输入到软件中,如下图:
续上表: 续上表:
续上表:
(2)进行双因素方差分析并得出分析结果。
①描述性统计量:
DescriptiveStatistics
Dependent Variable:直径
树种地区Mean Std. Deviation N
1 1 19。
6000 5。
45894 5
220。
0000 3.39116 5
3 23。
4000 3.78153 5
4 17。
6000 5。
1283
5 5
Total 20。
1500 4.67102 20
2 1 24.0000 3.5355
3 5
2 26.0000 3.74166 5
3 19.8000 5。
40370 5
4 21.0000 3.67423 5
Total 22.7000 4。
5664720
3 1 15.0000 4.89898 5
2 16。
8000 4。
43847 5
321.4000 3.91152 5
418。
80004.32435 5
Total 18.0000 4。
72396 20Total 1 19。
53335。
78010 15
2 20。
93335.33809 15
321.53334。
37308 15
4 19.1333 4.34029 15
Total20.2833 4。
9680060 ②方差齐性检验:
结论:表中P=0。
837>0.05,方差具有齐性。
③方差分析结果
:
结论:由上表得出,树种的P=0。
006<0。
05,拒绝H0
A,接受H1A,树种类型对松树的生长直径有显著影响。
地区的P=0。
394〉0。
05,接受H0B,种植地区对于松树的生长直径没有显著影响。
而树种*地区的P=0。
051虽然大于0。
05,但由于种植地区对于
松树的成长影响不显著,因此,接受H0C,交互作用的影响不显著。
(3)单因素方差分析:
Sum ofSquares df MeanSqu
are F Sig。
Between
Groups
221。
433 2 110。
717 5。
111 .009 Within
Groups
1234。
750 57 21。
662
Total1456.18359
结论:利用单因素方差分析,得出树种的P=0.009<0.05,进一步确认了树种之间的差异是显著的。
(4)使用箱图分析各树种的直径:
图一
五、总结:
根据上述的实验,我们得出实验结果:树种类型的P值小于显著性水平(α=0.05),拒绝原假设,树种类型对于松树的直径有显著影响。
因此,林业部门在种植松树时,要把重心放在松树品种的选取上,又根据箱图(图一)可知:B树种的平均直径更大些,所以选择种植B种松树最好。