统计学实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学数学实验报告
单因素方差分析
姓名
专业
学号
单因素方差分析
摘要统计学是关于数据的科学,它所提供的是一套有关数据收集、处理、分析、解释数据并从数据中得出结论的方法,统计研究的是来自各个领域的数据。单因素方差分析也是统计学分析的一种。单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响。关键字单因素、方差、数据统计
方差分析(analysis of variance,ANOVA)就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。当方差分析中之涉及一个分类型自变量时称为单因素方差分析(one-way analysis of variance).
单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响。例如要检验汽车市场销售汽车时汽车颜色对销售数据的影响,这里只涉及汽车颜色一个因素,因而属于单因素方差分析。
为了更好的理解单因素方差分析,下面举个例子来具体说明单因素方差所要解决的问题。从3个总体中各抽取容量不同的样本数据,结果如下表1所示。检验3个总体的均值之间是否有显著差异(α=0.01)P29210.1
样本1 样本2 样本3
158 153 169
148 142 158
161 156 180
154 149
169
如果要进行单因素方差分析时,就需要得到一些相关的数据结构,从而对那些数据结构进行分析,如下表2所示:
分析步骤
1.提出假设
与通常的统计推断问题一样,方差分析的任务也是先根据实际情况提出原假设H0与备择假设H1,然后寻找适当的检验统计量进行假设检验。本节将借用上面的实例来讨论单因素试验的方差分析问题。
表中的数据可以看成来自s 个不同总体(每个水平对应一个总体)的样本值,将各个总体的均值依次记为,则按题意需检验假设
不全相等
2. 构造检验的统计量 (1)计算个样本的均值
假如从第i 个总体中抽取一个容量为1i 的简单随机样本,令i x 为第i 个总体样本的样本均值,则有
i
n j ij
i n x
x i
∑==
1
其中: k i ,...,2,1=
式中,
n i
为第i 个总体的样本量的第个观测值。例如根据上表1中的数据,分别计算
三个样本的均值为:
样本1的均值=++++==
∑=5
1691541611481581
5
1
11
n x
x j j
i 158
由此可得样本2、样本3的均值分别为150,169 (2)计算全部观测值的总均值。
它是全部观测值的总和除以观测值的总个数,令总均值为x ,则公式为
n
x
n n
x
x k
i i
i j ij
k
i i
n ∑∑∑====
=
1
1
1
根据上表1中的数据我们可得出三个样本的总均值为
11
1
1
1212
158148161154169153142156149169158180
12
158.083
n i
k
k
ij
i
i j i x
n x
x ====
=
+++++++++++=
=∑∑∑ (3)计算各误差平方和
为构造检验计算量,在单因素方差分析中,需要计算三个误差平方和,即总平方和、组建平方和(因素平方和)、组内平方和(误差平方和或残差平方和)。
①总平方和(sum of squares for total ),记为SST ,它是全部观测值ij x 与总观测值
x 的误差平方和,其计算是为
∑∑
==-=i
n j ij
k
i x x
SST 1
1
)(
例如在前面式中我们已经计算出083.158=x ,计算出的总平方和为
2
2
...(158158.083)(180158.083)SST =+=--1216.918
②组间平方和(sum of squares for factor A ),记为SSA 。它是各组均值i x (k i ,...,2,1=)与总均值x 的误差平方和,反映各个样本之间的差异程度,因此又称为因素平方和。其计算公式为
21
)(x x n SSA k
i i i -=∑=
例如根据上面计算的有关结果,计算组建平方和为
=
-=∑=23
1
)(x x n SSA i i i =-⨯+-⨯+-⨯222)083.158169(3)083.158150(4)083.158158(5618.918
③组内平方和(sum of squares for error ),记为SSE 。它是每个水平或组的各样本数据与其组均值的误差平方和,反映每个样本观测值的离散状况。该平方和反映了随机误差的大小,其计算公式为:
21
1
)(∑∑
==-=i
n j i ij
k
i x x
SSE
在上例中先求出各样本数据与其均值的误差平方和,然后将三个误差平方和加总,即SSE 。计算误差平方和分别为:
样本1:
=-++-+-=-∑=22225
1
11)158169(...)158148()158158()(j j
x x
246
由此可得,样本2 、样本3的误差平方和为110,242 然后将其加总可以得到:246+110+242=598 上述三个平方和的关系为
=
-∑∑==2
1
1
)(x x
j
n j ij
k
i ∑∑==-i
n j ij
k i x x
1
1
)(+2
1
)(x x n k i i i -∑=+21
1
)(∑∑
==-i
n j i ij
k
i x x
即总平方和(SST )=组间平方和(SSA )+组内平方和(SSE ) 从上面计算结果也可以证明这一点:1216.918=618.918+598 (4)、计算统计量