方差分析与回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/4/26
概率论与数理统计
5
9.1 一元方差分析
表9.2中的数据可看成来自4个不同的总体(每一个水平 对应一个总体)的容量为4的样本值。我们假设各总体 均为正态变量,即 X1, X 2, X 3, X 4分别服从N(i, 2) ,(i 1,2,3,4)。 X ij ( j 1,2,3,4) 是从总体 X i 中抽得的简单随机样本 按题意,即要检验假设 H0 :1 2 3 4 。 故这是一个检验方差相等的多个正态总体均值是否相 等的问题。方差分析法就是解决这类问题的一种统计 方法。
方差来源
平方和
自由度
均方
F值
因素的影 响
(组间) 误差 (组内)
总和
r
2 ni (X i X )2 i1
r ni
1
(X ij X i )2
i1 j1
r ni
(X ij X )2
i1 j1
r 1
nr
n 1
S
*2 2
r
1
1
2
F
S
*2 2
S1*2
S1*2
n
1
r
1
2020/4/26
概率论与数理统计
2020/4/26
概率论与数理统计
6
9.1 一元方差分析
下面来推导更一般的问题。
设有r个正态总体X i ~ N (i , 2 )(i 1, ,r), 这里假定r个 总体的方差相等,都为 2,做假设
H0 :1 2 r
现独立地从各总体上取出一个样本,用r个样本检验上 述假设是否成立。
采用直观的离差分解的方法来处理上述问题。将每个样
10
9.2 一元线性回归
一般来讲,客观世界中存在的变量之间的关系可分为 两大类,一类是变量之间为确定关系,另一类是非确 定关系。确定关系指变量之间的关系可用函数关系表 示。自变量取确定值时,因变量也随之确定。如 f (x) x2 2 ,这是在高等数学中所研究的函数关系。而 另一类非确定关系即所谓的相关关系,具有统计规律 性。下面举一些例子来说明。
2020/4/26
概率论与数理统计
2
9.1 一元方差分析
例 为了比较四种不同肥料对某农作物产量的影响,
选用一块肥沃程度和水利灌溉比较均匀的土地,将其 分成16小块,如下表所示(按下表划分土地是为了尽可 能减少土地原有肥沃程度及灌溉条件差异的影响,只 分析肥料这个因素对产量的影响) 。
表9.1
A1
本看成一组,则组内平均
X i
1 ni
ni
X ij
j1
2020/4/26
概率论与数理统计
7
9.1 一元方差分析
总平均
1 r ni
1r
X
n
i1
X ij
j1
n
ni Xi
i1
r
n ni i1
总离差平方和为
r ni
r ni
( Xij X )2
[(Xij Xi ) ( Xi X )]2
2020/4/26
概率论与数理统计
1
9.1 一元方差分析
一项试验中,若只有一个因素在改变,称为单因素试 验;多于一个因素在改变的试验称为多因素试验。
因素(即影响试验指标的条件)可分为两类:一类是可 控因素,如温度、比例、浓度等;一类是不可控因素, 如测量误差、气象条件等。这里所说的因素是可控因 素,且称因素所处的不同状态为该因素的不同水平。
A2
A3
A4
A2
A3
A4
A1
A3
A4
A1
A2
A4
A1
A2
A3
2020/4/26
概率论与数理统计
3
9.1 一元方差分析
在表9.1中, Ai 表示在一小块土地上施第i种肥料。显
x
然施每种肥料的各有四小块土地,所得产量由表9.2给
出。问施肥对该作物的产量有无显著影响,若影响显
著,施哪种肥料为好?
肥料种类 (Ai)
2020/4/26
概率论与数理统计
11
9.2 一元线性回归
(1) 人的身高X与Y体重之间存在一定的变量关系。一般来说人高
一些,体重也重一些。但同样高度的人,体重往往不一定相同。 (2) 人们的收入水平X与消费水平Y之间也有一定的关系。人们的
收入水平X越高,相应的消费水平Y也越高,但收入水平相同的人 消费水平却不一定相同。 (3) 人的血压X与年龄Y之间也存在着这种关系,一般年龄大的人 血压也高,然而相同年龄的人血压往往各不相同。
A1
表9.2
收获量(xi) 98 96 91 96
平均收获 量( x ) 95.25
A2
60 69 50 35
53.50
A3
79 64 81 70
73.50
A4
90 70 79 88
81.75
2020/4/26
概率论与数理统计
4
9.1 一元方差分析
例1是一个单因素试验,这个因素就是肥料,不同的肥 料A1,A2,A3,A4就是这个因素的4个水平。在因素的 每一水平下进行独立试验,所得数据如表9.2所示。可 以看出,虽然所施肥料相同,其他生产条件也一样, 但相同面积土地的收获量是不相等的。这说明产量也 是一个随机变量。从表9.2右边所示的平均收获量又可 以看出,施不同的肥料对收获量是有影响的。现在判 断肥料对作物产量的影响问题,就是要辨别收获量之 间的差异主要是由抽样误差造成的还是由肥料的影响 造成的。
i1 j1
i1 j1
r ni
r
( Xij Xi )2 ni ( X i X )2
i1 j1
i1
1 2
1 2 称为离差分解。 下面通过比较 1 和 的数值来检验假设 H0。
2
2020/4/26
概率论与数理统计
8
9.1 一元方差分析
可以证明,在假设 分布 2 (n r)和 2 (r
第9章 方差分析及回归分析
在科学实验和生产实践中,影响一些事物的因素往往 很多 。在众多影响因素中,有的影响较大,有的影响 较小。为了解决这类问题,一般需要做两步工作。第 一步是设计一个实验,使得这个实验一方面能很好地 反映我们所感兴趣的因素的作用,另一方面实验的次 数要尽可能地少,尽可能地节约人力、物力和时间。 其次是如何充分地利用实验结果的信息,对我们所关 心的事物(因素的影响)作出合理的推断。方差分析和 回归分析都是数理统计中具有广泛应用的内容,本章 介绍的是最基本的内容。
H0成立时, 1) 。
1 和
2
2 2
相互独立且服从
由F分布定义知
2
F
2 (r 1) 1
(n r)2 (r 1)1
~ F(r 1,n r)
2(nr)
所以
F
S2*2 S1*2
来自百度文库
(n r )2 (r 1)1
~
F (r
1,n r )
2020/4/26
概率论与数理统计
9
9.1 一元方差分析
为方便计算F的数值,常用下面的方差分析表来计算, 见表9.3。