协方差分析课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
s t i 1 t j 1 2
SE
i 1
s
j 1
y
ij
b b x ij
i
2
其中 S R 的自由度为1, S E 的自由度为n-s-1. 接下来处理回归问题。 将样本数据作回归,即求 , 使
i 1
s
t
j 1
y
ij
x ij
表5.4.2
因素v 试验结果 因素m
v1
v2
m1
m2
X:15,4,7, 9,14,5 Y:98,60,77, 80,95,65 X:10,12,14, 13,2,3 Y:71,80,86, 82,46,35
X;4,5,8,7, 13,11 Y:55,60,75, 65,87,78 X:11,10,2,3, 7, 9 Y:76,68,43, 47,62,70
,并且 相互独立。
上述两个问题的模型可以推广到一般情况。
下面只讨论一个影响因素,一个协变量的 协方差分析模型。 设因素A有s个水平,每个水平试验t次。 数学模型:
yij bx ij i ij
i 1 ,2 , , s
2
j 1 Hale Waihona Puke Baidu2 , , t
s i 1
其中 εij ~N( 0 , σ ) ,并且 相互独立, α i 0
2
最小。 上式对 , 求偏导数,并令其为零,可求 得 , 的估计为
ˆ
i 1
( y ij - y i )( x ij - x i )
j 1 s i 1
s
t
( x ij - x i )
j 1
t
2
ˆx ˆ y
由此可算得
ST
i 1 s t j 1
y
ˆ x ij ˆ ij
2
它的自由度是n-2。
最后处理关于因素A的方差分析问题。 因为 ST 中含有因素A的效应,所以
S A ST S E
这就是因素A的效应, 其自由度为s-1。 关于因素A的方差分析可用方差分析表来 完成分析工作。
综上,我们得到单因素协变量方差分析表
求解模型如下:
令 bi i ,求 bi , b , 使
SS
i 1 s t j 1
y
ij
bi b x ij
2
最小。 记 n st
1 t y i y ij t j 1 1 s x i x ij s i 1
1 s t y y ij st i 1 j 1
方差来源
回归
平方和
自由度
均方和
F值
Fα
显著性
1
SR
因素A
SR
S R n s 1 SE
s-1
SA
误差
SA s 1 SE n s 1
S A n s 1 S E s 1
SE
总和
n-s-1
S
n-1
再令
SS 0 b
SS 0 bi
解得
b
i 1
( y ij - y i )( x ij - x i )
j 1 s i 1
s
t
( x ij - x i )
j 1
t
2
bi y i b x i
所以 bi , b 的估计为
b
i
i 1
( y ij - y i )( x ij - x i )
并且 ij 相互独立。 综合上述假设,得到数学模型: 令 i b0
yij bx ij i ij
i 1 ,2 ,3
2
j 1 ,2 , ,8
3 i 1
其中 εij ~N( 0 , σ ) ,并且 相互独立, α i 0
例题5.4.2 某园艺家研究花的品种v和温 度m对鲜花产量y的影响. 由于试验的地块大小 不一样,他决定引用面积x为协变量,m与v各 取两个水平1和2,对4种组合各试验6次,数据 如表5.4.2。他打算分析x与y的关系,并分析因 素m与v对鲜花产量y的影响。
Ⅱ x y Ⅲ x y
此问题中,A1,A2,A3三个水平是可以控制 的,它们作为分类变量A的值,而苹果第一年产 量x是不可控制的,要分析x与苹果增加重量的 关系,我们把它作为普通变量,即协变量来处 理。 画出x与y的散点图,观察这两个量的关系 可看出,x与y之间有明显的线性关系。于是我 们假设:
(1)第一年重量x和增加重量y之间有线 性关系 y b0 bx 再考虑肥料因素对增重的影响,我们设: (2)施用肥料Ai ,苹果增重为μi (3)影响苹果增重的随机误差为 ij εij ~N( 0 , σ 2 )
j 1 s i 1
s
t
( x ij - x i )
j 1
t
2
b yi b xi
再来处理平方和分解公式。 有上估计,可算出协方差模型中的回归平 方和及误差平方和
( y ij - y i )( x ij - x i ) i 1 j 1 SR s t 2 ( x ij - x i )
第五章
方差分析
§5.4
协方差分析
在方差分析中,因素是可以控制的,每个 水平都可以人为地达到。但是在一些实际问题 中,有些因素是不可能控制的或是难以控制的。 考虑这些因素的影响,并作方差分析的方法称 为协方差分析。
例题5.4.1 研究三种肥料对苹果的增重 效果(肥料因子A有3个水平),又要考虑苹果 树原来产量的影响。选24株同龄苹果树,以它 们第一年的产量x(kg)为协变量,每8株施一 种肥料,以第二年产量y(kg)为因变量,得到 数据如表5.4.1。问三种肥料对苹果树增重有无 显著差异?哪些肥料效果好?第一年产量与苹 果增重有无明显关系?
表5.4.1
样本
x ,y
肥料因素A(水平)
Ⅰ x
y
47 54 52 54 44 52
58 66 53 53 48 58
53 63 64 67 46 54
46 51 58 62 50 61
49 56 59 62 59 70
56 66 61 63 57 64
54 61 63 64 58 69
44 50 66 69 53 66
考虑面积对鲜花产量有线性影响,我们以x为 协变量建立数学模型:
yijk bx ijk i j ij ijk
i 1 ,2 j 1 ,2 k 1 ,2 , ,6
2
其中 i 是因素v的效应, i 是因素m的效应,
ij 是交互效应,x为协变量, εijk ~N( 0 , σ )
SE
i 1
s
j 1
y
ij
b b x ij
i
2
其中 S R 的自由度为1, S E 的自由度为n-s-1. 接下来处理回归问题。 将样本数据作回归,即求 , 使
i 1
s
t
j 1
y
ij
x ij
表5.4.2
因素v 试验结果 因素m
v1
v2
m1
m2
X:15,4,7, 9,14,5 Y:98,60,77, 80,95,65 X:10,12,14, 13,2,3 Y:71,80,86, 82,46,35
X;4,5,8,7, 13,11 Y:55,60,75, 65,87,78 X:11,10,2,3, 7, 9 Y:76,68,43, 47,62,70
,并且 相互独立。
上述两个问题的模型可以推广到一般情况。
下面只讨论一个影响因素,一个协变量的 协方差分析模型。 设因素A有s个水平,每个水平试验t次。 数学模型:
yij bx ij i ij
i 1 ,2 , , s
2
j 1 Hale Waihona Puke Baidu2 , , t
s i 1
其中 εij ~N( 0 , σ ) ,并且 相互独立, α i 0
2
最小。 上式对 , 求偏导数,并令其为零,可求 得 , 的估计为
ˆ
i 1
( y ij - y i )( x ij - x i )
j 1 s i 1
s
t
( x ij - x i )
j 1
t
2
ˆx ˆ y
由此可算得
ST
i 1 s t j 1
y
ˆ x ij ˆ ij
2
它的自由度是n-2。
最后处理关于因素A的方差分析问题。 因为 ST 中含有因素A的效应,所以
S A ST S E
这就是因素A的效应, 其自由度为s-1。 关于因素A的方差分析可用方差分析表来 完成分析工作。
综上,我们得到单因素协变量方差分析表
求解模型如下:
令 bi i ,求 bi , b , 使
SS
i 1 s t j 1
y
ij
bi b x ij
2
最小。 记 n st
1 t y i y ij t j 1 1 s x i x ij s i 1
1 s t y y ij st i 1 j 1
方差来源
回归
平方和
自由度
均方和
F值
Fα
显著性
1
SR
因素A
SR
S R n s 1 SE
s-1
SA
误差
SA s 1 SE n s 1
S A n s 1 S E s 1
SE
总和
n-s-1
S
n-1
再令
SS 0 b
SS 0 bi
解得
b
i 1
( y ij - y i )( x ij - x i )
j 1 s i 1
s
t
( x ij - x i )
j 1
t
2
bi y i b x i
所以 bi , b 的估计为
b
i
i 1
( y ij - y i )( x ij - x i )
并且 ij 相互独立。 综合上述假设,得到数学模型: 令 i b0
yij bx ij i ij
i 1 ,2 ,3
2
j 1 ,2 , ,8
3 i 1
其中 εij ~N( 0 , σ ) ,并且 相互独立, α i 0
例题5.4.2 某园艺家研究花的品种v和温 度m对鲜花产量y的影响. 由于试验的地块大小 不一样,他决定引用面积x为协变量,m与v各 取两个水平1和2,对4种组合各试验6次,数据 如表5.4.2。他打算分析x与y的关系,并分析因 素m与v对鲜花产量y的影响。
Ⅱ x y Ⅲ x y
此问题中,A1,A2,A3三个水平是可以控制 的,它们作为分类变量A的值,而苹果第一年产 量x是不可控制的,要分析x与苹果增加重量的 关系,我们把它作为普通变量,即协变量来处 理。 画出x与y的散点图,观察这两个量的关系 可看出,x与y之间有明显的线性关系。于是我 们假设:
(1)第一年重量x和增加重量y之间有线 性关系 y b0 bx 再考虑肥料因素对增重的影响,我们设: (2)施用肥料Ai ,苹果增重为μi (3)影响苹果增重的随机误差为 ij εij ~N( 0 , σ 2 )
j 1 s i 1
s
t
( x ij - x i )
j 1
t
2
b yi b xi
再来处理平方和分解公式。 有上估计,可算出协方差模型中的回归平 方和及误差平方和
( y ij - y i )( x ij - x i ) i 1 j 1 SR s t 2 ( x ij - x i )
第五章
方差分析
§5.4
协方差分析
在方差分析中,因素是可以控制的,每个 水平都可以人为地达到。但是在一些实际问题 中,有些因素是不可能控制的或是难以控制的。 考虑这些因素的影响,并作方差分析的方法称 为协方差分析。
例题5.4.1 研究三种肥料对苹果的增重 效果(肥料因子A有3个水平),又要考虑苹果 树原来产量的影响。选24株同龄苹果树,以它 们第一年的产量x(kg)为协变量,每8株施一 种肥料,以第二年产量y(kg)为因变量,得到 数据如表5.4.1。问三种肥料对苹果树增重有无 显著差异?哪些肥料效果好?第一年产量与苹 果增重有无明显关系?
表5.4.1
样本
x ,y
肥料因素A(水平)
Ⅰ x
y
47 54 52 54 44 52
58 66 53 53 48 58
53 63 64 67 46 54
46 51 58 62 50 61
49 56 59 62 59 70
56 66 61 63 57 64
54 61 63 64 58 69
44 50 66 69 53 66
考虑面积对鲜花产量有线性影响,我们以x为 协变量建立数学模型:
yijk bx ijk i j ij ijk
i 1 ,2 j 1 ,2 k 1 ,2 , ,6
2
其中 i 是因素v的效应, i 是因素m的效应,
ij 是交互效应,x为协变量, εijk ~N( 0 , σ )