华东师范大学茆诗松概率论与数理统计教程方差分析与回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 December 2019
华东师范大学
第八章 方差分析与回归分析
第9页
为对假设( 8.1.1)进行检验,需要从每一水 平下的总体抽取样本,设从第 i个水平下的总 体获得m个试验结果,记 yij 表示第i个总体的 第j次重复试验结果。共得如下 n=r? m个试验 结果:
yij, i=1, 2,…, r , j=1, 2, …, m,
其中r为水平数, m为重复数, i为水平编号, j 为重复编号。
1 December 2019
华东师范大学
第八章 方差分析与回归分析
第10页
在水平 Ai下的试验结果 yij与该水平下的指标
均值 ? i 一般总是有差距的,记 ?ij = y ?ij ? i,
?ij 称为随机误差。于是有
y ij = ? i +?ij
yi. ? y ? (? i ? ?i.) ? (? ? ? ) ? ai ? ?i. ? ? (8.1.12)
yi. ? y 除了反映随机误差外,还反映了第 i个水 平的效应,称为 组间偏差。
1 December 2019
华东师范大学
第八章 方差分析与回归分析
第17页
三、偏差平方和及其自由度
?
在统计学中,把
m
Ti
2
Ti
?y
2 ij
j?1
A1 73 9 60 1 2 12 9 28 194 37636 10024
A2 107 92 -10 109 90 74 122 1 585 342225 60355
A3 93 29 80 21 22 32 29 48 354 125316 20984 1133 505177 91363
k个数据
y1
,
y2
,
…,
y
分别对其均
k
值 y =(y1+ …+ yk )/k 的偏差平方和
k
? Q ? ( y1 ? y )2 ? ? ( yk ? y )2 ? ( yi ? y )2 i?1
称为k个数据的偏差平方和, 它常用来度量若干
个数据分散的程度。
1 December 2019
华东师范大学
第八章 方差分析与回归分析
第18页
?在构成偏差平方和 Q的k个偏差y1? y , …, yk? y 间
有一个恒等式
k
?
( yi ? y ) ? 0
,这说明在 Q中独立
i?1
的偏差只有 k? 1个。
? 在统计学中把平方和中独立偏差个数称为该平 方和的 自由度, 常记为 f,如Q的自由度为 fQ=k? 1。自由度是偏差平方和的一个重要参数。
第23页
定理8.1.2 在单因子方差分析模型 (8.1.8) 及前 述符号下,有
(1) Se /? 2 ~ ? 2(n? r) ,从而 E(Se ) =(n? r) ? 2
r
? E ( S A ) ? ( r ? 1)? 2 ? m
a
2,进一步,若
i
H
0成
i?1
立,则有 SA/? 2 ~? 2(r? 1)
组,每组各喂一种饲料, 60天后观察它们 的重量。试验结果如下表所示:
1 December 2019
华东师范大学
第八章 方差分析与回归分析
第4页
表8.1.1 鸡饲料试验数据
饲料A
鸡 重(克)
A1 1073 1009 1060 1001 1002 1012 1009 1028 A2 1107 1092 990 1109 1090 1074 1122 1001
该检验的 p值也可利用统计软件求出,若 以Y记服从 F(fA ,fe)的随机变量,则检验的 p 值为 p=P(Y? F)。
1 December 2019
华东师范大学
第八章 方差分析与回归分析
第26页
常用的各偏差平方和的计算公式如下:
?? ST
?
r i?1
m j?1
yi2j
?
T2 n
? S A
?
1 m
如今要对因子平方和 SA 与误差平方和 Se 之间进
行比较,用其均方和 MSA= SA /fA , MSe= Se /fe 进
行比较更为合理,故可用 F ? MS A ? S A / f A 作为
检验H0的统计量。
MS e S e / f e
1 December 2019
华东师范大学
第八章 方差分析与回归分析
2
( yij ? yi. )
表示,
i?1 j?1
也称为误差偏差平方和, 其自由度为 fe=n? r ;
1 December 2019
华东师范大学
第八章 方差分析与回归分析
第20页
? 由于组间差异除了随机误差外,还反映了
效应间的差异,故由效应不同引起的数据
r
差异可用 组间偏差平方和 S A ? m? ( yi. ? y )2 i?1
A3 1093 1029 1080 1021 1022 1032 1029 1048
1 December 2019
Hale Waihona Puke Baidu
华东师范大学
第八章 方差分析与回归分析
第5页
本例中,我们要比较的是三种饲料对鸡的增肥 作用是否相同。为此,把饲料称为 因子,记为A, 三种不同的配方称为因子 A的三个水平,记为A1, A2, A3,使用配方 Ai下第 j 只鸡60天后的重量用 yij 表示,i=1, 2, 3, j=1, 2,? , 10。我们的目的是比 较三种饲料配方下鸡的平均重量是否相等,为 此,需要做一些基本假定,把所研究的问题归 结为一个统计问题,然后用方差分析的方法进 行解决。

? ?i. ?
1 m
m
?ij ,
j?1
? ?? ?
?
1 r
r
?i. ?
i?1
1 n
r i?1
m
?ij
j?1
1 December 2019
华东师范大学
第八章 方差分析与回归分析
第16页
由于
yij ? yi. ? (? i ? ?ij ) ? (? i ? ?i ) ? ?ij ? ?i (8.1.11 ) 所以yij - yij仅反映组内数据与组内平均的随机误 差,称为组内偏差; 而
1 December 2019
华东师范大学
第八章 方差分析与回归分析
第7页
1) 每一总体均为正态总体,记为 N(? i ,? i 2),
i=1, 2,…, r ;
2)
各总体的方差相同 :
?
1
2=?
22=…=?
2 r
=?
2

3) 从每一总体中抽取的样本是相互独立的, 即所有的试验结果 yij 都相互独立。
1 December 2019
华东师范大学
第八章 方差分析与回归分析
第6页
8.1.2 单因子方差分析的统计模型
在例8.1.1中我们只考察了一个因子,称其 为单因子试验。
通常,在单因子试验中,记因子为 A, 设其 有r个水平,记为 A1, A2,…, Ar,在每一水平 下考察的指标可以看成一个总体 ,现有 r 个水平,故有 r 个总体, 假定:
? yij ? ? ? ai ? ?ij ,
?
?? r
?
ai ? 0
i ? 1,2,...,r, j ? 1,2,...,m
(8.1.8)
? i?1
???ij相互独立,且都服从N(0,? 2)
假设( 8.1.1 )可改写为 H0 :a1 =a2 =…=ar =0
(8.1.9)
1 December 2019
n ? r ?m ? 总试验次数
1 December 2019
华东师范大学
第八章 方差分析与回归分析
第14页
表8.1.2 单因子方差分析试验数据
因子水平 A1 A2 ┆ Ar
试验数据 y11 y12 … y1m y21 y22 … y2m
┆ yr1 yr2 … yrm
1 December 2019
和 平均
T1
y1
T2
y2
┆┆
Tr
yr
Ty
华东师范大学
第八章 方差分析与回归分析
第15页
二、组内偏差与组间偏差
数据间是有差异的。数据 yij与总平均 y 间 的偏差可用 yij ? y 表示,它可分解为二个 偏差之和
yij ? y ? ( yij ? yi. ) ? ( yi. ? y) (8.1.10)
(8.1.16)
(8.1.16)式通常称为 总平方和分解式。
1 December 2019
华东师范大学
第八章 方差分析与回归分析
第22页
8.1.4 检验方法
偏差平方和 Q的大小与自由度有关,为了便于在 偏差平方和间进行比较,统计上引入了 均方和 的概念,它定义为 MS=Q/fQ ,其意为平均每个 自由度上有多少平方和,它比较好地度量了一 组数据的离散程度。
1 December 2019
华东师范大学
第八章 方差分析与回归分析
第19页
四、总平方和分解公式
?各yij间总的差异大小可用 总偏差平方和 rm
?? ST ?
( yij ? y ) 2
i?1 j?1
表示,其自由度为 fT=n? 1;
? 仅由随机误差引起的数据间的差异可以用
rm
组内偏差平方和 Se ? ??
N
(0,
?
2)
(8.1.3)
总均值与效应 :
称诸
? i 的平均
?
?
1 r
(
?
1
?
... ?
?r)
?
?1 r
r i?1
?i
为总均值 .
称第 i 水平下的均值 ? i 与总均值 ? 的差:
ai=?i -? 为 Ai 的效应。
1 December 2019
华东师范大学
第八章 方差分析与回归分析
第12页
模型( 8.1.3 )可以改写为
表示,也称为 因子A的偏差平方和, 其自
由度为 fA=r? 1;
1 December 2019
华东师范大学
第八章 方差分析与回归分析
第21页
定理8.1.1 在上述符号下,总平方和 ST可以 分解为因子平方和 SA与误差平方和 Se之和, 其自由度也有相应分解公式,具体为:
S T =SA +Se , fT =fA +fe
(8.1.2)
(8.1.2)式称为试验结果 yij 的数据结构式。
1 December 2019
华东师范大学
第八章 方差分析与回归分析
单因子方差分析的统计模型:
第11页
?? yij ? ? i ? ?ij ,i ? 1,2,..., r, j ? 1,2,..., m
? ?
诸?
ij
相互独立,且都服从
r
Ti 2
i?1
?
T2 n
Se ? ST ? SA
(8.1.19)
一般可将计算过程列表进行。
1 December 2019
华东师范大学
第八章 方差分析与回归分析
第27页
例8.1.2 采用例8.1.1的数据,将原始数据减去 1000,
列表给出计算过程:
表8.1.4 例8.1.2的计算表
水 平
数据(原始数据-1000)
(2) SA与Se独立。
1 December 2019
华东师范大学
第八章 方差分析与回归分析
第24页
由定理8.1.2,若H0成立,则检验统计量F服从自由度 为fA和fe的F分布,因此拒绝域为W={F? F1?? (fA ,fe)}, 通常将上述计算过程列成一张表格,称为方差分析
表。
表8.1.3 单因子方差分析表
第八章 方差分析与回归分析
第2页
§8.1 方差分析
8.1.1 问题的提出
实际工作中我们经常碰到多个正态总体 均值的比较问题,处理这类问题通常采 用所谓的方差分析方法。
1 December 2019
华东师范大学
第八章 方差分析与回归分析
第3页
例8.1.1 在饲料养鸡增肥的研究中,某研究
所提出三种饲料配方: A1是以鱼粉为主的 饲料,A2是以槐树粉为主的饲料, A3是以 苜蓿粉为主的饲料。为比较三种饲料的效 果,特选 24 只相似的雏鸡随机均分为三
来源 平方和 自由度 均方和
F比
因子 SA fA=r? 1 MSA= SA/fA F= MSA/ MSe
误差 Se fe=n?r MSe= Se/fe
总和 ST fT=n?1
1 December 2019
华东师范大学
第八章 方差分析与回归分析
第25页
对给定的 ? ,可作如下判断:
? 如果 F >F1?? (fA ,fe),则认为因子 A显著; ? 若F? F1?? (fA ,fe) ,则说明因子 A不显著。
华东师范大学
第八章 方差分析与回归分析
第13页
8.1.3 平方和分解
一、试验数据
通常在单因子方差分析中可将试验数据列成 如下页表格形式。
表8.1.2中的最后二列的和与平均的含义如
下:
m
? Ti ? yij
j?1
yi.
?
Ti m
i ? 1,2, , r
r
T ? ? Ti i?1
y? T ?T r ?m n
1 December 2019
华东师范大学
第八章 方差分析与回归分析
第8页
我们要比较各水平下的均值是否相同, 即要对如下的一个假设进行检验:
H0 :? 1 =? 2 =…=? r
备择假设为
H1 :? 1, ? 2, …, ? r 不全相等
(8.1.1)
在不会引起误解的情况下, H1 通常可省略不写。 如果H0成立,因子A的r个水平均值相同,称因子A的r 个水平间没有显著差异,简称因子A不显著;反之, 当H0不成立时,因子A的r个水平均值不全相同,这时 称因子A的不同水平间有显著差异,简称因子A显著。
1 December 2019
相关文档
最新文档