概率统计第八章

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

定理1 在单因子方差分析模型及前述符号下,有
1 ) S E / 2 ~ 2 ( n r ), 从而E ( Se ) ( n r ) 2
2 ) S A / 2 ~ 2 ( r 1)
3 ) S A与S E 相互独立
S A / f A S A /( r 1) 4 ) F ~ F (r 1 , n r ) S E / f E S E /( n r )
r
2
2 y ij j 1
mi
468 509
1091 1476

Ti 2 n 10 T 180 m 3498 3544 i 1 i
2 2 T 180 由此可求的各类偏差平方和如下 ( 3240) n 10
ST 3544 3240 304, fT 10 1 9
表1 鸡饲料试验数据
饲料A
A1 A2
A3
鸡重( g )
1073 1009 1060 1001 1002 1012 1107 1092 1093 1029 990 1109 1090 1074 1009 1028 1122 1001
1080 1021 1022
1032 1029 1048
试比较三种饲料对鸡的增肥作用是否相同。
取 0.01, F1 0.01 (3,6) 9.78,
由于 F 11.22 9.78,
故拒绝原假设,
认为各水平间有显著差异.
§8· 2
★ 变量间的两类关系
回归分析
y f ( x) y f ( x)
1 、确定性关系-----函数关系
2 、非确定性关系------相关关系
fA r 1 S E ST S A
T yij
i 1 j 1 r mi
fE n r
例2.某食品公司对一种食品设计了四种新包装.为
考察哪种包装最受顾客欢迎,选了10个地段繁华程度
相似、规模相近的商店做试验,其中两种包装各指定
两个商店销售,另两种包装各指定三个商店销售. 在 试验期间内各店货架排放的位置、空间都相同,营业
本例中,我们要比较的是三种饲料对鸡的增肥作用
是否相同.为此,把饲料称为因子,记为A ,三种不同的 配方称为因子
A
的三个水平,记为 A1 , A2 , A3 ,使用
配方 Ai 下第j只鸡60天后的重量用
y ij 表示,i 1,2,3
j 1,2,,8 .我们的目的是比较三种饲料配方下的平均
重量是否相等,为此,需要做一些基本假设,把所研究
【例1】 解:设三种饲料喂养下鸡的重量分别是
i (i 1,2,3) 且 i ~ N ( i , 2 )
需检验
H 0 : 1 2 3
计算过程如下表:
表4 例1试验数据计算表 水平
A1
73
数据(原始数据-1000)
9 60 1 2 12 9 28
Ti
194
585 354
fT 24 1 23
505177 1133 2 SA 9660.08 8 24
fA 3 1 2
S E ST S A 37876.04 9660.08 28215.96
f E 23 2 21
将上述结果填入方差分析表
表5 例1方差分析表 来源 因子A 误差E 总和T 平方和 自由度 均方和 4830.04 1343.62 F比
S E ST S A
T yij
i 1 j 1 r m
【注】 在单因子方差分析中, 数据
yij ( i 1, , r , j 1, , m )经线性变换 xij yij a b 后,算得的统计量 F值不变.
4.方差分析表 表3 来源 因子 误差 总和 单因子方差分析表 均方和 F比
Ti yi . m
r
T1 T2 Tr
y1. y 2. yr .
T
其中 Ti yij
j 1
y
T T y rm n
T Ti
i 1
n rm
1.平方和分解公式
ST ( yij y )2
i 1 j 1 r m
总偏差平方和
fT n 1
9660.08
28215.96 37876.04
2
21 23
3.59
取 0.05, F0.95 (2,21) 3.47,
由于 F 3.59 3.47,
故拒绝原假设,
认为饲料对鸡的增肥是有显著性影响的.
五、重复数不等情形
设从第i个水平下的总体中获得 mi 个试验结果,
yij 第i个水平第j次试验的结果 i 1,2,, r , j 1,2,, mi
2. 统计模型
设从第i个水平下的总体中获得 m个试验验结果,
yij 第i个水平第j次试验的结果 i 1,2,, r , j 1,2,, m
yij i ij , i 1,, r , j 1,, m 2 ~ N ( 0 , ) ij 诸 ij 相互独立
fT f E f A
2.
检验方法
偏差平方和Q的大小与数据个数(或 自由度)有关, 一般说,数据越多,其 偏差平方和越大 .为了便于在偏差 平方和间进行比较,引 入均方和
MS Q / f Q
- - - 均方和
其意义为每个自由度上有多少平方和,它比较好地度 量了一组数据的离散程度. 令
MS A S A / f A F MS E S E / f E
第八章 方差分析与回归分析
§ 8· 1 方差分析
一、问题的提出 例1 在饲料养鸡增肥的研究中,某研究所提出了三种饲 料的配方:A1 是鱼粉为主的饲料,A2 是一槐树粉为主的饲 料, A3是一苜蓿粉为主的饲料,为比较三种饲料的效果, 60天后观察它们的重量,实验结果如下:
特选24只相似的雏鸡随机均分为三组,每组各喂一种饲料,
i 1
r
Ti yi . mi
T Ti
i 1
ቤተ መጻሕፍቲ ባይዱ
r
2 r mi T 2 2 ST ( yij y )2 yij yij ny 2 n i 1 j 1 i 1 j 1 i 1 j 1 r r
mi
mi
fT n 1
2 2 T T 2 2 S A ( yi . y ) mi ( yi . y ) i n i 1 j 1 i 1 i 1 m i r r r mi
个单位。
●高个子的父辈有生高个子儿子的趋势,但是一群高个
子父辈的儿子们的平均身高要低于父辈的平均身高。 譬如, x 80, y ˆ 75.01,低于父辈的平均身高。 ●低个子的父辈的儿子们虽为低个子,但其平均身高要 比父辈的平均身高高一些。譬如, x 60, y ˆ 64.69
高于父辈的平均身高。
统计学家高尔顿(Gaiton)在研究父与子身高的遗传问题
时,观察了1078对父与子,用x表示父亲身高,y表示成年
儿子的身高,发现将(x,y)点在直角坐标系中,这1078
个点基本在一条直线周围,并求出了该直线方程(单位: 英寸,1英寸=2.54cm): y ˆ 33.73 0.516 x
这表明: ●父亲身高每增加1个单位,其儿子身高平均增加0.516
表4 单因子方差分析的试验数据 因子水平 试验数据 y11 y12 y1m1
y21 yr 1
mi

A1 A2 Ar
T1 T2 Tr
平均 y1.
y22 y2 m2 yr 2 yrmr
y 2. yr .
T
其中 Ti yij
j 1
y
T y n
n mi
( 2 )
需检验的假设 H 0 : 1 2 r
H1 : 1 , 2, , r不全相同
( 3)
四、检验统计量
表2 单因子方差分析的试验数据 因子水平 试验数据 和 平均
A1 A2 Ar
m
y11 y21 yr 1
y12 y1m y22 y2 m yr 2 yrm
S A 3498 3240 258, f A 4 1 3
S E 304 258 46, f E 10 4 6
方差分析表如下
表5 例2方差分析表 来源 因子A 误差E 总和T 平方和 258 46 304 自由度 均方和 86 7.67 F比
3
6 9
11.22
Ti
2
37636
242225 125316
j 1 10024
60355 20984

m
2 yij
A2 107 92 -10 109 90 74 122 1 A3 93 29 80 21 22 32 29 48
1133 505177
91363
由公式:
1133 2 ST 91363 37876.04 24
的问题归结为一个统计问题,然后用方差分析的方法进
行解决.
二、方差分析的基本概念
1. 什么是方差分析? 方差分析是根据试验结果鉴别各有关因素对试验
的结果影响程度的一种统计方法.
2. 因子(因素) 试验中需要考虑的可控制的条件. 3. 水平 因子所处的不同的状态. 4. 单因子试验
试验中只有一个因子在改变而其他保持不变的试验.
r
n mi
i 1
yij i ij , i 1, , r , j 1, , m i 2 ~ N ( 0 , ) ij 诸 ij 相互独立 需检验的假设
( 5.1 )
H 0 : 1 2 r
, H1 : 1 , 2, , r不全相同
S E ( yij yi . )2
i 1 j 1
r
m
组内偏差平方和
S A m ( yi . y )
i 1
r
f E r ( m 1) n r
2
组间偏差平方和 fT r 1
ST S E S A 总平方和分解公式
★ ★ 回归分析的内容(任务) 1 对模型中的参数进行估计 (求回归方程) 2 对模型的可信度进行检验( 显著性、相关性) 3 对模型的拟合效果进行考察(残差分析) 4 对变量进行预测和控制
★★ 回归分析的含义
回归分析是定量地描述变量间的相关关系,并根据这
些数量关系对现象进行预测和控制的一种统计方法。
只有一个自变量的回归分析称为一元回归分析;
多于一个自变量的回归分析称为多元回归分析。
★ “ 回归”(regression)一词的来源
“回归” 一词来源于生物学,它是用来描述子代身 高与父代身高的一种关系。早在19世纪,英国生物学家兼
三、单因子方差分析的统计模型
1. 模型的假设
设因子A有r个水平A1 , A2 ,, Ar 假设:
( 1 ) 每一总体均为正态N ( i , i2 ), i 1,2,, r
2 ( 2 )各总体方差相同 12 2 r2 2
( 1)
( 3 )各总体中取出的样本是 相互独立的 .
平方和 自由度
SA SE ST
fA r 1
fE n r
fT n 1
MS A S A / f A MS E S E / f E
MS A F MS E
对给定的 ,可作如下判断: 如果F F1 ( r 1 , n r ),则认为因子 A显著;
如果F F1 ( r 1 , n r ),则认为因子 A不显著
员的销售方法也基本相同,经过一段时间,记录其销
售数据,列于下表的左半边,其相应的计算结果列于
右侧:
销售量数据及计算表
包装类型
A1 A2 A3 A4
销售量数据 m i
12 18 14 12 13 19 17 24 30 21
2 3 3 2
Ti
30 39 57 54
Ti / mi
450 507 1083 1458
拒绝域W {F F1 (r 1 , n r )}
3.具体计算格式
2 r m T 2 2 ST yij yij ny 2 , n i 1 j 1 i 1 j 1 r m
1 r 2 T2 1 r 2 S A Ti Ti ny 2 m i 1 n m i 1
相关文档
最新文档