概率论与数理统计(茆诗松)第二版课后第八章习题参考答案

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第八章 方差分析与回归分析

本章前三节研究方差分析,讨论多个正态总体的比较,后两节研究回归分析.讨论两个变量之间的相关关系.

§8.1 方差分析

8.1.1

问题的提出

上一章讨论了单个或两个正态总体的假设检验,这里讨论多个正态总体的均值比较问题.

通常为了研究某一因素对某项指标的影响情况,将该因素在多种情形下进行抽样检验,作出比较.一般将该因素称为一个因子,所检验的每种情形称为水平.在每个水平下需要考察的指标都分别构成一个总体,比较它们的总体均值是否相等.对每一个总体都分别抽取一个样本,样本容量称为重复数.

如果只对一个因子中的多个水平进行比较,称为单因子方差分析,对多个因子的水平进行比较,称为多因子方差分析.本章只进行单因子方差分析.

例 在饲料养鸡增肥的研究中,现有三种饲料配方:A 1 , A 2 , A 3 ,为比较三种饲料的效果,特选24只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量.实验结果如下表所示: 饲料

鸡重/g

A 1 1073 1009 1060 1001 1002 1012 1009 1028 A 2 1107 1092 990 1109 1090 1074 1122 1001 A 3 1093 1029 1080 1021 1022 1032 1029 1048 在此例中,就是要考察饲料对鸡增重的影响,需要比较三种饲料对鸡增肥的作用是否相同.这里,饲料就是一个因子,三种饲料配方就是该因子的三个水平,每种饲料喂养的雏鸡60天后的重量分别构成一个总体,这里共有3个总体,每一个总体抽取样本的重复数都是8,比较这3个总体的均值是否相等. 8.1.2

单因子方差分析的统计模型

设因子A 有r 个水平A 1 , A 2 , …, A r ,在每个水平下需要考察的指标都构成一个总体,即有r 个总体,分别记为Y 1 , Y 2 , …, Y r ,对每一个总体都分别抽取一个样本,首先考虑重复数相等的情形,设重复数都是m ,总体Y i 的样本Y i 1 , Y i 2 , …, Y im ,i = 1, 2, …, r .作出以下假定:

(1)每一个总体都服从正态分布,即r i N Y i i i ,,2,1),,(~2L =σµ;

(2)各个总体的方差都相等,即22

221r σσσ===L ,都记为σ 2;

(3)各个总体及抽取的样本相互独立,即Y ij 相互独立,i = 1, 2, …, r ,j = 1, 2, …, m . 需要比较它们的总体均值是否相等,即检验的原假设与备择假设为

H 0:µ 1 = µ 2 = … = µ r vs H 1:µ 1 , µ 2 , …, µ r 不全相等,

如果H 0成立,就可以认为这r 个水平下的总体均值相同,称为因子A 不显著;反之,如果H 0不成立,就称为因子A 显著.

在水平A i 下的样品Y ij 与该水平下的总体均值µ i 之差ε ij = Y ij − µ i 为随机误差.由于Y ij ~ N (µ i , σ 2 ),因此随机误差ε ij ~ N (0 , σ 2 ).对所有r 个水平下的总体均值求平均,即

∑==+++=r

i i r r r 1

211)(1µµµµµL

称为总均值.每个水平A i 下的总体均值µ i 与总均值µ 之差a i = µ i − µ 称为该水平A i 下主效应.显然所有

主效应a i 之和等于0,即

01

=∑=r

i i

a

检验所有水平下的总体均值是否相等,也就是检验所有主效应a i 是否全等于0.这样单因子方差分析在重复数相等的情形下,统计模型为

⎪⎪⎩⎪

⎪⎨⎧===++=∑=).

,0(;

0;,,2,1,,,2,1,2

1

σεεµN a m j r i a Y ij r i i ij i ij 相互独立,且都服从L L 检验的原假设与备择假设为

H 0:a 1 = a 2 = … = a r = 0 vs H 1:a 1 , a 2 , …, a r 不全等于0. 8.1.3

平方和分解

一.试验数据

对于r 个总体下的试验数据Y ij , i = 1, 2, …, r ,j = 1, 2, …, m ,记T i 表示第i 个总体下试验数据总和,

⋅i Y 表示第i 个总体下样本均值,n = rm 表示总的样本容量,T 表示总的试验数据总和,Y 表示总的样本均

值,即

∑==m

j ij i Y T 1

,∑=⋅==m

j ij i i Y m m T Y 11, i = 1, 2, …, r ,

∑∑∑=====r i m

j ij r i i Y T T 11

1,∑∑∑=⋅=====r

i i r i m j ij Y r Y rm T n Y 111111, 用⋅i Y 作为µ i 的点估计,Y 作为µ 的点估计.又记⋅i ε表示第i 个总体下随机误差平均值,ε表示总的随机误差平均值,即

∑=⋅=m

j ij i m 11εε, i = 1, 2, …, r ,

∑∑∑=⋅====r

i i r i m j ij r n 1

1111εεε.

显然有⋅⋅+=i i i Y εµ,εµ+=Y .

在单因子方差分析中通常将试验数据及基本计算结果写成表格形式 因子水平

试验数据

和 和的平方

平方和

A 1 Y 11 Y 12 … Y 1m T 1 21T

∑2

1j

Y A 2 Y 21 Y 22 … Y 2m T 2 22T

∑22j

Y

┆ ┆ ┆ ┆ ┆ ┆ ┆

A r

Y r 1

Y r 2

Y rm

T r

2r T ∑2

rj

Y

Σ T

∑=

r

i i T 1

2

∑∑==r

i m

j ij

Y

11

2

相关文档
最新文档