统计学第八章方差分析教学指导与习题解答
(完整word版)方差分析习题与答案
(完整word版)方差分析习题与答案统计学方差分析练习题与答案一、单项选择题1.在方差分析中,()反映的是样本数据与其组平均值的差异A总离差B组间误差C抽样误差D组内误差2.是()A组内平方和B组间平方和C总离差平方和D因素B的离差平方和3.是()A组内平方和B组间平方和C总离差平方和D总方差4.单因素方差分析中,计算F统计量,其分子与分母的自由度各为()Ar,nBr-n,n-rCr-1.n-rDn-r,r-1二、多项选择题1.应用方差分析的前提条件是()A各个总体报从正态分布B各个总体均值相等C各个总体具有相同的方差D各个总体均值不等E各个总体相互独立2.若检验统计量F=近似等于1,说明()A组间方差中不包含系统因素的影响B组内方差中不包含系统因素的影响C组间方差中包含系统因素的影响D方差分析中应拒绝原假设E方差分析中应接受原假设3.对于单因素方差分析的组内误差,下面哪种说法是对的?()A其自由度为r-1B反映的是随机因素的影响C反映的是随机因素和系统因素的影响D组内误差一定小于组间误差E其自由度为n-r4.为研究溶液温度对液体植物的影响,将水温控制在三个水平上,则称这种方差分析是()A单因素方差分析B双因素方差分析C三因素方差分析D单因素三水平方差分析E双因素三水平方差分析三、填空题1.方差分析的目的是检验因变量y与自变量某是否,而实现这个目的的手段是通过的比较。
2.总变差平方和、组间变差平方和、组内变差平方和三者之间的关系是。
3.方差分析中的因变量是,自变量可以是,也可以是。
4.方差分析是通过对组间均值变异的分析研究判断多个是否相等的一种统计方法。
5.在试验设计中,把要考虑的那些可以控制的条件称为,把因素变化的多个等级状态称为。
6.在单因子方差分析中,计算F统计量的分子是方差,分母是方差。
7.在单因子方差分析中,分子的自由度是,分母的自由度是。
四、计算题1.有三台机器生产规格相同的铝合金薄板,为检验三台机器生产薄板的厚度是否相同,随机从每台机器生产的薄板中各抽取了5个样品,测得结果如下:机器1:0.236,0.238,0.248,0.245,0.243机器2:0.257,0.253,0.255,0.254,0.261机器3:0.258,0.264,0.259,0.267,0.262问:三台机器生产薄板的厚度是否有显著差异?2.养鸡场要检验四种饲料配方对小鸡增重是否相同,用每一种饲料分别喂养了6只同一品种同时孵出的小鸡,共饲养了8周,每只鸡增重数据如下:(克)配方:370,420,450,490,500,450配方:490,380,400,390,500,410配方:330,340,400,380,470,360配方:410,480,400,420,380,410问:四种不同配方的饲料对小鸡增重是否相同?3.今有某种型号的电池三批,它们分别为一厂、二厂、三厂三个工厂所生产的。
统计学第五版第八章课后习题答案
由Excel制表得:
由图可知:
已知:α= 0、05,n1 = n2=12
=31、75 =28、67 =10、20 =6、06 t=1、72 t∈(-1、72,1、72)接受,否则拒绝。 t=(31 、75-28、67)/(8、08* 0、41)=0、93 0、 93∈(-1、72,1、72)
决策:在α= 0、05得水平上接受 。
已知包重服从正态分布,试检验该日打包机工作就是否正常 ( α
=0、) 。 解:
如图所示:
本题采用单样本t检验。
:μ=100 :μ≠100基
本统计量:
α=0、05,N=9, =99、978,
S=1、2122, =0、4041 检验结果: t=-0、005,自由度f=8, 双侧检验P=0、996,单侧检验P=0、498
:μ≥700
:μ<700
∵α=0、05∴
=-1、645
计算检验统计量: =(680-700)/(60/6)=-2
决策: ∵Z值落入拒绝域,
∴在α=0、05得显著水平上拒绝 ,接受 。
结论: 有证据表明这批灯泡得使用寿命低于700小时,为不合格产品。
8、3 某地区小麦得一般生产水平为亩产250公斤,其标准差为30 公斤。现用一种化肥进行试验,从25个小区抽样,平均产量为270
决策:在 α= 0、05得水平上拒绝 。
结论: 服用阿司匹林可以降低心脏病发生率。
8、14 某工厂制造螺栓,规定螺栓口径为7、0cm,方差为0、03cm。 今从一批螺栓中抽取80个测量其口径,得平均值为6、97cm,方差为 0、0375cm。假定螺栓口径为正态分布,问这批螺栓就是否达到规 定得要求 (a=0、05)?
双侧检验
统计学课后答案(第3版)第8章方差分析习题答案
第八章 方差分析习题答案一、单选1.D ;2.B ;3.A ;4.C ;5.C ;6.C ;7.C ;8.A ;9.B ;10.A二、多选1.ACE ;2.ABD ;3.BE ;4.AD ;5.BCE6.ABCD ;7.ABCDE ;8.ABCE ;9.ACD ;10.ABD三、计算分析题1、运用EXCEL 进行单因素方差分析,有:方差分析:单因素方差分析SUMMARY组 观测数 求和 平均 方差列 1 5 1.21 0.242 2.45E-05列 2 5 1.38 0.276 0.00226列 3 5 1.31 0.262 1.35E-05方差分析差异源 SS df MS F P-value F crit 组间 0.00292 2 0.00146 1.906005 0.191058 3.885294 组内 0.009192 12 0.000766总计 0.012112 14由于P 值=1.906005>05.0=α,不拒绝原假设,没有证据表明3个总体的均值之间有显著差异。
(或用F 值判断,有同样结论)2、运用EXCEL 进行单因素方差分析,有:方差分析:单因素方差分析SUMMARY组 观测数 求和 平均 方差列 1 5 222 44.4 28.3列 2 5 150 30 10列 3 5 213 42.6 15.8方差分析差异源 SS df MS F P-value F crit 组间 615.6 2 307.8 17.06839 0.00031 3.885294 组内 216.4 12 18.03333总计 832 14由于由于P 值=0.00031<05.0=α,拒绝原假设,表明3个总体的均值之间有显著差异。
(或用F 值判断,有同样结论)进一步用LSD 方法见教材P2063、(1)按行依次为:420、2、1.478(第一行);27、142.07(第二行);4256(第三行)。
(2)由于P 值=0.245946>05.0=α,不拒绝原假设,没有证据表明3种方法组装产品数量有显著差异。
黄良文《统计学》课后习题(方差分析)【圣才出品】
各水平均值分别为 X1g 67.8,X 2g 83.2, X 3g 73.6 。 利用 Excel 可得方差分析表,如表 8-4 所示。
表 8-4 方差分析表
3/7
圣才电子书 十万种考研考证电子书、题库视频学习平台
差异源
SS
df
MS
F
P-value
组间
604.93
SS
df
MS
F
P-value
组间
52.62
4
13.16
4.72
0.0105
组内
44.62
16
2.79
—
—
总计
97.24
20
—
—
—
对于 5%的显著性水平,F=4.72>F0.05(4,16)=3.01,因此拒绝原假设,认为不同 品牌的汽油间是存在显著差异的。
同。各水平均值分别为
X1g 13.4, X 2g 13.667,X 3g 11.75, X 4g 16, X 5g 12 。
利用 Excel 可得方差分析表,如表 8-6 所示。
4/7
圣才电子书
十万种考研考证电子书、题库视频学习平台
表 8-6 方差分析表
差异源
(N=4)。各水平均值分别为:
X1g
20
12
15 4
19
16.5
X
2g
17
14
4
12
15
14.5
X 3g
23
16
18 4
14
17.75
X
4g
15
17
4
20
12
16
X 5g
方差分析习题及答案
方差分析习题及答案方差分析习题及答案方差分析是一种统计方法,用于比较两个或多个样本均值之间的差异。
它可以帮助我们确定是否存在显著的差异,并进一步了解这些差异的来源。
在本文中,我们将介绍一些方差分析的习题,并提供相应的答案。
习题一:某研究人员想要比较三种不同的肥料对植物生长的影响。
他随机选择了30个植物,并将它们分成三组,每组10个。
每组植物分别使用不同的肥料进行施肥。
研究人员在10天后测量了每组植物的平均生长高度(单位:厘米)。
下面是测量结果:组1:12, 14, 15, 16, 17, 13, 14, 15, 16, 18组2:10, 11, 13, 12, 14, 15, 13, 12, 11, 10组3:9, 10, 8, 11, 12, 13, 10, 9, 11, 12请使用方差分析方法,判断这三种肥料是否对植物生长有显著影响。
答案:首先,我们需要计算每组的平均值和总体平均值。
组1的平均值为15.0,组2的平均值为11.1,组3的平均值为10.5。
总体平均值为12.2。
接下来,我们计算组内平方和(SS_within),组间平方和(SS_between)和总体平方和(SS_total)。
根据公式,我们有:SS_within = Σ(xi - x̄i)^2SS_between = Σ(ni * (x̄i - x̄)^2)SS_total = Σ(xi - x̄)^2其中,xi代表第i组的观测值,x̄i代表第i组的平均值,x̄代表总体平均值,ni代表第i组的样本量。
计算得到:SS_within = 23.0SS_between = 48.6SS_total = 71.6接下来,我们计算均方(mean square):MS_within = SS_within / (n - k)MS_between = SS_between / (k - 1)其中,n代表总样本量,k代表组数。
计算得到:MS_within = 2.56MS_between = 24.3最后,我们计算F值:F = MS_between / MS_within计算得到:F = 9.49根据F分布表,自由度为2和27时,F临界值为3.35。
第8章课后习题答案
拒绝域为U > u0.05 = 1.645 现算得, x = 20.8 , 那么检验统计量U = x -19 = 20.8 -19 = 3.6 > 1.645 2 / 16 2 / 16
所以拒绝 H0 ,可以认为新工艺下维生素 C 的含量比旧工艺下含量高。
差仍为 2(cm / s) ,问这批推进器的燃烧率是否较以往生产的推进器的燃烧率有 显著的提高?取显著性水平a = 0.05
解:建立统计假设: H0 : m £ 40, H1 : m > 40
采用U 检验法,U = X -19 2 / 16
拒绝域为U > u0.05 = 1.645 由题知, x = 41.25 ,
=
1.237,s
2 0
=
0.012 2
S 2 = 0.035, , X = 4.36,
算得
c2
=
(n -1)S 2
s
2 0
=
6´ 0.0351 0.012 2
= 16.7889
> 14.449
所以拒绝假设 H0 ,即不能认为新工艺炼出的铁水含碳量的方差仍为 0.1122
8、某洗衣粉包装机,在正常工作情况下,每袋标准重量为 1000 克,标准 差s 不能超过 15 克。假设每袋洗衣粉的净重服从正态分布,某天为检查 机器工作是否正常,从已装好的袋中,随机抽查 10 袋,测其净重(克)
问是否可以认为新工艺炼出的铁水含碳量的方差仍为 0.1122 (a = 0.05)
(提示 H 0 :s 2 = 0.1122 , H1 :s 2 ¹ 0.1122 ) 解:设含碳量为 X ,则 X : N (m,s 2 ) 。考虑假设
方差分析习题与答案
统计学方差分析练习题与答案一、单项选择题1.在方差分析中,()反映地是样本数据与其组平均值地差异A 总离差B 组间误差C 抽样误差D 组内误差2.是()A 组内平方和B 组间平方和C 总离差平方和D 因素B地离差平方和3.是()A 组内平方和B 组间平方和C 总离差平方和D 总方差4A r,1AD2ACE3ACE4(AD12345.在试验设计中,把要考虑地那些可以控制地条件称为,把因素变化地多个等级状态称为 .6.在单因子方差分析中,计算F统计量地分子是方差,分母是方差.7.在单因子方差分析中,分子地自由度是,分母地自由度是 .四、计算题1.有三台机器生产规格相同地铝合金薄板,为检验三台机器生产薄板地厚度是否相同,随机从每台机器生产地薄板中各抽取了5个样品,测得结果如下:机器1:0.236,0.238,0.248,0.245,0.243机器2:0.257,0.253,0.255,0.254,0.261机器3:0.258,0.264,0.259,0.267,0.262问:三台机器生产薄板地厚度是否有显著差异?2.养鸡场要检验四种饲料配方对小鸡增重是否相同,用每一种饲料分别喂养了6只同一品种同时孵出地小鸡,共饲养了8周,每只鸡增重数据如下:(克)配方:370,420,450,490,500,450配方:490,380,400,390,500,410配方:330,340,400,380,470,360配方:410,480,400,420,380,410问:四种不同配方地饲料对小鸡增重是否相同?3.今有某种型号地电池三批,它们分别为一厂、二厂、三厂三个工厂所生产地.为评比其一厂二厂三厂41.1.1234567.四、计算题1.解:根据计算结果列出方差分析表因为(2,12)=3.89<32.92,故拒绝,认为各台机器生产地薄板厚度有显著差异.2.解:根据计算结果列出方差分析表。
统计学第八章课后习题答案
8.1解:建立假设: H0:μ=4.55;H1:μ≠4.55这是双侧检验,并且方差已知,检验的统计量 Z 值为:=-1.833而=1.96>|-1.833|,因此不能拒绝原假设,即可认为现在生产的铁水平均含碳量为 4.558.2解:建立假设: H0:μ≥700;H1:μ<700这是左侧检验,并且方差已知,检验统计量 Z 为:Z==-2而-=-1.645>-2,因此拒绝原假设,即在显著性水平 0.05 下这批元件是不合格的。
8.3解:建立假设: H0:μ≤250;H1:μ>250这是右侧检验,并且方差已知,检验的统计量 Z 值为:Z==3.33 而=1.645<3.33,因此拒绝原假设,即这种化肥使小麦明显增产。
8.4解:建立假设: H0:μ=100;H1:μ≠1009/108.055.4484.4−=Z Z 025.036/60700680−Z 05.025/30250270−Z05.0由样本数据可得: ==99.978S===1.212这是双侧检验,并且方差未知,又是小样本,故采用 t 统计量,检验统计量的值为: t==-0.054而(8)=2.306>|-0.054|,因此不拒绝原假设,即该日打包机工作正常8.5、由题意先建立假设,显然不符合标准的比例越小越好,由于采用的是产品质量抽查,即使总体不合标准的比例没有超过5%,属于合格范围,采用右单侧检验。
P=6/50=12%属于单侧检验,当α=0.05时,有,因此拒绝原假设,即认为该批食品不能出厂n X ni ix∑==195.100....7.983.99+++1)(12−−∑=n x ni i x 8)978.995.100(...978.99-7.98978.99-3.99222−+++)()(9/2122.1100-978.99t025.0%5:%,5:1>≤ππH H o 27.250%)51(%5%5%12=−−−=Z 27.2645.105.0<=Z8.6、由题意建立假设:单侧检验,并且方差未知,n=15,属于小样本,故采用t 统计量,检验统计量的值为:α=0.05,,因此不能拒绝原假设,认为该厂家的广告不真实8.7、建立假设:,由样本数据可以得出,这是单侧检验,并且方差未知,是小样本,因此采用t 检验量,检验统计量的值为25000:,25000:10>≤μμH H 549.115/50002500027000/0=−=−=n s x t μ549.1761.1)14(05.0>=t 225,22510>≤H H 5.24116170485 (2121012801591)=++++++==∑=nxx ni i7.9815)5.241170(....)5.241280()5.241159(12221=−++−+−=−=∑=n xs ni in s x t /μ−=669.016/7.982255.241=−=通过查表可得出,,因此不能拒绝原假设,没有理由认为元件的平均寿命显著地大于225小时。
《医学统计学》医统-第八章方差分析
编辑课件
公共卫生系 流行病与统计学教研室
祝晓明
例 8-1 在评价某药物耐受性及安全性的I 期临床试验中,对符合纳入标准的30名健 康自愿者随机分为3组每组10名,各组注 射剂量分别为0.5U、1U、2U,观察48小 时部分凝血活酶时间(s)试问不同剂量的 部分凝血活酶时间有无不同?
编辑课件
编辑课件
• 方差分析
F=3.55, F>F0.05(2,18),P<0.05,三组大鼠 MT 含量的总体均值不全相同。
编辑课件
第三节 多个样本均数的两两比较
证实性研究
探索性研究
证实性研究 与探索性研究
编辑课件
Dunnett-t 检验 LSD-t 检验
SNK-q检验 Tukey检验 Schéffe检验
两个均数的比较时,同一资料所得结果与t检验等
价,即有如下关系 t 2 。F
2.方差分析的基本思想:将全部观测值的总变异按 影响因素分解为相应的若干部分变异,在此基础 上,计算假设检验的统计量 F 值,实现对总体均 数是否有差别的推断。
编辑课件
3. 方差分析有多种设计类型,但基本思想和计算步骤 相同,只是分组变量的个数不同,使用统计软件很容 易实现。 4.多重比较有多种方法,如 Dunnett-t 检验、LSD-t检 验、SNK-q (Student-Newman-Keuls)法 、Tukey法、 Schéffe法、Bonferroni t 检验和 Sidak t 检验。学习 中注意各种方法的适用性。
k1
的
2 分布, 2
2 ,
,认为方差不齐。
编辑课件
例8-1 资料方差齐性检验 提出检验假设,确定检验水准 H0:σ12=σ22=σ32 H1:三组方差不全相等 α=0.05
统计学课后习题答案 第8章的习题答案
1. 解:根据题意建立原假设和备择假设:01:700;:700H H μμ≥<2x Z ===- 由于-2<-1.645,所以Z Z α<-,Z 值位于原假设0H 的拒绝域,所以拒绝0H ,即在显著性水平0.05下该批元件不合格。
2. 根据题意建立原假设和备择假设:01:250;:250H H μμ≤>20 3.336x t ====,0.05(24) 1.7109t =, 由于0.05(24),.t t t t α>>所以t 值位于原假设H 0,即在显著性水平0.05下该种化肥使得水稻明显增产。
3. 解:已知 0620.157,0.155,0.05, 1.96.400p p Z αα===== 根据题意建立原假设和备择假设:01:0.157;:0.157H P H P =≠0.10995P Z ===- -0.10995>-1.96,所以Z 值位于原假设H 0的接受域。
即在显著性水平0.05下随机调查的结果支持该市老年人口比重为15.7%。
4. 解:已知 09,100,99.98, 1.2122n x s μ====。
根据题意建立原假设和备择假设:01:100;:100H H μμ=≠0.020.04950.4041x t -====- -0.0495>-2.306,所以t 位于原假设H 0的接受域,即在显著性水平0.05下,打包机打包正常。
5. 解:已知00.05200,20,208.5,30,(19) 1.7291n x S t μ=====。
根据题意建立原假设和备择假设:01:200;:200H H μμ≤>8.5 1.2676.7083x t ==== t t α<,所以t 值位于原假设H 0的接受域,即在显著性水平0.05下,接受原假设,即在特定时间内每小时经过该地的汽车数量小于200辆。
6. 解:已知015,40,14.5, 2.3,0.05, 1.645n x S Z αμα======。
方差分析习题与答案完整版
方差分析习题与答案 HUA system office room 【HUA16H-TTMS2A-HUAS8Q8-HUAH1688】统计学方差分析练习题与答案一、单项选择题1.在方差分析中,()反映的是样本数据与其组平均值的差异A 总离差B 组间误差C 抽样误差D 组内误差2.是()A 组内平方和B 组间平方和C 总离差平方和D 因素B的离差平方和3.是()A 组内平方和B 组间平方和C 总离差平方和D 总方差4.单因素方差分析中,计算F统计量,其分子与分母的自由度各为()A r,nB r-n,n-rC r-1.n-rD n-r,r-1二、多项选择题1.应用方差分析的前提条件是()A 各个总体报从正态分布B 各个总体均值相等C 各个总体具有相同的方差D 各个总体均值不等E 各个总体相互独立2.若检验统计量F= 近似等于1,说明()A 组间方差中不包含系统因素的影响B 组内方差中不包含系统因素的影响C 组间方差中包含系统因素的影响D 方差分析中应拒绝原假设E方差分析中应接受原假设3.对于单因素方差分析的组内误差,下面哪种说法是对的()A 其自由度为r-1B 反映的是随机因素的影响C 反映的是随机因素和系统因素的影响D 组内误差一定小于组间误差E 其自由度为n-r4.为研究溶液温度对液体植物的影响,将水温控制在三个水平上,则称这种方差分析是()A 单因素方差分析B 双因素方差分析C 三因素方差分析D 单因素三水平方差分析E 双因素三水平方差分析三、填空题1.方差分析的目的是检验因变量y与自变量x是否,而实现这个目的的手段是通过的比较。
2.总变差平方和、组间变差平方和、组内变差平方和三者之间的关系是。
3.方差分析中的因变量是,自变量可以是,也可以是。
4.方差分析是通过对组间均值变异的分析研究判断多个是否相等的一种统计方法。
5.在试验设计中,把要考虑的那些可以控制的条件称为,把因素变化的多个等级状态称为。
统计学(第四版)贾俊平 第八章 方差分析与实验设计 练习题答案
统计学(第四版)贾俊平 第八章 方差分析与实验设计 练习题答案8.10123411234:0:,,,0=0.01SPSS H H ααααααααα====至少有一个不等于用进行方差分析,表8.1-1填装量主体间效应的检验(单因素方差分析表)因变量: 填装量 源 III 型平方和df均方F Sig.偏 Eta 方非中心 参数观测到的幂b校正模型 .007a3 .002 10.098 .001 .669 30.295 .919 截距 295.7791 295.7791266416.430.000 1.000 1266416.4301.000 机器 .007 3 .002 10.098.001.66930.295.919误差 .004 15 .000总计 304.17119 校正的总计.01118a. R 方 = .669(调整 R 方 = .603)b. 使用 alpha 的计算结果 = .01由表8.1-1得:p=0.001<0.01,拒绝原假设,i 0α不全为,表明不同机器对装填量有显著影响。
8.201231123:0:,,0=0.05SPSS H H ααααααα===至少有一个不等于用进行方差分析,表8.2-1满意度评分主体间效应的检验(单因素方差分析表)因变量: 评分 源III 型平方和df 均方 F Sig.校正模型 29.610a2 14.805 11.756 .001 截距 975.156 1 975.156 774.324 .000 管理者 29.610 2 14.805 11.756.001误差 18.890 15 1.259总计 1061.000 18 校正的总计48.50017a. R 方 = .611(调整 R 方 = .559)由表8.2-1得:p=0.001<0.05,拒绝原假设,i 0α不全为,表明管理者水平不同会导致评分的显著差异。
8.301231123:0:,,0=0.05SPSS H H ααααααα===至少有一个不等于用进行方差分析,表8.3-1电池寿命主体间效应的检验(单因素方差分析表)因变量: 电池寿命 源III 型平方和df 均方 F Sig. 偏 Eta 方 非中心 参数 观测到的幂b校正模型 615.600a2 307.800 17.068 .000 .740 34.137 .997 截距 22815.000 1 22815.000 1265.157 .000 .991 1265.157 1.000 企业 615.600 2 307.800 17.068.000.74034.137.997误差 216.400 12 18.033总计 23647.000 15 校正的总计832.00014a. R 方 = .740(调整 R 方 = .697)b. 使用 alpha 的计算结果 = .05由表8.2-1得:p=0.001<0.05,拒绝原假设,i 0α不全为,表明3个企业生产的电池平均寿命之间存在显著差异。
统计学:方差分析习题与答案
一、单选题1、方差分析的主要目的是()。
A.研究类别自变量对数值因变量的影响是否显著B.比较各总体的方差是否相等C.判断各总体是否存在有限方差D.分析各样本数据之间是否有显著差异正确答案:A2、在方差分析中,一组内每个数据减去该组均值后所得结果的平方和叫做()A.组间离差平方和B.组内离差平方和C.以上都不是D.总离差平方和正确答案:C3、在单因素方差分析中,若原假设是H0: α1=α2=⋯=αr=0,则备择假设是()A. α1>α2>⋯>αrB. α1<α2<⋯<αrC.不全为0D. α1≠α2≠⋯≠αr正确答案:C4、下面选项中,不属于方差分析所包含的假定前提是()。
A.等方差假定B.独立性假定C.非负性假定D.正态性假定正确答案:C5、只考虑主效应的双因素方差分析是指用于检验的两个因素()A. 对因变量的影响是有交互作用的B.对自变量的影响是独立的C.对因变量的影响是独立的D. 对自变量的影响是有交互作用的正确答案:C6、下列不属于检验正态分布的方法是()A.Shapiro-Wilk统计检验法B.饼图C.K-S统计检验法D. 正态概率图正确答案:B7、在单因素方差分析中,用于检验的F统计量的计算公式是()A.[(n-r)SSA]/[(r-1)SSE]B.SSA/SSEC. SSA/SSTD.[(n-1)SSE]/[(r-1)SSA]正确答案:A8、在只考虑主效应的双因素方差分析中,因素A有r个水平,因素B有s个水平,因素A和B每个水平组合只有一个观测值,观测值共rs个,下面结论正确的是()A.随机误差的均方差为SSE/(rs-1)B. 因素A检验统计量[SSA/(r-1)]/[SSE/(rs-r-s+1)]C. SSA+SSB=SSTD.因素A的均方差为SSA/r正确答案:B9、在考虑交互效应的双因素方差分析中,因素A有r个水平,因素B有s个水平,因素A、B每个水平组合都有m个观测值,下面结论正确的是()A.因素A检验统计量[SSA/(r-1)]/[SSE/(rs-r-s+1)]B.SSA+SSB+SSE≤SSTC.SSAB≤SSED.随机误差的均方差为SSE/(rsm-rs+1)正确答案:B10、只考虑主效应的双因素方差分析中,因素A、B的水平数分别是3和4,因素A和B每个水平组合只有一个观测值,则随机误差的自由度等于()A. 3B.6C.12D.11正确答案:B二、多选题1、对于方差分析法,叙述正确的有()A.是用于多个总体的方差是否相等的检验B.是用于多个总体是否相互独立的检验C.是区分观测值变化主要受因素水平还是随机性影响的检验D.是用于多个总体的均值是否相等的检验正确答案:C、D2、应用方差分析的前提条件是()A.各个总体相互独立B.各个总体具有相同的方差C.各个总体均值不等D.各个总体服从正态分布正确答案:A、B、D3、对于方差分析,下面哪些说法是对的?()A.双因素方差分析一定存在交互效应B.组内均方差一定小于组间均方差C.组内均方差消除了观测值多少对误差平方和的影响D.综合比较了随机因素和系统因素的影响正确答案:C、D4、为研究教学方法和本科生年级对教学效果的影响,将教学方法分为三个水平,本科生年级分为四个水平,对这种方差分析叙述正确的是()A.双因素方差分析B. 没有交互效应C.三因素方差分析D.未知方差齐性正确答案:A、D5、在只考虑A、B主效应的双因素方差分析中,已知SSA=13004.55,自由度为3;SSE=2872.7,自由度为12;SST=17888.95,自由度为19,则下列结论中正确的有:()A.统计量FB的值等于2.1008B.因素B的自由度为4C.统计量FA的值等于8.6193D.SSB=2011.7正确答案:A、B、D三、判断题1、在双因素方差分析中,总离差平方和自由度等于因素A的自由度、因素B的自由度、交互作用的自由度、随机误差的自由度相加减去4。
概率论与数理统计(茆诗松)第二版课后第八章习题参考答案
第八章 方差分析与回归分析本章前三节研究方差分析,讨论多个正态总体的比较,后两节研究回归分析.讨论两个变量之间的相关关系.§8.1 方差分析8.1.1问题的提出上一章讨论了单个或两个正态总体的假设检验,这里讨论多个正态总体的均值比较问题.通常为了研究某一因素对某项指标的影响情况,将该因素在多种情形下进行抽样检验,作出比较.一般将该因素称为一个因子,所检验的每种情形称为水平.在每个水平下需要考察的指标都分别构成一个总体,比较它们的总体均值是否相等.对每一个总体都分别抽取一个样本,样本容量称为重复数.如果只对一个因子中的多个水平进行比较,称为单因子方差分析,对多个因子的水平进行比较,称为多因子方差分析.本章只进行单因子方差分析.例 在饲料养鸡增肥的研究中,现有三种饲料配方:A 1 , A 2 , A 3 ,为比较三种饲料的效果,特选24只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量.实验结果如下表所示: 饲料鸡重/gA 1 1073 1009 1060 1001 1002 1012 1009 1028 A 2 1107 1092 990 1109 1090 1074 1122 1001 A 3 1093 1029 1080 1021 1022 1032 1029 1048 在此例中,就是要考察饲料对鸡增重的影响,需要比较三种饲料对鸡增肥的作用是否相同.这里,饲料就是一个因子,三种饲料配方就是该因子的三个水平,每种饲料喂养的雏鸡60天后的重量分别构成一个总体,这里共有3个总体,每一个总体抽取样本的重复数都是8,比较这3个总体的均值是否相等. 8.1.2单因子方差分析的统计模型设因子A 有r 个水平A 1 , A 2 , …, A r ,在每个水平下需要考察的指标都构成一个总体,即有r 个总体,分别记为Y 1 , Y 2 , …, Y r ,对每一个总体都分别抽取一个样本,首先考虑重复数相等的情形,设重复数都是m ,总体Y i 的样本Y i 1 , Y i 2 , …, Y im ,i = 1, 2, …, r .作出以下假定:(1)每一个总体都服从正态分布,即r i N Y i i i ,,2,1),,(~2L =σµ;(2)各个总体的方差都相等,即22221r σσσ===L ,都记为σ 2;(3)各个总体及抽取的样本相互独立,即Y ij 相互独立,i = 1, 2, …, r ,j = 1, 2, …, m . 需要比较它们的总体均值是否相等,即检验的原假设与备择假设为H 0:µ 1 = µ 2 = … = µ r vs H 1:µ 1 , µ 2 , …, µ r 不全相等,如果H 0成立,就可以认为这r 个水平下的总体均值相同,称为因子A 不显著;反之,如果H 0不成立,就称为因子A 显著.在水平A i 下的样品Y ij 与该水平下的总体均值µ i 之差ε ij = Y ij − µ i 为随机误差.由于Y ij ~ N (µ i , σ 2 ),因此随机误差ε ij ~ N (0 , σ 2 ).对所有r 个水平下的总体均值求平均,即∑==+++=ri i r r r 1211)(1µµµµµL称为总均值.每个水平A i 下的总体均值µ i 与总均值µ 之差a i = µ i − µ 称为该水平A i 下主效应.显然所有主效应a i 之和等于0,即01=∑=ri ia,检验所有水平下的总体均值是否相等,也就是检验所有主效应a i 是否全等于0.这样单因子方差分析在重复数相等的情形下,统计模型为⎪⎪⎩⎪⎪⎨⎧===++=∑=).,0(;0;,,2,1,,,2,1,21σεεµN a m j r i a Y ij r i i ij i ij 相互独立,且都服从L L 检验的原假设与备择假设为H 0:a 1 = a 2 = … = a r = 0 vs H 1:a 1 , a 2 , …, a r 不全等于0. 8.1.3平方和分解一.试验数据对于r 个总体下的试验数据Y ij , i = 1, 2, …, r ,j = 1, 2, …, m ,记T i 表示第i 个总体下试验数据总和,⋅i Y 表示第i 个总体下样本均值,n = rm 表示总的样本容量,T 表示总的试验数据总和,Y 表示总的样本均值,即∑==mj ij i Y T 1,∑=⋅==mj ij i i Y m m T Y 11, i = 1, 2, …, r ,∑∑∑=====r i mj ij r i i Y T T 111,∑∑∑=⋅=====ri i r i m j ij Y r Y rm T n Y 111111, 用⋅i Y 作为µ i 的点估计,Y 作为µ 的点估计.又记⋅i ε表示第i 个总体下随机误差平均值,ε表示总的随机误差平均值,即∑=⋅=mj ij i m 11εε, i = 1, 2, …, r ,∑∑∑=⋅====ri i r i m j ij r n 11111εεε.显然有⋅⋅+=i i i Y εµ,εµ+=Y .在单因子方差分析中通常将试验数据及基本计算结果写成表格形式 因子水平试验数据和 和的平方平方和A 1 Y 11 Y 12 … Y 1m T 1 21T∑21jY A 2 Y 21 Y 22 … Y 2m T 2 22T∑22jY┆ ┆ ┆ ┆ ┆ ┆ ┆┆A rY r 1Y r 2…Y rmT r2r T ∑2rjYΣ T∑=ri i T 12∑∑==ri mj ijY112二.组内偏差与组间偏差数据Y ij 与样本总均值Y 之差Y Y ij −称为样本总偏差,可以分成两部分之和:)()(Y Y Y Y Y Y i i ij ij −+−=−⋅⋅,其中⋅⋅⋅−=+−+=−i ij i i ij i i ij Y Y εεεµεµ)()(是第i 个总体内数据与该总体内样本均值的偏差,称为组内偏差,反映第i 个总体内的随机误差;εεεµεµ−+=+−+=−⋅⋅⋅i i i i i a Y Y )()(是第i 个总体内样本均值与总样本均值的偏差,称为组间偏差,反映第i 个总体的主效应. 三.偏差平方和及其自由度在统计学中,对于k 个独立数据Y 1 , Y 2 , …, Y k ,平均值∑==ki i Y k Y 11,称Y i 与Y 之差为偏差,所有偏差的平方和∑=−=ki i Y Y Q 12)(称为这k 个数据的偏差平方和,反映这k 个数据的分散程度.由于所有偏差之和0)(11=−=−∑∑==Y k Y Y Y ki i k i i , 即这k 个偏差由k 个独立数据受到一个约束条件形成,可以证明它们与k − 1个独立(随机)变量可以相互线性表示,称之为等价于k − 1个独立(随机)变量.一般地,若k 个独立数据受到r 个不相关的约束条件,则它们等价于k − r 个独立(随机)变量.在统计学中,把形成平方和的变量所等价的独立变量个数,称为该平方和的自由度,通常记为f .如上述偏差平方和Q 的自由度为k − 1,即f Q = k − 1.由于平方和的大小与变量个数(或自由度)有关,为了对偏差进行比较,通常考虑偏差平方和与其自由度之商,称为均方和,记为MS ,反映一组数据的平均分散程度,如样本方差∑=−−=ni i X X n S 122)(11就是样本数据偏差的均方和. 四.总平方和分解公式总偏差平方和记为S T 或SST ,其自由度记为f T ,有∑∑==−=r i mj ij T Y Y S 112)(,f T = rm − 1 = n − 1;组内偏差平方和记为S e 或SSE ,其自由度记为f e ,有∑∑==⋅−=r i mj i ij e Y Y S 112)(,f e = r (m − 1) = n − r ;组间偏差平方和记为S A 或SSA ,其自由度记为f A ,有∑∑∑=⋅==⋅−=−=ri i r i m j i A Y Y m Y Y S 12112()(,f A = r − 1.组内偏差平方和反映所有总体内的随机误差,组间偏差平方和反映所有总体的主效应.定理 总偏差平方和S T 可以分解为组内偏差平方和S e 与组间偏差平方和S A 之和,其自由度也可作相应的分解,即S T = S e + S A ,f T = f e + f A ,称之为平方和分解公式. 证:∑∑∑∑==⋅⋅==−+−=−=ri mj i i ij ri mj ij T Y Y Y Y Y Y S 112112()[()(∑∑∑∑∑∑==⋅⋅==⋅==⋅−−+−+−=ri mj i i ij ri mj i ri mj i ij Y Y Y Y Y Y Y Y 11112112))((2)()(A e A e ri i A e ri mj i ij i A e S S S S Y Y S S Y Y Y Y S S +=++=×−++=−−++=∑∑∑=⋅==⋅⋅0]0[(2])()[(2111,且显然有f T = n − 1 = (n − r ) + (r − 1) = f e + f A . 8.1.4检验方法由于组内偏差平方和反映所有总体内的随机误差,组间偏差平方和反映所有总体的主效应,通过比较组内偏差平方和与组间偏差平方和检验因子的显著性.下面将证明在假设所有主效应都等于0成立的条件下,它们的均方和之商服从F 分布.定理 在单因子方差分析模型中,组内偏差平方和S e 与组间偏差平方和S A 满足(1)E(S e ) = (n − r )σ 2,且)(~22r n Se −χσ; (2)∑=+−=ri i A a m r S 122)1()E(σ,且当H 0:a 1 = a 2 = … = a r = 0成立时,)1(~22−r S Aχσ;(3)S e 与S A 相互独立. 证:根据第五章的定理结论知:设X 1 , X 2 , …, X n 相互独立且都服从正态分布N (µ , σ 2),记∑==ni i X n X 11,∑=−=ni i X X S 120)(,则X 与S 0相互独立,且)1(~22−n S χσ.(1)∑∑==⋅−=ri mj i ij e Y Y S 112)(,Y i 1 , Y i 2 , …, Y im 相互独立且都服从正态分布N(µ i , σ 2),∑=⋅=mi ij i Y m Y 11,则∑=⋅−mj i ij Y Y 12)(与⋅i Y 相互独立,且)1(~)(12122−−∑=⋅m Y Y mj i ijχσ,因在不同水平下的样本都相互独立,则∑∑==⋅−ri mj i ij Y Y 112)(与⋅⋅⋅r Y Y Y ,,,21L 也相互独立,且根据独立χ 2变量的可加性知)(~)(121122r rm Y Y r i mj i ij−−∑∑==⋅χσ,故)(~)(1211222r n Y Y S r i mj i ije−−=∑∑==⋅χσσ,即得E(S e ) = (n − r )σ 2;(2)∑∑∑∑∑=⋅=⋅==⋅=⋅−+−+=−+=−=ri i i r i i r i ir i i i r i i A a m m a m a m Y Y m S 112121212(2)()()(εεεεεε,因ε ij (i = 1, 2, …, r , j = 1, 2, …, m ) 相互独立且都服从正态分布N (0, σ 2 ),有∑=⋅=m j ij i m 11εε (i = 1, 2, …, r ) 相互独立且都服从正态分布,0(2m N σ,∑=⋅=ri i r 11εε,则0)E()E()E(=−=−⋅⋅εεεεi i 且)1(~)(2212−−∑=⋅r mri i χσεε,即m r r i i 212)1()(E σεε−=⎥⎦⎤⎢⎣⎡−∑=⋅, 故21211212)1()E(2)(E )E(σεεεε−+=−+⎥⎦⎤⎢⎣⎡−+=∑∑∑∑==⋅=⋅=r a m a m m a m S ri i r i i i r i i ri iA ,当H 0:a 1 = a 2 = … = a r = 0成立时,∑∑=⋅=⋅−=−=ri i r i i A m Y Y m S 1212)()(εε,故)1(~)(22122−−=∑=⋅r mS ri i Aχσεεσ;(3)因∑∑==⋅−=ri mj i ij e Y Y S 112)(与⋅⋅⋅r Y Y Y ,,,21L 相互独立,有S e 与∑=⋅=ri i Y r Y 11相互独立,且∑=⋅−=ri i A Y Y m S 12(,故S e 与S A 相互独立.由于)(~22r n S e −χσ,当H 0:a 1 = a 2 = … = a r = 0成立时,)1(~22−r S A χσ,且S e 与S A 相互独立,则根据F 分布的定义可知:当H 0成立时,有),1(~)()1(22r n r F MS MS f S f S r n S r S F eAe e A A eA−−==−−=σσ.由于∑=+−=ri i A a m r S 122)1()E(σ,则F 越大,即S A 越大时,越有可能发生a i ≠ 0,则检验的拒绝域为右侧.步骤:假设H 0:a 1 = a 2 = … = a r = 0 vs H 1:a 1 , a 2 , …, a r 不全等于0,统计量),1(~r n r F MS MS f S f S F eAe e A A −−==, 显著水平α ,右侧拒绝域W = {f ≥ f 1 − α (r − 1, n − r )},计算f ,并作出判断. 这是F 检验法.通常列成方差分析表: 来源 平方和 自由度 均方和 F 比 因子 S A f A = r − 1 MS A = S A / f A F = MS A / MS e误差 S e f e = n − r MS e = S e / f A总和S Tf T = n − 1为了计算方便,可给出三个偏差平方和的计算公式.对于一组数据X 1 , X 2 , …, X n ,记∑==ni i X n X 11,则有2112212121)(⎟⎟⎠⎞⎜⎜⎝⎛−=−=−∑∑∑∑====n i i ni i n i i n i i X n X X n X X X , 记∑==m j ij i Y T 1,∑∑∑=====r i mj ij r i i Y T T 111,可得2112211112211211211)(T n Y Y n Y Y n Y Y Y S r i mj ij r i m j ij ri mj ij ri mj ij ri mj ij T −=⎟⎟⎠⎞⎜⎜⎝⎛−=−=−=∑∑∑∑∑∑∑∑∑∑==========, 212211121212121111)(T n T m Y n mr Y m m Y r Y m Y Y m S r i i r i m j ij r i m j ij r i i ri i A −=⎟⎟⎠⎞⎜⎜⎝⎛−⎟⎟⎠⎞⎜⎜⎝⎛=⎥⎦⎤⎢⎣⎡−=−=∑∑∑∑∑∑∑======⋅=⋅, ∑∑∑===−=−=r i i r i mj ijA T e T m Y S S S 121121.例 在饲料养鸡增肥的研究中,现有三种饲料配方:A 1 , A 2 , A 3 ,为比较三种饲料的效果,特选24只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量.实验结果如下表所示: 饲料鸡重/gA 1 1073 1009 1060 1001 1002 1012 1009 1028 A 2 1107 1092 990 1109 1090 1074 1122 1001 A 3 1093 1029 1080 1021 1022 1032 1029 1048 在显著水平α = 0.05下检验这三种饲料对雏鸡增重是否有显著差别. 解:假设H 0:a 1 = a 2 = a 3 = 0 vs H 1:a 1 , a 2 , a 3不全等于0,统计量),1(~r n r F MS MS f S f S F eAe e A A −−==,平方和显著水平α = 0.05,n = 24,r = 3,m = 8,右侧拒绝域W = { f ≥ f 0.95 (2, 21)} = { f ≥ 3.47},试验数据计算表 因子水平试验数据Y ijT i2i T∑=mj ijY 12A 1 1073 1009 1060 1001 10021012100910288194 67141636 8398024 A 2 1107 1092 990 1109 10901074112210018585 73702225 9230355 A 31093 1029 1080 1021 10221032102910488354 69789316 8728984总和 25133 210633177 26357363计算可得0833.96602513324121063317781112212=×−×=−=∑=T n T m S r i i A ,875.282152106331778126357363112112=×−=−=∑∑∑===r i i r i mj ije T m Y S ,方差分析表来源平方和自由度均方和F 比因子 9660.0833 2 4830.0417 3.5948 误差 28215.875 21 1343.6131 总和 37875.958323有F 比f = 3.5948 ∈ W ,故拒绝H 0 ,接受H 1 ,可以认为这三种饲料对雏鸡增重有显著差别, 并且检验的p 值p = P {F ≥ 3.5948} = 1 − 0.9546 = 0.0454 < α = 0.05. 8.1.5参数估计在方差分析问题中,可对总均值µ ,误差的方差σ 2作参数估计.当检验结果为因子不显著时,各水平下指标的总体均值与总体方差都相同,可将所有水平的指标看作一个统一的总体,全部试验数据是来自正态总体Y ~ N (µ , σ 2 ) 的一个容量为n = rm 的样本,因此样本均值nT Y n Y r i m j ij ==∑∑==111,样本方差1)(111122−=−−=∑∑==n S Y Y n S T r i m j ij.这样总均值µ 和误差的方差σ 2的点估计分别为Y =µˆ,22S =∧σ,置信度为1 − α 的置信区间分别是 ])1([2/1nSn t Y −±∈−αµ,])1()1(,)1()1([22/222/122−−−−∈−n S n n S n ααχχσ.当检验结果为因子显著时,还可进一步对主效应a i 作参数估计. 一.点估计由于试验数据Y ij , (i = 1, 2, …, r , j = 1, 2, …, m ) 相互独立且都服从正态分布N (µ + a i , σ 2 ),根据最大似然估计法,得到总均值µ ,误差的方差σ 2及主效应a i 的点估计.似然函数∏∏∏∏====⎪⎭⎪⎫⎪⎩⎪⎨⎧−−−==r i mj i ij r i m j ij r a y y p a a a L 11222112212)(exp π21)(),,,,,(σµσσµL ⎭⎬⎫⎩⎨⎧−−−=∑∑==ri mj iij na y 112222)(21exp )π2(1µσσ, 取对数,得∑∑==−−−−−=r i mj i ija yn n L 11222)(21)ln(2π)2ln(2ln µσσ.令关于µ 的偏导数等于0,有⎟⎟⎠⎞⎜⎜⎝⎛−−=−⋅−−−=∂∂∑∑∑∑∑=====r i i r i mj ijri mj i ij a m n y a y L 11121121)1()(221ln µσµσµ0101112112=⎟⎟⎠⎞⎜⎜⎝⎛−=⎟⎟⎠⎞⎜⎜⎝⎛−−=∑∑∑∑====µσµσn y n y r i m j ij r i mj ij , 得y y n r i mj ij ==∑∑==111µ,故总均值µ 的最大似然估计为Y =µˆ. 令关于a k 的偏导数等于0,有01)1()(221ln 1212=⎟⎟⎠⎞⎜⎜⎝⎛−−=−⋅−−−=∂∂∑∑==k mj kj mj k kj k ma m y a y a L µσµσ, k = 1, 2, …, r , 得µµ−=−=⋅=∑k mj kj k y y m a 11,故主效应a i 的最大似然估计为Y Y Y a i i i −=−=⋅⋅µˆˆ, i = 1, 2, …, r ,相应,第i 个水平下的总体均值µ i 的最大似然估计为⋅=+=i i i Y a ˆˆˆµµ. 令关于σ 2的偏导数等于0,有0)(2112)(ln 112422=−−+⋅−=∂∂∑∑==r i mj i ija yn L µσσσ,得∑∑==−−=r i m j i ij a y n 1122)(1µσ,故误差的方差σ 2的最大似然估计为nS Y Y n e r i m j i ij M =−=∑∑==⋅∧1122)(1σ.由于E(S e ) = (n − r )σ 2,可知∧2Mσ不是σ 2的无偏估计,修偏得σ 2的无偏估计e eMS rn S =−=∧2σ. 二.置信区间对总均值µ ,误差的方差σ 2及第i 个水平下的总体均值µ i 给出置信区间.第i 个水平下总体均值µ i 的点估计为∑=⋅==mj ij i i Y m Y 11ˆµ,因试验数据Y ij , (i = 1, 2, …, r , j = 1, 2, …, m )相互独立且都服从正态分布N(µ i , σ 2),则有),(~2mN Y i i σµ⋅,即)1,0(~N mY ii σµ−⋅,但σ 未知,用r n S e −=σˆ替换.由于)(~22r n S e −χσ且S e 与⋅i Y 相互独立,则根据χ 2分布的定义可得 )(~ˆ)(2r n t mY r n S m Y i i eii −−=−−⋅⋅σµσσµ,故第i 个水平下总体均值µ i 的置信度为1 − α 的置信区间是]ˆ)([2/1mr n t Y i i σµα−±∈−⋅.总均值µ 的点估计为∑∑====r i mj ij Y n Y 111ˆµ,因数据Y ij , (i = 1, 2, …, r , j = 1, 2, …, m ) 相互独立且都服从正态分布N (µ i , σ 2 ),有Y 服从正态分布,且µµµ====∑∑∑∑∑=====r i i r i mj i r i m j ij n m n Y n Y 111111)E(1)E(,n n n n Y nY ri mj r i mj ij 222112211211)Var(1)Var(σσσ=⋅===∑∑∑∑====, 得,(~2nN Y σµ,即)1,0(~N nY σµ−,但σ 未知,用r n S e −=σˆ替换.由于)(~22r n S e −χσ且S e 与Y 相互独立,则根据t 分布的定义可得 )(~ˆ)(2r n t nY r n S n Y e−−=−−σµσσµ, 故总均值µ 的置信度为1 − α 的置信区间是ˆ)([2/1nr n t Y σµα−±∈−.误差的方差σ 2的点估计为r n S e −=∧2σ,且)(~22r n Se −χσ,故误差的方差σ 2的置信度为1 − α 的置信区间是⎥⎦⎤⎢⎢⎢⎣⎡−−−−=⎥⎦⎤⎢⎣⎡−−∈∧−∧−)()(,)()()(,)(22/222/1222/22/12r n r n r n r n r n S r n S e e ααααχσχσχχσ. 例 由前面的鸡饲料对鸡增重问题的数据给出总均值µ ,误差的方差σ 2及三个水平下总体均值µ1 , µ 2 , µ 3的点估计和置信区间(α = 0.05).解:前面已检验知因子显著,则三个水平下总体均值µ1 , µ 2 , µ 3的点估计为25.102488194ˆ111====⋅m T Y µ, 125.107388585ˆ222====⋅m T Y µ,25.104488354ˆ333====⋅m T Y µ,总均值µ 的点估计为2083.10472425133ˆ====n T Y µ,误差的方差σ 2的点估计为6131.13432==−=∧e eMS rn S σ, 置信度为0.95的置信区间是]2008.1051,2992.997[86131.13430796.225.1024[]ˆ)21([975.011=×±=±∈⋅m t Y σµ,]0758.1100,1742.1046[86131.13430796.2125.1073[]ˆ)21([975.022=×±=±∈⋅m t Y σµ,]2008.1071,2992.1017[]86131.13430796.225.1044[]ˆ)21([975.033=×±=±∈⋅mt Y σµ,]7684.1062,6482.1031[]246131.13430796.22083.1047[]ˆ)21([975.0=×±=±∈nt Y σµ,[]9608.2743,2861.7952829.10875.28215,4789.35875.28215)21(,)21(2025.02975.02=⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡∈χχσe e S S . 8.1.6重复数不等的情形如果每个水平下试验次数不全相等,称为重复数不等的情形,其检验方法与在重复数相等的情形下类似,只是在对数据的表述和处理上有几点区别. 一.数据设第i 个水平A i 下的重复数为m i ,所取得的样本为i im i i Y Y Y ,,,21L ,i = 1, 2, …, r .显然重复数总数为n ,即m 1 + m 2 + … + m r = n . 二.总均值总均值µ 是各水平下总体均值µ i 的以频率nm i为权数的加权平均,即 ∑==+++=r i i i r r m n n m n m n m 122111µµµµµL .三.主效应约束条件第i 个水平下主效应a i = µ i − µ ,则满足011=−=∑∑==µµn m a m ri iir i ii .四.模型单因子方差分析在重复数不等的情形下,统计模型为⎪⎪⎩⎪⎪⎨⎧===++=∑=).,0(;0;,,2,1,,,2,1,21σεεµN a m m j r i a Y ij r i i i i ij i ij 相互独立,且都服从L L 检验H 0:a 1 = a 2 = … = a r = 0 vs H 1:a 1 , a 2 , …, a r 不全等于0.五.平方和的计算记∑==im j ij i Y T 1,∑=⋅==im j ij i i i i Y m m T Y 11,∑∑∑=====ri i ri m j ij T Y T i111,∑∑∑=⋅=====ri i i r i m j ij Y m n Y n n T Y i 11111, 则各平方和的计算公式为n T Y Y n Y Y Y S ri m j ijri m j ijri m j ij T iii21122112112)(−=−=−=∑∑∑∑∑∑======, n T m T Y n Y m Y Y m Y Y S ri ii ri i i ri i i ri m j i A i21221212112)()(−=−=−=−=∑∑∑∑∑==⋅=⋅==⋅, ∑∑∑===−=−=ri ii ri m j ijA T e m T Y S S S i12112. 例 某食品公司对一种食品设计了四种新包装,为了考察哪种包装最受顾客欢迎,选了10个地段繁华程度相似、规模相近的商店做试验,其中两种包装各指定两个商店销售,另两种包装各指定三个商店销售.在试验期内各店货架排放的位置、空间都相同,营业员的促销方法也基本相同,经过一段时间,记录其销售量数据,见下表包装类型销售量数据A 1 12 18 A 2 14 12 13 A 3 19 17 21 A 4 24 30在显著水平α = 0.01下检验这四种包装对销售量是否有显著影响. 解:假设H 0:a 1 = a 2 = a 3 = a 4 = 0 vs H 1:a 1 , a 2 , a 3 , a 4不全等于0,统计量),1(~r n r F MS MS f S f S F eAe e A A −−==,显著水平α = 0.01,n = 10,r = 4,右侧拒绝域W = { f ≥ f 0.99 (3, 6)} = { f ≥ 9.78},销售量数据计算表计算可得258180101349812212=×−=−=∑=T n m T S ri ii A ,463498354412112=−=−=∑∑∑===ri i i ri mj ije m T Y S ,方差分析表来源平方和自由度均方和F 比因子 258 3 86 11.2174 误差 46 6 7.6667 总和 3049有F 比f = 11.2174 ∈ W ,故拒绝H 0 ,接受H 1 ,可以认为这四种包装对销售量有显著影响, 并且检验的p 值p = P {F ≥ 11.2174} = 1 − 0.9929 = 0.0071 < α = 0.01. 由于因子显著,则四个水平下总体均值µ1 , µ 2 , µ 3 , µ 4的点估计为15230ˆ1111====⋅m T Y µ, 13339ˆ2222====⋅m T Y µ, 19357ˆ3333====⋅m T Y µ, 27254ˆ4444====⋅m T Y µ, 总均值µ 的点估计为1810180ˆ====n T Y µ, 误差的方差σ 2的点估计为6667.72==−=∧e eMS rn S σ, 置信度为0.99的置信区间是]2587.22,7413.7[]26667.77074.315[]ˆ)6([1995.011=×±=±∈⋅m t Y σµ,]9267.18,0733.7[]36667.77074.313[]ˆ)6([2995.022=×±=±∈⋅m t Y σµ,]9267.24,0733.13[]36667.77074.319[]ˆ)6([3995.033=×±=±∈⋅m t Y σµ,]2587.34,7413.19[]26667.77074.327[]ˆ)6([4995.044=×±=±∈⋅m t Y σµ,]2462.21,7538.14[106667.77074.318[]ˆ)6([995.0=×±=±∈nt Y σµ,[]0775.68,4801.26757.046,5476.1846)6(,)6(2005.02995.02=⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡∈χχσeeS S .§8.2 多重比较上一节是将多个总体作为一个整体进行检验.如果检验结果是因子A 显著,则可以认为各水平下的均值µ i 不全相等,但却不能直接说明µ i 中哪些可以认为相等,哪些可以认为不等.这一节是对各个µ i 两两之间进行比较,对µ i − µ j ,也就是效应差a i − a j 作出估计、检验. 8.2.1效应差的置信区间效应差a i − a j = µ i − µ j 的点估计为⋅⋅−j i Y Y .因Y ik ~ N (µ i , σ 2 ), (i = 1, 2, …, r , k = 1, 2, …, m i ),则),(~121i i m k ik i i m N Y m Y iσµ∑=⋅=,,(~121jj m k jkj j m N Ym Y jσµ∑=⋅=,且当i ≠ j 时,⋅i Y 与⋅j Y 相互独立,可得))11(,(~2σµµji j i j i m m N Y Y +−−⋅⋅, 即)1,0(~11)()(N m m Y Y ji j i j i +−−−⋅⋅σµµ,但σ 未知,用r n S e −=σˆ替换.由于)(~22r n S e −χσ且S e 与⋅⋅j i Y Y ,相互独立,则根据t 分布的定义可得 )(~11ˆ)()()(11)()(2r n t m m Y Y r n S m m Y Y ji j i j i ej i j i j i −+−−−=−+−−−⋅⋅⋅⋅σµµσσµµ,故效应差a i − a j = µ i − µ j 的置信度为1 − α 的置信区间是]11ˆ)([2/1ji j i j i m m r n t Y Y +⋅−±−∈−−⋅⋅σµµα. 例 由前面的鸡饲料对鸡增重问题的数据给出各效应差µ i − µ j 的点估计和置信区间(α = 0.05). 解:因m 1 = m 2 = m 3 = 8,n = 24,r = 3,有25.102488194111===⋅m T Y ,125.107388585222===⋅m T Y ,25.104488354333===⋅m T Y , 则各效应差µ i − µ j 的点估计分别为875.48125.107325.10242121−=−=−=−⋅⋅∧Y Y µµ, 2025.104425.10243131−=−=−=−⋅⋅∧Y Y µµ, 875.2825.1044125.10733232=−=−=−⋅⋅∧Y Y µµ;因6553.3621875.28215ˆ==−=r n S e σ,有1142.385.06553.360796.211ˆ)21(975.0=××=+⋅j i m m t σ,则各效应差µ i − µ j 的置信度为0.95的置信区间分别是]7608.10,9892.86[]1142.38875.48[]8181ˆ)21([975.02121−−=±−=+⋅±−∈−⋅⋅σµµt Y Y , ]1142.18,1142.58[]1142.3820[]8181ˆ)21([975.03131−=±−=+⋅±−∈−⋅⋅σµµt Y Y , ]9892.66,2392.9[]1142.38875.28[]8181ˆ)21([975.03232−=±=+⋅±−∈−⋅⋅σµµt Y Y . 例 由前面的食品包装对销售量影响问题的数据给出各效应差µ i − µ j 的点估计和置信区间(α = 0.01). 解:因m 1 = 2,m 2 = 3,m 3 = 3,m 4 = 2,n = 10,r = 4,有15230111===⋅m T Y ,13339222===⋅m T Y ,19357333===⋅m T Y ,27254444===⋅m T Y , 则各效应差µ i − µ j 的点估计分别为213152121=−=−=−⋅⋅∧Y Y µµ,419153131−=−=−=−⋅⋅∧Y Y µµ, 1227154141−=−=−=−⋅⋅∧Y Y µµ,619133232−=−=−=−⋅⋅∧Y Y µµ, 1427134242−=−=−=−⋅⋅∧Y Y µµ,827194343−=−=−=−⋅⋅∧Y Y µµ;因7689.2646ˆ==−=r n S e σ,有2653.107689.27074.3ˆ)6(995.0=×=⋅σt ,则各效应差µ i − µ j 的置信度为0.99的置信区间分别是]3709.11,3709.7[]9129.02653.102[]3121ˆ)6([995.02121−=×±=+⋅±−∈−⋅⋅σµµt Y Y , ]3709.5,3709.13[]9129.02653.104[]3121ˆ)6([995.03131−=×±−=+⋅±−∈−⋅⋅σµµt Y Y , ]7347.1,2653.22[]12653.1012[]2121ˆ)6([995.04141−−=×±−=+⋅±−∈−⋅⋅σµµt Y Y , ]3816.2,3816.14[]8165.02653.106[]3131ˆ)6([995.03232−=×±−=+⋅±−∈−⋅⋅σµµt Y Y , ]6291.4,3709.23[]9129.02653.1014[]2131ˆ)6([995.04242−−=×±−=+⋅±−∈−⋅⋅σµµt Y Y , ]3709.1,3709.17[]9129.02653.108[]2131ˆ)6([995.04343−=×±−=+⋅±−∈−⋅⋅σµµt Y Y .8.2.2 多重比较问题对各个µ i 两两之间进行比较,也就是检验任意两个水平A i 与A j 下的总体均值是否相等,即检验假设j i ij H µµ=:0 vs j i ij H µµ≠:1, i , j = 1, 2, …, r .对于每一个假设ijH 0可以采取上一章两个正态总体的均值比较方法进行检验,但这里需要同时检验2)1(2−=r r C r 个这种假设. 设需要同时检验k 个假设k i H i ,,2,1,0L =,每一个假设的显著水平是α ,即在iH 0成立的条件下,接受i H 0的概率为1 − α ,但在所有k 个假设i H 0都成立的条件下,要同时接受所有假设iH 0的概率就可能远小于1 − α .事实上,此时对每一个假设i H 0,拒绝i H 0的概率为α ,而对所有k 个假设k i H i ,,2,1,0L =,至少拒绝其中一个i H 0的概率最大时可能达到k α ,即同时接受所有假设i H 0的概率就可能只有1 − k α .可见,需要同时检验多个假设时,一般不应逐个检验每一个假设,而是采用多重比较方法同时检验多个假设.多重比较方法,就是针对所有假设,构造一个统一的拒绝域,再逐个进行比较.这里,需要检验假设j i ijH µµ=:0 vs j i ij H µµ≠:1, 1≤ i < j ≤ r , 在ij H 0成立的条件下,⋅i Y 与⋅j Y 不应相差太大.对每一个假设ijH 0,拒绝域可以取为}|{|ij j i ij c Y Y W ≥−=⋅⋅,其中c ij 是常数.对所有的假设ijH 0,统一的拒绝域取为U U rj i ij j i rj i ijc Y YWW ≤<≤⋅⋅≤<≤≥−==11}|{|.分成重复数相等与不等两种场合进行讨论. 8.2.3重复数相等场合的T 法重复数相等时,各水平是平等的,由对称性,可以要求所有的c ij 相等,记为c ,即统一的拒绝域为}min max {}||max {}|{|1111c Y Y c Y Y c Y YW i ri i ri j i rj i rj i j i ≥−=≥−=≥−=⋅≤≤⋅≤≤⋅⋅≤<≤≤<≤⋅⋅U .因Y ij , (i = 1, 2, …, r , j = 1, 2, …, m ) 相互独立且都服从正态分布N (µ i , σ 2),有,(~2mN Y i i σµ⋅.当所有的假设ijH 0都成立时,即µ 1 = µ 2 = … = µ r = µ ,有,(~2mN Y i σµ⋅,则)1,0(~N mY i σµ−⋅.但σ 未知,用r n S e−=σˆ替换.由于)(~22r n S e −χσ且S e 与⋅i Y 相互独立,则根据t 分布的定义可得 )()(~ˆ)(2e i ei f t r n t mY r n S m Y =−−=−−⋅⋅σµσσµ.统一的拒绝域W 的形式可改写为⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≥−−−=≥−=⋅≤≤⋅≤≤⋅≤≤⋅≤≤m c m Y m Y c Y Y W i r i i r i i r i i r i σσµσµˆˆmin ˆmax }min max {1111, 其中mY Y mY mY Q i ri i ri i ri i ri σσµσµˆmin max ˆminˆmax1111⋅≤≤⋅≤≤⋅≤≤⋅≤≤−=−−−=是从分布为t ( f e )的总体中抽取容量为r 的样本所得的最大与最小顺序统计量之差(极差),称之为t 化极差统计量,其分布记为q (r , f e ).显然,t 化极差统计量Q 的分布q (r , f e ) 只与水平个数r 以及t 分布的自由度f e 有关,而与参数µ , σ 2及重复数m 无关.分布q (r , f e )的准确形式比较复杂,通常采用随机模拟方法得到其分位数q 1 − α (r , f e ).对于给定的容量r 及自由度f e ,随机模拟方法是(1)随机生成r 个标准正态分布N (0, 1) 随机数x 1 , x 2 , …, x r ,将这r 个随机数按由小到大的顺序排列,得到其最小随机数x (1) 和最大随机数x (r ) ;(2)随机生成1个自由度为f e 的χ 2分布χ 2 ( f e ) 随机数y ; (3)计算er f y x x q )1()(−=;(4)重复(1)至(3)步N 次,得到t 化极差统计量Q 的N 个观测值,只要N 非常大(如10 4或10 5次),就可得q (r , f e )的各种分位数q 1 − α (r , f e )的近似值.当显著水平为α 时,拒绝域{}),(ˆ1ef r q Q m c Q W ασ−≥=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≥=,有m c f r q e σαˆ),(1=−,可得 mf r q c e σαˆ),(1⋅=−,再逐个将||⋅⋅−j i Y Y 与c 比较,得出每一对µ i 与µ j 是否有显著差异的结论.步骤:假设j i ijH µµ=:0 vs j i ij H µµ≠:1, 1≤ i < j ≤ r , 统计量mY Y mY mY Q i ri i ri i ri i ri σσµσµˆmin max ˆminˆmax1111⋅≤≤⋅≤≤⋅≤≤⋅≤≤−=−−−=,显著水平α ,右侧拒绝域{}),(ˆ1e f r q Q m c Q W ασ−≥=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≥=,计算mf r q c e σαˆ),(1⋅=−,逐个将||⋅⋅−j i Y Y 与c 比较,得出结论.例 由前面的鸡饲料对鸡增重影响问题的数据对各因子作多重比较(α = 0.05).解:假设j i ijH µµ=:0 vs j i ij H µµ≠:1, 1≤ i < j ≤ 3, 统计量mY Y mY mY Q i ri i ri i ri i ri σσµσµˆmin max ˆminˆmax1111⋅≤≤⋅≤≤⋅≤≤⋅≤≤−=−−−=,显著水平α = 0.05,r = 3,f e = n − r = 21,右侧拒绝域W = {Q ≥ q 0.95 (3, 21)} = {Q ≥ 3.57},因m = 8,6553.3621875.28215ˆ==−=r n S e σ,有2658.4686553.3657.3=×=c , 由于c Y Y >=−=−⋅⋅875.48|125.107325.1024|||21,故µ 1与µ 2有显著差异;c Y Y <=−=−⋅⋅20|25.104425.1024|||31,故µ 1与µ 3没有显著差异; c Y Y <=−=−⋅⋅875.28|25.1044125.1073|||32,故µ 2与µ 3没有显著差异;8.2.4重复数不等场合的S 法重复数不等时,因)1,0(~11)()(N m m Y Y ji j i j i +−−−⋅⋅σµµ,但σ 未知,用r n S e−=σˆ替换.由于)(~22r n S e −χσ且S e 与⋅⋅j i Y Y ,相互独立,则根据t 分布的定义可得 )()(~11ˆ)()(e ji j i j i f t r n t m m Y Y =−+−−−⋅⋅σµµ,当所有的假设ijH 0都成立时,即µ 1 = µ 2 = … = µ r = µ ,有)(~11ˆe ji j i ij f t m m Y Y T +−=⋅⋅σ,得),1(~11ˆ)(222e j i j i ijij f F m m Y Y T F ⎟⎟⎠⎞⎜⎜⎝⎛+−==⋅⋅σ,从而统一的拒绝域可以取为U U r j i ji j i r j i ji j i c m m Y Y m m c Y Y W ≤<≤⋅⋅≤<≤⋅⋅≥+−=+≥−=11}11||{}11|{| }ˆmax {}ˆ11ˆ)(max {}ˆ11ˆ||max {221222211σσσσσc F c m m Y Y cm m Y Y ij r j i j i j i r j i ji j i r j i ≥=≥⎟⎟⎠⎞⎜⎜⎝⎛+−=≥+−=≤<≤⋅⋅≤<≤⋅⋅≤<≤,可以证明,),1(~1max 1e ij rj i f r F r F −−≤<≤&.当显著水平为α 时,拒绝域{}),1(ˆ)1(122e f r f F r c F W −≥=⎭⎬⎫⎩⎨⎧−≥=−ασ,有221ˆ)1(),1(σα−=−−r c f r f e ,可得),1()1(ˆ1e f r f r c −−=−ασ,因此⎟⎟⎠⎞⎜⎜⎝⎛+−−=+=−j i e ji ij m m f r f r m m c c 11),1()1(ˆ111ασ, 再逐个将||⋅⋅−j i Y Y 与ji ij m m cc 11+=比较,得出每一对µ i 与µ j 是否有显著差异的结论. 步骤:假设j i ijH µµ=:0 vs j i ij H µµ≠:1, 1≤ i < j ≤ r , 统计量),1(~11ˆ)1()(max1max 2211e j i j i rj i ijrj i f r F m m r Y Y r F F −⎟⎟⎠⎞⎜⎜⎝⎛+−−=−=⋅⋅≤<≤≤<≤&σ,显著水平α ,右侧拒绝域{}),1(ˆ)1(122e f r f F r c F W −≥=⎭⎬⎫⎩⎨⎧−≥=−ασ, 计算⎟⎟⎠⎞⎜⎜⎝⎛+−−=+=−j i e ji ij m m f r f r m m cc 11),1()1(ˆ111ασ, 逐个将||⋅⋅−j i Y Y 与c ij 比较,得出结论.例 由前面的食品包装对销售量影响问题的数据对各因子作多重比较(α = 0.01). 解:假设j i ijH µµ=:0 vs j i ij H µµ≠:1, 1≤ i < j ≤ 4, 统计量),1(~11ˆ)1()(max)1(max 224141e j i j i j i ij j i f r F m m r Y Y r F F −⎟⎟⎠⎞⎜⎜⎝⎛+−−=−=⋅⋅≤<≤≤<≤&σ,显著水平α = 0.01,r = 4,f e = n − r = 6,右侧拒绝域W = {F ≥ f 0.99 (3, 6)} = {F ≥ 9.78},因m 1 = m 4 = 2,m 2 = m 3 = 3,7689.2646ˆ==−=r n S e σ,有9981.1478.937689.2=××=c , 则6914.13312134241312=+====cc c c c ,9981.14212114=+=c c ,2459.12313123=+=c c , 由于12212|1315|||c Y Y <=−=−⋅⋅,故µ 1与µ 2没有显著差异;13314|1915|||c Y Y <=−=−⋅⋅,故µ 1与µ 3没有显著差异; 144112|2715|||c Y Y <=−=−⋅⋅,故µ 1与µ 4没有显著差异; 23326|1913|||c Y Y <=−=−⋅⋅,故µ 2与µ 3没有显著差异; 244214|2713|||c Y Y >=−=−⋅⋅,故µ 2与µ 4有显著差异; 34438|2719|||c Y Y <=−=−⋅⋅,故µ 3与µ 4没有显著差异.§8.3 方差齐性检验在单因子方差分析统计模型中,总是假设各个水平下的总体方差都相等,即222221σσσσ====r L ,称之为方差齐性.但方差齐性不一定自然成立,需要对其进行检验,检验的原假设与备择假设为H 0:22221r σσσ===L vs H 1:22221,,,r σσσL 不全相等,称为方差齐性检验.各水平下的总体方差2i σ分别是以该水平下的样本方差2i S 作为点估计,以由22221,,,r S S S L 构成的函数作为检验的统计量.分成重复数相等与不等两种场合进行讨论. 8.3.1重复数相等场合的Hartley 检验法重复数相等时,样本方差⎥⎦⎤⎢⎣⎡−−=⎥⎦⎤⎢⎣⎡−−=−−=∑∑∑=⋅==⋅m T Y m Y m Y m Y Y m S i m j ij i m j ij m j i ij i2122121221111)(11,i = 1, 2, …, r , 各水平是平等的,以r 个水平下样本方差),,2,1(,2r i S i L =的最大值与最小值之比作为检验的统计量H ,即},,,min{},,,max{2222122221r r S S S S S S H L L =.在方差齐性成立的条件下,统计量H 的分布只与水平个数r 及样本方差2i S 的自由度f = m − 1有关,记为H (r , f ).分布H (r , f )的准确形式比较复杂,通常采用随机模拟方法得到其分位数H 1 − α (r , f ).显然有H ≥ 1,且H 的观测值越接近1,方差齐性越应该成立,因此拒绝域取为W = {H ≥ H 1 − α (r , f )}.步骤:假设H 0:22221r σσσ===L vs H 1:22221,,,r σσσL 不全相等,统计量},,,min{},,,max{2222122221rr S S S S S S H L L =,显著水平α ,右侧拒绝域W = {H ≥ H 1 − α (r , f )}, 计算H ,并作出判断. 这称之为Hartley 检验法.例 由前面的鸡饲料对鸡增重影响问题的数据采用Hartley 检验法进行方差齐性检验(α = 0.05).解:假设H 0:232221σσσ== vs H 1:232221,,σσσ不全相等,统计量},,min{},,max{232221232221S S S S S S H =, 显著水平α = 0.05,且r = 3,f = m − 1,右侧拒绝域W = {H ≥ H 0.95 (3, 7)} = {H ≥ 6.94},根据试验数据计算表,可得T 1 = 8194,T 2 = 8585,T 3 = 8354,8398024121=∑=mj j Y ,9230355122=∑=mj jY,8728984123=∑=mj j Y ,则9286.759)881948398024(71221=−=S ,9821.2510885859230355(71222=−=S ,9286.759)883548728984(71223=−=S ,可得W H ∉==3042.39286.7599821.2510,故拒绝H 0 ,接受H 1 ,可以认为三个水平下的总体方差满足方差齐性.8.3.2 重复数不等场合大样本情形的Bartlett 检验法重复数不等时,样本方差⎥⎦⎤⎢⎣⎡−−=⎥⎦⎤⎢⎣⎡−−=−−=∑∑∑=⋅==⋅i i m j ij i i i m j ij i m j i ij i im T Y m Y m Y m Y Y m S i i i 2122121221111)(11,i = 1, 2, …, r , 记i i m j ijm j i ij i m T Y Y Y Q ii21212)(−=−=∑∑==⋅为第i 个水平下的偏差平方和,f i = m i − 1为其自由度,有i i i f Q S =2,且e r i m j i ijr i i S Y YQ i=−=∑∑∑==⋅=1121)(,e ri ir i i f r n r mf =−=−=∑∑==11,则组内偏差均方和∑∑∑=======ri i ei ri ii e ri ie e e e Sf f S f f Q f f S MS 1212111, 即MS e 等于样本方差22221,,,r S S S L 以各自自由度所占比例为权数的加权算术平均,而相应的加权几何平均记为GMS e ,即∏==ri f f i e eiS GMS 12)(.以MS e 与GMS e 之商的一个函数作为检验统计量.可以证明,大样本情形,在方差齐性成立的条件下,)1(~])ln()ln([1ln 212−−==∑=r S f MS f C GMS MS C f B ri i i e e e e e χ&,其中常数⎟⎟⎠⎞⎜⎜⎝⎛−−+=∑=e r i i f f r C 11)1(3111. 由于算术平均必大于等于几何平均,即MS e ≥ GMS e ,当且仅当所有2i S 都相等时等号成立,即B 的观测值越小,方差齐性越应该成立,因此拒绝域取为)}1({21−≥=−r B W αχ.。
概率论与数理统计第八章课后习题及参考答案
概率论与数理统计第八章课后习题及参考答案1.设某产品指标服从正态分布,它的均方差σ已知为150h ,今从一批产品中随机抽查26个,测得指标的平均值为1637h .问在5%的显著性水平,能否认为这批产品的指标为1600h ?解:总体X ~)150,(2μN ,检验假设为0H :1600=μ,1H :1600≠μ.采用U 检验法,选取统计量nX U /00σμ-=,当0H 成立时,U ~)1,0(N ,由已知,有1637=x ,26=n ,05.0=α,查正态分布表得96.1025.0=u ,该检验法的拒绝域为}96.1{>u .将观测值代入检验统计量得2577.142.293726/150********==-=u ,显然96.12577.1<=u ,故接受0H ,即可认为这批产品的指标为1600h .2.正常人的脉搏平均为72次/min ,现某医生从铅中毒患者中抽取10个人,测得其脉搏(单位:次/min)如下:54,67,68,78,70,66,67,70,65,69设脉搏服从正态分布,问在显著性水平05.0=α下,铅中毒患者与正常人的脉搏是否有显著性差异?解:本题是在未知方差2σ的条件下,检验总体均值72=μ.取检验统计量为nS X T /0μ-=,检验假设为0H :720==μμ,1H :72≠μ.当0H 成立时,T ~)1(-n t ,由已知,有4.67=x ,93.5=s ,05.0=α,查t 分布表得262.2)9(025.0=t ,将观测值代入检验统计量得45.288.16.410/93.5724.67/0-=-=-=-=n s x t μ,显然)9(262.2447.2025.0t t =>=,故拒绝0H ,即铅中毒患者与正常人的脉搏有显著性差异.3.测定某溶液中的水分,得到10个测定值,经统计%452.0=x ,22037.0=s ,该溶液中的水分含量X ~),(2σμN ,μ与2σ未知,试问在显著性水平05.0=α下该溶液水分含量均值μ是否超过5%?解:这是在总体方差2σ未知的情况下,关于均值μ的单侧检验.检验假设为0H :%5.0≤μ,1H :%5.0>μ.此假设等价于检验假设0H :%5.0=μ,1H :%5.0>μ.由于2σ未知,取检验统计量为nS X T /0μ-=.当0H 成立时,T ~)1(-n t ,拒绝域为)}1(/{0-≤-n t n s x αμ,将观测值代入检验统计量得709.1)5.052.0(10/0=-=-=ns x t μ,由05.0=α,查t 分布表得833.1)9(05.0=t ,显然)9(833.1709.105.0t t =<=,所以接受0H ,即该溶液水分含量均值μ是否超过5%.4.甲、乙两个品种作物,分别用10块地试种,产量结果97.30=x ,79.21=y ,7.2621=s ,1.1222=s .设甲、乙品种产量分别服从正态分布),(21σμN 和),(22σμN ,试问在01.0=α下,这两种品种的产量是否有显著性差异?解:这是在方差相等但未知的情况下检验两正态总体的均值是否相等的问题.检验假设为0H :21μμ=,1H :21μμ≠.由题可知,22221σσσ==未知,因此取检验统计量nm n m mn S n S m YX T +-+-+--=)2()1()1(2221,当0H 为真时,T ~)2(-+n m t ,该检验法的拒绝域为)}2({2/-+>n m t t α.由题设,10==n m ,97.30=x ,79.21=y ,7.2621=s ,1.1222=s .将其代入检验统计量得n m n m mn S n S m yx t +-+-+--=)2()1()1(222166.4201810101.1297.26979.2197.30=⨯⨯⨯+⨯-=,由01.0=α,查t 分布表得878.2)18()2(005.02/==-+t n m t α.显然)18(878.266.4005.0t t t =>=,因此,拒绝0H ,即这两种品种的产量有显著性差异.5.某纯净水生产厂用自动灌装机装纯净水,该自动灌装机正常罐装量X ~)4.0,18(2N ,现测量某厂9个罐装样品的灌装量(单位:L)如下:0.18,6.17,3.17,2.18,1.18,5.18,9.17,1.18,3.18在显著性水平05.0=α下,试问:(1)该天罐装是否合格?(2)罐装量精度是否在标准范围内?解:(1)检验罐装是否合格,即检验均值是否为18,故提出假设0H :18=μ,1H :18≠μ,由于方差224.0=σ已知,取检验统计量为nX U /00σμ-=,当0H 为真时,U ~)1,0(N ,该检验法的拒绝域为}{2/αu u ≥.由题可知,9=n ,18=x ,将其代入检验统计量得09/4.01818/00=-=-=n x u σμ,由05.0=α,查标准正态分布表得96.1025.0=u ,显然,025.096.10u u =<=,故接受0H ,即该天罐装合格.(2)检验罐装量精度是否在标准范围内,即检验假设0H :224.0≤σ,1H :224.0>σ,此假设等价于0H :224.0=σ,1H :224.0>σ.由于18=μ已知,选取检验统计量为∑=-=n i i X12202)18(1σχ,当0H 为真时,2χ~)(2n χ,该检验法的拒绝域为)}({22n αχχ≥.由已知计算得625.6)18(112202=-=∑=n i i x σχ,查2χ分布表得307.18)10(205.0=χ,由此知)10(307.18625.6205.02χχ=<=,故接受0H ,即罐装量精度在标准范围内.6.某厂生产某型号电池,其寿命长期以来服从方差221600h =σ的正态分布,现从中抽取25只进行测量,得222500h s =,问在显著性水平05.0=α下,这批电池的波动性较以往有无显著变化?解:这是在均值未知的条件下,对正态总体方差的检验问题.检验假设为0H :202σσ=,1H :202σσ≠,其中160020=σ,取检验统计量为222)1(σχS n -=.当0H 为真时,2χ~)(2n χ,对于给定的显著性水平,该检验法的拒绝域为)}1({22/12-≤-n αχχ或)}1({22/2-≥n αχχ.将观测值25002=s 代入检验统计量得5.371600250024)1(222=⨯=-=σχs n .对于05.0=α,查2χ分布表得401.12)24()1(2975.022/1==--χχαn ,364.39)24()1(2025.022/==-χχαn ,由于)24(364.395.37401.12)24(2025.022975.0χχχ=<=<=,故接受0H ,即这批电池的波动性较以往无显著变化.7.某工厂生产一批保险丝,从中任取10根试验熔化时间,得60=x ,8.1202=s ,设熔化时间服从正态分布),(2σμN ,在01.0=α下,试问熔化时间的方差是否大于100?解:本题是在均值未知的条件下,检验2σ是否大于100,是关于2σ的单侧检验问题.检验假设为0H :1002≥σ,1H :1002<σ,此假设等价于0H :1002=σ,1H :1002<σ,这是左侧检验问题,取检验统计量为2022)1(σχS n -=,当0H 为真时,2χ~)(2n χ,该检验法的拒绝域为)}1({212-≤-n αχχ.将10=n ,10020=σ,8.1202=s ,代入上述统计量得87.101008.1209)1(2022=⨯=-=σχs n .对于01.0=α,查2χ分布表得0879.2)9(299.0=χ,显然)9(0879.287.10299.02χχ=>=,接受0H ,即熔化时间的方差大于100.本题如果将检验假设设为0H :1002≤σ,1H :1002>σ,即进行右侧检验,统计量得选取如上,则该检验法的拒绝域为)}1({22-≥n αχχ.对于01.0=α,查2χ分布表得666.21)9(201.0=χ,显然)9(666.2187.10201.02χχ=<=,接受0H ,即熔化时间的方差不大于100.注:若选取的显著性水平为3.0=α,用MATLAB 计算得6564.10)9(23.0=χ,从而有)9(6564.1087.1023.02χχ=<=,则应拒绝原假设,即熔化时间的方差大于100.上述结果说明了在观测值接近临界值时,原假设不同的取法会导致检验结果的不一样,如果用-p 值检验法则可避免上述矛盾.8.设有两个来自不同正态总体的样本,4=m ,5=n ,60.0=x ,25.2=y ,07.1521=s ,81.1022=s .在显著性水平05.0=α下,试检验两个样本是否来自相同方差的总体?解:记两正态总体为),(211σμN 和),(222σμN ,其中1μ和2μ未知.检验假设为0H :2221σσ=,1H :2221σσ≠.取检验统计量为2221S S F =,当0H 为真时,F ~)1,1(--n m F ,该检验法的拒绝域为)}1,1({2/1--≤-n m F F α或)}1,1({2/--≥n m F F α.由题可知,05.0=α,4=m ,5=n ,将观测值代入检验统计量得39.181.1007.152221===s s F ,查F 分布表得98.9)4,3()1,1(025.02/1==---F n m F α,066.010.151)3,4(1)4,3()1,1(025.0975.02/====--F F n m F α.由此知)4,3(98.939.1066.0)4,3(025.0975.0F F =<<=,观测值没有落入拒绝域内,接受0H ,即两个样本来自相同方差的总体.9.某厂的生产管理员认为该厂第一道工序加工完的产品送到第二道工序进行加工之前的平均等待时间超过90min .现对100件产品的随机抽样结果的平均等待时间为96min ,样本标准差为30min .问抽样的结果是否支持该管理员的看法?(05.0=α).解:这是非正态总体均值的检验问题,用X 表示第一道工序加工完的产品送到第二道工序进行加工之前的等待时间,设其均值为μ,依题意,检验假设为0H :90≤μ,1H :90>μ.由于100=n 为大样本,故用U 检验法.总体标准差σ未知,用样本标准差S 代替.取检验统计量为100/90S X U -=,当0H 为真时,近似地有U ~)1,0(N ,该检验法的拒绝域为}{αu u >.由题可知,96=x ,30=s ,100=n .对于05.0=α,查标准正态分布表得645.105.0==u u α.将观测值代入检验统计量得2100/309096100/90=-=-=s x u ,显然,05.0645.12u u =>=,故拒绝0H ,即平均等待时间超过90分钟,也即支持该管理员的看法.10.一位中学校长在报纸上看到这样的报道:“这一城市的初中学生平均每周看8h 电视.”她认为她所领导的学校,学生看电视时间明显小于该数字.为此,她向学校的100名初中学生作了调查,得知平均每周看电视的时间5.6=x h ,样本标准差为2=s h ,问是否可以认为校长的看法是对的?(05.0=α)解:初中生每周看电视的时间不服从正态分布,这是非正态总体均值的假设检验问题.检验假设为0H :8=μ,1H :8<μ.由于100=n 为大样本,故用U 检验法,取检验统计量为nS X U /μ-=,当0H 为真时,近似地有U ~)1,0(N ,该检验法的拒绝域为}{αu u -<.由题可知,5.6=x ,2=s ,100=n .对于05.0=α,查标准正态分布表得645.105.0==u u α.将观测值代入检验算统计量得5.7100/285.6-=-=u ,显然,05.0645.15.7u u -=-<-=,故拒绝0H ,即初中生平均每周看电视的时间少于8小时,这位校长的看法是对的.11.已知某种电子元件的使用寿命X (单位:h)服从指数分布)(λE .抽查100个元件,得样本均值950=x h .能否认为参数001.0=λ?(05.0=α)解:X ~)(λE ,λ1)(=X E ,21)(λ=X D ,由中心极限定理知,当n 充分大时,近似地有n X n X U )1(/1/1-=-=λλλ~)1,0(N .由题可知001.00=λ,检验假设可设为0H :0λλ=,1H :0λλ≠.取检验统计量为n X n X U )1(/1/1000-=-=λλλ,当0H 为真时,近似地有U ~)1,0(N ,该检验法的拒绝域为}{2/αu u ≤.由题知,100=n ,950=x ,05.0=α,查标准正态分布表知96.1025.02/==u u α.将观测值代入检验统计量得5.0-=u ,显然,025.096.15.0u u =<=,故接受0H ,即可以认为参数001.0=λ.12.某地区主管工业的负责人收到一份报告,该报告中说他主管的工厂中执行环境保护条例的厂家不足60%,这位负责人认为应不低于60%,于是他在该地区众多的工厂中随机抽查了60个厂家,结果发现有33家执行了环境保护条例,那么由他本人的调查结果能否证明那份报告中的说法有问题?(05.0=α)解:设执行环境保护条例的厂家所占的比率为p ,则检验假设为0H :6.0≥p ,1H :6.0<p ,上述假设等价于0H :6.0=p ,1H :6.0<p .引入随机变量⎩⎨⎧=.,0,,1条例抽到的厂家为执行环保例抽到的厂家执行环保条X 则X ~),1(p B ,p X E =)(,)1()(p p X D -=,由中心极限定理,当0H 为真时,统计量60/)6.01(6.06.0/)1(000--=--=X n p p p X U 近似地服从)1,0(N .对于显著性水平05.0=α,查标准正态分布表得645.105.0==u u α,由此可知05.0}645.160/)6.01(6.06.0{≈-<--X P .以U 作为检验统计量,该检验法的拒绝域为}645.1{05.0-=-<u u .将55.06033==x 代入上述检验统计量,得791.060/)6.01(6.06.055.0/)1(000-=--=--=n p p p x u ,显然,05.0645.1791.0u u -=->-=,故接受0H ,即执行环保条例的厂家不低于60%,也即由他本人的调查结果证明那份报告中的说法有问题.13.从选取A 中抽取300名选民的选票,从选取B 中抽取200名选民的选票,在这两组选票中,分别有168票和96票支持所选候选人,试在显著性水平05.0=α下,检验两个选区之间对候选人的支持是否存在差异.解:这是检验两个比率是否相等的问题,检验假设为0H :21p p =,1H :21p p ≠.取检验统计量为⎪⎭⎫ ⎝⎛+--=m n p p p pU 11)ˆ1(ˆˆˆ21,其中)(1ˆ2121m n Y Y Y X X X mn p ++++++++= 是21p p p ==的点估计.当0H 为真时,近似地有U ~)1,0(N .由题可知300=n ,168=n μ,200=m ,96=m μ,又56.0300168ˆ1==p ,48.020096ˆ2==p ,528.0500264ˆ==++=m n p m n μμ.由此得统计量的观测值为755.11201472.0528.048.056.0=⨯⨯-=u ,由05.0)96.1(==>αU P ,得拒绝域为}96.1{>u ,因为96.1755.1<=u ,故接受0H ,即两个选区之间对候选人的支持无显著性差异.。
黄良文《统计学》(第2版)笔记和课后习题(含考研真题)详解 第8章 方差分析 【圣才出品】
验这 k 个总体(水平)的均值是否相等,即通过简单随机样本检验以下假设:
不全相等
这里的原假设 H 0 表示:对所讨论的数值变量(因变量)而言,分类变量(自变量)的
不同水平没有显著差异,即分类变量对该数值变量没有显著影响。
二、单因素方差分析
1 / 26
圣才电子书 十万种考研考证电子书、题库视频学习平台
总变差 SST 进行平方和分解可以得到: SST=SSA+SSE
其中,组内变差 SSE 为:
组间变差为:
2 / 26
圣才电子书 十万种考研考证电子书、题库视频学习平台
2.单因素方差分析的数学模型 把表 8-1 的每一行看作是取自某一水平所对应正态分布总体的容量为 N 的简单随机样
(2)双因素试验的总变差 SST:
4 / 26
圣才电子书 十万种考研考证电子书、题库视频学习平台
对总变差 SST 进行平方和分解,可以得到 SST=SSE+SSA+SSB。 其中,随机变差 SSE 为
因素 A 的变差 SSA 为
因素 B 的变差 SSB 为
2.双因素方差分析 (1)双因素方差分析的数学模型
在原假设成立的情况下,
,
和
。 3.等均值原假设的 F 检验
(1)对于等均值原假设 H 0 ,可以构造 F 统计量为:
在显著性水平α的条件下,只要 F≥ F 2 [M-1,M(N-1)]就可以拒绝原假设 H 0 ,认
3 / 26
圣才电子书 十万种考研考证电子书、题库视频学习平台
圣才电子书
十万种考研考证电子书、题库视频学习平台
第 8 章 方差分析
8.1 复习笔记
一、方差分析方法引导
统计学(第四版)贾俊平 第八章 方差分析与实验设计 练习题答案
统计学(第四版)贾俊平 第八章 方差分析与实验设计 练习题答案8.10123411234:0:,,,0=0.01SPSS H H ααααααααα====至少有一个不等于用进行方差分析,表8.1-1填装量主体间效应的检验(单因素方差分析表)因变量: 填装量 源 III 型平方和df均方F Sig.偏 Eta 方非中心 参数观测到的幂b校正模型 .007a3 .002 10.098 .001 .669 30.295 .919 截距 295.7791 295.7791266416.430.000 1.000 1266416.4301.000 机器 .007 3 .002 10.098.001.66930.295.919误差 .004 15 .000总计 304.17119 校正的总计.01118a. R 方 = .669(调整 R 方 = .603)b. 使用 alpha 的计算结果 = .01由表8.1-1得:p=0.001<0.01,拒绝原假设,i 0α不全为,表明不同机器对装填量有显著影响。
8.201231123:0:,,0=0.05SPSS H H ααααααα===至少有一个不等于用进行方差分析,表8.2-1满意度评分主体间效应的检验(单因素方差分析表)因变量: 评分 源III 型平方和df 均方 F Sig.校正模型 29.610a2 14.805 11.756 .001 截距 975.156 1 975.156 774.324 .000 管理者 29.610 2 14.805 11.756.001误差 18.890 15 1.259总计 1061.000 18 校正的总计48.50017a. R 方 = .611(调整 R 方 = .559)由表8.2-1得:p=0.001<0.05,拒绝原假设,i 0α不全为,表明管理者水平不同会导致评分的显著差异。
8.301231123:0:,,0=0.05SPSS H H ααααααα===至少有一个不等于用进行方差分析,表8.3-1电池寿命主体间效应的检验(单因素方差分析表)因变量: 电池寿命 源III 型平方和df 均方 F Sig. 偏 Eta 方 非中心 参数 观测到的幂b校正模型 615.600a2 307.800 17.068 .000 .740 34.137 .997 截距 22815.000 1 22815.000 1265.157 .000 .991 1265.157 1.000 企业 615.600 2 307.800 17.068.000.74034.137.997误差 216.400 12 18.033总计 23647.000 15 校正的总计832.00014a. R 方 = .740(调整 R 方 = .697)b. 使用 alpha 的计算结果 = .05由表8.2-1得:p=0.001<0.05,拒绝原假设,i 0α不全为,表明3个企业生产的电池平均寿命之间存在显著差异。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章方差分析Ⅰ.学习目的本章介绍方差分析的理论、方法与运用。
通过学习,要求:1.了解方差分析的基本概念和思想;2.理解方差分解原理;3.掌握单因素、双因素(有、无交互作用)方差分析的原理和流程;4学会针对资料提出原假设,并能利用Excel进行方差分析。
Ⅱ.课程内容要点第一节方差分析方法引导一、方差分析问题的提出方差分析,简称ANOVA(analysis of variance),就是利用试验观测值总偏差的可分解性,将不同条件所引起的偏差与试验误差分解开来,按照一定的规则进行比较,以确定条件偏差的影响程度以及相对大小。
当已经确认某几种因素对试验结果有显著影响时,可使用方差分析检验确定哪种因素对试验结果的影响最为显著及估计影响程度。
二、方差分析的有关术语和概念1.试验结果:在一项试验中用来衡量试验效果的特征量,也称试验指100101标或指标,类似函数的因变量或者目标函数。
2.试验因素:试验中,凡是对试验指标可能产生影响的原因都称为因素,或称为因子,类似函数的自变量。
试验中需要考察的因素称为试验因素,简称为因素。
一般用大写字母A 、B 、C 、……表示。
方差分析的目的就是分析实验因素对实验或抽样的结果有无显著影响。
如果在实验中变化的因素只有一个,这时的方差分析称为单因素方差分析;如果在实验中变化的因素不止一个,这时的方差分析就称为多因素方差分析。
3.因素水平:因素在试验中所处的各种状态或者所取的不同值,称为该因素的水平,简称水平。
一般用下标区分。
同样因素水平有时可以取得具体的数量值,有时只能取到定性值(如好,中,差等)。
4.交互作用:当方差分析过程中的影响因素不唯一时,这种多个因素的不同水平的组合对指标的影响称为因素间的交互作用。
三、方差分析的基本原理 (一)方差分解原理一般地,试验结果的差异性可由离差平方和表示,离差平方和又可分解为组间方差与组内方差。
其中,组间方差为因素对试验结果的影响的加总;组内方差则是各组内的随机影响的加总。
如果组间方差明显高于组内方差,说明样本数据波动的主要来源是组间方差,因素是引起波动的主要原因,则认为因素对试验的结果存在显著的影响;否则认为波动主要来自组内方差,即因素对试验结果的影响不显著。
(二)检验统计量检验因素影响是否显著的统计量是F 统计量:组内方差的自由度组内方差组间方差的自由度组间方差//F102 F 统计量的值越大,说明组间方差是离差平方和的主要来源,因素影响显著;F 统计量的值越小,说明组内方差是离差平方和的主要来源,因素影响不显著。
第二节 单因素方差分析一、单因素条件下的平方和分解公式设ij X 表示在i A 水平下,第j 次试验的试验结果。
.1ni ij j X X ==∑..11r nij i j X X ===∑∑..i i X X n =..XX nr =按方差分解的原理可得 T A E S S S =+22..()()A i i S X X n X X =-=-∑∑∑2.()E ij i S X X =-∑∑A S 为组间方差,由不同水平下的各组均值和总平均值的残差平方和;ES 是组内方差,即各组试验结果和各组均值的残差平方和。
二、因素作用显著性的检验若记各水平下的总体均值为12,,,r μμμ,则检验因素对试验结果影响的显著性就是检验假设:103012:r H μμμ=== 112:,,,r H μμμ不全相等可直接构造F 统计量来检验前面提出的假设,即统计量为:()()~1,1AES F F r r n S =--1AA S S r =- , ()1E E S S r n =-F 值越大,越说明组间方差大于组内方差,因此组间方差构成了离差平方和的主要来源,即因素的不同水平对试验结果影响较大,应拒绝原假设;反之,说明组内方差是主要来源,应接受原假设。
对于给定的显著性水平α,查F 分布表得临界值()()1,1F r r n α--,当αF F >时,拒绝原假设,认为因素对总体有显著影响;当αF F <时,接受原假设,即因素对试验结果的影响不显著。
三、应注意的问题(一)方差分析需满足的假设条件。
(1)每次试验都是独立进行的;(2)各样本都是来自正态总体的;(3)各总体的方差是相等的。
只有满足这些条件,方差分析的结果才是有效的。
(二)在实际问题中,各水平下的总体的试验次数可以相等也可以不等,分析过程和结论基本不变。
但是当试验次数相差较大或因素较多时应该考虑104 采用广义线性模型分析, 以消除非均衡试验设计的影响。
(三)方差分析只能判断各总体的均值是否相等,而不能判断出哪个总体的均值是大还是小,这时需要在均值不等的前提下,采用多重比较法进一步比较各个均值的大小。
第三节 双因素方差分析一、无交互作用的双因素方差分析A 与B 是待确认是否对试验结果有显著影响的两个因素,假定,A B 之间无交互作用,在两个因素的各种水平组合下进行重复试验可得表8-1。
()r ,,i X i ,21 . =是在因素A 的各个水平下s 个试验结果的均值;(),s ,,j X j 21 .=是在因素B 的各种水平下r 个试验结果的均值。
根据方差分解原理可得:T A B E S S S S =++依次展开有105()211r sT ij i j S X X===-∑∑()()22..111r srA i i i j i S X X s X X ====-=-∑∑∑()()22..111r s sB j j i j j S X X r X X ====-=-∑∑∑()2..11r sE ij i j i j S X X X X ===--+∑∑A S 表示的是因素A 的各个水平下各组试验结果与该组均值的残差平方和,B S 是因素B 的各个水平下各组试验结果与该组均值的残差平方和,E S 是,A B 所有水平组合下的试验结果和均值的残差平方和。
类似单因素方差分析可知,T S 的自由度为1rs -,A S 的自由度为1r -,B S 的自由度为1s -,E S 的自由度为()()11r s --。
对应的均方差为:1AA S S r =- 1B B S S s =-()()11EE S S r s =--检验因素A 与B 对试验结果的影响是否显著的F 统计量分别为()~1,(1)(1)AA ES F F r r s S =---()~1,(1)(1)BB ES F F s r s S =---综合以上结论可以得到方差分析表。
106 表8-2 无交互作用的双因素方差分析表二、有交互作用的双因素方差分析当因素之间存在交互作用时,为了区分随机误差和交互作用,需要在不同的水平组合下进行重复试验。
设在因素A 与因素B 每一个水平组合下等重复的试验t 次,得到表8-3。
t r X 1tr X 2rst X ijk X 表示的是在水平组合j i B A ,下第k 次试验的试验结果。
在该组合下的试验结果的均值为:.11tij ijk k X X t ==∑进一步记:107..111s ti ijk j k X X st ===∑∑..111r tj ijki k X Xrt===∑∑1111r s tijk i j k X X rst ====∑∑∑和无交互作用的方差分析类似,离差平方和可以分解为:T A B AB E S S S S S =+++其中()2111rstT ijk i j k S X X ====-∑∑∑()2..1rA i i S st X X ==-∑()2..1sB j j S rt X X ==-∑()2 (11)r sij i j AB i j S t X X X X===--+∑∑()2.1tij E ijk k S X X ==-∑交叉项AB S 表示两个因素的取值水平组合下的试验结果产生的因素水平组合方差。
T S 、A S 、B S 、AB S 和E S 的自由度分别是1rst -、1r -、1s -、108 ()()11r s --和()1rs t -。
可计算出均方差1AA S S r =- 1B B SS s =-(1)(1)ABAB S S r s =--(1)EE S S rs t =-则F 统计量依次为()~1,(1)AA ES F F r rs t S =--()~1,(1)BB ES F F s rs t S =--()~(1)(1),(1)ABAB ES F F r s rs t S =---总结以上结论可以得到方差分析表8-4。
ABAB ES F S =表8-4:双因素等重复试验方差分析表Ⅲ.考核知识点与考核要求一、方差分析的问题和基本概念1、识记:(1)方差分析的定义(2)实验因素的概念,因素水平的含义。
2、领会:交互作用的含义。
二、方差的分解和F统计量的构造1、识记:(1)方差的分解;(2)检验统计量。
2、领会:方差“自由度”的确定。
三、单因素方差分析1、识记:(1)单因素方差分析的意义;(2)单因素条件下的离差平方和的分解;(3)各个方差自由度的确定;(4)F统计量的构造。
2、领会:(1)单因素条件下的数据结构;(2)方差分析中应注意的几个问题。
3、应用:(1)单因素方差分析的应用;(2)利用Excel进行单因素方差分析。
109110 四、双因素方差分析 1、识记:(1)无交互作用下的离差平方和的分解,各个方差自由度的确定,检验双因素影响是否显著的F 统计量的构造;(2)有交互作用下的离差平方和的分解,各个方差自由度的确定,检验各因素影响和交互作用是否显著的F 统计量的构造。
2、领会:(1)无交互作用下方差分析的数据结构; (2)有交互作用下方差分析的数据结构。
3、应用:(1)无交互作用条件下双因素方差分析的应用; (2)有交互作用条件下的方差分析的应用; (3)利用Excel 进行上述两种方差分析。
Ⅳ.习题详解一、选择题1.B2.D3.C4.B5.B6.B7.A8.C9.ABCDE 10.ABCD 11.ABC 12.BCE 13.ADE 二、计算题1.解:这是一个等重复的单因素试验。
由题意设来自四个不同供应商的柳钉破坏承受力的均值分别为4321,,,μμμμ。
可以建立假设检验01234:H μμμμ===,11234:,,,H μμμμ不全相等。
由Excel 软111件的方差分析可以得到下表。
表8-5 Excel 得到的方差分析表由于p 值=0.15341,大于显著水平01.0=α,所以认为供应商不会对柳钉的损坏承受力产生显著影响,应该接受原假设0H 。
各水平下的均值i μ99%的置信度下的置信区间为:/2/2i i X t X t αα⎛⎫-+ ⎝,即 表8-5 均值置信区间表2.解:由题意设来自三条不同线路的灯泡寿命均值分别为321,,μμμ。