第10章方差分析

合集下载

方差分析方法

10.2.1 单因素方差分析的问题
因而有：因而有： (1) 粮食产量是随机变量，是数值型的变量；粮食产量是随机变量，是数值型的变量； (2) 把同一化肥的同一水平得到的粮食产量看作把同一化肥(A的同一水平的同一水平)得到的粮食产量看作同一总体抽得的样本，同一总体抽得的样本，施用不同化肥得到的粮食产量视为不同总体下抽得的样本，视为不同总体下抽得的样本，表中数据应看成从三个总体X 中分别抽了容量为6的样本的观测值的样本的观测值. 总体 1，X2，X3中分别抽了容量为的样本的观测值推断甲乙丙三种化肥的肥效是否存在差异的问题，推断甲乙丙三种化肥的肥效是否存在差异的问题，就是要辨别粮食产量之间的差异主要是由随机误差造成的，还是由不同化肥造成的，成的，还是由不同化肥造成的，这一问题可归结为三个总体是否有相同分布的讨论．个总体是否有相同分布的讨论．
10.2.1 单因素方差分析的问题
由于在实际中有充分的理由认为粮食产量服从正态分布, 且在安排试验时, 除所关心的因素(这里是化肥这里是化肥) 态分布且在安排试验时除所关心的因素这里是化肥外, 其它试验条件总是尽可能做到一致. 其它试验条件总是尽可能做到一致这使我们可以认为每个总体的方差相同即 Xi～N(µi,σ2) i = 1, 2, 3 因此，推断三个总体是否具有相同分布的问题就简因此，化为：化为：检验几个具有相同方差的正态总体均值是否相等的问题，等的问题，即只需检验 H0： µ 1 = µ 2 = µ 3
10. 10.2.2 单因素方差分析的数学模型
进行单因素方差分析时，需要得到如表10.2所示的进行单因素方差分析时，需要得到如表所示的数据结构．数据结构．
表10.2 单因素方差分析中数据结构

第10章单因素方差分析

第10章单因素方差分析单因素方差分析(0ne-Way ANOV A)，又称一维方差分析，它能够对单因素多个独立样本的均数进行比较，可以用10种检验方法对变量间的均数进行两两比较(即多重比较检验)并给出方差分析表，还可以作出5种类型图形(Type of plots)和2种均数图形(Means plot options)10.1 单因素方差分析的计量资料[例10—1] 某社区随机抽取了30名糖尿病患者、IGT异常人和正常人进行载脂蛋白(mg／dL)测定，结果示于表10—1。

试问3组人群的载脂蛋白测定结果含量是否相同？(倪宗瓒．卫生统计学．第4版，北京：人民卫生出版社，2001.50)本例是一个完全随机设计的单因素方差分析。

已建立SAS数据集文件并保存Sasuser.onewav4。

(1)进入SAS／Win(v8)系统，单击Solutions－Analysis－Analyst，得到分析家窗口。

(2)单击File-open By SAS Name—Sasuser-0neway4—0K，调入数据文件。

(3)在“分析家”窗口单击Statistics-ANOV A-One way ANOV A，得到图10—1所示对话框。

本例因变量(Dependent)为A(载脂蛋白)，单击A—Dependent。

自变量(1ndependent)：B(3种人的组别)，单击B—Independent 。

图10.1 0ne—way ANOV A：0neway4(单因素方差分析)对话框(4)单击Tests按钮，得到图10—2所示对话框。

在此对话框的ANOV A(F—检验)选项中可进行如下设置。

Analysis of variance，方差分析。

Welch’s variance-weighted ANOV A，威尔奇方差—权重方差分析。

Tests for equal variance，相等方差检验，即方差齐性检验。

Barlett’s test，巴特尼特检验。

统计学第十章(方差分析)

第十章方差分析一、单项选择题：1.在方差分析中，（）反映的是样本数据与其组平均值的差异。

A.总离差平方和B.组间离差平方和C.抽样误差D.组内离差平方和2.∑∑=⎪⎪⎭⎫⎝⎛k1i 21-j ij n i i x x ——是（）。

A.组内平方和 B.组间平方和C.总离差平方和D.因素B 的离差平方和3.∑∑=⎪⎪⎭⎫⎝⎛k1i 21-j ij n i i x x ——是（）。

A.组内平方和 B.组间平方和 C.总离差平方和D.总方差4.单因素方差分析中，计算F 统计量，其分子与分母的自由度各位（）。

A.k ，nB.k ，n-kC.k-1，n-kD.n-k ，k-15.方差分析基本原理是（）首先提出的。

A.费雪B.皮尔逊C.泰勒D.凯特勒6.组间离差平方和反映的是（）。

A.抽样误差B.系统误差C.随机误差D.总误差7.组内离差平方和反映的是（）。

A.抽样误差B.系统误差C.随机误差D.总误差8.单因素方差分析的对立和假设是（）。

A.μμμk 21===B.差距不显著，，，μμμk 21C.不是全部相等，，，μμμk 21D.全部不相等，，，μμμk 219.单因素方差分析的零假设是（）。

A.μμμk 21===B.差距不显著，，，μμμk 21C.不是全部相等，，，μμμk 21D.全部不相等，，，μμμk 2110.在方差分析中，若F k -n 1,-k 05.0F ）（>，则统计推论是（）。

A.各组间的总体均数不全相等B.各组间的总体均数都不相等C.各组间的样本均数都不相等D.各组间的总体方差不全相等11.为研究温度对菌种生产率的影响，将温度控制在三个水平上，则应该使用（）。

A.单因素方差分析B.双因素方差分析C.独立样本t 检验D.三因素方差分析12.为分析学历对收入的影响，调查了50个职工，按学历高低分成四组，使用单因素方差分析，则F 检验临界值为（）。

贾俊平的《统计学》(第7版)学习辅导书-章节题库(方差分析)【圣才出品】

9．关亍单因素方差分析中的 F 检验（）。[中央财经大学 2011 研] A．拒绝域在 F 分布曲线的右侧 B．F 统计量的样本观测值可能为负值 C．拒绝域在 F 分布曲线的左侧和右侧 D．以上表述都丌对【答案】A 【解析】在单因素方差分析中，若 F＞Fα，则拒绝原假设；若 F＜Fα，则丌拒绝原假设。

【解析】方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。如果分析数据来自相同总体，那么在组间误差中只包含随机误差，而没有系统误差。反之，如果分析数据来自丌同总体，在组间误差中除了包含随机误差外，还会包含系统误差。另外，方差分析要求每个总体都应服从正态分布。
10．关亍方差分析，以下说法哪一项更合理？（）[中山大学 2012 研] A．方差分析的目的是分析各组总体方差是否有显著差异 B．方差分析的目的是分析各组总体标准差是否有显著差异 C．方差分析的目的是分析各组总体均值是否有显著差异 D．方差分析的目的是分析各组总体中位数是否有显著差异【答案】C 【解析】表面上看，方差分析是检验多个总体均值是否相等的统计方法，但本质上它所研究的是分类型自变量对数值型因变量的影响。即方差分析是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
4．在方差分析中总变差可以分解为组内变差和组间变差，其中组间变差表示（）。 [厦门大学 2014 研]
A．一样本观测值不均值差方和 B．全部样本观测值不总均值的差方和 C．各样本观测值不各自均值的差方和 D．各样本均值不总均值的差方和【答案】D
＿
【解析】方差分析中组间平方和记为 SSA，它是各组均值xi（i＝1，2，…，k）不总均值 x 的误差平方和，反映组间误差的大小。
2．下面关亍方差学 2015 研]

第10章方差分析习题解答

第10章方差分析习题解答一．选择题1. 下列关于方差分析的说法不正确的是( A ).A. 方差分析是一种检验若干个正态分布的均值和方差是否相等的一种统计方法.B. 方差分析是一种检验若干个独立正态总体均值是否相等的一种统计方法.C. 方差分析实际上是一种F 检验.D. 方差分析基于偏差平方和的分解和比较.2. 设,1,2,,;1,2,,ij i ij i X i a j n µε=+== ，2(0,)ij i N εσ ，且ij ε相互独立，进行单因子方差分析是( C ) . A . 对假设012:a H µµµ=== 作检验. B . 对假设222012:a H σσσ=== 作检验. C . 假定2(0,)ij N εσ ，2σ为未知，对假设012:a H µµµ=== 作检验. D . 假定2(0,)ij N εσ 12a µµµµ==== ，µ为未知，对假设222012:a H σσσ=== 作检验.3. 对因子A 取r 个不同的水平进行试验，每个水平观测t 次，结果,1,2,,,1,2,,ij y i r j t == .对()ij r t y ×的偏差有分解：2211111()()()ˆr t r trTijij i i E A i j i j i SS y y y y t y y SS SS ⋅⋅======−=−+−=+∑∑∑∑∑ 其中11111, r t ti i ij i j j y y y y rt t ⋅=====∑∑∑对假设012:r H µµµ=== 进行检验时，如下说法错误的是( B ) .A .E SS 表示0H 为真时，由随机性引起的y ij 的波动.B .A SS 表示0H 为真时，所引起的由各水平间ij y 波动.C . E SS 表示各水平上随机性误差的总和.D . A SS 表示各水平之间系统误差的总和.4. 对某因素进行方差分析，由所得试验数据算得下表：方差来源平方和自由度F 值组间 4623.7 4 组内 4837.25 15 总和9460.9519采用F 检验法检验，且知在0.05α=时F 的临界值0.05(4,15) 3.06F =，则可以认为因素的不同水平对试验结果( B ).A. 没有影响.B. 有显著影响.C. 没有显著影响.D. 不能作出是否有显著影响的判断.5. 设在双因子A 和B 的方差分析模型：ij i j ij X µαβε=+++，10ai i α==∑，10bjj β==∑，2(0,)ij N εσ ，且ij ε相互独立，检验假设：0112:,0rH ααα==== ，和0212:,0sH βββ==== 检验时，下列结论中错误的是( D ) . A . 若拒绝域01H ，则认为因子A 的不同水平对结果有显著影响. B . 若拒绝域02H ，则认为因子B 的不同水平对结果有显著影响.C . 若不拒绝01H 和02H ，则认为因子A 与B 的不同水平的组合对结果无显著影响.D . 若不拒绝01H 或02H ，则认为因子A 与B 的不同水平组合对结果无显著影响.6. 某结果可能受因素A 及B 的影响.现对A 取4个不同的水平, B 取3个不同水平,对A 与B 每一种水平组合重复二次试验,对观测结果的双因子有交互作用的方差分析模型计算得:44.3A SS =，11.5B SS =，27.0A B SS ×=，65.0E SS =.且0.05(2,12) 3.89F =，0.05(3,12) 3.49F =，0.05(6,12) 3.00F =,则在显著性水平0.05α=时,检验的结果是( B ).A. 只有A 因素对结果有显著性影响.B. 只有B 因素对结果有显著性影响.C. 只有交互作用对结果有显著性影响.D. A 、B 及A 和B 的交互作用都对结果无显著性影响.7.设某结果可能受因素A 及B 的影响,现对A 取4个不同的水平, B 取3个不同的水平配对作试验,按双因子方差分析模型的计算结果: 5.29A SS =， 2.22B SS =，7.77T SS =.且0.05(3,6) 4.80F =，0.05(2,6) 5.10F =,则在显著性水平0.05α=时,检验的结果是（ C ). A. 只有A 因素的不同水平对结果有显著影响. B. 只有B 因素的不同水平对结果有显著影响.C. A 的不同水平及B 的不同水平都对结果有显著影响.D. A 、B 因素不同水平组合对结果没有显著影响.8. 对因子A 取r 个不同水平，因子B 取s 个不同水平，A 与B 的每种水平组合重复次试验后，对结果进行双因子有重复试验的方差分析，则以下关于各偏差平方和自由度的结论错误的是( D ).A. A 因子的偏差平方和A SS 的自由度为.B.B 因子的偏差平方和B SS 的自由度为.C. 交互作用的偏差平方和A B SS ×的自由度为(1)(1)r s −−.D. 误差平方和E SS 的自由度为(1)(1)(1)r s t −−−. 二．填空题9. 进行单因素方差分析的前提之一是要求表示r 个水平的r 个总体的方差相等． 10. 进行方差分析时，将离差平方和211()in r Tiji j SS XX ===−∑∑表示为TA E SS SS SS =+，其中A SS =21()ri ii n XX =−∑，E SS =211()in riji i j XX ==−∑∑．11. 进行方差分析时，将离差平方和211()in rT iji j SS XX ===−∑∑表示为TA E SS SS SS =+，则2ESS σ~2(n r)χ−．12. 进行方差分析时，如果所有2~(,)ij X N µσ，则222111()in r T iji j SSXX σσ===−∑∑~21(1)ri i n χ=−∑．13. 进行方差分析时，选取统计量2 1211()()(1)()(1)()i ri i i A n rE ij i i j n r n X X SS r FSS n r r X X ===−−−==−−−∑∑∑，则F ~(r 1,n r)F −−．14. 在单因素方差分析中，如果因素A 有a 个水平，其中在第i 个水平下作了i n 次试验，12a n n n n +++= ，总的偏差平方和T SS 分解为A SS 和E SS ，则A SS 的自由度为1a −，E SS 的自由度为n a−，检验统计量A F =/(1)/(1)A E SS a SS n −−，若A F 大于给定的临界值水平，则说明因素A 的a 个水平对试验指标有显著影响．15. 某企业准备用三种方法组装一种新的产品，为确定哪种方法每小时生产的产品数量最多，随机抽取了30名工人，并指定每个人使用其中一种方法．在显著水平α=0.05下，通过对每个工人生产的产品数量进行方差分析得到下面的部分结果．请完成方差分析表，由于 1.70 3.354131F =< 或P=0.245946>0.05 ，可判断不同的组装方法对产品数量的影响不显著（显著，不显著）．差异源 SS df MS F P-value F crit 组间 420 2 210 1.70 0.245946 3.354131 组内 3836 27 142.07 — — — 总计425629————16. 在双因素方差分析中，因素A 有三个水平，因素B 有四个水平,每个水平搭配各做一次试验．请完成下列方差分析表，在显著水平α=0.05下，由于0.05(25.7,6)508.1A F F ==>，可判断因素A 的影响显著（显著，不显著）；由于0.05(35.8,6)405.8B F F ==>，可判断因素B 的影响显著（显著，不显著）．来源平方和自由度均方 F 值因素A 54 2 27 5.78 因素B 82 3 27.33 5.85 误差e 28 6 4.67 — 总和16411——17. 在某种化工产品的生产过程中，选择3种不同的浓度：1A =2%，2A =4%，3A =6%；4种不同的温度：1B =100C ，2B =240C ，3B =380C ，4B =520C ；在每种浓度与温度配合下各做两次试验，观测产品的收取率．现由试验数据计算出如下结果：总偏差平方和147.8333T SS =，因素A （浓度）的偏差平方和44.3333A SS =，因素B （温度）的偏差平方和11.50B SS =，交互作用A B ×的偏差平方和27.00A B SS ×=，则误差平方和E SS = 65 ，检验统计量A F = 4.09 ， B F = 0.708 ，A B F ×= 0.831 ，在显著性水平0.05α=下．由于0.05(2,4.0912) 3.89A F F ==>，可判断因素A 的影响显著（显著，不显著）；由于0.05(30.7,12)908 3.4B F F ==<，可判断因素B 的影响不显著（显著，不显著）；由于0.050.831(6,12) 3.00A B F F ×==<，可判断因因素A 与因素B 的交互作用影响不显著（显著，不显著）．18. 为了分析不同操作方法生产某种产品节约原料是否相同，在其余条件尽可能相同的情况下，安排了五种不同的操作方法生产某种产品，测量原料节约额，得到实验结果如下表所示．在显著水平α=0.05下，由于0.00410.05P =<，可判断不同操作方法生产某种产品节约原料有（有，无）显著差异.差异源 SS df MS F P-value F crit 操作方法55.5370 4 13.8842 6.05900.00414.8932组内 34.3725 15 2.2915总计89.90951919. 对腐乳的味道、口感等只能通过感观来确定其产品质量.为了检验专业评议员对腐乳评分标准是否存在显著差异，不同的腐乳质量是否存在显著差异，得到4位专业评议员对4种腐乳的评分结果，得到实验结果如下表所示．在显著水平α=0.05下，由于0.0005690.05P =<，可判断专业评议员对腐乳评分标准有（有，无）显著差异；由于 1.020.0505E P −=<，可判断不同的腐乳质量有（有，无）显著差异.差异源 SS df MS F P-value F crit 专业评议员54 3 18.0000 16.2 0.000569 3.8625 腐乳 148 3 49.3333 44.4 1.02E-053.8625误差 10 9 1.1111总计2121520．为了分析时段、路段以及时段与路段的交互作用对行车时间的影响，某市一名交通警察分别在两个路段和高峰期与非高峰期驾车试验，共获得20个行车时间数据，得到实验结果如下表所示．在显著水平α=0.05下，由于 5.700.056E P =<−，可判断时段因素对行车时间的影响显著（显著，不显著）；由于0.0001.0805P =<，可判断路段因素对行车时间的影响显著（显著，不显著）；由于0.9118.0105P =>，可判断时段与路段因素对行车时间交互作用的影响不显著（显著，不显著）．差异源SSdfMS F P-value F crit时段 174.05 1 174.05 44.0632 5.7E-06 4.49399 路段 92.45 1 92.45 23.4050 0.00018 4.49399 交互 0.05 1 0.05 0.01260.911814.49399内部 63.20 16 3.95总计329.7519三．应用计算题21．比较四种肥料1234,,,A A A A 对作物产量的影响，每一种肥料做5次试验，得产量（公斤/小区）如下表．试检验四种肥料对产量的影响有无显著差异?肥料 1A2A3A4A样本观测值5.56.5 8.0 5.5 5.0 6.0 6.5 6.5 6.07.0 7.5 6.0 4.5 6.5 7.0 5.0 7.05.56.05.5解：设使用四种不同肥料后作物的产量2~(,),1,2,3,4i i Y N i µσ=．则需检验的问题为43210:µµµµ===H ,:1H 4321,,,µµµµ不全相等.首先由样本直接计算有关值如下表作物产量计算表肥料样本观测值行和i A T1A 5.5 5.0 6.0 4.5 7.0 28 2A 6.5 6.0 7.0 6.5 5.5 31.5 3A 8.0 6.5 7.5 7.0 6.0 35 4A5.56.56.05.05.528.5 411in ij i j T x ===∑∑1232756.45T C n ==4211771.5756.4515.05in Tiji j SS xC ===−=−=∑∑22222412831.53528.5756.45 6.255555iA A i iT SS C n ==−=+++−=∑15.05 6.258.8E T A SS SS SS =−=−=列出相应的方差分析表．作物产量方差分析表方差来源平方和自由度均方MS F 值临界值因素A 6.25 3 2.08 3.79 0.05(3,16) 3.24F = 0.01(3,16) 5.29F =误差 8.8 16 0.55 总和15.0519由于0.053.79(3,16)A F F =>，认为四种肥料对产量有显著影响．22．取四个种系未成年雌性大白鼠各三只，每只按一种剂量注射雌激素，一月后，解剖秤其子宫重量，结果如下表．试检验不同剂量和不同白鼠种系对子宫重量有无显著影响？解设注射不同剂量的不同白鼠种系的子宫重量2~(,),1,2,3,4ij i j Y N i µαβσ++=；1,2,3j =．则需检验的问题为01234:0A H αααα==== ，11234:,,,A H αααα不全为零 0123:0B H βββ===，1123:,,B H βββ不全为零为了计算各平方和，列出如下表．子宫重量计算表本题中4,3,12a b n ab ====22109810046712T C n ===4321111354210046713075Tiji j SS xC ===−=−=∑∑242222.11(367225314192)1004676457.66733i Ai T SS C ==−=+++−=∑ 23.22211(260358480)100467607444j Bj T SS C==−=++−=∑130756457.6676074543.33E T A B SS SS SS SS =−−=−−=得到相应的无交互作用双因素方差分析表．子宫重量双因素方差分析表方差来源平方和自由度均方MS F 值临界值因素A（种系） 6457.6732152.5623.770.05(3,6) 4.76F =0.01(3,6)9.78F =因素B60742303733.540.05(2,6) 5.14F =（剂量）0.01(2,6)10.92F =误差E 543.33 6 90.56 总和1307511因为0.0123.77(3,6)A F F =>，认为种系对子宫重量有极显著影响；0.0133.54(2,6)B F F =>，认为剂量对子宫重量有极显著影响．由此可知，种系和剂量对子宫重量都有极显著影响．23．为检验广告媒体和广告方案对产品销售量的影响，一家营销公司做了一项试验，考察三种广告方案和两种广告媒体，获得的销售量数据如下表．试检验广告方案.广告媒体或其交互作用对销售量的影响是否显著．广告方案广告媒体报纸电视 A8,12 12,8 B22,14 26,30 C10,1818,14解设不同广告方案和广告媒体的产品销售量2~(,)ij i j ij Y N µαβγσ+++，1,2i =,3；1,2j =．则需检验的问题为0111221223132:0A B H γγγγγγ×======，1111221223132:,,,,,A B H γγγγγγ×不全为零. 0123:0A H ααα===，1123:,,A H ααα不全为零, 012:0B H ββ==，112:,B H ββ不全为零, 本题计算过程如下表：销售量数据方差分析计算表2A22,14 (36) 26, 30(56) 9284643A10,18 (28)18, 14(32)603600 列和..j x84 108 154 136642..j x705611664 1872032221113616ijti j t x====∑∑∑32221111()307212ijt i j t x ====∑∑∑ 322.117040ij i j x===∑∑36163072544T SS =−=11336430723444A SS =×−=1187203072486B SS =×−=17040307234448562A B SS ×=×−−−=得如下方差分析表：销售量数据双因素方差分析表方差来源平方和自由度均方和 F 值广告方案A 344 2 172 10.75 广告媒体B 48 1 48 3 交互效应A B ×56 2 28 1.75 误差 96 6 16 总和54411查表得0.05(2,6) 5.14F =，0.05(1,6) 5.99F =，因此，广告方案对产品销售量的影响显著；广告媒体对产品销售量的影响不显著；广告方案和广告媒体对产品销售量没有交互作用．。

第10章一般线性模型

B 55 65 75 65 62 56 61 59 60
C 90 95 100 71 75 85 67 78 89
分析：组间效应检验表，a催化剂，F=177.818，
P=0.000<0.01，按照α=0.05的水准，认为不同的催化剂对该化合物的转化率不同。B（温度），F=12.152，P=0.001<0.01，按照 α=0.05的水准，认为对于同一催化剂，不同温度该化合物的转化率不同。
10.5 重复测量设计资料的方差分析
重复测量设计资料的方差分析是对同一因变量
进行重复测量，可以是同一条件下进行的重复测量，目的在于分析各处理组间是否存在统计学意义的同时，分析受试者之间的差异、受试者几次测量之间的差异及受试者与各处理组间的交互效应。
例10-14
（书253）已知三组贫血患者，其血红蛋白浓度及红细胞计数如表所示，试进行单因素多元方差分析。
例10-8 （书229）研究镉作业工人暴露于烟尘的年数与肺活量的关系，按暴露年数将工人分为两组：甲组暴露>=10 年，乙组暴露<10年，两组工人的年龄未经控制，其中x代表年龄（岁），Y代表肺活量（升）。试进行方差分析，问两组暴露于镉作用工人的平均肺活量是否相同？
分析：组件效应检验表，校正模型的F检验，
既可以分析各因素的主效应，又可以分析交互
作用
例10-2 （书215）治疗缺铁性贫血患者12例，分为4组给予不同的治疗，一个月后观察红细胞增加数，假设甲药为因素A，用甲药和不用甲药为因素的两个水平；又假设乙药为因素B，用乙药和不用乙药也为因素的两个水平，次级组各有3各病例。试问甲药、乙药单独使用的治疗效果如何?甲药、乙药同时使用的治疗效果又如何？

第十章协方差分析

第十章协方差分析协方差分析（Analysis of Covariance，简称ANCOVA）是一种多元统计方法，用于在考虑一个或多个共变量（covariates）的情况下，评估一个或多个自变量（independent variables）对于因变量（dependent variable）的影响。

在实际研究中，常常会遇到一些与因变量相关但未被考虑的其他变量，而这些变量可能会对因变量与自变量之间的关系产生干扰。

ANCOVA通过引入共变量来修正这种干扰，从而提高自变量对因变量的解释效果。

ANCOVA的基本思想是通过构建一个线性回归模型，将自变量、共变量以及其交互项作为预测变量，将因变量作为被预测变量，进而评估自变量对因变量的影响。

在这个过程中，共变量的作用是控制或削弱对因变量的影响，从而更准确地评估自变量的效果。

在进行ANCOVA分析之前，需要满足一些前提条件。

首先，因变量和自变量之间应该存在线性关系。

其次，各个共变量与自变量和因变量之间也应该存在线性关系。

最后，自变量与因变量之间的差异不能完全由共变量解释。

在进行ANCOVA分析时，需要进行一些统计检验来评估因变量与自变量、共变量之间的关系。

例如，可以计算自变量和因变量之间的相关系数，使用方差分析来比较组间差异，以及计算共变量与因变量的相关系数等。

ANCOVA的优势在于可以更准确地评估自变量对因变量的影响，同时控制其他可能干扰的因素。

此外，ANCOVA还可以用于提高实验的统计效力，减少研究中可能出现的偏差。

然而，ANCOVA也存在一些局限性。

首先，ANCOVA要求共变量与自变量和因变量之间存在线性关系，因此如果数据不符合线性假设，则ANCOVA可能不适用。

其次，ANCOVA要求样本量足够大，才能保证结果的可信度。

此外，ANCOVA对于共变量和自变量之间的交互作用也存在敏感性。

总结来说，协方差分析是一种有效的多元统计方法，可以用于控制共变量的干扰，评估自变量对因变量的影响。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

其中 µ , α i , β j , γ ij , σ 都是未知参数.
2
i= 1, ⋅⋅⋅, r , j = 1, ⋅⋅⋅, s, k = 1, ⋅⋅⋅, t
这样假设检验问题可以表述成如下的三个假设检验问题:
H 01 : α1 = α 2 = ⋅⋅⋅ = α r = 0; ↔ H11 : α1 , ⋅⋅⋅, α r 不全为零; H 02 : β1 = β 2 = ⋅⋅⋅ = β s = 0; ↔ H12 : β1 , ⋅⋅⋅, β s 不全为零; H 03 : γ ij = 0, i= 1, ⋅⋅⋅, r , j = 1, ⋅⋅⋅, s; ↔ H13 : γ ij 不全为零.
= i 1= j 1
r
s
3.假设检验
185
(1)
σ2
SE
~ χ 2 (rs (t − 1)) ,
(2) 当 H 01 为真时, (3) 当 H 02 为真时, (4) 当 H 03 为真时,
σ
SA
2
~ χ 2 (r = − 1) ,从而 FA ~ χ 2 (s= − 1) ,从而 FB
S A /(r − 1) ~ F (r − 1, rs (t − 1)) ; S E /(rs (t − 1)) S B /( s − 1) ~ F ( s − 1, rs (t − 1)) ; S E /(rs (t − 1))
= FB
10.2 习题详解
1.三台机器制造同一种产品,记录五天的产量如下：机器
A1
138 144
A2
163 148 152 146 157
A3
155 144 159 147 153
日产量
135 149 143
试在显著性 α = 0.05 下检验这三台机器的日产量是否有显著差异. 解对假设检验问题 H 0 : µ = µ = µ3 1 2 取检验统计量 F =
H 01 : α1 = α 2 = ⋅⋅⋅ = α r = 0; ↔ H11 : α1 , ⋅⋅⋅, α r 不全为零; H 02 : β1 = β 2 = ⋅⋅⋅ = β s = 0; ↔ H12 : β1 , ⋅⋅⋅, β s 不全为零.
与双因素等重复试验方差分析的讨论过程类似,可以得到方差分析表: 方差来源因素 A
S A /(r − 1) ≥ Fα (r − 1, rs (t − 1)) , S E /(rs (t − 1))
H 02 拒绝域为 = FB
拒绝域为 FA× B H 03 =
S B /( s − 1) ≥ Fα ( s − 1, rs (t − 1)) , S E /(rs (t − 1))
S A× B /[(r − 1)( s − 1)] ≥ Fα ((r − 1)( s − 1), rs (t − 1)) . S E /(rs (t − 1))
于是数据就有如下结构
xijk = µij + ε ijk , i= 1, ⋅⋅⋅, r ; j = 1, ⋅⋅⋅, s; k = 1, ⋅⋅⋅, t , 2 ε ijk ~ N (0, σ )
上式就是双因素方差分析的数学模型. 引入如下记号:
184
µ=
µ= ⋅j
1 r s µij ; ∑∑ rs= i 1= j 1
186
平方和
自由度
均方
SA
r −1
S A /(r − 1)
F比 S A /(r − 1) FA = S E /((r − 1)( s − 1))
因素 B 误差总和
SB SE ST
s −1
S B /( s − 1) S E /(r − 1)( s − 1)
FA =
S B /( s − 1) S E /((r − 1)( s − 1))
并且所有的 xij 相互独立. 令ε xij − µ j ( j 1, 2, ⋅⋅⋅, r= ; i 1, 2, ⋅⋅⋅, n j ) ,则 ε ij 是在水平 Aj 下做第 i 次观察时由于随 = = ij 机因素的影响而产生的随机误差,且 ε ij 相互独立.所以可得如下的数据结构:
= = µ j + ε ij , j 1, 2, ⋅⋅⋅, r= ; i 1, 2, ⋅⋅⋅, n j ij x 2 ε ij ~ N (0, σ ),
= j 1= i 1
∑∑ ( x
SA
r
nj
⋅j
− x )2 .
σ
SE
2
~ χ 2 (n − r ) ,
σ2
~ χ 2 (r − 1) ,且 S E 与 S A 相互独立.从而
= F
S A / (r − 1) ~ F (r − 1, n − r ) . S E / (n − r )
对给定的检验水平 α ,若 F ≥ Fα (r − 1, n − r ) ,则拒绝原假设 H 0 ,即认为因素 A 影响显著. 5.参数估计
1.数学模型设有两个 A , B 作用于试验的指标,因素 A 有 r 个水平 A1 , A2 , ⋅⋅⋅, Ar ,因素 B 有 s 个水平
= i 1, 2, ⋅⋅⋅, r ; = j 1, 2, ⋅⋅⋅, s 都作 t (t ≥ 2) B1 , B2 , ⋅⋅⋅, Bs ,对因素 A, B 的水平的每对组合 ( Ai , B j ),
= = µ + α i + β j + ε ij= j 1, 2, ⋅⋅⋅, s , i 1, 2, ⋅⋅⋅, r ; x ij r s , 2 = = ε N σ α β ~ (0, ), 0, 0 ∑ ∑ ij i j = i 1= j 1
其中 µ 为总平均, α i 为水平 Ai 的效应, β j 为水平 B j 的效应,且 µ , α i , β j , σ 2 均为未知参数. 此时要检验假设有以下两个:
= i 1, 2, ⋅⋅⋅, r ; = j 1, 2, ⋅⋅⋅, s; = 次试验 , 试验数记为 xijk , 设 xijk ~ N ( µij , σ ), k 1, 2, ⋅⋅⋅, t . 令
2
ε= xijk − µij= (i 1, 2, ⋅⋅⋅, r ; = j 1, 2, ⋅⋅⋅, s; = k 1, 2, ⋅⋅⋅, t ) ,则 ε ijk 相互独立,且 ε ijk ~ N (0, σ 2 ) . ijk
2
1 t 误差平方和 = S E ∑∑∑ ( xijk − xij ⋅ ) ,其中 xij⋅ = ∑ xijk , i= 1, ⋅⋅⋅, r ; j = 1, ⋅⋅⋅, s , t k =1 = i 1= j 1= k 1
S A× B t ∑∑ ( xij⋅ − xi⋅⋅ − x⋅ j ⋅ + x ) 2 . A , B 的交互效应平方和=
= j 1= i 1
∑∑ ( xij − x )2 ,其中 x =
r
nj
1 r j xij . ∑∑ n= j 1= i 1
183
n
1 误差平方和 = S E ∑∑ ( xij − x⋅ j ) ,其中 x⋅ j = nj = j 1= i 1
2
r
nj
∑x
i =1
nj
ij
.
因素 A 的效应平方和 = SA 4.假设检验当 H 0 成立时,则
= x j ~ N ( µ j , σ 2 ), j 1, 2, ⋅⋅⋅, r .
在水平 A j 下进行 n j 次试验,得到取自总体 x j 的容量为 n j 的样本 x1 j , ⋅⋅⋅, xn j j ( j = 1, 2, ⋅⋅⋅,
r ) .于是有
Байду номын сангаас
= xij ~ N ( µ j , σ 2 ), j 1, 2, ⋅⋅⋅, r= ; i 1, 2, ⋅⋅⋅, n j ,
ˆ = x 是 µ 的无偏估计; (1) µ
ˆ j = x⋅ j 是 µ j 的无偏估计; (2) µ
ˆ= (3) α x⋅ j − x 是 α j 的无偏估计; j SE 2 是 σ 的无偏估计; n−r (5) µ j − µ k 的置信度为 1 − α 的置信区间为 ˆ = (4) σ
2
SE 1 1 SE 1 1 ( + ), x⋅ j − x⋅k + tα / 2 (n − r ) ( + ) . x⋅ j − x⋅k − tα / 2 (n − r ) n − s n j nk n − s n j nk 10.1.2 双因素等重复试验的方差分析
γ ij = µij − µi⋅ − µ⋅ j + µ , i= 1, ⋅⋅⋅, r ; j = 1, ⋅⋅⋅, s ,
则 µij = µ + α i + β j + γ ij ,称 γ ij 为水平 Ai 和水平 B j 的交互效应,于是数据的结构可以写成如下的数学模型:
x =µ + α + β + γ + ε , i j ij ijk ijk 2 ε ijk ~ N (0, σ ), r s r s ∑ = = = = α i 0, ∑ β j 0, ∑ γ ij ∑ γ ij 0, = j 1 = i 1= j 1 i 1 =
2. 统计分析总平方和 = ST
r s t
= i 1= j 1= k 1
∑∑∑ ( xijk − x )2 ,其中 x =
r i =1
1 r s t xijk , ∑∑∑ rst = i 1= j 1= k 1 1 s t xijk , i= 1, ⋅⋅⋅, r , ∑∑ st = j 1= k 1
1 r t xijk , j = 1, ⋅⋅⋅, s , ∑∑ rt= i 1= k 1
因素 A 的效应平方和 = S A st 因素 B 的效应平方和 = S B rt