协方差分析02
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.58
42
4.12
43
4.89
43
4.62
37
4.30
50
3.70
50
3.50
45
4.20
48
4.06
51
4.51
46
4.66
58
3.Байду номын сангаас8
38
4.64
38
5.09
方差不齐用校正t检验
未经年龄校正时不同暴露年限的平均肺活量有差异(P=0.005) 不同暴露年限的平均年龄也有差异P=0.01
问题:不同暴露年限的平均肺活量有差异吗?
在不同的暴露水平上肺活量与年龄均呈线性关系!
在不同的暴露水平上肺活量与年龄均呈线性关系!
直接比较不同暴露年限的平均肺活量显然不合理 如何分析比较:控制(或消除)年龄对肺活量的 线性影响后,再比较不同暴露年限的平均肺活量!
方法:协方差分析(线性回归+方差分析)
消除了年龄对肺活量的线性影响后,不同暴露年限的平均肺活量无统计学上的差异
x1(年龄) y1(肺活量,L)
49 4.62 40 4.29 41 4.52 51 3.71 45 4.02 50 3.09 52 2.70 47 4.31 61 2.70 65 3.03 58 2.73 59 3.67
乙组(暴露<10年)
x2(年龄) y2(肺活量,L)
43
4.91
39
4.73
38
(二)估计协方差分量
方差分析中根据均方MS与期望均方EMS
间的关系,可获得不同变异来源的方差分量
估计值;在协方差分析中,根据均积MP与期 望均积EMP间的关系,可获得不同变异来源
的协方差分量估计值。
这种协方差分析称为相关模型的协方差 分析。
第二节 单因素完全随机设计试验资料 的协方差分析
【例10·1】 为研究A1、A2、A3、A4 4种不 同肥料(k=4)对梨树单株产量的影响, 选择 40株梨树作试验, 把40株梨树完全随机分为4 组,每组包含10株梨树(n=10),每组施用1种肥 料。各株梨树的起始干周(x,cm)和单株产量 (y, kg)列于表10—1, 试检验4种肥料的单 株产量是否有显著差异。
如果那些不能很好地进行试验控制的因素 是 可量测的,且又和试验结果之间存在直线回归 关系,就可利用这种直线回归关系将各处理的 观测值都矫正到初始条件相同时的结果,使得 处理间的比较能在相同基础上进行,而得出正 确结论。这一做法在统计上称为统计控制。
这时所进行的协方差分析是将回归分析和 方差分析结合起来的一种统计分析方法,这种 协方差分析称为回归模型的协方差分析。
COV (x, y) n11(x x)(y y)
样本协方差亦称为均积, 简记为MP,是总 体协方差的估计值。
方差 是用来度量单个变量 “ 自身变 异”大小的总体参数,方差越大,该变量的 变异越大;
协方差是用来度量两个变量之间 “协 同变异”大小的总体参数,即二个变量相互 影响大小的参数,协方差的绝对值越大,二 个变量相互影响越大。
表10—1 梨树4种肥料比较试验的起始干周 (x,cm)与单株产量(y,kg)
肥变 料量
观测值
总和 平均
36 30 26 23 26 30 20 19 20 16 246 24.6
A1
89 80 74 80 85 68 73 68 80 58 755 75.5
28 27 27 24 25 23 20 18 17 20 229 22.9
如何分析?
• 假设1:肺活量与暴露无关而与年龄有关? • 假设2:肺活量与暴露、年龄均有关? • 假设3:肺活量仅与暴露有关而与年龄无关? • 假设4:肺活量与暴露、年龄均无关????
研究因素(变量):暴露年限 控制因素(变量):年龄 结局变量: 肺活量
yˆ 7.163 0.069(年龄)
yˆ 6.543 0.048(年龄)
二、协方差分析的功用
(一)对试验进行统计控制
要提高试验结果的正确性,必须严格控制试验 条件的均匀性,使各处理处于尽可能一致的试验条 件下,这一做法在统计上叫做试验控制。
但试验控制有时不一定能实施。例如,研究棉 花的蕾铃脱落率要求各处理的单株有相同蕾铃数, 研究不同肥料对梨树的单株产量的影响要求各株梨 树起始干周完全相同等,都不易达到。在这些情况 下,要消除起始条件不等对试验结果的影响,提高 试验结果分析的正确性,就应采用协方差分析。
方差分析(六)
协方差分析
第一节 协方差分析的意义 和功用
下列数据是研究镉作业工人暴露于烟尘的年数与 肺活量的关系。按暴露年数将工人分为两组:甲 组暴露≥10年,乙组暴露<10年。两组工人年龄
未经控制。问该两组暴露于镉作业工人平均肺活 量是否相同?
镉作业工人接触烟尘年数与肺活量的关系研究
甲组(暴露≥10年)
A4
52 58 64 62 54 54 55 44 51 51 545 54.5
947 23.675
试验用4种肥料分别施10株梨树,各组的 单株产量 y 既包含了不同肥料所引起的 “自身变异”,也包含了不同的起始干周x 所引起的 “协同变异”,因此应采用协方 差分析法将“协同变异”从 y 的总变异中 剔除,获得y的“自身变异”,然后才能正 确地检验4种肥料平均单株产量是否有显著 差异。
A2
64 81 73 67 77 67 64 65 59 57 674 67.4
28 33 26 22 23 20 22 23 18 17 232 23.2
A3
55 62 58 58 66 55 60 71 55 48 588 58.8
32 23 27 23 27 28 20 24 19 17 240 24.0
一、协方差分析的意义
协方差 是两个变量的协变异数 ,用 COV(x,y)表示。
对于一个具有N对(x,y)的有限总体, x与y的协方差定义为双变量离均差乘积和 的平均数,即:
COV (x, y) 1 N
(x x )( y y )
对于具有n对观测值的样本,x与y的样 本协方差COV(x, y)定义为双变量离均差 乘积和与自由度的商,即:
对于仅涉及单个变量的试验资料,由于其总 变异仅为“自身变异”(如单因素完全随机设 计试验资料,“自身变异”是指由处理和随机 误差所引起的变异),因而可以用方差分析法 进行分析;
对于涉及两个变量的试验资料,由于每个 变量的总变异既包含了“自身变异”又包含了 “协同变异”(是指由另一个变量所引起的变 异),须采用协方差分析法来进行分析,才能 得到正确结论。