第七讲 方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 三、方差分析的类型 • 1。单因素方差分析(one-way ANOVA) 也称为完全随机设计(completely random design)的方差分析。该设计只能分析一个 因素下多个水平对试验结果的影响。 • 2。双因素方差分析(two-way ANOVA) 称为随机区组设计(randomized block design)的方差分析。该设计可以分析两 个因素。一个为处理因素,也称为列因素; 一个为区组因素,也称为行因素。
i j
2 ij j i
( X
ij
)2
• •
• • •
计算公式
• 三、计算实例 • 例4.2 某医院研究五种消毒液对 四种细菌的抑制效果。抑制效果用 抑菌圈直径(mm)表示。数据见表 4-5。试分析五种消毒液对细菌有 无抑制作用,对四种细菌的抑制效 果有无差异。
表4-5 消毒液对不同细菌的抑 制效果
细菌类型 大肠杆菌 绿边杆菌 葡萄球菌 痢疾杆菌 ∑j X 各组均数 ∑j X
2
消毒液类型 A 15 11 25 20 71 17 . 75 1371 B 17 12 28 17 74 18 . 50 1506 C 15 14 25 19 73 18 . 25 1407 D 14 13 30 13 70 17 . 50 1434 E 12 9 22 17 60 15 . 00 998
• 2.常用符号及其意义
• ⑴: 所 将第i个处理组的j个数据合计后平方,再将 有i个处理组的平方值合计。 • ( X ) ⑵: 将第j个区组的i个数据合计后平方,再将所 有j个区组的平方值合计。 ⑶ 各种变异来源 SS总:总变异, 由处理因素、区组因素及随机误差的综 合作用而形成。 SS处理:各处理组之间的变异,可由处理因素的作用所 致。 SS区组或SS配伍:各区组之间的变异,可由区组因素的 作用所致。 SS误差:从总变异中去除SS处理及SS区组后剩余的变异。 此变异由个体差异和测量误差等随机因素所致。
第四章 方差分析
• 学习要求: • 1。掌握方差分析的基本思想; • 2。掌握单因素、双因素方差分析的应用条件、 意义及计 算方法; • 3。熟悉多个均数间两两比较的意义及方法; • 4。了解方差齐性检验和t’检验的意义及方法; • 5。熟悉变量变换的意义和方法。
第一节
方差分析的基本思想
• 一、方差分析的用途及应用条件 • 方差分析(analysis of variance,缩写为ANOVA) • 是常用的统计分析方法之一。其应用广泛,分析效率高 , 节省样本含量。 • 主要用途有: • ①进行两个或两个以上样本均数的比较; • ②可以同时分析一个、两个或多个因素对试验结果的作用 和影响; • ③分析多个因素的独立作用及多个因素之间的交互作用; • ④进行两个或多个样本的方差齐性检验等。 • 方差分析对分析数据的要求及条件比较严格,即要求各样 本为随机样本,各样本来自正态总体,各样本所代表的总 体方差齐性或相等。
• 三。计算实例 • 例 4.1 科 研 人 员 研 究 细 胞 增 殖 核 抗 原 (PCNA)在胃癌组织(A组),胃癌旁组织 ( B 组)及正常胃粘膜组织( C 组)中的表 达状况。检测结果用表达指数来表示。 • 数据见表 4 - 2 。试分析 PCNA 在三种胃组织 中的表达有无差异。
表4-2 PCNA在三种不同胃组织中的 表达结果 不同胃组织Xi
• 4。各种变异除以相应的自由度,称为均方, 用MS表示,也就是方差。当H0为真时,组 间均方与组内均方相差不大,两者比值F值 约接近于1。 即 F=组间均方/组内均方≈1。 • 5。当H0不成立时,处理因素产生了作用, 使得组间均方增大,此时,F>>1,当大 于等于F临界值时,则P≤0.05。可认为H0 不成立,各样本均数不全相等。
• 3。计算各部分变异的均方 在方差分析中,方差也称 为均方,是各部分的离均差平方和除以其相应的自由度, 用MS表示。基本公式为:MS=SS/ν。 • 4。计算统计量F值 F值是指两个均方之比。一般是用较 大的均方除以较小的均方。故F值一般不会小于1。 • 5。确定P值,推断结论 根据分子ν1,分母ν2,查F界 值表(方差分析用),得到F值的临界值(critical value),即:如果F≥F界值,则P≤0.05,在α=0.05水 准上拒绝H0,接受H1。可以认为各样本所代表的总体均数 不全相等。如果想要了解哪两个样本均数之间有差异,可 以继续进行各样本均数的两两比较。
3。三因素方差分析 也称为拉丁方设计(Latin square design)的方差分析。该设计特点是,可 以同时分析三个因素对试验结果的作用,且三个 因素之间相互独立,不能有交互作用。 4 。 析 因 设 计 ( factorial design ) 的 方 差 分 析 当两个因素或多个因素之间存在相互影响或交互 作用时,可用该设计来进行分析。该设计不仅可 以分析多个因素的独立作用,也可以分析多个因 素间的交互作用,是一种高效率的方差分析方法。
标本Xj 1 2
A
56 46
B
30 37
C
21 14
3
… ∑Xj ni 均数 ∑Xj2
39
… 553 10 55.30 31291
20
… 221 9 24.56 6273
27
… 100 8 12.5 1672 874 (∑X) 27 ( N) 32.37(总均值) 39236( ∑X2)
• 检验步骤及方法 • ⑴建立检验假设 • H0 :PCNA在三种组织中的表达指数相同, μ1 = μ2 = μ3; • H1:PCNA在三种组织中的表达指数不全相同。 • α=0.05, • ⑵计算检验统计量F值 由表4-2的数据计算有: • 校正系数 C =( ∑ X ) 2 / N =( 874 ) 2 / 27 = 28291.70 • SS总=∑X2-C=39236-28291.70=10944.3 • υ总=N-1=27-1=26
表4-2 结果
标本Xj 1 2
PCNA在三种不同胃组织中的表达
不同胃组织Xi
A
56 46
B
30 37
C
21 14
3
… ∑Xj ni 均数 ∑Xj2
39
… 553 10 55.30 31291
20
… 221 9 24.56 6273
27
… 100 8 12.5 1672 874 (∑X) 27 ( N) 32.37(总均值) 39236( ∑X2)
• 四、方差分析的基本步骤 • 1。计算总变异:指所有试验数据的离均差 平方和。
SS总 ( X X ) 2 X 2 (X ) 2 / N
C (X ) / N
2
• 2。计算各部分变异 :单因素方差分析中,可以分出 组间变异(SS组间)和组内变异(SS组内);双因素方差 分析中,可以分出处理组变异(SS处理),区组变异(SS 区组)或称为配伍组变异(SS配伍)及误差变异(SS误差)。
∑i X 73 59 130 86 348 (∑X) 17.4(总均数) 6716 ∑X )
2
• • • •
• • • • • •
检验步骤及方法 (1)建立检验假设 1)对处理因素作用的检验假设 H0 :五种消毒液的消毒效果相同, μ 1 = μ 2 = μ =μ 4=μ 5; H1:五种消毒液的消毒效果不全相同。 α =0.05 2)对区组因素作用的检验假设 H0 :四种细菌的抑菌圈直径相同, μ 1 = μ 2 = μ =μ 4; H1:四种细菌的抑菌圈直径不全相同。 α =0.05
• υ组间=k-1=3-1=2 • SS 组 内 = SS 总 - SS 8965.98=1978.32
SS组间
i
组 间
= 10944.3-
( X ij ) 2
j
ni
(553) 2 (221 ) 2 (100) 2 C 28291 .70 10 9 8
37257 .68 28291 .70 8965.98
第二节
单因素方差分析
• 1 。特点 单因素方差分析是按照完全随机设计 的原则将处理因素分为若干个不同的水平,每个 水平代表一个样本,只能分析一个因素对试验结 果的影响及作用。其设计简单,计算方便,应用 广泛,是一种常用的分析方法,但其效率相对较 低。该设计中的总变异可以分出两个部分, • 即SS总=SS组间+SS组内。 • 2。常用符号及其意义 • (1)Xij 意义为第i组的第j个数据。其中下标 i 表 示列,j 表示行。 • (2) X 意义为将第i组的全部j个数据合计。
2 2 12 2 k 2
即要求检验假设为 此假设的意义为,在某处理因素的不同水平下, 各样本的总体均数相等。 H :
0 1 2 k
• 1。设某因素有多个水平,即试验数据产生 多个样本。由多个样本的全部数据可以计 算出总变异,称为总的离均差平方和。即 SS总。 • 2。数理统计证明,SS总可以由几个部分构 成。单因素方差分析中, SS总由组间变异 和组内变异构成。 • SS总=SS组间+SS组内。 • 3。组间变异主要受到处理因素和个体误差 两方面影响,组内变异主要受个体误差的 影响。当H0 为真时,由于处理因素不起作 用,组间变异只受个体误差的影响。此时, 组间变异与组内变异相差不能太大。
表4-3 方差分析表
变异来 源 (1) SS总 SS 自由 度 F值 F0.0 5 F0.0 1 P值
均方
(2)
(3) (4)
(5) (6) (7) (8)
10944 26 .30
SS组间
SS组内
8965. 98 1978. 32
2
24
4482. 54.3 3.40 99 9 82.43
5.61 <0.0 1
5。正交试验设计的方差分析 如果 要分析的因素有三个或三个以上, 可进行正交试验设计(orthogonal experimental design)的方差分 析。当分析因素较多时,试验次数 会急剧增加,用此设计进行分析则 更能体现出其优越性。该设计利用 正交表来安排各次试验,以最少的 试验次数,得到更多的分析结果。
第三节
双因素方差分析
• 一、特点及意义 • 1. 特点 按照随机区组设计的原则来分析两个因 素对试验结果的影响及作用。其中一个因素称为 处理因素,一般作为列因素;另一个因素称为区 组因素或配伍组因素,一般作为行因素。两个因 素相互独立,且无交互影响。双因素方差分析使 用的样本例数较少,分析效率高,是一种经常使 用的分析方法。 • 但双因素方差分析的设计对选择受试对象及试验 条件等方面要求较为严格,应用该设计方法时要 十分注意。该设计方法中,总变异可以分出三个 部分: • SS总=SS处理+SS区组+SS误差
二、方差分析的基本思想 处理因素可分为若干个等级或不同类型,通常 称为水平。在不同的水平下进行若干次试验并取 得多个数据,可以将在每个水平下取得的这些数 据看作一个样本。若某个因素有四个水平,每个 水平的数据代表一个样本,则获得四个样本的数 据。 设有k 个相互独立的样本,分别来自 k 个正态总体 X1,X2,…Xk,且方差相等,
ij j
( X
ij
)2
•Leabharlann Baidu(3) 平方,
i
j
将第i组的j个数据合计后 再将所有各i组的平方值合
计。 • (4)变异来源 ①SS总:表示变异由处 理因素及随机误差共同所致;② SS组间: 表示变异来自处理因素的作用或影响; ③ SS 组内 :表示变异由个体差异和测量 误差等随机因素所致。
计算公式
MS组内
SS组内
组内
1978 .32 82.43 24
MS组间
SS组间
组间
8965 .98 4482 .99 2
• (3) 列方差分析表 见表4-3。 • (4 )确定 P 值 根据 α = 0.05 , υ1 = υ 组间 = 2 , υ2=υ组内=24,查附表4,F界值表,得F界值: F0.01(2,24)=5.61 。 本 例 F = 54.39 , 大 于 界 值 F0.01(2,24)=5.61,则P<0.01。 • ( 5 )推断结论 由于 P < 0.01 ,在 α = 0.05 水准 上拒绝 H0 ,接受 H1 ,差异有统计学意义。可以认 为 PCNA 在三种不同胃组织中的表达指数不全相同。 • 该结论的意义为,至少有两种组织的 PCNA 表达指 数不同。如果想确切了解哪两个组织的 PCNA 表达 指数有差异,可进一步作多个样本均数的两两比 较。