★卫生统计学专题九:方差分析
卫生统计学---方差分析
c4 0.419 -0.663 -0.663 -0.196 0.740 1.591 0.942 0.810 -1.279 0.410 0.262
c5 0.466 -1.032 -1.032 -0.465 1.752 0.029 -0.694 -0.790 1.067 0.016 -0.017
c6 -1.357 0.151 0.151 0.535 0.850 -1.806 0.942 -1.634 -0.745 0.856 -0.140
ni
2
k SS组内
i 1
ni
( xij
j 1
xi )2
k i 1
ni j 1
xi2j
xij
j 1
ni
组内 N k
2019/12/5
19
ANOVA
• 三种变异的关系:线性可加性
SS总 SS组间 SS组内
Ronald Fisher
2019/12/5
11
ANOVA
• 常用术语:
– 因素:所要检验的对象称为因素(如研究某种 药物的不同剂量疗效,药物即因素)
– 水平:因素的具体表现称为水平(药物的每个 剂量为一个水平)
– 观察值:在每个因素水平下得到的样本值
2019/12/5
12
ANOVA
• 变异的测量:
c10 0.562 0.828 1.446 0.487 0.208 0.603 0.549 0.416 -0.472 1.080 0.571
S 0.970
1.072
1.026
0.844 0.887 1.128 0.995 0.876 0.839 0.510
医学统计学之方差分析(pdf 10页)
回顾t检验、秩和检验 t检验应用条件及特 点: 小样本 正态性 方差齐性 秩和检验应用条件及 特点: 不符合t检验条件时•多组之间的样本均数比较例:有身高发育低下的儿童20名,应用 五种不同膳食进 行治疗,每组4名,一个疗程后各组儿童身高增加值如下 表,问五种不同膳食组身高增长的平均数间有无差别?膳食 X 第一组 第二组 第三组 第四组 第五组3.3 5.1 5.5 8.3 8.5在不同的 个体间值 存在差异6.8 6.3 7.3 7.7 7.82.2 3.2 7.6 6.2 10.4 5.5 3.1 7.2 9.1 6.8X =6.395X i 4.450 4.425 6.900 7.825 8.375同一种膳食(组内) 的四个儿童值不同膳食组间身高增长 值平均数存在不同能否将五组分别进行t检验呢? 按排列组合5组两两比较,共进行10次t检验。
若每次t检验犯第1类错误的概率为0.05,则不犯 第1类错误的概率为0.95,10次检验独立进行, 10次都不犯第1类错误的概率应为 0.9510=0.5987 ,故在10次t检验中至少有一次犯 第1类错误的概率为:•P:1-0.9510=0.4013>>0.05不能将五组分别两两进行t检验!方差分析!第九章 方差分析1.方差分析的基本思想和应用条件 2.完全随机设计 3.随机区组设计资料的方差分析 4.多个均数间的两两比较 5.交叉设计资料的方差分析 6.析因设计的方差分析 7.重复测量资料的方差分析 8.多个样本的方差齐性检验第一节 方差分析的基本思想和应用条件1第一节 完全随机设计的方差分析1. 方差分析的概念 方差分析(ANOVA)又称变异数分析或F检验,其目的是推断两组或多组资料的总体均数是否相 同,检验两个或多个样本均数的差异是否有统计 学意义。
应用条件: • 各样本相互独立 • 均来自总体方差具有齐性的正态分布方差分析的基本思想 将全部观察值的总变异按影响实验结果的诸 因素分解为若干变异,构造出反映各部分变 异作用的统计量(SS),之后构造假设检验 统计量(F),实现对总体均数的推断。
医学统计学方差分析(ANOVA)
方差分析是为了比较多个总体样本均数是否存在差别。
该方法有RA.Fisher首先提出,后来由GW.Snedecor完善,为了纪念Fisher,故称方差分析为F检验。
组间均方:MS组间=SS组间/ v组间,SS代表离均差平方和,v代表自由度,组间变异包括处理效应和随机误差。
组内均方:MS组内=SS组内/ v组内,组内差异包括随机误差。
F=MS组间/MS组内,F接近1,说明组间差异不大。
方差分析的基本思想,首先将总变异分为组间和组内变异,然后计算两者的F 值。
F值越大,说明组间差异大,处理起作用,反之,则不起作用,是由随机误差导致的。
方差分析应用条件:1)样本独立;2)来自正态总体;3)方差齐性。
方差分析包括完全随机设计(completely random design)的方差分析,又叫单向(one-way)方差分析和随机区组设计(radomized block design)的方差分析又叫双向(two-way)方差分析。
完全随机设计的方差分析是将受试对象随机化的分配到各个处理组或对照组的方法,未考虑干扰因素的影响,各个组的样本数可以不一样多。
随机区组设计的方差分析将受试对象按照性质相同或相近组成b个区组,每个区组有g个受试对象,分别随机分配到g个处理组,这样各个处理组不仅样本个数相同,生物学特性也比较均衡。
方差分析拒绝H0,接受H1,只说明g个总体均数不全相等,如果想要进一步了解那两个组均数不等,需要进行两两比较或称多重比较,即post-hoc检验。
ANOVA与T test的关系:.。
卫生统计学_方差分析[新版]
请思考以下问题
该实验属何种设计方案?处理因素 是什么?有几个水平?观察指标 是什么?
能否采用 t 检验比较不同作业环境中 的大鼠全肺湿重是否有差异?
对于小样本多组均数的比较不能采用t检 验进展两两比较
原因: 割裂整体设计,只见树木,不见森林 增大一型错误的概率 可以采用方差分析的方法进展分析
误 差 2 9921 8
【检验步骤】 2.计算检验统计量F值 〔2〕计算均方与F值
M S 处 理 2 4 8 .5 7 9 /2 1 2 4 .2 9 0
M S 区 组 2 3 5 7 .7 9 9 /9 2 6 1 .9 7 8
M S 误 差 5 3 7 .1 8 6 /1 8 2 9 .8 4 4
1.组间无差异,理论上F=1 2.假设处理组间有差异,那么F>1。是否统计学
意义查方差分析界值表 若F≥Fα(νTR,νe),则P≤0.0 5 若F<Fα(νTR,νe),则P>0.0 5
如果H0成立, F=MSTR/MSe 1
不能拒绝H0
拒绝H0
a
0
F
Fa(k-1,n-k)
F 分布
➢ ANOVA应用条件
第三节 随机区组设计的 ANOVA
表9-6 3种营养素喂养小白鼠所增体重〔g〕方差分析计算表
xj
ni xi
x
S i2
S2
变异分解
SS总 = SS处理+SS区组+SSe
总处 理 区 组 e
检验统计量F 值
F处理=MS处理/ MSe F区组=MS区组/ MSe
变异来源 处理组 区组 误差 总变异
表9-3 完全随机设计方差分析计算公式
ni (xi x)2 i
医学统计学(方差分析)
各种变异的表示方法
04
列举存在的变异及意义
各种变异的表示方法
SS总 总 MS总
SS组内 组内 MS组内
SS组间 组间 MS组间
三者之间的关系: SS总= SS组内+ SS组间 总= 组内+ 组间
F=MS组间/MS组内
自由度: 组间=组数-1
组内=N-组数
通过这个公式计算出统计量F,查表求出对应的P值,与进行比较,以确定是否为小概率事件。
01
计算 C=(Σx) 2/N=(3309.5) 2/30=365093 SS总=Σx2-C=372974.87-365093=7881.87
α=0.05
02
SS组内=SS总-SS组间=7881.87-2384.026=5497.84
Ν总=N-1=29, Ν组间=k-1=2, Ν组内=N-k=30-3=27
159.0
111.0
115.0
合计Σxij
1160
921.5
1228
3309.5(Σx)
ni
11
9
10
30(N)
均数
105.45
102.39
122.80
110.32()
糖尿病
IGT
正常人
xij
106.5
Σ
Σxij2
123509.52
144.0
105.2
124.5
117.0
109.5
105.1
110.0
96.0
76.4
109.0
115.2
95.3
103.
95.3
医学统计学第九章方差分析课件PPT
17.40
25.61 19.12
21.36
19.53 15.31
21.75
12.65
19.47
18.48
15.51
19.83
10.86
23.12
27.81
19.22
21.65
19.22
16.32
16.72
20.75
27.90
22.11
11.74
13.17
24.66
17.55
14.18
19.26
16.52
SS组间 SS B ni ( X i X )
i 1
k
2
组间 k 1
2.组间变异:各组均数与总均数的离均差平方和,反
映处理因素的作用和随机误差的影响
SS组间 21(9.1952 6.8650)2 19(5.8000 6.8650)2 20(5.4300 6.850)2 176.7612
MS 909.8723 / 57 15.9627
三种变异的关系:
SS总 SS组间 SS组内
总 组间 组内
检验统计量:
MS组间 F , 1 组间 , 2 组内 MS组内 如果 1 2 k ,则 MS 组间 ,MS 组内 都为
进行多次(k)假设检验,犯第一类错误的概率: 1-(1-)k 组数为4, k=6, 1-(1-0.05)k=0.2649 组数为5, k=10, 1-(1-0.05)k=0.4013 组数为6, k=15, 1-(1-0.05)k=0.5400
第九章 方差分析
analysis of variance, ANOVA
1412ff100806040200?1?1?2?5?1?5?2?5?1?10?2?1012f34f分布曲线0变异分解c??xn2完全随机设计资料的方差分析表变异来源总变异自由度n1k1ssms2f?x?c2组间?nixi?xiss组间?组间ss组内ms组间ms组内组内nkss总?ss组间?组内引例某医生为研究一种四类降糖新药的疗效以统一的纳入标准和排除标准选择了60名2型糖尿病患者按完全随机设计方案将患者分为三组进行双盲临床试验
卫生统计学课程第九篇方差分析
添加标题
原假设和备择假设,并进行假设 检验。
结果解释:根据方差分析的结果, 解释各组之间的差异是否具有统 计学显著性。
05
方差分析的实例解析
实例选择与数据来源
实例选择:选择具有代 表性的数据集
数据来源:确保数据真 实可靠,避免数据污染
数据量:样本量要足够 大,以提高分析的准确
模型建立
确定研究因素和水平
收集数据并整理
确定实验设计和样本量
建立方差分析模型并进行 统计分析
模型检验
方差分析的前提假设 模型拟合度检验 模型诊断与检验 模型预测与评估
结果解释与推断
描述性统计:对数据进行描述性 统计,包括平均数、标准差等。
方差分析:利用方差分析的方法, 比较不同组之间的差异。
添加标题
添加标题
添加标题
添加标题
农业试验:分析不同品种、肥料 等对农作物产量的影响
市场调研:比较不同地区、不同 营销策略对销售额的影响
03
方差分析的数学模型
方差分析的数学表达
方差分析的基本思想是通过数学 模型将不同组别的数据转化为可 比较的形式,从而进行统计分析。
在方差分析中,因变量的变异被分 解为组间变异和组内变异,组间变 异反映了不同组别之间的差异,组 内变异则反映了随机误差。
方差分析与相关分析的比较
目的:比较方差分析和相关分析的异同点
方差分析:用于比较不同组之间的差异,要求数据满足独立性、正态性和方差齐性
相关分析:用于研究变量之间的相关关系,不要求数据满足独立性、正态性和方差 齐性
适用范围:方差分析适用于组间比较,相关分析适用于变量间关系研究
感谢您的观看
汇报人:XX
方差分析的基本假设 方差分析的数学模型 方差分析的数学推导过程 方差分析的数学意义
第九章----方差分析
若组间变异明显大于组内变异, 则不能认为组 间变异仅反映随机误差的大小, 处理因素也在起 作用。根据计算出的检验统计量F值, 查界值表 得到相应的P值, 按所取检验水准α作出统计推断 结论。
检验统计量F值服从F分布。
F<Fα,(ν组间, ν组内),则P > α, 不拒绝H0, 还不能认 为各样本所来自的总体均数不同;
1、各样本是相互独立的随机样本, 且来自 正态分布的总体;
2、相互比较的各样本的总体方差相等, 即 具有方差齐性。 独立性、随机性、正态性、方差齐性
五、方差分析的用途
1、用于进行两个或多个样本均数的比较; 2、分析两因素或多因素间的交互作用; 3、用于回归方程的线性假设检验。
六、方差分析的优点
1、不受比较组数的限制,可比较多组均数; 2、可同时分析多个因素的作用; 3、可分析因素间的交互作用.
一、多个样本均数间的比较能否用 t 检 验或 u 检验?为什么?
原因:
五个样本均数进行比较, 每次两个均数作一次 t 检验, 共需作10(C52=10)次 t 检验。若每次比 较的检验水准α=0.05, 则每次比较不犯Ⅰ型错误 的概率为(1-α)=0.95。当这些检验独立进行 时, 则10次比较均不犯Ⅰ型错误的概率为0.9510= 0.5987, 此时犯Ⅰ型错误的概率, 即总的检验水准 α变为1-0.5987=0.4013比0.05大的多。犯Ⅰ型错 误的概率增大, 可能将原本无差别的两个总体推 断为有差别, 误判为有统计意义。因此多重比较 不宜用的 t 检验或 u检验作两两比较。
已知各组均数、标准差和样本含量时F值 的简便计算方法。
当原始数据未知, 只知各组均数、标准差和 样本含量时, 可进行如下计算, 分两种情况: 1、各组样本含量ni相等; 2、各组样本含量ni不等。
医学统计学(方差分析)
评估经济政策的 效果
研究设计:用于 设计实验和研究 方法
数据分析:用于 分析实验数据和 结果
假设检验:用于 检验假设和结论
结果解释:用于 解释实验结果和 结论
PRT FIVE
可以检验多个自变量对因变 量的影响
适用于多个样本均值比较
可以控制其他自变量的影响
可以检验自变量与因变量之 间的关系是否显著
确定研究目的和假设
选择合适的统计方法
收集数据并进行预处 理
对数据进行分组和分 类
计算方差和标准差
进行方差分析并解释 结果
添加标题 添加标题 添加标题 添加标题 添加标题 添加标题
确定研究设计:选择合适的方差分析类型如单因素方差分析、双因素方差分析或多因素方差分析 收集数据:收集实验或调查数据包括自变量和因变量 计算均值和方差:计算每个组的均值和方差以及总体均值和总体方差 计算F值:使用F分布表计算F值用于检验假设 确定P值:计算P值用于判断假设是否成立 得出结论:根据P值和F值得出结论如假设成立或不成立以及各组之间的差异是否显著。
异常值:需要检 查数据中是否存 在异常值如果存 在需要处理或剔 除
样本量:样本量 需要足够大否则 方差分析的结果 可能不准确
样本量:应足够大 以保证统计结果的 可靠性
分组数:应适中过 多或过少都会影响 结果的准确性
样本量与分组数的 关系:应根据研究 目的和实际情况进 行选择
样本量与分组数的 选择原则:应遵循 统计学原理和研究 设计要求
识别异常值:通过统计方法或经验判断识别异常值 处理方法:删除、替换或保留异常值根据实际情况选择合适的处理方法 影响因素:异常值可能受到样本量、测量误差等因素的影响
结果解释:异常值对分析结果的影响需要谨慎对待避免过度解读或忽视其存在
医学统计学方差分析
医学统计学方差分析方差分析是一种统计学方法,用于比较三个或三个以上的组之间的平均值是否存在显著差异。
在医学研究中,方差分析常用于比较不同治疗方法或不同个体群体之间的差异,以确定是否存在统计学上的显著差异。
方差分析的基本原理是比较组间离散程度与组内离散程度的比值,即组间均方与组内均方的比值。
组间方差表示不同组之间的差异性,组内方差表示同一组内个体之间的变异程度。
如果组间离散程度显著大于组内离散程度,即组间均方大于组内均方,就可以得出组间存在显著差异的结论。
在医学研究中,方差分析可以应用于很多不同的情况。
举例来说,我们可以使用方差分析来比较不同药物对同一疾病的治疗效果,或者比较不同药物剂量对同一疾病的治疗效果。
我们还可以使用方差分析比较不同年龄组、性别组或不同地区患者之间的其中一种疾病发病率。
方差分析的核心是比较组间差异与组内差异。
组间差异可以通过计算组间均方来得到。
组间均方的计算公式为组间平方和除以组间自由度。
组间平方和是每个组内数据与该组均值之差的平方的总和。
组间自由度等于组数减1、组内差异可以通过计算组内均方来得到。
组内均方的计算公式为组内平方和除以组内自由度。
组内平方和是每个组内数据与该组均值之差的平方的总和。
组内自由度等于总体样本量减去组数。
计算得到组间均方和组内均方之后,即可计算F值。
F值等于组间均方除以组内均方。
F值的计算结果可以与F分布的临界值进行比较,以判断组间均方是否显著大于组内均方。
如果F值大于F分布的临界值,就可以得出组间存在显著差异的结论。
除了F值,方差分析还可以计算一些其他的统计量。
例如,可以计算每个组的均值和标准差,以了解不同组之间的差异程度。
还可以计算方差分析表,其中包含了组间平方和、组间自由度、组间均方、组内平方和、总平方和、总自由度、组内自由度和组内均方等统计量。
需要注意的是,在进行方差分析之前,需要检验数据的正态性和方差齐性。
正态性检验可通过绘制正态概率图、Shapiro-Wilk检验或Kolmogorov-Smirnov检验进行。
医学统计学:第九章 方差分析
目 录
第一节 方差分析的基本思想
第二节
第三节
单因素方差分析
双因素方差分析
第四节
多个样本均数间的两两比较
学习要求
1、掌握方差分析的基本思想; 2、掌握单因素方差分析的应用条件、意义
及计算方法;
第一节 方差分析的基本思想
一、方差分析的用途及应用条件 1. 方 差 分 析 ( analysis of variance ,
即要求检验假设为 H 0 : 1 2 k 此假设的意义为,在某处理因素的不同水平下,各样本的 总体均数相等。
3、设某因素有多个水平,即试验数据产生多个样本。由
多个样本的全部数据可以计算出总变异,称为总的离均差 平方和。即SS总。
4、数理统计证明,SS总可以由几个部分构成。单因素方差
该结论的意义为,至少有两种组织的 PCNA 表达指数不 同。如果想确切了解哪两个组织的PCNA表达指数有差异, 可进一步作多个样本均数的两两比较。
表4-3 方差分析表
变异来 源
(1) SS ( 2) 自由度 (3) 均方 (4) F值 (5) F0.05 (6) F0.01 P值
(7) (8)
SS总
PCNA在三种不同胃组织中的表达结果
不同胃组织Xi
A 56 46 39 57 61 54 70 64 50 B 30 37 20 17 37 36 16 13 15 221 9 24.56 6273 100 8 12.5 1672 874 (∑X) 27 ( N) 32.37(总均值) 39236( ∑X2) C 21 14 27 8 9 6 10 5
ANOVA)是常用的统计分析方法之一。其应
卫生统计学 卫统9 方差分析
ij
i
( 9 - 3 )
24.06.2021
.
11
– 数理统计可以证明,上述三种变异及相应自由
度的关系为:
S S 总 S S 组 间 S S 组 内
总 组 间 组 内
( 9 - 4 )
• 以上各离均差平方和均与自由度有关,为了便 于比较,可将各离均差平方和除以相应的自由
度,得各自的均方(mean square,MS)
24.06.2021
.
17
• 方差分析的应用条件
– 任何统计分析方法都有其适用条件,对于方差 分析来说,理论上要求数据满足以下条件:
• 各样本须是相互独立的随机样本(独立性) • 各样本来自正态分布总体(正态性) • 各总体方差相等(方差齐性)
24.06.2021
.
18
第二节 完全随机设计的方差分析
24.06.2021
.
41
24.06.2021
.
42
24.06.2021
.
43
24.06.2021
.
44
第五节 交叉设计的方差分析
• 交叉设计(cross-over design)
– 医学研究中多用于止痛、镇静、降压等药物疗 效的研究,可分为两阶段交叉设计和多阶段交 叉设计。
• 两阶段交叉设计方差分析的变异分解为:
• 可能由随机误差所致,随机误差包括两种成分: 个体间的变异和测量误差两部分;
• 可能是由于各组所接受的处理不同,不同的处理 引起不同的作用和效果,导致各处理组之间均数 不同。
24.06.2021
.
6
– 本研究关心三组大鼠的全肺湿重有无差别? 即三个处理组(不同环境)总体均数之间是否相 等。
(卫生统计学)第九章 方差分析
由于ANOVA是根据试验设计将总变异分成若干部分,因此设计时考虑的因素越多, 变异划分的越精细,各部分变异的涵义越清晰明确,结论的解释也越容易。同时由于变异 划分精细,误差部分减小,提高了检验的灵敏度和结论的准确性。
方差分析的基本思想是:按造成数据变异的来源分解离均差平方和与自由度,然后借助F 分布作统计推断。
S 处 1 S 2 . 理 5 0 3 . 2 8 2 1 4 0 2 . 9 0 2 0 3 . 2 7 0 2 1 4 6 4 . 1 0 2 0 3 . 2 7 0 2 4 1 0 . 7 2 3 0 0 0 1
S 区 S 3 组 3 .1 2 3 .2 3 4 2 3 3 3 2 .10 7 3 .2 3 4 2 3 . 2 .3 . 3 .5 0 0 3 .2 3 4 2 3 1 .5 05 077
( i1
xij)2
j1
N
S总 SS组 S 间 S组 S 内
ni
k ni
k ni
(
k
xi)j2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专题九 方差分析方差分析(ANOV A ),又称F 检验,是一种以分析数据的变异为基础,以F 值为统计量的计量资料的假设检验方法。
用较不同变异来源的均方,借助F 分布做出统计推断。
⑴方差分析的应用条件:①各观察值相互独立,且每一水平下的观察值均服从正态分布。
②各总体方差相等,即具有方差齐性。
⑵对于不满足方差分析应用条件的资料,可采用以下两种方式进行处理:①变量变换,是指满足方差分析的基本假定。
②应用非参数统计分析方法。
⒉完全随机设计的ANOV A各组样本均数各不相等,这种差异可能由两种原因引起:①随机误差;②处理因素。
⑴完全随机设计的变异分解:完全随机设计(成组设计)资料的总变异可以分解为组间变异和组内变异。
①总变异:SS 总,用所有观察值与均数的离均差平方和表示。
SS 总=∑∑-ij2ijx x )(,υ总=N-1(N 为总例数)②组间变异:SS 组间,用各组均数与总均数的离均差平方和表示。
SS 组间=∑-i2ii x xn )(,υ组间=k-1(k 为处理组数)③组内变异:SS 组内,用各组内每个测量值xij 与该组均数得离均差平方和表示,仅反映随机误差,又称误差变异。
SS 组内=∑∑-ij2i ij x x )(,υ组内=N-k⑵三种变异及相关自由度的关系为:SS 总=SS 组间+SS 组内,υ总=υ组间+υ组内均方MS 组间=SS 组间/υ组间;MS 组内= SS 组内/υ组内⑶方差分析的统计量F :F=MS 组间/MS 组内⑷F 界值表:纵标目为组间自由度υ1,横标目为组内自由度υ2,表中给出了α=0.05和α=0.01时供方差分析用的单侧F 界值,用F α,(υ1,υ2)表示。
若F ≥F α,(υ1,υ2),则P ≤α,按α水准拒绝H 0,接受H 1,差别有统计学意义,可以认为总体均数不等或不全等(处理因素有效应);反之,则差别无统计学意义,尚不能认为总体均数不等或不全等(尚不能认为处理因素有效应)。
完全随机设计方差分析计算公式变异来源 SS υ MS F 组间变异(处理)∑-i2i i x x n )( k-11k SS -组间组内组间MS MS组内变异(误差)∑∑-ij2i ijx x )( N-kk-N SS 组内总变异∑2x -()Nx 2∑N-1【小结】①完全随即设计资料的总变异可分解为组间变异和组内变异两部分。
②方差分析常用于三个及以上均数的比较,当用于两个均数的比较时,同一资料所得结果与t 检验等价,即F=t 2③方差分析的结果若拒绝H0,而接受H1,只说明多个总体均数中至少有两个均数不同,不能说明任意两个总体均数都有差⑴随机区组设计的变异分解:SS 总=SS 处理+SS 区组+SS 误差,υ总=υ处理+υ区组+υ误差用k 表示处理组数,b 表示区组数,实验观察值x ij 下标i (i=1,2,…,k )表示组别,下标j (j=1,2,…,b )表示区组序号。
完全随机设计方差分析计算公式变异来源 SS υ MS F处理组()∑-i2i i xx nk-11k SS -处理误差处理MS MS区组()∑-j2j j xx nb-11b SS -区组误差区组MS MS误差 SS 总-SS 处理-SS 区组 N-k-b-1或(k-1)(b-1)1b k N SS +--误差总变异∑2x -()Nx 2∑N-11N SS -总⑵随机区组设计资料的ANOV A 的基本步骤: ①建立假设检验,确定检验水准:⑴对于处理组:H 0:μ1=μ2=μk ,即…相同;H 1:μ1、μ2、μk 不等或不全等,即…不同或不全同。
⑵对于区组:H 0:k 个区组的总体均数相等;H 1:k 个区组的总体均数不等或不全等。
②计算检验统计量:F= MS 处理/MS 误差;F= MS 区组/MS 误差 ③确定P 值,做出统计推断。
⑴对处理组:以υ1=k-1,υ2=N-k-b-1或(k-1)(b-1),查F 界值表,确定P 值,做出统计推断。
⑵对区组:以υ1=b-1,υ2= N-k-b-1或(k-1)(b-1),查F 界值表,确定P 值,做出统计推断。
【注意】①随机区组设计资料的总变异可以分解为处理组间变异、区组间变异和误差变异三个部分。
②随机区组设计与完全随机设计相比,由于利用区组控制了可能的混杂因素,并在进行方差分析时,将区组间变异从原组内变异中分离出来,当区组间变异有统计学意义时,由于减少了误差均方使处理间的F 值更容易出现显著性,从而提高了实验效率。
2多组均数假的两两比较不能用t 检验,会增大Ⅰ型错误。
两两比较的方法较多,常用的是多重比较,多重比较法有两种情况:①探索性研究,即事先没有计划的任意两个均数的事后比较:SNK-q 检验、Bonfferoni t 检验。
②证实性研究,即事先有明确假设,用于多组中某一对或某几对在专业上有特殊意义的均数间的比较:Dunnett-t 检验、LSD-t 检验、Bonfferoni t 检验等。
不能多种方法一起使用,然后选取“有利”的结果。
⒌交叉设计的ANOV A ⑴两阶段交叉设计的变异分解:二阶段交叉设计方差分析的总变异可以分解为处理间变异、阶段间变异、个体变异和误差变异四个部分。
SS 总=SS 处理+SS 阶段+SS 个体+SS 误差,υ总=υ处理+υ阶段+υ个体+υ误差⑵两阶段交叉设计的方差分析基本步骤: ①建立建设检验,确定检验水准。
②计算检验统计量F 值:MS 阶段/MS 误差、MS 个体/MS 误差、MS 处理/MS 误差; ③确定P 值,做出统计推断。
【说明】①交叉设计可以采用完全随机设计或配对设计方法来安排其受试对象。
②交叉实验的处理是单因素的,但影响实验结果的因素还有非人为控制的受试者之间的个体差异和试验阶段这两个因素。
因此交叉设计试验实际上是一个试验因素和两个重要的非实验因素的多因素实验。
⒍析因设计的ANOV A析因设计资料的方差分析包括主效应分析、交互效应分析和单独效应分析三个层次。
①单独效应:是指其他因素的水平固定时,同一因素不同水平间的差别。
②主效应:是指某一因素各水平间的平均差别。
③交互效应:是指当某一因素的各单独效应随某一因素水平的变化而变化时则称这两个因素间存在交互效应。
两因素析因设计即I ×J 析因设计,表示有两种处理因素,第一种处理因素有I 个水平,第二种因素有J 个水平,共有I ×J 种处理组合。
⑴析因设计的变异分解:SS 总=SS 处理+ SS 误差=(SSA+SSB+SSAB )+SSE ,υ总=υ处理+υ误差=(μA+μB+μAB )+μE若处理因素A 有a 个水平,处理因素B 有b 个水平,每个处理因素组含有n 个受试对象,则全部收拾对象的总数N=a ×b ×n 。
用x ijk 表示每个受试对象的观察值,其中i (i=1,2,…,a )表示A 因素的水平。
j (j=1,2,…,b )表示B 因素有b 个水平;k (k=1,2,…,n )表示A 、B 两因素不同水平组合下受试对象的序号。
析因设计方差分析计算表变异来源 SS υ MS F处理 ()∑∑-ij2ij ij xx nab-1A()∑-i2ii xxna-11a SS A- 误差MS MS AB()∑-j2j j xx nb-11-b SS B误差MS MS BAB SS 处理-SS A -SS B (a-1)(b-1)()()1b 1-a SS AB-误差MS MS AB误差 SS 误差=SS 总-SS 处理 N-ab 或ab (n-1)()1n ab SS -误差总变异()Nx x22∑∑-N-1或(abn-1)1N SS -总⑵两因素析因设计资料方差分析的基本步骤:①对于因素A 、B 、交互作用AB 分别建立假设检验,确定检验水准。
检验假设:⑴对于因素A :H 0:A 因素各水平总体均数相等;H 1:A 因素各水平总体均数不相等; ⑵对于因素B :H 0:B 因素各水平总体均数相等;H 1:B 因素各水平总体均数不相等; ⑶ 对于交互作用AB :H 0:A 、B 无交互作用;H 1:A 、B 有交互作用; ②计算检验统计量:列表计算各组均数及方差分析表。
③确定P 值,做出统计推断。
【说明】①析因设计是将两个或多个实验因素的各水平进行交叉分组、全面实验的方法。
因此析因设计的方差分析被广泛用于需要分析交互效应和选择最佳组合的实验研究中。
②析因设计不但可以分析主效应和交互效应,也可以分析单独效应,故效率较高,但当因素太多时,所需的样本含量会很大。
③对析因设计资料,应先分析交互效应,若交互效应有统计学意义,方进一步分析个因素的单独效应。
反之,若交互效应无统计学意义,则因素之间的作用相互独立,分析某一因素的作用只需考虑因素的主效应。
⒎重复测量设计的ANOV A重复测量设计是指给予一种或多种处理后,在多个时间点上从同一受试对象重复获得指标的观察值。
重复测量数据的两因素多水平设计,两因素是指处理因素和处理时间;多水平是指处理有k (≥1)个水平;测量时间有i (i ≥2)个水平(时间点),即每个观察对象有i 个重复测量数据。
⑴重复测量设计的变异分解:两因素重复测量设计的总变异包括两部分:受试对象间变异、受试对象内变异。
SS 总=SS 受试对象间+SS 受试对象内=(SS 处理+SS 个体间误差)+SS 时间+SS 处理与时间交互作用+SS 个体内误差 υ总=υ受试对象间+υ受试对象内=(υ处理+υ个体间误差)+υ时间+υ处理与时间交互作用+υ个体内误差⑵重复测量设计方差分析的基本步骤:①对于处理因素、时间因素、交互作用分别建立检验假设,确定检验水准; ②计算检验统计量:SPSS 软件 ③确定P 值,做出统计推断;⑶重复测量设计方差分析的前提条件: ①正态性和方差齐性;②协方差阵地球形性或复合对称性。
球对称性:Mauchly 检验。
【注意】①若资料不满足球对称性,则方差分析的F 值有偏,通常会增大Ⅰ型错误的概率。
②资料满足球对称性时,可采用重复测量设计资料的单变量方差分析方法;若资料不满足球对称性,可用Greenhouse-Geisser 、Huynh-Feldt 或Lower-bound 三种“球对称”系数对自由度进行校正或采用多变量方差分析的方法。
【小结】①完全随机设计资料的方差分析,若处理无作用,则F 值理论上应等于1。
②重复测量设计资料和随机区组设计资料的区别主要有两点:⑴重复测量设计资料中同一受试对象(看成区组)的数据高度相关。
⑵重复测量设计资料中的处理因素在受试对象间为随机分配,但受试对象内的个时间点却不能随机分配;随机区组设计资料中每个区组内的受试对象彼此独立,处理只在区组内随机分配,同一区组内的受试对象的处理各不相同。