★卫生统计学专题九:方差分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专题九 方差分析
方差分析(ANOV A ),又称F 检验,是一种以分析数据的变异为基础,以F 值为统计量的计量资料的假设检验方法。用
较不同变异来源的均方,借助F 分布做出统计推断。 ⑴方差分析的应用条件:
①各观察值相互独立,且每一水平下的观察值均服从正态分布。②各总体方差相等,即具有方差齐性。 ⑵对于不满足方差分析应用条件的资料,可采用以下两种方式进行处理:
①变量变换,是指满足方差分析的基本假定。②应用非参数统计分析方法。
⒉完全随机设计的ANOV A
各组样本均数各不相等,这种差异可能由两种原因引起:①随机误差;②处理因素。 ⑴完全随机设计的变异分解:
完全随机设计(成组设计)资料的总变异可以分解为组间变异和组内变异。 ①总变异:SS 总,用所有观察值与均数的离均差平方和表示。
SS 总=
∑∑
-i
j
2
ij
x x )
(,υ总=N-1(N 为总例数)
②组间变异:SS 组间,用各组均数与总均数的离均差平方和表示。
SS 组间=
∑-i
2
i
i x x
n )
(,υ组间=k-1(k 为处理组数)
③组内变异:SS 组内,用各组内每个测量值xij 与该组均数得离均差平方和表示,仅反映随机误差,又称误差变异。
SS 组内=
∑∑-i
j
2
i ij x x )(,υ组内=N-k
⑵三种变异及相关自由度的关系为:
SS 总=SS 组间+SS 组内,υ总=υ组间+υ组内
均方MS 组间=SS 组间/υ组间;MS 组内= SS 组内/υ组内
⑶方差分析的统计量F :
F=MS 组间/MS 组内
⑷F 界值表:
纵标目为组间自由度υ1,横标目为组内自由度υ2,表中给出了α=0.05和α=0.01时供方差分析用的单侧F 界值,用F α,(υ1,υ2)表示。 若F ≥F α,(υ1,υ2),则P ≤α,按α水准拒绝H 0,接受H 1,差别有统计学意义,可以认为总体均数不等或不全等(处理因素有效应);反之,则差别无统计学意义,尚不能认为总体均数不等或不全等(尚不能认为处理因素有效应)。
完全随机设计方差分析计算公式
变异来源 SS υ MS F 组间变异(处理)
∑-i
2
i i x x n )( k-1
1
k SS -组间
组内
组间MS MS
组内变异(误差)
∑∑
-i
j
2
i ij
x x )
( N-k
k
-N SS 组内
总变异
∑2
x -()N
x 2
∑
N-1
【小结】
①完全随即设计资料的总变异可分解为组间变异和组内变异两部分。
②方差分析常用于三个及以上均数的比较,当用于两个均数的比较时,同一资料所得结果与t 检验等价,即F=t 2
③方差分析的结果若拒绝H0,而接受H1,只说明多个总体均数中至少有两个均数不同,不能说明任意两个总体均数都有差
⑴随机区组设计的变异分解:
SS 总=SS 处理+SS 区组+SS 误差,υ总=υ处理+υ区组+υ误差
用k 表示处理组数,b 表示区组数,实验观察值x ij 下标i (i=1,2,…,k )表示组别,下标j (j=1,2,…,b )表示区组序号。
完全随机设计方差分析计算公式
变异来源 SS υ MS F
处理组
()∑-i
2
i i x
x n
k-1
1
k SS -处理
误差
处理MS MS
区组
()∑-j
2
j j x
x n
b-1
1
b SS -区组
误差
区组MS MS
误差 SS 总-SS 处理-SS 区组 N-k-b-1或(k-1)(b-1)
1
b k N SS +--误差
总变异
∑2
x -()N
x 2
∑
N-1
1
N SS -总
⑵随机区组设计资料的ANOV A 的基本步骤: ①建立假设检验,确定检验水准:
⑴对于处理组:H 0:μ1=μ2=μk ,即…相同;H 1:μ1、μ2、μk 不等或不全等,即…不同或不全同。 ⑵对于区组:H 0:k 个区组的总体均数相等;H 1:k 个区组的总体均数不等或不全等。 ②计算检验统计量:F= MS 处理/MS 误差;F= MS 区组/MS 误差 ③确定P 值,做出统计推断。
⑴对处理组:以υ1=k-1,υ2=N-k-b-1或(k-1)(b-1),查F 界值表,确定P 值,做出统计推断。 ⑵对区组:以υ1=b-1,υ2= N-k-b-1或(k-1)(b-1),查F 界值表,确定P 值,做出统计推断。 【注意】
①随机区组设计资料的总变异可以分解为处理组间变异、区组间变异和误差变异三个部分。
②随机区组设计与完全随机设计相比,由于利用区组控制了可能的混杂因素,并在进行方差分析时,将区组间变异从原组内变异中分离出来,当区组间变异有统计学意义时,由于减少了误差均方使处理间的F 值更容易出现显著性,从而提高了实验效率。
2
多组均数假的两两比较不能用t 检验,会增大Ⅰ型错误。
两两比较的方法较多,常用的是多重比较,多重比较法有两种情况:
①探索性研究,即事先没有计划的任意两个均数的事后比较:SNK-q 检验、Bonfferoni t 检验。
②证实性研究,即事先有明确假设,用于多组中某一对或某几对在专业上有特殊意义的均数间的比较:Dunnett-t 检验、LSD-t 检验、Bonfferoni t 检验等。
不能多种方法一起使用,然后选取“有利”的结果。
⒌交叉设计的ANOV A ⑴两阶段交叉设计的变异分解:
二阶段交叉设计方差分析的总变异可以分解为处理间变异、阶段间变异、个体变异和误差变异四个部分。
SS 总=SS 处理+SS 阶段+SS 个体+SS 误差,υ总=υ处理+υ阶段+υ个体+υ误差
⑵两阶段交叉设计的方差分析基本步骤: ①建立建设检验,确定检验水准。
②计算检验统计量F 值:MS 阶段/MS 误差、MS 个体/MS 误差、MS 处理/MS 误差; ③确定P 值,做出统计推断。 【说明】
①交叉设计可以采用完全随机设计或配对设计方法来安排其受试对象。
②交叉实验的处理是单因素的,但影响实验结果的因素还有非人为控制的受试者之间的个体差异和试验阶段这两个因素。因此交叉设计试验实际上是一个试验因素和两个重要的非实验因素的多因素实验。
⒍析因设计的ANOV A
析因设计资料的方差分析包括主效应分析、交互效应分析和单独效应分析三个层次。 ①单独效应:是指其他因素的水平固定时,同一因素不同水平间的差别。 ②主效应:是指某一因素各水平间的平均差别。
③交互效应:是指当某一因素的各单独效应随某一因素水平的变化而变化时则称这两个因素间存在交互效应。
两因素析因设计即I ×J 析因设计,表示有两种处理因素,第一种处理因素有I 个水平,第二种因素有J 个水平,共有I ×J 种处理组合。