第九章+方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2011-2-7
12
四、应用条件
1)各样本是相互独立的随机样本 )各样本是相互独立的随机样本 2)各样本来自正态总体 )各样本来自正态总体 3)各处理组总体方差相等,即方差齐 )各处理组总体方差相等,
2011-2-7
13
第二节
完全随机设计资料的 方差分析
2011-2-7 14
一、完全随机设计 completely random design
2011-2-7
6
目的: 目的:推断各处理组即多个总体均数是
否有差别。 否有差别。 也可用于两个
方法:方差分析,即多个样本均数比较 方法:方差分析,
检验。( 。(能否用多个两两比较 的 F 检验。(能否用多个两两比较 检验代替? 的 t 检验代替?)
2011-2-7
7
不能……原因有二: 原因有二: 不能 原因有二
不全相等, 值将明显大于1 如果 µ1 , µ 2 ,L , µ k 不全相等,F 值将明显大于1。 界值( 用F界值(单侧界值)确定 值。 界值 单侧界值)确定P
2011-2-7 27
三、变异分解
C=
(∑X)2 N
完全随机设计资料的方差分析表
变异来源 总变异 自由度 N-1 k-1 SS MS F
随 机
糖尿病患者
І组 П组 Ш组
分 组
组间误差=随机误差 组间误差 随机误差
MS组间 = MS组内
2011-2-7
组间误差=随机误差 组间误差 随机误差 +干预因素 干预因素
MS组间 ≥ MS组内?
26
组间误差与组内误差示意图
检验统计量: 检验统计量:
M 组间 S F= , ν1 =ν组间, ν2 =ν组内 M 组内 S 如果 µ1 = µ2 = L = µ k ,则 M 组间, M 组内 都为 S S 随机误差 2 的估计,F 值应接近于1。 σ 的估计, 值应接近于1
第九章 方差分析
analysis of variance, ANOVA
2011-2-7 1
方差分析由 R.A.Fisher(英)首创, 英 首创 首创, 又称F检验 又称 检验 缩写: 缩写:ANOVA
2011-2-7
2
讲授内容 方差分析的基本思想及应用条件 完全随机设计资料的方差分析 随机区组设计资料的方差分析 析因设计的方差分析 重复测量资料的方差分析 多个样本均数间的多重比较
α = 0.05
2011-2-7 29
2 . 计算检验统计量 :
可根据下表的公式和前面表9-1下半部分数据来计算 可根据下表的公式和前面表 下半部分数据来计算 也可用统计软件包如SAS或SPSS等进行计算,直接 或 等进行计算, 也可用统计软件包如 等进行计算 获得表9-4的方差分析表。 获得表 的方差分析表。 的方差分析表
i= j= 1 1 i k ni
v组内 = v2 = N −k
2011-2-7 22
SS组内 = (21−1 ×17.6305+(19−1 ×18.1867+(20−1 ×12.3843 ) ) ) = 909.8723
v组内 = v2 = 60−3
M =909.8723/57 =15.9627 S
2011-2-7 18
1.总变异 1.总变异: 所有测量值之间总的变异程度
SS总 = SST = ∑∑(Xij − X)
i= j = 1 1 k ni 2
ν总 = N −1
SS总=18.4176×(60-1)=1086.6384 × )
ν=60-1=59
2011-2-7 19
2.组间变异:各组均数与总均数的离均差平方和,反 组间变异:各组均数与总均数的离均差平方和,
2011-2-7 16
表 9-1 高剂量组 (i=1) 5.6 9.5 6.0 8.7 9.2
Xij
三组患者 4 周后血糖的下降值(mmol / L) 低剂量组 (i=2) 对照组 (i=3) 2.0 5.6 7.0 7.9 4.3 6.4 7.0 5.4 3.1 12.4 0.9 7.0 3.9 1.6 6.4 3.0 3.9 2.2 1.1 2.7 7.8 6.9 1.5 9.4 3.8 7.5 8.4 12.2 6.0 合计
∑X2 −C
组 间
∑ni (Xi − X)
i
2
SS组间
ν组间 ν组内
M 组间 S M 组内 S
组 内
N-k
SS总 −SS组间
SS组内
2011-2-7
28
四、分析步骤
1. 建立检验假设,确定检验水准 建立检验假设,确定检验水准:
H0:µ1 = µ 2 = µ 3 即3组总体均数相等 组总体均数相等 H1:3组总体均数不等或不全相等 组总体均数不等或不全相等
2011-2-7
32
注意: 注意:
方差分析的结果拒绝H 接受H 方差分析的结果拒绝 0,接受 1,不能 说明各组总体均数间两两都有差别。 说明各组总体均数间两两都有差别 。 如果 要分析哪些两组间有差别, 可进行多个均 要分析哪些两组间有差别 , 数间的多重比较(见本章第五节) 数间的多重比较(见本章第五节)。当k=2 时 , 完全随机设计方差分析与成组设计资 料的t 检验等价, 料的 检验等价,有 t = F 。
表 9-4 例 9-1 的方差分析表 df SS MS F 变异来源 59 1086.63 总变异 2 176.76 88.38 5.537 组 间 909.87 15.96 组 内(误差) 57
P <0.01
2011-2-7
30
ANOVA X Sum of Squares Between Groups 180.513 Within Groups 908.569 Total 1089.082 df Mean Square 2 90.257 57 15.940 59 F 5.662 Sig. .006
2011-2-7
返回
9
二、方差分析的几个名词和符号
什么是方差? 什么是方差? 方差 离均差 离均差平方和SS 离均差平方和 方差( 均方( ) 方差(σ2 S2 )均方(MS) 标准差: 标准差:S 自由度: 自由度: ν 关系: 关系: MS= SS/ ν
2011-2-7 10
各种符号的意义
Xij第i 个组的第 个观察值 个组的第j i=1,2,…k j=1,2,…ni ni第i 个处理组的例数 ∑ni=N Xi =第i组的均数 第 组的均数 X=总的均数 总的均数
16.3 11.8 14.6 4.9 8.1 3.8 6.1 13.2 16.5 9.2
-0.6 5.7 12.8 4.1 -1.8 -0.1 6.3 12.7 9.8 12.6
5.0 3.5 5.8 8.8 15.5 11.8
Байду номын сангаас
ni
Xi
21 9.1952 17.3605
19 5.8000 18.1867
第一节
基本思想及应用条件
2011-2-7 4
一、为什么要学方差分析? 为什么要学方差分析?
概述:在进行科研时, 概述:在进行科研时,有时要按实验设计将 所研究的对象分为多个处理组施加不同的干 处理因素, 施加的干预称为处理因素 处理因素至 预,施加的干预称为处理因素,处理因素至 少有两个水平。 少有两个水平。
2011-2-7
31
3. 确定 值,作出推断结论: 确定P值 作出推断结论:
本例: 本例:ν1=3−1=2,ν2=60−3=57。因附表 中ν2无57, , 。因附表3中 , 故取最接近者ν 水准, 故取最接近者 2=60, 得P<0.01。按α=0.05水准,拒绝 。 水准 H0,接受 1,有统计学意义。 接受H 有统计学意义。 可以认为2型糖尿病患者经药物 新药和标准药物 可以认为 型糖尿病患者经药物(新药和标准药物 治 型糖尿病患者经药物 新药和标准药物)治 小时血糖的总体平均水平不全相同, 疗4周,其餐后 小时血糖的总体平均水平不全相同, 周 其餐后2小时血糖的总体平均水平不全相同 即三个总体均数中至少有两个不同。 即三个总体均数中至少有两个不同。
v 间 = 3−1 组
M 组间 =176.7612/ 2 =88.3806 S
2011-2-7 21
3.组内变异:各组内各测量值Xij与其所 组内变异:
在组的均数的差值的平方和,反映随机误差 在组的均数的差值的平方和,反映随机误差 的影响. 的影响.
SS组内 = SSW = SSE = ∑∑ Xij − Xi )2 = ∑ ni −1 Si2 ( ( )
20 5.4300 2.3843
60(N) 6.859( X 18.4176(S²)
17
)
Si
总变异
组间
组内
二、列举存在的变异及意义
1、全部的 个实验数据之间大小不等, 、全部的60个实验数据之间大小不等 个实验数据之间大小不等, 存在变异(总变异)。 存在变异(总变异)。 2、各个组间存在变异:反映处理因素之 、各个组间存在变异: 间的作用,以及随机误差。 间的作用,以及随机误差。 3、各个组内个体间数据不同:反映了观 、各个组内个体间数据不同: 察值的随机误差。 察值的随机误差。 思考:各种变异的表示方法? 思考:各种变异的表示方法?
2011-2-7
11
三、方差分析的基本思想
根据变异的来源,将全部观察值总的离均差平 根据变异的来源,将全部观察值总的离均差平 方和及自由度分解为两个或多个部分 分解为两个或多个部分, 方和及自由度分解为两个或多个部分,除随机 误差外, 误差外,其余每个部分的变异可由某些特定因 素的作用加以解释。 素的作用加以解释。 通过比较不同来源变异的方差( 通过比较不同来源变异的方差(也叫均方 MS),借助 分布做出统计推断,从而判断某 ),借助 分布做出统计推断, ),借助F分布做出统计推断 因素对观察指标有无影响。 因素对观察指标有无影响。
甲处理( 甲处理(n1) 乙处理 (n2) 处理( 处理(n3) 各 组 例 数 可 以 相 等 或 不 等
试验对象 (N) )
随机化分组
M
验 (one-way ANOVA)
2011-2-7 15
例9-1 Page 150
某医生为研究一种四类降糖新药的疗效, 某医生为研究一种四类降糖新药的疗效, 以统一的纳入标准和排除标准选择了60名 以统一的纳入标准和排除标准选择了 名2 型糖尿病患者,按完全随机设计方案将患 型糖尿病患者, 者分为三组进行双盲临床试验。问治疗 周 者分为三组进行双盲临床试验。问治疗4周 餐后2小时血糖下降值的三组总体平均 后,餐后 小时血糖下降值的三组总体平均 水平是否不同? 水平是否不同?
映处理因素的作用和随机误差的影响
如果有 个总体均数有 如果有——k个总体均数有差别 个总体均数 如果无 个总体均数无 如果无——k个总体均数无差别 个总体均数
SS组间 = SSB = ∑ni (Xi − X)
i= 1
k
2
ν组间 = k −1
2011-2-7 20
SS组间 = 21(9.1952−6.8650)2 +19(5.8000−6.8650)2 +20(5.4300−6.850)2 =176.7612
2011-2-7
5
处理因素和 处理因素和水平
研究者对研究对象人为地施加某种干预措施, 研究者对研究对象人为地施加某种干预措施, 称为处理因素(factor)或实验因素; 或实验因素; 称为处理因素 或实验因素 处理因素所处的不同状态称为水平(level)。 。 处理因素所处的不同状态称为水平 处理因素的水平数≥2,即实验的组数。 处理因素的水平数 ,即实验的组数。
检验, 多次重复使用 t 检验,会使犯第一类 错误的概率增大。 错误的概率增大。下一页 脱离了原先的实验设计, 脱离了原先的实验设计,将多个样本 均数地同时比较转变为两个均数的多 次比较。 次比较。
2011-2-7 8
例如,有4个样本均数,两两组合数 4 检验做6次比较 次比较, 为 ( ) = 6 ,若用 t 检验做 次比较,且每次比 2 较的检验水准定为α=0.05, 则每次比较不犯 较的检验水准定为 , 次均不犯Ⅰ ) 次均不犯 Ⅰ类错误的概率为(1-0.05),6次均不犯Ⅰ 类错误的概率为( 类错误的概率为 (1-0.05)6,这时,总的检验 这时, 远比0.05大。因 水准变为 1-(1-0.05)6 = 0.26 ,远比 大 此 , 样本均数间的多重比较不能用两样本均 检验。 数比较的 t 检验。
2011-2-7 23
三种变异的关系:
SS总 = SS组间 + SS组内
ν总 =ν组间 +ν组内
2011-2-7 24
均方差,均方( 均方差,均方(mean square,MS)。 , )
M 组间 = S M 组内 = S
2011-2-7
SS组间
ν组间
SS组内
ν组内
25
干预前
干预后 干预后 高剂量 i=1 低剂量 i=2 对 照 i=3