多个样本均数比较的方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
µ 如果 1 , µ2 ,L , µ g
不全相等, 值将明显大于1 不全相等,F值将明显大于1。 界值(单侧界值)确定P 用F界值(单侧界值)确定P值。
第二节
完全随机设计资料的方差分析
一、完全随机设计
(completely random design)是采用完全随 机化的分组方法,将全部试验对象分配到g个处理 组(水平组),各组分别接受不同的处理,试验结 束后比较各组均数之间的差别有无统计学意义,推 论处理因素的效应。
SS组内 = 82.10 − 32.16 = 49.94 , ν组内 =120 − 4 =116 32.16 49.94 MS组间 = =10.72 ,MS组内 = = 0.43 , 3 116 10.72 F= = 24.93 0.43
列方差分析表 表4-5 完全随机设计方差分析表
变 来 异 源 总 异 变 组 间 组 内 自 度 由 119 3 116 SS 82.10 32.16 49.94 M S 10.72 0.43 F 24.93 P <0.01
不同,各组的样本均数 (i=1,2,…,g)也大小 不等,这种变异称为组间变异。 其大小可用各组均数与总均数的离均差平方和表 示,记为SS组间 。
计算公式为
SS组间 = ∑ni (Xi − X) = ∑
2 i=1 i=1
g
g
(∑Xij )
j=1
ni
2
ni
−C
ν 组间 = g − 1
3.组内变异: 在同一处理组中,虽然每个受 组内变异:
测量值
4.59 4.34 2.66 3.59 3.13 4.04 3.53 3.56 3.85 4.07 3.93 2.33 2.98 4.00 3.55 2.64 2.56 3.50 3.25 3.52 3.93 4.19 2.96 2.96 4.3 4.16 2.59 30 3.43 102.91 367.85 统计量
例 4-1 某医生为了研究一种降血脂新
药的临床疗效, 药的临床疗效 , 按统一纳入标准选择 120名患者 , 采用完全随机设计方法将 名患者, 名患者 患者等分为4组进行双盲试验 。 患者等分为 组进行双盲试验。 问如何 组进行双盲试验 进行分组? 进行分组?
(1)完全随机分组方法:
1. 编号 : 120名高血脂患者从 开始到 编号: 名高血脂患者从1开始到 名高血脂患者从 开始到120, , 见表4-2第 行 见表 第1行(P72); ) 2. 取随机数字:从附表 中的任一行任一列 取随机数字:从附表15中的任一行任一列 开始, 行第7列 开始, 依次读取三位 开始 , 如 第 5行第 列 开始 , 依次读取 三位 行第 作为一个随机数录于编号下,见表4-2第 数作为一个随机数录于编号下,见表 第2 行;
分组结果 甲 丁 乙 甲 甲 丁 甲 丁 丁 丁 … 甲 丙
(2)统计分析方法选择:
1. 对于正态分布且方差齐同的资料,常采用完全随 对于正态分布且方差齐同的资料, 机设计的单因素方差分析 机设计的单因素方差分析(one-way ANOVA)或成 单因素方差分析 或成 检验( 组资料的 t 检验(g=2); ) 2. 对于非正态分布或方差不齐的资料,可进行数据 对于非正态分布或方差不齐的资料, 可进行数据 变换或采用 秩和检验。 变换或采用Wilcoxon秩和检验。 或采用 秩和检验
Xgj
…
Xgng
ng Xg
Sg
合计
X ij
N
X S
X ij :第i个处理组第 个观察结果 第 个处理组第 个处理组第j个观察结果
记总均数为 X = ∑ ∑ X ij / N,各处理组均
i =1 j =1
g
ni
数为 X i = ∑ X ij / ni ,总例数为N=
j =1
ni
nl+n2+…+ng,g为处理组数。 g
二、变异分解
表 4-4 完全随机设计资料的方差分析表
变异来源 总变异 自由度 N-1
g ni
SS
MS
2
F
∑∑ Xij −C
i =1 j =1
ni
组 间
g-1
∑
i =1
g
(∑ Xij )
j =1
2
SS组间
−C
ni
ν组间
SS组内
MS组间 MS组内
组 内
N-g
SS总 − SS组间
ν组内
例4-2 某医生为了研究一种降血脂新药的临
1.总变异 1.总变异:全部测量值大小不同,这种变异
称为总变异。 总变异的大小可以用离均差平方和(sum of squares of deviations from mean,SS)表示, 即各测量值Xij与总均数差值的平方和,记为 SS总。 总变异SS总反映了所有测量值之间总的变异程 度。
计算公式为
表 4-2 完全随机设计分组结果 编 号 随机数 序 号 1 2 3 4 5 6 7 8 9 10 … 119 120
260 873 373 204 056 930 160 905 886 958 … 220 634 24 106 39 15 3 114 13 109 108 117 … 16 75
完全随机设计资料的方差分析的基本思想
表4-1 g 个 理 的 验 果 处 组 试 结
处 分 理 组 平 1水 平 2水 X11 X21 X12 X22 测 值 量 … … X1j X2j … …
X1n1 X2n2
统 量 计 n1 X1 n2 X2 S1
…
…
…
…
…
…
…
…
…
S2
…
g水 平
Xg1
Xg2
…
试对象接受的处理相同,但测量值仍各不相同, 这种变异称为组内变异(误差)。组内变异可用 组内各测量值Xij 与其所在组的均数的差值的平方 和表示,记为SS组内, 表示随机误差的影响。
SS组内 = ∑∑( Xij − Xi )
iຫໍສະໝຸດ Baidu1 j=1
g ni
2
ν 组内 = N − g
三种变异的关系:
SS总 = SS组间 + SS组内
233.00
225.54
132.13
三、分析步骤
1. 建立检验假设,确定检验水准 建立检验假设,确定检验水准:
H H
0
: :
µ
1
=
µ
2
=
µ
3
=
µ
4
,
即
4
个
试
验
组
的
总
体
均
数
相
等
1
4
个
试
验
组
的
总
体
均
数
不
全
相
等
方
H0: 1 = µ2 = µ3 = µ4 即4个试验组总体均数相等 个试验组总体均数 个试验组总体均数相等 µ
表4 - 3
分 组 3.53 安慰剂组 3.30 1.37 降血脂新药 2.42 2.4g 组 1.98 2.36 2.86 4.8g 组 2.66 3.48 0.89 7.2g 组 1.98 1.31
4个处理组低密度脂蛋白测量值(mmol/L) 4个处理组低密度脂蛋白测量值(mmol/L) 个处理组低密度脂蛋白测量值
编序号: 3. 编序号 : 将全部随机数字从小到大 ( 数据相同则按 先后顺序)编序号,见表4 先后顺序)编序号,见表4-2第3行。 事先规定:序号1 30为甲组 序号31 60为乙组 为甲组, 31- 为乙组, 4. 事先规定:序号1-30为甲组,序号31-60为乙组,序 号61-90为丙组,序号91-120为丁组,见表4-2第四行。 61-90为丙组,序号91-120为丁组,见表4 第四行。 为丙组 91 为丁组
α
= 0 . 0 5
中 按 S 表 4 - 4 的 公 式 计 算 各 离 均 差 平 方 和 S S 、 自 由 度
ν
、
均
M
和
F
值
。
H1:4个试验组总体均数不全相等 个试验组总体均数 个试验组总体均数不全相等
α = 0.05
2 . 计算检验统计量 :
∑∑ Xij =102.91+ 81.46 + 80.94 + 58.99 = 324.30 2 Xij = 367.85 + 233.00 + 225.54 +132.13 = 958.52 ∑∑
C = (324.30)2 /120 = 876.42 SS总 = 958.52 −876.42=82.10 , 总 =120- 19 ν 1=1
(102.91)2 (81.46)2 (80.94)2 (58.99)2 SS组间 = + + + −876.42 = 32.16 30 30 30 30 ν组间 = 4 −1= 3
SS总 = ∑∑( Xij − X ) = ∑∑ Xij − C
g ni 2 g ni 2 i =1 j =1 i =1 j =1
ν总 = N −1
其中: 其中:
C= (∑∑ Xij )
i=1 j=1 g ni 2
N
=
(∑ Xij )
i, j
2
N
2.组间变异: 各处理组由于接受处理的水平 .组间变异:
名高血脂患者, 床疗效, 按统一纳入标准选择120名高血脂患者 , 床疗效 , 按统一纳入标准选择 名高血脂患者 采用完全随机设计方法将患者等分为 组 采用完全随机设计方法将患者等分为4组(具体分 等分 组方法见例4-1), 进行双盲试验 。 6周后测得低 ) 进行双盲试验。 周后测得 周后测得低 组方法见例 密度脂蛋白作为试验结果, 见表4-3。问 4个处理 密度脂蛋白 作为试验结果,见表 作为试验结果 。 个处理 组患者的低密度脂蛋白含量总体均数有无差别? 组患者的低密度脂蛋白含量总体均数有无差别
应用条件: 应用条件: 总体——正态且方差相等 总体 正态且方差相等 样本——独立、随机 独立、 样本 独立 设计类型: 设计类型: 完全随机设计资料的方差分析 随机区组设计资料的方差分析 拉丁方设计资料的方差分析 两阶段交叉设计资料的方差分析
N 1 ( µ 1 , σ 2 ), N 2 ( µ 2 , σ 2 ), L , N g ( µ g , σ 2 )
第一节 方差分析的基本思想 及其应用条件
目的:推断多个总体均数是否有差别。 目的:推断多个总体均数是否有差别。
也可用于两个
方法:方差分析, 方法:方差分析,即多个样本均数比较 检验。 的F检验。 检验 基本思想: 基本思想:根据资料设计的类型及研究目的, 可将总变异分解为两个或多个部分,每个部 分的变异可由某因素的作用来解释。通过比 较可能由某因素所至的变异与随机误差,即 可了解该因素对测定结果有无影响。
ν总 =ν组间 +ν组内
均方差,均方( 均方差,均方(mean square,MS)。 , )
MS组间 = MS组内 =
SS组间
ν组间
SS组内
ν组内
检验统计量:
MS组间 F= , ν1 =ν组间, ν2 =ν组内 MS组内 µ 如果 1 = µ2 = L = µ g ,则 组间, MS组内 都为随 MS 的估计, 值应接近于1 机误差 σ 2 的估计,F值应接近于1。
1.56 3.11 1.81 1.77 30 2.65 2.22 2.90 2.97 2.80 3.57 4.02 2.31 3.21 2.23 2.32 2.68 2.66 3.68 2.65 3.02 3.04 2.81 1.97 1.68 1.19 2.17 2.28 1.72 0.94 2.11 2.81 2.52 2.47 1.02 2.10 3.71 30 1.97 58.99 30 2.70 80.94 2.72 81.46
多个样本均数比较的方差分析
Analysis of Variance, ANOVA
Content
• 1. Basal ideal and application conditions • 2. ANOVA of completely random designed data • 3. ANOVA of randomized block designed data • 4. ANOVA of latin square designed data • 5. ANOVA of cross-over designed data cross• 6. Multiple comparison of sample means • 7. Bartlett test and Levene test
n
Xi
∑X
∑X 2
3.36 4.32 2.34 2.68 2.95 2.63 2.86 2.93 2.17 2.72 2.56 2.52 2.27 2.98 3.72 2.28 2.39 2.28 2.48 2.28 2.32 2.61 3.64 2.58 3.65 2.42 2.41 2.66 3.29 2.70 1.06 1.08 1.27 1.63 1.89 1.74 2.16 3.37 2.97 1.69 2.51 1.88 1.41 3.19 1.92
不全相等, 值将明显大于1 不全相等,F值将明显大于1。 界值(单侧界值)确定P 用F界值(单侧界值)确定P值。
第二节
完全随机设计资料的方差分析
一、完全随机设计
(completely random design)是采用完全随 机化的分组方法,将全部试验对象分配到g个处理 组(水平组),各组分别接受不同的处理,试验结 束后比较各组均数之间的差别有无统计学意义,推 论处理因素的效应。
SS组内 = 82.10 − 32.16 = 49.94 , ν组内 =120 − 4 =116 32.16 49.94 MS组间 = =10.72 ,MS组内 = = 0.43 , 3 116 10.72 F= = 24.93 0.43
列方差分析表 表4-5 完全随机设计方差分析表
变 来 异 源 总 异 变 组 间 组 内 自 度 由 119 3 116 SS 82.10 32.16 49.94 M S 10.72 0.43 F 24.93 P <0.01
不同,各组的样本均数 (i=1,2,…,g)也大小 不等,这种变异称为组间变异。 其大小可用各组均数与总均数的离均差平方和表 示,记为SS组间 。
计算公式为
SS组间 = ∑ni (Xi − X) = ∑
2 i=1 i=1
g
g
(∑Xij )
j=1
ni
2
ni
−C
ν 组间 = g − 1
3.组内变异: 在同一处理组中,虽然每个受 组内变异:
测量值
4.59 4.34 2.66 3.59 3.13 4.04 3.53 3.56 3.85 4.07 3.93 2.33 2.98 4.00 3.55 2.64 2.56 3.50 3.25 3.52 3.93 4.19 2.96 2.96 4.3 4.16 2.59 30 3.43 102.91 367.85 统计量
例 4-1 某医生为了研究一种降血脂新
药的临床疗效, 药的临床疗效 , 按统一纳入标准选择 120名患者 , 采用完全随机设计方法将 名患者, 名患者 患者等分为4组进行双盲试验 。 患者等分为 组进行双盲试验。 问如何 组进行双盲试验 进行分组? 进行分组?
(1)完全随机分组方法:
1. 编号 : 120名高血脂患者从 开始到 编号: 名高血脂患者从1开始到 名高血脂患者从 开始到120, , 见表4-2第 行 见表 第1行(P72); ) 2. 取随机数字:从附表 中的任一行任一列 取随机数字:从附表15中的任一行任一列 开始, 行第7列 开始, 依次读取三位 开始 , 如 第 5行第 列 开始 , 依次读取 三位 行第 作为一个随机数录于编号下,见表4-2第 数作为一个随机数录于编号下,见表 第2 行;
分组结果 甲 丁 乙 甲 甲 丁 甲 丁 丁 丁 … 甲 丙
(2)统计分析方法选择:
1. 对于正态分布且方差齐同的资料,常采用完全随 对于正态分布且方差齐同的资料, 机设计的单因素方差分析 机设计的单因素方差分析(one-way ANOVA)或成 单因素方差分析 或成 检验( 组资料的 t 检验(g=2); ) 2. 对于非正态分布或方差不齐的资料,可进行数据 对于非正态分布或方差不齐的资料, 可进行数据 变换或采用 秩和检验。 变换或采用Wilcoxon秩和检验。 或采用 秩和检验
Xgj
…
Xgng
ng Xg
Sg
合计
X ij
N
X S
X ij :第i个处理组第 个观察结果 第 个处理组第 个处理组第j个观察结果
记总均数为 X = ∑ ∑ X ij / N,各处理组均
i =1 j =1
g
ni
数为 X i = ∑ X ij / ni ,总例数为N=
j =1
ni
nl+n2+…+ng,g为处理组数。 g
二、变异分解
表 4-4 完全随机设计资料的方差分析表
变异来源 总变异 自由度 N-1
g ni
SS
MS
2
F
∑∑ Xij −C
i =1 j =1
ni
组 间
g-1
∑
i =1
g
(∑ Xij )
j =1
2
SS组间
−C
ni
ν组间
SS组内
MS组间 MS组内
组 内
N-g
SS总 − SS组间
ν组内
例4-2 某医生为了研究一种降血脂新药的临
1.总变异 1.总变异:全部测量值大小不同,这种变异
称为总变异。 总变异的大小可以用离均差平方和(sum of squares of deviations from mean,SS)表示, 即各测量值Xij与总均数差值的平方和,记为 SS总。 总变异SS总反映了所有测量值之间总的变异程 度。
计算公式为
表 4-2 完全随机设计分组结果 编 号 随机数 序 号 1 2 3 4 5 6 7 8 9 10 … 119 120
260 873 373 204 056 930 160 905 886 958 … 220 634 24 106 39 15 3 114 13 109 108 117 … 16 75
完全随机设计资料的方差分析的基本思想
表4-1 g 个 理 的 验 果 处 组 试 结
处 分 理 组 平 1水 平 2水 X11 X21 X12 X22 测 值 量 … … X1j X2j … …
X1n1 X2n2
统 量 计 n1 X1 n2 X2 S1
…
…
…
…
…
…
…
…
…
S2
…
g水 平
Xg1
Xg2
…
试对象接受的处理相同,但测量值仍各不相同, 这种变异称为组内变异(误差)。组内变异可用 组内各测量值Xij 与其所在组的均数的差值的平方 和表示,记为SS组内, 表示随机误差的影响。
SS组内 = ∑∑( Xij − Xi )
iຫໍສະໝຸດ Baidu1 j=1
g ni
2
ν 组内 = N − g
三种变异的关系:
SS总 = SS组间 + SS组内
233.00
225.54
132.13
三、分析步骤
1. 建立检验假设,确定检验水准 建立检验假设,确定检验水准:
H H
0
: :
µ
1
=
µ
2
=
µ
3
=
µ
4
,
即
4
个
试
验
组
的
总
体
均
数
相
等
1
4
个
试
验
组
的
总
体
均
数
不
全
相
等
方
H0: 1 = µ2 = µ3 = µ4 即4个试验组总体均数相等 个试验组总体均数 个试验组总体均数相等 µ
表4 - 3
分 组 3.53 安慰剂组 3.30 1.37 降血脂新药 2.42 2.4g 组 1.98 2.36 2.86 4.8g 组 2.66 3.48 0.89 7.2g 组 1.98 1.31
4个处理组低密度脂蛋白测量值(mmol/L) 4个处理组低密度脂蛋白测量值(mmol/L) 个处理组低密度脂蛋白测量值
编序号: 3. 编序号 : 将全部随机数字从小到大 ( 数据相同则按 先后顺序)编序号,见表4 先后顺序)编序号,见表4-2第3行。 事先规定:序号1 30为甲组 序号31 60为乙组 为甲组, 31- 为乙组, 4. 事先规定:序号1-30为甲组,序号31-60为乙组,序 号61-90为丙组,序号91-120为丁组,见表4-2第四行。 61-90为丙组,序号91-120为丁组,见表4 第四行。 为丙组 91 为丁组
α
= 0 . 0 5
中 按 S 表 4 - 4 的 公 式 计 算 各 离 均 差 平 方 和 S S 、 自 由 度
ν
、
均
M
和
F
值
。
H1:4个试验组总体均数不全相等 个试验组总体均数 个试验组总体均数不全相等
α = 0.05
2 . 计算检验统计量 :
∑∑ Xij =102.91+ 81.46 + 80.94 + 58.99 = 324.30 2 Xij = 367.85 + 233.00 + 225.54 +132.13 = 958.52 ∑∑
C = (324.30)2 /120 = 876.42 SS总 = 958.52 −876.42=82.10 , 总 =120- 19 ν 1=1
(102.91)2 (81.46)2 (80.94)2 (58.99)2 SS组间 = + + + −876.42 = 32.16 30 30 30 30 ν组间 = 4 −1= 3
SS总 = ∑∑( Xij − X ) = ∑∑ Xij − C
g ni 2 g ni 2 i =1 j =1 i =1 j =1
ν总 = N −1
其中: 其中:
C= (∑∑ Xij )
i=1 j=1 g ni 2
N
=
(∑ Xij )
i, j
2
N
2.组间变异: 各处理组由于接受处理的水平 .组间变异:
名高血脂患者, 床疗效, 按统一纳入标准选择120名高血脂患者 , 床疗效 , 按统一纳入标准选择 名高血脂患者 采用完全随机设计方法将患者等分为 组 采用完全随机设计方法将患者等分为4组(具体分 等分 组方法见例4-1), 进行双盲试验 。 6周后测得低 ) 进行双盲试验。 周后测得 周后测得低 组方法见例 密度脂蛋白作为试验结果, 见表4-3。问 4个处理 密度脂蛋白 作为试验结果,见表 作为试验结果 。 个处理 组患者的低密度脂蛋白含量总体均数有无差别? 组患者的低密度脂蛋白含量总体均数有无差别
应用条件: 应用条件: 总体——正态且方差相等 总体 正态且方差相等 样本——独立、随机 独立、 样本 独立 设计类型: 设计类型: 完全随机设计资料的方差分析 随机区组设计资料的方差分析 拉丁方设计资料的方差分析 两阶段交叉设计资料的方差分析
N 1 ( µ 1 , σ 2 ), N 2 ( µ 2 , σ 2 ), L , N g ( µ g , σ 2 )
第一节 方差分析的基本思想 及其应用条件
目的:推断多个总体均数是否有差别。 目的:推断多个总体均数是否有差别。
也可用于两个
方法:方差分析, 方法:方差分析,即多个样本均数比较 检验。 的F检验。 检验 基本思想: 基本思想:根据资料设计的类型及研究目的, 可将总变异分解为两个或多个部分,每个部 分的变异可由某因素的作用来解释。通过比 较可能由某因素所至的变异与随机误差,即 可了解该因素对测定结果有无影响。
ν总 =ν组间 +ν组内
均方差,均方( 均方差,均方(mean square,MS)。 , )
MS组间 = MS组内 =
SS组间
ν组间
SS组内
ν组内
检验统计量:
MS组间 F= , ν1 =ν组间, ν2 =ν组内 MS组内 µ 如果 1 = µ2 = L = µ g ,则 组间, MS组内 都为随 MS 的估计, 值应接近于1 机误差 σ 2 的估计,F值应接近于1。
1.56 3.11 1.81 1.77 30 2.65 2.22 2.90 2.97 2.80 3.57 4.02 2.31 3.21 2.23 2.32 2.68 2.66 3.68 2.65 3.02 3.04 2.81 1.97 1.68 1.19 2.17 2.28 1.72 0.94 2.11 2.81 2.52 2.47 1.02 2.10 3.71 30 1.97 58.99 30 2.70 80.94 2.72 81.46
多个样本均数比较的方差分析
Analysis of Variance, ANOVA
Content
• 1. Basal ideal and application conditions • 2. ANOVA of completely random designed data • 3. ANOVA of randomized block designed data • 4. ANOVA of latin square designed data • 5. ANOVA of cross-over designed data cross• 6. Multiple comparison of sample means • 7. Bartlett test and Levene test
n
Xi
∑X
∑X 2
3.36 4.32 2.34 2.68 2.95 2.63 2.86 2.93 2.17 2.72 2.56 2.52 2.27 2.98 3.72 2.28 2.39 2.28 2.48 2.28 2.32 2.61 3.64 2.58 3.65 2.42 2.41 2.66 3.29 2.70 1.06 1.08 1.27 1.63 1.89 1.74 2.16 3.37 2.97 1.69 2.51 1.88 1.41 3.19 1.92