统计学5 方差分析课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ABC三种方案处理后大白兔血中白蛋白减少量(g/L)
区组
A
B
C
1
2.21
2.91
4.25
2
2.32
2.64
4.56
3
3.15
3.67
4.33
4
1.86
3.29
3.89
5
2.56
2.45
3.78
6
1.98
2.74
4.62
7
2.37
3.15
4.71
8
2.88
3.44
3.56
9
3.05
2.61
3.77
10
水平:因子的具体表现
2. 基本思想
各样本均数的差异Î各总体均数的差异
各样本均数之间的差异(总变异)来源:
– 组间差异--处理+随机误差 Î 各总体均数不全相等
– 组内差异--随机误差 Î 各总体均数相等
2. 基本思想
x2 μ2
x1 μ1
μ3 x3
x2 x1 μ x3
2. 基本思想
问题:组间变异、组内变异用什么来衡量?
– LSD: 假阳性 – SNK:q 检验,多组间两两比较 – Bonferroni – Dunnett-t检验:多个实验组与一个对照组 – Sidak等
1、q 检验(Student-Newman-Keuls法,SNK 法):用于多个样本均数间作两两比较。
q = xA − x B SxA −xB
S = xA −xB
-0.1
6.4
6.4
3.8
6.1
6.3
7.0
3.0
7.5
5.8
13.2
12.7
5.4
3.9
8.4
8.0
16.5
9.8
3.1
2.2
12.2
15.5
9.2
12.6
1.1
6.0
11.8
ni
21
Xi
9.1952
Si2wenku.baidu.com
17.3605
19 5.8000 18.1867
20 5.4300 12.3843
60(N) 6.8650(X) 18.4176(S2)
SS 区组/(b-1)
F
MS处理 MS误差
MS区组 MS误差
误差 SS总 − SS处理 − SS区组 (k-1)(b-1) SS 组内/(k-1)(b-1)
总变异
∑ X 2 −(ΣX)2 N
N-1
SS 总/N-1
属于两因素方差分析
(3)确定P值,做出推断结论
F < Fα(ν 1,ν 2)
P > 0.05
6.3
7.0
12.7
5.4
9.8
3.1
12.6
对照组
12.4
2.7
0.9
7.8
7.0
6.9
3.9
1.5
1.6
9.4
6.4
3.8
3.0
7.5
3.9
8.4
2.2
12.2
1.1
6.0
9.1952
5.8000
5.4300
1. 基本概念
因素(因子):
– 单因素方差分析(one-way ANOVA) – 两因素方差分析
例:为研究母亲职业是否影响新生儿体重,调查 不同职业产妇所生孩子的出生体重(g)。--完 全随机设计资料
基本步骤
(1)建立检验假设,确定检验水准
H0:三个总体均数相等,即μ1=μ2= μ3
H1:三个总体均数不等或不全相等 α=0.05
(2)选择检验方法,计算检验统计量
F = MS组间 MS组内
ν1 =ν组间 = k −1 ν 2 =ν组内 = N − k
分类型自变量 Î 数值型因变量
– 不同血型 Î 身高 – 促销方式 Î 销售额
案例
某临床试验:某医生为研究一种四类降糖新药的疗 效,以统一的纳入标准和排除标准选择了60名2型糖尿 病患者,按完全随机设计方案将患者分为三组进行双 盲临床试验。其中,降糖新药高剂量组21人、低剂量 组19人、对照组20人。对照组服用公认的降糖药物, 治疗4周后测得其餐后2小时血糖的下降值 (mmol/L),结果如下表。问:治疗4周后,餐后2小 时血糖下降值的三组总体平均水平是否不同?
例:同时在若干个教室的讲台边、中间、 后面3个部位测得的粉尘数;
例:对每份血样用A、B、C、D四种方法测 量所得的资料;
案 例1
为探索丹参对肢体缺血再灌注损伤的影响,将30只纯种新 西兰实验用大白兔,按窝别相同、体重相近划分为10个区 组。每个区组3只大白兔随机采用A、B、C三种处理方 案 , 即 在 松 止 血 带 前 分 别 给 予 丹 参 2ml/kg 、 丹 参 1ml/kg、生理盐水2ml/kg,在松止血带前及松后1小时分 别测定血中白蛋白含量(g/L),算出白蛋白减少量如下 表,问A、B两方案分别与C方案的处理效果是否不同? (data: bdb.sav)
2型糖尿病患者治疗4周后餐后2小时血糖的下降值(mmol/L)
高剂量组
低剂量组
对照组
5.6
16.3
-0.6
2.0
12.4
2.7
9.5
11.8
5.7
5.6
0.9
7.8
6.0
14.6
12.8
7.0
7.0
6.9
8.7
4.9
4.1
7.9
3.9
1.5
9.2
8.1
-1.8
4.3
1.6
9.4
Xij
5.0
3.5
3.8
3.42
2.86
4.23
变异来源 处理组 区组 误差 总计
方差分析表
SS
ν
MS
F
P
13.7018
2
6.8509 32.639 <0.01
1.5577
9
0.1731 0.825 >0.05
3.7790
18 0.2099
19.0385
29
结论?
多个样本均数的两两比较
P<0.05,差别有统计学意义 方法:
对数转换
Y = lgX 或 lnX
一般用于下列情况: (1)原始数据呈对数正态分布时(如等比级数资
料),转换后可使数据呈正态分布。 (2)标准差与均数成比例时(或CV值比较接近
3.42
2.86
4.23
随机区组设计方差分析中变异的分解
总变异
MS总
处理间变异 MS组间 = MSA
处理因素+随机 误差的作用
区组间变异
区组因素+随机
MS区组 = MSB。 误差的作用
误差
MS误差 = MSE
随机 误差的作用
基本步骤
(1)建立检验假设,确定检验水准
对于处理组
H0:三个总体均数相等,即μ1=μ2= μ3
Medical Statistics
方差分析
(A(nAalnyasliyssOisfOVfaVriarnicaen,ceA,NAONVOAV)A
能否用两样本t检验进行两两比较而得 出结论?
若规定α=0.05,
则每一次比较犯I型错误的概率为0.05;
每一次不犯I型错误的概率为1-0.05;
比较n次,则每一次都不犯I型错误的概率为 (1-0.05)n;
所以,两两比较n次,犯I型错误的概率为1-
(1-0.05)n >>0.05 。
n = Ck2
多个样本均数的比较,不能直接用两样 本t 检验来作两两比较;
应 该 选 用 方 差 分 析 ( Analysis of Variance,ANOVA)。
又称 F 检验
方差分析的用途
两个或多个均数的比较 分析因素间的交互作用 方差齐性检验 回归模型的假设检验
MS误差 2
⎛ ⎜ ⎝
1 n1
+
1 n2
⎞ ⎟ ⎠
2 、 最 小 有 意 义 差 异 法 ( least significant difference, LSD法):用于对照组与各处理 组的比较。
t = (X A − X B )
ν =νe
MSe ⎜⎜⎝⎛
1 nA
+
1 nB
⎟⎟⎠⎞
变量变换
对数转换 平方根转换 倒数变换 平方根反正弦转换 Box-Cox变换
SS总 = SS组间 + SS组内
ν总 =ν 组间 + ν 组内
2. 基本思想
F < Fα(ν 1,ν 2)
P > 0.05
不拒绝H0,差异无统计学意义,尚不能认为多 个总体均数不等或不全相等。
F ≥ Fα(ν 1,ν 2)
P ≤ 0.05 拒绝H0,接受H1,差异有统计学意义,可以认
为多个总体均数不全相等。
方差S2 — 均方MS
– MS组间= SS组间 /(k-1) – MS组内= SS组内 /(n-k)
F = MS组间 / MS组内
∑ SS组间 = ni (xi − x ) 2
i
∑ ∑ SS组内 =
(xij − xi ) 2
ij
– 原假设H0成立,则F=1; – 原假设H0不成立,则F>>1。 – F值达到多少才有意义呢?
方差分析表
变异来源 组间(处理组间) 组内(误差)
SS
ν MS
F
P
176.7612 2 88.3806 5.537 <0.01
909.8723 57 15.9627
总计
1086.6335 59
结论?
随机区组设计的方差分析
随机区组设计资料 ---- 两因素方差分析
配伍组设计资料:为研究k个处理效果有无差别,先将实 验对象配伍,每个配伍组的实验对象数等于处理组数k,然 后将同一配伍组的k个研究对象随机安排到k个不同的处理 组,所得的资料。 同一研究对象的k个部位测同一指标所得的数据; 同一样品用多种不同方法测同一指标所得的数据;
H1:三个总体均数不全相等
α=0.05
对于区组
H0:十个总体均数相等 H1:十个总体均数不全相等
α=0.05
(2)选择检验方法,计算检验统计量
随机区组设计方差分析计算表
变异来源
SS
v
MS
处理组
∑ ni ( Xi − X )2
k-1
i
SS 处理/(k-1)
区组
∑ nj (X j − X )2
b-1
j
内容提要
方差分析概述:基本概念、基本思想及应用条件 完全随机设计资料的方差分析 随机区组设计资料的方差分析 多个样本均数间的多重比较 变量变换 SPSS演示和结果表达 案例讨论
1. 基本概念
Analysis of variance,ANOVA:是用于检验以 某一分类变量得到的多个总体均数是否相等的方 法,从而判断某分类型自变量是否对某数值型因 变量产生影响的统计方法。
(3)确定P值,做出推断结论
F < Fα(ν 1,ν 2)
P > 0.05 不拒绝H0,差异无统计学意义,尚不能 认为多个总体均数不等或不全相等。
F ≥ Fα(ν 1,ν 2)
P ≤ 0.05 拒绝H0,接受H1,差异有统计学意义, 可以认为多个总体均数不全相等。
★ 单因素方差分析表
平方和 自由度 均方
ABC三种方案处理后大白兔血中白蛋白减少量(g/L)
区组
A
B
C
1
2.21
2.91
4.25
2
2.32
2.64
4.56
3
3.15
3.67
4.33
4
1.86
3.29
3.89
5
2.56
2.45
3.78
6
1.98
2.74
4.62
7
2.37
3.15
4.71
8
2.88
3.44
3.56
9
3.05
2.61
3.77
10
3. 方差分析的基本假定
正态分布 方差齐性 独立性
完全随机设计资料的方差分析
完全随机设计: 采用完全随机化的分组方法,将全部实验对象分 配到g个处理组,各组接受不同的处理,试验结 束后比较各组均数之间的差异有无统计学意义, 推论处理因素的效应。
例:为研究饲料中维生素E的缺乏对肝中维生素A 含量的关系,将大鼠随机分为3组。第1组给予维 生素E缺乏的饲料,第2组给予正常饲料,第3组 给予维生素E含量较为丰富的饲料,然后定期将 大鼠处死,测定肝中维生素A的含量。--完全 随机设计资料
变异来源
F值
P值
SS
df
MS
组间 组内 合计
SSA υ1= k-1 SSA/ υ1
MSA/MSE
SSE υ2= n-k SSE/ υ2
SST
n-1
案例
某医生为研究一种四类降糖新药的疗效,以统一的纳 入标准和排除标准选择了60名2型糖尿病患者,按完全 随机设计方案将患者分为三组进行双盲临床试验。其 中,降糖新药高剂量组21人、低剂量组19人、对照组 20人。对照组服用公认的降糖药物,治疗4周后测得其 餐后2小时血糖的下降值(mmol/L),结果如下表。 问:治疗4周后,餐后2小时血糖下降值的三组总体平 均水平是否不同?
不拒绝H0,差异无统计学意义,尚不能 认为多个总体均数不等或不全相等。
F ≥ Fα(ν 1,ν 2)
P ≤ 0.05
拒绝H0,接受H1,差异有统计学意义, 可以认为多个总体均数不全相等。
案 例1
为探索丹参对肢体缺血再灌注损伤的影响,将30只纯种新 西兰实验用大白兔,按窝别相同、体重相近划分为10个区 组。每个区组3只大白兔随机采用A、B、C三种处理方 案 , 即 在 松 止 血 带 前 分 别 给 予 丹 参 2ml/kg 、 丹 参 1ml/kg、生理盐水2ml/kg,在松止血带前及松后1小时分 别测定血中白蛋白含量(g/L),算出白蛋白减少量如下 表,问A、B两方案分别与C方案的处理效果是否不同? (data: bdb.sav)
2型糖尿病患者治疗4周后餐后2小时血糖的下降值(mmol/L)
高剂量组
5.6
16.3
9.5
11.8
6.0
14.6
8.7
4.9
9.2
8.1
5.0
3.8
3.5
6.1
5.8
13.2
8.0
16.5
15.5
9.2
11.8
低剂量组
-0.6
2.0
5.7
5.6
12.8
7.0
4.1
7.9
-1.8
4.3
-0.1
6.4