统计学5 方差分析课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– LSD: 假阳性 – SNK:q 检验,多组间两两比较 – Bonferroni – Dunnett-t检验:多个实验组与一个对照组 – Sidak等
1、q 检验(Student-Newman-Keuls法,SNK 法):用于多个样本均数间作两两比较。
q = xA − x B SxA −xB
S = xA −xB
不拒绝H0,差异无统计学意义,尚不能 认为多个总体均数不等或不全相等。
F ≥ Fα(ν 1,ν 2)
P ≤ 0.05
拒绝H0,接受H1,差异有统计学意义, 可以认为多个总体均数不全相等。
案 例1
为探索丹参对肢体缺血再灌注损伤的影响,将30只纯种新 西兰实验用大白兔,按窝别相同、体重相近划分为10个区 组。每个区组3只大白兔随机采用A、B、C三种处理方 案 , 即 在 松 止 血 带 前 分 别 给 予 丹 参 2ml/kg 、 丹 参 1ml/kg、生理盐水2ml/kg,在松止血带前及松后1小时分 别测定血中白蛋白含量(g/L),算出白蛋白减少量如下 表,问A、B两方案分别与C方案的处理效果是否不同? (data: bdb.sav)
2型糖尿病患者治疗4周后餐后2小时血糖的下降值(mmol/L)
高剂量组
低剂量组
对照组
5.6
16.3
-0.6
2.0
12.4
2.7
9.5
11.8
5.7
5.6
0.9
7.8
6.0
14.6
12.8
7.0
7.0
6.9
8.7
4.9
4.1
7.9
3.9
1.5
9.2
8.1
-1.8
4.3
1.6
9.4
Xij
5.0
3.5
3.8
SS 区组/(b-1)
F
MS处理 MS误差
MS区组 MS误差
误差 SS总 − SS处理 − SS区组 (k-1)(b-1) SS 组内/(k-1)(b-1)
总变异
∑ X 2 −(ΣX)2 N
N-1
SS 总/N-1
属于两因素方差分析
(3)确定P值,做出推断结论
F < Fα(ν 1,ν 2)
P > 0.05
-0.1
6.4
6.4
3.8
6.1
6.3
7.0
3.0
7.5
5.8
13.2
12.7
5.4
3.9
8.4
8.0
16.5
9.8
3.1
2.2
12.2
15.5
9.2
12.6
1.1
6.0
11.8
ni
21
Xi
9.1952
Si2
17.3605
19 5.8000 18.1867
20 5.4300 12.3843
60(N) 6.8650(X) 18.4176(S2)
方差分析表
变异来源 组间(处理组间) 组内(误差)
SS
ν MS
F
P
176.7612 2 88.3806 5.537 <0.01
909.8723 57 15.9627
总计
1086.6335 59
结论?
随机区组设计的方差分析
随机区组设计资料 ---- 两因素方差分析
配伍组设计资料:为研究k个处理效果有无差别,先将实 验对象配伍,每个配伍组的实验对象数等于处理组数k,然 后将同一配伍组的k个研究对象随机安排到k个不同的处理 组,所得的资料。 同一研究对象的k个部位测同一指标所得的数据; 同一样品用多种不同方法测同一指标所得的数据;
SS总 = SS组间 + SS组内
ν总 =ν 组间 + ν 组内
2. 基本思想
F < Fα(ν 1,ν 2)
P > 0.05
不拒绝H0,差异无统计学意义,尚不能认为多 个总体均数不等或不全相等。
F ≥ Fα(ν 1,ν 2)
P ≤ 0.05 拒绝H0,接受H1,差异有统计学意义,可以认
为多个总体均数不全相等。
例:同时在若干个教室的讲台边、中间、 后面3个部位测得的粉尘数;
例:对每份血样用A、B、C、D四种方法测 量所得的资料;
案 例1
为探索丹参对肢体缺血再灌注损伤的影响,将30只纯种新 西兰实验用大白兔,按窝别相同、体重相近划分为10个区 组。每个区组3只大白兔随机采用A、B、C三种处理方 案 , 即 在 松 止 血 带 前 分 别 给 予 丹 参 2ml/kg 、 丹 参 1ml/kg、生理盐水2ml/kg,在松止血带前及松后1小时分 别测定血中白蛋白含量(g/L),算出白蛋白减少量如下 表,问A、B两方案分别与C方案的处理效果是否不同? (data: bdb.sav)
3. 方差分析的基本假定
正态分布 方差齐性 独立性
完全随机设计资料的方差分析
完全随机设计: 采用完全随机化的分组方法,将全部实验对象分 配到g个处理组,各组接受不同的处理,试验结 束后比较各组均数之间的差异有无统计学意义, 推论处理因素的效应。
例:为研究饲料中维生素E的缺乏对肝中维生素A 含量的关系,将大鼠随机分为3组。第1组给予维 生素E缺乏的饲料,第2组给予正常饲料,第3组 给予维生素E含量较为丰富的饲料,然后定期将 大鼠处死,测定肝中维生素A的含量。--完全 随机设计资料
MS误差 2
⎛ ⎜ ⎝
1 n1
+
1 n2
⎞ ⎟ ⎠
2 、 最 小 有 意 义 差 异 法 ( least significant difference, LSD法):用于对照组与各处理 组的比较。
t = (X A − X B )
ν =νe
MSe ⎜⎜⎝⎛
1 nA
+
1 nB
⎟⎟⎠⎞
变量变换
对数转换 平方根转换 倒数变换 平方根反正弦转换 Box-Cox变换
6.3
7.0
12.7
5.4
9.8
3.1
12.6
对照组
12.4
2.7
0.9
7.8
7.0
6.9
3.9
1.5
1.6
9.4
6.4
3.8
3.0
7.5
3.9
8.4
2.2
12.2
1.1
6.0
9.1952
5.8000
5.4300
1. 基本概念
因素(因子):
– 单因素方差分析(one-way ANOVA) – 两因素方差分析
2型糖尿病患者治疗4周后餐后2小时血糖的下降值(mmol/L)
高剂量组
5.6
16.3
9.5
11.8
6.0
14.6
8.7
4.9
9.2
8.1
5.0
3.8
3.5
6.1
5.8
13.2
8.0
16.5
15.5
9.2
11.8
低剂量组
-0.6
2.0
5.7
5.6
12.8
7.0
4.1
7.9
-1.8
4.3
-0.1
6.4
例:为研究母亲职业是否影响新生儿体重,调查 不同职业产妇所生孩子的出生体重(g)。--完 全随机设计资料
基本步骤
(1)建立检验假设,确定检验水准
H0:三个总体均数相等,即μ1=μ2= μ3
H1:三个总体均数不等或不全相等 α=0.05
(2)选择检验方法,计算检验统计量
F = MS组间 MS组内
ν1 =ν组间 = k −1 ν 2 =ν组内 = N − k
对数转换
Y = lgX 或 lnX
一般用于下列情况: (1)原始数据呈对数正态分布时(如等比级数资
料),转换后可使数据呈正态分布。 (2)标准差与均数成比例时(或CV值比较接近
(3)确定P值,做出推断结论
F < Fα(ν 1,ν 2)
P > 0.05 不拒绝H0,差异无统计学意义,尚不能 认为多个总体均数不等或不全相等。
F ≥ Fα(ν 1,ν 2)
P ≤ 0.05 拒绝H0,接受H1,差异有统计学意义, 可以认为多个总体均数不全相等。
★ 单因素方差分析表
平方和 自由度 均方
Medical Statistics
方差分析
(A(nAalnyasliyssOisfOVfaVriarnicaen,ceA,NAONVOAV)A
能否用两样本t检验进行两两比较而得 出结论?
若规定α=0.05,
则每一次比较犯I型错误的概率为0.05;
每一次不犯I型错误的概率为1-0.05;
比较n次,则每一次都不犯I型错误的概率为 (1-0.05)n;
变异来源
F值
P值
SS
df
MS
组间 组内 合计
SSA υ1= k-1 SSA/ υ1
MSA/MSE
SSE υ2= n-k SSE/ υ2
SST
n-1
案例
某医生为研究一种四类降糖新药的疗效,以统一的纳 入标准和排除标准选择了60名2型糖尿病患者,按完全 随机设计方案将患者分为三组进行双盲临床试验。其 中,降糖新药高剂量组21人、低剂量组19人、对照组 20人。对照组服用公认的降糖药物,治疗4周后测得其 餐后2小时血糖的下降值(mmol/L),结果如下表。 问:治疗4周后,餐后2小时血糖下降值的三组总体平 均水平是否不同?
所以,两两比较n次,犯I型错误的概率为1-
(1-0.05)n >>0.05 。
n = Ck2
多个样本均数的比较,不能直接用两样 本t 检验来作两两比较;
应 该 选 用 方 差 分 析 ( Analysis of Variance,ANOVA)。
又称 F 检验
方差分析的用途
两个或多个均数的比较 分析因素间的交互作用 方差齐性检验 回归模型的假设检验
H1:三个总体均数不全相等
α=0.05
对于区组
H0:十个总体均数相等 H1:十个总体均数不全相等
α=0.05
(2)选择检验方法,计算检验统计量
随机区组设计方差分析计算表
变异来源
SS
v
MS
处理组
∑ ni ( Xi − X )2
k-1
i
SS 处理/(k-1)
区组
∑ nj (X j − X )2
b-1
j
3.42
2.86
4.23
随机区组设计方差分析中变异的分解
总变异
MS总
处理间变异 MS组间 = MSA
处理因素+随机 误差的作用
区组间变异
区组因素+随机
MS区组 = MSB。 误差的作用
误差
MS误差 = MSE
随机 误差的作用
基本步骤
(1)建立检验假设,确定检验水准
对于处理组
H0:三个总体均数相等,即μ1=μ2= μ3
内容提要
方差分析概述:基本概念、基本思想及应用条件 完全随机设计资料的方差分析 随机区组设计资料的方差分析 多个样本均数间的多重比较 变量变换 SPSS演示和结果表达 案例讨论riance,ANOVA:是用于检验以 某一分类变量得到的多个总体均数是否相等的方 法,从而判断某分类型自变量是否对某数值型因 变量产生影响的统计方法。
ABC三种方案处理后大白兔血中白蛋白减少量(g/L)
区组
A
B
C
1
2.21
2.91
4.25
2
2.32
2.64
4.56
3
3.15
3.67
4.33
4
1.86
3.29
3.89
5
2.56
2.45
3.78
6
1.98
2.74
4.62
7
2.37
3.15
4.71
8
2.88
3.44
3.56
9
3.05
2.61
3.77
10
3.42
2.86
4.23
变异来源 处理组 区组 误差 总计
方差分析表
SS
ν
MS
F
P
13.7018
2
6.8509 32.639 <0.01
1.5577
9
0.1731 0.825 >0.05
3.7790
18 0.2099
19.0385
29
结论?
多个样本均数的两两比较
P<0.05,差别有统计学意义 方法:
水平:因子的具体表现
2. 基本思想
各样本均数的差异Î各总体均数的差异
各样本均数之间的差异(总变异)来源:
– 组间差异--处理+随机误差 Î 各总体均数不全相等
– 组内差异--随机误差 Î 各总体均数相等
2. 基本思想
x2 μ2
x1 μ1
μ3 x3
x2 x1 μ x3
2. 基本思想
问题:组间变异、组内变异用什么来衡量?
方差S2 — 均方MS
– MS组间= SS组间 /(k-1) – MS组内= SS组内 /(n-k)
F = MS组间 / MS组内
∑ SS组间 = ni (xi − x ) 2
i
∑ ∑ SS组内 =
(xij − xi ) 2
ij
– 原假设H0成立,则F=1; – 原假设H0不成立,则F>>1。 – F值达到多少才有意义呢?
ABC三种方案处理后大白兔血中白蛋白减少量(g/L)
区组
A
B
C
1
2.21
2.91
4.25
2
2.32
2.64
4.56
3
3.15
3.67
4.33
4
1.86
3.29
3.89
5
2.56
2.45
3.78
6
1.98
2.74
4.62
7
2.37
3.15
4.71
8
2.88
3.44
3.56
9
3.05
2.61
3.77
10
分类型自变量 Î 数值型因变量
– 不同血型 Î 身高 – 促销方式 Î 销售额
案例
某临床试验:某医生为研究一种四类降糖新药的疗 效,以统一的纳入标准和排除标准选择了60名2型糖尿 病患者,按完全随机设计方案将患者分为三组进行双 盲临床试验。其中,降糖新药高剂量组21人、低剂量 组19人、对照组20人。对照组服用公认的降糖药物, 治疗4周后测得其餐后2小时血糖的下降值 (mmol/L),结果如下表。问:治疗4周后,餐后2小 时血糖下降值的三组总体平均水平是否不同?
相关文档
最新文档