卫生统计学 方差分析PPT课件
合集下载
医学统计学第三章--方差分析1(1)PPT课件
【Contrast钮】用于 对精细趋势检验和精 确两两比较的选项进 行定义,较少使用。
点击“Post Hoc”钮
【Post Hoc Multiple Comparisons对话框】 用于选择进行各组间 两两比较的方法
【Equal Variances Assumed复选框组】 当各组方差齐时可用 的两两比较方法 (14种)
点击“Option”钮
【Statistics复选框组】 常用 【Descriptive】 统计描述 【Homogeneity-of-variance】
方差齐性检验。
【Means plot复选框】用各组均数
做图,以直观的了解它们的差异。
√
【Missing Values单选框组】
定义分析中对缺失值的处理方法
因素: 在试验过程中,影响试验结果的条件叫做 因素(因子) 常用大写字母A , B , C 表…示。
水平: 把因素在试验中可能处的状态称做因素的 水平.常用表示该因素的字母加上足标表示。
方差分析的适用范围
在生产和科学实验中,影响结果的因素 往往有很多。要知道哪个因素对结果有 显著的影响时用方差分析。
常用:LSD、 S-N-K Bonferroni、 Turkey、 Sheffe、 Dunnett方法。
勾选“LSD”,点击 “Continue”返回 【Equal Variances Not Assumed复选框组】
当各组方差不齐时可用的两两比较方法,共有4种.
(一般认为“Game-Howell”方法较好,但由于统计学对 此尚无定论,所以建议方差不齐时使用非参数方法。)
成两组,乙( LBP治疗组)12只,丙(戒酒组)12只,8周后测
量
GSH值,问三种处理方式大鼠的GSH值是否相同。
第七章方差分析基础《卫生统计学》课件
方差分析简述方差分析也是统计检验的一种。
由英国著名统计学家:R.A.FISHER推导出来的,也叫F检验。
190240290340分组正常钙组中剂量钙(1.0%)高剂量钙(1.5%)1X 2X 3X X(2) 计算检验统计量可根据表7-5的公式来计算出离均差平方和、自由度、均方和F值。
从已知正态总体N(10,52)进行随机抽样,共抽取了k=10组样本,每组样本的样本含量n i=20,可算出各组的均数和标准差,得表7-7的结果。
如果采用t检验作两两比较,其比较次数为(1)10(101)45 222k k km⎛⎫--====⎪⎝⎭从理论上讲10个样本均来自同一正态总体N(10,52),应当无差异,但我们用两样本t检验时,已经规定犯第一类错误的概率不超过α=0.05,本次实验实际犯第一类错误的频率为5/45≈0.11,显然比所要控制的0.05要大。
因此不能直接用前面学过的两样本t检验对多样本均数作两两比较,而应采用专用的两两比较的方法。
(2) 计算检验统计量首先将三个样本均数由大到小排列,并编组次:, =11()2A B A B A B X X A BX X X X q S MS n n νν---==+误差误差(3) 确定值并作出推断结论自由度ν误差和对比组内包含组数a查附表4的q界值表得q界值,将算得的q值与相应q界值进行比较得各组的p值。
(3) 确定P值并作出推断结论自由度ν误差和实验组数 (不含对照组)查附表5.2的Dunnett –t(q, )界值表,得q,临界值,用计算得到的q,与临界值进行比较,得P值 。
(2) 计算检验统计量=11()A B A B A B X X A BX X X X t S MS n n νν---==+误差误差。
医学统计学第九章方差分析课件PPT
ni
Xi
)
Si
18.4176(S²)
列举存在的变异及意义
1.全部的60个实验数据之间大小不等,存在变异(总变异) 2.各个组间存在变异:反映处理因素之间的作用,以及随机 误差。 3.各个组内个体间数据不同:反映了观察值的随机误差。
思考:各种变异的表示方法?
1.总变异: 所有测量值之间总的变异程度
24.52
17.14 14.77
19.26
13.77 14.37
26.13
12.50 24.75
16.99
20.40 12.73
18.89
20.30 17.25
18.46
19.38 19.09
20.87
23.11 16.79
17.51
12.67 17.19
13.12
23.02 19.32
11.75
24.36 19.59
ni
Xi
)
Si
18.4176(S²)
知识引入
不能……原因有二:
脱离了原先的实验设计,将多个样本均数同 时比较转变为两个均数的多次比较。
多次重复使用 t 检验,会使犯第一类错误 的概率增大。
知识引入
多组间的两两比较为什么不能用 t 检验?
进行一次假设检验,犯第一类错误的概率: 3个样本,两两组合为3次, 用 t 检验做3次比较, 且每次比较α=0.05,则不犯Ⅰ类错误的概率为(1-0.05), 3次不犯错概率(1-0.05)3,而总水准为1-(1-0.05)3 =0.14
7.42 8.65 16.52 X 18.61 120
S=4.37
一、方差分析的几个名词和符号
实验研究 因素 水平
第八讲 卫生统计学 方差分析
Si
S i2
完全随机设计资料在进行统计分析时,需 根据数据的分布特征选择方法,对于正态分布 且方差齐同的资料,常采用完全随机设计的单 因素方差分析(one-way ANOVA)或成组资料的 t检验(k=2);对于非正态分布或方差不齐的 资料,可进行数据变换或采用Wilcoxon秩和检 验。
记总均数为 X X / N ,
MS组内= SS组内/υ组内=16466.65/33=498.99 F= MS组间/MS组内=15645.83/498.99=31.36
按表中的公式计算各离均差平方和SS、自由度、 均方MS和F值。
表 8-3 变异来源 df 35 总变异 2 组 间 组内(误差) 33 例 8-1 的方差分析表 SS MS F P 47758.32 31291.67 15645.83 31.36 <0.01 16466.65 498.99
Xij
正常钙(0.5%) 332.96 297.64 312.57 295.47 284.25 307.97 292.12 244.61 261.46 286.46 322.49 282.42 12 293.37 24.62 606.15
全部数据 36 252.55 36.94 1364.52
ni
Xi
又称为配伍组设计,是配对设计的扩展。具体做法是:先按影 响试验结果的非处理因素(如性别、体重、年龄、职业、病情、病 程等)将受试对象配成区组(block),再分别将各区组内的受试对象 随机分配到各处理或对照组。 与完全随机设计相比,随机区组设计的特点是随机分配的次数 要重复多次,每次随机分配都对同一个区组内的受试对象进行,且 各个处理组受试对象数量相同,区组内均衡。在进行统计分析时, 将区组变异离均差平方和从完全随机设计的组内离均差平和中分离 出来,从而减小组内平方和(误差平方和),提高了统计检验效率。 若将区组作为另一处理因素的不同水平,随机区组设计等同于无重 复观察的两因素设计。
第八章方差分析1预防医学精品PPT课件
R.A.Fisher(1890~1962)
9
多个独立样本资料的方差分析
检验目的 推断多个总体均数是否相等。
10
多个独立样本资料的方差分析
应用条件
➢ 多个独立随机样本的定量资料
➢ 各样本均来自正态分布总体
➢ 各总体方差相等
X 2 ~ N( 2 , )
X1 ~ N( 1 , )
X3 ~ N(3, )
5
表 8-1 2 型糖尿病患者治疗 4 周后餐后 2 小时血糖的下降值(mmol/L)
高剂量组 (i=1)
5.6 16.3
9.5 11.8
6.0 14.6
8.7 4.9
X ij
9.2 8.1
5.0 3.8
3.5 6.1
5.8 13.2
8.0 16.5
15.5 9.2
11.8
ni
21
Xi
9.1952
卫生统计学 -方差分析
1
方差分析
定量资料
方差分析的基本思想 完全随机设计资料的方差分析** 随机区组设计资料的方差分析** 多个样本均数的两两比较* 析因设计资料的方差分析 重复测量资料的方差分析 多个样本的方差齐性检验和数据变换
2
A 完全随机分组得到多个独立样本
样本1
甲药
受试对象
合计
t检验
资料类型? 设计类型? 分布类型? 总体方差相等?
20
60( N )
5.4300
6.8650( X )
12.3843
18.4176( S 2 )
6
不能用t检验的原因
检验假设: H0: 1 2 3 H1:至少有两个 总体均数不等
0.05
拒绝H0,犯一类 错误的概率是0.05
9
多个独立样本资料的方差分析
检验目的 推断多个总体均数是否相等。
10
多个独立样本资料的方差分析
应用条件
➢ 多个独立随机样本的定量资料
➢ 各样本均来自正态分布总体
➢ 各总体方差相等
X 2 ~ N( 2 , )
X1 ~ N( 1 , )
X3 ~ N(3, )
5
表 8-1 2 型糖尿病患者治疗 4 周后餐后 2 小时血糖的下降值(mmol/L)
高剂量组 (i=1)
5.6 16.3
9.5 11.8
6.0 14.6
8.7 4.9
X ij
9.2 8.1
5.0 3.8
3.5 6.1
5.8 13.2
8.0 16.5
15.5 9.2
11.8
ni
21
Xi
9.1952
卫生统计学 -方差分析
1
方差分析
定量资料
方差分析的基本思想 完全随机设计资料的方差分析** 随机区组设计资料的方差分析** 多个样本均数的两两比较* 析因设计资料的方差分析 重复测量资料的方差分析 多个样本的方差齐性检验和数据变换
2
A 完全随机分组得到多个独立样本
样本1
甲药
受试对象
合计
t检验
资料类型? 设计类型? 分布类型? 总体方差相等?
20
60( N )
5.4300
6.8650( X )
12.3843
18.4176( S 2 )
6
不能用t检验的原因
检验假设: H0: 1 2 3 H1:至少有两个 总体均数不等
0.05
拒绝H0,犯一类 错误的概率是0.05
医学统计学PPT课件:方差分析
Ronald Fisher(1890伦敦~1962 Adleaide )
哈罗公学(Harrow School) 剑桥大学
加拿大农场,投资公司,中学老 师 , 农业试验站 伦敦大学、剑桥大学
1918: The correlation between relatives on the supposition of Mendelian inheritance (ANOVA). 1925: Statistical Methods for Research Workers 1935: The design of experiments (The lady tasting tea test)
医学统计学
Medical Statistics
方差分析 Analysis of variance
(ANOVA)
上次课小复习
t X
s X
✓ 一组样本均数与总体均数的比较(单个
样本的t检验) ✓ 两组样本均数的比较(配对设计t检验)
✓ 两组样本均数的比较(独立样本t检验)
例:21名要求持续镇痛的病人被随机分到四组,接受同 剂量的吗啡,6小时后测量血中游离吗啡水平,问四组 之间有无差别?
若F远远大于1,拒绝H0, 则可认为处理(实验)因素 对实验结果可能有影响,即各组之间有差异;否 则,接受H0, 认为因素对结果没有显著影响。
方差分析基本步骤
校正数 C ( x)2 N
总平方和
x2 C DF总 = N-1
组间平方和
DF组间=组数-1
(x )2 n (x )2 n (x )2 n C
11
22
3
3
组内平方和 = 总平方和–组间平方和
DF组内 = DF总-DF组间
医学统计学方差分析ppt课件
24
25
方差分析步骤 :提出检验假设,确定检验水准
26
第二节 随机区组设计的方差分析
方差分析步骤 :计算检验统计量F 值
27
方差分析步骤 :确定P值,做出推断结论 对于处理因素A F0.05(2,18) =3.55 F=245.79
F> F0.05(2,18) ,P<0.05,拒绝H0
方差分析
1
方差分析由英国统计 学家R.A.Fisher在1923 年提出,为纪念Fisher,
以F命名,故方差分析又 称 F 检验
2
方差分析的用途 单因素多水平组间效应分析 多因素多水平组间效应分析 回归效应分析 方差齐性分析
3
完全随机设计的方差分析 随机区组设计的方差分析 多个样本均数的两两比较 方差齐性检验
20
基本思想:各变异的平均变异,即均方
处理均方:
MS处理
SS处理
处理
区组均方:
MS区组
SS区组
区组
组内(误差)均方:
MS误差
SS误差
误差
21
基本思想:统计量F值
F处理
MS处理 MS误差
F处理>Fα (k-1,(k-1)(m-1)),P<α ,认为比较组总体均值不 全相同
F处理<Fα (k-1,(k-1)(m-1)),P>α ,尚不能认为比较组总体 均值不同
4
例 拟探讨枸杞多糖(LBP)对酒精性脂肪肝大鼠GSH (mg/gprot)的影响,将36只大鼠随机分为甲、乙、丙 三组,其中甲(正常对照组)12只,其余24只用乙醇灌 胃10周造成大鼠慢性酒精性脂肪肝模型后,再随机分为 2组,乙(LBP治疗组)12只,丙(戒酒组)12只,8周 后测量三组GSH值。试问三种处理方式大鼠的GSH值是否 相同?
25
方差分析步骤 :提出检验假设,确定检验水准
26
第二节 随机区组设计的方差分析
方差分析步骤 :计算检验统计量F 值
27
方差分析步骤 :确定P值,做出推断结论 对于处理因素A F0.05(2,18) =3.55 F=245.79
F> F0.05(2,18) ,P<0.05,拒绝H0
方差分析
1
方差分析由英国统计 学家R.A.Fisher在1923 年提出,为纪念Fisher,
以F命名,故方差分析又 称 F 检验
2
方差分析的用途 单因素多水平组间效应分析 多因素多水平组间效应分析 回归效应分析 方差齐性分析
3
完全随机设计的方差分析 随机区组设计的方差分析 多个样本均数的两两比较 方差齐性检验
20
基本思想:各变异的平均变异,即均方
处理均方:
MS处理
SS处理
处理
区组均方:
MS区组
SS区组
区组
组内(误差)均方:
MS误差
SS误差
误差
21
基本思想:统计量F值
F处理
MS处理 MS误差
F处理>Fα (k-1,(k-1)(m-1)),P<α ,认为比较组总体均值不 全相同
F处理<Fα (k-1,(k-1)(m-1)),P>α ,尚不能认为比较组总体 均值不同
4
例 拟探讨枸杞多糖(LBP)对酒精性脂肪肝大鼠GSH (mg/gprot)的影响,将36只大鼠随机分为甲、乙、丙 三组,其中甲(正常对照组)12只,其余24只用乙醇灌 胃10周造成大鼠慢性酒精性脂肪肝模型后,再随机分为 2组,乙(LBP治疗组)12只,丙(戒酒组)12只,8周 后测量三组GSH值。试问三种处理方式大鼠的GSH值是否 相同?
医学统计学教学课件-方差分析 PPT
B 组(24h)
11.14 11.60 11.42 13.85 13.53 14.16 6.94 13.01 14.18 17.72
C 组(96h)
合计
10.85
8.58
7.19
9.36 i为组的编号,A,B,C
9.59
8.81 j为组内为个体编号,
8.22 1,2,…,10
9.95
11.26
8.68
与总均数 X 间的差别
2. 组间变异( between group variation ) 各
组的均数
X
与总均数
i
X
间的差异
3. 组内变异(within group variation )每组的
10个原始数据与该组均数X i 的差异
下面先用离均差平方和(sum of squares of
deviations from mean,SS)表示变异的大小
3. 组内变异
在同一处理组内,虽
然每个受试对象接受的处
理相同,但测量值仍各不
相同,这种变异称为组内
变异。SS组内仅仅反映了随
mi
机误差的影响。也称SS误差
k ni
k
SS组内
(XijXi)2 (ni 1)Si2
i1 j1
i1
组间 =Nk
S 组 = ( 7 S . 7 内 8 . 0 6 ) 2 ( 7 4 . 7 8 . 0 1 ) 2 4 ( 8 . 6 9 . 2 8 ) 2 1 5 . 0 1
ni
T3 X 3 j j 1
k ni
X X ij i1 j1
ni
Qi
X
2 ij
j 1
ni
最新医学统计学方差分析教学讲义ppt
表5.2 方差分析
来源 SS
ν MS
F
组间 1523.81 2 761.91 18.33
组内 748.00 18 41.56
总 2271.81 20
P <0.01
随机区组设计资料的方差分析(双因素方差分析)
例5.2 某研究者把24名贫血患儿按年龄及 贫血程度分成8个区组(b=8),每一区组中三 名儿童用随机的方式分配A、B和C三种不同的 治疗方法(处理组)。治疗后血红蛋白含量的 增加量(g/L)如下表,问:
医学统计学方差分析
第四章 方差分析
Analysis of variance ANOVA
第四章 方差分析
•方差分析的基本思想
•应用及资料要求 • 完全随机设计资料的方差分析 •随机区组设计资料的方差分析 •拉丁方设计资料的方差分析 •交叉设计资料的方差分析 •多个样本均数间的多重比较 •析因设计资料的方差分析 •正交设计资料的方差分析 •多元方差分析 •常用的数据转换方法 •课堂讨论
治疗一个月后,血红蛋白的增加克数如下表,问三种治疗方案对婴
幼儿贫血的疗效是否相同?
表 5 .1 三 种 方 案 治 疗 后 血 红 蛋 白 增 加 量 ( g / L )
A
B
C
24
20
20
36
18
11
25
17
6
14
10
3
26
19
0
34
24
-1
23
4
5
合计
n
7
6
8
21
Σ jΧ
182
108
48
338
Σ jΧ 2
方差分析的基本思想
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.6 3.6 4.5 5.1 4.9 4.7 4.8 4.3 4.6875
2020/11/19
14
ANOVA
• 变异的来源:
样本均数间存在的差异可能由两种原因所致: ① 随机因素引起的差异:抽样误差、测量误差 ② 处理因素引起的差异:不同的处理引起不同
的作用和效果,导致各处理组之间均数不同
2020/11/19
2020/11/19
3
ANOVA
表9-1 三组大鼠的全肺湿重(g)
甲组 4.2 3.3 3.7 4.3 4.1 3.3 3.5 4.1 乙组 4.5 4.4 3.5 4.2 4.6 4.2 4.4 4.1 丙组 5.6 3.6 4.5 5.1 4.9 4.7 4.8 4.4
• 研究者对上述资料采用两样本t 检验两两比较得 出结论:
7 -1.287
8 -0.238
9 -0.625
10 -0.293
x
-0.272
c2 -0.048 -0.990 0.607 -1.086 -0.136 -1.286 2.050 -1.511 0.345 -0.315 -0.237
c3 1.408 -2.014 -2.014 -0.366 -0.645 0.134 0.890 0.225 0.623 0.319 -0.068
方差:
s2
(xx)2
x2
(
x)2
n
n1
n1
2020/11/19
13
ANOVA
一、方差分析的基本思想
表 9-2 三组大鼠的全肺湿重( g )
甲组
乙组
丙组
4.2 3.3 3.7 4.3 4.1 3.3 3.5 4.1
x i 3.8125
4.5 4.4 3.5 4.2 4.6 4.2 4.1 4.4 4.2375
17
ANOVA
• 组间变异:各处理组均数之间不尽相同
ni 2
SS组 间i k1ni(xix)2i k1j1nxiij
10个样本来自同一标准正态分布N(0,1)总体
则 123 1 0
实际上犯I型错误的大小: 6 0.1333 45
2020/11/19
9
ANOVA
第一节 方差分析的基本思想和应用条件
2020/11/19
10
ANOVA
• 方差分析又称变异数分 析,是由英国著名统计 学家Fisher于1928年首 先提出的一种统计方法, 故也称F检验,用于多 个样本均数的比较
c10 0.562 0.828 1.446 0.487 0.208 0.603 0.549 0.416 -0.472 1.080 0.571
S 0.970
1.072
1.026
0.844 0.887 1.128 0.995 0.876 0.839 0.510
2020/11/19
7
ANOVA
两两比较的次数:m
Chapter 9
Analysis of Variance, ANOVA
主要内容
方差分析的基本思想和应用条件 完全随机设计的方差分析
outline
2020/11/19
随机区组设计的方差分析 多个样本均数的两两比较
2
ANOVA
• 【例9-1】 为研究煤矿粉尘作业环境对尘肺 的影响,将24只Wistar 大鼠随机分到甲、 乙、丙三个组,每组8只,分别在地面办公 楼、煤炭仓库和矿井下染尘,12周后测量 大鼠全肺湿重(g)
k 2
k(k 1) 2
例: k 3 ,
k 10,
m1
3(31) 2
3
10(101) m2 2 45
2020/11/19
8
ANOVA
c1-c8 c1-c10 c2-c8 c2-c10 c8-c9 c9-c10 t -2.38 -2.43 -2.16 -2.15 2.42 -2.54 P 0.029 0.026 0.044 0.045 0.026 0.021
15
ANOVA
• 变异的分解:
➢总变异 ➢组间变异 ➢ 组内变异
2020/11/19
16
ANOVA
• 总变异:所有观察值之间的变异(不分组)
k
SS总
n i
k
(xijx)2
n i xi2 j k
n i
2
xij
N
i 1j 1
i 1j 1
i 1j 1
总 N -1
2020/11/19
c4 0.419 -0.663 -0.663 -0.196 0.740 1.591 0.942 0.810 -1.279 0.410 0.262
c5 0.466 -1.032 -1.032 -0.465 1.752 0.029 -0.694 -0.790 1.067 0.016 -0.017
c6 -1.357 0.151 0.151 0.535 0.850 -1.806 0.942 -1.634 -0.745 0.856 -0.140
c7 1.211 -1.138 -1.138 -1.052 -0.171 0.460 0.168 0.532 1.203 -1.538 0.051
c8 0.077 1.327 1.327 1.042 0.122 -0.836 0.554 0.686 1.435 2.327 0.710
c9 0.464 0.770 -1.632 -0.083 -0.319 -1.173 0.452 -1.101 0.629 -0.184 -0.212
2020/11/19
5
ANOVA
模拟试验(simulation trial)
• 从标准正态分布总体 N( 0, 1 ) 中随机 抽样,样本含量为10,共抽取10次,得 数据如下:
2020/11/19
6
ANOVAd#c1源自1 1.80320.839
3 -1.212
4 -1.123
5 -0.545
6 -0.012
①乙组和丙组差异无统计学意义
②其余各两组间差异均有统计学意义
2020/11/19
4
ANOVA
【问题9-1】 (1)该实验属何种设计方案? (2)统计分析方法是否正确?为什么? 【分析】 (1)完全随机设计 (2)不正确:①将多个样本均数的同时比较转化为 多次的两两比较;②多次的两两比较会增大Ⅰ型错 误的概率
Ronald Fisher
2020/11/19
11
ANOVA
• 常用术语:
– 因素:所要检验的对象称为因素(如研究某种 药物的不同剂量疗效,药物即因素)
– 水平:因素的具体表现称为水平(药物的每个 剂量为一个水平)
– 观察值:在每个因素水平下得到的样本值
2020/11/19
12
ANOVA
• 变异的测量: