统计学--第八章方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
s x A x B 1 1 2 MS组内 ( ) 0.172 0.2092 nA nB 8
四、多个样本均数间的多重比较
3)确定P值,做出推断结论 v=N-K=32-4=28,查t界值表,得:
比较组
| XA XB |
t值
P < 0.001
甲与乙 0.7287 3.4849 0.001< P <0.002 甲与丙 1.8575 8.8833
第i个处理 水平 每个水平 组的例数 第i组的 均数
2
总均数
方差分析的基本思想
SS总=SS组内+SS组间
随机误差
组内变异
SS组内
SS总
总变异
随机误差+处理的作用(可能 存在)
组间变异
SS组间
方差分析表
变异来源 组间 组内 总 SS SS组间 SS组内 SS总 v k-1 N-k N-1
组间方差,又 称组间均方 (MS组间)
的比较,多个组与一个特定组间的比较或者特
定组间的比较(Planned Multiple
Comparison) 方差分析得到有差别的结论后多个组之间的 相互比较的探索性研究(Post Hoc)
四、多个样本均数间的多重比较
两两比较方法
多个样本均数间每 两个均数的比较 多个实验组分别与对照组 均数间的两两比较
MS SS组间/v组间 SS组内/v组内 F MS组间 MS组内
组内方差,又称 组内均方 (MS )
方差分析的原理
方差比的分布!
MS组间 SS组间 k 1 F MS组内 SS组内 n k
MS Between F ~ F( 1 , 2 ) MSWithin
MS组内 = MS组间
SX AXB MS 组内 1 1 ( ) 2 n A nB
当两样本n相等时 自由度=υ组内
S X A X B MS 组内 /n
四、多个样本均数间的多重比较
计算步骤 1. 将多个样本均数由小到大顺序排列 2. 按照两均数组合原则,计算出每两个样本均数 比较的统计量q值 3. 根据误差的自由度和两样本间隔组数a,查q界 值表得q界值。注意:组数a的计算方法:由于 各样本均数已由小到大顺序排列,因此,相邻 两样本均数比较时,组数a=2,中间间隔一个 样本均数时,组数a=3,间隔两个样本均数时, 组数a=4,余类推
(1)建立假设和确定显著性水平
(2)计算检验统计量 (3)确定P值和做出推断
可能发生的两类错误
检验结果 真实情况
拒绝H0
不拒绝H0
H0 成立
H1成立
I型错误(a )
推断正确(1-a )
II 型错误 ( b ) 推断正确(1-b)
问题的提出
t检验实例
外用中药搽剂骨肌康对小鼠琼脂肉芽的抑制作用。 给予对照组0.5ml65%乙醇,试验组施用大剂量骨肌 康,给予0.2g生药/0.5ml65%乙醇,观察两组的肉芽 肿重。
处 理 因 素
水平1 水平2
水平k
方差分析的应用条件
应用条件 1、各个样本是相互独立的随机样本; 2、各个样本来自正态总体; 3、各个处理组的总体方差相等,即方差齐。
t检验的应用条件??
方差分析的应用条件
不满足应用条件时处理方法
1、进行变量变换,以达到方差齐或 正态的要求 2、采用非参数法(秩和检验)
?
X =2.72mmol/l
Leabharlann Baidu
用药组2
X =2.70mmol/l
用药组3
X =1.97mmol/l
问题的提出
进行一次假设检验,犯I型错误的概率:a
进行多次(k)假设检验,犯I型错误的概率:
1-(1-a)k 组数为3, k=3, 组数为4, k=6, 1-(1-0.05)k=0.1426 1-(1-0.05)k=0.2649
1 0.95 0.2649
6
为避免增大犯第一类错误的概率,不能使用 t 检验,而应使用专门的方法。
四、多个样本均数间的多重比较
多重比较的方法较多,如SPSS软件中就
有18种方法,应根据资料特点(方差是
否齐性)和研究目的来选用。
四、多个样本均数间的多重比较
分类
事先计划好的多个试验组与一个对照组之间
| XA XB | t SX AXB
SX AXB
组内=N-k
1 1 MS组内 ( ) n A nB
自由度=υ
四、多个样本均数间的多重比较
LSD法实际上是一种t检验法,主要区别在
于计算标准误中的合并方差及自由度的不
同
仍按算得的t值查附表2,t界值表,作出 推断结论
四、多个样本均数间的多重比较
例 在方差分析的基础上,对不同大鼠模型
的IL-2水平进行多重比较。 1)建立假设,确定检验水准 H0: μA=μB
H1: μA≠μB
a 0.05
四、多个样本均数间的多重比较
2)计算统计量t值 由于各组的例数都一样,均为8例,而且在进行 方差分析时,已知MS组内=0.175。故任意两个比较组
的标准误均为:
组数为5, k=10, 1-(1-0.05)k=0.4013
问题的提出
t检验的局限性
比较两组样本均数
(单因素两水平)
方差分析
方差分析(Analysis of Variance,简写为
ANOVA )
由英国统计学家R.A.Fisher在1918年提出
F检验
方差分析的原理
单因素方差分析/完全随机设计方差分析 (one-way ANOVA):研究一个处理因素 (有k个水平),将n个观察单位随机分配到k 个水平,观察水平间效应的差别
SNK q检验
LSD -t检验
四、多个样本均数间的多重比较
(一)SNK-q检验
可对所有对照组及处理组的样本均数进行
两两比较
适用于探索性研究,在研究设计阶段未预
先考虑或未预料到,经数据结果的提示后
才决定的多个均数间每两个的事后比较
四、多个样本均数间的多重比较
计算公式
| XA XB | q S X AXB
甲与丁 1.9737 9.4390
乙与丙 1.1288 5.3984 乙与丁 1.2450 5.9541 丙与丁 0.1162 0.5557
SS 组内 (xij x i )
i j
2
第i个处理 水平
每个水平 组的第j例
任一 观测值
第i个处 理组的均 数
组间变异 各水平处理组的均值不同
组间变异
不同组间的血清IL-2水平不同
原因:处理因素的效应(如果存在的话);随机误
差组间变异
SS组间 ni ( xi x)
方差
SS/(n-1)
消除n 的 影响
总变异
所有观察值几乎不同,各观察值与 总体均数间的差异为总变异
SS总 ( xij x)
i j
第i个处理 水平 每个水平 组的第j例
2
v总 =n 1
总均数
任一 观测值
组内变异 同一水平处理组,各观测值不完全相等
组内变异
同组内的血清IL-2水平不一致 原因是不同个体的随机误差
i列, i =1,2..k,在此 k=4,处理组数
总例数
j 行, j =1,2…,ni,
在此j=8
总例数
第 i个 处理 组的 样本 均数
总 均 数
总变异 所有个体的血清IL-2水平几乎都不同
回顾:正态分布资料的离散趋势指标
SS (X X )
离均差 平方和
2
变异度
总例数n(自由度n-1)
F
MS组间 MS组内
1
处理因素 无效
MSW
MSB
处理因素
MS组内
F
MS组间 MS组内
1
MS组间
构造检验的统计量(F 分布)
构造检验的统计量(F 分布)
若均值相等, F=MS组间/MS组内 1
0
拒绝H0 不能拒绝H0
a
F
Fa(k-1,n-k)
F 分布
当 F≥Fα (V组间,V组内)时,p≤α ,拒绝H0,可认 为处理因素效应间差别有统计学意义; 当 F < Fα (V组间,V组内)时, p > α,不拒绝H0, 尚不能认为处理因素效应间差别有统计学意义
四、多个样本均数间的多重比较
例
在方差分析的基础上,对不同大鼠模型的 IL-2水平进行SNK法的多重比较。 先将样本均数从小到大排序,对比组次从1-4
均数排序(从小到大) 处理组(原组号) 均 例 数: 数: 甲 0.2913 8 1 乙 1.0200 8 2 3 丙 2.1488 8 丁 2.2650 8 4
一、方差分析的基本思想
SS总=SS组间+SS组内
组内变异(SS组内):随机误差 组间变异(SS组间) :处理因素+随机误差 当H0 为真时,由于处理因素不起作用,组间 变异只受随机误差的影响。此时,组间变异 与组内变异相差不能太大,有 MS组间 SS组间 k 1 1 MS组内 SS组内 n k
二、完全随机设计方差分析步骤
注意!
1. 如果方差分析有差别,只能说明总体间 有差别,各组中哪两组间是否有差别, 还要进一步做多重比较 2.如果方差分析无差别,分析结束
四、多个样本均数间的多重比较
多重比较(Multiple Comparison),又称两两 比较 假如每次t检验犯第一类错误的概率是0.05,那 么要完全地进行比较,犯第一类错误的概率是 1-(1-a)k。
3、使用近似F检验
t检验也类似!!!
方差分析的基本思想
例 在大肠湿热征模型研究中,将32只大鼠 随机分成4组,每组8值,分别为正常对照 组(甲组)、大肠杆菌模型组(乙组)、轮 状病毒模型组(丙组)和大肠杆菌加轮状病 毒混合模型组(丁组)。测得大鼠血清白细 胞介素IL-2水平见下表。试比较不同大鼠 模型的血清IL-2水平是否有差别。
处理因素:不同的药物
水平:0.5ml65%乙醇,
0.2g生药/0.5ml65%乙醇
问题的提出
一种新的降血脂药, 120 人分为安慰剂组,用 药 组 1(2.4g) , 用 药 组 2(4.8g) , 用 药 组 3(7.2g)。实验结束后观察血脂水平。
安慰剂组
X =3.43mmol/l
用药组1
排序号(组次):
四、多个样本均数间的多重比较
1)建立假设,确定检验水准 H0: μA=μB H1: μA≠μB α=0.05 2)计算统计量q值。 由于各组的例数都一样,均为8例,而且在进行方差 分析时,已知MS组内=0.175,任意两个比较组的 标准误均为:
s x A x B MS 组内 1 1 ( ) 0.1479 2 n A nB
二、完全随机设计方差分析步骤
1、 建立检验假设和确定检验水准 H0: 1 2 3 ( 四组血清IL-2水平总体均
4
数相等)
H1:四组血清IL-2水平总体均数不等或不全相等 α=0.05 2、计算F值
直接计算(软件) 或间接估计(查表)
3、确定P值和作出推断结论
二、完全随机设计方差分析步骤
变异来源 组间 组内 总
SS 21.429 v 3 MS 7.143 F P
40.766 4.906 26.335 28 31 0.175
<0.01
二、完全随机设计方差分析步骤
结论:
按α=0.05的水准,拒绝H0,接受H1,四
组均数之间的差异有统计学意义,可认
为四个模型组IL-2平均水平总体有差别。
第八章 方差分析
Analysis of Variance
重点掌握
方差分析的基本思想
完全随机设计、随机区组设计方差分 析和多重比较结果的合理解释
总体
同质、个体变异
随机 抽样
样本 代表性、抽样误差
总体参数 未知
样本统计量已知
统计 推断
风 险
假设检验的原理和步骤
“小概率反证法”思想 如果对总体的H0是真实的,那么不利于或不能支 持这一假设的事件A(小概率事件)在一次试验 中几乎不可能发生的;要是在一次试验中A竟然 发生了,就有理由怀疑该假设的真实性,拒绝H0
四、多个样本均数间的多重比较
3)确定p值做出推断结论
比较组
1与4 1与3 1与2 2与4 2与3 3与4
XA XB
a
4 3 2 3 2 2
q值
13.345 12.559 4.927 8.418 7.632 0.786
q0.05(a,28)
3.87 3.51 2.90 3.51 2.90 2.90
p
<0.05 <0.05 <0.05 <0.05 <0.05 >0.05
1.974 1.858 0.729 1.245 1.129 0.116
四、多个样本均数间的多重比较
(二)LSD-t检验,又称最小显著差异法 主要用于确证性实验研究 设计阶段就根据研究目的或专业知识决定某些均 数间的两两比较,如多个处理组与对照组的比较, 处理后不同时间与处理前的比较等 计算公式
四、多个样本均数间的多重比较
3)确定P值,做出推断结论 v=N-K=32-4=28,查t界值表,得:
比较组
| XA XB |
t值
P < 0.001
甲与乙 0.7287 3.4849 0.001< P <0.002 甲与丙 1.8575 8.8833
第i个处理 水平 每个水平 组的例数 第i组的 均数
2
总均数
方差分析的基本思想
SS总=SS组内+SS组间
随机误差
组内变异
SS组内
SS总
总变异
随机误差+处理的作用(可能 存在)
组间变异
SS组间
方差分析表
变异来源 组间 组内 总 SS SS组间 SS组内 SS总 v k-1 N-k N-1
组间方差,又 称组间均方 (MS组间)
的比较,多个组与一个特定组间的比较或者特
定组间的比较(Planned Multiple
Comparison) 方差分析得到有差别的结论后多个组之间的 相互比较的探索性研究(Post Hoc)
四、多个样本均数间的多重比较
两两比较方法
多个样本均数间每 两个均数的比较 多个实验组分别与对照组 均数间的两两比较
MS SS组间/v组间 SS组内/v组内 F MS组间 MS组内
组内方差,又称 组内均方 (MS )
方差分析的原理
方差比的分布!
MS组间 SS组间 k 1 F MS组内 SS组内 n k
MS Between F ~ F( 1 , 2 ) MSWithin
MS组内 = MS组间
SX AXB MS 组内 1 1 ( ) 2 n A nB
当两样本n相等时 自由度=υ组内
S X A X B MS 组内 /n
四、多个样本均数间的多重比较
计算步骤 1. 将多个样本均数由小到大顺序排列 2. 按照两均数组合原则,计算出每两个样本均数 比较的统计量q值 3. 根据误差的自由度和两样本间隔组数a,查q界 值表得q界值。注意:组数a的计算方法:由于 各样本均数已由小到大顺序排列,因此,相邻 两样本均数比较时,组数a=2,中间间隔一个 样本均数时,组数a=3,间隔两个样本均数时, 组数a=4,余类推
(1)建立假设和确定显著性水平
(2)计算检验统计量 (3)确定P值和做出推断
可能发生的两类错误
检验结果 真实情况
拒绝H0
不拒绝H0
H0 成立
H1成立
I型错误(a )
推断正确(1-a )
II 型错误 ( b ) 推断正确(1-b)
问题的提出
t检验实例
外用中药搽剂骨肌康对小鼠琼脂肉芽的抑制作用。 给予对照组0.5ml65%乙醇,试验组施用大剂量骨肌 康,给予0.2g生药/0.5ml65%乙醇,观察两组的肉芽 肿重。
处 理 因 素
水平1 水平2
水平k
方差分析的应用条件
应用条件 1、各个样本是相互独立的随机样本; 2、各个样本来自正态总体; 3、各个处理组的总体方差相等,即方差齐。
t检验的应用条件??
方差分析的应用条件
不满足应用条件时处理方法
1、进行变量变换,以达到方差齐或 正态的要求 2、采用非参数法(秩和检验)
?
X =2.72mmol/l
Leabharlann Baidu
用药组2
X =2.70mmol/l
用药组3
X =1.97mmol/l
问题的提出
进行一次假设检验,犯I型错误的概率:a
进行多次(k)假设检验,犯I型错误的概率:
1-(1-a)k 组数为3, k=3, 组数为4, k=6, 1-(1-0.05)k=0.1426 1-(1-0.05)k=0.2649
1 0.95 0.2649
6
为避免增大犯第一类错误的概率,不能使用 t 检验,而应使用专门的方法。
四、多个样本均数间的多重比较
多重比较的方法较多,如SPSS软件中就
有18种方法,应根据资料特点(方差是
否齐性)和研究目的来选用。
四、多个样本均数间的多重比较
分类
事先计划好的多个试验组与一个对照组之间
| XA XB | t SX AXB
SX AXB
组内=N-k
1 1 MS组内 ( ) n A nB
自由度=υ
四、多个样本均数间的多重比较
LSD法实际上是一种t检验法,主要区别在
于计算标准误中的合并方差及自由度的不
同
仍按算得的t值查附表2,t界值表,作出 推断结论
四、多个样本均数间的多重比较
例 在方差分析的基础上,对不同大鼠模型
的IL-2水平进行多重比较。 1)建立假设,确定检验水准 H0: μA=μB
H1: μA≠μB
a 0.05
四、多个样本均数间的多重比较
2)计算统计量t值 由于各组的例数都一样,均为8例,而且在进行 方差分析时,已知MS组内=0.175。故任意两个比较组
的标准误均为:
组数为5, k=10, 1-(1-0.05)k=0.4013
问题的提出
t检验的局限性
比较两组样本均数
(单因素两水平)
方差分析
方差分析(Analysis of Variance,简写为
ANOVA )
由英国统计学家R.A.Fisher在1918年提出
F检验
方差分析的原理
单因素方差分析/完全随机设计方差分析 (one-way ANOVA):研究一个处理因素 (有k个水平),将n个观察单位随机分配到k 个水平,观察水平间效应的差别
SNK q检验
LSD -t检验
四、多个样本均数间的多重比较
(一)SNK-q检验
可对所有对照组及处理组的样本均数进行
两两比较
适用于探索性研究,在研究设计阶段未预
先考虑或未预料到,经数据结果的提示后
才决定的多个均数间每两个的事后比较
四、多个样本均数间的多重比较
计算公式
| XA XB | q S X AXB
甲与丁 1.9737 9.4390
乙与丙 1.1288 5.3984 乙与丁 1.2450 5.9541 丙与丁 0.1162 0.5557
SS 组内 (xij x i )
i j
2
第i个处理 水平
每个水平 组的第j例
任一 观测值
第i个处 理组的均 数
组间变异 各水平处理组的均值不同
组间变异
不同组间的血清IL-2水平不同
原因:处理因素的效应(如果存在的话);随机误
差组间变异
SS组间 ni ( xi x)
方差
SS/(n-1)
消除n 的 影响
总变异
所有观察值几乎不同,各观察值与 总体均数间的差异为总变异
SS总 ( xij x)
i j
第i个处理 水平 每个水平 组的第j例
2
v总 =n 1
总均数
任一 观测值
组内变异 同一水平处理组,各观测值不完全相等
组内变异
同组内的血清IL-2水平不一致 原因是不同个体的随机误差
i列, i =1,2..k,在此 k=4,处理组数
总例数
j 行, j =1,2…,ni,
在此j=8
总例数
第 i个 处理 组的 样本 均数
总 均 数
总变异 所有个体的血清IL-2水平几乎都不同
回顾:正态分布资料的离散趋势指标
SS (X X )
离均差 平方和
2
变异度
总例数n(自由度n-1)
F
MS组间 MS组内
1
处理因素 无效
MSW
MSB
处理因素
MS组内
F
MS组间 MS组内
1
MS组间
构造检验的统计量(F 分布)
构造检验的统计量(F 分布)
若均值相等, F=MS组间/MS组内 1
0
拒绝H0 不能拒绝H0
a
F
Fa(k-1,n-k)
F 分布
当 F≥Fα (V组间,V组内)时,p≤α ,拒绝H0,可认 为处理因素效应间差别有统计学意义; 当 F < Fα (V组间,V组内)时, p > α,不拒绝H0, 尚不能认为处理因素效应间差别有统计学意义
四、多个样本均数间的多重比较
例
在方差分析的基础上,对不同大鼠模型的 IL-2水平进行SNK法的多重比较。 先将样本均数从小到大排序,对比组次从1-4
均数排序(从小到大) 处理组(原组号) 均 例 数: 数: 甲 0.2913 8 1 乙 1.0200 8 2 3 丙 2.1488 8 丁 2.2650 8 4
一、方差分析的基本思想
SS总=SS组间+SS组内
组内变异(SS组内):随机误差 组间变异(SS组间) :处理因素+随机误差 当H0 为真时,由于处理因素不起作用,组间 变异只受随机误差的影响。此时,组间变异 与组内变异相差不能太大,有 MS组间 SS组间 k 1 1 MS组内 SS组内 n k
二、完全随机设计方差分析步骤
注意!
1. 如果方差分析有差别,只能说明总体间 有差别,各组中哪两组间是否有差别, 还要进一步做多重比较 2.如果方差分析无差别,分析结束
四、多个样本均数间的多重比较
多重比较(Multiple Comparison),又称两两 比较 假如每次t检验犯第一类错误的概率是0.05,那 么要完全地进行比较,犯第一类错误的概率是 1-(1-a)k。
3、使用近似F检验
t检验也类似!!!
方差分析的基本思想
例 在大肠湿热征模型研究中,将32只大鼠 随机分成4组,每组8值,分别为正常对照 组(甲组)、大肠杆菌模型组(乙组)、轮 状病毒模型组(丙组)和大肠杆菌加轮状病 毒混合模型组(丁组)。测得大鼠血清白细 胞介素IL-2水平见下表。试比较不同大鼠 模型的血清IL-2水平是否有差别。
处理因素:不同的药物
水平:0.5ml65%乙醇,
0.2g生药/0.5ml65%乙醇
问题的提出
一种新的降血脂药, 120 人分为安慰剂组,用 药 组 1(2.4g) , 用 药 组 2(4.8g) , 用 药 组 3(7.2g)。实验结束后观察血脂水平。
安慰剂组
X =3.43mmol/l
用药组1
排序号(组次):
四、多个样本均数间的多重比较
1)建立假设,确定检验水准 H0: μA=μB H1: μA≠μB α=0.05 2)计算统计量q值。 由于各组的例数都一样,均为8例,而且在进行方差 分析时,已知MS组内=0.175,任意两个比较组的 标准误均为:
s x A x B MS 组内 1 1 ( ) 0.1479 2 n A nB
二、完全随机设计方差分析步骤
1、 建立检验假设和确定检验水准 H0: 1 2 3 ( 四组血清IL-2水平总体均
4
数相等)
H1:四组血清IL-2水平总体均数不等或不全相等 α=0.05 2、计算F值
直接计算(软件) 或间接估计(查表)
3、确定P值和作出推断结论
二、完全随机设计方差分析步骤
变异来源 组间 组内 总
SS 21.429 v 3 MS 7.143 F P
40.766 4.906 26.335 28 31 0.175
<0.01
二、完全随机设计方差分析步骤
结论:
按α=0.05的水准,拒绝H0,接受H1,四
组均数之间的差异有统计学意义,可认
为四个模型组IL-2平均水平总体有差别。
第八章 方差分析
Analysis of Variance
重点掌握
方差分析的基本思想
完全随机设计、随机区组设计方差分 析和多重比较结果的合理解释
总体
同质、个体变异
随机 抽样
样本 代表性、抽样误差
总体参数 未知
样本统计量已知
统计 推断
风 险
假设检验的原理和步骤
“小概率反证法”思想 如果对总体的H0是真实的,那么不利于或不能支 持这一假设的事件A(小概率事件)在一次试验 中几乎不可能发生的;要是在一次试验中A竟然 发生了,就有理由怀疑该假设的真实性,拒绝H0
四、多个样本均数间的多重比较
3)确定p值做出推断结论
比较组
1与4 1与3 1与2 2与4 2与3 3与4
XA XB
a
4 3 2 3 2 2
q值
13.345 12.559 4.927 8.418 7.632 0.786
q0.05(a,28)
3.87 3.51 2.90 3.51 2.90 2.90
p
<0.05 <0.05 <0.05 <0.05 <0.05 >0.05
1.974 1.858 0.729 1.245 1.129 0.116
四、多个样本均数间的多重比较
(二)LSD-t检验,又称最小显著差异法 主要用于确证性实验研究 设计阶段就根据研究目的或专业知识决定某些均 数间的两两比较,如多个处理组与对照组的比较, 处理后不同时间与处理前的比较等 计算公式