方差分析(F检验)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学
2014-8-12 18
放置不同时间的血糖浓度
•
放置不同时间的血糖浓度
受试者号
(区组) 0 1 5.27 2 5.27 3 5.88 4 5.44 5 5.66 6 6.22 7 5.83 8 5.27
放置时间(分) 45 90 135 5.27 4.94 4.61 5.22 4.88 4.66 5.83 5.38 5.00 5.38 5.27 5.00 5.44 5.38 4.88 6.22 5.61 5.22 5.72 5.38 4.88 5.11 5.00 4.44
ms组内
ss 组内
(n i 1)
ni 各样本含量
医学统计学
2014-8-12 11
F
ms组间 ms组内
T E F E
[问题 2] 当处理因素不起作用时,从理论上 来说 F 值是多大? [答案 2] 当处理因素不起作用时,从理论上 来说 T = 0 , T + E = E, MS 组 间 =MS 组 内 , F=1。 当处理因素起作用时,从理论上来说 T>0, T + E > E, F > 1, 多大的 F 值才认为均数间的差异 在统计学上有显著性意义,可根据自由度查F值表, 确定P值后作出推断。 医学统计学
2014-8-12 12
五、方差分析的方法
根据实验设计方法不同,完全随机设计(单 因素)、随机区组设计(双因素)、析因设计、 拉丁方设计和正交设计等资料应选用不同的方 差分析方法。
医学统计学
2014-8-12 13
[问题 1] 右边 资料是用何种实验设 计方法进行实验所得 资料?
15例患者体温降至正常所需要的天数 甲法 5 5 5 7 7 乙法 5 5 7 7 7 丙法 7 9 9 9 9
F 6.5
确定P值:查F值表, 1为组间自由度 2为组内自由度 F0.05(2,12)=3.88, F0.01(2,12)=6.93, 本例F=6.5, 3.88<6.5<6.93, 故0.05>P>0.01。
医学统计学
2014-8-12 17
随机区组设计资料 方差分析
研究酵解作用对血糖 受试者号 放置时间(分) 浓度的影响,从8名健康 45 90 135 人中抽取了血液并制备成 (区组) 0 1 5.27 5.27 4.94 4.61 血滤液,每个受试者的血 2 5.27 5.22 4.88 4.66 滤液分成四份,再随机把 3 5.88 5.83 5.38 5.00 4 5.44 5.38 5.27 5.00 4份血液分别放置0、45、 5 5.66 5.44 5.38 4.88 90、135分钟后测定其血 6 6.22 6.22 5.61 5.22 糖浓度,试分析放置不同 7 5.83 5.72 5.38 4.88 时间的血糖浓度有无变化。 8 5.27 5.11 5.00 4.44
2014-8-12
15
完全随机设计多个样本均数比较的方差分析公式
变异来源
总
SS
2
C
C
N—1
MS
F
i j
组间
I
( xij ) 2
j
k—1
S S组间
ni
组间
组内
MS组间 MS组内
组内
SS总 SS组间
N—k
SS组内
医学统计学
2014-8-12
16
变异来源 组 间 组 内
方差分析表 SS v MS 20.8 2 10.4 19.2 12 1.6
2014-8-12 5
医学统计学
15例患者体温降至 正常所需要的天数 甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 9
15例患者体温降至正 常所需要的天数不尽相 同,如果把每个患者所 需的天数与总均数的差 异之和称为总变异,总 变异用离均差平方和 (SS)来描述。
SS总 ( x x )
[答案 1] 用 完全随机设计(单因 素)方法进行实验所 得资料。
医学统计学
2014-8-12 14
1、完全随机设计(单因素)资料的方差分析 H0: 1 2 3 1 2 3或不完全相等 H1:
0.05
( x ) 2 105 2 c 735 N 15
例1
不同点是例1只有一 例2 现有8 名贫血患儿治疗前后血红蛋白含量资料如下: 8 名贫血患儿治疗前后血红蛋白含量(g/L) 个处理因素,例2有两 1个月 3个月 ∑b 个处理因素,因此总的 患者编号` 治疗前 1 115 104 120 339 变异来源可分解为:
SS总=SS因素1+SS因素2+SS误差 2 3 4 5 6 7 8 107 98 110 90 117 115 115 110 109 115 109 115 120 123 130 125 130 125 115 135 127 347 332 355 324 347 370 365
医学统计学
[案例 2] 现有8 名贫血患儿治疗前后血红蛋白含量 资料如下: 8 名贫血患儿治疗前后血红蛋白含量(g/L) 患者编号` 治疗前 1个月 3个月 ∑b 1 115 104 120 339 2 107 110 130 347 3 98 109 125 332 4 110 115 130 355 5 90 109 125 324 6 117 115 115 347 7 115 120 135 370 8 115 123 127 365 ni 8 8 8 N = 24 867.0 905.0 1007.0 X X 2779 x 108.4 113.1 125.9 2 X 94617.0 102657.0 127029.0 X 324303
ss总 ( x x ) 2 x 2 c 775 735 40
ss 组间 ( x i ) 2 ni (x X ) c ni
2
29 2 33 2 43 2 735 20.8 5 5 5
ss组内 ss总 ss组间 40 20.8 19.2
医学统计学
SS 组内 ( xi xi )
2014-8-12
2
7
15例患者体温降至 正常所需要的天数 甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 9
2、由于治疗方法不同而引 起,即组间变异引起。
组间变异,即由于各组 治疗方法(处理因素)不同 使得各组均数大小不等。
医学统计学
随机区组设计资料的类型 1、单因素多水平多组配对设计 资料。 2、多因素单水平多组配对设计 资料 3、双因素多水平设计资料。 配对 的方法: 1、同体配对研究 (1)处理前后配对研究 (2)同体左右配对研究 2、异体配对研究 (1)动物 :种系、性别、胎 次相同,体重±10%。 (2)人群:种族、性别、病种 相同,病情或并发症相似,年龄 ±5岁。
2014-8-12 21
四种大鼠注射不同剂量雌激素 (mg/Kg)后子宫重量如下表,试进行分析。 鼠 种 剂 量 0.1 0.2 0.4 0.8 A 98 106 116 145 B 40 42 68 115 C 56 70 111 133 D 38 42 63 87
医学统计学
2014-8-12 22
2014-8-12 19
随机区组设计资料变异来源分析
总变异=处理组间变异+区组间变异+误差变异 SS总=SS处理组间+SS区组间+SS误差
医学统计学
2014-8-12 20
不同治疗方法大鼠体重增重变化 常规疗法 甲 法 乙 区组号 1 2 3 4 5 6 7 8 9 10
医学统计学
法
治疗前 治疗后 治疗前 治疗后 治疗前 治疗后 160 240 160 264 165 290 178 253 176 306 172 317 156 262 158 258 158 288 164 272 164 284 164 298 172 265 172 290 174 320 168 277 168 286 170 305 165 282 168 290 168 310 170 290 172 300 168 312 164 276 162 280 162 290 174 268 176 296 174 300
医学统计学
2
2014-8-12
6
15例患者体温降至 正常所需要的天数 甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 9
[问题 1]造成总变异的 原因是什么?
[答案 1] 造成总变异的 原因有两种可能: 1、由于个体差异的存在 而引起,即组内变异引起。 组内变异,即由于随机 误差的原因使得各组内部患 者体温降至正常所需要的天 数各不相等。
医学统计学
2014-8-12 3
三、方差分析的条件
1、被比较的资料要有可比性。 2、被比较的资料要有实际意义。 3、被比较的资料要呈正态分布。 4、被比较的资料各组方差齐同。
医学统计学
2014-8-12 4
四、方差分析的基本思想
[例 1] 某医院用三种不同疗法治疗同种疾病,以体温降至正 常所需要的天数为指标,15例患者体温降至正常所需要的天数资 料如下: 15例患者体温降至正常所需要的天数 甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 9 29 33 43 x 105 xi 5 5 5 n = 15 ni 6.6 8.6 x = 7 x 5.8 2 229.0 373.0 x 2 775 x i 173.0
24
医学统计学
2014-8-12
随机区组设计(双因素)资料的方差分析方法为: Ho:不同时间HB含量相同, H1:不同时间HB含量不同或部分不同。 H0:不同的受试者HB含量相同, H1:不同的受试者HB含量不同或部分不同。
医学统计学
2014-8-12 25
0.05
[例 2] 现有8 名贫血患儿治疗 前后血红蛋白含量资料如下: ss总 x c 324303 321785 2518
医学统计学
2014-8-12 10
因组间变异数大小与组数(组间自由度K-1)有关,故用 组间变异数除以自由度所得组间均方来表示组间变异。
ms组间
ss组间 k 1
k=组数
因组内变异数大小与各样本含量大小即组内自由度∑(ni –1) 有关,故用组内变异数除以组内自由度所得组内均方来表示 组内变异。
S
医学统计学
2
(x x) n 1
2
x)2 x n 2 (
n 1
2014-8-12
2
二、方差分析的用途
1、对两组或多组计量资料的均数差异进行 显著性检验。 2、可用于完全随机设计(单因素)、随机 区组设计(双因素)、析因设计、拉丁方 设计和正交设计等资料的统计处理。 3、可对两因素间交互作用差异进行显著性 检验。 4、进行方差齐性检验。
第六节
方差分析(F检验)
医学统计学
2014-8-12 1
一、方差分析的概念
方差分析(ANOVA)又称变异数分析或F检 验,其目的是推断两组或多组资料的总体均数是否 相同,检验两个或多个样本均数的差异是否有统计 学意义。 2 ( x x) 离均差平方和又称为变异数。
方差的概念:方差即为标准差的平方,又称为 平均离均差平方和,简称“均方”。
SS组间 ni ( xi x)
2
医学统计学
2014-8-12 8
总变异与组ห้องสมุดไป่ตู้变异和组内变异的关系为:
总变异=组间变异 + 组内变异
SS总=SS组间+ SS组内 v总=v组间+ v组内
医学统计学
2014-8-12 9
总变异来源分析
处理因素 治疗方法 抽样误差 个体差异 组间变异
总变异
组内变异
I
2
2014-8-12
23
15例患者体温降至正常 所需要的天数 甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 9
[ 问题 2] 例2 的总变异来源与例 1 有何异同点? [ 答案 2] 共同点是其总变异来源都是来自于 处理因素变异和抽样误差变异,这不仅是它们 的共同点,而且是所有方差分析资料总变异来 源的共同点。
医学统计学
15例患者体温降至正常 所需要的天数 甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 9 x i 29 31 43 x 105 ni 5 5 5 n = 15 xi 5.8 6.6 8.6 x = 7 2 2 xi x 775 173.0 229.0 373
2014-8-12 18
放置不同时间的血糖浓度
•
放置不同时间的血糖浓度
受试者号
(区组) 0 1 5.27 2 5.27 3 5.88 4 5.44 5 5.66 6 6.22 7 5.83 8 5.27
放置时间(分) 45 90 135 5.27 4.94 4.61 5.22 4.88 4.66 5.83 5.38 5.00 5.38 5.27 5.00 5.44 5.38 4.88 6.22 5.61 5.22 5.72 5.38 4.88 5.11 5.00 4.44
ms组内
ss 组内
(n i 1)
ni 各样本含量
医学统计学
2014-8-12 11
F
ms组间 ms组内
T E F E
[问题 2] 当处理因素不起作用时,从理论上 来说 F 值是多大? [答案 2] 当处理因素不起作用时,从理论上 来说 T = 0 , T + E = E, MS 组 间 =MS 组 内 , F=1。 当处理因素起作用时,从理论上来说 T>0, T + E > E, F > 1, 多大的 F 值才认为均数间的差异 在统计学上有显著性意义,可根据自由度查F值表, 确定P值后作出推断。 医学统计学
2014-8-12 12
五、方差分析的方法
根据实验设计方法不同,完全随机设计(单 因素)、随机区组设计(双因素)、析因设计、 拉丁方设计和正交设计等资料应选用不同的方 差分析方法。
医学统计学
2014-8-12 13
[问题 1] 右边 资料是用何种实验设 计方法进行实验所得 资料?
15例患者体温降至正常所需要的天数 甲法 5 5 5 7 7 乙法 5 5 7 7 7 丙法 7 9 9 9 9
F 6.5
确定P值:查F值表, 1为组间自由度 2为组内自由度 F0.05(2,12)=3.88, F0.01(2,12)=6.93, 本例F=6.5, 3.88<6.5<6.93, 故0.05>P>0.01。
医学统计学
2014-8-12 17
随机区组设计资料 方差分析
研究酵解作用对血糖 受试者号 放置时间(分) 浓度的影响,从8名健康 45 90 135 人中抽取了血液并制备成 (区组) 0 1 5.27 5.27 4.94 4.61 血滤液,每个受试者的血 2 5.27 5.22 4.88 4.66 滤液分成四份,再随机把 3 5.88 5.83 5.38 5.00 4 5.44 5.38 5.27 5.00 4份血液分别放置0、45、 5 5.66 5.44 5.38 4.88 90、135分钟后测定其血 6 6.22 6.22 5.61 5.22 糖浓度,试分析放置不同 7 5.83 5.72 5.38 4.88 时间的血糖浓度有无变化。 8 5.27 5.11 5.00 4.44
2014-8-12
15
完全随机设计多个样本均数比较的方差分析公式
变异来源
总
SS
2
C
C
N—1
MS
F
i j
组间
I
( xij ) 2
j
k—1
S S组间
ni
组间
组内
MS组间 MS组内
组内
SS总 SS组间
N—k
SS组内
医学统计学
2014-8-12
16
变异来源 组 间 组 内
方差分析表 SS v MS 20.8 2 10.4 19.2 12 1.6
2014-8-12 5
医学统计学
15例患者体温降至 正常所需要的天数 甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 9
15例患者体温降至正 常所需要的天数不尽相 同,如果把每个患者所 需的天数与总均数的差 异之和称为总变异,总 变异用离均差平方和 (SS)来描述。
SS总 ( x x )
[答案 1] 用 完全随机设计(单因 素)方法进行实验所 得资料。
医学统计学
2014-8-12 14
1、完全随机设计(单因素)资料的方差分析 H0: 1 2 3 1 2 3或不完全相等 H1:
0.05
( x ) 2 105 2 c 735 N 15
例1
不同点是例1只有一 例2 现有8 名贫血患儿治疗前后血红蛋白含量资料如下: 8 名贫血患儿治疗前后血红蛋白含量(g/L) 个处理因素,例2有两 1个月 3个月 ∑b 个处理因素,因此总的 患者编号` 治疗前 1 115 104 120 339 变异来源可分解为:
SS总=SS因素1+SS因素2+SS误差 2 3 4 5 6 7 8 107 98 110 90 117 115 115 110 109 115 109 115 120 123 130 125 130 125 115 135 127 347 332 355 324 347 370 365
医学统计学
[案例 2] 现有8 名贫血患儿治疗前后血红蛋白含量 资料如下: 8 名贫血患儿治疗前后血红蛋白含量(g/L) 患者编号` 治疗前 1个月 3个月 ∑b 1 115 104 120 339 2 107 110 130 347 3 98 109 125 332 4 110 115 130 355 5 90 109 125 324 6 117 115 115 347 7 115 120 135 370 8 115 123 127 365 ni 8 8 8 N = 24 867.0 905.0 1007.0 X X 2779 x 108.4 113.1 125.9 2 X 94617.0 102657.0 127029.0 X 324303
ss总 ( x x ) 2 x 2 c 775 735 40
ss 组间 ( x i ) 2 ni (x X ) c ni
2
29 2 33 2 43 2 735 20.8 5 5 5
ss组内 ss总 ss组间 40 20.8 19.2
医学统计学
SS 组内 ( xi xi )
2014-8-12
2
7
15例患者体温降至 正常所需要的天数 甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 9
2、由于治疗方法不同而引 起,即组间变异引起。
组间变异,即由于各组 治疗方法(处理因素)不同 使得各组均数大小不等。
医学统计学
随机区组设计资料的类型 1、单因素多水平多组配对设计 资料。 2、多因素单水平多组配对设计 资料 3、双因素多水平设计资料。 配对 的方法: 1、同体配对研究 (1)处理前后配对研究 (2)同体左右配对研究 2、异体配对研究 (1)动物 :种系、性别、胎 次相同,体重±10%。 (2)人群:种族、性别、病种 相同,病情或并发症相似,年龄 ±5岁。
2014-8-12 21
四种大鼠注射不同剂量雌激素 (mg/Kg)后子宫重量如下表,试进行分析。 鼠 种 剂 量 0.1 0.2 0.4 0.8 A 98 106 116 145 B 40 42 68 115 C 56 70 111 133 D 38 42 63 87
医学统计学
2014-8-12 22
2014-8-12 19
随机区组设计资料变异来源分析
总变异=处理组间变异+区组间变异+误差变异 SS总=SS处理组间+SS区组间+SS误差
医学统计学
2014-8-12 20
不同治疗方法大鼠体重增重变化 常规疗法 甲 法 乙 区组号 1 2 3 4 5 6 7 8 9 10
医学统计学
法
治疗前 治疗后 治疗前 治疗后 治疗前 治疗后 160 240 160 264 165 290 178 253 176 306 172 317 156 262 158 258 158 288 164 272 164 284 164 298 172 265 172 290 174 320 168 277 168 286 170 305 165 282 168 290 168 310 170 290 172 300 168 312 164 276 162 280 162 290 174 268 176 296 174 300
医学统计学
2
2014-8-12
6
15例患者体温降至 正常所需要的天数 甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 9
[问题 1]造成总变异的 原因是什么?
[答案 1] 造成总变异的 原因有两种可能: 1、由于个体差异的存在 而引起,即组内变异引起。 组内变异,即由于随机 误差的原因使得各组内部患 者体温降至正常所需要的天 数各不相等。
医学统计学
2014-8-12 3
三、方差分析的条件
1、被比较的资料要有可比性。 2、被比较的资料要有实际意义。 3、被比较的资料要呈正态分布。 4、被比较的资料各组方差齐同。
医学统计学
2014-8-12 4
四、方差分析的基本思想
[例 1] 某医院用三种不同疗法治疗同种疾病,以体温降至正 常所需要的天数为指标,15例患者体温降至正常所需要的天数资 料如下: 15例患者体温降至正常所需要的天数 甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 9 29 33 43 x 105 xi 5 5 5 n = 15 ni 6.6 8.6 x = 7 x 5.8 2 229.0 373.0 x 2 775 x i 173.0
24
医学统计学
2014-8-12
随机区组设计(双因素)资料的方差分析方法为: Ho:不同时间HB含量相同, H1:不同时间HB含量不同或部分不同。 H0:不同的受试者HB含量相同, H1:不同的受试者HB含量不同或部分不同。
医学统计学
2014-8-12 25
0.05
[例 2] 现有8 名贫血患儿治疗 前后血红蛋白含量资料如下: ss总 x c 324303 321785 2518
医学统计学
2014-8-12 10
因组间变异数大小与组数(组间自由度K-1)有关,故用 组间变异数除以自由度所得组间均方来表示组间变异。
ms组间
ss组间 k 1
k=组数
因组内变异数大小与各样本含量大小即组内自由度∑(ni –1) 有关,故用组内变异数除以组内自由度所得组内均方来表示 组内变异。
S
医学统计学
2
(x x) n 1
2
x)2 x n 2 (
n 1
2014-8-12
2
二、方差分析的用途
1、对两组或多组计量资料的均数差异进行 显著性检验。 2、可用于完全随机设计(单因素)、随机 区组设计(双因素)、析因设计、拉丁方 设计和正交设计等资料的统计处理。 3、可对两因素间交互作用差异进行显著性 检验。 4、进行方差齐性检验。
第六节
方差分析(F检验)
医学统计学
2014-8-12 1
一、方差分析的概念
方差分析(ANOVA)又称变异数分析或F检 验,其目的是推断两组或多组资料的总体均数是否 相同,检验两个或多个样本均数的差异是否有统计 学意义。 2 ( x x) 离均差平方和又称为变异数。
方差的概念:方差即为标准差的平方,又称为 平均离均差平方和,简称“均方”。
SS组间 ni ( xi x)
2
医学统计学
2014-8-12 8
总变异与组ห้องสมุดไป่ตู้变异和组内变异的关系为:
总变异=组间变异 + 组内变异
SS总=SS组间+ SS组内 v总=v组间+ v组内
医学统计学
2014-8-12 9
总变异来源分析
处理因素 治疗方法 抽样误差 个体差异 组间变异
总变异
组内变异
I
2
2014-8-12
23
15例患者体温降至正常 所需要的天数 甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 9
[ 问题 2] 例2 的总变异来源与例 1 有何异同点? [ 答案 2] 共同点是其总变异来源都是来自于 处理因素变异和抽样误差变异,这不仅是它们 的共同点,而且是所有方差分析资料总变异来 源的共同点。
医学统计学
15例患者体温降至正常 所需要的天数 甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 9 x i 29 31 43 x 105 ni 5 5 5 n = 15 xi 5.8 6.6 8.6 x = 7 2 2 xi x 775 173.0 229.0 373