方差分析介绍及案例分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
组别(治疗方案) A B C
对比组 A与B
(1)
1与3 1与2 2与3
表 6.6 三个样本均数两两比较的 q 检验
计算SS总,SS组间,和SS组内
? C =(83.70) 2 /60=116.7615
? SS总=184.43-116.76=67.6685
SS组间 ?
36.802
?
28.302 20
? 18.602
? 116.7615?
8.2930
? SS组内=0.91332×19+1.29712×19+
?
0.78002 ×19=59.3747
方差分析的应用条件
? 独立性:各样本是相互独立随机的样本 ? 正态性:各样本都来自正态总体 ? 方差齐性:各样本的总体方差相等
看一个实例
? 例6.6 某地用A、B和C三种方案治疗血红蛋 白含量不满 10g 的婴幼儿贫血患者,治疗一 月后,记录下每名受试者血红蛋白的上升克 数,资料见表 6.3,问三种治疗方案对婴幼儿 贫血的疗效是否相同 ?
1.415 1.297 31.9669
C组
2.1 -0.7
1.9 1.3
1.7 1.1
0.2 0.2
2.0 0.7
1.5 0.9
0.9 0.8
1.1 -0.3
-0.2 0.7
1.3 1.4
所有数据
0.930
1.395
0.78
1.071
11.5626 67.6685
59.3755
变异分解
? 总变异
组间变异 组内变异
? 多个样本均数的两两比较不宜用t检验 ? 如用 t 检验,则第一类错误率将增大,
此时易将无差别的两均数错判为有差别
? ? ' =1-(1-? )m ( m=Ck2=k(k-1)/2)
? 如:三个组的比较 1-(1-0.05)3=0.14,比0.05大多了。
多个样本均数间的两两比较
? 用q检验(又称Student-Newman-Keuls 法,即SNK法),统计量为q:
? 组内=N -k
MS组内=SS组内/(N-k)
方差分析的基本思想
? 抽样误差 ? 本质上的差别 +
(组间差异)
抽样误差 (组内差异)
? 如果三种治疗方案效果相同,也即三组
样本均数来自同一总体(H0:? 1=? 2=? 3),
那么从理论上说组间变异应该等于组内 变异,因为两者均只反映随机误差(包 括个体差异),这时若计算组间均方与 组内均方的比值:
? ? q ? X A ? X B
MS误差 2
?
????
Fra Baidu bibliotek
1 nA
?
1 nB
????
? H0:? A = ? B ,每次对比时两个总体均数相等; ? H1:? A≠?B ,每次对比时两个总体均数不等。 ? ? =0.05。
? 将三个样本均数按从大到小顺序排列并编上组次:
组次
1
23
均数
1.840 1.415 0.930
方差分析
? 方差分析(Analysis of Variance, ANOVA) ? 1928年由英国统计学家R.A. Fisher 首先
提出,为纪念Fisher ,以F 命名,故方 差分析又称为F 检验。
方差分析的优点
? 不受比较组数的限制,可比较多组均数 ? 可同时分析多个因素的作用 ? 可分析因素间的交互作用
? 处理因素只有一个
属于完全随机设计:随机抽样 随机分组 随机试验
C ? ?? X?2 N
SS总 ? ? X 2 ? C
? ? ? SS组间 ?
ni ?
Xi
?
2
X?
?
?
Xi ? 2 ? C ni
SS组内 ? ? si2 ?ni ?1?? SS总 ? SS组间
基本步骤
? 建立检验假设 ? 计算检验统计量(列方差分析表) ? 计算 P 值 ? 下结论
? SS总=SS组间+SS组内
? ?总=?组间+?组内
总变异——SS总(离均差平方和 )
? ? SS总 ? ? ? Xij ? X 2
?总=N-1
组间变异——SS组间
? ? ? SS组间 ? ni Xi ? X 2
?组间=k-1
MS组间 =SS组间/(k-1)
组内变异——SS组内
? ? SS组内 ? ? ? Xi j? X i 2
列方差分析表
变异来源
表 6.5 单因素方差分析表
SS
?
MS
F
总
67.6685
59
组间
8.2930
2
4.1465
3.98
组内(误差) 59.3755
57
1.0417
P 0.0241
界定P值,作结论
? 总自由度为N-1=60-1=59 ? 组间自由度=组数(k)-1=3-1=2 ? 组内自由度=总自由度-组间自由度
F= MS组间 /MS组内
? 则F值在理论上应等于1,但由于抽样误 差的影响,F通常接近1,而并不正好等 于1。相反,若三种疗法效果不同,则 组间变异就会增大,F值则明显大于1, 要大到什么程度才有统计学意义呢?可 通过查附表4 方差分析用F界值表得到P
值,将其与事先规定的? 值比较后作出
判断。
单因素多个样本均数的比较 (analysis of one way variance)
婴幼儿贫血治疗后血红蛋白的增加量(g)
A组 1.8 1.4 0.5 1.2 2.3 2.3 3.7 0.7 2.4 0.5 2.0 1.4 1.5 1.7 2.7 3.0 1.1 3.2 0.9 2.5
均数 标准差 SS
1.840 0.913 15.8482
B组 5.0 2.0 0.2 0.0 0.5 1.6 0.3 3.0 1.9 1.6 1.0 0.0 2.4 3.0 -0.4 0.7 2.0 1.2 1.6 0.7
=59-2=57。
? 查方差分析表得F0.05(2,57)=3.15,F> F0.05(2,57),则P<0.05。
? 故按? =0.05的水准,拒绝H0,接受H1,
故可认为三种治疗方案的治疗效果不一 样。
多个样本均数的两两比较
在方差分析认为多组均数间差异有统计 学意义的基础上,若需了解究竟哪些组 均数之间有差别,还是各组间均有差别, 可用多个样本均数的两两比较(又称多 重比较 multiple comparison)。
建立假设
? H0 : ? A=?B=?C ,三种治疗方案治疗婴幼儿
贫血的疗效相同, ? H1 :三种治疗方案治疗婴幼儿贫血的疗效
不全相同或全不相同。
? ? =0.05
计算基本数据
? Xi
? Xi2
表6.4 方差分析基础数据
A
B
C
36.80
28.30
18.60
83.56
72.01
28.86
总和 83.70 184.43