统计学--第八章方差分析
医学统计学 -第08章 方差分析
第一节 方差分析的基本思想
看一个例子
例8-1 为研究钙离子对体重的影响作用,某研究者将36 只肥胖模型大白鼠随机分为三组,每组12只,分别给 予高脂正常剂量钙(0.5%)、高脂高剂量钙(1.0%)和高 脂高剂量钙(1.5%)三种不同的饲料,喂养9周,测其 喂养前后体重的差值。问三组不同喂养方式下大白鼠 体重改变是否不同?
• 三种喂养方式体重改变的平均值各不相同,这种变异 称为组间变异
•
是组内均值
X
与总均值
i
X
之差的平方和
360
340
组间变异反映了:
320
三种喂养方式的差异(影响), 300
同时也包含了随机误差。
280
260
240
k ni
220
SS组间
(Xi X )2
200
i1 j
180
X甲
X
X乙
X丙
甲
乙
丙
3、组内变异(SS组内,variation within groups)
0.05
2、根据公式计算SS、MS及F值,列于方差分析表内(计 算过程省略)
变异来源 总变异 组间 组内(误差)
完全随机设计的方差分析表
平方和 SS 自由度
均方MS
47758.32
35
31291.67
2
15645.83
16466.65
33
498.99
F值
31.36
3、确定P值,作出判断
分子自由度=k-1=2,分母自由度=n-k=33,查F 界值表(方差分析用)
表 8-1 三种不同喂养方式下大白鼠体重喂养前后差值(g)
正常钙(0.5%) 高剂量钙(1.0%) 高剂量钙(1.5%)
单向方差分析
F 分布曲线
17
F 界值表
5
附表5 F界值表(方差分析用,单侧界值) 上行:P=0.05 下行:P=0.01
分母自由度 υ2
•
分子旳自由度,υ1
1
2
3
4
5
6
161 200 216 225 230 234 1
4052 4999 5403 5625 5764 5859
18.51 19.00 19.16 19.25 19.30 19.33 2
t Yi Yh Se
Yi Yh
,
MS组内(
1 n1
1 n2
)
N a 组内
29
例四个均值旳Bonferroni法比较
设α=α’/c=0.1/6=0.0167,由此t旳临 界值为t(0.0167/2,20)=2.6117
18.5 28.0
t(A: B)
3.48 2.6117, 24 4 20
以F命名,故方差分析 又称 F 检验 (F
test)。用于推断两 个或多种总体均数有 无差别 。
3
方差分析旳优点: 不受比较组数旳限制,可比较多组均数 可同步分析多种原因旳作用 可分析原因间旳交互作用
4
完全随机设计资料(单原因)方差分析 One-way analysis of variance 第一节 方差分析旳基本思想
deviations from mean,SS)反应变异旳大小
10
1. 总变异: 全部测量值之间总
旳变异程度,计算公式
a ni
SS总
Yij Y
2
Y a ni 2 ij
C
i1 j1
i1 j1
N
统计学课后答案(第3版)第8章方差分析习题答案
第八章 方差分析习题答案一、单选1.D ;2.B ;3.A ;4.C ;5.C ;6.C ;7.C ;8.A ;9.B ;10.A二、多选1.ACE ;2.ABD ;3.BE ;4.AD ;5.BCE6.ABCD ;7.ABCDE ;8.ABCE ;9.ACD ;10.ABD三、计算分析题1、运用EXCEL 进行单因素方差分析,有:方差分析:单因素方差分析SUMMARY组 观测数 求和 平均 方差列 1 5 1.21 0.242 2.45E-05列 2 5 1.38 0.276 0.00226列 3 5 1.31 0.262 1.35E-05方差分析差异源 SS df MS F P-value F crit 组间 0.00292 2 0.00146 1.906005 0.191058 3.885294 组内 0.009192 12 0.000766总计 0.012112 14由于P 值=1.906005>05.0=α,不拒绝原假设,没有证据表明3个总体的均值之间有显著差异。
(或用F 值判断,有同样结论)2、运用EXCEL 进行单因素方差分析,有:方差分析:单因素方差分析SUMMARY组 观测数 求和 平均 方差列 1 5 222 44.4 28.3列 2 5 150 30 10列 3 5 213 42.6 15.8方差分析差异源 SS df MS F P-value F crit 组间 615.6 2 307.8 17.06839 0.00031 3.885294 组内 216.4 12 18.03333总计 832 14由于由于P 值=0.00031<05.0=α,拒绝原假设,表明3个总体的均值之间有显著差异。
(或用F 值判断,有同样结论)进一步用LSD 方法见教材P2063、(1)按行依次为:420、2、1.478(第一行);27、142.07(第二行);4256(第三行)。
(2)由于P 值=0.245946>05.0=α,不拒绝原假设,没有证据表明3种方法组装产品数量有显著差异。
第八章:方差分析
SSE xij xi
k ni i 1 j 1
2
计算结果为: SSE = 2708
三个离差平方和的关系
总离差平方和(SST)、组内离差平方和(SSE) 、组间离差平方和 (SSA) 之间的关系:
x
k i 1 j 1
ni
ij
x ni xi x xij x
外包装底色对产品销量是否有显著影响?
市场 北京 上海 深圳 西安 成都 红色 36 35 27 29 38 橙色 28 26 31 30 24 紫色 30 32 28 26 35 蓝色 22 27 20 21 29
什么是方差分析?
【 例 】为了对几个行业的服务质量进行评价,消费者协会 在4个行业分别抽取了不同的企业作为样本。最近一年中消 费者对总共23家企业投诉的次数如下表:
2.
方差分析的基本假定
1. 每个总体都服从正态分布 (每个行业被投诉的次数必须服从正态分布) 2. 各个总体的方差相同 ( 4个行业被投诉次数的方差都相等) 3. 观测值是独立的 (每个行业被投诉的次数与其他行业被投诉的次数独立)
方差分析的基本假设
H 0 : m1 m2 mk H1 : m1 , m2 , , mk 不全相等
2.计算误差
计算全部观测值的均值以及各水平下的组均值 计算总误差 计算组内误差 计算组间误差
计算总误差( SST)
1. 全部观察值 xij 与总平均值 x 的离差平方和 2. 反映全部观察值的离散状况 3. 其计算公式为
SST xij x
k ni i 1 j 1 2
方差分析
差异源
组间 组内
SS
1456.609 2708
石大医学统计学讲义08配伍组设计的方差分析
第八讲配伍组设计的方差分析配伍组设计的多个样本均数的比较可用无重复数据的两因素的方差分析(two-way ANOV A)。
两个因素是指主要的研究因素和配伍组因素。
按这两个因素纵横排列时,每个格子中仅有一个数据,故称无重复数据。
配伍组设计在医学科研中较为常见,例如在实验研究中,将动物按窝别配伍,再随机分配到各个处理组;在观察性别研究中,按年龄、性别或地区配伍来抽取和组成研究因素的各个水平组等等。
例题:某厂医务室测定了10名氟作业工人工前、工中及工后4小时的尿氟浓度(μmol/L),结果见下表。
问氟作业工人三个不同时间的的尿氟浓度有无差别?氟作业工人三个不同时间的的尿氟浓度(μmol/L)工人编号工前工中工后(∑X ij) 190.53142.1287.38320.03288.43163.1765.27316.78347.3763.1668.43178.964175.80166.33210.54552.675100.01144.75194.75439.51646.32126.3365.27237.92773.69138.96200.02412.678105.27126.33100.01331.61986.23121.06105.27312.651060.0173.6958.95192.65(∑X ij)873.751265.901155.893295.54(∑∑X) x87.38126.59115.59109.85均数i( ∑X2ij)88876.98170744.12167659.81427280.91 (∑∑X2)计算步骤:(1)建立假设和和确定检验水准H0:工人三个不同时间的的尿氟浓度相等μ1 = μ2 =μ3H1 :三组总体均数不等或不全相等μ1≠μ2 ≠μ3检验水准α=0.05(2) 计算检验统计量F值本例:校正数 C = (3295.54)2 / 30=362019.463SS总= ∑X2 —C = 427280.91 – 362019.463= 65261.447df总= N-1 = 30-1 = 29不同处理间:893.8182463.36201910)89.115(10)90.1265(10)75.873()X ( 222ij =-++=-=∑∑C nSS 处理 df 处理 = k -1 =3-1 =2 不同区组间:39712.984463.362019...3)87.316(3)03.320()X (22ij =-++=-=∑∑Cn SS 区组 df 区组 = n -1 =10-1 =9 SS 误差= SS 总- SS 处理- SS 区组= 65261.447 - 8182.893 - 39712.984 = 17365.570 df 误差= 29-2-9=18 M S 处理 = SS 处理/ df 处理 =8182.893 / 2 =4091.447 M S 区组 = SS 区组 / df 区组 = 39712.984 / 9 =4412.554M S 误差 =SS 误差/ df 误差 = 17365.570 /18 = 964.754 F 处理 = MS 处理/ M S 误差 F 区组= MS 区组/ M S 误差方差分析结果表变异来源 SS dfMSFP总变异 65261.447 29 处理间 8182.893 2 4091.447 4.241 <0.05 区组间 39712.984 9 4412.554 4.574 <0.05 误差17365.57018964.754(3) 确定P 值和作出推断结论 查表得P<0.01, 按α=0.05水准拒绝H 0 ,接受H 1.(4) 结论:故可以认为工人尿氟浓度三个不同时间中至少两组是不同的,同时10个工人尿氟浓度有差别。
卫生统计学第八章正交试验方差分析
WENKU DESIGN
正交试验设计定义与原理
正交试验设计定义
正交试验设计是研究多因素多水平的一种设计方法,它是根 据正交性从全面试验中挑选出部分有代表性的点进行试验, 这些有代表性的点具备了“均匀分散,齐整可比”的特点。
正交试验设计原理
正交试验设计是利用正交表来安排与分析多因素试验的一种 设计方法。它是由试验因素的全部水平组合中,挑选部分有 代表性的水平组合进行试验的,通过对这部分试验结果的分 析,了解全面试验的情况。
THANKS
感谢观看
REPORTINGΒιβλιοθήκη https://VS
正交表特点
每列中不同数字出现的次数相等;任意两 列中数字的排列方式齐全而且均衡。
正交试验设计步骤
挑因素,选水平
根据试验的目的和专业知识,挑选出与考察指标有关的因素。对选出的因素要分清主次,合理安排。 选取的水平数应根据实际情况而定,过少会导致结果不准确,过多则可能数据分布的规律性较差,代 表性差;
通过建立线性模型来描述各因素 与结果之间的关系,从而进行方 差分析和参数估计。
PART 03
正交试验方差分析步骤
REPORTING
WENKU DESIGN
数据整理与描述性统计
整理试验数据
按照试验因素和水平整理数据,列出试验指标的观察值。
计算总均值和总变异
计算所有观察值的总和、均值、离差平方和等描述性统计量。
选正交表,进行表头设计
根据确定的列数(C)与水平数(t)选择相应的正交表。选择的原则是首先满足列数,其次是水平数。若 有2个或2个以上正交表满足条件时则应选取行数最少的一个;
正交试验设计步骤
明确试验方案,进行试验;
医学统计学-8-方差分析
第二节 单因素方差分析
单因素方差分析
单因素方差分析:研究的是一个处理因素的 不同水平间效应的差别。
处 理 因 素
水平1 水平2 水平1 水平2 水平c
单因素方差分析
例1、某地用A、B和C三种方案治疗血红蛋 白含量不满10g的婴幼儿贫血患者,A方案 为每公斤体重每天口服2.5%硫酸亚铁1ml, B方案为每公斤体重每天口服2.5%硫酸亚 铁0.5ml,C方案为每公斤体重每天口服3g 鸡肝粉,治疗一月后,记录下每名受试者血 红蛋白的上升克数,资料见下表,问三种治 疗方案对婴幼儿贫血的疗效是否相同?
A、B、C三种方案治疗婴幼儿贫血的疗效观察表
治疗方案 A n=20
血红蛋白增加量(g) 1.8 1.4 0.5 1.2 2.3 2.3 3.7 0.7 2.4 0.5 2.0 1.4 1.5 1.7 2.7 3.0 1.1 3.2 0.9 2.5
B
n=19
0.2
0.0 2.1 -0.7
0.5
1.6 1.9 1.3
q XA XB
MSe 1 1 2 nA nB
ν=νe
一、q检验
例、在前面对某地用A、B和C三种方案治疗 血红蛋白含量不满10g的婴幼儿贫血患者的 例题(完全随机设计方差分析例1)进行了 方差分析,我们得出三组总体不等的结论。 究竟哪些总体均数之间存在着差别,我们需 要在前方差分析基础之上,再对该资料作两 两比较的q检验。
随机因素是无法避免的,而实质性差异是我们 需要得到的。 如何排除随机因素的干扰,利用样本信息对总 体均数间是否存在差异作出推断?
方差分析的基本思想
按照设计类型将总变异分解为处理因素引 起的变异和随机因素造成的变异; 以处理因素变异与随机因素变异之比来构 造检验统计量F。
统计学原理——假设检验与方差分析
二、假设检验中的两类错误**
第Ⅰ类错误/弃真错误 (type Ⅰ error)
当原假设为真时拒绝原假设。犯第Ⅰ类错误的概率
通常记为 。
第Ⅱ类错误/取伪错误(type Ⅱ error)
n1 P 40010.2 320 f 5
所以为大样本分布,检验统计量 Z 近似服从 正态分布。样本数据显示:
p 100 0.25 400
Z p P0 0.25 0.20 0.05 2.5
P 1 P 0.21 0.2 0.02
n
400
在显著性水平 0.05 情况下,查表可知,
比RMB 245.95小或者比RMB 274.05大。所以,在双侧 检验(见下图8-1)中有两个拒绝域。
拒绝域
接受域
拒绝域
245.95
260.00
274.05
图8-1 双边检验的拒绝域与接受域
[例8-2] 在例8-1的假设检验中,如果样本的均值
为 X 240.00 ,当显著性水平为0.05时,原假设是否被 拒绝。
重点是三种不同情况下的假设检验方法,总体方差已 知时正态总体均值和总体比例的假设检验。
难点是总体方差未知时正态总体均值的假设检验和方 差分析。
第一节 假设检验
一、假设检验的概念
一、假设检验的概念
假设(hypothesis),又称统计假设,是对总体参数 的具体数值所作的陈述。
假设检验(hypothesis test) 是先对总体参数提出 某种假设,然后利用样本信息判断假设是否成立的过程。
(3) H0:μ = μ0 H1:μ<μ
第八讲 卫生统计学 方差分析
Si
S i2
完全随机设计资料在进行统计分析时,需 根据数据的分布特征选择方法,对于正态分布 且方差齐同的资料,常采用完全随机设计的单 因素方差分析(one-way ANOVA)或成组资料的 t检验(k=2);对于非正态分布或方差不齐的 资料,可进行数据变换或采用Wilcoxon秩和检 验。
记总均数为 X X / N ,
MS组内= SS组内/υ组内=16466.65/33=498.99 F= MS组间/MS组内=15645.83/498.99=31.36
按表中的公式计算各离均差平方和SS、自由度、 均方MS和F值。
表 8-3 变异来源 df 35 总变异 2 组 间 组内(误差) 33 例 8-1 的方差分析表 SS MS F P 47758.32 31291.67 15645.83 31.36 <0.01 16466.65 498.99
Xij
正常钙(0.5%) 332.96 297.64 312.57 295.47 284.25 307.97 292.12 244.61 261.46 286.46 322.49 282.42 12 293.37 24.62 606.15
全部数据 36 252.55 36.94 1364.52
ni
Xi
又称为配伍组设计,是配对设计的扩展。具体做法是:先按影 响试验结果的非处理因素(如性别、体重、年龄、职业、病情、病 程等)将受试对象配成区组(block),再分别将各区组内的受试对象 随机分配到各处理或对照组。 与完全随机设计相比,随机区组设计的特点是随机分配的次数 要重复多次,每次随机分配都对同一个区组内的受试对象进行,且 各个处理组受试对象数量相同,区组内均衡。在进行统计分析时, 将区组变异离均差平方和从完全随机设计的组内离均差平和中分离 出来,从而减小组内平方和(误差平方和),提高了统计检验效率。 若将区组作为另一处理因素的不同水平,随机区组设计等同于无重 复观察的两因素设计。
统计学中的方差分析方法
统计学中的方差分析方法方差分析(Analysis of Variance,简称ANOVA)是统计学中常用的一种假设检验方法,用于比较两个或更多个样本均值是否存在差异。
它通过分析不同组之间的方差来评估组内和组间的变异情况,进而得出结论。
一、方差分析的基本思想方差分析基于以下两个基本假设:1. 原假设(H0):各总体均值相等,即样本所来自的总体没有差异;2. 备择假设(H1):各总体均值不相等,即至少存在一个样本来自于与其他样本不同的总体。
二、一元方差分析(One-way ANOVA)一元方差分析适用于只有一个自变量的情况,它将样本根据自变量分为两个或多个组,然后比较这些组之间的均值差异。
下面以一个简单的案例来说明一元方差分析。
假设我们要研究三种不同肥料对植物生长的影响,我们将随机选取三个试验区,分别施用A、B和C三种不同的肥料,每个试验区都观察到了相应植物的生长情况(例如植物的高度)。
我们的目标是通过方差分析来判断这些不同肥料是否对植物的生长有显著的影响。
在执行一元方差分析之前,我们首先需要验证方差齐性的假设。
如果各组样本的方差相等,我们就可以继续使用方差分析进行比较。
常用的方差齐性检验方法有Bartlett检验和Levene检验。
在通过方差齐性检验后,我们可以进行一元方差分析。
分析结果将提供两个重要的统计量:F值和P值。
F值表示组间均方与组内均方的比值,P值则表示了接受原假设的概率。
如果P值较小,则说明组间的差异是显著的,我们可以拒绝原假设,接受备择假设,即不同肥料对植物生长有显著影响。
三、多元方差分析(Two-way ANOVA)多元方差分析适用于有两个以上自变量的情况,分析对象的均值差异可以归因于两个或多个自变量的相互作用。
这种分析方法常用于研究两个或多个因素对实验结果的影响情况。
以品牌和价格对手机销量的影响为例,我们假设品牌和价格是两个自变量,手机销量是因变量。
我们可以将样本分成不同的组合,比如将不同品牌的手机按不同的价格段进行分类。
应用统计学8-方差分析(1)
Yi = µi + ε i
( 8-1)
其中, μi 纯属Ai作用的结果,称为在Ai条件下Yi的真值(也称为在 Ai条件下Yi的理论平均). εi 是试验误差(也称为随机误差)。
2 ε ~ N ( 0 , σ ) 且相互独立,则 Yi ~ N ( µ i , σ 2 ) 假定 i
且也是相互独立的
第八章
第八章
方差分析
8. 2 单因素试验的方差分析
数学模型和数据结构 参数点估计 分解定理 自由度 显著性检验 多重分布与区间估计
第八章
方差分析
8. 2. 1 数学模型和数据结构
在单因素试验中,为了考察因素A的k个水平A1, A2, …, Ak对Y的影响(如k 种型号对维修时间的影响),设想在固定的 条件Ai下作试验。所有可能的试验结果组成一个总体Yi (i=1, 2, …, k),它是一个随机变量,可以把它分解为两部分
第八章
方差分析
8. 2. 2 参数点估计
2 , , , , µ α α α σ 估计参数 1 2 k 和
估计方法:最小二乘法
最小偏差平方和原则:使观测值与真值的偏差平方和 达到最小
第八章
偏差平方和
方差分析
8. 2. 2 参数点估计
2 S ε = ∑∑ ε ij = ∑∑ (Yij − µ i ) 2 = ∑∑ (Yij − µ − α i ) 2 i =1 j =1 k m
eij = Yij − Y i
第八章
最小二乘估计量
方差分析
8. 2. 2 参数点估计
ˆ =Y µ ˆ i = Yi − Y α µ ˆ i = Yi
可以证明,这三个估计量均为参数μ、 αi和μi的无偏估计量
《医学统计学》医统-第八章方差分析
编辑课件
公共卫生系 流行病与统计学教研室
祝晓明
例 8-1 在评价某药物耐受性及安全性的I 期临床试验中,对符合纳入标准的30名健 康自愿者随机分为3组每组10名,各组注 射剂量分别为0.5U、1U、2U,观察48小 时部分凝血活酶时间(s)试问不同剂量的 部分凝血活酶时间有无不同?
编辑课件
编辑课件
• 方差分析
F=3.55, F>F0.05(2,18),P<0.05,三组大鼠 MT 含量的总体均值不全相同。
编辑课件
第三节 多个样本均数的两两比较
证实性研究
探索性研究
证实性研究 与探索性研究
编辑课件
Dunnett-t 检验 LSD-t 检验
SNK-q检验 Tukey检验 Schéffe检验
两个均数的比较时,同一资料所得结果与t检验等
价,即有如下关系 t 2 。F
2.方差分析的基本思想:将全部观测值的总变异按 影响因素分解为相应的若干部分变异,在此基础 上,计算假设检验的统计量 F 值,实现对总体均 数是否有差别的推断。
编辑课件
3. 方差分析有多种设计类型,但基本思想和计算步骤 相同,只是分组变量的个数不同,使用统计软件很容 易实现。 4.多重比较有多种方法,如 Dunnett-t 检验、LSD-t检 验、SNK-q (Student-Newman-Keuls)法 、Tukey法、 Schéffe法、Bonferroni t 检验和 Sidak t 检验。学习 中注意各种方法的适用性。
k1
的
2 分布, 2
2 ,
,认为方差不齐。
编辑课件
例8-1 资料方差齐性检验 提出检验假设,确定检验水准 H0:σ12=σ22=σ32 H1:三组方差不全相等 α=0.05
医学统计学:04 方差分析
1.4 f( F)
1.2
1.0
0.8
0.6
0.4
0.2
0.0
0
1
F 分布曲线
1 1, 2 5
1 5, 2 5
1 10,2 10
2F
3
4
F 界值表
附表4 F界值表(方差分析用,单侧界值) 上行:P=0.05 下行:P=0.01
分母自由度
υ2
1
161 1
4052
18.51 2
98.49
4.21 27
• 随机区组设计又称随机单位组设计、配伍组设计,也叫双因 素方差分析(two--way ANOVA)。是配对设计的扩展。
具体做法:
① 将受试对象按性质(如性别、年龄、病情等) (这些性质是
非处理因素,可能影响试验结果)相同或相近者组成m个单位 组(配伍组),每个单位组中有k个受试对象,分别随机地分 配到k个处理组。
2
7
33.4
18
2
8
38.3
19
2
9
38.4
20
2
10
39.8
21
3
1
32.9
22
3
2
37.9
23
3
3
30.5
24
3
4
31.1
25
3
5
34.7
26
3
6
37.6
27
3
7
40.2
28
3
8
38.1
29
3
9
32.4
30
3
10
35.6
35.51667
(Xij X )2
生物统计学课件单因素方差分析
(i
)]2
n a 1
E[
a i 1
( i.
..)2
2
a i1
( i.
..) (i
)
a i 1
(i
)2
]
处理均方的数学期望
n [E a 1
a i1
(i. )2
a
E
(
2 ..
)]
n a 1
a
2 i
i1
n (a 2
]
i 1
( E(ij ) 0,
E
(
2 ij
)
2
)
1 (an 2 na 2 )
an a
n
2
处理均方的数学期望
E ( MS A
)
a
1 1
E(SSA
)
1
a
E[
a 1 i1
n
( xi.
j1
x..)2 ]
1 a 1
E[n
a i 1
(
i
i.
..)2
]
n a 1
E
a i 1
[( i
..)
均方
称为处理间均方
MS A
SSA a 1
称为误差均方
MSe
SSe a(n 1)
为了估计σ2,除以相应的自由度而得到的
误差均方数学期望
E(MSe )
1 na
a
E(SSe )
1
a
E[
an a i1
n
( xi j xi. )2 ]
j1
1 an a
a
E[
i1
n i1
(
i
ij
i
i. )2 ]
统计学(第四版)贾俊平 第八章 方差分析与实验设计 练习题答案
统计学(第四版)贾俊平 第八章 方差分析与实验设计 练习题答案8.10123411234:0:,,,0=0.01SPSS H H ααααααααα====至少有一个不等于用进行方差分析,表8.1-1填装量主体间效应的检验(单因素方差分析表)因变量: 填装量 源 III 型平方和df均方F Sig.偏 Eta 方非中心 参数观测到的幂b校正模型 .007a3 .002 10.098 .001 .669 30.295 .919 截距 295.7791 295.7791266416.430.000 1.000 1266416.4301.000 机器 .007 3 .002 10.098.001.66930.295.919误差 .004 15 .000总计 304.17119 校正的总计.01118a. R 方 = .669(调整 R 方 = .603)b. 使用 alpha 的计算结果 = .01由表8.1-1得:p=0.001<0.01,拒绝原假设,i 0α不全为,表明不同机器对装填量有显著影响。
8.201231123:0:,,0=0.05SPSS H H ααααααα===至少有一个不等于用进行方差分析,表8.2-1满意度评分主体间效应的检验(单因素方差分析表)因变量: 评分 源III 型平方和df 均方 F Sig.校正模型 29.610a2 14.805 11.756 .001 截距 975.156 1 975.156 774.324 .000 管理者 29.610 2 14.805 11.756.001误差 18.890 15 1.259总计 1061.000 18 校正的总计48.50017a. R 方 = .611(调整 R 方 = .559)由表8.2-1得:p=0.001<0.05,拒绝原假设,i 0α不全为,表明管理者水平不同会导致评分的显著差异。
8.301231123:0:,,0=0.05SPSS H H ααααααα===至少有一个不等于用进行方差分析,表8.3-1电池寿命主体间效应的检验(单因素方差分析表)因变量: 电池寿命 源III 型平方和df 均方 F Sig. 偏 Eta 方 非中心 参数 观测到的幂b校正模型 615.600a2 307.800 17.068 .000 .740 34.137 .997 截距 22815.000 1 22815.000 1265.157 .000 .991 1265.157 1.000 企业 615.600 2 307.800 17.068.000.74034.137.997误差 216.400 12 18.033总计 23647.000 15 校正的总计832.00014a. R 方 = .740(调整 R 方 = .697)b. 使用 alpha 的计算结果 = .05由表8.2-1得:p=0.001<0.05,拒绝原假设,i 0α不全为,表明3个企业生产的电池平均寿命之间存在显著差异。
概率论与数理统计教程 第8章
MSe= Se/fe
总和
ST
fT=n1
对给定的,可作如下判断:
若F F1 (fA ,fe) ,则说明因子A不显著。 该检验的p值也可利用统计软件求出,若 以Y记服从F(fA ,fe)的随机变量,则检验的 p 值为 p=P(YF)。
如果 F >F1 (fA ,fe),则认为因子A显著;
由定理8.1.2,若H0成立,则检验统计量F服从自由度为fA和fe的F分布,因此拒绝域为W={FF1 (fA ,fe)},通常将上述计算过程列成一张表格,称为方差分析表。
表8.1.3 单因子方差分析表
来源
平方和
自由度
均方和
F比
因子
SA
fA=r1
MSA= SA/fA
F= MSA/ MSe
误差
Se
第八章 方差分析与回归分析
§8.1 方差分析 §8.2 多重比较 §8.3 方差齐性分析 §8.4 一元线性回归 §8.5 一元非线性回归
§8.1 方差分析
8.1.1 问题的提出 实际工作中我们经常碰到多个正态总体均值的比较问题,处理这类问题通常采用所谓的方差分析方法。
例8.1.1 在饲料养鸡增肥的研究中,某研究所提出三种饲料配方:A1是以鱼粉为主的饲料,A2是以槐树粉为主的饲料,A3是以苜蓿粉为主的饲料。为比较三种饲料的效果,特选 24 只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量。试验结果如下表所示:
模型(8.1.3)可以改写为 (8.1.8) 假设(8.1.1)可改写为 H0 :a1 =a2 =…=ar =0 (8.1.9)
8.1.5 参数估计
在检验结果为显著时,我们可进一步求出总均值 、各主效应ai和误差方差 2的估计。
统计学第八章 单因素方差分析(1)
称为处理平方 处理平方 和,记为 SSA
总平方和SST=处理平方和SSA+误差平方和SSe
即, ( y ij − y •• ) = n∑ ( y i • − y •• ) + ∑∑ ( y ij − y i• ) 2 ∑∑
2 i =1 j =1 i =1 i =1 j =1 a n 2 a a n
i =1 j =1
a
n
= n∑ ( y i• − y •• ) + 2∑ [( y i• − y •• )∑ ( y ij − y i• )] + ∑∑ ( y ij − y i • )
2 i =1 i =1 j =1 i =1 j =1
a
a
n
a
n
j =1
∑ ( y ij − y i • ) = 0
换句话说,采用两两t检验法,要进行45次t检验,程序太繁琐。
原因(2):检验的I 型错误增大,从而检验的 可靠性低
a = 2 时, H 0 只有一个,即
µ 1= µ 2
a = 3 时, H 0 有 3 个,即 µ 1= µ 2, µ 2= µ 3, µ 1= µ 3
a = 5时,H 0 有10个,即µ1=µ 2,µ 2=µ3, , µ 4=µ5 L
二、方差分析的几个概念
1、方差分析(analysis of variance):将试验数据的总变异分 解成不同来源的变异,从而评定不同来源的变异相对重要性 的一种统计方法。 2、试验指标(experiment index):为衡量试验结果的好坏或 处理效应的高低,在试验中具体测定的性状或观测的项目。 3、试验因素(experiment factor):试验中所研究的影响试验 指标的因素:单因素、双因素或多因素试验。 4、因素水平(level of factor):因素的具体表现或数量等级。
方差分析课件-PPT
增重表就是选用S-N-K法作均数多重两两比较得结果:
本例按a=0、05水准,将无显著性差异得数归为一类 (Subset for alpha=0、05)。可见
品种5、2、3得样本均数位于同一个子集( Subset )内,说 明品种5、品种2、品种3得样本均数两两之间无显著差异; 品种3、4、1位于同一个Subset内,她们之间无显著差异;而 品种5、2与品种4、1得样本均数有显著差异。
即三组均数间差异极显著,即不同时期切痂对大鼠肝脏 ATP含量有影响。
LSD法多重比较:
“*”显著性标注 两组均数得差
•S-N-K法:本例按0、5水平,将无显著差异得均数归为一类。
•第一组与第三组为一类,无显著差异,它们与第二组之间均数差 异显著。
•LSD与S-N-K法,不同得两两比较法会有不同。
如欲了解就是否达到极显著差异,需要将显著水平框中得 值输入0、01。
例、 为了研究烫伤后不同时间切痂对大鼠肝脏 ATP得影响,现将30只雄性大鼠随机分成3组,每组 10只:A组为烫伤对照组,B组为烫伤后24小时切痂 组,C组为烫伤后96小时切痂组。全部大鼠在烫伤 168小时候处死并测量器肝脏ATP含量,结果如下。 问试验3组大鼠肝脏ATP总数均数就是否相同。
该12个观察值得总得均值为91、5,标准差为34、 48。
上图为品系、剂量间均值得方差分析(F检验)结果
由表中可知,品系得F=23、771,P=0、001<0、01,差异极显著;
剂量得F=33、537,P=0、001<0、01,差异极显著。说明不同品系与 不同雌激素剂量对大鼠子宫得发育均有极显著影响,故有必要进一步对 品系、雌激素剂量两因素不同水平得均值进行多重比较。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
处理因素:不同的药物
水平:0.5ml65%乙醇,
0.2g生药/0.5ml65%乙醇
问题的提出
一种新的降血脂药, 120 人分为安慰剂组,用 药 组 1(2.4g) , 用 药 组 2(4.8g) , 用 药 组 3(7.2g)。实验结束后观察血脂水平。
安慰剂组
X =3.43mmol/l
用药组1
排序号(组次):
四、多个样本均数间的多重比较
1)建立假设,确定检验水准 H0: μA=μB H1: μA≠μB α=0.05 2)计算统计量q值。 由于各组的例数都一样,均为8例,而且在进行方差 分析时,已知MS组内=0.175,任意两个比较组的 标准误均为:
s x A x B MS 组内 1 1 ( ) 0.1479 2 n A nB
第八章 方差分析
Analysis of Variance
重点掌握
方差分析的基本思想
完全随机设计、随机区组设计方差分 析和多重比较结果的合理解释
总体
同质、个体变异
随机 抽样
样本 代表性、抽样误差
总体参数 未知
样本统计量已知
统计 推断
风 险
假设检验的原理和步骤
“小概率反证法”思想 如果对总体的H0是真实的,那么不利于或不能支 持这一假设的事件A(小概率事件)在一次试验 中几乎不可能发生的;要是在一次试验中A竟然 发生了,就有理由怀疑该假设的真实性,拒绝H0
二、完全随机设计方差分析步骤
1、 建立检验假设和确定检验水准 H0: 1 2 3 ( 四组血清IL-2水平总体均
4
数相等)
H1:四组血清IL-2水平总体均数不等或不全相等 α=0.05 2、计算F值
直接计算(软件) 或间接估计(查表)
3、确定P值和作出推断结论
二、完全随机设计方差分析步骤
s x A x B 1 1 2 MS组内 ( ) 0.172 0.2092 nA nB 8
四、多个样本均数间的多重比较
3)确定P值,做出推断结论 v=N-K=32-4=28,查t界值表,得:
比较组
| XA XB |
t值
P < 0.001
甲与乙 0.7287 3.4849 0.001< P <0.002 甲与丙 1.8575 8.8833
3、使用近似F检验
t检验也类似!!!
方差分析的基本思想
例 在大肠湿热征模型研究中,将32只大鼠 随机分成4组,每组8值,分别为正常对照 组(甲组)、大肠杆菌模型组(乙组)、轮 状病毒模型组(丙组)和大肠杆菌加轮状病 毒混合模型组(丁组)。测得大鼠血清白细 胞介素IL-2水平见下表。试比较不同大鼠 模型的血清IL-2水平是否有差别。
处 理 因 素
水平1 水平2
水平k
方差分析的应用条件
应用条件 1、各个样本是相互独立的随机样本; 2、各个样本来自正态总体; 3、各个处理组的总体方差相等,即方差齐。
t检验的应用条件??
方差分析的应用条件
不满足应用条件时处理方法
1、进行变量变换,以达到方差齐或 正态的要求 2、采用非参数法(秩和检验)
甲与丁 1.9737 9.4390
乙与丙 1.1288 5.3984 乙与丁 1.2450 5.9541 丙与丁 0.1162 0.5557
方差
SS/(n-1)
消除n 的 影响
总变异
所有观察值几乎不同,各观察值与 总体均数间的差异为总变异
SS总 ( xij x)
i j
第i个处理 水平 每个水平 组的第j例
2
v总 =n 1
总均数
任一 观测值
组内变异 同一水平处理组,各观测值不完全相等
组内变异
同组内的血清IL-2水平不一致 原因是不同个体的随机误差
第i个处理 水平 每个水平 组的例数 第i组的 均数
2
总均数
方差分析的基本思想
SS总=SS组内+SS组间
随机误差
组内变异
SS组内
SS总
总变异
随机误差+处理的作用(可能 存在)
组间变异
SS组间
方差分析表
变异来源 组间 组内 总 SS SS组间 SS组内 SS总 v k-1 N-k N-1
组间方差,又 称组间均方 (MS组间)
四、多个样本均数间的多重比较
例
在方差分析的基础上,对不同大鼠模型的 IL-2水平进行SNK法的多重比较。 先将样本均数从小到大排序,对比组次从1-4
均数排序(从小到大) 处理组(原组号) 均 例 数: 数: 甲 0.2913 8 1 乙 1.0200 8 2 3 丙 2.1488 8 丁 2.2650 8 4
SNK q检验
LSD -t检验
四、多个样本均数间的多重比较
(一)SNK-q检验
可对所有对照组及处理组的样本均数进行
两两比较
适用于探索性研究,在研究设计阶段未预
先考虑或未预料到,经数据结果的提示后
才决定的多个均数间每两个的事后比较
四、多个样本均数间的多重比较
计算公式
| XA XB | q S -0.05)k=0.4013
问题的提出
t检验的局限性
比较两组样本均数
(单因素两水平)
方差分析
方差分析(Analysis of Variance,简写为
ANOVA )
由英国统计学家R.A.Fisher在1918年提出
F检验
方差分析的原理
单因素方差分析/完全随机设计方差分析 (one-way ANOVA):研究一个处理因素 (有k个水平),将n个观察单位随机分配到k 个水平,观察水平间效应的差别
变异来源 组间 组内 总
SS 21.429 v 3 MS 7.143 F P
40.766 4.906 26.335 28 31 0.175
<0.01
二、完全随机设计方差分析步骤
结论:
按α=0.05的水准,拒绝H0,接受H1,四
组均数之间的差异有统计学意义,可认
为四个模型组IL-2平均水平总体有差别。
| XA XB | t SX AXB
SX AXB
组内=N-k
1 1 MS组内 ( ) n A nB
自由度=υ
四、多个样本均数间的多重比较
LSD法实际上是一种t检验法,主要区别在
于计算标准误中的合并方差及自由度的不
同
仍按算得的t值查附表2,t界值表,作出 推断结论
四、多个样本均数间的多重比较
二、完全随机设计方差分析步骤
注意!
1. 如果方差分析有差别,只能说明总体间 有差别,各组中哪两组间是否有差别, 还要进一步做多重比较 2.如果方差分析无差别,分析结束
四、多个样本均数间的多重比较
多重比较(Multiple Comparison),又称两两 比较 假如每次t检验犯第一类错误的概率是0.05,那 么要完全地进行比较,犯第一类错误的概率是 1-(1-a)k。
四、多个样本均数间的多重比较
3)确定p值做出推断结论
比较组
1与4 1与3 1与2 2与4 2与3 3与4
XA XB
a
4 3 2 3 2 2
q值
13.345 12.559 4.927 8.418 7.632 0.786
q0.05(a,28)
3.87 3.51 2.90 3.51 2.90 2.90
(1)建立假设和确定显著性水平
(2)计算检验统计量 (3)确定P值和做出推断
可能发生的两类错误
检验结果 真实情况
拒绝H0
不拒绝H0
H0 成立
H1成立
I型错误(a )
推断正确(1-a )
II 型错误 ( b ) 推断正确(1-b)
问题的提出
t检验实例
外用中药搽剂骨肌康对小鼠琼脂肉芽的抑制作用。 给予对照组0.5ml65%乙醇,试验组施用大剂量骨肌 康,给予0.2g生药/0.5ml65%乙醇,观察两组的肉芽 肿重。
SS 组内 (xij x i )
i j
2
第i个处理 水平
每个水平 组的第j例
任一 观测值
第i个处 理组的均 数
组间变异 各水平处理组的均值不同
组间变异
不同组间的血清IL-2水平不同
原因:处理因素的效应(如果存在的话);随机误
差组间变异
SS组间 ni ( xi x)
的比较,多个组与一个特定组间的比较或者特
定组间的比较(Planned Multiple
Comparison) 方差分析得到有差别的结论后多个组之间的 相互比较的探索性研究(Post Hoc)
四、多个样本均数间的多重比较
两两比较方法
多个样本均数间每 两个均数的比较 多个实验组分别与对照组 均数间的两两比较
一、方差分析的基本思想
SS总=SS组间+SS组内
组内变异(SS组内):随机误差 组间变异(SS组间) :处理因素+随机误差 当H0 为真时,由于处理因素不起作用,组间 变异只受随机误差的影响。此时,组间变异 与组内变异相差不能太大,有 MS组间 SS组间 k 1 1 MS组内 SS组内 n k
i列, i =1,2..k,在此 k=4,处理组数
总例数
j 行, j =1,2…,ni,
在此j=8
总例数
第 i个 处理 组的 样本 均数
总 均 数
总变异 所有个体的血清IL-2水平几乎都不同
回顾:正态分布资料的离散趋势指标
SS (X X )
离均差 平方和
2
变异度
总例数n(自由度n-1)
1 0.95 0.2649