CH6方差分析(1)_讲义版_2014
CH6方差分析-“地域”与“抑郁”
“地域”与“抑郁”朱平辉改编自西南财大网(案例分析者刘玲同学)一、案例简介美国人作了一项调查,研究地理位置与患抑郁症之间的关系。
他们选择了60个65岁以上的健康人组成一个样本,其中20个人居住在佛罗里达,20个人居住在纽约、20个人居住在北卡罗来纳。
对中选的每个人给出了测量抑郁症的一个标准化检验,搜集到表1中的资料,较高的得分表示较高的抑郁症水平。
研究的第二部分考虑地理位置与患有慢性病的65岁以上的人患抑郁症之间的关系,这些慢性病诸如关节炎、高血压、心脏失调等。
这种身体状况的人也选出60个组成样本,同样20个人居住在佛罗里达,20个人居住在纽约、20个人居住在北卡罗来纳。
这个研究记录央视主持人崔永元对外公开其患有抑郁症后,使人们对这种精神疾病有了更多的关注。
通过对以上两个数据集统计分析,你能从中看出什么结论?你对该疾病有什么认识?二、抑郁症的相关知识抑郁症有两种含义,广义的抑郁症包括情感性精神病、抑郁性神经症、反应性抑郁症、更年期抑郁症等;狭义的则仅指情感性精神病抑郁症。
抑郁症在国外是一种十分常见的精神疾病,据报告,其患病率最高竟占人群的10%左右,而且社会经济情况较好的阶层,患病率越高。
世界卫生组织预测,抑郁症将成为21世纪人类的主要杀手。
全世界患有抑郁症的人数在不断增长,而抑郁症患者中有10—15%面临自杀的危险……引起抑郁症的原因有很多,为了了解地理位置对抑郁症是否有影响,我们做如下的案例分析:三、地理位置与患抑郁症之间是否有关系作为对65岁以上的人长期研究的一部分,在纽约洲北部地区的Wentworth医疗中心的社会学专家和内科医生进行了一项研究,以调查地理位置与患抑郁症之间的关系。
选择了60个相当健康的人组成一个样本,其中20人居住在佛罗里达,20人居住在纽约,20人居住在北卡罗米纳。
对中选的人给出了测量抑郁症的一个标准化实验,搜集到表1中的资料,较高的分表示较高的抑郁症水平。
研究的第二部分考虑地理位置与患有慢性病的65岁以上的人患抑郁症之间的关系,这些慢性病诸如关节炎、高血压、心脏失调等。
ch6方差分析-上海财经大学
12
例--胶合板耐磨性试验
例1.1(胶合板耐磨性试验) 为了比较五种不同品牌的胶合 板的质量,从每种品牌中随机抽取4个样品作耐磨性试验. 记录了每次试验测量的板材磨损数量,数据存放在数据集 VENEER中(见下表).该数据集有两个变量:BRAND表示 胶合板的品牌;WEAR表示测得的磨损数量.
品牌 ACME CHAMP AJAX TUFFY XTRA 胶合板磨损数据 磨损数量(每个牌子四个样品) 2.3, 2.1, 2.4, 2.5 2.2, 2.3, 2.4, 2.6 2.2, 2.0, 1.9, 2.1 2.4, 2.7, 2.6, 2.7 2.3, 2.5, 2.3, 2.4
5
单因素方差分析 例(隔热试验的例子): 为检验三种隔热材料的效果进行30次试验,每种10次. 比较三种材料的平均温度变化是否一样.
H0 所有均值相等 H1:至少 一个均值不等
6
单因素方差分析---方差分析模型
在方差分析中: 指标X(因变量或响应变量):记录各种试验条件下的观测结果; 因素(自变量或分类变量):各试验条件分类变量值又称为水平. ������������������ :温度改变 ������������������ = ������ + ������������ + ������������������ ������:平均水平 ������������ :材料的效应 ������������������ :误差
20
21
有重复观测的情形。若第一个因素 A有������ 个水平,第二个因素 B 有������水平。在因素A的第������个水平和因素B的第������个水平下进行了多 次观测,记为{ ������������������������,1 ≤ ������ ≤ ������},对Xijk考虑以下模型: ������������������������ = ������ + ������������ + ������������ + ������������������������,(1 ≤ ������ ≤ ������ ,1 ≤ ������ ≤ ������ , 1 ≤ ������ ≤ ������ ) 其中������ 表示总平均的效应,������������ 和τj分别表示因素A的第������ 个水平和因 素 B的第������ 个水平的附加效应,εijk 为误差,其中误差假定它是独立 的并且是等方差的正态分布。这里设两因素不存在交互效应。
讲稿方差分析
方差分析(ANOV A)一. 方差分析的概念方差分析(analysis of variance, ANOVA)又称变异数分析或F查验,其目的是推断两组或多组资料的整体均数是不是相同,查验两个或多个均数的不同是不是有统计学意义。
咱们要学习的要紧内容包括单因素方差分析,即完全随机(成组)设计的方差分析和两因素方差分析即随机区组(配伍组)设计的方差分析。
方差分析除用于两个或多个均数的比较外,还可分析两个或多个研究因素的交互作用和回归方程的线性假设查验等。
依照资料设计的类型及研究目的,可将总变异分解为两个或多个部份,每一个部份的变异可由某因素的作用来讲明,通过比较可能由某因素所致的变异与随机误差(如组内变异),即可了解该因素对测定结果有无阻碍。
另外,多个均数间的比较,由于涉及的对照组数大于2,假设仍用两组比较的t查验,对每两个对照组作比较,会使犯第一类错误的概率()增大。
例如:有5个均数的比较,能够用10次t查验比较,假设每次比较的查验水准=,那么每次比较不犯第一类错误的概率为(1-)=,那么10次比较均不犯第一类错误的概率为=,这时犯第一类错误的概率,也确实是总的显著性水准变成1-=,比大多了,大大增加了犯第一类错误的概率,可能把本来无不同的两个整体均数判为有不同。
因此,多个均数比较不宜用前述t查验别离作两两比较。
二.方差分析的应用条件方差分析的应用条件如下:1.正态散布,要求资料服从正态散布,偏态散布资料不适用方差分析。
对偏态散布的资料应考虑利用秩和查验,或用变量变换方式将数据转变成正态或接近正态后再进行方差分析。
2.方差齐性,即各组的方差要相等,假设组间方差不齐那么不适用方差分析。
故方差分析前,应做多个方差的齐性查验。
3.各样本是彼此独立的随机样本。
三.完全随机(成组)设计的方差分析下面咱们用一个简单的例子来讲明其大体思想:三种方案医治后血红蛋白增加量(g/L)方案观察值nA243625142634237B2018171019246C2011630-1458三种人的载脂蛋白测定结果糖尿病IGT正常人从以上资料能够看出,30个观对象的载脂蛋白量各不相同,就其变异情形来分析,其总变异有以下两个来源:组内变异:每组内部各个观看对象的载脂蛋白量各不相同,就其缘故主若是由于随机误差所引发的。
统计学第6章方差分析精品PPT课件
于是,当原假设为真时,可得服从 F 分布的统计量, 其分子自由度为 r 1,分母自由度为 nT r 。此 F 统计
量可充当检验统计量: F MSA MSE
★ 6.2.2 方差分析基本步骤
:
2 1
2 2
2 r
H1
:
2 1
,
2 2
,,
2 r
不尽相等
Bartlett 方差齐性检验统计量是自由为 r 1的 2 统计量:
2
r j 1
nj
1 ln
sc2
s
s j
给定显著性水平
,检验中的拒绝准则为:
2
2
。应当注意,
Bartlett 检验结果只在样本数据具有正态性时有效。
6.3 方差相等性检验
种方法,称为最小显著性差异法,简称 LSD。LSD 的检验假设为:
H0 : i j H1 : i j
这里是针对问题中所涉及的总体的个数,提出了多次原假设。LSD 的检
验统计量是一个自由度为 nT r 的 t 统计量:t xi x j i j
M
SE
1 ni
1 nj
6.3 方差相等性检验
r 1
第六步:计算总体方差的组内估计
r
nj
1
s
2 j
MSE j1
nT r
第七步:计算 F 统计量的值。
F MSA MSE
第八步:编制方差分析表。
表 6.2
方差来源
平方和
自由度
组间
SSA
r 1
组内
SSE
nT r
方差分析ppt课件(001)
差异:由抽样造成? 由处理效应不同造成?
方差分析
__
Xi
8.04 12.76 9.25 10.02( X )
4
均数的比较
两样本:u检验:s已知
s未知的大样本 t检验:s未知的小样本 多样本:ANOVA----F检验
5
基本概念
1.
因素或因子:影响响应变量的因素
例1中即为烫伤后的时间
2.
水平:因素所处的各个状态
1.
M S S S B B/ B F = M S S S E E/ E
20
水 平 数 ( 例 1 中 为 3 ) 1 样 本 总 量 ( 例 1 中 为 3 0 ) - 水 平 数
B E
M S S / 1 9 . 8 3 1 4 / 2 B S B B 1 F = = = 1 4 . 3 2 M S S / 1 2 . 9 7 1 2 / 2 7 E S E E 1
T E
B
( 总 变 异 ) ( 误 差 变 异 ) ( 组 间 变 异 ) S S S S S S
S S S S 平 均 变 异 , M S M S ν ν
E B E B E B
18
SSB SST SSE
19
例 1:
假设检验: H0:1=2=3(三个时间的ATP含量相同) H1:A≠B(三个时间ATP含量不同或不 全相同) =0.05 2. 求检验统计量F值及自由度(列方差分析 表)
3.求 P 值,下结论。 若F≤1,不必查表,P> 。本例,P< , 拒绝H0 ,接受H1 ,即不同处理的总体均数 不同或不全相同(有待多重比较进一步分 析)。
各个样本是相互独立的随机样本
第六方差分析学习教案
第21页/共25页
第二十二页,共25页。
多重比较方法是指通过不同水平均值之间的两两 配对比较,来检验(jiǎnyàn)各个总体均值之间是否 存在显著差异的假设检验(jiǎnyàn)方法和过程。
那是不是直接利用正态总体均值检验(jiǎnyàn) ,做如下的检验(jiǎnyàn)就可以了呢?
第六方差分析
会计学
1
第一页,共25页。
一、方差分析的一般(yībān)问题
1、两个(liǎnɡ ɡè)引子
例 某企业为了分析研究成品车间的产品质量控制 (kòngzhì)问题,对该车间的5个班组的产品优等 品率进行了一次抽查,在每个班组独立地抽取了5 个优等品率数据构成了随机样本,结果如下表:
观察值
观察值
优等品率
1组
81
82
84
86
84
2组
83
80
85
84
81
班组
3组
84
87
87
88
90
4组
86
82
89
87
91
5组
92
89
90
89
90
因素
水平 (shuǐpí
ng)
观测值
分析均值间是否有明显(míngxiǎn)差异。
第6页/共25页
第七页,共25页。
3、方差分析的基本假定
方差分析基本假定的一般性的表述为,
第18差分析表 在实际进行单因子方差分析时,通常将有关的
统计量连同分析结果列在一张表里面(lǐmiàn),已 达到一目了然的目的,称为方差分析表
差异来源 离差平方和 自由度
chapter6方差分析PPT课件
总均方一般不等于处理间均方加处理内均方。
.
24
某B水iosta产tisti研cs 究所为了比较四种不同配合饲料 对鱼的饲喂效果,选取了条件基本相同的鱼 20尾,随机分成四组,投喂不同饲料,经一 个月试验以后,各组鱼的增重结果列于下表。
.
25
Biostatistics
这是一个单因素试验,处理数k=4,重复数 n=5。各项平方和及自由度计算如下:
(xij xi.)分别eij是μ、(μi-.
14
Biostatistics
告诉我们:
( 每个观或x测ij 值 都i),包故含k处nx理i个j 效观xi.应测(值μ的i-总μ或变异可)x分i.,解与为x.误处. 差理
间的变异和处理内的变异两部分。
.
在单因素试验结果的方差分析中,无效假设
为H0:μ1=μ2=…=μk,备择假设为HA:各μi不 全相等,或H0 :2 =0,H A2 : ≠0;
F=MSt/MSe,也就是要判断处理间均方是否
显著大于处理内(误差)均方。
如果结论是肯定的,我们将否定H0;反之,不 否定H0。
.
33
Biostatistics
次的处理间变异,称为处理间平方和,记为SSt,
即
k
SSt n (xi.x..)2
i1
.
18
式B中ios,tatisticsk n (为xij 各 xi处.)2 理内离均差平方和之和,
i1 j1
反映了各处理内的变异即误差,称为处理内平方
和或误差平方和,记为SSe,即
于是有
kn
SSe
(xij xi.)2
Biostatistics
第六章 方差分析 analysis of variance(ANOVA)
方差分析1ppt课件
精选PPT课件
15
随机区组设计的方差分析SPSS操作
▪ Analyze General Linear Model
Univariate
Dependent Variable: x
要分析的应变量为x
Fixed Factor框: t,w
固定效应变量为t、w
Model :
要求自定义方差分析模型
Build Terms下拉列表:Main effects 模型中准备纳入主效应
第三,下结论时用语要准确,不能绝对化
➢ P ≤α ,按α水准,拒绝H0 ,接受H1,差别有统计学意义(统计结论) , 可认为……不同或不等。
➢ P >α ,按α水准,不拒绝H0,差别无统计学意义,尚不能认为……不
同或不等。
精选PPT课件
3
方差分析的应用条件
▪ 独立
nomal
只有各样本为相互独立的随机样本,才能不保证变异的可分解性(最严格)
▪ 定义:亦称配伍组设计或双因素无重复试验设计。分为两 种情况:对同一受试对象在同一处理不同水平的比较;或 将几个受试对象按一定条件配成区组,再将每一区组的各 受试对象随机分配到各个处理组中去。每个区组的例数等 于处理组个数。
▪ 注意:用于区组的因素应该是影响试验效应的非处理因素。 ▪ 当只有两个区组时,该设计变成了配对设计
组别变量g
▪ 录入数据
▪ Analyze Compare Means one way ANOVA
Dependent List框:x 要分析的结果变量为x
Factor框: g
分组变量为g
Options :
要求进行方差齐性检验
Post Hoc :
两两比较方法采用SNK法
CH6_1方差分析和正交试验设计 应用数理统计课件
Ch6方差分析和正交试验设计2014年5月28日星期三12时2分2秒主要内容方差分析概述单因子方差分析不考虑交互作用的双因子方差分析 考虑交互作用的双因子方差分析 正交试验设计方差分析是应用广泛的实验数据统计分析方法其实质是检验多个变量均值的一致性.方差分析概述ANOVA 由英国统计学家R.A.Fisher 首创.为纪念Fisher ,方差分析又称F 检验.方差分析的几个基本概念如原料成分、原料剂量、催化剂等.—试验中因子所处的不同状态. 试验指标—试验所考察的事项,亦称响应变量.如考察化工生产中产品的质量、数量.试验因子—影响试验指标的因素.因子水平单因子方差分析—单指标、单因子、多因子水平的实验数据分析.双因子方差分析—单指标、双因子、多因子水平的实验数据分析.常用大写英文字母表示试验因子,用大写字母加下标表示该因子的不同水平.方差分析的工作目标依据实验数据,判断不同因子水平下指标变量取值否有差异?即:比较不同因子水平下指标的均值是否相等英语成绩是否有显著影响.若有影响,哪一种教学方法好?同的变量.分析问题是判断教师所采用的不同教学方法对学生方差分析中将因子的各个水平下的试验指标看作是不指标变量—英语成绩.影响因子—教学方法,记为A .因子水平—三种不同的教学方法,记为A 1, A 2, A 3.通常假定每一个变量服从方差相等的正态分布,并且 方差分析的三个基本的理论假设是相互独立的.显然,这是一个单因子方差分析问题.如三种教学方法下的英语成绩ξ1, ξ2, ξ3.方差分析的基本思路判断不同的教学方法对英语成绩的影响是否有显著差异,按Fisher 的思路可以通过分析造成成绩数据差异的原因来得到答案.实验数据(英语成绩)差异的来源:n条件误差—由因子的不同水平(三种不同的教学方法)引起的差异.o随机误差—由随机因素(不可控制或不可预知的因素,如考试时的环境、时间对学生的影响)引起的差异.实验数据之间的差异可用离差平方和的概念描述.方差分析中的一个最基本的关系式,就是将数据总的离差平方和按照产生的原因进行分解,得到:总离差平方和= 条件误差平方和+ 随机误差平方和方差分析的任务就是进一步判断:在总离差平方和中,条件误差平方和与随机误差平方和究竟哪一个是决定性的(占更大的比重)?如果是条件误差平方和是决定性的,则说明因子的不同水平对指标变量的影响是有差异的.因子的不同水平对指标变量的影响是否有差异,可以用不同水平下指标变量的均值是否相同来描述.方差分析基本任务的统计描述判断不同水平下指标变量的均值是否相同,可归结为统计推断问题,即检验假设H 0: 不同因子水平下指标变量的均值相同;H 1: 不同因子水平下指标变量的均值不完全相同.n 当前的问题是否满足三个基本的理论假设;围绕H 0 的检验,应思考并解决如下三个方面的问题:p 若拒绝H 0 ,如何找出因子的最优处理?o 检验统计量的构造与分布是怎样的?如何决策?F解2012344~(,),1,2,3,4:i i N i H ξμσμμμμ====这可以看作是一个单因子方差分析问题。
方差分析(1)
例:黑龙江某地淋溶土上玉米氮肥品种肥效试 验,每亩施N6斤,小区面积54m2 ,随机区组设计, 重复四次,玉米产量见下表.请对不同品种氮肥的 肥效进行分析.
重复 1 2 3 4 Ts
CK 126.8 148.7 121.9 83.1 480.2
碳铵 233.8 231.1 226.0 221.3 911.9
(Fisher’s protected D, 或FPLSD)
13
L.S.D法是t检验法,其只适用于二个相 互独立的平均数间的比较。而复因素试验的 互比时,由于交互作用的存在,平均数间失 去了独立性,从而增大了二个平均数间的差 值,用t检验时易产生a错误。
14
(二)最小显著极差法:LSR法,采用不 同平均数间用不同的显著差数标准进行比 较。又根据标准的严格,分为新复极差法 和q法
2
二.平方和与自由度的可加性与分解性
方差分析就是将总平方和以及总自由度划分成若 干个分量,而每一个分量与试验设计中的一个因素相 关联,所以方差分析的第一步就是从总变异中分解平 方和与自由度开始。
全部资料的总平方和可以分解成组内平方和与组 间平方和两部分)——平方和的分解性。 平方和与 自由度的分解性与可加性就是方差分析的数学基础。
第一节 方差分析的基本原理
方差分析是将一个试验的总变异分解为各变因的相应部 分,以误差作为统计假设检验的依据,对其它可控变因进 行显著性检验,并判断各变因的重要性。
将总变异剖分为各个变异来源的相应部分,从而发现 各变异原因中相对重要程度的一种统计分析方法。
1
一.变异因素的划分 处理间变异:组间变异——试验效应 处理内变异:组内变异——试验误差
氯铵 264.6 252.9 267.5 150.3 935.2
《方差分析课时》课件
可以使用统计软件或图形方法(如直方图、QQ图等)对数据进行正态性检验。 如果数据不符合正态分布,可以考虑对数据进行适当的转换或使用非参数方法进 行统计分析。
数据的方差齐性检验
总结词
在进行方差分析之前,需要检验各组数据的方差是否齐性,因为方差分析的另一个前提假设是各组数 据的方差必须齐性。
详细描述
方差分析的基本思想
总结词
方差分析的基本思想是将数据的总变异分为组内变异和组间变异两部分,并比较这两部 分的变异程度。
详细描述
方差分析的基本思想是通过将数据的总变异分解为组内变异和组间变异两部分,来评估 组间变异是否显著大于组内变异。如果组间变异的比例显著大于组内变异的比例,则说 明不同组别或处理之间的均值存在显著差异;反之,则说明各组之间没有显著差异。通
03
方差分析的步骤
数据的收集与整理
确定研究目的
在开始方差分析之前,需 要明确研究的目的和目标 ,以便收集合适的数据。
数据来源
确定数据来源,包括调查 、实验、公开数据等,确 保数据的可靠性和有效性 。
数据整理
对收集到的数据进行整理 ,包括数据清洗、缺失值 处理、异常值处理等,以 确保数据的质量。
数据的分组与分类
行计算。
结果解释
根据计算结果,检验
进行显著性检验,以判断各组间是 否存在显著差异,并解释差异产生 的原因。
04
方差分析的应用实例
单因素方差分析实例
总结词
用于比较三个或更多组间的总体均值 是否存在显著差异。
详细描述
单因素方差分析是用来比较三个或更 多组间的总体均值是否存在显著差异 的统计方法。例如,比较不同地区的 销售业绩是否存在显著差异。
06
方差分析-1
2013年10月22日
一、完全随机设计的方差分析
完全随机设计也叫成组设计 单因素多水平(k>2)设计 K=2时,用成组t检验 K>2时,采用单因素方差分析
分组方式:
1、将受试对象随机分配到各处理组中 2、分别从不同总体中进行随机抽样 样本含量:可以相等(称平衡设计),也可 不等(称非平衡设计)。平衡设计时检验效能 较高。 2013年10月22日
2013年10月22日
(三)下结论
查附表4,F界值表,F0.05(3,35)=2.78,
F> F0.05(3,35),P<0.05拒绝H0,接受H1,四 个总体间的差异有统计学意义,可以认为不 同中药对小白鼠细胞免疫机能的影响不同。 如要了解哪两个总体间有差别,哪两个 总体间没有差别,需要进一步做多个样本均 数间的两两比较。
1 (1 0.05) 0.1426
3
1 (1 0.05) 0.2649
4
2013年10月22日
“多重比较”的几种方法
一、SNK-q检验(多个均数间全面比较) 二、LSD-t检验(有专业意义的均数间比较) 三、Dunnett检验 (多个实验组与对照组比较) 还有TUKEY 、DUNCAN、 SCHEFFE、 WALLER 、BON等比较方法
2013年10月22日
ANOVA 由英国统 计学家R.A.Fisher首创, 为纪念Fisher,以F命名, 故方差分析又称 F 检验 (F test)。用于推断 多个总体均数有无差异
2013年10月22日
方差分析的基本思想
根据变异的不同来源,将全部观察值总的离
均差平方和及自由度分解为两个或多个部分
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3
内容
• 方差分析基本概念 • 单因素方差分析 • 单因素方差分析—均数的多重比较 • 双因素方差分析(1): 无交互作用方差分析 • 附录:均数的多重比较—几种常用方法
P(reject in at least one test) = 1-0.857 = 0.143 0.143即是犯第一类假设检验错误的概率,远大于0.05
25
单因素方差分析--均数的多重比较
Bofferoni 校正法 (Bofferoni Correction)
在均值的多重检验中,设犯Ⅰ类错误的总概率为
生物统计学
第6讲 实验设计与方差分析(1)
2014.10
1
引言
对于 H0: μ1= μ2 vs. HA: μ1≠μ2 可采用两独立样本 t 检验
如果需要检验多个总体均值是否存在显著性差异, 需采用
什么方法?
若考虑仍采用两独立样本t 检验
在只有3个总体的情况下,将样本两两配对,需做3次独立 样本t 检验
方差分析应用条件 1. 各样本是相互独立的随机样本(变异的可加性) ; 2. 各样本来自正态总体; 3. 各处理组总体方差相等,即方差齐性或齐同 (homogeneity of variance)。 上述条件与两均数比较的 t 检验的应用条件相类似。 当组数为2时,方差分析与两均数比较的t检验是等价 的
MSB
SSB B
νW = N – a νB = a – 1
MS: 均方差 (Mean Square, MS)
19
单因素方差分析
F值越大,越说明总的方差波动中,组间方差是主 要部分,待检验因素的影响越显著,有利于拒绝原假设 接受备选假设;
反之,F值越小,越说明随机方差是主要的方差来 源,说明待检验的因素对总体波动没有显著影响,有利 于接受原假设。
μ1与μ2不相等 28
单因素方差分析--均数的多重比较
2. John Hopkins (中心1) 及 St. Louis (中心3)
t
13
x1 x3
1.64
MSW(
1 n1
1 n3
)
df=60-3=57
p=0.107>0.033,在0.033显著性水平接受零假设H0: μ1 = μ3
3. Rancho Los Amigos (中心2)及St. Louis (中心3)
16
单因素方差分析
三种变异之间的关系
SST= SSB + SSW
自由度νT= νB+ νW
νB = a – 1,
νw = (n1-1)+ (n2-1) …+(na-1)
=N–a νT = N-1
a
N ni i 1
单因素方差分析
问题: 每组样本均数与全总体均数间的差异,以及每组组内 所有观测值与该组均数的差异,是否第一个差异要比 第二个差异大?
(John Hopkins, Rancho Los Amigos 以及 St. Louis) 分别
抽取了21名、16名及23名病人, 测其FEV1指标,相关数
据见下页
21
22
单因素方差分析
H0: 1 =2 = 3 vs H A: 1, 2 , 3 不全等
MSB n1
在多因素试验中,实施在试验单位上的具体项目是各因素的某 一水平组合。例如进行三个品牌的某化学药物在3个剂量水平上对 收缩压降低水平的两因素试验,整个试验共有3×3=9个水平组 合,实施在试验单位(高血压患者)上的具体项目就是某品牌降压药 物与某种剂量的结合。所以,在多因素试验时,试验因素的所有 水平组合就是一个处理组合。
如果如上述所说,则组间总体均值间的差异要高过组内观测值 间的差异(个体差异),也就表明,每组总体均值不全相等。
17
18
3
单因素方差分析
H0:μ1= μ2 = … = μα vs. 全相等
检验统计量
F
MSB MSW
HA: μ1, μ2 , … , μα 不 F ~F(α-1, N-α)
MSW
SSW W
Bonferroni 校正的适用性 • 当比较次数不多时,Bonferroni法的效果较好。 • 但当比较次数较多(例如在10次以上)时,则由于 其检验水准选择得过低,结论偏于保守。
27
单因素方差分析--均数的多重比较
例2. 还是采用例1中三家医学中心冠状动脉患者FEV1的例子, 对三个总体进行两两 t 检验
试验因素常用大写字母A、B、C、…等表示。
7
方差分析—常用术语
2. 因素水平(level of factor) 试验因素所处的某种特定状态或数量等级称为因
素水平,简称水平。 比如临床试验中, 研究某一降血压药物三种不同剂
量降低收缩压的效果, 三种剂量就是收缩压降低水平 这个试验因素的三个水平
8
方差分析—常用术语
13
14
单因素方差分析
三种不同的变异
1. 总变异 (Total variation):全部测量值 xij与总均数 x.. 的
差异
SST
a i 1
ni
( xij
j 1
x..)2
a i 1
ni
xi2j
j 1
x2 N
2. 组间变异 (between group variation):各组的均数 xi 与
单个比较的显著性水平:
*
a
2
统计量
t
xi x j
MSW(
1 ni
1 nj
)
自由度 N a
a
ni 1 si2
原因:共有N个观测值参加计算
MSW
i 1 a
ni a
i 1
请注意: a [ei] (alpha)
用去了a个统计量
26
单因素方差分析--均数的多重比较
3. 试验处理(treatment)
事先设计好的实施在试验单位上的具体项目叫试验处理。
在单因素试验中, 实施在试验单位上的具体项目就是试验因素的 某一水平。比如临床试验中, 研究三个品牌的某化学药物降低收缩 压的效果, 三个品牌就是收缩压降低水平这个试验因素的三个水平。 单因素试验时, 试验因素的一个水平就是一个处理。
t23
x2 x3
0.91
MSW(
1 n2
1) n3
df=60-3=57
p=0.367>0.033,在0.033显著性水平接受零假设接受零假设H0: μ2= μ3
29
双因素方差分析
假设某个试验中,有两个可控因素在变化,因素A有a 个水平,记作A1,A2,…,Aa;因素B有b个水平,记 作B1,B2,….Bb;则A与B的不同水平组合AiBj(i=1, 2,…,a;j=1,2,…,b)共有ab个,每个水平组合 称为一个处理,每个处理只作一次试验,得ab个观测 值Xij,得双因素无重复实验表
and Interaction)
6
1
方差分析—常用术语
1.试验因素(Experimental Factor): 试验中所研究的影响试验指标的因素叫试验因素。方
差分析的目的就是分析因子对实验或抽样的结果有无显 著影响。
当试验中考察的因素只有一个时,称为单因素试验, 比如研究一种药物对某疾病的疗效;
若同时研究两个或两个以上的因素对试验指标的影响 时,则称为两因素或多因素试验,比如同时研究两种或 两种以上的药物对某疾病的疗效。
)2
i 1 j 1
15
单因素方差分析
变异与离差平方和的关系
xij x xi x xij xi
某一观测值与 总均值的差异
组间差异
组内差异 实验误差eij残差估计值
取平方后对i,j求和
交叉项对i,j求和后均为0
SST = SSB + SSW eij xij xˆij , xˆij xi
检验的拒绝域安排在右侧。
20
单因素方差分析
单因素方差分析
例1. 为研究一氧化碳摄入对冠状动脉疾病患者的影响,研
究时需考虑的一项指征是患者的肺功能,以第一秒用力呼 气容积 (FEV1) 作为研究指标, 如果来自某一医学中心的患
者FEV1水平比其他中心的患者FEV1水平高(或低), 则说明
分析结果受肺功能这一因素的影响,研究者从三家医院
总均数 x.. 间的差异
SSB
a
n i (xi
i i2 ni
x2 N
3. 组内变异(within group variation ):每组的每个测量值
xij与该组均数 xi 的差异
a ni
SSW SST SSB
( xij
x i
如果有10个样本总体呢?
需做独立样本t检验的次数:120
45
次
2
引言
常规 t 检验在多重比较中的局限 对三个总体两两t检验, 在0.05水平,3次检验都不拒绝H0的 概率为
P(fail to reject in all three tests)=(1-0.05)3 = 0.953 = 0.857 那么,3次检验至少拒绝一次检验的概率
x1 x 2 n2
x2 x 2 n3 31
x3 x 2 0.769L2
MSW
n1 1 s12 n2 1 s22 n3