第四章 方差检验
STATA 第四章 t检验和单因素方差分析命令输出结果说明
i ng si n第四章 t 检验和单因素方差分析命令与输出结果说明·单因素方差分析单因素方差分析又称为Oneway ANOVA ,用于比较多组样本的均数是否相同,并假 定:每组的数据服从正态分布,具有相同的方差,且相互独立,则无效假设。
原假设:H 0:各组总体均数相同。
在STATA 中可用命令:oneway 观察变量 分组变量[, means bonferroni]其中子命令bonferroni 是用于多组样本均数的两两比较检验。
例:测定健康男子各年龄组的淋巴细胞转化率(%),结果见表,问:各组的淋巴细 胞转化率的均数之间的差别有无显著性?健康男子各年龄组淋巴细胞转化率(%)的测定结果:11-20 岁 组:58 61 61 62 63 68 70 70 74 7841-50 岁 组:54 57 57 58 60 60 63 64 6661-75 岁 组:43 52 55 56 60用变量x 表示这些淋巴细胞转化率以及用分组变量group=1,2,3分别表示 11-20岁组,41-50岁组和61-75岁组,即:数据表示为:x 586161626368707074785457group 111111111122x 575860606364664352555660group 222222233333则 用 STATA 命 令:oneway x group, mean bonferroni| Summary of xgroup | Mean ①-------------+------------1 | 66.52 | 59.8888893 | 53.2------+------------Total | 61.25 ②Analysis of VarianceSource SS df MS F Prob > F------------------------------------------------------------------------------- Between groups 616.311111③ 2 ④ 308.155556⑤ 9.77⑥ 0.0010⑦Within groups 662.188889⑧ 21⑨ 31.5328042⑴-------------------------------------------------------------------------------Total 1278.50 23 55.586956(2)Bartlett's test for equal variances:chi2(2) = 2.1977 (3)Prob>chi2=0.333Comparison of x by group(Bonferroni)Row Mean- |Col Mean | 1 2-------------- --|--------------------------------------2 | -6.61111 (4)| 0.054 (5)|3 | -13.3 (6) -6.68889(8)| 0.001 (7) 0.134 (9)①对应三个年龄组的淋巴细胞转化率的均数;②三组合并在一起的总的样本均数;③组间离均差平方和;④组间离均差平方和的自由度;⑤组间均方和(即:⑤=③/④);⑧组内离均差平方和;⑨组内离均差平方和的自由度;(1)组内均方和(即:(1)=⑧/⑨);⑥为F 统计值(即为⑤/(1));⑦为相应的p值;(2)为方差齐性的Bartlett检验;(3)方差齐性检验相应的p值;(4)第二组的淋巴细胞转化率样本均数—第一组的淋巴细胞转化率的样本均数的差;(5)第二和第一组均数差的显著性检验所对应p 值;(6)第三组的淋巴细胞转化率样本均数—第一组的淋巴细胞转化率的样本均数的差;(7)第三和第一组均数差的显著性检验所对应的 p 值;(8)第三组的淋巴细胞转化率样本均数—第二组的淋巴细胞转化率的样本均数的差;(9)第三和第二组均数差的显著性检验所对应的p 值。
4方差分析
4方差分析方差分析(Analysis of Variance, ANOVA)是一种统计分析方法,用于比较两个或多个样本组间的均值是否有显著差异。
方差分析通过比较组间的变差和组内的变差来进行判断。
在进行方差分析之前,需要满足以下假设:独立性假设、正态性假设和方差齐性假设。
独立性假设指样本之间相互独立,正态性假设指样本符合正态分布,方差齐性假设指不同样本组的方差相同。
方差分析的基本思想是将总体的方差分解为组间方差和组内方差两部分,然后通过比较组间均方与组内均方的大小来判断组间均值是否存在显著差异。
具体步骤如下:1.建立假设:设有k个样本组,组之间的均值分别为μ1,μ2,...,μk,假设H0:μ1=μ2=...=μk,Ha:至少有一组的均值不相等。
2.计算组间均方(MSB):MSB等于组间平方和(SSB)除以自由度(k-1,k为组数)。
组间平方和是各组均值与总体均值的差的平方和。
3.计算组内均方(MSW):MSW等于组内平方和(SSW)除以自由度(N-k,N为总体样本数)。
组内平方和是各组内各样本值与各组均值的差的平方和。
4.计算F值:F值等于MSB除以MSW。
5.查表或计算P值:根据F分布表或计算得到的P值,判断F值是否大于临界值或P值是否小于显著性水平(通常为0.05),若满足显著性要求,则拒绝原假设。
方差分析具有以下优点:1.可以同时比较多个样本组的均值差异,适用于多个样本的情况。
2.可以将总体方差分解为组间方差和组内方差,从而更好地了解不同样本组的变差情况。
3.可以通过F值和P值来判断均值差异的显著性。
4. ANOVA可以进行多重比较,如Tukey检验、LSD检验等,可以对具体的组别进行比较。
然而,方差分析也存在一些限制:1.方差分析要求样本之间相互独立,正态分布和方差齐性,如果数据不满足这些假设,则分析结果可能不准确。
2.方差分析只能检验组间均值是否有差异,无法给出具体的均值大小和差异的方向。
研究生 试验设计与数据处理 第四章
PDF created with pdfFactory Pro trial version
举 例
1. 判断颜色对销售量是否有显著影响,实际上也
就是检验具有同方差的四个正态总体的均值是 否相等的问题 2. 如果四个总体的均值相等,可以期望四个样本 的均值也会很接近 § 四个样本的均值越接近,我们推断四个总体均值
PDF created with pdfFactory Pro trial version
1. 随机误差
2.
在因素的 同一 水平 ( 同一 个总体 ) 下 ,样本的 各观 察值之间的差异 § 比如,同一种颜色的饮料在不同超市上的销售量 是不同的 § 不同超市销售量的差异可以看成是随机因素的影 响 ,或者 说是 由 于 抽样的随 机 性 所 造 成 的, 称 为 随机误差 系统误差 § 在因素的不 同 水平 ( 不 同 总体 ) 下 , 各观 察值之 间 的差异 § 比如,同一家超市,不同颜色饮料的销售量也是 不同的 § 这种差异可能是由于抽样的随机性所造成的,也 可能 是由 于颜色本 身所造成 的,后者 所形成的 误 差是由系统性因素造成的,称为系统误差
什么是方差分析?
(例子的进一步分析)
① 检验饮料的颜色对销售量是否有影响,也就 是检验四种颜色饮料的平均销售量是否相同 ② 设µ1为无色饮料的平均销售量,µ2粉色饮料的 平均销售量,µ3为橘黄色饮料的平均销售 量, µ 4 为绿色饮料的平均销售量, 也就是检 验下面的假设 ① H0: µ1 = µ2 = µ3 = µ4 ② H1: µ1 , µ2 , µ3 , µ4 不全相等 ③ 检验上述假设所采用的方法就是方差分析
1 2 3 4 5
该饮料在五家超市的销售情况 无色
26.5 28.7 25.1 29.1 27.2
方差分析(F检验)
医学统计学
2010-1119 17
随机区组设计资料 方差分析
研究酵解作用对血糖 受试者号 放置时间(分) 浓度的影响,从8名健康 45 90 135 人中抽取了血液并制备成 (区组) 0 1 5.27 5.27 4.94 4.61 血滤液,每个受试者的血 2 5.27 5.22 4.88 4.66 滤液分成四份,再随机把 3 5.88 5.83 5.38 5.00 4 5.44 5.38 5.27 5.00 4份血液分别放置0、45、 5 5.66 5.44 5.38 4.88 90、135分钟后测定其血 6 6.22 6.22 5.61 5.22 糖浓度,试分析放置不同 7 5.83 5.72 5.38 4.88 时间的血糖浓度有无变化。 8 5.27 5.11 5.00 4.44
处理因素 治疗方法 抽样误差 个体差异 组间变异 总变异 组内变异
医学统计学
2010-1119 10
因组间变异数大小与组数(组间自由度 因组间变异数大小与组数(组间自由度K-1)有关,故用 )有关, 组间变异数除以自由度所得组间均方来表示组间变异。
ms
组间
ss 组间 = k −1
k=组数
因组内变异数大小与各样本含量大小即组内自由度∑(ni –1) 因组内变异数大小与各样本含量大小即组内自由度 有关, 有关,故用组内变异数除以组间自由度所得组内均方来表示组 内变异。 内变异。
医学统计学
2010-1119 3
三、方差分析的条件
1、被比较的资料要有可比性。 被比较的资料要有可比性。 被比较的资料要有实际意义。 2、被比较的资料要有实际意义。 被比较的资料要呈正态分布。 3、被比较的资料要呈正态分布。 被比较的资料各组方差齐同。 4、被比较的资料各组方差齐同。
spss整理(大题目)
spss整理(大题目)Spass整理第三章统计假设检验二、两样本平均数统计假设检验例3-11.随机抽取 2 个品种的苹果果实的果肉硬度(磅/cm 2),试比较2 品种苹果的果肉硬度是否存在显著差异?SPSS 操作:菜单Analyze —Independent-Samples T Test在独立样本T检验(成组T检验)比较中,结果会分2种情况输出,对应着结果表的数据是2行,第一行是假设方差相等的数据,第二行是假设方差不相等的数据。
最终的结果是看第一行还是第二行,需要看Levene's Test for Equality of Variances(方差齐性检验)的结果。
如果Levene's Test for Equality of Variances 结果是方差相齐的,则看第一行数据,否则看第二行数据。
分析过程:首先,Levene's Test for Equality of Variances H0:2组数据方差相等(相齐),检验结果显著值(Sig.)为0.947 > 0.05,接受H0,2组数据方差相等,看第一行数据. 其次,T检验的显著值(Sig.)是0.458 > 0.05,说明接受T检验的H0:2组数据对应总体的均值无显著差异,即2个品种的苹果果实的果肉硬度无显著差异。
例3-12. 选用10个品种的草莓进行电渗处理和传统方法对草莓果实中钙离子含量的影响,结果如下,请问电渗处理和传统处理方法对草莓果实中钙离子含量是否有显著的差异?SPSS 操作:因为该试验是对10 个品种的每个品种进行2种方法测试,因此需要使用成对样本均值的T 检验,而不能用成组样本的T检验在成对样本T 检验结果表中,需要看T检验的显著值。
分析过程:成对样本T 检验(Paired-Samples T T est)结果,显著值(Sig.)为0 < 0.05 ( 0.01 ),否定H0:2种处理方法对应的总体均值相等,说明传统方法和电渗处理2种方法测试的草莓果实中钙离子含量之间有显著(极显著)差异,根据分析结果,对照—电渗处理的均值小于0,说明电渗处理法测试的草莓果实中钙离子含量显著提高。
STATA第四章t检验和单因素方差分析命令输出结果说明
第四章 t检验和单因素方差分析命令与输出结果说明·单因素方差分析单因素方差分析又称为Oneway ANOVA,用于比较多组样本的均数是否相同,并假定:每组的数据服从正态分布,具有相同的方差,且相互独立,则无效假设。
原假设:H0:各组总体均数相同。
在STATA中可用命令:oneway 观察变量分组变量[, means bonferroni]其中子命令bonferroni是用于多组样本均数的两两比较检验。
例:测定健康男子各年龄组的淋巴细胞转化率(%),结果见表,问:各组的淋巴细胞转化率的均数之间的差别有无显著性?健康男子各年龄组淋巴细胞转化率(%)的测定结果:11-20 岁组:58 61 61 62 63 68 70 70 74 7841-50 岁组:54 57 57 58 60 60 63 64 6661-75 岁组:43 52 55 56 60用变量x 表示这些淋巴细胞转化率以及用分组变量group=1,2,3分别表示11-20岁组,41-50岁组和61-75岁组,即:数据表示为:x 58 61 61 62 63 68 70 70 74 78 54 57 group 1 1 1 1 1 1 1 1 1 1 2 2x 57 58 60 60 63 64 66 43 52 55 56 60 group 2 2 2 2 2 2 2 3 3 3 3 3则用 STATA 命令:oneway x group, mean bonferroni| Summary of xgroup | Mean ①-------------+------------1 | 66.52 | 59.8888893 | 53.2------+------------Total | 61.25 ②Analysis of VarianceSource SS df MS F Prob > F-------------------------------------------------------------------------------Between groups 616.311111③ 2 ④ 308.155556⑤ 9.77⑥ 0.0010⑦Within groups 662.188889⑧ 21⑨ 31.5328042⑴-------------------------------------------------------------------------------Total 1278.50 23 55.586956(2)Bartlett's test for equal variances:chi2(2) = 2.1977 (3)Prob>chi2=0.333Comparison of x by group(Bonferroni)Row Mean- |Col Mean | 1 2-------------- --|--------------------------------------2 | -6.61111 (4)| 0.054 (5)|3 | -13.3 (6) -6.68889(8)| 0.001 (7) 0.134 (9)①对应三个年龄组的淋巴细胞转化率的均数;②三组合并在一起的总的样本均数;③组间离均差平方和;④组间离均差平方和的自由度;⑤组间均方和(即:⑤=③/④);⑧组内离均差平方和;⑨组内离均差平方和的自由度;(1)组内均方和(即:(1)=⑧/⑨);⑥为F 统计值(即为⑤/(1));⑦为相应的p值;(2)为方差齐性的Bartlett检验;(3)方差齐性检验相应的p值;(4)第二组的淋巴细胞转化率样本均数—第一组的淋巴细胞转化率的样本均数的差;(5)第二和第一组均数差的显著性检验所对应p 值;(6)第三组的淋巴细胞转化率样本均数—第一组的淋巴细胞转化率的样本均数的差;(7)第三和第一组均数差的显著性检验所对应的 p 值;(8)第三组的淋巴细胞转化率样本均数—第二组的淋巴细胞转化率的样本均数的差;(9)第三和第二组均数差的显著性检验所对应的p 值。
课件方差分析
例子2
五个商店以各自的销售方式卖出新型健身器, 连续五天各商店健身器的销售量如下表所示。销 售量服从正态分布,且具有方差齐性,试考察销 售方式对销售量有无显著影响,并对销售量作两 两比较。
双因素方差分析假设
双因素方差分析数据结构表
双因素方差分析表
双因素方差分析SPSS界面
例子1
例子2
西方国家有一种说法,认为精神病与月亮有关,月 圆时,人盯着州亮看,看得太久,就会得精神病。中医 也有一种说法,认为精神病与季节有关,特别是春季, 人最容易得精神病。为了检验这两种说法是否有道理, 对某地平均每日精神病发病人数统计如下:
SSR与MSR
组间差异(组间平方和,简称SSR): 各组平均值与总平均值离差的平方和, 反映了各水平之间的差异程度或不同 的处理造成的差异。
组间均方: MSR= SSR /(自由度k-l)
SSE与MSE
组内差异(组内平方和、残差平方和, 简称SSE): 每个样本数据与其组平均值离差的平方和, 反映了随机误差造成差异的大小。
例子2
Байду номын сангаас
单因素练习1
某饮料生产企业研制出一种新型饮料。饮料的颜色共 有四种,分别为桔黄色、粉色、绿色和无色透明。随机从 五家超级市场上收集了前一期该种饮料的销售量。
问:饮料的颜色是否对销售量产生影响。
超市 1 2 3 4 5
无色 26.5 28.7 25.1 29.1 27.2
粉色 桔黄色 绿色 31.2 27.9 30.8 28.3 25.1 29.6 30.8 28.5 32.4 27.9 24.2 31.7 29.6 26.5 32.8
概述 方差分析的分类
方差分析按所涉及因素的多少可分为: 单因素方差分析 双因素方差分析 多因素方差分析
第四章 异方差检验的eviews操作
第四章异方差性例一、参数估计进入Eviews软件包,确定时间范围,编辑输入数据;选择估计方程菜单:(1)在Workfile对话框中,由路径:Quick/Estimate Equation,进入Equation Specification对话框,键入“log(y) c log(x1) log(x2)”,确认ok,得到样本回归估计结果;(2)直接在命令栏里输入“ls log(y) c log(x1) log(x2)”,按Enter,得到样本回归估计结果;(3)在Group的当前窗口,由路径:Procs/Make Equation,进入Equation Specification窗口,键入“log(y) c log(x1) log(x2)”,确认ok,得到样本回归估计结果。
如表:表图估计结果为:R2= .= F= RSS=括号内为t统计量值。
二、检验模型的异方差(一)图形法(1)生成残差平方序列。
①在Workfile的对话框中,由路径:Procs/Generate Series,进入Generate Series by Equation对话框,键入“e2=resid^2”,生成残差平方项序列e2;②直接在命令栏里输入“genr e2=resid^2”,按Enter,得到残差平方项序列e2。
(2)绘制散点图。
①直接在命令框里输入“scat log(x2) e2”,按Enter,可得散点图。
②选择变量名log(x2)与e2(注意选择变量的顺序,先选的变量将在图形中表示横轴,后选的变量表示纵轴),再按路径view/graph/scatter/simple scatter ,可得散点图。
③由路径quick/graph进入series list窗口,输入“log(x2) e2”,确认并ok,再在弹出的graph窗口把line graph换成scatter diagram,再点ok,可得散点图。
图由图可以看出,残差平方项e2对解释变量log(X2)的散点图主要分布图形中的下三角部分,大致看出残差平方项e2随log(X2)的变动呈增大的趋势,因此,模型很可能存在异方差。
正交检验的极差分析和方差分析(教学课堂)
(Yij i )2
(Yij i )2
i1 j1
令下列各偏导数为零
S 0,
S 0
i
(i=1,2,…,k)
特选课堂
2
第四章 方差分析
4.1 方差分析的基本概念和原理
表 4-1 对6种型号生产线维修时数的调查结果
序号 型号
A型 B型 C型 D型 E型 F型
1
9.5 4.3 6.5 6.1 10.0 9.3
2
8.8 7.8 8.3 7.3 4.8 8.7
特选课堂
3
11.4 3.2 8.6 4.2 5.4 7.2
第四章 方差分析
4.2.1 数学模型和数据结构
其中:
i 纯属Ai作用的结果,称为在Ai条件下Yi的真值(也称为
在Ai条件下Yi的理论平均). i是实验误差(也称为随机误差)。
i ~ N (0, 2 ) (4-2)
Yi ~ N (i , 2 )
其中, 和 都是未知参数(i=1,2,…,k).
i 2
i 1
Mean),它是比
较作用大小的一个基点;
特选课堂
14
第四章 方差分析
4.2.1 数学模型和数据结构
并且称
i i
为第i个水平Ai的效应.它表示水平的真值比一般
水平差多少。满足约束条件
1 2 k 0
(4-6)
可得
Yij i ij ;
i 0
i=1,2,…,k ;j=1,2,…,m
…
Ykj
…
Ykm
特选课堂
合计
T1 T2
…
Ti
…
Tk
平均
Y1 Y2
…
Yi
方差检验
单边检验
H0:=0;H1:0
X 0 P t ( n 1) n S
拒绝域为
T t ( n 1)
或 H0:=0;H1:0
X 0 P t ( n 1) n S
拒绝域为
U u
或 H0:=0;H1:0
X 0 P u n
拒绝域为
U u
单个正态总体方差未知的均值检验
问题:总体 X~N(,2),2未知 假设 H0:=0;H1:≠0
X 0 S n
T检验
双边检验
T X Y S X n1 1 S Y n 2 1
2 2
~ t n1 n 2 2 1 n1 1 n2
n1 n 2 2
对给定的检验水平 , 得H0的拒绝域:
T X Y S X n1 1 S Y n 2 1
1
2
是Y的一个样本,
则
2 X X ~ N X , , n1 2 Y Y ~ N Y , n2
2 2 X Y 所以, X Y ~ N X Y , n1 n2
两个正态总体的均值检验 1、方差已知,检验均值相等
是x的一个样本是y的一个样本未知107定理53知t检验法两个正态总体的均值检验2方差未知但两个总体的方差相等检验均值相等假设即认为ab两种灯泡的平均寿命有统计意义
单个正态总体方差已知的均值检验
问题:总体 X~N(,2),2已知 假设 H0:=0;H1:≠0
X 0
U检验
双边检验
H0为真的前提下
拒绝域为
T t ( n 1)
第四章 方差检验
i 1 j 1
ij
各处理组均数为
X i X ij / ni
j 1
ni
总例数为N=nl+n2+…+ng, g为处理组数。
1.总变异 全部测量值大小不同,这种变异称 为总变异。 总变异的大小可以用离均差平方和(sum of squares of deviations from mean,SS)表示, 即各测量值Xij与总均数差值的平方和,记为SS 总。 总变异SS总反映了所有测量值之间总的变异程 度
g 个处理组的试验结果
处理分 组 1 水平 2 水平 … g 水平 测量值 统计量 … …
X 1n1 X 2n2
X11 X21 Xg1
…
X12 X22 Xg2
…
… … …
X1j X2j
…
n1 n2
…
X1 X2
S1 S2
…
… Xgj
……Leabharlann …X gngng
…
Xg
Sg
完全随机设计资料在进行统计分析时,需根据数 据的分布特征选择方法,对于正态分布且方差齐 同的资料,常采用完全随机设计的单因素方差分 析(one-way ANOVA)或成组资料的 t 检验( g=2); 对于非正态分布或方差不齐的资料,可进行数据 变换或采用Wilcoxon秩和检验。 g ni 记总均数为 X X /N
主要内容
第一节 方差分析的基本概念
第二节 完全随机设计的单因素方差分析
第三节 随机区组设计的两因素方差分析
第四节 多个样本均数间的多重比较
第一节 方差分析的基本概念
一、方差分析的几个名词 什么是方差? 离均差 离均差平方和SS 方差(2 S2 )均方(MS) 标准差:S 自由度: 关系: MS= SS/
参数检验方差检验
二、方差分析过程 首先需要确定因素(Factors)和因变量(Dependent) (Factors)和因变量(Dependent)。 首先需要确定因素(Factors)和因变量(Dependent)。 单因素情况:经过一次考试, 例:单因素情况:经过一次考试,统计四个班级的 学生的考试成绩,因变量为“成绩” 因素(自变量) 学生的考试成绩,因变量为“成绩”,因素(自变量)为 “班级”。 班级” 解释:对于研究四个班级考试成绩的差异的时候, 解释:对于研究四个班级考试成绩的差异的时候, 成绩”是因变量, 班级” 是因素, 自变量。 “成绩”是因变量,“班级” 是因素,即:自变量。因 素的不同水平对应不同自变量值。 素的不同水平对应不同自变量值。 双因素情况:经过一次考试, 例:双因素情况:经过一次考试,统计两个班级的 不同性别的学生考试成绩, 不同性别的学生考试成绩, 因变量“成绩” 87、79、 因变量“成绩”: 87、79、92 ...... 因素1(自变量1) 班级 1(自变量 班级” 班和4 因素1(自变量1) “班级”: 1班、2班、3班和4班 因素2(自变量2) 性别 2(自变量 性别” 男生、 因素2(自变量2) “性别”: 男生、女生
解释:对于研究四个班级的学生考试成绩差异的时候, 解释:对于研究四个班级的学生考试成绩差异的时候, 成绩”是因变量, 班级”是区分不同样本的一个因素, “成绩”是因变量,“班级”是区分不同样本的一个因素, 称为“因素1 或 自变量1 。 称为“因素1”或“自变量1”。对于研究不同性别的学生 考试成绩差异的时候。 性别” 是区分不同样本的因素, 考试成绩差异的时候。“性别” 是区分不同样本的因素, 称为称为“因素2 或 自变量2 称为称为“因素2”或“自变量2” 。 两种因素的不同水 平对应不同的自变量值和因变量值。 平对应不同的自变量值和因变量值。 方差分析就是比较不同水平下,因变量的均值差异, 方差分析就是比较不同水平下,因变量的均值差异, 即检验各因素各水平作用下样本均值的差异 三、T检验与方差分析所研究的问题 在前面已经学习过了的T 在前面已经学习过了的T检验是关于均值差异性的检 方差分析也是关于均值差异性的检验。 验,方差分析也是关于均值差异性的检验。其不同点在于 所面对的问题: 所面对的问题: 检验: T检验: 关于单因素双水平的问题 单因素方差分析: 单因素方差分析:关于单因素多水平的问题 多因素方差分析: 多因素方差分析:关于多因素多水平的问题 协方差分析: 协方差分析: 关于含不可控因素的问题
方差分析的基本原理和F测验
表6.2 水稻不同药剂处理的苗高(cm)
药剂 苗高观察值 总和Ti 平均yi
A 18 21 20 13 72
18
B 20 24 26 22 92
23
C 10 15 17 14 56
14
D 28 27 29 32 116
29
T=336 y =21
根据(6·3)进行总平方和的剖分:
T 2 336 2 C 7056
总的均方
MST sT2
( yij
y)2
nk 1
组 间 的 均 方 MSt st2 n
( yi y)2 k 2
组内均方
MSe se2
( yij yi k(n 1)
)2
(6·6) (6·7)
MSe作分母去除MSt,商数用F表示,即 F=MSt/MSe
… MSt可能有两种情况:
组别 观察值 ( yij,i=1,2,…,k;j=1,2…,n)
1
y11 y12 … y1j …
y1n
2
y21 y22 … y2j …
y2n
… …
总和 平均 均方
T1
y1 s12
T2
y2
s
2 2
i
yi1 yi2 … yij …
yin
… …
Ti
yi
si2
k
yk1 yk2 … ykj …
ykn
(5)若F接近于1,推断处理间无显著差异,分析 结束。
基本思路图示:
全 部 试
总变异 SST
验
处理间变异SSt
误差变异SSe
相除得MSt
相
除
数
据
总自由
度dfT
方差显著性水平及检验
(7). 双边备择假设与双边假设检验
在 H 0 : 0 和 H 1 : 0 中, 备择假 设H 1 表示 可能大 于 0 , 也可能 小于 0 , 称为双 边备择假设形如 , H 0 : 0 , H 1 : 0 的假设 检验称为双边 假 设检验.
S 采用F 1 2 作为检验统计量 . S2
当 H 0 为真时, E ( S12 ) 1 2 E ( S 2 ),
2 2 2
2
当 H1 为真时, E ( S ) 1 2
2 1 2
2
s 故拒绝域的形式为 1 2 k , 此处 k 的值由下式确定: s2
2
S E ( S 2 ),观察值 1 2 有偏小的趋势 , S2
(1) 要求检验假设: H 0 : 2 0 2 , H1 : 2 0 2 , 其中 0 为已知常数 .
( n 1) s 2
0
2
2 1 / 2
( n 1) 或
( n 1) s 2
0
2
2
2 / 2 ( n 1).
(2)单边检验问题的拒绝域 (设显著水平为 )
2). 给定显著性水平 以及样本容量 ; n
3). 确定检验统计量以及拒绝域形式;
4). 按 P{ H 0 为真拒绝H 0 } 求出拒绝域 ;
5). 取样, 根据样本观察值确定接 受还是拒绝 0 . H
3.1 2 为已知, 关于 的检验( Z 检验)
Z检验 检验统计量的观察值 z x 0
要点回顾
1. (1) 显著性水平
当样本容量固定时选定后, 数 k 就可以确 定, 然后按照统计 , 量Z x 0 的观察值的绝对值大于 等于 k 还是小于k 来作决定 .
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
处理分 组 1 水平 2 水平 … g 水平 测量值 统计量 … …
X 1n1 X 2n2
X11 X21 Xg1
…
X12 X22 Xg2
…
… … …
X1j X2j
…
n1 n2
…
X1 X2
S1 S2
…
… Xgj
…
…
…
X gng
ng
…
Xg
Sg
完全随机设计资料在进行统计分析时,需根据数 据的分布特征选择方法,对于正态分布且方差齐 同的资料,常采用完全随机设计的单因素方差分 析(one-way ANOVA)或成组资料的 t 检验( g=2); 对于非正态分布或方差不齐的资料,可进行数据 变换或采用Wilcoxon秩和检验。 g ni 记总均数为 X X /N
SS组内 ( X ij X i )
i 1 j 1
g
ni
2
组内 N g
3.组间变异 各处理组由于接受处理的水 平不同,各组的样本均数 (i=1,2,…, g)也大小不等,三组2型糖尿病患者餐后2 小时血糖的样本均数各不相同,它与总均 数也不相同,这种变异称为组间变异。 其大小可用各组均数与总均数的离均差平 方和表示,记为SS组间,它反映了三组用药 不同的影响(如处理确实有作用),同时也 包括了随机误差
②处理的不同水平可能对试验结果的影响。
基本思想:
SS总 SS组间 SS组内
总 组间 组内
变异程度:除与离均差平方和的大小有关外,还与 其自由度有关,将各部分离均差平方和除以相应 自由度,其比值称为均方差,简称均方(mean square,MS)。
MS组间
SS组间
组间
主要内容
第一节 方差分析的基本概念
第二节 完全随机设计的单因素方差分析
第三节 随机区组设计的两因素方差分析
第四节 多个样本均数间的多重比较
第一节 方差分析的基本概念
一、方差分析的几个名词 什么是方差? 离均差 离均差平方和SS 方差(2 S2 )均方(MS) 标准差:S 自由度: 关系: MS= SS/
3.计算统计量F: F=MS处理/MS误差
4.求概率值P
5.做出推论
完整书写方差分析的过程
1.建立假设:
H0 :8窝小白鼠体重增量相等
1 = 2 = 3。。。
H1 :8窝小白鼠体重增量不全相等
2.确定显著性水平,取0.05。
3.计算统计量F: F2=MS区组/MS误差
4.求概率值P 5.做出推论
例 4-1 的方差分析表 变异来源 总变异 组 间 组 内(误差)
df
59 2 57
SS
MS
F
5.537
P
<0.01
1086.63 176.76 88.38 909.87 15.96
(3)确定P值,作出推断结论 以求F值时分子的自由度ν1=ν组间、分母的自 由度ν2=ν组内查附表3的F界值表得P值。若 F≥Fα(ν1, ν2),则P≤α,按α水准,拒绝H0, 接受H1,有统计学意义。 本例:ν1=3−1=2,ν2=60−3=57。因附表3中ν2无 57,故取最接近者ν2=60,得P<0.01。按α=0.05水 准,拒绝H0,接受H1,有统计学意义。可以认为2 型糖尿病患者经药物(新药和标准药物)治疗4周, 其餐后2小时血糖的总体平均水平不全相同,即三 个总体均数中至少有两个不同。
例
题
给小白鼠分别喂A、B、C三种不同的营养素,了 解不同营养素的增重效果。以窝别作为区组特征, 以消除遗传因素对体重增长的影响。现将同系同 体重的24只小白鼠分为8个区组,每组3只。3周 后测量增重结果,结果如下表, 问3种不同营养素喂养后所增体重有无差别?
变异间的关系 SS总 总 SS处理 处理 MS处理 SS区组 区组 MS区组
列举存在的变异及意义
1、全部的19个实验数据之间大小不等,存在变 异(总变异)。 2、各个组间存在变异(组间变异):反映处理 因素之间的作用,以及随机误差。 3、各个组内个体间数据不同:反映了观察值的 随机误差(组内变异)。
各种变异的表示方法
SS总 总 MS总
SS组内 组内 MS组内
注意:方差分析的结果若拒绝 H0 ,接受 H1 ,不能 说明各组总体均数两两间都有差别。如果要分析 哪些两组间有差别,要进行多个均数间的多重比 较(见本章第四节)。当g=2时,方差分析的结果 与两样本均数比较的 t 检验等价,有 。
t F
第三节 随机区组设计的两因 素方差分析
(Randomized block design Two-way ANOVA) 将全部受试对象按某种或某些特性分为若干个区组, 使每个区组内的观察对象与研究对象的水平尽可 能相近,减少了个体间差异对研究结果的影响, 比成组设计更容易检验出处理因素间的差别,提 高了研究效率。 (复习配对资料)是配对资料的扩充。
MS组内
SS组内
组内
如果各组样本的总体均数相等( H0 :…),即各处 理组的样本来自相同总体,无处理因素的作用 (处理效应),则组间变异同组内变异一样,只 反映随机误差作用的大小。组间均方与组内均方 的比值称为F统计量
MS组间 F MS组内
1 组间
2 组内
MS组间 F MS组内
分组方法:先将60名糖尿病患者从1开始到60编号; 从随机数字表(附表15)中的任一行任一列开始,依 次读取三位数作为一个随机数录于编号下;然后将全 部随机数从小到大编序号(数据相同的按先后顺序编 序号),将每个随机数对应的序号记录;规定序号121为甲组,序号22-40为乙组,序号41-60为丙组。
通过比较不同来源变异的方差(也叫均方MS),借 助F分布做出统计推断,从而判断某因素对观察指 标有无影响。
第二节 成组设计的多个样本均 数比较(单因素方差分析)
某社区随机抽取糖尿病患者、IGT异常和正常 人共30人进行载蛋白测定,结果如下,问3种人的 载蛋白有无差别?
四组不同摄入方式病人的血浆游离吗啡水平
SS误差 误差 MS误差
变异之间的关系: • SS总= SS处理+ SS区组+ SS误差 总= 处理+ 区组+误差
统计量F 的计算
F1=MS处理/MS误差 F2=MS区组/MS误差 自由度: 处理=组数-1=3-1=2 区组=区数-1=8-1=7 误差=(组数-1)(区数-1)=14
SS总 X ij X X ij C
g ni 2 g ni 2 i 1 j 1 i 1 j 1
C ( X ij ) / N
2 i 1 j 1
g
ni
总 N 1
2.组内变异 在同一处理组中,虽然每个受 试对象接受的处理相同,但测量值仍各不 相同,各组内2型糖尿病患者的餐后2小时 血糖Xij大小各不相同,与本组的样本均数 也不相同,这种变异称为组内变异(误 差)。组内变异可用组内各测量值 Xij 与其 所在组的均数的差值的平方和表示,记为 SS组内, 表示随机误差(含个体差异和测量误 差)的影响。又称误差变异
方差分析结果
变异 来源 总 处理 间 区组 间 误差 SS
2861.84
23
MS
F
P
144.92
2376.38
2
14
完整书写方差分析的过程
1.建立假设: H0 :3种营养素喂养的小白鼠体重增量相等 1 = 2 = 3 H1 :3种营养素喂养的小白鼠体重增量不全相等 2.确定显著性水平,用 表示,常取0.05。
例 某医生为研究一种四类降糖新药的疗效,以 统一的纳入标准和排除标准选择了60名2型糖尿 病患者,按完全随机设计方案将患者分为三组 进行双盲临床试验。其中,降糖新药高剂量组 21人、低剂量组19人、对照组20人。对照组服 用公认的降糖药物,治疗4周后测得其餐后2小 时血糖的下降值(mmol/L),结果如表9-1所示。 问治疗4周后,餐后2小时血糖下降值的三组总 体平均水平是否不同?
组间变异 处理 误差 组内变异 误差
F 值(Fisher)接近于l,就没有理由拒绝H0;反之, F值越大,拒绝H0的理由越充分。数理统计的理论证 明,当H0成立时,F统计量服从F分布。F分布有两个 自由度, 分子自由度为1,分母自由度为2,记
为 F ,
1
。
2
通过上述变异的分解,可以看出,方差分析 的基本思想就是根据试验设计的类型,将全部测 量值总的离均差平方和及其自由度分解为两个或 多个部分,除随机误差作用外,每个部分的变异 可由某个因素的作用(或某几个因素的交互作用) 加以解释,如组间变异SS组间可由处理因素的作用 加以解释。通过比较不同变异来源的均方,借助F 分布做出统计推断,从而推论各种研究因素对试 验结果有无影响。
应用条件: 1)各样本是相互独立的随机样本 2)各样本来自正态总体 3)各处理组总体方差相等,即方差齐
(2)计算检验统计量 可根据下表的公式和前面表下半部分数据来计 算。也可用统计软件包如SAS或SPSS等进行计算, 直接获得下表的方差分析表。 按表中的公式计算各离均差平方和SS、自由度、 均方MS和F 值。
二、方差分析的含义
方差是描述变异的一种指标,方差分析是一种假 设检验的方法。方差分析也就是对变异的分析。 是对总变异进行分析。看总变异是由哪些部分组 成的,这些部分间的关系如何。
三、方差分析的基本思想
根据变异的来源,将全部观察值总的离均差平方和 及自由度分解为两个或多个部分,除随机误差外, 其余每个部分的变异可由某些特定因素的作用加以 解释。
i 1 j 1
ij
各处理组均数为
X i X ij / ni