第10章单因素方差分析
(完整版)方差分析选择题及答案
第10章 方差分析与试验设计三、选择题1.方差分析的主要目的是判断 ( )。
A. 各总体是否存在方差B. 各样本数据之间是否有显著差异C. 分类型自变量对数值型因变量的影响是否显著 D. 分类型因变量对数值型自变量的影响是否显著 2.在方差分析中,检验统计量F是 ( )。
A. 组间平方和除以组内平方和 B. 组间均方除以组内均方 C. 组间平方除以总平方和 D. 组间均方除以总均方 3.在方差分析中,某一水平下样本数据之间的误差称为 ( )。
A. 随机误差 B. 非随机误差 C. 系统误差 D. 非系统误差 4.在方差分析中,衡量不同水平下样本数据之间的误差称为 ( )。
A. 组内误差 B. 组间误差 C. 组内平方 D. 组间平方 5.组间误差是衡量不同水平下各样本数据之间的误差,它 ( )。
A. 只包括随机误差 B. 只包括系统误差C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差6.组内误差是衡量某一水平下样本数据之间的误差,它 ( )。
A. 只包括随机误差 B. 只包括系统误差C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差7.在下面的假定中,哪一个不属于方差分析中的假定 ( )。
A. 每个总体都服从正态分布 B. 各总体的方差相等 C. 观测值是独立的 D. 各总体的方差等于08.在方差分析中,所提出的原假设是= ···=,备择假设是( )210:μμ=H k μA. ··· B. ···≠≠H 211:μμk μ≠>>H 211:μμkμ>C. ··· D. ···不全相等<<H 211:μμk μ<,,:211μμH k μ,9.单因素方差分析是指只涉及 ( )。
第10章 单因素方差分析
号的和 体一、 系级平
j 1
法数均
1 xi n xi
an
x
xij
第i水平均值 全部观察值的和
表据数 示,、 ,在大 要本总 注章和
i1 j1
1 x an x
总平均值
意我、 熟们总 悉采平
Si2
1 n 1
a i 1
( xij
xi )2
第i水平上的子样方差
和用均
可xij以分解为
xij i ij
、(i
)
i、( xij
i
)
的估计值。
ij
故an个观察值的总变异可分解为处理间的变异和处理 内的变异两部分。
全部观察值的总变异可以用总均方来度量,处理间变 异和处理内变异分别用处理间均方和处理内均方来 度量。
总均方的拆分是通过将总均方的分子──称为总离均差平
方和,简称为总平方和(total sum of squares,SST) ,剖分成
方差分析中常用基本概念
(一)试验指标(experimental index)
为衡量试验结果的好坏或处理效应的高低,在试验中具体 测定的性状或观测的项目。
(二)试验因素 (experimental factor)
试验中所研究的影响试验指标的因素叫试验因素。 当试验中考察的因素只有一个时,称为单因素试验; 若同时研究两个或两个以上的因素对试验指标的影响时, 则称为两因素或多因素试验。 按是否可控制因素可分为:固定因素和随机因素.
方差分析(analysis of variance-ANOVA)
是由英国统计学家R.A.Fisher于1923年提出的。
方差分析是一种特殊的假设检验,是用来判断多组数据 之间平均数差异显著性的.
方差分析方法
10.2.1 单因素方差分析的问题
因而有: 因而有: (1) 粮食产量是随机变量,是数值型的变量; 粮食产量是随机变量,是数值型的变量; (2) 把同一化肥 的同一水平 得到的粮食产量看作 把同一化肥(A的同一水平 的同一水平)得到的粮食产量看作 同一总体抽得的样本, 同一总体抽得的样本,施用不同化肥得到的粮食产量 视为不同总体下抽得的样本, 视为不同总体下抽得的样本 ,表中数据应看成从三个 总体X 中分别抽了容量为6的样本的观测值 的样本的观测值. 总体 1,X2,X3中分别抽了容量为 的样本的观测值 推断甲乙丙三种化肥的肥效是否存在差异的问题, 推断甲乙丙三种化肥的肥效是否存在差异的问题, 就是要辨别粮食产量之间的差异主要是由随机误差造 成的,还是由不同化肥造成的, 成的,还是由不同化肥造成的,这一问题可归结为三 个总体是否有相同分布的讨论. 个总体是否有相同分布的讨论.
10.2.1 单因素方差分析的问题
由于在实际中有充分的理由认为粮食产量服从正 态分布, 且在安排试验时, 除所关心的因素(这里是化肥 这里是化肥) 态分布 且在安排试验时 除所关心的因素 这里是化肥 外, 其它试验条件总是尽可能做到一致. 其它试验条件总是尽可能做到一致 这使我们可以认为每个总体的方差相同 即 Xi~N(µi,σ2) i = 1, 2, 3 因此,推断三个总体是否具有相同分布的问题就简 因此, 化为: 化为:检验几个具有相同方差的正态总体均值是否相 等的问题, 等的问题,即只需检验 H0: µ 1 = µ 2 = µ 3
10. 10.2.2 单因素方差分析的数学模型
进行单因素方差分析时, 需要得到如表10.2所示的 进行单因素方差分析时 , 需要得到如表 所示的 数据结构. 数据结构.
表10.2 单因素方差分析中数据结构
统计学各章计算题公式及解题方法
统计学各章计算题公式及解题方法第四章数据的概括性度量1.组距式数值型数据众数的计算:确定众数组后代入公式计算:下限公式:;上限公式:,其中,L为众数所在组下限,U为众数所在组上限,为众数所在组次数与前一组次数之差,为众数所在组次数与后一组次数之差,d为众数所在组组距2.中位数位置的确定:未分组数据为;组距分组数据为3.未分组数据中位数计算公式:4.单变量数列的中位数:先计算各组的累积次数(或累积频率)—根据位置公式确定中位数所在的组—对照累积次数(或累积频率)确定中位数(该公式假定中位数组的频数在该组内均匀分布)5.组距式数列的中位数计算公式:下限公式:;上限公式:,其中,为中位数所在组的频数,为中位数所在组前一组的累积频数,为中位数所在组后一组的累积频数6.四分位数位置的确定:未分组数据:;组距分组数据:7.简单均值:8.加权均值:,其中,为各组组中值统计学各章计算题公式及解题方法9.几何均值(用于计算平均发展速度):10.四分位差(用于衡量中位数的代表性):11.异众比率(用于衡量众数的代表性):12.极差:未分组数据:;组距分组数据:13.平均差(离散程度):未分组数据:;组距分组数据:14.总体方差:未分组数据:;分组数据:15.总体标准差:未分组数据:;分组数据:16.样本方差:未分组数据:;分组数据:17.样本标准差:未分组数据:;分组数据:18.标准分数:19.离散系数:第七章参数估计1.的估计值:置信水平α90%0。
1 0。
05 1。
654 95%0。
05 0.025 1。
9699%0.01 0。
005 2。
58统计学各章计算题公式及解题方法2.不同情况下总体均值的区间估计:总体分布样本量σ已知σ未知大样本(n≥30)正态分布小样本(n〈30)非正态分布大样本(n≥30)其中,查p448 ,查找时需查n—1的数值3.大样本总体比例的区间估计:4.总体方差在置信水平下的置信区间为:5.估计总体均值的样本量:,其中,E为估计误差6.重复抽样或无限总体抽样条件下的样本量:,其中π为总体比例第八章假设检验1.总体均值的检验(已知或未知的大样本)[总体服从正态分布,不服从正态分布的用正态分布近似]假设双侧检验左侧检验右侧检验假设形式已知统计量未知拒绝域值决策,拒绝2.总体均值检验(未知,小样本,总体正态分布)假设双侧检验左侧检验右侧检验假设形式统计学各章计算题公式及解题方法已知统计量未知拒绝域值决策,拒绝注:已知的拒绝域同大样本3.一个总体比例的检验(两类结果,总体服从二项分布,可用正态分布近似)(其中为假设的总体比例)假设双侧检验左侧检验右侧检验假设形式统计量拒绝域值决策,拒绝4.总体方差的检验(检验)假设双侧检验左侧检验右侧检验假设形式统计量拒绝域值决策,拒绝5.统计量的参考数值0。
第10章单因素方差分析
第10章单因素方差分析单因素方差分析(0ne-Way ANOV A),又称一维方差分析,它能够对单因素多个独立样本的均数进行比较,可以用10种检验方法对变量间的均数进行两两比较(即多重比较检验)并给出方差分析表,还可以作出5种类型图形(Type of plots)和2种均数图形(Means plot options)10.1 单因素方差分析的计量资料[例10—1] 某社区随机抽取了30名糖尿病患者、IGT异常人和正常人进行载脂蛋白(mg/dL)测定,结果示于表10—1。
试问3组人群的载脂蛋白测定结果含量是否相同?(倪宗瓒.卫生统计学.第4版,北京:人民卫生出版社,2001.50)本例是一个完全随机设计的单因素方差分析。
已建立SAS数据集文件并保存Sasuser.onewav4。
(1)进入SAS/Win(v8)系统,单击Solutions-Analysis-Analyst,得到分析家窗口。
(2)单击File-open By SAS Name—Sasuser-0neway4—0K,调入数据文件。
(3)在“分析家”窗口单击Statistics-ANOV A-One way ANOV A,得到图10—1所示对话框。
本例因变量(Dependent)为A(载脂蛋白),单击A—Dependent。
自变量(1ndependent):B(3种人的组别),单击B—Independent 。
图10.1 0ne—way ANOV A:0neway4(单因素方差分析)对话框(4)单击Tests按钮,得到图10—2所示对话框。
在此对话框的ANOV A(F—检验)选项中可进行如下设置。
Analysis of variance,方差分析。
Welch’s variance-weighted ANOV A,威尔奇方差—权重方差分析。
Tests for equal variance,相等方差检验,即方差齐性检验。
Barlett’s test,巴特尼特检验。
统计学第十章(方差分析)
第十章方差分析一、单项选择题:1.在方差分析中,( )反映的是样本数据与其组平均值的差异。
A.总离差平方和B.组间离差平方和C.抽样误差D.组内离差平方和2.∑∑=⎪⎪⎭⎫⎝⎛k1i 21-j ij n i i x x ——是( )。
A.组内平方和 B.组间平方和C.总离差平方和D.因素B 的离差平方和3.∑∑=⎪⎪⎭⎫⎝⎛k1i 21-j ij n i i x x ——是( )。
A.组内平方和 B.组间平方和 C.总离差平方和D.总方差4.单因素方差分析中,计算F 统计量,其分子与分母的自由度各位( )。
A.k ,nB.k ,n-kC.k-1,n-kD.n-k ,k-15.方差分析基本原理是( )首先提出的。
A.费雪B.皮尔逊C.泰勒D.凯特勒6.组间离差平方和反映的是( )。
A.抽样误差B.系统误差C.随机误差D.总误差7.组内离差平方和反映的是( )。
A.抽样误差B.系统误差C.随机误差D.总误差8.单因素方差分析的对立和假设是( )。
A.μμμk 21===B.差距不显著,,,μμμk 21C.不是全部相等,,,μμμk 21D.全部不相等,,,μμμk 219.单因素方差分析的零假设是( )。
A.μμμk 21===B.差距不显著,,,μμμk 21C.不是全部相等,,,μμμk 21D.全部不相等,,,μμμk 2110.在方差分析中,若F k -n 1,-k 05.0F )(>,则统计推论是( )。
A.各组间的总体均数不全相等B.各组间的总体均数都不相等C.各组间的样本均数都不相等D.各组间的总体方差不全相等11.为研究温度对菌种生产率的影响,将温度控制在三个水平上,则应该使用( )。
A.单因素方差分析B.双因素方差分析C.独立样本t 检验D.三因素方差分析12.为分析学历对收入的影响,调查了50个职工,按学历高低分成四组,使用单因素方差分析,则F 检验临界值为( )。
医学统计学:第十章 常用实验设计方法
分组结果 甲组:4、6、8、11、15号
乙组:3、5、9、12、14号
和检验、Ridit 分析、有序变量的 logistic 回归 模型和有序变量的对数线型模型等。 (2)若比较各样本不同等级构成情况,用 2 检验。
14
4.双向有序且属性不同资料的比较 (1)若分析两变量是否存在线性相关关系时,用 等级相关分析或 Pearson 列联系数。 (2)若分析两变量是否存在直线变化趋势时,用 线性趋势检验。 5.双向有序且属性相同资料的一致性检验,用
丙组:1、2、7、10、13号
10
11
(二)统计分析
数值变量资料
1.两样本比较 (1)小样本时 ①两样本来自正态分布总体且总 体方差相等时,用成组设计的两样本均数比较的
t 检验;②两样本来自非正态总体或总体方差不
等时,通过变量变换使数据呈正态或方差齐后,
再用成组设计的两样本均数比较的 t 检验;若仍 达不到 t 检验的应用条件时,可选用 t' 检验或成
18 1 10 13 17 2 0 3 8 15 7 4 19 12 5 14 9 11 6 16
动物编号 1 2 3 4 5 6 7 8 9 10 随机数字 1 2 0 3 8 7 4 5 9 6 组 别甲乙乙甲乙甲乙甲甲乙
分组结果 甲组:1、4、6、8、9号小鼠 乙组:2、3、5、7、10号小鼠
17
随机分组
1.1 2.1 3.1 4.1 5.1 6.1 7.1 8.1 9.1 10.1 小鼠编号
单因素方差分析 (2)
单因素方差分析1. 引言•单因素方差分析(One-way ANOVA)是一种常用的统计方法,用于比较两个或多个组之间的均值是否存在显著差异。
•在实际研究中,我们经常需要比较不同组之间某个变量的均值差异,例如不同教育水平对收入的影响,不同药物对疾病的治疗效果等。
•单因素方差分析提供了一种统计方法,可以判断不同组之间均值差异是否由随机因素引起,还是由于真正的因素差异引起。
2. 基本概念•因素(Factor):需要比较不同组之间的变量,也称为自变量或分类因素。
•水平(Level):每个因素具有的不同取值或组别,也称为处理或条件。
•观测值(Observation):每个组内的单个实验结果或数据点。
•总平均(Grand Mean):所有组的观测值的平均值。
•组内平均(Group Mean):每个组的观测值的平均值。
•组间平均(Between-group Mean):所有组的观测值的平均值。
3. 假设检验•零假设(H0):不同组的均值之间没有显著差异。
•备择假设(H1):不同组的均值之间存在显著差异。
4. 单因素方差分析的步骤1.收集数据:按照分类因素进行分组,获得每个组的观测值。
2.计算总平均:计算所有观测值的平均值。
3.计算组内平均:计算每个组的观测值的平均值。
4.计算组间平均:计算所有组的观测值的平均值。
5.构造统计模型:建立协方差矩阵和方差矩阵之间的关系。
6.计算平方和:计算组内平方和和组间平方和。
7.计算均方差:计算组内均方差和组间均方差。
8.计算F值:计算F统计量,用于检验组间均值差异是否显著。
9.假设检验:比较F值与临界值,确定是否拒绝零假设。
5. F分布与p值•在单因素方差分析中,我们使用F分布来进行假设检验。
•F分布是一种连续概率分布,取值范围大于等于0,且分布形状根据自由度的不同而变化。
•在单因素方差分析中,我们计算出的F值可以与F分布表中的临界值进行比较,以确定是否拒绝零假设。
•p值是统计假设检验中的一个重要指标,表示在零假设成立的情况下,观察到的样本数据或更极端结果出现的概率。
贾俊平的《统计学》(第7版)学习辅导书-章节题库(方差分析)【圣才出品】
【解析】方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因 变量是否有显著影响。如果分析数据来自相同总体,那么在组间误差中只包含随机误差,而 没有系统误差。反之,如果分析数据来自丌同总体,在组间误差中除了包含随机误差外,还 会包含系统误差。另外,方差分析要求每个总体都应服从正态分布。
10.关亍方差分析,以下说法哪一项更合理?( )[中山大学 2012 研] A.方差分析的目的是分析各组总体方差是否有显著差异 B.方差分析的目的是分析各组总体标准差是否有显著差异 C.方差分析的目的是分析各组总体均值是否有显著差异 D.方差分析的目的是分析各组总体中位数是否有显著差异 【答案】C 【解析】表面上看,方差分析是检验多个总体均值是否相等的统计方法,但本质上它所 研究的是分类型自变量对数值型因变量的影响。即方差分析是通过检验各总体的均值是否相 等来判断分类型自变量对数值型因变量是否有显著影响。
4.在方差分析中总变差可以分解为组内变差和组间变差,其中组间变差表示( )。 [厦门大学 2014 研]
A.一样本观测值不均值差方和 B.全部样本观测值不总均值的差方和 C.各样本观测值不各自均值的差方和 D.各样本均值不总均值的差方和 【答案】D
_
【解析】方差分析中组间平方和记为 SSA,它是各组均值xi(i=1,2,…,k)不总均 值 x 的误差平方和,反映组间误差的大小。
2.下面关亍方差学 2015 研]
第10章方差分析习题解答
第10章方差分析习题解答一.选择题1. 下列关于方差分析的说法不正确的是( A ).A. 方差分析是一种检验若干个正态分布的均值和方差是否相等的一种统计方法.B. 方差分析是一种检验若干个独立正态总体均值是否相等的一种统计方法.C. 方差分析实际上是一种F 检验.D. 方差分析基于偏差平方和的分解和比较.2. 设,1,2,,;1,2,,ij i ij i X i a j n µε=+== ,2(0,)ij i N εσ ,且ij ε相互独立,进行单因子方差分析是( C ) . A . 对假设012:a H µµµ=== 作检验. B . 对假设222012:a H σσσ=== 作检验. C . 假定2(0,)ij N εσ ,2σ为未知,对假设012:a H µµµ=== 作检验. D . 假定2(0,)ij N εσ 12a µµµµ==== ,µ为未知,对假设222012:a H σσσ=== 作检验.3. 对因子A 取r 个不同的水平进行试验,每个水平观测t 次,结果,1,2,,,1,2,,ij y i r j t == .对()ij r t y ×的偏差有分解:2211111()()()ˆr t r trTijij i i E A i j i j i SS y y y y t y y SS SS ⋅⋅======−=−+−=+∑∑∑∑∑ 其中11111, r t ti i ij i j j y y y y rt t ⋅=====∑∑∑对假设012:r H µµµ=== 进行检验时,如下说法错误 的是( B ) .A .E SS 表示0H 为真时,由随机性引起的y ij 的波动.B .A SS 表示0H 为真时,所引起的由各水平间ij y 波动.C . E SS 表示各水平上随机性误差的总和.D . A SS 表示各水平之间系统误差的总和.4. 对某因素进行方差分析,由所得试验数据算得下表: 方差来源 平方和自由度F 值组间 4623.7 4 组内 4837.25 15 总和9460.9519采用F 检验法检验,且知在0.05α=时F 的临界值0.05(4,15) 3.06F =,则可以认为因素的不同水平对试验结果( B ).A. 没有影响.B. 有显著影响.C. 没有显著影响.D. 不能作出是否有显著影响的判断.5. 设在双因子A 和B 的方差分析模型:ij i j ij X µαβε=+++,10ai i α==∑,10bjj β==∑,2(0,)ij N εσ ,且ij ε相互独立,检验假设:0112:,0rH ααα==== ,和0212:,0sH βββ==== 检验时,下列结论中错误的是( D ) . A . 若拒绝域01H ,则认为因子A 的不同水平对结果有显著影响. B . 若拒绝域02H ,则认为因子B 的不同水平对结果有显著影响.C . 若不拒绝01H 和02H ,则认为因子A 与B 的不同水平的组合对结果无显著影响.D . 若不拒绝01H 或02H ,则认为因子A 与B 的不同水平组合对结果无显著影响.6. 某结果可能受因素A 及B 的影响.现对A 取4个不同的水平, B 取3个不同水平,对A 与B 每一种水平组合重复二次试验,对观测结果的双因子有交互作用的方差分析模型计算得:44.3A SS =,11.5B SS =,27.0A B SS ×=,65.0E SS =.且0.05(2,12) 3.89F =,0.05(3,12) 3.49F =,0.05(6,12) 3.00F =,则在显著性水平0.05α=时,检验的结果是( B ).A. 只有A 因素对结果有显著性影响.B. 只有B 因素对结果有显著性影响.C. 只有交互作用对结果有显著性影响.D. A 、B 及A 和B 的交互作用都对结果无显著性影响.7.设某结果可能受因素A 及B 的影响,现对A 取4个不同的水平, B 取3个不同的水平配对作试验,按双因子方差分析模型的计算结果: 5.29A SS =, 2.22B SS =,7.77T SS =.且0.05(3,6) 4.80F =,0.05(2,6) 5.10F =,则在显著性水平0.05α=时,检验的结果是( C ). A. 只有A 因素的不同水平对结果有显著影响. B. 只有B 因素的不同水平对结果有显著影响.C. A 的不同水平及B 的不同水平都对结果有显著影响.D. A 、B 因素不同水平组合对结果没有显著影响.8. 对因子A 取r 个不同水平,因子B 取s 个不同水平,A 与B 的每种水平组合重复次试验后,对结果进行双因子有重复试验的方差分析,则以下关于各偏差平方和自由度的结论错误的是( D ).A. A 因子的偏差平方和A SS 的自由度为.B.B 因子的偏差平方和B SS 的自由度为.C. 交互作用的偏差平方和A B SS ×的自由度为(1)(1)r s −−.D. 误差平方和E SS 的自由度为(1)(1)(1)r s t −−−. 二.填空题9. 进行单因素方差分析的前提之一是要求表示r 个水平的r 个总体的方差 相等 . 10. 进行方差分析时,将离差平方和211()in r Tiji j SS XX ===−∑∑表示为TA E SS SS SS =+,其中A SS =21()ri ii n XX =−∑,E SS =211()in riji i j XX ==−∑∑.11. 进行方差分析时,将离差平方和211()in rT iji j SS XX ===−∑∑表示为TA E SS SS SS =+,则2ESS σ~2(n r)χ−.12. 进行方差分析时,如果所有2~(,)ij X N µσ,则222111()in r T iji j SSXX σσ===−∑∑~21(1)ri i n χ=−∑.13. 进行方差分析时,选取统计量2 1211()()(1)()(1)()i ri i i A n rE ij i i j n r n X X SS r FSS n r r X X ===−−−==−−−∑∑∑,则F ~(r 1,n r)F −−.14. 在单因素方差分析中,如果因素A 有a 个水平,其中在第i 个水平下作了i n 次试验,12a n n n n +++= ,总的偏差平方和T SS 分解为A SS 和E SS ,则A SS 的自由度为1a −,E SS 的自由度为n a−,检验统计量A F =/(1)/(1)A E SS a SS n −−,若A F 大于给定的临界值水平,则说明 因素A 的a 个水平对试验指标有显著影响 .15. 某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中一种方法.在显著水平α=0.05下,通过对每个工人生产的产品数量进行方差分析得到下面的部分结果.请完成方差分析表,由于 1.70 3.354131F =< 或P=0.245946>0.05 ,可判断不同的组装方法对产品数量的影响 不显著 (显著,不显著). 差异源 SS df MS F P-value F crit 组 间 420 2 210 1.70 0.245946 3.354131 组 内 3836 27 142.07 — — — 总 计425629————16. 在双因素方差分析中,因素A 有三个水平,因素B 有四个水平,每个水平搭配各做一次试验.请完成下列方差分析表,在显著水平α=0.05下,由于0.05(25.7,6)508.1A F F ==>,可判断因素A 的影响 显著 (显著,不显著);由于0.05(35.8,6)405.8B F F ==>,可判断因素B 的影响 显著 (显著,不显著). 来 源 平方和 自由度 均方 F 值 因素A 54 2 27 5.78 因素B 82 3 27.33 5.85 误差e 28 6 4.67 — 总 和16411——17. 在某种化工产品的生产过程中,选择3种不同的浓度:1A =2%,2A =4%,3A =6%;4种不同的温度:1B =100C ,2B =240C ,3B =380C ,4B =520C ;在每种浓度与温度配合下各做两次试验,观测产品的收取率.现由试验数据计算出如下结果:总偏差平方和147.8333T SS =,因素A (浓度)的偏差平方和44.3333A SS =,因素B (温度)的偏差平方和11.50B SS =,交互作用A B ×的偏差平方和27.00A B SS ×=,则误差平方和E SS = 65 ,检验统计量A F = 4.09 , B F = 0.708 ,A B F ×= 0.831 ,在显著性水平0.05α=下.由于0.05(2,4.0912) 3.89A F F ==>,可判断因素A 的影响 显著 (显著,不显著);由于0.05(30.7,12)908 3.4B F F ==<,可判断因素B 的影响 不显著 (显著,不显著);由于0.050.831(6,12) 3.00A B F F ×==<,可判断因因素A 与因素B 的交互作用影响不显著 (显著,不显著).18. 为了分析不同操作方法生产某种产品节约原料是否相同,在其余条件尽可能相同的情况下,安排了五种不同的操作方法生产某种产品,测量原料节约额,得到实验结果如下表所示.在显著水平α=0.05下,由于0.00410.05P =<,可判断不同操作方法生产某种产品节约原料 有 (有,无)显著差异.差异源 SS df MS F P-value F crit 操作方法55.5370 4 13.8842 6.05900.00414.8932组内 34.3725 15 2.2915总计89.90951919. 对腐乳的味道、口感等只能通过感观来确定其产品质量.为了检验专业评议员对腐乳评分标准是否存在显著差异,不同的腐乳质量是否存在显著差异,得到4位专业评议员对4种腐乳的评分结果,得到实验结果如下表所示.在显著水平α=0.05下,由于0.0005690.05P =<,可判断专业评议员对腐乳评分标准 有 (有,无)显著差异;由于 1.020.0505E P −=<,可判断不同的腐乳质量 有 (有,无)显著差异.差异源 SS df MS F P-value F crit 专业评议员54 3 18.0000 16.2 0.000569 3.8625 腐乳 148 3 49.3333 44.4 1.02E-053.8625误差 10 9 1.1111总计2121520.为了分析时段、路段以及时段与路段的交互作用对行车时间的影响,某市一名交通警察分别在两个路段和高峰期与非高峰期驾车试验,共获得20个行车时间数据,得到实验结果如下表所示.在显著水平α=0.05下,由于 5.700.056E P =<−,可判断时段因素对行车时间的影响 显著 (显著,不显著);由于0.0001.0805P =<,可判断路段因素对行车时间的影响 显著 (显著,不显著);由于0.9118.0105P =>,可判断时段与路段因素对行车时间交互作用的影响 不显著 (显著,不显著). 差异源SSdfMS F P-value F crit时段 174.05 1 174.05 44.0632 5.7E-06 4.49399 路段 92.45 1 92.45 23.4050 0.00018 4.49399 交互 0.05 1 0.05 0.01260.911814.49399内部 63.20 16 3.95总计329.7519三.应用计算题21.比较四种肥料1234,,,A A A A 对作物产量的影响,每一种肥料做5次试验,得产量(公斤/小区)如下表.试检验四种肥料对产量的影响有无显著差异?肥料 1A2A3A4A样 本 观 测 值5.56.5 8.0 5.5 5.0 6.0 6.5 6.5 6.07.0 7.5 6.0 4.5 6.5 7.0 5.0 7.05.56.05.5解:设使用四种不同肥料后作物的产量2~(,),1,2,3,4i i Y N i µσ=.则需检验的问题为43210:µµµµ===H ,:1H 4321,,,µµµµ不全相等.首先由样本直接计算有关值如下表作物产量计算表肥料样本观测值行和i A T1A 5.5 5.0 6.0 4.5 7.0 28 2A 6.5 6.0 7.0 6.5 5.5 31.5 3A 8.0 6.5 7.5 7.0 6.0 35 4A5.56.56.05.05.528.5 411in ij i j T x ===∑∑1232756.45T C n ==4211771.5756.4515.05in Tiji j SS xC ===−=−=∑∑22222412831.53528.5756.45 6.255555iA A i iT SS C n ==−=+++−=∑15.05 6.258.8E T A SS SS SS =−=−=列出相应的方差分析表.作物产量方差分析表方差来源 平方和 自由度 均方MS F 值临界值因素A 6.25 3 2.08 3.79 0.05(3,16) 3.24F = 0.01(3,16) 5.29F =误差 8.8 16 0.55 总和15.0519由于0.053.79(3,16)A F F =>,认为四种肥料对产量有显著影响.22.取四个种系未成年雌性大白鼠各三只,每只按一种剂量注射雌激素,一月后,解剖秤其子宫重量,结果如下表.试检验不同剂量和不同白鼠种系对子宫重量有无显著影响?解设注射不同剂量的不同白鼠种系的子宫重量2~(,),1,2,3,4ij i j Y N i µαβσ++=;1,2,3j =.则需检验的问题为01234:0A H αααα==== ,11234:,,,A H αααα不全为零 0123:0B H βββ===,1123:,,B H βββ不全为零为了计算各平方和,列出如下表.子宫重量计算表本题中4,3,12a b n ab ====22109810046712T C n ===4321111354210046713075Tiji j SS xC ===−=−=∑∑242222.11(367225314192)1004676457.66733i Ai T SS C ==−=+++−=∑ 23.22211(260358480)100467607444j Bj T SS C==−=++−=∑130756457.6676074543.33E T A B SS SS SS SS =−−=−−=得到相应的无交互作用双因素方差分析表.子宫重量双因素方差分析表方差来源 平方和 自由度 均方MS F 值 临界值因素A(种系) 6457.6732152.5623.770.05(3,6) 4.76F =0.01(3,6)9.78F =因素B60742303733.540.05(2,6) 5.14F =(剂量)0.01(2,6)10.92F =误差E 543.33 6 90.56 总和1307511因为0.0123.77(3,6)A F F =>,认为种系对子宫重量有极显著影响;0.0133.54(2,6)B F F =>,认为剂量对子宫重量有极显著影响.由此可知,种系和剂量对子宫重量都有极显著影响.23.为检验广告媒体和广告方案对产品销售量的影响,一家营销公司做了一项试验,考察三种广告方案和两种广告媒体,获得的销售量数据如下表.试检验广告方案.广告媒体或其交互作用对销售量的影响是否显著.广告方案广告媒体报纸电视 A8,12 12,8 B22,14 26,30 C10,1818,14解 设不同广告方案和广告媒体的产品销售量2~(,)ij i j ij Y N µαβγσ+++,1,2i =,3;1,2j =.则需检验的问题为0111221223132:0A B H γγγγγγ×======,1111221223132:,,,,,A B H γγγγγγ×不全为零. 0123:0A H ααα===,1123:,,A H ααα不全为零, 012:0B H ββ==,112:,B H ββ不全为零, 本题计算过程如下表:销售量数据方差分析计算表2A22,14 (36) 26, 30(56) 9284643A10,18 (28)18, 14(32)603600 列和..j x84 108 154 136642..j x705611664 1872032221113616ijti j t x====∑∑∑32221111()307212ijt i j t x ====∑∑∑ 322.117040ij i j x===∑∑36163072544T SS =−=11336430723444A SS =×−=1187203072486B SS =×−=17040307234448562A B SS ×=×−−−=得如下方差分析表:销售量数据双因素方差分析表方差来源 平方和 自由度 均方和 F 值 广告方案A 344 2 172 10.75 广告媒体B 48 1 48 3 交互效应A B ×56 2 28 1.75 误差 96 6 16 总和54411查表得0.05(2,6) 5.14F =,0.05(1,6) 5.99F =,因此,广告方案对产品销售量的影响显著;广告媒体对产品销售量的影响不显著;广告方案和广告媒体对产品销售量没有交互作用.。
最新人大版_贾俊平_第五版_统计学_第10章_方差分析PPT课件
பைடு நூலகம்
10.1.3 方差分析中的基本假定 1.每个总体都应服从正态分布
• 对于因素的每一个水平,其观察值是来自服从正态 分布总体的简单随机样本。
• 比如,每种颜色饮料的销售量必需服从正态分布 2.各个总体的方差必须相同
• 对于各组观察数据,是从具有相同方差的总体中抽 取的
10.2 单因素方差分析
10.2.1 数据结构
观察值 ( j )
1 2 : : n
水平A1
x11 x21 : : xn1
因素(A) i
水平A2
…
x12
…
x22
…
:
:
:
:
xn2
…
水平Ak
x1k x2k : : xnk
10.2.2 分析步骤
1.提出假设
• 一般提法 H0: m1 = m2 =…= mk (因素有k个水平) H1: m1 ,m2 ,… ,mk不全相等
身所造成的,后者所形成的误差是由系统性因素造成的, 称为系统误差
2.两类方差 (1)组内方差(误差平方和 、残差平方和、 SSE)
– 因素的同一水平(同一个总体)下样本数据的方差 – 比如,无色饮料A1在5家超市销售数量的方差 – 组内方差只包含随机误差
(2)组间方差(因素平方和、SSA)
– 因素的不同水平(不同总体)下各样本之间的方差 – 比如,四种颜色饮料销售量之间的方差 – 组间方差既包括随机误差,也包括系统误差
水平A ( i ) 粉色(A2) 橘黄色(A3)
绿色(A4)
1
26.5
31.2
27.9
30.8
R语言实战(五)方差分析与功效分析
R语⾔实战(五)⽅差分析与功效分析本⽂对应《R语⾔实战》第9章:⽅差分析;第10章:功效分析====================================================================⽅差分析:回归分析是通过量化的预测变量来预测量化的响应变量,⽽解释变量⾥含有名义型或有序型因⼦变量时,我们关注的重点通常会从预测转向组别差异的分析,这种分析⽅法就是⽅差分析(ANOVA)。
因变量不只⼀个时,称为多元⽅差分析(MANOVA)。
有协变量时,称为协⽅差分析(ANCOVA)或多元协⽅差分析(MANCOVA)。
#基本格式aov(formula, data = dataframe)基本表达式符号参考回归中的表格研究设计的表达式下表中,⼩写字母表⽰定量变量,⼤写字母表⽰组别因⼦,Subject是对被试者独有的标识变量设计表达式单因素ANOVA y ~ A含单个协变量的单因素ANCOVA y ~ x + A双因素ANOVA y ~ A * B含两个协变量的ANCOVA y ~ x1 + x2 + A*B随机化区组y ~ B + A (B是区组因⼦)单因素组内ANOVA y ~ A + Error(Subject/A)含单个组内因⼦(W)和单个组间因⼦(B)的重复测量ANOVA y ~ B * W + Error(Subject/W)表达式中的各项顺序:有两种情况会造成影响:(1)因⼦不⽌⼀个,并且是⾮平衡设计;(2)存在协变量。
出现任意⼀种情况时,等式右边的变量都与其他每个变量相关,此时我们⽆法清晰地划分它们对因变量的影响。
例如,对于双因素⽅差分析,若不同处理⽅式中的观测数不同,那么模型y ~ A * B与模型y ~ B * A的结果不同R默认类型1(序贯型)⽅法计算ANOVA效应。
第⼀个模型可以这样写:y ~ A + B + A : BR中的ANOVA表的结果将评价:1. A对y的影响2. 控制A时,B对y的影响3. 控制A和B的主效应时,A与B的交互效应顺序很重要当⾃变量与其他⾃变量或者协变量相关时,没有明确的⽅法可以评价⾃变量对因变量的贡献。
单因素方差分析原理
单因素方差分析原理
单因素方差分析是一种常用的统计方法,用于比较一个因素对于不同组之间的差异是否显著。
其基本原理是利用组内变异与组间变异之间的比较来判断因素对于不同组的影响程度。
在单因素方差分析中,我们将总体的方差分解为两个部分:组间方差和组内方差。
组间方差反映了不同组之间的差异程度,而组内方差反映了同一组内观测值之间的差异。
通过计算组间方差和组内方差的比值,可以得到F值,即F
统计量。
F统计量的大小反映了因素对于不同组之间的差异是
否显著。
如果F值显著大于1,表明组间方差较大,差异显著,因素对于不同组之间的差异有显著影响;反之,如果F值接
近1,则说明组间方差较小,差异不显著,因素对于不同组之
间的差异没有显著影响。
进行单因素方差分析时,需要满足一些基本假设,如观测值之间的独立性、组内方差的同质性等。
此外,还需要使用适当的假设检验方法和确定显著水平,以判断因素对于不同组之间的差异是否显著。
总之,单因素方差分析通过比较组内变异与组间变异,能够帮助我们判断一个因素对于不同组之间的差异是否显著,从而得出相应的结论。
这种统计方法在实验设计和数据分析中经常被应用,对于研究因素的影响具有重要的意义。
统计学 分析题
问:管理者的层次评分是否对评分有显著影响? 管理者的层次评分是否对评分有显著影响?
H 0 : µ ≥ 1000 H1 : µ < 1000
决策:P= 0.022< α = 0.05,拒 绝原假设,接受备选假设。 结论:该批灯泡的平均寿命 低于合同规定。
例:不拒绝原假设时
Data
某批发商欲从厂家购进 一批灯泡,合同规定灯 泡平均使用寿命不低于 1000小时,已知标准差 为200小时。现随机抽取 100支灯泡,测得平均寿 命为980小时。问该批灯 泡的平均寿命是否低于 合同规定?
总体比例的假设检验总体均值的检验?总体标准差已知时用正态分布确定样本发生概率100nx??应用phstat?总体标准差已知时用t分布确定样本发生概率用样本标准差s代替10nn?10??ntnsx?例
统计学原理
分析题
第4章 数据的概括性度量
分析要点:
1. 离散系数 2. 经验法则 3. 标准化分数
例1
结论:错误在190~210之间的概率为38.29%
第6章 统计量及其抽样分布
要点:
1. 确定样本均值的分布并计算相关概率 2. 确定样本比例的分布并计算相关概率
例1:样本均值的分布
作为市场营销研究的一部分,Food King超市连 锁店随机抽取150名顾客。顾客的平均消费为 31.84美元。取样之前,该公司假定顾客消费的平 均水平为$ 30.00,标准差为8.00美元。如果这些 假定是正确的,那么抽取的顾客平均消费在31.84 美元以上的概率是多少?这个概率对于该公司先 前的假定意味着什么?
Normal Probabilities Common Data Mean Standard Deviation Probability for X <= X Value Z Value P(X<=230) 230 1.5 0.9331928 200 20
最新《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)
《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第10章SPSS的聚类分析1、根据“高校科研研究.sav”数据,利用层次聚类分析对各省市的高校科研情况进行层次聚类分析。
要求:1)根据凝聚状态表利用碎石图对聚类类数进行研究。
2)绘制聚类树形图,说明哪些省市聚在一起。
3)绘制各类的科研指标的均值对比图。
4)利用方差分析方法分析各类在哪些科研指标上存在显著差异。
采用欧氏距离,组间平均链锁法利用凝聚状态表中的组间距离和对应的组数,回归散点图,得到碎石图。
大约聚成4类。
步骤:分析→分类→系统聚类→按如下方式设置……结果:凝聚计划阶段 组合的集群系数 首次出现阶段集群 下一个阶段集群 1集群 2集群 1集群 21 26 30 328.189 0 02 2 26 29 638.295 1 0 73 20 25 1053.423 0 0 54 4 12 1209.922 0 0 15 5 8 201505.035 0 3 6 6 8 16 1760.170 5 0 9 7 24 26 1831.926 0 2 10 8 7 11 1929.891 0 0 11 9 5 8 2302.024 0 6 22 10 24 31 2487.209 7 0 22 11 2 7 2709.887 0 8 16 12 22 28 2897.106 0 0 19 13 6 23 2916.551 0 0 17 14 10 19 3280.752 0 0 25 15 4 21 3491.585 4 0 21 16 2 3 4229.375 11 0 21 17 6 13 4612.423 13 0 20 18 9 18 5377.253 0 0 25 19 14 22 5622.415 0 12 24 20 6 15 5933.518 17 0 23 21 2 4 6827.276 16 15 26 22 5 24 7930.765 9 10 24 23 6 27 9475.498 20 0 26 24 5 14 14959.704 22 19 28 25 9 10 19623.050 18 14 27 26 2 6 24042.669 21 23 28 27 9 17 32829.466 25 0 29 28 2 5 48360.854 26 24 29 29 2 9 91313.530 28 27 30 3012293834.50329选中数据列,点击“插入”菜单 拆线图……碎石图:由图可知,北京自成一类,江苏、广东、上海、湖南、湖北聚成一类。
10.3(双因素方差分析)
10.3.1 无交互作用的双因素方差分析
计算F统计量 在单元格G15中输入公式: 中输入公式: 计算 统计量FB,在单元格 统计量 中输入公式 =F15/F16 计算F 中输入公式: 计算 A的P值,在单元格 值 在单元格H14中输入公式: 中输入公式 =FDIST(G14,D14,D16) 计算FB的P值,在单元格 中输入公式: 计算 值 在单元格H15中输入公式: 中输入公式 =FDIST(G15,D15,D16) 如图10.9所示. 所示. 如图 所示
平均值
x1..
x2..
xl..
10.3 双因素方差分析
10. 10.3.1 无交互作用的双因素方差分析
无交互作用的双因素方差分析的数学模型可以表示 为: xijk= µ + αi + τj + εijk
ε ijk ~ N (0, σ 2 ) , 且相互独立. 1≤i≤l, 1≤j≤m, 1≤k≤n 且相互独立
10.3.1 无交互作用的双因素方差分析
( 2) 计算 xi ..,在单元格 在单元格C10中输入公式: 中输入公式: 中输入公式 =AVERAGE(C4:C9) 并将单元格C10中公式复制到单元格区域 中公式复制到单元格区域D10:F10. 并将单元格 中公式复制到单元格区域 . 在单元格G4中输入公式 中输入公式: 计算x. j . ,在单元格 中输入公式: =AVERAGE(C4:F5) 并将单元格G4中公式复制到单元格 、 中 并将单元格 中公式复制到单元格G6、G8中. 中公式复制到单元格 如图所示. 如图所示.
10.3 双因素方差分析 对于两因素问题,通常考虑等重复观测的情形, 对于两因素问题 ,通常考虑等重复观测的情形,若 第一个因素A有 个水平 第二个因素B有 个水平 个水平, 个水平. 第一个因素 有l个水平,第二个因素 有m个水平.在 因素A的第 个水平和因素B的第 个水平下均进行了n次 因素 的第i个水平和因素 的第j个水平下均进行了 次 的第 个水平和因素 的第 个水平下均进行了 观测,记为{x 观测,记为 ijk,1≤i≤l,1≤j≤m,1≤k≤n}. , , . 其数据结构如表所示. 其数据结构如表所示.
第10章单因素方差分析
第10章单因素方差分析单因素方差分析(0ne-Way ANOV A),又称一维方差分析,它能够对单因素多个独立样本的均数进行比较,可以用10种检验方法对变量间的均数进行两两比较(即多重比较检验)并给出方差分析表,还可以作出5种类型图形(Type of plots)和2种均数图形(Means plot options)10.1 单因素方差分析的计量资料[例10—1] 某社区随机抽取了30名糖尿病患者、IGT异常人和正常人进行载脂蛋白(mg/dL)测定,结果示于表10—1。
试问3组人群的载脂蛋白测定结果含量是否相同?(倪宗瓒.卫生统计学.第4版,北京:人民卫生出版社,2001.50)本例是一个完全随机设计的单因素方差分析。
已建立SAS数据集文件并保存Sasuser.onewav4。
(1)进入SAS/Win(v8)系统,单击Solutions-Analysis-Analyst,得到分析家窗口。
(2)单击File-open By SAS Name—Sasuser-0neway4—0K,调入数据文件。
(3)在“分析家”窗口单击Statistics-ANOV A-One way ANOV A,得到图10—1所示对话框。
本例因变量(Dependent)为A(载脂蛋白),单击A—Dependent。
自变量(1ndependent):B(3种人的组别),单击B—Independent 。
图10.1 0ne—way ANOV A:0neway4(单因素方差分析)对话框(4)单击Tests按钮,得到图10—2所示对话框。
在此对话框的ANOV A(F—检验)选项中可进行如下设置。
Analysis of variance,方差分析。
Welch’s variance-weighted ANOV A,威尔奇方差—权重方差分析。
Tests for equal variance,相等方差检验,即方差齐性检验。
Barlett’s test,巴特尼特检验。
第十章 F分布及其应用
第十章F分布及其应用学习要点第一节F分布第二节F分布的应用——方差的同质性检验第三节F分布的应用——方差分析本章小结学习要点1.理解方差分析的基本原理2.熟练掌握方差分析的基本方法3.熟练掌握不同实验设计的方差分析方法4.熟练掌握方差分析的全过程5.了解二因素方差分析的原理6.初步掌握SPSS中的方差分析操作第一节F分布研究A、B、C三种不同学校学生的阅读理解成绩找到一种解决的办法,有人可能会以为,只要多次使用Z检验或t检验,比较成对比较学校(或条件)即可。
但是我们不会这样来处理。
因为Z检验或t检验有其局限性。
一、Z检验和t检验的局限性当研究中出现两个以上的平均数时,用Z检验和t检验会有以下一些不足。
(一)比较的组合次数增多如上所述,若把三所学校成对比较,则需对A校与B校,B校与C校,C校与A校做检验,这时我们所做的检验是三次而不是一次。
如果一次研究10个学校,其检验数就会达到45个之多。
事实上我们只需要一个可以让我们同时处理两种以上条件的单独检验。
(二)降低可靠程度因为对数据做得Z检验或t检验越多,我们更容易犯Ⅰ型错误。
在一个检验中,α=0.05,意味着有0.05的可能性犯Ⅰ型错误,即有1-α=0.95的概率不犯Ⅰ型错误。
如果我们做两次检验,每次都为0.05的显著性水平,那么不犯Ⅰ型错误的概率就变为0.95×0.95=0.90。
此时犯Ⅰ型错误的概率则为1-0.90=0.10,即至少犯一次Ⅰ型错误的概率翻了一倍。
若做10次检验的话,至少犯一次Ⅰ型错误的概率将上升到0.40(1-0.952),而10次检验结论中都正确的概率只有60%。
所以说采用Z检验或t检验随着均数个数的增加,其组合次数增多,从而降低了统计推论可靠性的概率,增大了犯错误的概率。
若想要若干检验的总显著性水平仍为0.05的话,一种做法就是为每一独立检验设置更为保守的显著性水平。
譬如,若进行5次检验,为了使总的犯Ⅰ型错误的风险仍为0.05,则每一个独立检验的显著性水平需设为p=0.01(因为1-0.99×0.99×0.99×0.99×0.99=0.05)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第10章 单因素方差分析单因素方差分析(0ne-Way ANOV A),又称一维方差分析,它能够对单因素多个独立样本 的均数进行比较,可以用10种检验方法对变量间的均数进行两两比较(即多重比较检验)并给出方差分析表,还可以作出5种类型图形(Type of plots)和2种均数图形(Means plot options)10.1 单因素方差分析的计量资料[例10—1] 某社区随机抽取了30名糖尿病患者、IGT 异常人和正常人进行载脂蛋白 (mg /dL)测定,结果示于表10—1。
试问3组人群的载脂蛋白测定结果含量是否相同?(倪宗瓒.卫生统计学.第4版,北京:人民卫生出版社,2001.50) 组别(B )载脂蛋白测定 糖尿病(1)85.7 105.2 109.5 96.0 115.2 95.3 110.0 100.0 125.6 111.0 106.5 96.0 124.5 105.1 76.4 95.3 110.0 95.2 99.0 120.0144.0 117.0 110.0 109.0 103.0 123.0 127.0 121.0 159.0 115.0 IGT 异常(2) 正常人(3)本例是一个完全随机设计的单因素方差分析。
已建立SAS 数据集文件并保存Sasuser.onewav4。
(1)进入SAS /Win(v8)系统,单击Solutions -Analysis -Analyst ,得到分析家窗口。
(2)单击File-open By SAS Name —Sasuser-0neway4—0K ,调入数据文件。
(3)在“分析家”窗口单击Statistics-ANOV A-One way ANOV A ,得到图10—1所示对话框。
本例因变量(Dependent)为A(载脂蛋白),单击A —Dependent 。
自变量(1ndependent): B(3种人的组别),单击B —Independent 。
图10.1 0ne —way ANOV A :0neway4(单因素方差分析)对话框(4)单击Tests 按钮,得到图10—2所示对话框。
在此对话框的ANOV A(F —检验)选项 中可进行如下设置。
Analysis of variance ,方差分析。
Welch ’s variance-weighted ANOV A ,威尔奇方差—权重方差分析。
Tests for equal variance ,相等方差检验,即方差齐性检验。
Barlett ’s test ,巴特尼特检验。
Brown-Forsythe test ,布朗—福塞斯检验。
Levene ’s test ,列文检验。
本例以上都选。
图10—2 ANOV A(方差分析)选项卡(5)单击图10。
2所示对话框的Power Analysis标签,得到图10—3所示的Power Analysis选项卡。
本例选择Perform Power analysis(执行功效分析),。
(A1phas)值取默认值0.05图10—3 Power Analysis(功效分析)选项卡(6)单击0K按钮,返回图10—1所示对话框。
单击Means按钮,得到图10—4所示对话框。
此对话框的Comparisons选项卡的Comparison method选项区域,列出了10种待选多重均数比较方法。
Bonferroni t-test,修正最小显著差异t检验法(本例选择此项)。
Tukey’s HSD,’图基可靠显著性差异检验法。
Duncan’s multiple-range test,邓肯多重范围检验法。
Dunnett’s t·test,邓尼特t检验法。
Fisher’s LSD,费雪尔最小显著差异(LSD,least·significant—difference)法。
Gabriel’s multiple—comparison procedure,嘉百列多重比较过程。
Student—Newman·Keels multiple—rangete8t,SNK多重范围检验法。
Waller—Duncan k—ratios。
test,娃尔—邓肯A—比率t检验法。
Schaffer’s multiple comparison procedure,谢弗多重比较过程。
Ryan-Einot—Gabriel—Wel6ch multiple—rangete8t,R—E—G。
W多重范围检验法。
图10-4 One-way ANOV A:Means(待选多重均数比较方法)对话框(7)单击Bonferroni t-test,得到图10。
5所示对话框。
在comparisons选项卡中可进行相关设置。
本例显著性水平(Signillcancelevel)为0.贴。
也可以选择其他值。
主效应(Main effects)为B,加选(Add)效应/方法(effect/method)为B/Bonferronit。
test,单击B—Add,完成相应设置。
图10—5 One—way ANOV A:Means(已选均数比较)对话框(8)单击Breakdown标签,得到图10—6所示对话框的Breakdown选项卡。
数学变量统计量全选。
图10-6 Breakdown(均数细分)选项卡(9)单击0K按钮,返回图10—1所示对话框。
单击P10ts按钮,得到图10—7所示对话框。
图10-7 one-Way ANOV A:P1ots(作图)对话框(10)单击0K按钮,返回图10—1所示对话框。
单击0K按钮,得到如下数值结果。
图形结果如图10-8到图10-10所示。
图10—8 Box plot of A by B(箱形图)图10—9 Bar chart of A mean:(条形图)图10—10 Means Plot of A by B(均数图)主要结果分析(1)方差齐性检验(Test for Homogeneity of A Variance):由巴特尼特检验(Bartlelt’stest),布朗—福塞斯检验(Brown—Forsyth test)以及列文检验(Levine’s test)等3种方法的结果表明,P>0.05,可认为本例方差齐。
(2)方差分析表明,F(F Value)=5.85,P<0.05。
在a=0.05水准上,拒绝量H0,接受H1,可认为3种人群的载脂蛋白不同或不完全相同,它们之间有差别。
(3)均数间的多重比较(Bonferroni t-test,修正最小显著差异t检验法),得到表10—2所示结果。
(4)3种人群的均数从小到大,依次为:102.39 105.45 122.801GT异常人(2) -糖尿病患者(1) -正常人(3) 由图10—8至图10—10可见,正常人(3)的载脂蛋白均高于IGT异常人(2)和糖尿病患者(1)。
(5)本例尚有均数及其描述性统计量等结果。
其他分析方法本例也可以选择如下途径:So1utions—ASSIST—WorkPlace(工作空间)一Continue -Data Analysis4AN0vA—Analysis of variance,在相应对话框中选择SASUSER.0NEW AY3及相应的因变量(Dependent,A),自变量(1ndependent,B)和相关选项,同样可获得上述主要结果。
10.2 单因素方差分析的变量转换在用方差分析时,理论上要求具备3个条件:①各组数据应从相同的正态分布总体中获得。
②样本的各总体方差相等,即方差齐性,否则就是方差不齐;③每一组数据均由若干部分相加而成效应的可加性。
但是实际工作中的数据有时并不完全满足上述条件,这时,可以采用变量转换的方法使之改变原数据的分布形式,以满足上述条件。
5AS/Win(v8)系统提供了30多种变量转换(Transformation)方法,包括平方根转换,对数转换正弦转换等,用户可以根据数据的特征在SAS/Win(v8)系统中选择某一转换方法,使其数据基本上满足上述假定。
[例10—2] 以骨质增生丸液注入小白鼠腹腔,按含原生药20、50、100(mg/100m1)的剂量分为3个试验组,另设对照组,注入同量生理盐水。
一小时以后注入醋酸,记录各小白鼠的“扭体次数”为表示痛感程度的指标(X),数据表略。
试分析3种剂量的镇痛效果。
(郭祖超.医用数理统计方法。
第3版,北京:人民卫生出版社,1988.305)表10。
3 小白鼠痛感程度指标由于本资料系“次数”,有若干个0值,方差又不齐,需要进行变量转换。
(1)进入SAS/Win(v8)系统,单击Solutions—Analysis—Analyst进人分析家窗口,建立并保存图10-11所示的数据集文件Sasuser.onel。
其中,4为小白鼠痛感程度的指标,而月为分组变量量。
l为20g组,2为50g组,3为100g组,4为对照组。
可以单击File-Save-(Libraries)-Sasuser-(Member)one way3-0K。
保存数据集文件Sasuser.one way3。
如果直接用上述资料进行分析,方差不齐。
因此,可以进行对数转换。
L_X=log (X十1.5):2)单击Solutions’Analysis Interactive Data Analysis(Libraries) Sasuser-(Data Set)One way3-open,得到图10—12所示数据文件。
在此界面单击图10-12左上角的箭头。
选择Define Variables,单击A,将(Name)A改为X,再单击Apply。
单击图10—12左上角的箭头,选择Deflne Variable6,单击B,将(Name)B改为G,再单击Apply,得到图10-13所示数据文件。
图10—11 数据文件(部分) 图10-12数据文件(部分) 图10-13 数据文件(部分)(3)单击Edit-Variables-Other,得到图10—14所示对话框。
变量转换(Transformation)选择log(Y十a),其中,a为1.5。
(4)单击Apply按钮,得到图10—15所示数据文件。
图10—14 Edit Variable(编辑变量)对话框图10—15 转换后的数据文件(部分)(5)再将对数转换后的资料保存为SASUSER..ONE3。
单击File-Save-Data,得到图10-16所示对话框。
保存的SAS数据库(Library)为SASUSER,SAS数据集文件(Data Set)为ONE3。
图10.16 save Data(保存转换后的数据)对话框(6)单击OK—So1utions-Aanlysis-Analyst,进入分析家窗口。