第十二章 方差分析
第12章-多重线性回归分析
6 因变量总变异的分解
P
(X,Y)
Y
(Y Y) (Y Y)
(Y Y)
Y X
Y
Y
9
Y的总变异分解
Y Y Yˆ Y Y Yˆ
Y Y 2 Yˆ Y 2 Y Yˆ 2
总变异 SS总
回归平方和 剩余平方和
SS回
SS剩
10
Y的总变异分解
病程 (X2)
10.0 3.0 15.0 3.0 4.0 6.0 2.9 9.0 5.0 2.0 8.0 20.0
表 12-1 脂联素水平与相关因素的测量数据
空腹
回归模空型腹 ?
瘦素
脂联 BMI 病程 瘦素
脂联
(X3)
血糖 (X4)
素(Y)
(X1)
(X2)
(X3)
血糖 素(Y) (X4)
5.75 13.6 29.36 21.11 9.0 4.90 6.0 17.28
H 0: 1 2 3 4 0 ,即总体中各偏回归系数均为0; H 1:总体中各偏回归系数不为0或不全为0;
= 0.05。
2 计算检验统计量: 3 确定P值,作出推断结论。
拒绝H0,说明从整体上而言,用这四个自变量构成 的回归方程解释糖尿病患者体内脂联素的变化是有统 计学意义的。
的平方和 (Y Yˆ)2为最小。
只有一个自变量
两个自变量
例12-1 为了研究有关糖尿病患者体内脂联素水平的影响因 素,某医师测定30例患者的BMI、病程、瘦素、空腹血糖, 数据如表12-1所示。
BMI (X1)
24.22 24.22 19.03 23.39 19.49 24.38 19.03 21.11 23.32 24.34 23.82 22.86
方差分析SPSS
F界值为单尾
4、根据统计推断结果,结合相应的专业知识,给出一个专 业的结论。
随机区组设计的两因素方差分析
配伍设计有两个研究因素,区组因素和处理因素。 事先将全部受试对象按某种或某些特征分为若干个 区组,使每个区组内研究对象的特征尽可能相近。 每个区组内的观察对象与研究因素的水平数k相等, 分别使每个区组内的观察对象随机地接受研究因素 某一水平的处理。
k ni
SS总=
( Xij X )2 ,总 N 1
i1 j 1
组间变异:各处理组的样本均数也大小不等。大小可用各组
均数 X i 与总均数 X 的离均差平方和表示。
k
SS组间= ni ( X i X )2 , 组间 k 1, MS组间=SS组间 组间 i 1
组内变异:各处理组内部观察值也大小不等,可用各处理组
内部每个观察值 X ij与组均数 X i 的离均差平方和表示。
k ni
SS组内=
( Xij Xi )2,组内 N k,MS组内=SS组内 组内
i1 j1
三种变异的关系
SS总 SS组间 SS组内
并且该等式和上面的等式存在如下的对应关系 总变异=随机变异+处理因素导致的变异
总变异=组内变异 + 组间变异
=0.05
2、选定检验方法,计算检验统计量
F MS处理 MS误差;F MS区组 MS误差 3、确定P值,作出推断结论
F F ,P (处理,误差 ) F F ,P (处理,误差 )
F界值为单尾
4、根据统计推断结果,结合相应的专业知识,给出一个专 业的结论。
多重比较
LSD-t 检验:适用于检验k组中某一对或某几对在 专业上有特殊意义的均数是否相等。
第十二章 连续变量的统计推断(二)—单因素方差分析
SPSS中实现过程 中实现过程
随机抽取了三组学生的数学成绩,试以 随机抽取了三组学生的数学成绩,试以0.05的显著性水 的显著性水 平分析三组学生的数学平均成绩是否有显著差异。 平分析三组学生的数学平均成绩是否有显著差异。
人 名 hxh yaju yu shizg hah s watet jess wish 2_new1 2_new2 2_new3 2_new4 2_new5 2_new6 2_new7 2_new8 2_new9 数 学 99.00 88.00 99.00 89.00 94.00 90.00 79.00 56.00 89.00 99.00 70.00 89.00 55.00 50.00 67.00 67.00 56.00 56.00 组 别 0 0 0 0 0 0 2 2 2 2 2 2 1 1 1 1 1 1
实现步骤
在菜单中选择“OneANOVA”命令 在菜单中选择“One-Way ANOVA”命令
“One“One-Way ANOVA”对话框 ANOVA”对话框
“One“One-Way ANOVA:Options”对话框 ANOVA:Options”对话框
“One“One-Way ANOVA:Post Hoc Multiple Comparisons”对话框 ANOVA: Comparisons”对话框
单因素方差分析实质上采用了统计推断的方法, 单因素方差分析实质上采用了统计推断的方法, 由于方差分析有一个比较严格的前提条件, 由于方差分析有一个比较严格的前提条件,即不 同水平下,各总体均值服从方差相同的正态分布, 同水平下,各总体均值服从方差相同的正态分布, 因此方差分析问题就转换成研究不同水平下各个 总体的均值是否有显著差异的问题。 总体的均值是否有显著差异的问题。
《社会统计学》章节知识点——单选题
《社会统计学》章节知识点——单选题第一章总论●变量类型1.下列变量属于数值型变量的是( A )。
A.工资收入B.产品等级C.学生对考试改革的态度D.企业的类型【参考答案】A2.从变量分类看,下列变量属于定序变量的是( C )。
A.专业B.性别C.产品等级D.收入【参考答案】C●总体和样本1.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平,这项研究的样本是( B )。
A.332.1万户家庭B.3000户家庭C.332.1户家庭的年均收入D.3000户家庭的年均收入【参考答案】B2.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平,这项研究的总体是( A )。
A.22000名学生B.2200名学生C.22000名学生的每月生活费用 D.2200名学生的每月生活费用【参考答案】A3.为了解某地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上,此处5000户是( C )。
A.变量 B.总体 C.样本 D.统计量【参考答案】C●抽样方式4.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的机会入选样本,这样的抽样方式称为( A )。
A.简单随机抽样B.系统抽样 C.整群抽样D.分层抽样【参考答案】A5.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查,这种调查方法属于( C )。
A.简单随机抽样 B.整群抽样 C.分层抽样 D.系统抽样【参考答案】C6.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,最后将所有子样本合起来作为总样本,这样的抽样方式称为( D )。
医学统计学课件:第十二章 重复测量设计资料的方差分析
111
123
131
B
10
118
114
116
123
133
C
11
131
119
118
135
129
C
12
129
128
121
148
132
C
13
123
123
120
143
136
C
14
123
121
116
145
126
C
15
125
124
118
142
130
2. 未设立对照的重复测量数据
表12-3 受试者血糖浓度(mmol/L)
• 能说明治疗有效吗?
住院休息,环境和情绪的改变?考虑了吗?
二、设立对照的前后测量设计
高血压患者治疗前后的舒张压(mmHg)
编号 1 2 3 4 5 6 7 8 9 10
处理组 前后 130 114 124 110 136 126 128 116 122 102 118 100 116 98 138 122 126 108 124 106
1. 设立对照的重复测量设计
• 将手术要求基本相同的15名患者随机分3
组,在手术过程中分别采用A,B,C三 种麻醉诱导方法,在T0(诱导前)、T1、 T2、T3,T4 五个时相测量患者的收缩压, 数据记录见表。
表 12-16 不同麻醉诱导时相患者的收缩压(mmHg)
方法 序号
T0
麻醉诱导时相
T1
.937**
.882**
Sig. (2-tailed)
.001
.004
N
8
生物统计第十二章 实验设计2
在某些情况下,我们不仅需要排除假阳性, 还需要排除假阴性。此时就需要设置阳性 对照了。这主要用于我们对实验材料是否 会产生我们所希望的变化并无十分把握的 情况。例如在遗传毒理实验中,常以靶细 胞染色体是否受到损害为指标。如果我们 选用了一类新的靶细胞,那对它是否会出 可观察到的明显的染色体损害就不是非常 肯定。此时则不仅需要阴性对照,也需要 阳性对照,即留出部分实验材料采用一些 已知的强诱变剂,
注意适当设置对照, 四 . 注意适当设置对照 , 包括阴性 对照与阳性对照
在生命科学的研究中,常常很难事先根据理 论或经验确定一个标准值,然后再检验样 本是否与它相同。常用的方法是设置一个 对照,通过与对照的比较来检验是否达到 了目的。这种对照又可分为阴性对照与阳 性对照。所谓阴性对照常常是留出一定量 实验材料不加特殊处理,让它们保持自然 状态;而另一部分材料则按预定程序加以 特定处理,然后对处理和不处理的结果加 以比较,看它们是否有差异,从而判断处 理是否有效。
2. 双样本:当两总体标准差σ1,σ2已知时, 其平均值之差的标准差为:
σ 12
n1
2 σ 12。因此有: σ2
n1
L = u 0 . 975 +
+
n2
σ
2 2
令
n n
1
n2
= =
σ σ σ
1
(12.2)
2
σ
1
2
+ σ
2
N ,
2
则有:N = n1 + n2, 且
从统计学角度看,我们更关心第三步,即从数 据处理与分析的角度作好实验设计。一个好 的实验设计,应当是既不丢掉有用信息,又 不浪费人力物力去收集无用数据,并保证以 最小的工作量获取能满足使用需求精度的数 据。从前边的一些课程中也可看到实验设计 的重要性。例如二因素方差分析,有交互作 用,但实验未设重复;或本应进行协方差分 析,却未记录协变量的数据,等等。
第十二章 方差分析
2
2. 组内误差 组内误差(sum squares of error)是因素的同一水平(同一个总体) 下样本数据的误差。它是每个水平或组的个体样本数据与其本组平均值 误差的平方和,通常记作 SSE,也称为误差项平法和或残差平方和。 计算公式为:
SSE xij xi
i 1 j 1
假设显著水平 α = 0.05,可以通过查 F 分布表得:F0.05(2,12)= 3.89。而 F = 17. 06 839 > F0.05(2,12)= 3.89, 所以拒绝虚无假设,也就是说,我们 认为专业对收入有显著影响。
通过 F 检验可以发现自变量与因变量之间是否有影响,但是至于影 响程度多大,F 检验不能给出。
方差分析的逻辑
方差分析作为一种统计方法,是根据变异的可加性,将数据的总变异分 为不同来源的分量。具体地讲,它将总平方和分解为组内误差和组间误 差。 1. 总误差平方和 总误差平方和(sum squares of total)是全部观察值 xij 与所有观察 值的平均值 x 的误差平方和,通常记作 SST。它反映了前部观察值的 离散状况。 公式为:
F 统计量服从自由度为 n1 和 n2 的 F 分布。
F 统计量构造
组间均方: MSA 组 间 平 方 和 SSA
自由度
k 1
组内均方: MSE 组 内 平 方 和 SSE
自由度
nk
在计算出组间均方 MSA 和组内均方 MSE 后,将它们两个进行对比即 可得到检验需要的 F 统计量。 计算公式为: F
例子
某大学不同专业毕业生平均月收入 专业 单位:元
毕业生
社会学 1 2 3 4 5 3200 2800 3000 3400 2600 经济学 5000 5000 4300 4000 3900 信息学 4500 4200 3800 4800 4000
第2章单因素方差分析
第12章方差分析(Analysis of V ariance)方差分析是鉴别各因素效应的一种有效统计方法,它是通过实验观察某一种或多种因素的变化对实验结果是否带来显著影响,从而选取最优方案的一种统计方法。
在科学实验和生产实践中,影响一件事物的因素往往很多,每一个因素的改变都有可能影响产品产量和质量特征。
有的影响大些,有的影响小些。
为了使生产过程稳定,保证优质高产,就有必要找出对产品质量有显著影响的那些因素及因素所处等级。
方差分析就是处理这类问题,从中找出最佳方案。
方差分析开始于本世纪20年代。
1923年英国统计学家R.A. Fisher 首先提出这个概念,(ANOV A)。
因当时他在Rothamsted农业实验场工作,所以首先把方差分析应用于农业实验上,通过分析提高农作物产量的主要因素。
Fisher1926年在澳大利亚去世。
现在方差分析方法已广泛应用于科学实验,医学,化工,管理学等各个领域,范围广阔。
在方差分析中,把可控制的条件称为“因素”(factor),把因素变化的各个等级称为“水平”或“处理”(treatment)。
若是试验中只有一个可控因素在变化,其它可控因素不变,称之为单因素试验,否则是多因素试验。
下面分别介绍单因素和双因素试验结果的方差分析。
1.1 单因素方差分析(One Way Analysis of Variance)1.一般表达形式2.方差分析的假定前提3.数学模形4.统计假设5.方差分析:(1)总平方和的分解;(2)自由度分解;(3)F检验6.举例7.多重比较1.1.1 一般表达形式首先通过一个例子引出单因素方差分析方法。
某农业科研所新培养了四种水稻品种,分别用A1,A2,A3,A4表示。
每个品种随机选种在四块试验田中,共16块试验田。
除水稻品种之外,尽量保持其它条件相同(如面积,水分,日照,肥量等),收获后计算各试验田中产量如下表:通过这些数据要考察四个不同品种的单位产量,是否有显著性差异。
第十二章 三次设计
12.2 通过试验设计容差(华达呢染色)
前面讨论的试验项目,一般都是参数设计的项目。有时候,找到了 优良参数组合以后,在怎样的精度下使用这种好参数条件,就需要进行 容差设计。容差设计告诉我们:对哪些因素应严格控制和掌握?对哪些 因素可放宽限制?“严”则提高质量、效果,“宽”则降低成本简化操作。 例如,北京化工厂的“铬酸钡工艺改进”试验后,发现PH值为重 要因素,应严格控制在PH3-PH4之间才行,这样用PH试纸就不 合适了,化工厂用工业酸度计代替了试纸,实现了PH值自动控制,结果 不仅产品质量大为改进,而且提高了生产效率。 下面介绍的“华达呢染色”中的(三)是一个通过试验进行容差设 计的实例。纯毛华达呢6707色号(蓝色), 过去由于操作水平不统一, 同样的染料配方,染出的产品色差却很大。原来作试验的主要目的是 为了找出对上色号的辅料配比及方便易行的操作方法。试验后不仅达 到了目的,而且还节约了染料。
2.参数设计:系统设计之后,就是要决定系统因素的好参数组合. 在试验项目中,指的是要找到综合效果较好的生产条件。对于可计算 性项目,什么叫做好参数组合呢?它主要分成两类: 第一类是“直接择优”项目,优良的参数组合使得产品的性能指标达 到优良的状态。
第二类是:稳定性择优”项目,通过优良的参数组合,来提高产品指标 的稳定性。
表 12-4 因素
试验号
1 2 3 4 K1 K2 R
矾前沸 1 1大沸 2 小沸 1 2 180 185 5
矾后沸 2 1小沸 1 2大沸 2 185 180 5
矾前留液 3 1界限之间 2低于下限 2 1 200 165 35
评分 100 85 80 100 总和=365
四、效果
1.通过参数设计(前两批正交试验)找到了好的搭配条件,染色效果显著 提高。通过参数设计能得到好的生产条件,通过容差设计知道,如何实 现好条件。要想生产稳步上升,条件掌握该粗则粗,该细则细。 2. 用三次设计得到的好条件投产,批批对上色号。在不增加人力、物 力、财力的条件下,做到节约成本(节约染料15%),提高质量(批批对上 色号)、减少三废(减少了红矾用量,又取消了矾前放液。使染料与红矾 充分络合。减少了留入地沟的红矾),又减少了染色时间,真是一举四得。
12方差分析
单因素方差分析
t 检 验 法 只 适用于两个处理平均数 适用于两个处理平均数 间差异显著性检验。如果采用t检验法对多 检验法对多 间差异显著性检验。如果采用 检验法 个处理平均数间进行差异显著性检验 ,会 出现问题: 出现问题:
1、计算工作量大 、
理平均数,采用t检验 例如对于 5 个 处 理平均数,采用 检验 法,则需进行 性检验。 性检验。
方差分析的基本步骤:1,平方和与自由度分解(含均方 计算);2,计算均方比作F测验,3,多重比较
第九章 两因素方差分析
28
第一节 两因素无重复资料方差分析
♦ 设A方向分为a个组,B方向分为b个组,交叉分组后每个单
元格只有一个观察值,资料模式如下:
A向 分组 A1 A2 …… Aa T.j Y.j
B向分组 B1 B2 y11 y12 y21 y22 …… …… ya1 ya2 T.1 T.2
Ti. …… …… …… …… …… …… Bb y1b y2b …… yab T.b T1. T2 . …… Ta. T..
Yi. Y1.
Y..
♦ 注意与单向分组资料的区别在于,每个值均固
定位置,不能调换。 ♦ 变异来源为:A组间,B组间,A×B互作 ♦ 互作,是指A因为B的变异引起的变异,或B 因 为A的变异引起的变异。 ♦ 在无重复两因素资料中,用互作表示实验的误 差。
一、自由度与平方和分解
药剂 A B C D 苗高 18 20 10 28 21 24 15 27 20 26 17 29 13 22 14 32 总和 72 92 56 113 T=336 平均 18 23 14 29 21
C=T2/nk=3362/4*4=7056 SST=∑y2-C=182+212+…+322-C=602; df=kn-1=4*4-1=15 SSt=∑Ti2/n-C=(722+922+562+1162)/4-C=504; df=k-1=4-1=3 SSe= ∑y2 ∑Ti2/n = SST- SSt=602-504=98:; df=k(n-1)=4*(4-1)=12
《医学统计学》习题解答(最佳选择题和简答题)
《医学统计学》习题解答(最佳选择题和简答题)孙振球主编.医学统计学习题解答. 第2版. 北京:人民卫生出版社2005目录第二章计量资料的统计描述 (2)第三章总体均数的估计与假设检验 (3)第四章多个样本均数比较的方差分析 (6)第五章计数资料的统计描述 (7)第六章二项分布与Poisson分布 (9)第七章χ2检验 (11)第八章秩和检验 (13)第九章回归与相关 (14)第十章统计表与统计图 (17)第十一章多因素试验资料的方差分析 (19)第十二章重复测量设计资料的方差分析 (19)第十五章多元线性回归分析 (20)第十六章logistic回归分析 (22)第十七章生存分析 (23)第二十五章医学科学研究设计概述 (26)第二十六章观察性研究设计 (26)第二十七章实验研究设计 (28)第二十七章临床试验研究设计 (29)第二章 计量资料的统计描述(注:题号上有“方框” 的简答题为基本概念,下同)第三章总体均数的估计与假设检验简答题:第四章多个样本均数比较的方差分析简答题:第五章计数资料的统计描述简答题:第六章二项分布与Poisson分布简答题:第七章χ2检验简答题:1. 说明χ2检验的用途2. 两个样本率比较的u检验与χ2检验有何异同?3. 对于四格表资料,如何正确选用检验方法?4. 说明行×列表资料χ2检验应注意的事项?5. 说明R×C表的分类及其检验方法的选择。
第八章秩和检验简答题:5. 两独立样本比较的Wilcoxon秩和检验,当n1>10或n2-n1>10时用u检验,这时检验是属于参数检验还是非参数检验,为什么?6. 随机区组设计多个样本比较的Friedman M 检验,备择假设H1如何写?为什么?第九章回归与相关简答题:第十章统计表与统计图简答题:5. 统计表与统计图有何联系和区别?6. 茎叶图与频数分布图相比有何区别,有何优点?第十一章多因素试验资料的方差分析一、简答题1. 简述析因试验与正交试验的联系与区别。
医学统计学第十二章重复测量设计资料的方差分析PPT课件
医学统计学
8
表11-7 A,B两药联合运用的镇痛时间(min)
A 药物 剂量
1.0 mg
B 药物剂量
5g
1 5g
3g0
105
115
75
80
105
95
65
80
85
75
2.5 mg
115
80
125
135
130
120
90
150
5.0 mg
10.08.2020
85 120 125
医学统计学
65 120 100
前后测量设计不能同期观察试验结果,虽
然可以在前后测量之间安排处理,但本质上比
较的是前后差别,推论处理是否有效是有条件
的,即假定测量时间对观察结果没有影响。
10.08.2020
医学统计学
18
2. 配对 t 检验要求同一对子的两个实 验单位的观察结果分别与差值相互独立, 差值服从正态分布。
18 6983.333 387.963
10.08.2020
医学统计学
10
第十二章
重复测量设计的方差分析
ANOVA of Repeated Measurement Data
10.08.2020
医学统计学
11
Content
• Data characteristic • Analysis of two factors and two levels • Analysis of two factors and several levels • Familiar errors
16 14 10 12 20 18 18 16 18 18 1 6 .0 3 .1 316
方差分析
(三)r×c表独立性测验 3, ∵ r ≥ 3,C≥3 , df ≥ 4 不需连续性矫正,用下面公式计算: ∴ 不需连续性矫正,用下面公式计算:
χ =∑
2 i
(O − E )
E
2
或
2 Oij 2 χ = n ∑ − 1 Tri Tcj
两个总体的P1、P2未知,则在两总体方 差相等的假定下,用两个样本百分数的加 权平均数作为p1和p2的估计。 加权平均数 x +x
p=
1
2
n1 + n2
q=1−p
s p1 − p2 = ˆ ˆ
1 1 pq ( + ) n1 n2
ˆ ˆ p1 − p 2 u= s p1 − p2 ˆ ˆ
若需进行连续性矫正的u值或t值:
表4
药剂 A B 总计
防治红颈天牛药效试验结果
死虫数 178 153 331 活虫数 22 27 4 C≥3 df ≥ 2 不需连续性矫正,用下面公式计算: ∴ 不需连续性矫正,用下面公式计算:
χ =∑
2 i
(O − E )
E
2
O12j Tr2 n 2 χ = − 1 ∑ 或 Tr1Tr 2 Tcj n
χ
2 c
r + s sA − ra − 2 = rs ( A + a )
2
二、K≥3的适合性测验 K≥3的适合性测验 因为df≥2,所以不需要矫正, 因为df≥2,所以不需要矫正,可 df≥2 用以下两个公式进行计算。 用以下两个公式进行计算。
χ =∑
2 i
(O − E )
三、卡方的连续性矫正
χ =∑
2 c 1
统计学与研究方法试题答案
统计学与研究方法试题答案第一章绪论1单选题1、总体是指()A.全部研究对象B.全部研究对象中抽取的一份C.全部样本D.全部研究指标E.全部同质研究对象的某个变量的值2、统计学中所说的样本是指()A.随意抽取的总体中任意部分B.有意识的选择总体中的典型部分C.依照研究者要求选取总体中有意义的一部分D.依照随机原则抽取总体中有代表性的一部分E.有目的的选择总体中的典型部分3、下列资料属等级资料的是()A.白细胞计数B.住院天数C.门急诊就诊人数D.病人的病情分类E.ABO血型分类4、为了估计某年华北地区家庭医疗费用的平均支出,从华北地区的5个城市随机抽样调查了1500户家庭,他们的平均年医疗费用支出是997元,标准差是391元。
该研究中研究者感兴趣的总体是()A.华北地区1500户家庭B.华北地区的5个城市C.华北地区1500户家庭的年医疗费用D.华北地区所有家庭的年医疗费用E.全国所有家庭的年医疗费用5、欲了解研究人群中原发性高血压病(EH)的患病情况,某研究者调查了1043人,获得了文化程度、高血压家族史、月人均收入、吸烟、饮酒、打鼾、脉压差、心率等指标信息。
则构成计数资料的指标有()A.文化程度、高血压家族史吸烟、饮酒、打鼾B.月人均收入、脉压差、心率C.文化程度、高血压家族史、、打鼾D.吸烟、饮酒E.高血压家族史、饮酒、打鼾第二章计量资料统计描述及计数资料统计描述1、描述一组偏态分布资料的变异度,以()指标较好。
A.全距B.标准差C.变异系数D.四分位数间距E.方差2、用均数和标准差可以全面描述()资料的特征。
A.正偏态分布B.负偏态分布C.正态分布D.对称分布E.对数正态分布3、各观察值均加(或减)同一数后()。
A.均数不变B.几何均数不变C.中位数不变D.标准差不变E.变异系数不变4、比较某地1~2岁和5~5.5岁儿童身高的变异程度。
宜用()。
A.极差B.四分位数间距C.方差D.变异系数E.标准差5、偏态分布宜用()描述其分布的集中趋势。
田间试验与统计分析 第十二章 多因素试验结果的统计分析
2 B
2
r
2 ABC
rc
2 AB
ra
2 BC
rac
2 B
2
ra
2 BC
rac
2 B
2
rab
2
C
2
r
2 ABC
rb
2 AC
ra
2 BC
rab
2 C
2
rab
2 C
2
rc
2 AB
2
r
2 ABC
rc
2 AB
2
r
2 ABC
rc
2 AB
2
rb
2 AC
2
r
2 ABC
rb
2 AC
2
ra
2 BC
2
r
2 ABC
ra
2 BC
DF
a-1 b-1 c-1 (a-1) (b-1) (a-1) (c-1) (b-1) (c-1) (a-1) (b-1)(c-1) abc(n-1)
MS 固定模型
期望均方EMS 随机模型
混合模型 A、B固定,C
随机
MSA MSB MSC
MSAB
2
nbc
2 A
2
nac
2 B
2
nab
2 C
2
nc
2 AB
2
rb
2 AC
2
ra
2 BC
SSABC
2
r
2 ABC
2
r
2 ABC
2
r
2 ABC
误 差 abc(n-1)
SSe
2
2
2
第二节 裂区试验统计分析
协方差分析
例题:A-B比较
Sd
2.442 (1 1 50.875 59.52 ) 0.958
88
589.75
t yi (x x) y j (x x) 62.06 64.29 6.837
SD
0.958
查t表 t0.05(20)=2.086 t0.01(20)=2.845
A-C比较:
S d
k:处理数 n:每组成对资料数 k=3 n=8
② 计算回归系数b
b SPe 679.125 1.1515 SSex 589.75
③ 对回归关系进行检验
S b
Sy/x SSe x
S y / x :回归标准误
Sy/x
Qe ve
48.83 1.56 20
Sb
1.56 0.0653 589.75
SPe SPxy SPk 679.125
◆ 测验x与y间是否存在直线回归关系
对处理内(误差项)作回归分析
① 计算离回归平方和Qe和自由度Ve:
Qe
SSe y
(SPe )2 SSe x
830.875
679.1252 589.75
48.83
Ve k (n 1) 1 3 (8 1) 1 20
本例x-y变量间回归系数检验,回归关系 极显著,必须对反应量(y)进行矫正。
◆ 测定矫正后 yi (x x) 的差异性
① 计算总变异离回归平方和 (即对总变异
进行离回归分析)
QT
SST y
(SPT )2 SST x
765.752 891.625
945.833
271.67
VT n k 2 8 3 2 22
52 58 54 61 70 64 69 66 495
生物统计学(第3版)杜荣骞 课后习题答案 第十二章 实验设计
第十二章实验设计12.1一项关于在干旱地区生长的一种杨树(Populus euphratica),在土壤中的水分逐渐丧失后,其基因表达、蛋白谱、生态生理学及生长性能等方面产生可逆性改变的研究。
作者在本实验的5个时间点上(H5为对照),用qPCR方法度量了该杨树叶子中的三个基因的转录丰度比[83],表中给出的为阵列数据:GenBank ID 基因H1H2H3H4H5AJ 780 423 半胱氨酸蛋白酶0.7 1.0 2.3 13.1 1.9AJ 780 698 环核苷酸和钙调节的离子通道 1.5 1.2 3.0 4.3 1.5AJ 777 362 核糖体蛋白 1.1 1.1 1.0 0.9 1.2借用上述数据,以三个基因作为三个区组,计算在5个时间点上转录丰度比差异是否显著?答:随机化完全区组实验设计方差分析的程序,类似于两因素交叉分组实验设计。
以下是本题的程序和结果:options linesize=76 nodate;data poplar;do block=1 to 3;do time=1 to 5;input trans @@;output;end;end;cards;0.7 1.0 2.3 13.1 1.91.5 1.2 3.0 4.3 1.51.1 1.1 1.0 0.9 1.2;proc anova;class block time;model trans=block time;run;The SAS SystemThe ANOVA ProcedureClass Level InformationClass Levels Valuesblock 3 1 2 3time 5 1 2 3 4 5Number of observations 15The SAS SystemThe ANOVA ProcedureDependent Variable: transSum ofSource DF Squares Mean Square F Value Pr > F Model 6 72.5560000 12.0926667 1.53 0.2809Error 8 63.1013333 7.8876667Corrected Total 14 135.6573333R-Square Coeff Var Root MSE trans Mean0.534848 117.6745 2.808499 2.386667Source DF Anova SS Mean Square F Value Pr > F block 2 18.82533333 9.41266667 1.19 0.3519 time 4 53.73066667 13.43266667 1.70 0.2416从上表中的结果可以看出,如果按随机化完全区组设计进行分析,不同时间点之间的差异不显著。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i
n
(1) ∑ X ij
各水平重复试验数据之和 j =1 (各样本数据之和) 2 n (2) ∑ X ij 各水平重复试验数据平方和 j =1 (各样本数据平方和) k n (3) ∑∑ X ij 各水平重复试验数据和的总和 i =1 j =1 (全部数据之和) k n 2 X ij 各水平重复试验数据平方和的总和 (4)∑∑ i=1 j =1 (全部数据的平方和)
方差分析表 差异来源 离差平方和 组 组 总 间 内 379.611 84.000 463.611 自由度 2 15 17 方差 189.805 5.600 F 33.89 P P<0.01
2 xij = 493 ∑∑
(− 23)2 C=
18
2
= 29.389
LT = 493 − 29.389 = 463.611
(− 35) + (− 18) − 29.389 = 379.611 30 LA = + 5 7 6 LE = 463.611 − 379.611 = 84.000
2 2
′ nT = 18 −1 = 17
C =
(ΣΣ X )
ij
2
N
2
69 .7 2 = = 202 . 420 24
LT = ΣΣX ij − c = 248.31 − 202.420 = 45.890
LA
(ΣX ) =Σ
ij
2
ni
13.42 16.52 13.82 26.02 −c = + + + − 202.420 = 17.288 6 6 6 6
2、计算离差平方和 (1)总离差平方和
LT
(∑∑X ) = ∑∑X − = ∑∑X N
2 2 ij ij
2 2 ij ij
2 ij
−c
(∑∑ X ) c=
ij
2
N
(2)组间离差平方和
LA
(∑ X ) (∑∑ X ) (∑ X ) =∑ − =∑ n N n
ij i i
2
−c
(3)组内离差平方和
L E = LT − L A
H 0 : µ1 = µ 2 = µ 3
排球 1 2 3 4 5 6 7 8 5 3 8 6 体操 -5 -7 -5 -5 -3 -8 -2
ij
′ x ij = x ij − 70
游泳 -1 -8 -4 -3 -2 0 -18 94
∑x 2 xij ∑
30 198
-35 201
∑∑ x
ij
= −23
LE = LT − L A = 45 ⋅890 − 17.288 = 28.602
nT = N −1= 24−1= 23 ′ n′ = k −1= 4−1= 3 A n′ = N −k = 24−4 = 20 E
LA 17.288 = = 5.762 MSA = ′ 3 nA
L E 28 .602 MS E = = = 1 .430 n′ 20 E
3、计算自由度 ′ (1)总自由度 nT = N − 1 (2)组间自由度 n′ = k − 1 A ′ (3)组内自由度 n′ = N − k = nT − n′A E 4、计算方差 LA MS A = (1)组间方差 ′
nA
(2)组内方差 计算统计量F 5、 计算统计量F值
MS F = MS
A E
p > 0.05
p ≤ 0 .05 p ≤ 0.01
(四)确定概率判定
因素对试验结果无显著性影响
因素对试验结果有显著 性影响 因素对试验结果有高度 显著性影响
对[例1]进行单因素方差分析
H 0 : µ1 = µ 2 = µ 3 = µ 4
方法一 方法二 方法三 方法四 1 2 3 4 5 6 3.3 1.2 0 2.7 3.0 3.2
MS A 5 .762 F = = = 4 .029 ≈ 4 .03 MS E 1 .430
差异来源 组 组 总 间 内
F0.01(3, 20 ) = 4.94 F0.05(3,20) = 3.10 4.03>3.10 P<0.05 训练方法对运动员磷 酸肌酸增长值有显著性影响,即四种训练方 法 运动员磷酸肌酸平均增长值差异有显著性意 方差分析表 义。
第十二章 方差分析
第一节 单因素方差分析
一、单因素方差分析的几个概念 因素: 因素:影响研究对象的某一指标、变量。 。 水平: 水平:因素变化的各种状态或因素变化所分 的等级或组别。 单因素试验:考虑的因素只有一个的试验叫 单因素试验 单因素试验。
单因素方差分析:对单因素试验结果进行分 单因素方差分析 析,检验因素对试验结果有无显著性影响的 方法叫单因素方差分析。单因素方差分析是 两个样本平均数比较的引伸,它是用来检验 多个平均数之间的差异,从而确定因素对试 验结果有无显著性影响的一种统计方法。 二、单因素方差分析的基本原理
ij
3.0 2.3 2.4 1.1 4.0 3.7 16.5 50.95
0.4 1.7 2.3 4.5 3.6 1.3 13.8 43.24
3.6 4.5 4.2 4.4 3.7 5.6 26.0 115.26
∑x
∑ xij
13.4 38.86
∑∑ x
∑∑ x
ij
= 69.70间方差 F= 组内方差
三、单因素方差分析的方法步骤 单因素方差分析的方法步骤 单因素方差分析应用的条件: 单因素方差分析应用的条件:被检验的总体 服从正态分布且各总体方差齐性。 ㈠ 提出统计假设
H 0 : µ1 = µ 2 = ⋯ = µ k
㈡ 计算统计量F值 计算统计量F 1、列表计算下列各值 试验数据用 x ij 表示 i 列标 i =1,2,……K j行标 j = 1,2,…… n
LE MSE = n′ E
(三) 查表求临界值 附表4 F值表(方差分析用) P291 Fα ( n ′ , n ′ )
1 2
′ A n1 = n′ = k -1
F < F0.05( n1′ ,n′2 )
F ≥ F0.05 ( n1′ , n ′2 ) F ≥ F0.01( n1′ ,n′2 )
n′ = n′ = N −k 2 E
n′ = 3 −1 = 2 A
n′ = 18 − 3 = 15 E
84.000 379.611 = 5.600 MS E = MS A = = 189.805 15 2 189.805 F= = 33.893 ≈ 33.89 5.600
F 0 . 01 ( 2 ,15 ) = 6 . 36
33.89>6.36 P<0.01 运动项目对运动员纵跳成绩有显著性影响,不 同运动项目运动员平均纵跳成绩差异有高度 显著性意义。
[例1]为考查不同训练方法对磷酸肌酸增长的 影响,我们采用了四种不同的训练方法。每 种方法选取条件相仿的6名运动员,通过三个 月的训练以后,其磷酸肌酸的增长值(单 位:mg/100ml)如下表。试检验训练方法对 运动员磷酸肌酸增长值有无显著性影响?即 四种训练方法运动员磷酸肌酸平均增长值差 异 有无显著性意义?
离差平方和 自由度 17.288 28.602 45.890 3 20 23 方差 F P 5.762 1.430 4.03 P<0.05
[例2]测得男子排球、体操、游泳三个项目运 动员的纵跳成绩(单位:厘米)如下: 排球 78 75 73 78 76 体操 65 63 65 65 67 62 68 游泳 69 62 66 67 68 70 试检验运动项目对纵跳成绩有无显著性影 响,即不同运动项目运动员平均纵跳成绩之 间的差异有无显著意义?
编号 1
xi
方法一 方法二 方法三 方法四 3.3 1.2 0 2.7 3.0 3.2 2.23 3.0 2.3 2.4 1.1 4.0 3.7 2.75 0.4 1.7 2.3 4.5 3.6 1.3 2.30 3.6. 4.5 4.2 4.4 3.7 5.6 4.33
2 3 4 5 6
xi
从表中的数据可以看到 1、存在组内差异 2、存在组间差异 3、存在总的差异 方差分析的基本思想是:将总差异分解,分 方差分析的基本思想 出组间差异和组内差异,并分别用组间方 差、组内方差来表示其差异程度的大小,然 后对组间差异和组内差异的大小进行比较。