第11章 方差分析

合集下载

协方差分析

协方差分析
协方差分析的作用、意义 单向分组资料的协方差分析 两项分组资料的协方差分析 协方差分析的数学模型和基本假定
协方差分析是将乘积和与平方和按照变异来源 进行分解,从而将直线回归与方差分析结合应 用的一种统计方法。
在方差分析的过程中,通常是根据变异的来源将平 方和和自由度分离,从而进行误差估计和显著性检 验。
P
2
0.18667 0.09333 1.04 0.375
组内
18 1.62286 0.09016
总变异
20 1.80952
对y的方差分析
变异来源 组间
df
SS
s2
F
P
2
2.201 1.100 0.45 0.646
组内
18
44.251 2.458
总变异
20
46.452
从方差分析结果来看,不论是营养液喷洒前还 是喷洒后,瓜苗的高度均没有显著区别!
检验误差项回归系数的显著性(F检验法):
Ue
F dfe(U ) 25.348 22.8
Qe
18.9
dfe(Q)
17
按df1=1,df2=17查F值表,得F(0.01)=8.40, F值达到极显著水平,故认为喷洒营养液一周
后植株的高度确实受到植株原高度的影响。
检验误差项回归系数的显著性(t检验法):
C x 2.4 2 2.3 2.2 2 2.9 2.7 16.5 2.35
y 12.9 10.2 12 11 9.5 14.2 13.3 83.1 11.87
总计 x
51.7 2.46
y
240.4 11.44
先对x和y变量分别进行方差分析,得如下结果:
对x的方差分析

(整理)正交试验结果的方差分析方法

(整理)正交试验结果的方差分析方法

正交试验结果的方差分析方法计算公式和项目试验指标的加和值=,试验指标的平均值与表4-13一样,第j列的(1) I j”水平所对应的试验指标的数值之和(2) II j——“ 2”水平所对应的试验指标的数值之和(3)……(4) k j——同一水平出现的次数。

等于试验的次数除以第j列的水平数.(5)I j/k j——“水平所对应的试验指标的平均”(6)II j/k j——“2”水平所对应的试验指标的平均值(7)……以上各项的计算方法,与“极差法”同,见4.1.7节(8)偏差平方和(4-1)(9) fj ——自由度.fj第j列的水平数-1.(10)Vj——方差.Vj =Sj/fj(4-2)(11)Ve——误差列的方差。

(4-3)(12)Fj——方差之比(4-4)(13)查F分布数值表(见附录6),做显著性检验。

显著性检验结果的具体表示方法与第3章相同。

(14)总的偏差平方和(4-5) (15)总的偏差平方和等于各列的偏差平方和之和。

即(4-6) 式中,m为正交表的列数。

若误差列由5个单列组成,则误差列的偏差平方和S e等于5个单列的偏差平方和之和,即:S e=S e1+S e2+S e3+S e4+S e5;也可用S e= S总-S’来计算,其中:S’为安排有因素或交互作用的各列的偏差平方和之和应引出的结论。

与极差法相比,方差分析方法可以多引出一个结论:各列对试验指标的影响是否显著,在什么水平上显著。

在数理统计上,这是一个很重要的问题。

显著性检验强调试验误差在分析每列对指标影响中所起的作用。

如果某列对指标的影响不显著,那么,讨论试验指标随它的变化趋势是毫无意义的。

因为在某列对指标的影响不显著时,即使从表中的数据可以看出该列水平变化时,对应的试验指标的数值也在以某种“规律”发生变化,但那很可能是由于实验误差所致,将它作为客观规律是不可靠的。

有了各列的显著性检验之后,最后应将影响不显著的交互作用列与原来的“误差列”合并起来,组成新的“误差列”,重新检验各列的显著性。

正交试验的方差分析法

正交试验的方差分析法

C×D
B×D A×D
A
B A×B C A×C D A×D
C×D
B×D
B×C
A
B A×B C A×C D
E
D×E C×D C×E B×D B×E A×E A×B
B×C
(四) 列出试验方案
把正交表中安排原因旳各列(不包括欲考 察旳交互作用列)中旳每个数字依次换成该原 因旳实际水平,就得到一种正交试验方案。
上一张 下一张 主 页 退 出
此例不考察交互作用,可将品种(A)、 密度(B)和施氮量 (C)依次安排在L9(34)旳第1、 2、3列上,第4 列 为空列,见表2-4。
表11-4 表头设计
列号 1 2 3 4 因素 A B C 空
原因 数 2 3
4
L9(34)表头设计


1
2
3
4
A A B×C1
C 3 1(3) 2(5) 3(8) 2(5) 3(8) 1(3) 3(8) 1(3) 2(5)
上一张 下一张 主 页 退 出
第二节 正交试验资料旳方差分析
若各号试验处理都只有一种观察值,则称 之为单个观察值正交试验;
若各号试验处理都有两个或两个以上观察 值,则称之为有反复观察值正交试验。
上一张 下一张 主 页 退 出
A原因是氮肥施用量,设A1、A2、A3 3个水平 ; B原因是磷肥施用量,设B1、B2、B3 3个水平 ; C原因是钾肥施用量,设C1、C2、C3 3个水平。 这是一种3原因每个原因3水平旳试验 ,各原因旳 水平之间全部可能旳组合有27种。
上一张 下一张 主 页 退 出
假如进行全方面试验 ,能够分析各原因 旳效应 ,交互作用,也可选出最优水平组合。

第11章回归分析习题解答

第11章回归分析习题解答
A. 是一个尚不知晓的确定的数.
B. 是随机变量,且有 y0 N (β0 + β1x0 ,σ 2 ) .
C. 当 β0 , β1 确知时等于 β0 + β1x0 .
D. 等于 βˆ0 + βˆ1x0 .
6. 在回归分析中,检验线性相关显著性常用的三种检验方法,不包含(
A. 相关系数显著性检验法.
B. t 检验法.
; 若 新 保 单 数 x0 = 1000 , 给 出 Y 的 估 计 值 为
yˆ0 = 0.118129 + 0.003585×1000 = 3.703129 .
16. 下表是 16 只公益股票某年的每股帐面价值 x 和当年红利 y ,利用 Excel 的数据分
析功能得到的统计分析结果如下:
方差分析
过 10 周时间,收集了每周加班工作时间的数据和签发的新保单数目, x 为每周签发的新保
单数目,Y 为每周加班工作时间(小时).利用 Excel 的数据分析功能得到统计分析如下表.
Coefficients
标准误差
Intercept X Variable 1
0.118129 0.003585
0.355148 0.000421
15.1
15.1
228.01
228.01
18
15.1
14.5
228.01
210.25
列和
270.1
265
计算可得:
4149.39
3996.14
∑ Syy =
y2 i

ny 2
=94.75
∑ Sxx =
x2 i

nx 2
=96.39
∑ Sxy = xi yi − nxy = 95.24

第十一章 t 检验

第十一章   t 检验

H0: μ=μ0, 即该山区成年男子的平均脉搏数与一般成年男
子脉搏 数相等 H1: μ>μ0, 即该山区成年男子的平均脉搏数高于一般成年 男子脉 搏数 单侧 α=0.05
(2) 选定检验方法,计算检验统计量t值
X 0 74.2 72 t 1.833 S 6 n 25
v n 1 25 1 24 t0.05 24 1.7109
单位:千克
94.5
101
110
103.5
97
88.5
96.5
101
104
116.5
85
89.5
101.5
96
86
80.5
87
93.5
93
102
首先进行假设:H0 :μ1 - μ2 ≤ 8.5
H1 :μ1 - μ2 > 8.5
即平均体重减少不足 8.5千克
即平均体重减少超过 8.5千克
然后计算参加前后体重变化差值,见下表:
(3) 判断结果 t=1.833 > t0.05(24)=1.7109, 拒绝H0,接受H1,差异有统计学意义。 可认为该山区健康成年男子脉搏数高于 一般成年男子脉搏数。
两配对样本 t 检验

配对样本:是指一个样本中的数据与另一个样本中的数据相对应的两 个样本。 例如,医生对药物治疗效果进行检验时,将病情相似的病人分为两组, 其中一组按时服用药物,另一组则不服用药物;我们将一个班级的同 学(同质性较强)随机分为两组,一组采用新教案授课,另一组按原 教案上课,最后通过比较分析新教案是否有利于提高学生成绩。
取 α= 0.05 。
首先进行假设:H0 :μ1 = μ2
H1 : μ 1 ≠ μ 2

练习题答案11

练习题答案11

第十一章多个样本均数比较的方差分析练习题一、最佳选择题1. 各组数据的()时,不可直接作方差分析。

A.均数相差较大B.中位数相差较大C.n相差较大D.变异系数相差较大E.方差相差较大2. 完全随机设计方差分析中的组间均方是表示()。

A.抽样误差大小B.某因素的效应大小C.某因素效应与抽样误差综合结果D.全部数据的离散程度E.不可预见的误差3. 完全随机设计与随机区组设计相比较()。

A. 随机区组设计的变异来源比完全随机设计分得更细B. 随机区组设计的误差一定小于完全随机设计C.完全随机设计的效率高于随机区组设计D.两组设计试验效率一样E.以上说法都不对4. 四个样本均数经方差分析后,p<0.05,为进一步弄清四个均数彼此之间有无差别,须进行()。

检验B. q检验C.u检验D. t检验E.Dunnett-检验A. 25.两样本均数的比较,可用()A.方差分析B.t检验C.q检验D.方差分析与t检验均可E.u检验二、问答题1. 简述均数比较方差分析的基本思想?2. 均数比较方差分析与实验设计有何联系?3.方差分析对数据有什么要求?4.为什么不能用t 检验进行多个均数的两两比较?5.单样本重复测量数据的方差分析与随机区别设计方差分析有何不同?在什么情况下,单样本重复测量数据可用随机区组设计方差分析进行假设检验? 6.简述均数比较方差分析随机效应模型与固定效应模型的区别。

7.简述随机效应方差分析的应用。

三、计算题1.欲研究感染脊髓灰质炎病毒的大鼠接种伤寒或百日咳后的生存情况,将感染脊髓灰质炎病毒的大鼠随机分3组,两组分别接种伤寒菌、百日咳菌,另一个组作为对照,试验结果见下表。

问两个接种组与对照组生存日数是否相同?各组大鼠的生存日数伤寒 百日咳 对照 ij X5 6 8 7 6 9 8 7 10 98 10 9 8 10 10 9 11 10 9 12 11 10 12 11 10 14 1211 16 ∑ijX92 84 112 288 i n10 10 10 30 i X9.28.4 11.2 9.6 ∑2ijX886 732 1306 2924 2i S4.42.935.73-2.将18名原发性血小板减少症患者按年龄相近的原则配为6个区组,每个区组的3名患者随机分配到A 、B 、C 、三个治疗组中,治疗后的血小板升高情况见下表,问三种治疗方法的疗效有无差别?A、B、C、三组血小板升高值年龄组 A B C1 3.8 6.3 8.02 4.6 6.3 11.93 7.6 10.2 14.14 8.6 9.2 14.75 6.4 8.1 13.06 6.2 6.9 13.43.下表是某实验室7个技术员对同一血样血清钾的重复测定结果,评价估计技术员之间、每个技术员重复性测量结果之间的误差。

市场调查方法与技术 第5版 第十一章 定量调查资料的分析

市场调查方法与技术 第5版 第十一章 定量调查资料的分析
结合市场分析场景或案例分别介绍常见的描述分析方法、变量间相关分析方法(相关分析、列 联分析、对应分析等)、有监督统计分析方法(回归分析、方差分析、判别分析等)、以及无 监督统计分析方法(聚类和因子分析)。
表11-1数据类型及其适用的分析方法
4
01
单变量的 描述统计分析
描述统计分析
描述统计是市场调查分析中最常用的分析方法,关键是如何选择适当的图表或统计量使数据更易于解释。不同的 描述统计分析方法适用于不同的研究目的,适合不同的测量尺度数据。 下面我们以表11-2中的数据为例,介绍常用的描述统计方法
• 四分位差较小说明数据比较集中于中位数附近;反之 分布较分散。
• 四分位差常与中位数一起描述定距或定序变量分布。 缺点是四分位差没有充分利用所有数据信息。
10
数据的特征描述③ 离散趋势分析b
反映各数值远离其中心的程度,即数据分布的分散程度。数据的离散程度越大,则集中趋势测度值对该组数据的代 表性越差;离散程度越小,则其代表性就越好。
变异系数
全距
• 也称为离散系数,即标准差与均值的比值,主要用于 不同类别数据离散程度的比较,记为CV。公式如下:
• 也称极差,是一组数据中最大值与最小值之差, 计算公式是
• 标准差大小不仅与数据测度单位有关,也与观测值 的均值大小有关,不能直接用标准差比较离散程度, 而变异系数消除了测度单位和观测值水平不同的影 响,因而可以直接用来比较数据的离散程度。
图 11-1 显示公司员 工的年薪多在3.5万 元左右,但也有少数 员工的年薪达到10万 元以上,分布呈现一 定的右偏。
7
数据的特征描述①
• 频数分析和直方图可以清晰展示数据的取值分布情况,但有时这些信息过于详细,我们可能希望用一些统 计量对其信息进行概括性描述,例如用众数、中位数、均值描述数据的集中位置,用异众比例、四分位差、 标准差描述数据分布的变异性,同偏度与峰度描述分布的形态。

统计学教案习题11多元线性回归与logistic回归

统计学教案习题11多元线性回归与logistic回归

第十一章 多元线性回归与logistic 回归一、教学大纲要求(一)掌握内容1.多元线性回归分析的概念:多元线性回归、偏回归系数、残差。

2.多元线性回归的分析步骤:多元线性回归中偏回归系数及常数项的求法、多元线性回归的应用。

3.多元线性回归分析中的假设检验:建立假设、计算检验统计量、确定P 值下结论。

4.logistic 回归模型结构:模型结构、发病概率比数、比数比。

5.logistic 回归参数估计方法。

6.logistic 回归筛选自变量:似然比检验统计量的计算公式;筛选自变量的方法。

(二)熟悉内容 常用统计软件(SPSS 及SAS )多元线性回归分析方法:数据准备、操作步骤与结果输出。

(三)了解内容 标准化偏回归系数的解释意义。

二、教学内容精要(一) 多元线性回归分析的概念将直线回归分析方法加以推广,用回归方程定量地刻画一个应变量Y 与多个自变量X 间的线形依存关系,称为多元线形回归(multiple linear regression ),简称多元回归(multiple regression )基本形式:01122ˆk kY b b X b X b X =+++⋅⋅⋅+ 式中Y ˆ为各自变量取某定值条件下应变量均数的估计值,1X ,2X ,…,k X 为自变量,k 为自变量个数,0b 为回归方程常数项,也称为截距,其意义同直线回归,1b ,2b ,…, k b 称为偏回归系数(partial regression coefficient ),j b 表示在除j X 以外的自变量固定条件下,j X 每改变一个单位后Y 的平均改变量。

(二) 多元线性回归的分析步骤Y ˆ是与一组自变量1X ,2X ,…,kX 相对应的变量Y 的平均估计值。

多元回归方程中的回归系数1b ,2b ,…, k b 可用最小二乘法求得,也就是求出能使估计值Yˆ和实际观察值Y 的残差平方和22)ˆ(∑∑-=Y Y e i 为最小值的一组回归系数1b ,2b ,…, k b 值。

最新11-第8章 单因素方差分析汇总

最新11-第8章  单因素方差分析汇总

11-第8章单因素方差分析仅供学习与交流,如有侵权请联系网站删除 谢谢140+第八章 单因素方差分析第一节 方差分析的基本问题一、方差分析要解决的问题t 检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验;而多个平均数间的差异显著性检验,必须用方差分析法。

1、检验过程繁琐一试验包含5个处理,采用t 检验法要进行25C 10=次两两平均数的差异显著性检验;若有k 个处理,则要作k (k-1)/2次类似的检验。

2、无统一的试验误差,误差估计的精确性和检验的灵敏性低 12X -X s如表8-1,试验有5个处理,每个处理重复6次,共有30个观测值。

进行t 检验时,每次只能利用两个处理共12个观测值估计试验误差,误差自由度为2(6-1)=10;若利用整个试验的30个观测值估计试验误差,显然估计的精确性高,且误差自由度为5(6-1)=25。

可见在用t检法进行检验时,由于估计误差的精确性低,误差自由度小,使检验的灵敏性降低,容易掩盖差异的显著性。

3、推断的可靠性低,检验的I型错误率大用t检验法进行多个处理平均数间的差异显著性检验,由于没有考虑相互比较的两个平均数的秩次问题,因而会增大犯I型错误的概率,降低推断的可靠性。

假设每一对检验接受零假设的概率都是1-α=0.95,而且这些检验都是相互独立的,那么10对检验都接受概率是(0.95)10=0.60,犯错误的概率α׳=1-0.60=0.40犯I型错误的概率明显增加。

由于上述原因,多个平均数的差异显著性检验不宜用t检验,须采用方差分析法。

二、方差分析的几个概念方差分析(analysis of variance)是由英国统计学家R.A.Fisher于1923年提出的。

这种方法是将a个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。

正交试验方差分析(通俗易懂)

正交试验方差分析(通俗易懂)

第十一章正接安排考查资料的圆好领会之阳早格格创做正在本质处事中,时常需要共时观察 3个或者3个以上的考查果素,若举止周到考查,则考查的规模将很大,往往果考查条件的节造而易于真施.正接安排是安插多果素考查、觅供最劣火仄拉拢的一种下效用考查安排要领.第一节、正接安排本理战要领(一) 正接安排的基础观念正接安排是利用正接表去安插多果素考查、领会考查截止的一种安排要领.它从多果素考查的局部火仄拉拢中选择部分有代表性的火仄拉拢举止考查,通过对付那部分考查截止的领会相识周到考查的情况,找出最劣火仄拉拢.比圆,钻研氮、磷、钾肥施用量对付某小麦品种产量的效用:A果素是氮肥施用量,设A1、A2、A3 3个火仄;B果素是磷肥施用量,设B1、B2、B3 3个火仄;C果素是钾肥施用量,设C1、C2、C3 3个火仄.那是一个3果素每个果素3火仄的考查,各果素的火仄之间局部大概的拉拢有27种.如果举止周到考查,不妨领会各果素的效力,接互效用,也可选出最劣火仄拉拢.但是周到考查包罗的火仄拉拢数较多,处事量大,由于受考查场合、经费等节造而易于真施 .如果考查的主要手段是觅供最劣火仄拉拢,则可利用正接安排去安插考查.正接安排的基础个性是:用部分考查去代替周到考查,通过对付部分考查截止的领会,相识周到考查的情况.正接考查是用部分考查去代替周到考查,它没有成能像周到考查那样对付各果素效力、接互效用一一领会;当接互效用存留时,有大概出现接互效用的混纯.如对付于上述3果素每个果素3火仄考查,若没有思量接互效用,可利用正接表L9(34)安插,考查规划仅包罗9个火仄拉拢,便能反映考查规划包罗27个火仄拉拢的周到考查的情况,找出最佳的死产条件.一、正接安排的基根源基本理表11-1 33考查的周到考查规划正接安排便是从周到考查面(火仄拉拢)中选择出有代表性的部分考查面(火仄拉拢)去举止考查.图1中标有‘9 ’个考查面,便是利用正接表L9(34)从27个考查面中选择出去的9个考查面.即:(1)A1B1C1 (2)A1B2C2 (3)A1B3C3(4)A2B1C2 (5)A2B2C3 (6)A2B3C1(7)A3B1C3 (8)A3B2C1 (9)A3B3C2上述采用,包管了A果素的每个火仄与B果素、C 果素的各个火仄正在考查中各拆配一次.从图1中不妨瞅到,9个考查面分集是均衡的,正在坐圆体的每个仄里上有且仅有3个考查面;每二个仄里的接线上有且仅有1个考查面.9个考查面均衡天分集于所有坐圆体内,有很强的代表性,不妨比较周到天反映周到考查的基础情况.二、正接表及其个性(一) 正接表表11-2 是L8(27)正接表,其中“L”代表正接表;L 左下角的数字“8”表示有8止,用那弛正接表安插考查包罗8个处理 (火仄拉拢) ;括号内的底数“2” 表示果素的火仄数,括号内2的指数“7”表示有7列,用那弛正接表最多不妨安插7个2火仄果素.表11-2 L8(27)正接表2火仄正接表另有L4(23)、L16(215)等;3火仄正接表有L9(34)、L27(313) 、…、等.(二) 正接表的个性1、任一列中,分歧数字出现的次数相共比圆L8(27)中分歧数字惟有1战2,它们各出现4次;L9(34)中分歧数字有1、2战3,它们各出现3次 .2、任二列中,共一横止所组成的数字对付出现的次数相共比圆 L8(27)的任二列中(1, 1), (1, 2), (2, 1), (2, 2)各出现二次;L9(34)任二列中 (1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (3, 3)各出现1次.即每个果素的一个火仄与另一果素的各个火仄互碰次数相等,标明任性二列各个数字之间的拆配是匀称的.用正接表安插的考查,具备均衡分别战整齐可比的个性.均衡分别,是指用正接表选择出去的各果素火仄拉拢正在局部火仄拉拢中的分集是均衡的.由图11-1不妨瞅出,正在坐圆体中,任一仄里内皆包罗3 个考查面,任二仄里的接线上皆包罗1个考查面.整齐可比是指每一个果素的各火仄间具备可比性.果为正接表中每一果素的任一火仄下皆均衡天包罗着其余果素的各个火仄,当比较某果素分歧火通常,其余果素的效力皆相互对消.如正在A、B、C 3个果素中,A果素的3 个火仄A1、A2、A3条件下各有B、C 的3 个分歧火仄,即:正在那9个火仄拉拢中,A果素各火仄下包罗了B、C 果素的3个火仄,虽然拆配办法分歧,但是B、C皆处于共等职位,当比较A果素分歧火通常,B果素分歧火仄的效力相互对消,C果素分歧火仄的效力也相互对消.所以A果素3个火仄间具备可比性.共样,B、C果素3个火仄间亦具备可比性.(三) 正接表的类型1、相共火仄正接表各列中出现的最大数字相共的正接表称为相共火仄正接表.L4(23)、L8(27)、L12(211)等各列中最大数字为2,称为二火仄正接表;L9(34)、L27(313)等各列中最大数字为3,称为3火仄正接表.2、混同火仄正接表各列中出现的最大数字没有真足相共的正接表称为混同火仄正接表.L8(41×24)表中有一列最大数字为4,有4列最大数字为2. 也便是道该表不妨安插1个4火仄果素战4个2火仄果素.L16(44×23),L16(4×212)等皆混同火仄正接表.三、正接安排要领【例11·1】某火稻栽培考查采用了3个火稻劣良品种(A):二九矮、下二矮、窄叶青, 3种稀度(B): 15、20、25(万苗/666.7m2);3种施氮量(C):3、5、8(kg/666.7m2),试采与正接安排安插一个考查规划.(一) 决定考查果素及其火仄, 列出果素火仄表表11-3 果素火仄表(二) 采用符合的正接表根据果素、火仄及需要观察的接互效用的几去采用符合的正接表.采用正接表的准则是:既要能安插下考查的局部果素(包罗需要考查的接互效用),又要使部分火仄拉拢数(处理数)尽大概天少.普遍情况下,考查果素的火仄数应恰好等于正接表暗号中括号内的底数;果素的个数(包罗需要考查接互效用)应没有大于正接表暗号中括号内的指数;各果素及接互效用的自由度之战要小于所选正接表的总自由度,以便预计考查缺面.若各果素及接互效用的自由度之战等于所选正接表总自由度,则可采与有沉复正接考查去预计考查缺面.此例有3个3火仄果素,若没有观察接互效用,则各果素自由度之战为果素个数× (火仄数-1) = 3 × (3-1) =6,小于L9(34)总自由度 9-1=8,故不妨采用L9(34);若要观察接互效用,则应采用L27(313),此时所安插的考查规划本质上是周到考查规划.(三) 表头安排表头安排便是把选择出的果素战要观察的接互效用分别排进正接表的表头适合的列上.正在没有观察接互效用时,各果素可随机安插正在各列上;若观察接互效用,便应按该正接表的接互效用列表安插各果素与接互效用.此例没有观察接互效用,可将品种(A)、稀度(B)战施氮量(C)依次安插正在L9(34)的第1、2、3列上,第4 列为空列,睹表2-4.表11-4 表头安排L9(34)表头安排L8(27) 表头安排(四) 列出考查规划把正接表中安插果素的各列(没有包罗欲观察的接互效用列)中的每个数字依次换成该果素的本质火仄,便得到一个正接考查规划.表11-5 正接考查规划第二节正接考查资料的圆好领会若各号考查处理皆惟有一个瞅测值,则称之为单个瞅测值正接考查;若各号考查处理皆有二个或者二个以上瞅测值,则称之为有沉复瞅测值正接考查.一、单个瞅测值正接考查资料的圆好领会对付【例11-1】用L9(34)安插考查规划后,各号考查只举止一次,考查截止列于表2-6.试对付其举止圆好领会.表11-6 正接考查截止预计表T i为各果素共一火仄考查指标之战,T为9个考查号的考查指标之战;x为各果素共一火仄考查指目标仄衡数.该考查的9个瞅测值总变同由A果素、B果素、C果素及缺面变同4部分组成,果而举止圆好领会时仄圆战与自由度的领会式为:SS T = SS A + SS B + SS C+SSedf T = df A + df B + df C + dfe用n表示考查(处理)数;a、b、c表示A、B、C果素的火仄数;k a、k b、k c表示A、B、C果素的各火仄沉复数.本例,n=9、a=b=c=3、k a=k b=k c=3.1、预计各项仄圆战与自由度矫正数C = T2/n = 37112/9 = 1530169.00总仄圆战SST =Σx2-C=22+ (2)=21238.00A果素仄圆战SS A=Σ2T/k a-CA=222B果素仄圆战SS B= Σ2T/k b-CB222C果素仄圆战SS C=Σ2T/k c-CC222=5492.17缺面仄圆战SS e=SS T-SS A-SS B-SS C==3062.16总自由度df T=n-1=9-1=8A果素自由度df A=a-1=3-1=2B果素自由度df B=b-1=3-1=2C果素自由度df C=c-1=3-1=2缺面自由度df e= df T-df A-df B-df C= 8-2-2-2 = 22、列出圆好领会表,举止F考验表11-7圆好领会表F 考验截止标明,三个果素对付产量的效用皆没有隐著.究其本果大概是本例考查缺面大且缺面自由度小(仅为2),使考验的敏捷度矮,进而掩盖了观察果素的隐著性.由于各果素对付删沉效用皆没有隐著,没有必再举止各果素火仄间的多沉比较.此时,可从表11-6中采用仄衡数大的火仄A2、B3、C3拉拢成最劣火仄拉拢 A2B3C3.若F考验截止3个果素对付考查指目标效用隐著或者极隐著,举止各果素火仄间多沉比较常采与SSR法.本例是采用相共火仄正接表L9(34)安插的考查,A、B、C 果素各火仄沉复数相共,即k a=k b=k c=3,它们的尺度误相共,即单个瞅测值正接考查资料的圆好领会,其缺面是由“空列”去预计的.然而“空列”本去没有空,本质上是被已观察的接互效用所吞噬.那种缺面既包罗考查缺面,也包罗接互效用,称为模型缺面.若接互效用没有存留,用模型缺面预计考查缺面是可止的;若果素间存留接互效用,则模型缺面会夸大考查缺面,有大概掩盖观察果素的隐著性.考查缺面应通过沉复考查值去预计.所以,举止正接考查最佳能有二次以上的沉复.正接考查的沉复,可采与真足随机或者随机区组安排.二、有沉复瞅测值正接考查资料的圆好领会【例11·4】为了探讨花死锈病药剂防治效验的是非,举止了药剂种类(A)、浓度(B)、剂量(C)3果素考查,各有3个火仄,采用正接表L9(342)睹表11—10,对付考查截止举止圆好领会.用r表示考查处理的沉复数(区组数);n,a、b、c,k a、k b、k c的意思共上.此例 r=2; n=9, a=b=c=3, k a=k b=k c=3.表11-10 防治花死锈病药剂种类、浓度、剂量正接考查规划及截止预计表T i为各果素共一火仄考查指标之战,T为9个考查号的考查指标之战;x为各果素共一火仄考查指目标仄衡数.对付于有沉复、且沉复采与随机区组安排的正接考查,总变同不妨区分为处理间、区组间战缺面变同三部分,而处理间变同可进一步区分为A果素、B果素、C果素与模型缺面变同四部分.此时,仄圆战与自由度领会式为:SS T=SS t+SSr+SS e2df T = df t + df r + df e2而SS t=SS A+SSB+SS C+SS e1df t = df A + df B + df C + df e1于是SS T= SS A+SS B+SS C+SS r+SS e1+ SS e2df T = df A + df B + df C + df r + df e1 + df e2其中:SS r为区组间仄圆战;SS e1为模型缺面仄圆战;SS e2为考查缺面仄圆战;SS t为处理间仄圆战;df r、df e1、df e2、df t 为相映自由度.注意,对付于沉复采与真足随机安排的正接考查,正在仄圆战与自由度区分式中无 SS r、df r项.1、预计各项仄圆战与自由度矫正数C =T2/ r n =2/(2×总仄圆战SS T=Σx2-C=22+ (2)区组间仄圆战SS r=ΣT2r /n-C=22处理间仄圆战SS t = ΣT2t / r - C22+ (2)A果素仄圆战SS A = ΣT2A / k a r - C= 222)/(3×=B果素仄圆战SS B=ΣT2B / k b r - C222)/(3×=45.24C果素仄圆战SS C= ΣT2C / k c r - C=222)/(3×2) -16744.50=78.77模型缺面仄圆战SS e1= SS t– SS A– SS B - SS C=245.96- 25.72- 45.24.- 78.77= 96.23考查缺面仄圆战SS e2=SS T– SS r - SS t=246.62- 0.22- 245.96= 0.44总自由度 df T=rn-1=2×9-1=17区组自由度df r=r-1=2-1=1处理自由度df t=n-1=9-1=8A果素自由度df A=a-1=3-1=2B果素自由度df B=b-1=3-1=2C果素自由度df C=c-1=3-1=2模型缺面自由度 df e1 = df t-df A-df B-df C= 8-2-2-2= 2考查缺面自由度df e2=df T-df r-df t=17-1-8 = 82、列出圆好领会表,举止F考验表11-10 有沉复瞅测值正接考查资料的圆好领会表最先考验MS e1与MS e2好别的隐著性,若经F考验没有隐著,则可将其仄圆战与自由度分别合并,预计出合并的缺面均圆,举止F考验与多沉比较,以普及领会的粗度;若F考验隐著,证明存留接互效用,二者没有克没有及合并,此时只可以MS e2举止F考验与多沉比较.本例MS e1 / MS e2=802.00** ,模型缺面均圆MS e1与考查缺面均圆MS e2 好别极隐著,证明考查果素间接互效用极隐著,只可以考查缺面均圆MS e2举止F考验与多沉比较.F考验截止标明,药剂种类(A)、浓度(B)、剂量(C)3 果素对付花死产量皆有极隐著效用;区组间好别没有隐著.3、多沉比较(1) 若模型缺面隐著,证明考查果素间存留接互效用,各果素天圆列有大概出现接互效用的混纯,此时各考查果素火仄间的好别已没有克没有及真真反映果素的主效,果而举止各果素火仄间的多沉比较无多大本质意思,但是应举止考查处理间的多沉比较,以觅供最处理,即最劣火仄拉拢.举止各考查处理间多沉比较时采用考查缺面均圆MS e2.模型缺面隐著,还应进一步考查,以领会果素间的接互效用.(2) 若模型缺面没有隐著,证明考查果素间接互效用没有隐著,各果素天圆列有大概已出现接互效用的混纯,此时各果素火仄间的好别能真真反映果素的主效,果而举止各果素火仄间的多沉比较有本质意思,并从各果素火仄间的多沉比较中选出各果素的最劣火仄相拉拢,得到最劣火仄拉拢.举止各果素火仄间的多沉比较时,用合并的缺面均圆MSe=(SS e1+ SS e2)/(df e1+ df e2)此时可没有举止考查处理间的多沉比较.本例模型缺面极隐著,证明果素间存留接互效用,没有必举止各果素火仄间的多沉比较,应举止考查处理间的多沉比较,以觅供最处理,即最劣火仄拉拢.为了让读者相识多沉比较的要领,底下仍对付各果素火仄间、各考查处理间举止多沉比较.(1)A、B、C果素各火仄仄衡数的多沉比较表11-12 A果素各火仄仄衡数的多沉比较表(SSR法)表11-13 B果素各火仄仄衡数的多沉比较表(SSR法)表11-14 C果素各火仄仄衡数的多沉比较表(SSR法)果为由df e=8战k=2, 3, 查得SSR值并预计出LSR值列于表11-15.表11-15 SSR值与LSR值表多沉比较截止标明:A果素各火仄仄衡产量间、B果素各火仄仄衡产量间、C果素各火仄仄衡产量间好别隐著或者极隐著.各果素的最劣火仄为A1、B1、C2.注意,本例模型缺面隐著,考查果素间存留接互效用,没有宜从各果素火仄间的多沉比较中选出各果素的最劣火仄相拉拢去得到最劣火仄拉拢.(2)各考查处理仄衡数间的多沉比较表11-16 各考查处理仄衡数多沉比较表(LSD法)果为由df e=8, 查得t0.05(8)=2.306,t0.01(8)=3.355,预计出LSD值为:LSD0.05=0.245=0.565LSD0.01=0.245=0.822各考查处理间仄衡数多沉比较截止,除第2号考查处理与第7号考查处理、第3号考查处理与第6 号考查处理仄衡产量好别没有隐著中,其余各考查处理仄衡产量间好别极隐著或者隐著,最劣火仄拉拢为第2 号考查处理A1B2C2(或者第7号考查处理A3B1C3)本例模型缺面隐著,考查果素间存留接互效用,应以考查处理间的多沉比较觅供的最劣火仄拉拢,即第2号考查处理A1B2C2(或者第7号考查处理A3B1C3)为该考查的最劣火仄拉拢.。

教育统计学课后练习参考答案

教育统计学课后练习参考答案

教育统计学课后练习参考答案第一章1、教育统计学,就是应用数理统计学的一般原理和方法,对教育调查和教育实验等途径所获得的数据资料进行整理、分析,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。

教育统计学既是统计科学中的一个分支学科,又是教育科学中的一个分支学科,是两种科学相互结合、相互渗透而形成的一门交叉学科。

从学科体系来看,教育统计学属于教育科学体系的一个方法论分支;从学科性质来看,教育统计学又属于统计学的一个应用分支。

2、描述统计主要是通过对数据资料进行整理,计算出简单明白的统计量数来描述庞大的资料,以显示其分布特征的统计方法。

推断统计又叫分析统计,它根据统计学的原理和方法,从我们所研究的全体对象(即总体)中,按照等可能性原则采取随机抽样的方法,抽出总体中具有代表性的部分个体组成样本,在样本所提供的数据的基础上,运用概率理论进行分析、论证,在一定可靠程度上对总体的情况进行科学推断的一种统计方法。

3、在自然界或教育研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,这类现象称为随机现象。

随机现象具的特点:(1)一次条件完全相同的实验有多种可能的结果(这样的实验称为随机实验);(2)在实验之前不能确切知道哪种结果会发生;(3)在相同的条件下可以重复进行这样的实验。

4、总体,也叫做母体或全域,是指具有某种共同特征的个体的总和。

当所研究的总体数量非常大时,可以从总体中抽取其中一部分个体来观测,由此来推断总体的信息,从总体中抽出的这部分个体就称为样本,它是用以表征总体的个体的集合。

通常将样本中样本个数大于或等于30个的样本称为大样本,小于30个的称为小样本。

5、复置抽样指每次抽出的个体经观测后,仍放回原总体,然后再从总体中抽取下一个个体。

6、反映总体特征的量数叫做总体参数,简称参数。

反映样本特征的量数叫做样本统计量,简称统计量。

参数是总体的真正数值,是固定的常量,理论上应该通过计算总体中全部个体的数值而获得,但由于总体中个体的数量通常很大,总体参数往往很难获得,在统计分析中一般通过样本的数值来估计。

2021年统计学(贾5)课后练答案(11-14章)

2021年统计学(贾5)课后练答案(11-14章)

第11章 一元线性回归分析欧阳光明(2021.03.07)11.1(1)散点图(略),产量与生产费用之间正的线性相关关系。

(2)920232.0=r(3) 检验统计量2281.24222.142=>=αt t ,拒绝原假设,相关系数显著。

11.2(1)散点图(略)。

11.3 (1)0ˆβ表示当0=x 时y 的期望值。

(2)1ˆβ表示x 每变动一个单位y 平均下降0.5个单位。

11.4 (1)%902=R(2)1=e s11.5 一家物流公司的管理人员想研究货物的运输距离和运输时间的关系,为此,他抽出了公司最近10个卡车运货记录的随机样本,得到运送距离要求:(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态: (2)计算线性相关系数,说明两个变量之间的关系强度。

(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

解:(1)可能存在线性关系。

(2)x 运送距离(km )y 运送时间(天) x 运送距离(km )Pearson 相关性 1.949(**) 显著性(双侧)0.000 N10 10 y 运送时间(天)Pearson 相关性 .949(**) 1显著性(双侧) 0.000 N**. 在 .01 水平(双侧)上显著相关。

有很强的线性关系。

(3)模型非标准化系数标准化系数t 显著性B标准误Beta1(常量) 0.118 0.355 0.333 0.748 x 运送距离(km )a. 因变量: y 运送时间(天)回归系数的含义:每公里增加0.004天。

11.6 下面是7个地区2000年的人均国内生产总值(GDP )和人均消费水要求:(1)人均GDP 作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。

(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。

(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

(4)计算判定系数,并解释其意义。

第11章 多因素试验资料的方差分析 1.2节

第11章 多因素试验资料的方差分析 1.2节

AB (a2b2 a1b2 ) (a2b1 a1b1 ) 2 (8 4) 2 2 BA (a2b2 a2b1 ) (a1b2 a1b1 ) 2 (24 20) 2 2
即AB=BA。
4个均数可作线图 ,若两条直线几乎相互平 行, 则表示两因素交互作用很小;若两条直线 相互不平行, 则说明两因素可能存在交互作用。
处理组合数 g = 各因素水平数之积。
一、2 ×2两因素析因设计资料的 方差分析
例11-1 将20只家兔随机等分4组,每组5 只,进行神经损伤后的缝合实验。处理由A、 B 两因素组合而成,因素 A 为缝合方法,有两 水平,一为外膜缝合,记作 a1 ,二为束膜缝 合,记作a2;因素B为缝合后的时间,亦有两 水平,一为缝合后1月,记作b1,二为缝合后 2月,记作b2。试验结果为家兔神经缝合后的 轴突通过率(%),见下表。欲用析因分析比较 不同缝合方法及缝合后时间对轴突通过率的 影响。
第十一章 多因素实验资料的 方差分析
单因素实验:只涉及一个处理因素(至少两 个水平),只是根据实验对象的属性和控制实 验误差的需要,采用的实验设计方法有所不同。
多因素试验:处理因素不止一个。如4种饲 料是由脂肪含量和蛋白含量两个因素复合组成, 研究目的不仅是比较4种饲料的差别,还要分 别分析脂肪含量高低、蛋白含量高低对小鼠体 重的影响,就是两因素的试验。此时可做析因 分析。
第二节
正交设计与方差分析
33
一、正交设计的基本概念
析因设计是全面试验,g个处理组是各因素
各水平的全面组合;如2×2×2×2×2析因 实验有32个处理。
正交设计是非全面试验,g个处理组是各因
素各水平的部分组合,或称析因实验的部分 实施。如以上析因试验用正交设计可选1/2 实施方案有16个处理。

SPSS统计分析-第11章信度分析

SPSS统计分析-第11章信度分析
信度是评价一个测量工具质量优劣的重要指标,只有信 度达到一定要求的测量工具才可以考虑使用。信度系数可解 释为真分数方差在样本测验分数的总方差中占多少比例,它 是测量过程中的随机误差大小的反映,可以解释个人分数的 意义。 注意:判定某测验是否可靠时,必须依据该测验施测的具体 情境,以及其测验结果是否能够经过多次证实来判定;一个 测验可以有多个信度估计,所以在实际测验时要注意选择。 信度可以用来解释预测个人分数的意义。测量的结果应看成 是一个范围。
• 信 度 的概念 出 现于 20 世 纪初 ,是 以 真分数 测 量理论 ( Classical Test Theory,简写为CTT)为基础的,该理论 是20世纪前期与中期的心理测量理论的主导部分,所以也 叫它经典测量理论。
SPSS统计分析-第11章信度分析
1.经典测量理论数学模型 (1)基本概念 • 真分数:是在实际测量中很难得到的一个理论上构想出来
SPSS统计分析-第11章信度分析
11.2.1 重测信度的基本概念
• 重测信度表示两次测验结果有无变动,反映测验分数的稳 定程度,故又称稳定性系数。由于重测信度可提供有关测 验结果是否随时间而变异的资料,所以可作为预测受测者 将来行为的依据。
1.定义 • 重测信度(rest-retest coefficient)是用于判断测量
论上构想的概念,只能根据一组实得分数做出估计。 信度的操作性定义指一组测量分数的真实方差与实得方差之 比,其公式为:
rx x
ST2
S
2 X
SPSS统计分析-第11章信度分析
(2)信度的表示方法:信度一般是以相关系数表示的,即 用同一组被试样本所得的两组资料的相关系数作为测量一致 性的指标,称为信度系数。 3.信度的作用

贾俊平版统计学课件 第11章

贾俊平版统计学课件  第11章
根据例11.6的样本数据,计算不良贷款、贷款余额、应收 贷款、贷款项目、固定资产投资额之间的相关系数. 解:用Excel计算的相关系数矩阵如下.
从相关矩阵可以看出,在不良贷款与其他几个变量的关 系中,与贷款余额的相关系数最大,而与固定资产投资额的 相关系数最小。
11.1.3 相关系数的显著性检验
1. r 的抽样分布
回归模型
1、回答“变量之间是什么样的关系?” 2、方程中运用 1 个数值型因变量(响应变量) 被预测的变量 1 个或多个数值型或分类型自变量 (解释变量) 用于预测的变量 3、主要用于预测和估计
11.2.1 一元线性回归模型
1.回归模型(regression model)
y 0 1 x
i 1 i 1 i 1
n
n
n
相关系数的取值范围及意义
1. r 的取值范围为[-1,1]. 2. r 1 ,称完全相关,即存在线性函数关系. r =1,称完全正相关. r =-1,称完全负相关. 3. r =0,称零相关,即不存在线性相关关系.
4. r <0,称负相关.
5. r >0,称正相关. 6. r 愈大,表示相关关系愈密切.
t 0.05 (23) 2.069
2
由于
t 7.5344 t 0.05 (23) 2.069
2
因此,拒绝 H 0,认为 x 和 y 的相关系数 0 ,即不良贷 款与贷款余额之间的线性相关关系显著.
表11-3 各相关系数显著性检验的t 统计量值
11.2 一元线性回归
11.2.1 一元线性回归模型 11.2.1 参数的最小二乘估计
相关系数的性质
性质 1 : r 具有对称性。即 x 与 y 之间的相关系数和 y 与 x 之间 的相关系数相等,即rxy= ryx 性质 2 : r 数值大小与 x 和 y 原点及尺度无关 ,即改变 x 和 y 的 数据原点及计量尺度,并不改变r数值大小 性质3:仅仅是x与y之间线性关系的一个度量,它不能用 于描述非线性关系。这意味着, r=0只表示两个变量之间 不存在线性相关关系,并不说明变量之间没有任何关系 性质 4 : r 虽然是两个变量之间线性关系的一个度量,却不 一定意味着x与y一定有因果关系

第十一章 配合力的估算和分析

第十一章 配合力的估算和分析

SSSCA
1 b
i
x2 ij g
C
SS父GCA
SS母GCA
j
(5492 5362 L 4722 ) 2010012.5 342.3 8302.2 3970.3 3
SSe SST SS区组 SS父GCA SS母GCA 21389.5 600.6 342.3 8302.2
父本和
xi gg
4084
3974
3972
x 12030 ggg
目的:配合力分析的第一步是检验亲本的一般配合力和特殊配合力之 间有没有显著差别,如果有显著差别,则可计算各个亲本的一 般配合力、特殊配合力等遗传参数。
配合力的方差分析可以采用两种方式进行:
1 先将杂交组合看作为一个试验因素,进行单因素随机区组设计 的方差分析,检验杂交组合之间是否有显著差异。
Ⅱ 189 191 180 194 150 149 151 22
Ⅲ 180 143 160 197 175 140 105
x22 j g 557 501 527 567 488 447 419
Ⅰ 170 178 173 161 161 159 161
Ⅱ 33

x33 j g 母本和 xgjg
163 180 513 1619
现有测交系n1=3个,待测无性系n2=8个,共有杂交 组合n1×n2=3×8=24个。子代按随机完全区组进行 造林试验,区组数为b=3个,共有观测小区 =24×3=72个。3a生苗高资料见下表11-1。试对此 数据进行配合力的分析。
表11-1 杉木无性系测交子代3a生苗高数据
母本
父本 区组
1
2
3
4
第二步:计算各个变异来源的平方和
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
可以看到,为了使生产过程稳定,达到优质、高产,需要对影响产品质量的因素进 行分析,找出有显著影响的那些因素,除了从机理方面进行研究外,常常要作许多试验, 对结果作分析、比较,寻求规律。用数理统计分析试验结果、鉴别各因素对结果影响程 度的方法称为方差分析(Analysis Of Variance),记作 ANOVA。
服从 N (μi ,σ 2 ) , i = 1,L, r, j = 1,L, ni 且相互独立。将这些数据列成表 1(单因素试
验数据表)的形式。
表 1 单因素试验数据表
A1
x11
x12

x1n1
A2
x 21
x 22

x2n2





Ar
xr1
xr 2

x rnr
将第 i 行称为第 i 组数据。判断 A 的 r 个水平对指标有无显著影响,相当于要作以
niα
2 i
i=1
当 H 0 成立时
(10) (11)
ES A = (r −1)σ 2
(12)
可知若 H 0 成立,S A 只反映随机波动,而若 H 0 不成立,那它就还反映了 A 的不同水平
的效应αi 。单从数值上看,当 H 0 成立时,由(10)、(12)对于一次试验应有
SA /(r −1) ≈ 1 SE /(n − r)
规则为
F < F1−α (r −1, (n − r)) 时接受 H 0 ,否则拒绝。
以上对 S A , SE , ST 的分析相当于对组间、组内等方差的分析,所以这种假设检验方法称
方差分析。
1.3 方差分析表 将试验数据按上述分析、计算的结果排成表 2 的形式,称为单因素方差分析表 (Matlab 中给出的方差分析表)。
个试验,试验过程中除 A 外其它影响指标的因素都保持不变(只有随机因素存在),我
们的任务是从试验结果推断,因素 A 对指标有无显著影响,即当 A 取不同水平时指标
有无显著差别。
A 取某个水平下的指标视为随机变量,判断 A 取不同水平时指标有无显著差别,
相当于检验若干总体的均值是否相等。
1.1 数学模型
人们关心的试验结果称为指标,试验中需要考察、可以控制的条件称为因素或因子, 因素所处的状态称为水平。上面提到的灯泡寿命问题是单因素试验,小麦产量问题是双 因素试验。处理这些试验结果的统计方法就称为单因素方差分析和双因素方差分析。
§1 单因素方差分析
只考虑一个因素 A 对所关心的指标的影响, A 取几个水平,在每个水平上作若干
减少对比次数。
对于上述问题,Matlab 多重比较的程序为
x=[1620 1580 1460 1500
1670 1600 1540 1550
1700 1640 1620 1610
1750 1720 1680 1800];
x=[x(1:4),x(16),x(5:8),x(9:11),x(12:15)];
合作若干次试验,对所得数据进行方差分析,检验两因素是否分别对指标有显著影响, 或者还要进一步检验两因素是否对指标有显著的交互影响。
2.1 数学模型
设 A 取 r 个水平 A1, A2 ,L, Ar , B 取 s 个水平 B1, B2 ,L, Bs ,在水平组合 ( Ai , Bj )
-217-
下总体 xij 服从正态分布 N (μij ,σ 2 ) ,i = 1,L, r ,j = 1,L, s 。又设在水平组合 ( Ai , Bj ) 下作了 t 个试验,所得结果记作 xijk , xijk 服从 N (μij ,σ 2 ) , i = 1,L, r , j = 1,L, s , k = 1,L, t ,且相互独立。将这些数据列成表 5 的形式。
p=anoval(x)
返回值 p 是一个概率,当 p > α 时接受 H 0 ,x 为 m × r 的数据矩阵,x 的每一列是一个
水平的数据(这里各个水平上的样本容量 ni = m )。另外,还输出一个方差表和一个
Box 图。 例 1 为考察 5 名工人的劳动生产率是否相同,记录了每人 4 天的产量,并算出其
ni
∑ (xij − xi• )2 σ 2 ~ χ 2 (ni −1)
j=1
由 χ 2 分布的可加性知
-214-
∑ SE
σ
2
~
χ 2 ⎜⎛ ⎝
r i=1
(ni
− 1) ⎟⎞ ⎠

SE σ 2 ~ χ 2(n − r)
且有
ESE = (n − r)σ 2
对 S A 作进一步分析可得
r
∑ ESA = (r −1)σ 2 +
平均值,如表 3。你能从这些数据推断出他们的生产率有无显著差别吗?
工人

A1
1
256
2
242
3
280
4
298
平均产量 269
表3
A2
A3
A4
A5
254 250 248 236 330 277 280 252 290 230 305 220 295 302 289 252 292.25 264.75 280.5 240
位数,可以验证 fcdf(2.262,4,15)=0.8891=1-p
Box 图反映了各组数据的特征。
注:接受 H 0 ,是将 5 名工人的生产率作为一个整体进行假设检验的结果,并不表
明取其中 2 个工人的生产率作两总体的均值检验时,也一定接受均值相等的假设。实际
上,读者可以用 ttest2 对本题作 H 0 : μ2 = μ5 的检验,看看会得到什么结果。
而当 H 0 不成立时这个比值将远大于 1。当 H 0 成立时,该比值服从自由度 n1 = r −1,
n2 = (n − r) 的 F 分布,即
F = SA /(r −1) ~ F (r −1, n − r) SE /(n − r)α ,记 F 分布的1 − α 分位数为 F1−α (r − 1, (n − r)) ,检验
1700 1640 1620 1610
1750 1720 1680 1800];
x=[x(1:4),x(16),x(5:8),x(9:11),x(12:15)];
g=[ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4)];
p=anova1(x,g) 求得 0.01<p=0.0331<0.05,所以几种工艺制成的灯泡寿命有显著差异。
原假设为(以后略去备选假设)
(3)
H0 :α1 = α2 = L = αr = 0
1.2 统计分析 记
(4)
∑ ∑ ∑ xi•
=
1 ni
ni
xij
j=1
,x
=
1 n
r i=1
ni
xij
j =1
xi• 是第 i 组数据的组平均值, x 是总平均值。考察全体数据对 x 的偏差平方和
(5)
经分解可得
r ni
-215-
方差分析一般用的显著性水平是:取α = 0.01 ,拒绝 H 0 ,称因素 A 的影响(或 A
各水平的差异)非常显著;取α = 0.01 ,不拒绝 H 0 ,但取α = 0.05 ,拒绝 H 0 ,称因
素 A 的影响显著;取α = 0.05 ,不拒绝 H 0 ,称因素 A 无显著影响。
1.4 Matlab 实现 Matlab 统计工具箱中单因素方差分析的命令是 anoval。 若各组数据个数相等,称为均衡数据。若各组数据个数不等,称非均衡数据。 (1)均衡数据 处理均衡数据的用法为:
g=[ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4)];
[p,t,st]=anova1(x,g)
[c,m,h,nms] = multcompare(st);
[nms num2cell(m)]
§2 双因素方差分析
如果要考虑两个因素 A, B 对指标的影响, A, B 各划分几个水平,对每一个水平组
1.5 多重比较
在灯泡寿命问题中,为了确定哪几种工艺制成的灯泡寿命有显著差异,我们先算出
各组数据的均值:
工艺 均值
A1
1708
A2
1635
A3
1540
A4
1585
虽然 A1 的均值最大,但要判断它与其它几种有显著差异,还需做多重比较。一般 多重比较要对所有 r 个总体作两两对比,分析相互间的差异。根据问题的具体情况可以
第十一章 方差分析
我们已经作过两个总体均值的假设检验,如两台机床生产的零件尺寸是否相等,病 人和正常人的某个生理指标是否一样。如果把这类问题推广一下,要检验两个以上总体 的均值彼此是否相等,仍然用以前介绍的方法是很难做到的。而你在实际生产和生活中 可以举出许多这样的问题:从用几种不同工艺制成的灯泡中,各抽取了若干个测量其寿 命,要推断这几种工艺制成的灯泡寿命是否有显著差异;用几种化肥和几个小麦品种在 若干块试验田里种植小麦,要推断不同的化肥和品种对产量有无显著影响。
解 编写程序如下: x=[256 254 250 248 236
242 330 277 280 252 280 290 230 305 220 298 295 302 289 252]; p=anova1(x)
求得 p = 0.1109 > α = 0.05 ,故接受 H 0 ,即 5 名工人的生产率没有显著差异。方 差表对应于上面的单因素方差分析表的1 ~ 4 列,F = 2.262 是 F (4,15) 分布的1− p 分
方差来源
因素 A
误差 总和
平方和
SA SE ST
表 2 单因素方差分析表
相关文档
最新文档