在方差分析的数据结构模型中,需假设随机误差项===
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
试验数据
不同奖金水平失业者的再就业时间(天)
无奖金 92
低奖金 86
中奖金 96
高奖金 78
100
85 88 89 90
108
93 88 89 75
92
90 77 79 71
75
76 87 73 83
94
80
2016/1/28
78
72 79
82
75来自百度文库
版权所有 BY 统计学课程组
82
68 72
6
78
81
奖金水平
1=无奖金 2=低奖金 3=中奖金 4=高奖金。根据实验 结果,可以认为各总体的平均失业时间相同吗?
10
版权所有 BY 统计学课程 组 2016/1/28
研究方法:两样本的t检验?
• 如果采用t检验法对多个总体均值进行差异显著性 检验 ,会出现如下问题:
▫ 全部检验过程烦琐,做法不经济 ▫ 无统一的总体方差估计 ,检验的精度降低 ▫ 犯第一类错误的概率增大,检验的可靠性降低
•
33
版权所有 BY 统计学课程 组 2016/1/28
总变差(离差平方和)分解的图示
组间变异 组内变异
总变异
34
版权所有 BY 统计学课程 组 2016/1/28
总变差
SST ( xij x)2
i 1 j 1
k
n
组间离差平方和
SSA n ( xi x)
i 1 k 2
31
版权所有 BY 统计学课程 组 2016/1/28
7.2.2
方差分析的基本原理
32
版权所有 BY 统计学课程 组 2016/1/28
总变差(离差平方和)的分解
• • 数据的误差用离差平方和(sum of squares)描述。 组内离差平方和(within groups) ▫ 因素的同一水平(同一个总体)下样本数据的变异 ▫ 比如,同一奖金水平下失业时间的差异 ▫ 组内离差平方和只包含随机误差 组间离差平方和(between groups) ▫ 因素的不同水平(不同总体)下各样本之间的变异 ▫ 比如,四个奖金水平之间失业时间的差异 ▫ 组间离差平方和既包括随机误差,也包括系统误差
Ai
16
版权所有 BY 统计学课程 组 2016/1/28
7.1.1 :固定效应模型
若因素 A 的每一个水平(处理)均做试验, 相当于对该因素进行了全面调查。此种情形下, A1 , A2 , , Ak 方差分析目的在于:对 比较寻优, 即确定因素 的显著影响水平,且该显著影 A A1 , A2 ,中有效,在 , Ak 响水平仅在 A1 , A2 ,, Ak 外无效,一句话,试验数据不能 对因素做推断,这属于固定效应模型方差分析 范畴。
27
版权所有 BY 统计学课程 组 2016/1/28
实验数据误差类型
• 随机误差
▫ ▫ ▫ 因素的同一水平(总体)下,样本各观察值之间的差异 比如,同一奖金水平下不同不同人的失业时间是不同的 这种差异可以看成是随机因素影响的结果,称为随机误
差
因素的不同水平(不同总体)下,各观察值之间的差异 比如,不同奖金水平之间的失业时间之间的差异 这种差异可能是由于抽样的随机性所造成的,也可能是 由于奖金本身所造成的,后者所形成的误差是由系统性 因素造成的,称为系统误差
X ij i ij i ij
30
版权所有 BY 统计学课程 组 2016/1/28
7.2.1 单因素方差分析模型(2)
ì ï xij = m+ a i + eij i = 1, 2, , k ; j = 1, 2, , n (可加性假定) ï ï ï k ï ï a = 0 约束条件 ( ) íå i ï i= 1 ï ï ï 2 ï e 相互独立,且均服从 N 0, s ( ) (独立性、正态性、方差齐性假定) ï î ij
3
版权所有 BY 统计学课程 组 2016/1/28
学习内容
第一节 方差分析简介 常用术语 基本假定
第二节 单因素方差分析 分析模型 基本思想 分析步骤 多重比较
第三节 双因素方差分析 无交互作用双因素方差分析 有交互作用双因素方差分析
4
版权所有 BY 统计学课程 组 2016/1/28
7.1 方差分析简介
失业时间
失业时间
失业时间
失业时间
2016/1/28
版权所有 BY 统计学课程组
20
21
版权所有 BY 统计学课程 组 2016/1/28
(2)等方差性的检验
经验方法:计算各组数据的标准差,如果最大值 与最小值的比例小于2:1,则可认为是同方差的。 本例中,最大值和最小值的比例等于1.83<2。 Levene检验 *
12
版权所有 BY 统计学课程 组 2016/1/28
ANOVA (analysis of variance)
• 由于方差分析法是通过比较有关方差的大小而得 到结论的,所以在统计中,常常把运用方差分析 法的活动称为方差分析。 • 方差分析的内容很广泛,既涉及到实验设计的模 式,又关乎数据分析模型中因素效应的性质。本 章在完全随机试验设计下,讨论固定效应模型方 差分析的基本原理与方法,重点介绍单因素方差 分析及两因素方差分析的内容。
奖金水 平 1 2 3 4 均值 88.44 85.33 82.56 77.11 N 9 9 9 9 标准差 6.82 11.02 8.38 6.01
22
版权所有 BY 统计学课程 组 2016/1/28
(3) 其它说明
• 方差分析对前两个假设条件是稳健的,允许一定 程度的偏离。 • 独立性的假设条件一般可以通过对数据搜集过程 的控制来保证。 • 如果确实严重偏离了前两个假设条件,则需要先 对数据进行数学变换,也可以使用非参数的方法 来比较各组的均值。
组内离差平方和
SSE ( xij xi )2
i 1 j 1 k n
因素A及随机因素导致 的变差
随机因素导致的变差
SST=SSA+SSE
35
版权所有 BY 统计学课程 组 2016/1/28
18
版权所有 BY 统计学课程 组 2016/1/28
方差分析与回归分析的联系*
• 回归分析主要用来研究定量自变量和定量因变量 之间的关系(第八章学习)。 • 回归分析中方差分析常常用来检验回归方程的整 体显著性。 • 回归模型中也可以包含定性自变量。这时回归模 型与方差分析模型是等价的。
19
版权所有 BY 统计学课程 组 2016/1/28
14
版权所有 BY 统计学课程 组 2016/1/28
7.1.1 方差分析中的几个基本概念
• 方差分析主要用来研究一个定量因变量与一个或 多个定性自变量的关系 • 只有一个自变量的方差分析称为单因素方差分析。
• 研究多个因素对因变量的影响的方差分析称为多 因素方差分析,其中最简单的情况是双因素方差 分析。
固定效应模型:因素的所有水平都是由实验者 审慎安排而不是随机选择的。
17
版权所有 BY 统计学课程 组 2016/1/28
7.1.1 :随机效应模型
若只对因素 A 的部分水平(处理)做试验,相 当于对 A 进行了抽样调查,此种情形下,方差 A 的总体变量所服从的 分析目的在于:对因素 2 分布 N , A 进行差异性检验和参数估计,即样 本推断总体,这属于随机效应模型方差分析范畴。 随机效应模型:因素的水平是从多个可能的水平 中随机选择的。 固定效应和随机效应模型在假设的设臵和参数估 计上有所差异,本章研究的都是固定效应模型。
8
版权所有 BY 统计学课程 组 2016/1/28
各个总体的均值相等吗?
f(X)
1 2 3 4
f(X)
X
3 1 2 4
X
9
失业保险案例:实验结果……
110 100 90 80 70 1 2 3 4
版权所有 BY 统计学课程 组
2016/1/28
失 业 时 间
13
版权所有 BY 统计学课程 组 2016/1/28
7.1.1 方差分析中的几个基本概念
• 因变量:我们实际测量的、作为结果的变量,例 如失业持续时间。因变量也称试验指标,其不同 的取值常称为观察值或试验数据。 • 自变量:作为原因的、把观测结果分成几个组以 进行比较的变量例如奖金水平。 • 在方差分析中,自变量也被称为因素(factor)。 • 因素的不同表现,即每个自变量的不同取值称为 因素的水平。
• 7.1.1 方差分析中的基本概念 • 7.1.2 方差分析中的基本假设与检验
5
版权所有 BY 统计学课程 组 2016/1/28
失业保险案例:为什么要进行方差分析?
为了减小失业保险支出、促进 就业,政府试图为失业者提供再 就业奖励:如果失业者可以在限 定的时间内重新就业,他将可以 获得一定数额的奖金。政策会有 效吗?
7.1.2:方差分析中的基本假设
• (1)在各个总体中因变量都服从正态分布;
• (2)在各个总体中因变量的方差都相等;
• (3)各个观测值之间是相互独立的。
(1)正态性的检 验
• 各组数据的直方图 • Q-Q图, K-S检验*
奖金水平 1
4
2
3
4
F re q u e n c y
3 2 1 0
60 70 80 90 100 110 60 70 80 90 100 110 60 70 80 90 100 110 60 70 80 90 100 110
11
版权所有 BY 统计学课程 组 2016/1/28
方差分析可以用来比较多个均值
• 方差分析(Analysis of variance,ANOVA)的主要目的 是通过对方差的比较来同时检验多个均值之间差异的显著 性。 • 可以看作t检验的扩展,只比较两个均值时与t检验等价。
• 20世纪20年代由英国统计学家费喧(R. A. Fisher)最早 提出的,开始应用于生物和农业田间试验,以后在许多学 科中得到了广泛应用。
•
系统误差
▫ ▫ ▫
28
版权所有 BY 统计学课程 组 2016/1/28
方差分析的实质与分析目的
• 方差分析的实质:观测值变异原因的数量分析。 • 方差分析的目的:系统中是否存在显著性影响 因素
29
版权所有 BY 统计学课程 组 2016/1/28
7.2.1 单因素方差分析模型(1)
单因素方差分析: 模型中有一个自变量(因素)和一 个因变量。 在失业保险实验中,假设张三在高奖金组,则 张三的失业时间 =高奖金组的平均失业时间 + 随机因素带来的影响 =总平均失业时间 +高奖金组平均值与总平均值之差 + 随机因素带来的影响
23
版权所有 BY 统计学课程 组 2016/1/28
7.2. 单因素方差分析
• • • • 7.2.1 单因素方差分析模型 7.2.2 方差分析的基本原理 7.2.3 单因素方差分析的步骤 7.2.4 方差分析中的多重比较
24
版权所有 BY 统计学课程 组 2016/1/28
7.2.1 单因素方差分析模型
7
要研究的问题
总体1,μ1 (奖金=1) 总体2,μ2 (奖金=2)
版权所有 BY 统计学课程 组
2016/1/28
总体3,μ3 (奖金=3)
总体4,μ4 (奖金=4)
样本1
2 x1, s1
样本2
2 x2 , s2
样本3
2 x3 , s3
样本4
2 x4 , s4
H 0 : 1 2 3 4 ??
25
版权所有 BY 统计学课程 组 2016/1/28
单因素方差分析的数据结构
26
版权所有 BY 统计学课程 组 2016/1/28
试验数据变异原因(误差来源)分 析
• 同一试验条件下的数据变异-----随机因素影响 • 不同试验条件下,试验数据变异-----随机因素 和可能存在的系统性因素即试验因素共同影响
1
在方差分析的数据结构模型 中,需假设随机误差项
方差分析
Analysis of Variance (ANOVA )
版权所有 BY 统计学课 程组 2016/1/28
2
版权所有 BY 统计学课程 组 2016/1/28
学习目标
• • • • • 掌握方差分析中的基本概念; 掌握方差分析的基本思想和原理; 掌握单因素方差分析的方法及应用; 初步了解多重比较方法的应用; 了解双因素方差分析的方法及应用。
15
版权所有 BY 统计学课程 组 2016/1/28
7.1.1 :固定效应与随机效应模型
为便于理解,在单因素方差分析中,将因 Ai i 1,2,, k 素 A 的任何一个水平(处理) 看作是一个总体,该水平(处理)下试验 得到的数据可看成是从总体 中抽出的 一个样本,处理的重复数即为样本容量。