统计学第5章 方差分析

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中央财经大学统计学院 19
5.2.2 :组间方差和组内方差
组间离差平方和
r
SSA m(xi x)2 i1
组内离差平方和
rm
SSE
(xij xi)2
i1பைடு நூலகம்j1
组间方差
MSA SSA r 1
组内方差
MSE SSE nr
受因素A和 随 机
因素的影响
中央财经大学统计学院 20
只受随机 因素的影响
5.2.2 :方差分析的基本思想
样本2
样本3
样本4
x2
,
s
2 2
x3 , s32
x4
,
s
2 4
1234? ?
中央财经大学统计学院 5
各个总体的均值相等吗?
f(X)
X
1 2 3 4
f(X)
X
3 1 2 4
中央财经大学统计学院 6
研究方法:两样本的t检验?
用t检验比较两个均值: 每次只能比较两个均值,要解决上述问题 需要进行6次t检验……
在整体检验中犯第一类错误的概率显著增 加: 如果在每次t检验中犯第一类错误的概率 等于5%,则在整体检验中等于1-(10.05)6=0.2649
中央财经大学统计学院 7
方差分析可以用来比较多个均值
方差分析(Analysis of variance,ANOVA) 的主要目的是通过对方差的比较来检验多 个均值之间差异的显著性。
F=
组间方差 MSA SSA r 1
组内方差 MSE SSE
nr
如果因素A的不同水平对结果没有影响,那么在组间 方差中只包含有随机误差,两个方差的比值会接近1
如果不同水平对结果有影响,组间方差就会大于组 内方差,组间方差与组内方差的比值就会大于1
当这个比值大到某种程度时,就可以说不同水平之 间存在显著差异,或者说因素A对结果有显著影响。
中央财经大学统计学院 17
5.2.2 :总变差(离差平方和)的分解
总变差
n
SST (xi x)2 i1
组间离差平方和
r
SSA m(xi x)2 i1
组内离差平方和
rm
SSE
(xi jxi )2
i1 j1
因素A导致的变差
随机因素导致的变差
SST=SSA+SSE
中央财经大学统计学院 18
5.2.2 :组间方差和组内方差
中央财经大学统计学院 16
5.2.1 单因素方差分析模型
单因素方差分析: 模型中有一个自变量 (因素)和一个因变量。
在失业保险实验中假设张三在高奖金组,则 张三的失业时间 =高奖金组的平均失业时间 +随机因素带来的影响 =总平均失业时间 +高奖金组平均值与总平均值之差 + 随机因素带来的影响
X ijiijiij
为了比较四个专业的起薪,我们 从某高校四个专业的毕业生中分 别随机选择6人调查他们的起薪。 如何根据样本数据比较不同专业 毕业生的平均起薪?
中央财经大学统计学院 4
要研究的问题
总体1,μ1 总体2,μ2 (专业=1) (专业=2)
总体3,μ3 (专业=3)
总体4,μ4 (专业=4)
样本1
x1, s12
中央财经大学统计学院 21
各离差平方和的大小与观察值的多少有关,为了 消除观察值多少对离差平方和大小的影响,需要 将其平均,这就是均方。
计算方法是用离差平方和除以相应的自由度 三个平方和的自由度分别是
SST 的自由度为n-1,n为全部观察值的个数 SSA的自由度为r-1,其中r为因素水平的个数 SSE 的自由度为n-r
研究多个因素对因变量的影响的方差分析 称为多因素方差分析,其中最简单的情况 是双因素方差分析。
中央财经大学统计学院 10
5.1.1 :固定效应与随机效应模型
固定效应模型:因素的所有水平都是由实 验者审慎安排而不是随机选择的。
随机效应模型:因素的水平是从多个可能 的水平中随机选择的。
固定效应和随机效应模型在假设的设置和 参数估计上有所差异,本章研究的都是固 定效应模型。
(2)等方差性的检验
经验方法:计算各组数据的标准差,如果最大值 与最小值的比例小于2:1,则可认为是同方差的。 最大值和最小值的比例等于1.83<2
Levene检验 *
N
均值 标准差
1
6
3433 378
2
6
3450 596
3
6
2733 505
4
6
2400 420
中央财经大学统计学院 14
(3) 其它说明
方差分析对前两个假设条件是稳健的, 允许一定程度的偏离。
独立性的假设条件一般可以通过对数据 搜集过程的控制来保证。
如果确实严重偏离了前两个假设条件, 则需要先对数据进行数学变换,也可以 使用非参数的方法来比较各组的均值。
中央财经大学统计学院 15
5.2. 单因素方差分析
5.2.1 单因素方差分析模型 5.2.2方差分析的基本原理 5.2.3 单因素方差分析的步骤 5.2.4 方差分析中的多重比较
自变量:作为原因的、把观测结果分成几 个组以进行比较的变量例如奖金水平。
在方差分析中,自变量也被称为因素 (factor)。
因素的不同表现,即每个自变量的不同取 值称为因素的水平。
中央财经大学统计学院 9
5.1.1 基本概念
方差分析主要用来研究一个定量因变量与 一个或多个定性自变量的关系
只有一个自变量的方差分析称为单因素方 差分析。
可以看作t检验的扩展,只比较两个均值时 与t检验等价。
20世纪20年代由英国统计学家费希尔(R. A. Fisher)最早提出的,开始应用于生物 和农业田间试验,以后在许多学科中得到 了广泛应用。
中央财经大学统计学院 8
5.1.1 方差分析中的几个基本概念
因变量:我们实际测量的、作为结果的变 量,例如失业持续时间。
中央财经大学统计学院 11
5.1.2:方差分析中的基本假设
(1)在各个总体中因变量都服从正态分布; (2)在各个总体中因变量的方差都相等; (3)各个观测值之间是相互独立的。
中央财经大学统计学院 12
(1)正态性的检验
各组数据的直方图 峰度系数、偏度系数 Q-Q图, K-S检验*
中央财经大学统计学院 13
统计学第5章 方差分析
学习目标
掌握方差分析中的基本概念; 掌握方差分析的基本思想和原理; 掌握单因素方差分析的方法及应用; 初步了解多重比较方法的应用; 了解双因素方差分析的方法及应用。
中央财经大学统计学院 2
5.1 方差分析中的基本概念 和假设
中央财经大学统计学院 3
为什么要进行方差分析?
相关文档
最新文档