统计学:5方差分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

5
48
35
59
2008年8月
统5.2计学单因素方差分析
STATISTICS (第三版)
(例题分析)
1. 提出假设。设不同行业投诉次数均值分别为
m1(零售业)、 m2(旅游业)、m3 (航空公司) 和m4
(家电制造业) ,提出的假设为
▪ H0 :m1 m2 m3 m4 ▪ H1 :m1 , m2 , m3 , m4不全相等
组间平方和
=
+
(SST)
(SSE)
(SSA)
7-9
2008年8月
统5.1计学方差分析的基本原理
STATISTICS (第三版)
方差分析的基本原理(误差分解)
1. 误差的大小用均方(mean square)来表示,也 称为方差(variance)
平方和除以相应的自由度 总平方和(SST)的自由度为n-1; 组内平方和(SSE)的自由度为n-k ; 组间平方和(SSA)的自由度为k-1
2. 组间平方和占总平方和的比例记为R2 ,即
R2
组间平方和 总平方和
SSA SST
3. 其平方根R可以用来测量两个变量之间的关系强度
例题分析:R2=1456.609/4164.609=34.976%,表明行 业(分类变量)对投诉次数(数值变量)的影响效应占总效 应的34.976%。尽管并不高,但行业对投诉次数的影 响已经达到了统计上显著的程度。
2. 当分母H0自为由真度时为,二n-者k 的的F比分值布服,从即分子xi 自jn1ix由ij 度为k-1、
组间方差
F SSA / k 1 MSA SSE / n k MSE
~ F(k 1, n k) k ni xi x i1 组内方差 n
7 - 16
2008年8月
统5.2计学单因素方差分析
一定程度时,就意味着两个变量之间的关系显著,大 得越多,表明它们之间的关系就越强。反之,就意味 着两个变量之间的关系不显著,小得越多,表明它们 之间的关系就越弱
7 - 24
2008年8月
统5.2计学单因素方差分析
STATISTICS (第三版)
关系强度的测量
1. 变量间关系的强度用组间平方和(SSA) 占总平方和 (SST)的比例大小来反映
STATISTICS (第三版)
方差分析的基本假定
1. 正态性(normality)。每个总体都应服从正态分布, 即对于因子的每一个水平,其观测值是来自正态 分布总体的简单随机样本
2. 方差齐性(homogeneity variance)。各个总体的方 差必须相同,对于分类变量的k个水平,有 12=22=…=k2
i1 j1
k
组间平方和 SSA ni (xi x)2 i 1
组内平方和 SSE k
ni
(xij xi )2
7 - 15
i1 j1
2008年8月
统5.2计学单因素方差分析
STATISTICS (第三版)
构造检验的统计量F
1. 将组间方差MSA除以组内方差MSE即得到所需要
的检验统计量F ni
f(X)
m1 m2 m3 ……= mk
X
7-6
2008年8月
统5.1计学方差分析的基本原理
STATISTICS (第三版)
方差分析的基本假定
若备择假设成立,即H1 :mi (i=1,2,k)不全相等
自变量对因变量有显著影响
至少有一个总体的均值是不同的 3个样本分别来自均值不同的3个正态总体
2708
7 - 21
2008年8月
统5.2计学单因素方差分析
STATISTICS (第三版)
(例题分析)
计算统计量F
F SSA / k 1 MSA ~ F (k 1, n k) SSE / n k MSE
F SSA / k 1 1456.609 / 4 1 3.406643 SSE / n k 2708 / 23 4
2. 组内方差 MSE SSE
nk
3.
组间方差
MSA SSA k 1
7 - 10
2008年8月
统5.1计学方差分析的基本原理
STATISTICS (第三版)
方差分析的基本原理(误差分解)
1. 判断原假设是否成立,就是判断组间方差与组 内方差是否有显著差异
2. 若原假设成立,组间均方与组内均方的数值就 应该很接近,它们的比值就会接近1
统计学
ST管AT理IST者ICS层次水平的不同是否会导致评分的显著差异? (第三版)
一家管理咨询公司为 高、中、初级管 理者提供人力资 源讲座。听完讲 座后随机抽取不 同层次管理者大 满意度评分,取 0.05 的 显 著 性 水 平,检验管理者 层次水平的不同 是否会导致评分 的显著差异?
高级 7 7 8 7 9
3. 独立性(independence)。每个样本数据是来自因 子各水平的独立样本(该假定不满足对结果影响较 大)
7-5
ห้องสมุดไป่ตู้
2008年8月
统5.1计学方差分析的基本原理
STATISTICS (第三版)
方差分析的基本假定
如果原假设成立,即H0 :m1=m2=……=mk
自变量对因变量没有显著影响
每个样本都来自均值为m、方差为 2的同一正态总体
STATISTICS (第三版)
提出假设
1. 一般提法
▪ H0 :m1 = m2 =…= mk
• 自变量对因变量没有显著影响
▪ H1 :m1 ,m2 ,… ,mk不全相等
• 自变量对因变量有显著影响
2. 注意:拒绝原假设,只表明至少有两个总 体的均值不相等,并不意味着所有的均值 都不相等
7 - 14
3. 若原假设不成立,组间均方会大于组内均方, 它们之间的比值就会大于1
4. 当这个比值大到某种程度时,就可以说不同水 平之间存在着显著差异,即自变量对因变量有 影响
7 - 11
2008年8月
统计学
STATISTICS (第三版)
5.2 单因素方差分析
检验步骤 关系有多强? 哪些均值之间有显著差异?
ST(A第T三IS版T量IC) )S 是否有显著影响(=0.05)
1 2 3 4 5 6 7
样本量 组内均值
7 - 19
零售业
57 66 49 40 34 53 44 7 49
行业 旅游业
68 39 29 45 56 51
航空公司
31 49 21 34 40
家电制造业
44 51 65 77 58
6
5
R=0.5914。 R表明行业与被投诉次数之间已达到中等
7 - 25以上的相关
2008年8月
统5.2计学单因素方差分析
STATISTICS (第三版)
方差分析中的多重比较
1. 在拒绝原假设的条件下,通过对总体均值之 间的配对比较来进一步检验到底哪些均值之 间存在差异
2. 比较方法有多种,介绍Fisher提出的最小显 著差异(Least significant difference)方法, 简写为LSD
2. 检验方差分析的前提
3. 进行分析并做出决策
7 - 20
2008年8月
统5.2计学单因素方差分析
STATISTICS (第三版)
(例题分析)
计算各误差平方和
总平方和
k ni
SST
(xij x)2
i1 j1
(57 47.8696)2 ... (58 47.8696)2 4164.609
组间平方和
k
SSA ni (xi x)2 i 1
7 (49 47.8696)2 6 (48 47.8696)2 5 (35 47.8696)2 5 (59 47.8696)2
1456.609
组内平方和
k
SSE
ni
(xij xi )2
i1 j 1
(57 49)2 ...(68 48)2 ...(31 35)2 ...(44 59)2 ...
7 - 12
2008年8月
统5.2计学单因素方差分析
STATISTICS (第三版)
(one-way analysis of variance)
1. 只考虑一个分类型自变量对数值型因变量的 影响
2. 分析步骤
提出假设 构造检验统计量 做出决策
7 - 13
2008年8月
统5.2计学单因素方差分析
STATISTICS (第三版)
做出决策
将统计量的值F与给定的显著性水平的临界值
F进行比较(或计算出统计量的P值),做出决 策
▪ 若P< (F>F ),拒绝原假设H0 ,表明均值之间
的差异是显著的,所检验的分类变量的不同水平 对观察值有显著影响
▪ 若P> (F<F ) ,不拒绝原假设H0 ,无证据表明
2008年8月
统5.2计学单因素方差分析
STATISTICS (第三版)
构造检验的统计量F
1. 计算各样本均值
ni
xij
xi
j 1
ni
k
2. 计算全部观测值的均值
ni xi
3. 计算各误差平方和
x i1 n
n n1 n2 ...... nk
总平方和
k ni
SST
(xij x)2
统计决策
F0.05 (3,19) 3.13 F F0.05 拒绝原假设,即行业对投诉次数有显著影响
7 - 22
2008年8月
统5.2计学单因素方差分析
STATISTICS (第三版)
用spss进行方差分析
1. 选择—比较均值—单因素ANOVA 2. 把“各行业”移动到“因子”,“投诉次数”移动到“因变量列 3. 点击“确定” 统计量计算值F=3.407>3.13,拒绝原假设 0.039<0.05,拒绝原假设
中级 8 9 8 10 9 10 8
初级 5 6 5 7 4 8
7-3
2008年8月
统5.1计学方差分析的基本原理
ST(A第什T三IS么版TIC)是S 方差分析(ANOVA)?(analysis of variance)
1. 方差分析的基本原理是在20世纪20年代由英国统计学家 Ronald A.Fisher在进行实验设计时为解释实验数据而首先 引入的
LSD t 2
MSE
1 ni
1 nj
4. 决策:若 xi x j LSD,拒绝H0,否则不拒绝。
7 - 27
所检验的分类变量的不同水平对观察值有显著影 响
7 - 17
2008年8月
统5.2计学单因素方差分析
STATISTICS (第三版)
作出决策(F分布与拒绝域)
如果均值相等, F=MSA/MSE1
不拒绝H0
拒绝H0
0
F
F(k-1,n-k)
F 分布
7 - 18
2008年8月
统【计例学】检验行业(分类变量)对投诉次数(数值变
2. (形式上)检验多个总体均值是否相等 ▪ 通过分析数据的误差判断各总体均值是否相等
3. (本质上)研究分类型自变量对数值型因变量的影响 ▪ 一个或多个分类型自变量 ▪ 一个数值型因变量
4. 有单因素方差分析和双因素方差分析
涉及一个分类变量
7-4
涉及两个分类变量
2008年8月
统5.1计学方差分析的基本原理
f(X)
X
m1 m2 m3
7-7
2008年8月
统5.1计学方差分析的基本原理
STATISTICS (第三版)
方差分析的基本原理(误差分解)
1. 总误差——总平方和(SST)
▪ 反映全部观测数据的误差大小的平方和, ▪ 反映全部观测值的离散程度
2. 组内误差——组内平方和(SSE) ▪ 由于抽样的随机性造成的误差 ▪ 反映每个样本内数据之间的离散程度
统计学
STATISTICS (第三版)
第 5 章 方差分析
5.1 方差分析的基本原理 5.2 单因素方差分析 5.3 双因素方差分析
7-1
2008年8月
统计学
STATISTICS (第三版)
学习目标
方差分析的基本思想和原理 单因素方差分析 多重比较 双因素方差分析的方法
7-2
2008年8月
7 - 23
2008年8月
统5.2计学单因素方差分析
STATISTICS (第三版)
关系强度的测量
1. 拒绝原假设表明因素(因子、分类变量)与观测值 之间有显著关系
2. 组间平方和(SSA)度量了自变量(分类变量,行业) 对因变量(数值变量,投诉次数)的影响效应
▪ 当组间平方和(SSA)比组内平方和(SSE)大,而且大到
7 - 26
2008年8月
统5.2计学单因素方差分析
STATISTICS (第三版)
LSD方法检验步骤
1. 提出假设 ▪ H0: mi=mj (第i个总体的均值等于第j个总体的均值)
▪ H1: mimj (第i个总体的均值不等于第j个总体的均值)
2. 计算检验的统计量: xi x j
3. 计算LSD
3. 组间误差——组间平方和(SSA)
▪ 不同的水平(处理)影响所造成的误差 ▪ 反映不同水平样本之间数据的差异
7-8
2008年8月
统5.1计学方差分析的基本原理
STATISTICS (第三版)
方差分析的基本原理(误差分解)
误差平方和的分解及其关系 总误差 = 随机误差 + 处理误差
总平方和
组内平方和
相关文档
最新文档