第五章_方差分析110603
合集下载
第五章方差分析PPT学习教案
![第五章方差分析PPT学习教案](https://img.taocdn.com/s3/m/19f338ad3b3567ec112d8aae.png)
单因素方差分析
第8页/共39页
图5-1 选择菜单 图5-2 One-Way ANONA 对话框 图5-3 Options对话框
图5-4 One-Way ANONA: Post Hoc Multiple Compairisons对话框 图5-3 One-Way ANONA: Options对话框
第9页/共39页
12
53.674
Total
112898.000
18
Corrected Total
5250.000
17
a. R Squared = .877 (Adjusted R Sq uared = .826)
F 17.163 1774.340 30.700
6.542 5.588
组别和性别对数学成绩有显著影响
Sig . .000 .000 .000 .025 .019
Homogeneous Subsets
lun g
Subset for alpha = .05
group
N
1
2
3
Student-Newman-Keuls a,b 1
11
1.7909
2
9
2.3111
3
11
3.0818
Sig .
1.000
1.000
1.000
Means for groups in homogeneous subsets are displayed. a. Uses Harmonic Mean Sample Size = 10.241.
问题关键点:众多影响因素中寻找主要因素,加以控制。 影响教学效果和学生掌握知识的效果的因素:
教学方法 教材使用 学生接受知识的能力 寻找主要因素,以提高教学水平: 可控变量:教学的方法、教材的使用。 随机变量:学生接受知识的能力。 措施: 分别使用不同的教学方法,一段时间后测试。
第8页/共39页
图5-1 选择菜单 图5-2 One-Way ANONA 对话框 图5-3 Options对话框
图5-4 One-Way ANONA: Post Hoc Multiple Compairisons对话框 图5-3 One-Way ANONA: Options对话框
第9页/共39页
12
53.674
Total
112898.000
18
Corrected Total
5250.000
17
a. R Squared = .877 (Adjusted R Sq uared = .826)
F 17.163 1774.340 30.700
6.542 5.588
组别和性别对数学成绩有显著影响
Sig . .000 .000 .000 .025 .019
Homogeneous Subsets
lun g
Subset for alpha = .05
group
N
1
2
3
Student-Newman-Keuls a,b 1
11
1.7909
2
9
2.3111
3
11
3.0818
Sig .
1.000
1.000
1.000
Means for groups in homogeneous subsets are displayed. a. Uses Harmonic Mean Sample Size = 10.241.
问题关键点:众多影响因素中寻找主要因素,加以控制。 影响教学效果和学生掌握知识的效果的因素:
教学方法 教材使用 学生接受知识的能力 寻找主要因素,以提高教学水平: 可控变量:教学的方法、教材的使用。 随机变量:学生接受知识的能力。 措施: 分别使用不同的教学方法,一段时间后测试。
第五章方差分析
![第五章方差分析](https://img.taocdn.com/s3/m/81cb4911227916888486d71e.png)
MSA SSA/(r 1) F MSE SSE /(n r ) ~F(r-1,n-r)
培训例
⒈ 计 算 水 平 均 值 和 总 均 值
i 1 2 3 4 5 ® ½ ù µ Ë Æ ¾ Ö Û â µ ö ý ¹ ² Ö ¸ Ê Ü ù µ ×¾ Ö
j
A¿ ³ Î Ì 2058 2176 3449 2517 944
2
3 …
x21
x31
x22
x32
x2j
x3j
x2r
x3r
i
…
xi1
…
xi2
…
xij
…
xir
…
xn11 xn2 2
xn j j
x nr r
方差分析步骤
计算各水平均值和 总均值
计算离差平方和:S
F检验
计算检验统计量F
计算均方和: S/自由度
⒈计算水平均值和总均值
因素水平 1 试验次数 1 2 … x11 x21 2 x12 x22 3 … j x13 x1j x2j … r x1r x2r
SST SSE SSA
证明:
( xij x) 2 (( xij x j ) ( x j x)) 2
2 ( x
r nj j 1 i 1
( xij x j ) 2
ij
( x j x) 2
x j )(x j x)
nj
( x
观测条件不同(影响因素)引起试验结果有所不同
此结果差异是系统性的 此结果差异是系统性的——干扰:其他条件不变 此差异是偶然性的
其他影响因素不同引起试验结果有所不同
方差分析
![方差分析](https://img.taocdn.com/s3/m/9e9ee54669eae009581bec91.png)
x11
xij
x21 x22
…
x31 x32
…
xk1 xk 2
…
x12
…
x1n1
合计
x2n2
x3n3
xknk
∑x
j =1
n1
1j
∑x
j =1
n2
2j
∑x
j =1
n3
3j
…
∑x
j =1
nk
kj
ni
n1
n2
n3
…
nk
第一节 基本思想
1.总变异:26只家兔的血清 总变异: 只家兔的血清 只家兔的血清ACE浓度各不相同 总变异 浓度各不相同 (1)原因:个体差异、抽样误差和处理因素 )原因:个体差异、抽样误差和处理因素 )(MS) (2)表示变异的指标:方差(均方)( )表示变异的指标:方差(均方)( (3)公式: )公式: 总离均差平方和(sum of squares,SS) 总离均差平方和( ) 总自由度( 总自由度(freedom,ν) ) 总变异的离均差平方和为各变量值与总均数( 总变异的离均差平方和为各变量值与总均数( )差值 的平方和,离均差平方和和自由度分别为: 的平方和,离均差平方和和自由度分别为:
单因素方差分析的计算公式
变 来 异 源 离 差 方 (SS) 均 平 和 总 变 异 ∑ x2 −C* 组 变 间 异
k
自 度 ν ) 均 (MS) 由 ( 方 N-1
F
(
∑
i =1
∑
j =1
ni
xij ) 2 −C
*
k-1
SS组间
MS 组间 MS 组内
ni
ν组间
SS组内
方差分析ppt课件
![方差分析ppt课件](https://img.taocdn.com/s3/m/14a6f2af80c758f5f61fb7360b4c2e3f572725e8.png)
推断控制变量是否给观测变量带来了显 著影响。
在观测变量总离差平方和中,如果组
间离差平方和所占比例较大,则说明观 测变量的变动主要是由控制变量引起的, 可以由控制变量来解释,控制变量给观 测变量带来了显著影响;反之,如果组 间离差平方和所占比例小,则说明观测 变量的变动不是主要由控制变量引起的, 不可以主要由控制变量来解释,控制变 量的不同水平没有给观测变量带来显著 影响,观测变量值的变动是由随机变量 因素引起的。
不同饲料对牲畜体重增长的效果等, 都可以使用方差分析方法去解决。
方差或叫均方,是标准差的平方,是
表示变异的量。在一个多处理试验中, 可以得到一系列不同的观测值。造成观 测值不同的原因是多方面的,有的是处 理不同引起的,叫处理效应或条件变异, 有的是试验过程中偶然性因素的干扰和 测量误差所致,称为实验误差。
dfT nk 1 20 1 19
dft k 1 5 1 4
dfe 5(4 1) 15
st 2
SSt dft
103.94 3
34.65
se2
SSe dfe
109.36 12
9.11
进行F检验:
F st2 34.65 50.15 se2 9.11
F0.05(4,15) 3.06, F0.01(4,15) 4.89, F
x1 x2
ts x1 x2
x1 x2
LSD0.05 t s 0.05 x1x2
LSD0.01
t0.01
s x1 x2
若
x1
x 2 >t0.05
s x1
x2
或
x1
ห้องสมุดไป่ตู้
x2
>
t0.01
s x1 x2
在观测变量总离差平方和中,如果组
间离差平方和所占比例较大,则说明观 测变量的变动主要是由控制变量引起的, 可以由控制变量来解释,控制变量给观 测变量带来了显著影响;反之,如果组 间离差平方和所占比例小,则说明观测 变量的变动不是主要由控制变量引起的, 不可以主要由控制变量来解释,控制变 量的不同水平没有给观测变量带来显著 影响,观测变量值的变动是由随机变量 因素引起的。
不同饲料对牲畜体重增长的效果等, 都可以使用方差分析方法去解决。
方差或叫均方,是标准差的平方,是
表示变异的量。在一个多处理试验中, 可以得到一系列不同的观测值。造成观 测值不同的原因是多方面的,有的是处 理不同引起的,叫处理效应或条件变异, 有的是试验过程中偶然性因素的干扰和 测量误差所致,称为实验误差。
dfT nk 1 20 1 19
dft k 1 5 1 4
dfe 5(4 1) 15
st 2
SSt dft
103.94 3
34.65
se2
SSe dfe
109.36 12
9.11
进行F检验:
F st2 34.65 50.15 se2 9.11
F0.05(4,15) 3.06, F0.01(4,15) 4.89, F
x1 x2
ts x1 x2
x1 x2
LSD0.05 t s 0.05 x1x2
LSD0.01
t0.01
s x1 x2
若
x1
x 2 >t0.05
s x1
x2
或
x1
ห้องสมุดไป่ตู้
x2
>
t0.01
s x1 x2
第5章方差分析
![第5章方差分析](https://img.taocdn.com/s3/m/dee6db720b4c2e3f56276338.png)
3.根据样本计算F统计量的值。
方差分析表
离差平方和
变差来源
SS
组间
SSA
组内
SSE
总变异
SST
自由度 df r-1 n-r n-1
均方 MS MSA MSE
F值 MSA/MSE
中央财经大学统计学院 23
5.2.3 :方差分析的步骤
4.确定决策规则并根据实际值与临界值的 比较,或者p-值与α的比较得出检验结论。
组内离差平方和
rm
SSE
(xij xi)2
i1 j1
组间方差
MSA SSA r 1
组内方差
MSE SSE nr
受因素A和 随 机
因素的影响
中央财经大学统计学院 20
只受随机 因素的影响
5.2.2 :方差分析的基本思想
F=
组间方差 MSA SSA r 1
组内方差 MSE SSE
算的方差分析表。由于 p值 0.002 0.0,5
因此拒绝零假设。
平方和
df 均方
F
p值
组间 4927916.667 3 1642638.889 7.078 0.002
组内 4641666.667 20 232083.333
总数 9569583.333 23
中央财经大学统计学院 26
例2 热带雨林 (1)
多重比较是对各个总体均值进行的两两比较。方 法很多,如Fisher最小显著差异(Least Significant Difference,LSD)方法、Tukey的诚 实显著差异(HSD)方法或Bonferroni的方法等。 这里我们只介绍最小显著差异方法。
中央财经大学统计学院 32
第5章 方差分析-正式课件
![第5章 方差分析-正式课件](https://img.taocdn.com/s3/m/e02716eeaf1ffc4ffe47aca1.png)
这样,处理效应不固定,是随机的,这种模型称为随机模型。
在多因素试验中,若各因素水平的效应均属随机,则对应于随机模型。
在遗传、育种和生态试验研究方面随机模型有广泛的应用。
【例如】为研究中国猪种繁殖性能的变异情况,从大量地方品种中随机抽取 部分品种为代表进行试验、观察,以其结果推断中国猪种的繁殖性能的变异情况, 这就属于随机模型。
(一)、固定模型(fixed model)
在单因素试验的方差分析中,把k个处理看作k个明晰的总体, 如果满足: 1. 研究的对象只限于这k个总体的结果,而不需推广到其它总体 2. 研究目的在于推断这k个总体平均数是否相同,
即检验 H0:μ1=μ2=…=μk,若H0被否定,下一步需作多重比较 3. 重复试验时的处理仍为原来的k个处理
第5章 方差分析
多个平均数间的差异显著性检验
1
第一节 方差分析概述
一、方差分析的基本思想
方差分析(analysis of variance,简称ANOVA)由英国 统计学家R.A.Fisher提出,该方法是将k个处理的观测值作 为一个整体看待,把观测值的总变异分解为不同变异来源 的分变异,进而获得不同变异来源在总变异中所占份额的 估计值,通过F检验判定各样本所属总体的平均数是否相 等(H0:μ1=μ2=---=μk)。
12
第2节多样本的正态性检验和方差齐性检验
程序5-2 例5-1资料方差齐性检验的SAS程序
DATA EX5_2;
DO GROUP=1 TO 3;
DO N=1 TO 12;
INPUT X@@;
OUTPUT;
END;
END;
CARDS;
30 27 35 35 29 33 32 36 26 41 33 31
在多因素试验中,若各因素水平的效应均属随机,则对应于随机模型。
在遗传、育种和生态试验研究方面随机模型有广泛的应用。
【例如】为研究中国猪种繁殖性能的变异情况,从大量地方品种中随机抽取 部分品种为代表进行试验、观察,以其结果推断中国猪种的繁殖性能的变异情况, 这就属于随机模型。
(一)、固定模型(fixed model)
在单因素试验的方差分析中,把k个处理看作k个明晰的总体, 如果满足: 1. 研究的对象只限于这k个总体的结果,而不需推广到其它总体 2. 研究目的在于推断这k个总体平均数是否相同,
即检验 H0:μ1=μ2=…=μk,若H0被否定,下一步需作多重比较 3. 重复试验时的处理仍为原来的k个处理
第5章 方差分析
多个平均数间的差异显著性检验
1
第一节 方差分析概述
一、方差分析的基本思想
方差分析(analysis of variance,简称ANOVA)由英国 统计学家R.A.Fisher提出,该方法是将k个处理的观测值作 为一个整体看待,把观测值的总变异分解为不同变异来源 的分变异,进而获得不同变异来源在总变异中所占份额的 估计值,通过F检验判定各样本所属总体的平均数是否相 等(H0:μ1=μ2=---=μk)。
12
第2节多样本的正态性检验和方差齐性检验
程序5-2 例5-1资料方差齐性检验的SAS程序
DATA EX5_2;
DO GROUP=1 TO 3;
DO N=1 TO 12;
INPUT X@@;
OUTPUT;
END;
END;
CARDS;
30 27 35 35 29 33 32 36 26 41 33 31
第5章方差分析PPT学习教案
![第5章方差分析PPT学习教案](https://img.taocdn.com/s3/m/e792f9e70b4e767f5bcfced4.png)
2_new1 2_new2 2_new3 2_new4 2_new5 2_new6 2_new7 2_new8 2_new9
三组不同性别学生的数学成绩
数学 99.00 88.00 99.00 89.00 94.00 90.00 79.00 56.00 89.00 99.00 70.00 0 56.00 56.00
以上F统计量服从F分布。SPSS将自动计 算F值,并根据F分布表给出相应的相伴概率 值。 如果F控制变量的相伴概率小于或等于显著性 水平,则控制变量的不同水平对观察变量产 生显著的影响;如果F协变量的相伴概率小于 或等于显著性水平,则协变量的不同水平对 观察变量产生显著的影响。
第57页/共65页
研究问题
第20页/共65页
图5-4 “One-Way ANOVA:Post Hoc Multiple Comparisons”对话框
第21页/共65页
图5-5 “One-Way ANOVA:Contrasts”对话框
第22页/共65页
(1)首先是单因素方差分析的前提检验 结果,也就是Homogeneity of variance test
第23页/共65页
(2)输出的结果文件中第2个表格如下所示 。
第24页/共65页
(3)输出的结果文件中第3个表格如下所示 。
第25页/共65页
(4)输出的结果文件中第4个表格如下所示 。
第26页/共65页
(5)输出结果的最后部分是各组观察变 量均值的折线图,如图5-6所示。
第27页/共65页
第62页/共65页
小结
单因素方差分析所解决的是一个因素下 的多个不同水平之间的相关问题;多因素方 差分析的控制变量在两个或两个以上,其主 要用于分析多个控制变量的作用、多个控制 变量的交互作用以及其他随机变量是否对结 果产生了显著影响;协方差分析将那些很难 控制的因素作为协变量,在排除协变量影响 的条件下,分析控制变量对观察变量的影响 ,从而更准确地对控制因素进行评价。
三组不同性别学生的数学成绩
数学 99.00 88.00 99.00 89.00 94.00 90.00 79.00 56.00 89.00 99.00 70.00 0 56.00 56.00
以上F统计量服从F分布。SPSS将自动计 算F值,并根据F分布表给出相应的相伴概率 值。 如果F控制变量的相伴概率小于或等于显著性 水平,则控制变量的不同水平对观察变量产 生显著的影响;如果F协变量的相伴概率小于 或等于显著性水平,则协变量的不同水平对 观察变量产生显著的影响。
第57页/共65页
研究问题
第20页/共65页
图5-4 “One-Way ANOVA:Post Hoc Multiple Comparisons”对话框
第21页/共65页
图5-5 “One-Way ANOVA:Contrasts”对话框
第22页/共65页
(1)首先是单因素方差分析的前提检验 结果,也就是Homogeneity of variance test
第23页/共65页
(2)输出的结果文件中第2个表格如下所示 。
第24页/共65页
(3)输出的结果文件中第3个表格如下所示 。
第25页/共65页
(4)输出的结果文件中第4个表格如下所示 。
第26页/共65页
(5)输出结果的最后部分是各组观察变 量均值的折线图,如图5-6所示。
第27页/共65页
第62页/共65页
小结
单因素方差分析所解决的是一个因素下 的多个不同水平之间的相关问题;多因素方 差分析的控制变量在两个或两个以上,其主 要用于分析多个控制变量的作用、多个控制 变量的交互作用以及其他随机变量是否对结 果产生了显著影响;协方差分析将那些很难 控制的因素作为协变量,在排除协变量影响 的条件下,分析控制变量对观察变量的影响 ,从而更准确地对控制因素进行评价。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
15 16
输出结果(2)
ANOVA
输出结果(3)
70
投诉次数
Sum of Squares 1456.609 2708 000 2708.000 4164.609 df 3 19 22 Mean Square 485.536 142 526 142.526 F 3.407 Sig. .039
60
Between Groups Within Groups Total
i 1 j 1 k
组内差异小,组间差异大,说明控制变量给观测变 组内差异小,组间差异大,说明控制变量给观测变量带 量带来影响吗?两个变量相关 来显著影响 ,即两个变量相关 or不相关? 组内差异大,组间差异小,观测值的变动是不是控 组内差异大,组间差异小,说明观测值的变动是由随机 制变量引起的?两变量相关 or不相关? 变量引起的 , 观测变量的的变动不是控制变量引起的 , 控制变量没有给观测值带来显著影响, 即两变量不相关
3. 有单因素方差分析和双因素方差分析
单因素方差分析:涉及一个分类的自变量 双因素方差分析:涉及两个分类的自变量
3
4
方差分析的基本思想和原理(两类误差)
1. 系统误差
因素的不同水平(不同总体)下,各观察值之间的差异 比如,不同行业之间的被投诉次数之间的差异 这种差异可能是由于抽样的随机性所造成的,也可能是由
输出结果(1)
Descriptives
服务质量
95% Confidence Interval for Mean Std. Error Lower Bound Upper Bound Minimum Maximum 4.08248 39.0105 58.9895 34.00 66.00 5.54977 33.7338 62.2662 29.00 68.00 4.65833 22.0664 47.9336 21.00 49.00 5.70088 43.1718 74.8282 44.00 77.00 2.86888 41.9199 53.8193 21.00 77.00
14
③ 读分析结果p即sig. ④ 给出显著水平α,做判断:
检验后的拒绝概率p值≤α(显著性水平)? 通常α为0.05,或0.01 若满足,落在拒绝域 反之,接受原假设
13
单因素方差分析SPSS检验
例1: ①假设:不同行业的平均投诉次数没有差异 ②统计方法: Analyze->Compare y p Means->One Way y ANOVA ③拒绝概率p=0.039 ④给定显著水平α=0.05,p<0.05,拒绝原假设 即不同行业的平均投诉次数有明显差异
方差分析的基本思路
检验由单一因素影响的多组样本的某一个因 变量均值是否有有显著差异。 通过比较各个类别的组内(Within Withi group) ) 差异和类别之间的组间(Between group)差异 大小确定变量之间是否有关。
2. 研究分类型自变量对数值型因变量的影响
一个或多个分类型自变量 个或多个分类型自变量 两个或多个 (k 个) 处理水平或分类
17
40
30 零售业 旅游业 航空公司 家电制造业
行业
18
3
单因素方差分析
例 2 :对“休闲调查 1” 中,以“文化程度”作为影响 因素,确定不同文化程度的被调查者的平均家庭月收 入是否有显著差异。 ①原假设:不同文化程度的家庭月收入没有差异 ②统计方法: Analyze->Compare Means->One Way ANOVA ③拒绝概率sig.=0.000 ④给定显著水平α=0.05,sig.<0.05,拒绝原假设 即不同文化程度其家庭月收入有明显差异
第五章 方差分析
在农业、商业、医学、社会学、经济学等 诸多领域的数量分析研究中,方差分析发挥 了极为重要的作用 了极为重要的作用。 这种从数据差异入手的分析方法,有助 于人们从另一个角度发现事物的内在规律。
方差分析有关术语
方差分析中,所要检验的对象称为因素 因素或因子(factor) 因素的不同表现称为水平 水平(level)或处理 (treatment) 每个因子水平下选得到的样本数据称为观测值 观测值。 例:消费者协会想要了解不同行业投诉次数是否有显 著差异?
单因素4水平实验 因素—— 行业(控制变量) 水平—— 零售、旅游、航空、家电是“行业”这一因素 的具体表现 观测值—— 每个行业下的投诉次数的样本数据(观测变量)
2
1
方差分析(ANOVA--Analysis of Variance)
1. 检验多个总体均值是否相等
通过分析数据的误差判断各总体均值是否相等
F MSA ~ F ( k 1, n k ) MSE
x1 49
7
x 2 48
6
x3 35
5
x4 59
5
9
x
57 66 ... 77 58 47 . 869565 23
当组间方差较大时,说明分组有意义,两变量相关 当组内方差较大时,说明随机误差影响大,两变量不相关
SST = 观测值总离差平方 SSA + SSE 组内离差平方和 由误差引起 组间离差平方和 由控制变量引起
变量说明
SST = SSA + 观测值总离差平方和 组间离差平方和 由控制变量引起 系统误差 k ni SSE 组内离差平方和 由误差引起 随机误差
nj
SST ( x ij x ) 2
Sum of Squares 7977787 8.6E+07 9.4E+07 9.4E 07
Between Groups Within Groups Total
方差齐性检验 多重比较检验 其他检验
组间方差(MEA):1329631.132 组内方差(MSE): 314485.647 F统计量:4.228=1329631.132/ 314485.647 显然,组间(不同文化程度)方差明显大于组内(抽样)方差 且sig.=0.000<0.05,不同文化程度分组对收入有影响 即不同文化程度,家庭月收入有差异
构造检验的统计量(计算均方 MS)
1. 组间方差: SSA 的均
2. 组内方差: SSE 的均 方,记为 MSE ,计算 方 , 记 为 MSA , 计 算 公式为 公式为 SSA SSE MSA MSE k 1 nk 将MSA和MSE进行对比,即得到所需要的检验统计量F 当 H0 为真时,二者的比值服从分子自由度 df1 为 k-1 、分 母自由度df2为 n-k 的 F 分布,即
于行业本身所造成的,后者所形成的误差是由系统性因素 于行业本身所造成的 后者所形成的误差是由系统性因素 造成的,称为系统误差
方差分析的基本思想和原理(误差平方和)
1. 数据的误差用平方和(sum of squares)表示 2. 组内平方和(within groups) 因素的同一水平(同一个总体)下样本数据的平方和 比如,零售业被投诉次数的误差平方和 组内平方和只包含随机误差 3. 组间平方和(between groups) 因素的不同水平(不同总体)下各样本之间的平方和 比如,四个行业被投诉次数之间的误差平方和 组间平方和既包括随机误差,也包括系统误差
若显示此结果,需在分析时选择: Option-Means Plot
50
M ean of 投诉次数
SST(4164.609)=SSA(1456.609)+SSE(2708.000) 组间方差MSA(485.536) > 组内方差MSE(142.526) Sig=0.039<0.05,在显著水平=0.05下,拒绝无差异假设, 即各个行业的服务质量的均值有差异 具体差异可参看描述统计表(1)或均值图(3)
N
没读过书 小学 初中 高中 中专、技校 大专 大学本科及以上
Total
3 20 90 73 31 34 31 282
20
输出结果分析
ANOVA
单因素方差分析进一步分析
df 6 275 281 Mean Square 1329631.132 314485.647 F 4.228 Sig. .000
家月收入
N
零售业 售 旅游业 航空公司 家电制造业
Totalຫໍສະໝຸດ 7 6 5 5 23Mean Std. Deviation 49.0000 10.80123 48.0000 13.59412 35.0000 10.41633 59.0000 12.74755 47.8696 13.75865
若现实此结果,需在分析时选择: options-statistics-descriptive
10
方差分析的基本假设前提
观测变量各总体应服从正态分布 观测变量个总体的方差应相同
单因素方差分析 One Way ANOVA
总体的均值无显著差异 即: 1 = 2 =…= k 若有一个不相等,即拒绝原假设 若有 个不相等,即拒绝原假设 ② 选择检验统计量(F统计量) ③ 计算检验统计量的观测值和概率p ④ 给出显著水平α,判断: 如果p值≤α,则拒绝H0;反之,接受H0
19
输出结果
Descriptives
家月收入
95% Confidence Interval for Mean Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum 610.00 101.489 58.595 357.89 862.11 500 700 1066.90 451.281 100.909 855.69 1278.11 380 2300 928.34 692.601 73.007 783.28 1073.41 317 5400 1008.95 400.120 46.831 915.59 1102.30 336 2500 1091.68 487.832 87.617 912.74 1270.62 500 2629 1358.85 499.612 85.683 1184.53 1533.18 660 3000 1349.06 658.206 118.217 1107.63 1590.50 500 4000 1071.76 579.794 34.526 1003.80 1139.72 317 5400
输出结果(2)
ANOVA
输出结果(3)
70
投诉次数
Sum of Squares 1456.609 2708 000 2708.000 4164.609 df 3 19 22 Mean Square 485.536 142 526 142.526 F 3.407 Sig. .039
60
Between Groups Within Groups Total
i 1 j 1 k
组内差异小,组间差异大,说明控制变量给观测变 组内差异小,组间差异大,说明控制变量给观测变量带 量带来影响吗?两个变量相关 来显著影响 ,即两个变量相关 or不相关? 组内差异大,组间差异小,观测值的变动是不是控 组内差异大,组间差异小,说明观测值的变动是由随机 制变量引起的?两变量相关 or不相关? 变量引起的 , 观测变量的的变动不是控制变量引起的 , 控制变量没有给观测值带来显著影响, 即两变量不相关
3. 有单因素方差分析和双因素方差分析
单因素方差分析:涉及一个分类的自变量 双因素方差分析:涉及两个分类的自变量
3
4
方差分析的基本思想和原理(两类误差)
1. 系统误差
因素的不同水平(不同总体)下,各观察值之间的差异 比如,不同行业之间的被投诉次数之间的差异 这种差异可能是由于抽样的随机性所造成的,也可能是由
输出结果(1)
Descriptives
服务质量
95% Confidence Interval for Mean Std. Error Lower Bound Upper Bound Minimum Maximum 4.08248 39.0105 58.9895 34.00 66.00 5.54977 33.7338 62.2662 29.00 68.00 4.65833 22.0664 47.9336 21.00 49.00 5.70088 43.1718 74.8282 44.00 77.00 2.86888 41.9199 53.8193 21.00 77.00
14
③ 读分析结果p即sig. ④ 给出显著水平α,做判断:
检验后的拒绝概率p值≤α(显著性水平)? 通常α为0.05,或0.01 若满足,落在拒绝域 反之,接受原假设
13
单因素方差分析SPSS检验
例1: ①假设:不同行业的平均投诉次数没有差异 ②统计方法: Analyze->Compare y p Means->One Way y ANOVA ③拒绝概率p=0.039 ④给定显著水平α=0.05,p<0.05,拒绝原假设 即不同行业的平均投诉次数有明显差异
方差分析的基本思路
检验由单一因素影响的多组样本的某一个因 变量均值是否有有显著差异。 通过比较各个类别的组内(Within Withi group) ) 差异和类别之间的组间(Between group)差异 大小确定变量之间是否有关。
2. 研究分类型自变量对数值型因变量的影响
一个或多个分类型自变量 个或多个分类型自变量 两个或多个 (k 个) 处理水平或分类
17
40
30 零售业 旅游业 航空公司 家电制造业
行业
18
3
单因素方差分析
例 2 :对“休闲调查 1” 中,以“文化程度”作为影响 因素,确定不同文化程度的被调查者的平均家庭月收 入是否有显著差异。 ①原假设:不同文化程度的家庭月收入没有差异 ②统计方法: Analyze->Compare Means->One Way ANOVA ③拒绝概率sig.=0.000 ④给定显著水平α=0.05,sig.<0.05,拒绝原假设 即不同文化程度其家庭月收入有明显差异
第五章 方差分析
在农业、商业、医学、社会学、经济学等 诸多领域的数量分析研究中,方差分析发挥 了极为重要的作用 了极为重要的作用。 这种从数据差异入手的分析方法,有助 于人们从另一个角度发现事物的内在规律。
方差分析有关术语
方差分析中,所要检验的对象称为因素 因素或因子(factor) 因素的不同表现称为水平 水平(level)或处理 (treatment) 每个因子水平下选得到的样本数据称为观测值 观测值。 例:消费者协会想要了解不同行业投诉次数是否有显 著差异?
单因素4水平实验 因素—— 行业(控制变量) 水平—— 零售、旅游、航空、家电是“行业”这一因素 的具体表现 观测值—— 每个行业下的投诉次数的样本数据(观测变量)
2
1
方差分析(ANOVA--Analysis of Variance)
1. 检验多个总体均值是否相等
通过分析数据的误差判断各总体均值是否相等
F MSA ~ F ( k 1, n k ) MSE
x1 49
7
x 2 48
6
x3 35
5
x4 59
5
9
x
57 66 ... 77 58 47 . 869565 23
当组间方差较大时,说明分组有意义,两变量相关 当组内方差较大时,说明随机误差影响大,两变量不相关
SST = 观测值总离差平方 SSA + SSE 组内离差平方和 由误差引起 组间离差平方和 由控制变量引起
变量说明
SST = SSA + 观测值总离差平方和 组间离差平方和 由控制变量引起 系统误差 k ni SSE 组内离差平方和 由误差引起 随机误差
nj
SST ( x ij x ) 2
Sum of Squares 7977787 8.6E+07 9.4E+07 9.4E 07
Between Groups Within Groups Total
方差齐性检验 多重比较检验 其他检验
组间方差(MEA):1329631.132 组内方差(MSE): 314485.647 F统计量:4.228=1329631.132/ 314485.647 显然,组间(不同文化程度)方差明显大于组内(抽样)方差 且sig.=0.000<0.05,不同文化程度分组对收入有影响 即不同文化程度,家庭月收入有差异
构造检验的统计量(计算均方 MS)
1. 组间方差: SSA 的均
2. 组内方差: SSE 的均 方,记为 MSE ,计算 方 , 记 为 MSA , 计 算 公式为 公式为 SSA SSE MSA MSE k 1 nk 将MSA和MSE进行对比,即得到所需要的检验统计量F 当 H0 为真时,二者的比值服从分子自由度 df1 为 k-1 、分 母自由度df2为 n-k 的 F 分布,即
于行业本身所造成的,后者所形成的误差是由系统性因素 于行业本身所造成的 后者所形成的误差是由系统性因素 造成的,称为系统误差
方差分析的基本思想和原理(误差平方和)
1. 数据的误差用平方和(sum of squares)表示 2. 组内平方和(within groups) 因素的同一水平(同一个总体)下样本数据的平方和 比如,零售业被投诉次数的误差平方和 组内平方和只包含随机误差 3. 组间平方和(between groups) 因素的不同水平(不同总体)下各样本之间的平方和 比如,四个行业被投诉次数之间的误差平方和 组间平方和既包括随机误差,也包括系统误差
若显示此结果,需在分析时选择: Option-Means Plot
50
M ean of 投诉次数
SST(4164.609)=SSA(1456.609)+SSE(2708.000) 组间方差MSA(485.536) > 组内方差MSE(142.526) Sig=0.039<0.05,在显著水平=0.05下,拒绝无差异假设, 即各个行业的服务质量的均值有差异 具体差异可参看描述统计表(1)或均值图(3)
N
没读过书 小学 初中 高中 中专、技校 大专 大学本科及以上
Total
3 20 90 73 31 34 31 282
20
输出结果分析
ANOVA
单因素方差分析进一步分析
df 6 275 281 Mean Square 1329631.132 314485.647 F 4.228 Sig. .000
家月收入
N
零售业 售 旅游业 航空公司 家电制造业
Totalຫໍສະໝຸດ 7 6 5 5 23Mean Std. Deviation 49.0000 10.80123 48.0000 13.59412 35.0000 10.41633 59.0000 12.74755 47.8696 13.75865
若现实此结果,需在分析时选择: options-statistics-descriptive
10
方差分析的基本假设前提
观测变量各总体应服从正态分布 观测变量个总体的方差应相同
单因素方差分析 One Way ANOVA
总体的均值无显著差异 即: 1 = 2 =…= k 若有一个不相等,即拒绝原假设 若有 个不相等,即拒绝原假设 ② 选择检验统计量(F统计量) ③ 计算检验统计量的观测值和概率p ④ 给出显著水平α,判断: 如果p值≤α,则拒绝H0;反之,接受H0
19
输出结果
Descriptives
家月收入
95% Confidence Interval for Mean Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum 610.00 101.489 58.595 357.89 862.11 500 700 1066.90 451.281 100.909 855.69 1278.11 380 2300 928.34 692.601 73.007 783.28 1073.41 317 5400 1008.95 400.120 46.831 915.59 1102.30 336 2500 1091.68 487.832 87.617 912.74 1270.62 500 2629 1358.85 499.612 85.683 1184.53 1533.18 660 3000 1349.06 658.206 118.217 1107.63 1590.50 500 4000 1071.76 579.794 34.526 1003.80 1139.72 317 5400