SPSS均值比较、T检验和方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
作业
一家企业生产某种产品,随机抽取50 名工人,分成两个组,每组25名工人, 用A方法生产所需时间:
6.8
5
7.9
5.2
7.6
6.1
6.2
7.1
4.6
6
6.4
6.1
6.6
7.7
6.4
5
5.9
5.2
6.5
7.4
7.1
6.1
5
6.3
7
作业
用B方法生产所需时间:
5.2
6.7
5.7
6.6
8.5
4.2
4.5
▪ Dependent List 对话框->数学 ▪ Independent List对话框->性别 ▪ Option按钮,选择统计项目
第二节 T检验
一、单一样本T检验 二、两个独立样本T检验
一、单一样本T检验
▪ 检验某个变量的样本均值与某个指定总体均值之间 是否存在显著差异。
▪ 计算公式:
t xx D S.E.Mean s / n
步骤
▪ 在“Analyze”菜单“Compare Means”中选择 One-Way ANOVA命令。
▪ 在弹出的对话框中,选择“数学”变量添加到 Dependent List框中,选择“组别”变量添加到 Factor框中。
▪ 单击option按钮,出现一个对话框。由于方差分 析的前提是各个水平下总体服从方差相等的正态 分布,因此必须对方差分析的前提进行检验。
方差分析有: ▪ 单因素重复试验 ▪ 双因素重复试验 ▪ 双因素无重复试验
单因素试验
▪ 单因素方差分析测试某一个控制变量的不 同水平是否给观察变量造成了显著差异和 变动。
例如:农业上检验某种新型化肥的效果,做 增产试验。将土地分为三组: 第一组:使用Fa化肥 第二组:使用Fb化肥 第三组:使用传统化肥(对照)
▪ T检验适合在两个样本间的比较。对于两组 以上的均数比较,必须使用方差分析的办 法。
▪ 造成结果差异的原因可分为两类:一类是 不可控的随机变量;一类是在研究过程中 人为施加的控制变量。
▪ 方差分析的的基本思想是:通过分析不同 变量的变异对总变异的贡献大小,确定控 制变量对研究结果影响力的大小,是否对 结果产生了显著影响。如果没有,就是随 机变量的作用。
31
40
26
30
36
38
29
40
38
30
35
38
二、两个独立样本T检验
▪ 所谓独立样本是指两个样本之间彼此独立 没有任何关联,两个独立样本各自接受相 同的测量,研究者的主要目的是了解两个 变量之间是否有显著差异存在。
▪ 检验的前提: 1、两个样本相互独立 2、样本来自的两个总体服从正态分布
计算步骤
37
25
48
41
48
47
33
49
45
29
21
32
潮流型家庭收入
34
42
38
35
42
46
43
41
22
29
26
56
38
40
63
31
37
35
19
43
47
36
36
32
33
▪ D是样本均值与检验值的差。 ▪ S.E.Mean:样本均差,或抽样平均误差 ▪ S是样本标准差,n为样本数
中心极限定理
▪ 如果总体存在有限的平均数和方差时,不 管总体是否属于正态分布,只要当抽样单 位数不断增加,当样本容量大于30后,即 当抽样单位数足够大时,样本平均数x分布 趋近于正态发布。
Groups
▪ 本例中大于相伴概率0.461,大于显著水平 0.05,不能拒绝方差相等的假设,可以认 为两个学校学生数学成绩方差无显著差异;
▪ 在方差相等时看T检验结果,T检验值等于 相伴概率0.423,大于显著水平0.05,不能拒 绝T检验的零假设,可以认为两个学校学生 数学平均成绩无显著差异。
▪ 计算公式:
n
x1i
x1
i 1
n
例1
▪ 以下是某个班同学的数学成绩,比较不同性别 同学的数学成绩平均值和方差。
性别 male female
数学 99 79 59 89 79 89 99 88 54 56 23 70 80 67
步骤:
▪ Analyze->Compare Means- >Means
总变异
SST=SSA+SSE ▪ 其中:
SST:总变异的平方和 SSA:组间离差平方和 SSE:组内离差平方和
k
SSA ni (xi x)2
i1
k ni
SSE (xij xi )
i1 j1
SSA:是各水平组均值和总体均值离差的平方和, 反映了控制变量的影响。 SSE:是每个数据与本水平组平均值离差的平方 和,反映了数据抽样误差的大小程度。 K:水平数 ;Ni为第i水平下的样本容量。
多重比较
3个组之间的相伴概率都小于显著水平0.05, 说明3个组之间都存在显著差别
作业3 方差分析
▪ 某百货公司的营销部根据不同家庭的价值 观细分了女性服装市场,分为保守型、传 统型和潮流型,另外调查了不同类型家庭 收入,见下表(单位:千元)。能否推断 出不同类型的家庭的收入是否存在明显不 同?
例2
▪ 上题中,数学高考成绩与全国平均成绩70 之间是否存在显著差异?
步骤
▪ Analyze->Compare Means- >One Sample T Test
▪ Test Variables: 数学 ▪ Test Values: 70
Option: ▪ Confidence Interval: 95% ▪ Missing Values: Exclude cases
5.3
7.9
7
5.9
4.9
5.3
4.2
7.1
6.5
5.9
6.7
6.6
4.2
5.9
7.1
5.8
7
5.7
假设两个总体的方差相等,显著水平为0.05
,这两种方法效率是否有显著差异?
第三节 方差分析
▪ 方差分析是研究一个或多个可分组的自变 量与一个连续的因变量之间的统计关系, 并且测定自变量对因变量的影响和作用的 一种统计分析方法。
例题 三组学生的数学成绩
组别 1 1 1 1 1 1
数学 99 88 99 89 94 90
组别 2 2 2 2 2 2
数学 79 56 89 99 70 89
组别 3 3 3 3 3 3
数学 55 50 67 67 56 56
研究一个班3组同学(分别接受3种不同的教学 方法)在数学成绩上是否有显著差异.
评判标准:
▪ Spss将会根据计算的T值和T分布表,给出 相应的相伴概率值Sig。
▪ 如果相伴概率值小于或等于显著水平a,则 拒绝H0,认为两总体均值之间存在显著差异, 相反,相伴概率大于显著水平a,则不能拒 绝H0 ,认为两总体均值之间不存在显著差 异。
例3
▪ 清华、北大学生的高考数学成绩表
学校 清华 北大
▪ 在两总体方差未知且不等时, ▪ T统计量计算公式如右:
t
x1 x2
s12 / n1 s22 / n2
s12 s22
f
n1
s12 n1
2
n2
s22 n2
2
n1
n2
▪ 两总体方差未知且 相同情况下,T统 计量计算公式:
t x1 x2
s
2 p
/
n1
s2p
/
n2
S
2 p
(n1
1)s12 (n2 1)s22 n1 n2 1
▪ 单击Contrasts按钮,选择Linear,作线形 分解。
结果与讨论
▪ 单因素方差分析的前提检验结果
Test of Homogeneity of Variances
数学
Levene Statistic df1 df2 Sig.
3.862Βιβλιοθήκη Baidu
2 15 .044
方差检验
从上表可以看出,相伴概率为0,小于显著性水平0.05, 表示拒绝零假设,也就是说3个组中至少有一个组和其他 两个组有明显的区别。 总的离差平方和为5250,其中控制变量不同水平造成的 组间离差平方和为3686,组内离差平方和为1563.6
第6章 SPSS统计分析
本章内容
▪ 第一节 均值比较 ▪ 第二节 T检验 ▪ 第三节 方差分析
要点:
▪ 均值比较是对同一样本进行分组,对组与 组之间平均水平的比较。
▪ T检验主要运用在两个样本间平均水平的比 较。
▪ 方差分析运用于两个以上样本的均数比较。
第一节 均值比较
一、Means过程
▪ Means过程是按用户指定条件,对样本进 行分组计算均值和标准差。
计算公式,进行F检验
F SSA/(k 1) SSE /(n k)
▪ F服从(k-1,n-k)个自由度的F分布
▪ SPSS自动计算F统计值,F服从(k-1,n-k)个 自由度的F分布(k是水平数,n为个案 数),SPSS依据F分布表给出相应的相伴概 率值。
▪ 如果相伴概率值小于或等于显著水平a,则 拒绝零假设,认为各水平下总体均值有显 著差异,反之,则认为控制变量不同水平 下各总体均值没有显著差异。
结果与讨论
▪ T值为0.566
▪ 相伴概率Sig =0.584
▪ Sig>0.05, 因此不能拒绝H0, 可以认为11 名同学的成绩与全国数学平均成绩相比, 没有显著差异。
作业
▪ 抽取一个由12名学生组成的随机样本,调查他们 在作业上花费的时间。假设学生作业时间服从正 态分布,老师建议时间不低于36小时,检验其平 均时间是否与老师建议的时间相符?
抽样平均误差
(x X )2 = S
所有样本的个数 n
(S.E.Mean)
T分布
▪ 当样本容量小于30,样本平均数分布服从 n-1个自由度的T分布。
▪ SPSS将根据T分布表给出t值对应的相伴概 率值。如果相伴概率值小于或等于用户设 想的显著性水平a,则拒绝H0,认为总体均值 和检验值之间存在显著差异。反之,总体 均值和检验值之间不存在差异。
正态分布
-2u 否决域
-u
x
u
68.27%
2u 否决域
95.45% 接受域
▪ 当以全及总体平均数为中心各加减一个抽样平均误差 范围时,此范围的抽样指标占总体所有可能指标的 68.27%。两倍时为95.45%。这个倍数称为概率度
抽样平均误差
▪ 样本平均数x的平均数等于总体平均数,样 本平均数分布的方差等于总体方差除以样本 容量。
数学 99 88 79 59 54 89 79 56 89 99 23 89 70 50 67 78 89 56
步骤:
▪ Analyze->Compare Means- >Independent- Sample T Test
▪ Test Variables: 数学 ▪ Test Values: Source->Define
方差相等检验方法
▪ 在这里选择Homogeneity of variance test(方差相等检验方法)。如果相伴概率值 小于或等于显著水平,则拒绝零假设,认 为各水平下总体方差不等;相反,如果相 伴概率值大于显著水平,则接受零假设, 认为各水平下总体方差相等。单击 continue返回。
▪ 单击Post Hoc按钮,打开一个对话框,在 其中选择一种或几种比较分析的方法,选择 LSD(Least-Significant Difference)最小显 著法。a默认为0.05,单击Continue返回。
▪ 利用F检验判断两总体的方差是否相同。 Spss采用Levene F方法检验两总体方差是否相同, 自动计算F统计量,并根据F分布表给出统计量对 于的相伴概率和显著水平a进行比较,从而判断 方差是否相同。
▪ 根据第一步的结果,决定T统计量和自由度的计 算公式,进而对T检验的结论作出结论
▪ 两个独立样本T检验的零假设 H0为两总体均值之间不存在显 著差异。
保守型家庭收入
43
47
22
37
41
25
36
50
22
32
49
31
50
26
32
47
32
41
38
51
28
33
50
54
42
传统型家庭收入
35
33
54
43
38
40
45
38
34
29
43
23
32
37
25
48
41
48
47
33
49
45
29
21
32
传统型家庭收入
35
33
54
43
38
40
45
38
34
29
43
23
32