SPSS均值比较与检验
第6章 SPSS参数检验——均值比较
总体2
抽取简单随机样均值之差的检验 (s12、 s22 已知)
• 1.假定条件
两个样本是独立的随机样本 两个总体都是正态分布 若不是正态分布, 可以用正态分布来近似(n130和
n230) 2.检验统计量为
Z ( X1 - X 2 ) - (m1 - m2 ) ~ N (0,1)
6.2 MEANS 过程
• 功能:分组计算、比较指定变量的描述统计量。包括均值、 标准差、总和、观测数、方差等等,还可以给出方差分析表 和线性检验结果。
• Analyze-> Compare Means->Means
n Dependent List:用于选入需要分析的变量,如果选入两 个以上变量,系统会在同一张输出表中依次给出分析结果 。
)
1. 检验具有不等方差的两个总体 的均值
2. 假定条件
两个样本是独立的随机样本
两个总体都是正态分布
两个总体方差未知且不相等 s12 s22
3. 检验统计量
( S12 S22 )2
t
(
X1
-
X2) S12 n1
- (m1 S22
n2
-
m2
)
~
t(
(
S12 n1
)2
/(
n1
n1 -1)
s
2 1
s
2 2
n1 n2
两个总体均值之差的检验 (s12、 s22 未知,大样本)
• 检验统计量为
Z (X1 - X 2 ) - (m1 - m2 ) ~ N (0,1)
s12 s22 n1 n2
两个总体均值之差的检验 (s12、 s22 未知但相等,小样本)
一 均值比较和T检验及F检验
t
X1 X 2
2 X 2 X X 2 X1
2 1 2
n 1
=
79.5 71 9.1242 9.9402 2 0.704 9.124 9.940 10 1
பைடு நூலகம்
=3.459。 第三步 判断 根据自由度 df n 1 9 ,查 t 值表 t (9)0.05 2.262 , t (9)0.01 3.250 。由于实际计 算出来的 t =3.495>3.250= t (9)0.01 ,则 P 0.01 ,故拒绝原假设。 结论为:两次测验成绩有及其显著地差异。 由以上可以看出,对平均数差异显著性检验比较复杂,究竟使用 Z 检验还是使用 t 检 验必须根据具体情况而定,为了便于掌握各种情况下的 Z 检验或 t 检验,我们用以下一览表 图示加以说明。
已知时,用 Z
X
n
单总体
未知时,用 t
X (df n 1) S n
在这里, S 表示总体标准差的估计量,它与样本标准差 X 的关系是:
S
n X n 1
1 , 2 已知且是独立样本时,用
T 检验原理及公式
t 检验是用 t 分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。 t 检验分为单总体 t 检验和双总体 t 检验。当总体呈正态分布,如果总体标准差未知,而且样 本容量 n <30,那么这时一切可能的样本平均数与总体平均数的离差统计量呈 t 分布。
对于要使用 T 检验进行均值比较的变量应该是正态分布的。 如果分析变量明显是非正态 分布的,应该选择非参数检验过程。
II 双总体 t 检验
双总体 t 检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体 t 检验又分为两种情况 一. 独立样本 t 检验 (检验假设:两个独立样本的 t 检验用于检验两个不相关的样本来自具有相同均值的 总体) 独立样本平均数的显著性检验。各实验处理组之间毫无相关存在,即为独立样本。该检 验用于检验两组非相关样本被试所获得的数据的差异性。 独立样本 T 检验要求被检验的两个样本方差要求具有齐性, 如果不齐, 使用校正公式计 算 T 值和自由度。因此,在输出结果中,应该先检查方差齐性(F 检验) ,根据齐性的结果, 在输出表格中选择 T 检验的结果。 二. 相关(配对)样本 t 检验。 (检验假设:配对样本 t 检验(Paired Sample T test)用于检验两个相关的样本是 否来自具有相同均值的总体) 相关样本平均数差异的显著性检验,用于检验匹配而成的两组被试获得的数据或同组 被试在不同条件下所获得的数据的差异性,这两种情况组成的样本即为相关样本或配对样 本。 现以相关检验为例,说明检验方法。因为独立样本平均数差异的显著性检验完全类似, 只不过 r 0 。 相关样本的 t 检验公式为:
SPSS统计分析第四章均值比较与T检验
N 258 216
Mean $41441.8 $26031.9
Std. Dev iation $19,499.214 $7,558.021
Std. Error Mean $1213.97
$514.258
左第一栏为分析变量标签和分类变量标签 N观测量数目 Mean均值 Std. Deviation标准差 Std. Error Mean标准误
三、配对样本T检验
配对样本T检验(Paired Sample T test)用 于检验两个相关的样本是否来自具有相同均 值的总体。这种相关的或配对的样本常常来 自这样的实验结果,在实验中被观测对象在 实验前后均被观测。两个变量可以是before after,配对分析的测度也不是必须来自同一 个观测对象。一对可以两者组合而成。
练习题
已知某水样中含CaCO3的真值为20.7mg/L, 现用某方法重复测定该水样11次CaCO3的含 量(mg/L)为:20.99,20.41,20.10, 20.00,20.91,22.60,20.99,20.41, 20.00,23.00,22.00。问该方法测得的均值 是否偏高?
2、Independent Sample T test(独立样本T检验)
例题一
现有银行雇员工资为例,检验男女雇员现工 资是否有显著差异。一个是要比较salary变量 的均值,另一个是gender变量作为分水平变 量。 (data09--03) 。
分析变量的简单描述性统计量
Gender Current Salary Male
F emale
Group Statistics
如果你试图比较的变量明显不是正态分布的,则应该 考虑使用一种非参数检验过程(Nonparametric test)。 如果想比较的变量是分类变量,应该使用Crosstabs 功能。
spss均值检验(均数分析单样本t检验独立样本t检验)
在统计学中,我们往往从样本的特性推知随机变量总体的特性。
但由于总体中个体之间存在差异,样本的统计量和总体的参数之间往往会有误差。
因此,均值不相等的样本未必来自不同分布的总体,而均值相等的样本未必来自有相同分布的总体。
也就是说,如何从样本均值的差异推知总体的差异,这就是均值比较的内容。
SPSS提供了均值比较过程,在主菜单栏单击“Analyze”菜单下的“Compare Means”项,该项下有5个过程,如图4-1。
平均数比较Means过程用于统计分组变量的的基本统计量。
这些基本统计量包括:均值(Mean)、标准差(Standard Deviation)、观察量数目(Number of Cases)、方差(Variance)。
Means过程还可以列出方差表和线性检验结果。
[例子]调查了棉铃虫百株卵量在暴雨前后的数量变化,统计暴雨前和暴雨后的统计量,其数据如下:暴雨前 110 115 133 133 128 108 110 110 140 104 160 120 120暴雨后 90 116 101 131 110 88 92 104 126 86 114 88 112该数据保存在“DATA4-1.SAV”文件中。
1)准备分析数据在数据编辑窗口输入分析的数据,如图4-2所示。
或者打开需要分析的数据文件“DATA4-1.SAV”。
图4-2 数据窗口2)启动分析过程在SPSS主菜单中依次选择“Analyze→Compare Means→Means”。
出现对话框如图4-3。
图4-3 Means设置窗口3)设置分析变量从左边的变量列表中选中“百株卵量”变量后,点击变量选择右拉按钮,该变量就进入到因子变量列表“Dependent List:”框里,用户可以从左边变量列表里选择一个或多个变量进行统计。
从左边的变量列表中选中“调查时候”变量,点击“Independent List”框左边的右拉按钮,该变量就进入分组变量“IndependentList”框里,用户可以从左边变量列表里选择一个或多个分组变量。
SPSS均值比较与T检验
.
7
H 西0 南财经大学出版社
5.1 统计推断与假设检验
2、假设检验的几个概念 (4) 概率p值
SPSS16.0与统计数据分析
p值是当零假设正确时,观测到的样本信息出现的概率。 如果这个概率很小,以至于几乎不可能在零假设正确时出现 目前的观测数据时,我们就拒绝零假设。p值越小,拒绝零假 设的理由就越充分。但怎样的p值才算“小”呢?通常是与预 先设定的显著性水平 值比较,若 值为0.05,p值小于0.05则 认为该概率值足够小,应拒绝零假设。
.
8
H 西0 南财经大学出版社
5.1 统计推断与假设检验
SPSS16.0与统计数据分析
3、假设检验的基本步骤
➢第1步 给出检验问题的原假设;
根据检验问题的要求,将需要检验的最终结果作为零假 设。例如,需要检验某学校的高考数学平均成绩是否同往年 的平均成绩一样,都为75,由此可做出零假设,H0 :75
④配对样本T检验(Paired-Sample T Test),用于检 验两个相关的样本是否来自具有相同均值的总体。
.
4
H 西0 南财经大学出版社
5.1 统计推断与假设检验
SPSS16.0与统计数据分析
2、假设检验的几个概念
(1)统计假设
➢ 原假设:在很多情况下,我们给出一个统计假设仅仅是
为了拒绝它。例如,如果我们要判断给定的一枚硬币是
.
3
西南财经大学出版社
5.1 统计推断与假设检验
SPSS16.0与统计数据分析
1、参数检验
①均值比较(Means),用于计算指定变量的 综合描述统计量;
Compare Means子菜单
②单样本T检验(One-Sample T Test),检验单个 变量的均值与假设检验值之间是否存在差异;
spss均值的比较与检验
21000.00,19000.00,33000.00,31500.00,18500.00,34000.00,29000.00
26000.00,25000.00,28000.00,30000.00,28500.00,27500.00,28000.0 0
26000.00
操作步骤:
1、
第十八页,共29页。
5.5.3 配对样本T检验
一、有关概念
进行配对样本T检验要求被比较的两个样本有配对关系,要求两个 样本均来自正态总体,而且均值是对于检验有意义的描述统计量。
设总体X~ N(μx,σx2), Y ~ N(μy,σy2), x1,x2,…xn和y1,y2,…yn分别是对应
的样本,分别取自X和Y的样本。Z=X-Y, 和Sz2 分别是Z的样本均
若H0成立,则统计量T服从自由度为n-1的t分布。对于给定的α,由 t分布表可查得临界值t α/2(n-1), 使
P{|T|>t α/2(n-1)}= α 如果算得T的值t落入其拒绝域|t|>t α/2(n-1)内,则拒绝H0;否则不
能拒绝H0。
二、单样本T检验的功能与应用
执行单样本T检验过程,SPSS将显示:每个检验变量的统计量的均值、标准差和均
设总体X~ N(μx,σx2), Y ~ N(μy,σy2), X、Y独立。x1,x2,…xn和
y1,y2,…yn分别是取自X和Y的样本,
方差。
、X和YSx2、Sy2分别是样本均值和样本
检验的统计量其分布分两种情况:
(1)当σx= σy,即方差齐次性时
xy
t Sw
1 1 ~ t(nx ny 2) nx ny
第二页,共29页。
2、将要进行检验的变量放入右边的Test Variable(s)中
SPSS软件中几种常用的统计方法
SPSS应用
操作步骤
按照顺序:分析 → 比较均值 → 单样本T检验,进入单一 样本T检验 “单样本T检验”对话框中,将左侧“右2:4”变 量选入到检验变量“检验变量”框中。右下角检验值“检 验值”框用于输入已知的总体均值,在本例中假设为“1”。 如图所示
OR值等于1,表示该因素对疾病的发生不 起作用;
OR值大于1,表示该因素是危险因素;
OR值小于1,表示该因素是保护因素。
SPSS应用
操作步骤: 在“变量视图”栏中输入相应的变量类别。
SPSS应用
在各变量的值标签中输入相应的值
SPSS应用
返回“数据视图”栏输入相应的数据。
操作步骤(2)
单击定义组别“定义组”按钮,弹出“定义组” 对话框,如图所示,分别为组1和组2输入1,2。 (1代表男性,2代表女性)
输出结果(1)
结果解释
此表给出了独立样本均值检验的描述性统计量, 包括两个样本的均值、标准差和均值标准误差。
输出结果(2)
结果解释
对于方差齐性检验,其p值为0.731>0.05,认为两样本来自的总体 的方差相等。
输出结果(1)
结果解释:
此表给出了单一样本均值检验的描述性统计量, 包括均值、标准差和均值标准误差。右手指长 2D:4D的均值为0.93632,接近假设总体均值 1,但还不能就此下结论。
输出结果(2)
结果解释 此表是单一样本均值检验的结果列表,给出了t 统计量、自由度、双尾概率、显著水平及置信 区间。双尾概率P=0.000<0.05,故本研究样本 2D:4D比值与假设的总体均值具有显著性差异。
SPSS的均值比较过程
一、相关分析1、参数相关分析Pearson相关系数,又称积矩相关系数,适用于连续分布或正态分布变量,是最常用的参数相关分析。
2、非参数相关分析当资料不服从双变量正态分布或总体分布未知,或原始数据用等级表示时,宜用spearman 或kendall相关。
Spearman,等级相关,适合定序变量或不满足正态分布假设的等间隔数据,适用于连续等级资料;Kendall,等级相关,适合定序变量或不满足正态分布假设的等间隔数据,适用于合并等级资料;(1)Spearman相关分析Spearman相关系数又称秩相关系数,是根据等级资料研究两个变量间相关关系的方法。
它是依据两列成对等级的各对等级数之差来进行计算的,所以又称为“等级差数法”。
它对数据条件的要求没有积差相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关来进行研究。
它是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。
对于服从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要低一些。
Pearson相关系数的计算公式可以完全套用Spearman相关系数计算公式,但公式中的x和y用相应的秩次代替即可。
(2)Kendall相关分析肯德尔(Kendall)系数又称和谐系数,是表示多列等级变量相关程度的一种方法。
适用这种方法的数据资料一般是采用等级评定的方法收集的,即让K个评委(被试)评定N件事物,或1个评委(被试)先后K次评定N件事物。
等级评定法每个评价者对N件事物排出一个等级顺序,最小的等级序数为1 ,最大的为N,若并列等级时,则平分共同应该占据的等级,如,平时所说的两个并列第一名,他们应该占据1,2名,所以它们的等级应是1.5,又如一个第一名,两个并列第二名,三个并列第三名,则它们对应的等级应该是1,2.5,2.5,5,5,5,这里2.5是2,3的平均,5是4,5,6的平均。
SPSS第5章 平均数比较
5.3.2 单一样本T检验过程选择
• 顺序单击“Analyze”→“Compare Means”→“One Sample T test”命令,可打开图5.3的对话框。“Test Variable”框中的变量是需要作检验的变量,要从源变 量框中选取某个变量进入该框,然后单击向右的箭头, 再在“Test Value”参数框中输入一个定值作为假设检 验值(总体参数)。 • “Options”对话框将给出置信水平“Confidence Interval”和缺失值“Missing Value”处置方式。置信水 平必须在1-99之间,如90、95,99等(一般取95)。 缺失值的处置方式一般有两种(图5.4):一种是只 要变量中含有缺失值,该组样本都被剔除(Exclude cases Listwise);另一种是尽可能保留样本,仅剔除 被分析变量的那个变量中含有缺失值的Cases。
•1、统计检验中的假设条件
•假设是进行检验的前提,是有待确认的一种事实。例 如,某样本是否满足正态分布,两样本平均数是否源 于同一总体等等。
•假设检验中,首先要建立一个关于总体参数的假设(原 假设),然后抽取样本,检验所做假设正确与否。在进行 研究时,往往需要根据已有的理论和经验,事先对研究结 果作出一种预想希望能证实的一种假设。这种假使叫科学 假设或被择假设,记为H1;而要对总体的某种假设(论断) 作出判断时,常要对相反的假设进行统计检验,称这个假 设为零假设(或虚无假设、无偏假设),记作H0。进行假 设检验的目的是为了推翻假设,主要是推翻假设时的犯错 误概率容易把握,而承认假设正确的概率不容易把握。 •假设建立得合适与否是决定检验成败的关键,统计中的 假设检验有两个基本要求。第一,建立假设的目的是为了 推翻原假设,因为推翻假设远远比承认原假设容易,因此, 真正需要证明的往往作为备择假设,即使不能推翻原假设, 也只能说,没有足够的证据推翻原假设。第二,原假设必 须是虚无(无显著性差异)假设,即必须包括等号,因为 所有的统计分析、统计计算都建立在这个基础之上;而备 择假设一定不能包含等号。
spss教程第二章--均值比较检验与方差分析
第二章均值比较检验与方差分析在经济社会问题的研究过程中,常常需要比较现象之间的某些指标有无显著差异,特别当考察的样本容量n比较大时,由随机变量的中心极限定理知,样本均值近似地服从正态分布。
所以,均值的比较检验主要研究关于正态总体的均值有关的假设是否成立的问题。
◆本章主要内容:1、单个总体均值的 t 检验(One-Sample T Test);2、两个独立总体样本均值的 t 检验(Independent-Sample T Test);3、两个有联系总体均值均值的 t 检验(Paired-Sample T Test);4、单因素方差分析(One-Way ANOVA);5、双因素方差分析(General Linear Model Univariate)。
◆假设条件:研究的数据服从正态分布或近似地服从正态分布。
在Analyze菜单中,均值比较检验可以从菜单Compare Means,和General Linear Model得出。
如图2.1所示。
图2.1 均值的比较菜单选择项§2.1 单个总体的t 检验(One-Sample T Test)分析单个总体的 t 检验分析也称为单一样本的 t 检验分析,也就是检验单个变量的均值是否与假定的均数之间存在差异。
如将单个变量的样本均值与假定的常数相比较,通过检验得出预先的假设是否正确的结论。
例1:根据2002年我国不同行业的工资水平(数据库SY-2),检验国有企业的职工平均年工资收入是否等于10000元,假设数据近似地服从正态分布。
首先建立假设:H0:国有企业工资为10000元;H1:国有企业职工工资不等于10000元打开数据库SY-2,检验过程的操作按照下列步骤:1、单击Analyze →Compare Means →One-Sample T Test,打开One-Sample T Test 主对话框,如图2.2所示。
图2.2 一个样本的t检验的主对话框2、从左边框中选中需要检验的变量(国有单位)进入检验框中。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图3—5 Options对话框
11
2. 结果及分析
表3—1 观测量摘要 表(性别和年龄均放第 一层)
Case Processing Summary
身高 * 性别 身高 * 年龄
Included
N
Percent
27
100.0%
27
100.0%
Cases
Excluded
N
Percent
0
.0%
0
.0%
15
一、单一样本T检验
一、 简介
T检验:t x 0
s x
用于检验单个变量的均值与假设检 验值(给定的常数)之间是否存在差异。
二、完全窗口分析
按Analyze—Compare Means—OneSample T Test顺序,打开One-Sample T Test主对话框(如图3--1)
16
Test
Variables 框:用于 选取需要 分析的变 量
图3-6
Test Value:输 入已知 的总体 均值, 默认0
打开主对话框。 ▪ 3)单击Option, 打开Options对话框,选择统计项
目。 ▪ 4)单击OK完成。
9
选h sex
图3—3 在主对话框选送变量
图3—4
第二层变量框
按Next,进入 layer 2of 2, 选age
10
选
择
统
复选此2
计
项,第一
项
按此
层次分
目
按钮
组选择
计算方
差分析
和线性
检验
N2 2N 3
(N 1)(N 2)(N 3)
(xi S4
x)4
N(N
3(2N 3) 1)(N 2)(N
3)
(xi x)2 2 S4
N≥3,S>0
偏度:
Skewness
N
(N 1)(N 2)
(xi x)3 S3
N≥2,S>0
返回 4
MEANS过程
一、 Means过程 该过程实际上更倾向于对样本进行 描述,可以对需要比较的各组计算 描述指标,包括均值、标准差、总 和、观测量数、方差等一系列单变 量统计量。
14
身高 * 年龄
关联度测度
Measures of Association
R
R Squared
.879
.772
Eta .915
Eta Squared .838
表3—6是eta统计量表,η统计量表明因变 量和自变量之间联系的强度,η2是因变量中 不同组间差异所解释的方差比,是组间平 方和与总平方和之比。
决这样的问题,只建立一个控制层就不够了。应该考虑,选择身高h作为因变量,分类变 量age作为第一层控制变量,sex为第二层控制变量。两个分类变量分别放在两层中,且使 用选择项。
Case Processing Summary
身高 *性别 *年龄
Included
N
Percent
27 100.0%
Cases
Test) ▪ 方差分析(One-Way ANOVA)
2
有关公式—(提前说明)
算术平均值: 方差: 标准差:
n
xiwi
Mean
i1 n
wi
i1
n
wi (xi x)2
Variance i1 n
wi 1
i1
S Variance
均值标准误:
Stderr S N
3
有关公式
峰度: Kurtosis
Excluded
N
Percent
0
.0%
Total
N
Percent
27 100.0%
13
对第一层变量的方差分析结果
身高 * 年龄
Between Groups
Within Groups Total
(Combined) Linearity Deviation from Linearity
ANOVA Table
生物统计与实验设计
Biological Statistics And Experimental Designs
SPSS——均值比较与检验
▪ MEANS过程 ▪ 单一样本T检验 (One-Sample T Test) ▪ 独立样本T检验 (Independent-
Sample T Test) ▪ 配对样本T检验 (Paired-Sample T
Test for linearity:产 生第一层最后一个变 量的R和R2。
7
三、例题分析
测得某城市12岁儿童的身高及体重信息, 用Means过程对其做基本的描述性统计分析。
8
1、操作步骤
▪ 1) 打开数据文件“data03-MEANS_01.sav” 。 ▪ 2)按顺序Analyze Compare Means Means
6
Statistics框:供选择的统计量
Cell Statistics框: 选入的描述统计量,
默认为均值、样本 数、标准差。
图3—2 Options 对话框
Statistics for First Layer复选框:
Anova table and eta: 进行分组变量的单因 方差分析并计算eta 统计量。
身高 * 年龄
Mean 1.4488 1.5209 1.6129 1.5900 1.5259
N 8
11 7 1
27
Std. Deviation 2.1672
. 12 6.941E-02
分析实例
两个分类变量分别放在两层中
相同年龄的男孩和女孩是否身高有所不同?是否身高随年龄的增长呈线性关系?如果解
Sum of Squares
.105 .097
.008
.020 .125
df 3 1
2
23 26
Mean Square .035 .097
.004
.001
F 39.587 109.435
4.664
Sig. .000 .000
.020
当前表是方差分析表,共6列:第一列方差来 源:组间的、组内的、总的方差;第二列为平 方和;第三列为自由度;第四列为均方;第五 列为F值;第六列为F统计量的显著值。
Total
N
Percent
27
100.0%
27
100.0%
身高
性别 女 男 Total
身高 * 性别
Mean 1.5154 1.5357 1.5259
N 13 14 27
Std. Deviation 6.253E-02 7.623E-02 6.941E-02
身高
年龄 10 11 12 13 Total
二、完全窗口分析 按Analyze—Compare Means— Means顺序,打开Means主对话框 (如图3--1)。
5
该框的变量为因变量,即用于分析的变量。
单击此按钮,
进入下一层, 该框的变量为自
返回则按
变量,必须至少
Previous按钮。 有一个变量
见图3—2
图3—1 Means主对话框