SPSS之平均数比较与T检验
SPSS知识3 t检验(两个总体均数比较)
t检验前言:一、t检验有3种:单样本t检验、配对样本t检验、两组独立样本t检验。
二、t检验条件:数据资料服从正态或近似正态分布。
两组独立样本t检验还要求两组方差齐(不齐则要进行校正)。
正文:一、单样本t检验理论:单样本t检验是检验样本均数X和总体均数μ【已知的理论值(如脉搏72)、标准值或公认值】的比较。
T=(样本均数-总体均数)/样本均数的标准误Spss操作:前提:建立数据库(一列变量)第一步:正态性检验Analyze→Npar tests→1-sample K-S→数据调入右框(test variable list),选中Test Distribution中的normal→OK。
第二步:看output,判断数据资料正态性与否。
看统计量Z 和P值。
P>0.05,资料正态分布。
第三步:t检验。
正态性,则进行样本均数与总体均数的比较,即单样本t检验。
Analyze→compare means→one-sample T test→将数据调入右框(test variable),在右框下的Test Value右边框中输入总体均数μ→OK第四步:看output中的P值,判断差异是否有统计学意义。
P>0.05,差异无统计学意义。
二、配对样本t检验理论:配对设计有3种情况:1、同一样本分为2份,用2种不同的方法测定;2、自身比较,同一样本处理前后的比较(处理前后的过程中,应保持其他非处理因素的齐同性,并且处理周期不宜太长;3、将某些因素相同的样本组成配伍组,随即分为两组。
T=每一配对的测量值之差的均数/每一配对的测量值之差的均数的标准误。
(各自公式见理论)Spss操作:前提:建立数据库(两列:如before和after)第一步:两组数据做正态性检验Analyze→Npar tests→1-sample K-S→两组数据皆调入右框(test variable list),选中Test Distribution中的normal →OK。
第6章 SPSS参数检验——均值比较
总体2
抽取简单随机样均值之差的检验 (s12、 s22 已知)
• 1.假定条件
两个样本是独立的随机样本 两个总体都是正态分布 若不是正态分布, 可以用正态分布来近似(n130和
n230) 2.检验统计量为
Z ( X1 - X 2 ) - (m1 - m2 ) ~ N (0,1)
6.2 MEANS 过程
• 功能:分组计算、比较指定变量的描述统计量。包括均值、 标准差、总和、观测数、方差等等,还可以给出方差分析表 和线性检验结果。
• Analyze-> Compare Means->Means
n Dependent List:用于选入需要分析的变量,如果选入两 个以上变量,系统会在同一张输出表中依次给出分析结果 。
)
1. 检验具有不等方差的两个总体 的均值
2. 假定条件
两个样本是独立的随机样本
两个总体都是正态分布
两个总体方差未知且不相等 s12 s22
3. 检验统计量
( S12 S22 )2
t
(
X1
-
X2) S12 n1
- (m1 S22
n2
-
m2
)
~
t(
(
S12 n1
)2
/(
n1
n1 -1)
s
2 1
s
2 2
n1 n2
两个总体均值之差的检验 (s12、 s22 未知,大样本)
• 检验统计量为
Z (X1 - X 2 ) - (m1 - m2 ) ~ N (0,1)
s12 s22 n1 n2
两个总体均值之差的检验 (s12、 s22 未知但相等,小样本)
一 均值比较和T检验及F检验
t
X1 X 2
2 X 2 X X 2 X1
2 1 2
n 1
=
79.5 71 9.1242 9.9402 2 0.704 9.124 9.940 10 1
பைடு நூலகம்
=3.459。 第三步 判断 根据自由度 df n 1 9 ,查 t 值表 t (9)0.05 2.262 , t (9)0.01 3.250 。由于实际计 算出来的 t =3.495>3.250= t (9)0.01 ,则 P 0.01 ,故拒绝原假设。 结论为:两次测验成绩有及其显著地差异。 由以上可以看出,对平均数差异显著性检验比较复杂,究竟使用 Z 检验还是使用 t 检 验必须根据具体情况而定,为了便于掌握各种情况下的 Z 检验或 t 检验,我们用以下一览表 图示加以说明。
已知时,用 Z
X
n
单总体
未知时,用 t
X (df n 1) S n
在这里, S 表示总体标准差的估计量,它与样本标准差 X 的关系是:
S
n X n 1
1 , 2 已知且是独立样本时,用
T 检验原理及公式
t 检验是用 t 分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。 t 检验分为单总体 t 检验和双总体 t 检验。当总体呈正态分布,如果总体标准差未知,而且样 本容量 n <30,那么这时一切可能的样本平均数与总体平均数的离差统计量呈 t 分布。
对于要使用 T 检验进行均值比较的变量应该是正态分布的。 如果分析变量明显是非正态 分布的,应该选择非参数检验过程。
II 双总体 t 检验
双总体 t 检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体 t 检验又分为两种情况 一. 独立样本 t 检验 (检验假设:两个独立样本的 t 检验用于检验两个不相关的样本来自具有相同均值的 总体) 独立样本平均数的显著性检验。各实验处理组之间毫无相关存在,即为独立样本。该检 验用于检验两组非相关样本被试所获得的数据的差异性。 独立样本 T 检验要求被检验的两个样本方差要求具有齐性, 如果不齐, 使用校正公式计 算 T 值和自由度。因此,在输出结果中,应该先检查方差齐性(F 检验) ,根据齐性的结果, 在输出表格中选择 T 检验的结果。 二. 相关(配对)样本 t 检验。 (检验假设:配对样本 t 检验(Paired Sample T test)用于检验两个相关的样本是 否来自具有相同均值的总体) 相关样本平均数差异的显著性检验,用于检验匹配而成的两组被试获得的数据或同组 被试在不同条件下所获得的数据的差异性,这两种情况组成的样本即为相关样本或配对样 本。 现以相关检验为例,说明检验方法。因为独立样本平均数差异的显著性检验完全类似, 只不过 r 0 。 相关样本的 t 检验公式为:
均值比较和T检验
Spss16.0与统计数据分析均值比较和T检验20XX6月13日均值比较和T 检验统计分析常常采取抽取样本的方法,即从总体中随机抽取一定数量的样本进行研究来推论总体的特性。
但是,由于抽取的样本不一定具有完全代表性,样本统计量与总体参数间存在差异,所以不能完全的说明总体的特性。
同时,我们也可以知道,均值不等的两个样本不一定来自均值不同的整体。
对于如何避免这些问题,我们自然可以想均值比较和T 检验 1、Means 过程 1.1 Means 过程概述(1)功能:对数据进行进行分组计算,比较制定变量的描述性统计量包括均值、标准差 、总和、观测量数、方差等一系列单列变量描述性统计量,还可以给出方差分析表和线性检验结果。
(2)计算公式为: nxx ni i∑==1111.2问题举例:比较不同性别同学的体重平均值和方差。
数据如下表所示:体重表1.3用SPSS 操作过程截图:1.4 结果和讨论p{color:black;font-family:sans-serif;font-size:10pt;font-weight:normal} Your trial period for SPSS for Windows will expire in 14 days.p{color:0;font -family:Monospaced;font-size:13pt;font-style:normal;font-weight:normal;text-decoration:none}MEANS TABLES=体重 BY 性别/CELLS MEAN COUNT STDDEV VAR.MeansCase Processing SummaryCasesIncluded Excluded TotalN Percent N Percent N Percent体重* 性别24 100.0% 0 .0% 24 100.0%由SPSS 计算计算结果可知男同学体重平均值为:56.5,方差为54.091女同学体重平均值为43.833,方差为29.970。
SPSS统计分析第四章均值比较与T检验
N 258 216
Mean $41441.8 $26031.9
Std. Dev iation $19,499.214 $7,558.021
Std. Error Mean $1213.97
$514.258
左第一栏为分析变量标签和分类变量标签 N观测量数目 Mean均值 Std. Deviation标准差 Std. Error Mean标准误
三、配对样本T检验
配对样本T检验(Paired Sample T test)用 于检验两个相关的样本是否来自具有相同均 值的总体。这种相关的或配对的样本常常来 自这样的实验结果,在实验中被观测对象在 实验前后均被观测。两个变量可以是before after,配对分析的测度也不是必须来自同一 个观测对象。一对可以两者组合而成。
练习题
已知某水样中含CaCO3的真值为20.7mg/L, 现用某方法重复测定该水样11次CaCO3的含 量(mg/L)为:20.99,20.41,20.10, 20.00,20.91,22.60,20.99,20.41, 20.00,23.00,22.00。问该方法测得的均值 是否偏高?
2、Independent Sample T test(独立样本T检验)
例题一
现有银行雇员工资为例,检验男女雇员现工 资是否有显著差异。一个是要比较salary变量 的均值,另一个是gender变量作为分水平变 量。 (data09--03) 。
分析变量的简单描述性统计量
Gender Current Salary Male
F emale
Group Statistics
如果你试图比较的变量明显不是正态分布的,则应该 考虑使用一种非参数检验过程(Nonparametric test)。 如果想比较的变量是分类变量,应该使用Crosstabs 功能。
SPSS对数据进行T检验统计分析
SPSS对数据进行T检验统计分析下面将做此项目的最后一个环节,即使用SPSS进行统计分析。
先用SPSS来做组设计两样本均数比较的T检验,其步骤如下。
(1)执行Analyze/Compare Means/Independent-Samples T test命令,打开如图1-43所示的对话框。
(2)在该对话框中选择X放入TEST列表框中,选择Group放入Grouping Variable文本框中,如图1-44所示。
图1-43 打开T检验对话框图1-44 选择入列表(3)单击Define Groups按钮,系统弹出比较组定义对话框,如图1-45所示。
(4)在该对话框中的两个值框中分别输入1和2,然后单击Continue按钮,如图1-46所示。
图1-45 比较组定义对话框图1-46 输入值(5)单击T检验对话框中的OK按钮,如图1-47所示。
图1-47 进行T检验(6)系统经过计算后,会弹出结果浏览窗口。
首先给出的是两组的基本情况描述,如样本量、均数等,然后是T检验的结果,如图1-48所示。
图1-48 T检验结果从上图中可见,结果分为两大部分:第一部分为Levene's方差检验,用于判断两体方差是否齐,这里的检验结果为F=0.032,p=0.860,可见在本例中方差齐;第二部分则分别给出两组所在部体方差齐和方差不齐时的T检验结果,即上面一行列出的T=2.542,V=22,p=0.019。
从而最终的统计结论为按=0.05水准,拒绝H0,认为克山病患者与健康人的血磷值是不同的。
从样本均数来看,可以确定克山病患者的血磷值较高。
《证券理论与实务》模块八考试精要(证券市场基础知识)模块八考试精要一、单项选择题1、涉及证券市场的法律、法规第一个层次是指()。
A、法律B、行政法规C、厂纪厂规D、部门规章2、涉及证券市场的法律、法规第二个层次是指()。
A、法律B、行政法规C、厂纪厂规D、部门规章3、涉及证券市场的法律、法规第三个层次是指()。
如何使用SPSS进行独立样本T检验
使用“住房状况调查”数据,对不同性别、户口状况的居民现住面积进行独立样本T检验并解释其结果。
答:对不同性别的居民现住面积进行独立样本T检验:①SPSS操作:第一步:点击“分析”、依次选择“比较平均值”、“独立样本T检验”;第二步:将“现住面积”选入“检验变量”,“性别”选入“分组变量”,在点击“定义组”,在“组1”中键入1,在“组2”中键入2,点击“继续”、“确定”。
②结果输出:③结果解读:先用F检验对不同性别的居民现住面积的方差是否向相等加以验证,然后利用t检验对不同性别的居民现住面积的均值是否存在差异进行检验。
从独立样本检验输出图中可以看到:F统计量为1.598,p值为0.206,在显著性水平0.05下,p值大于0.05,不拒绝原假设,即认为不同性别的居民现住面积的方差相等,没有差别。
由于不同性别的居民现住面积的方差没有差别,t检验将看假定等方差一栏。
t统计量为2.982,p值为0.003,在显著性水平0.05下,p值小于0.05,拒绝原假设,即认为不同性别的居民现住面积的均值有显著性差异。
对不同户口状况的居民现住面积进行独立样本T检验:④SPSS操作:第一步:点击“分析”、依次选择“比较平均值”、“独立样本T检验”;第二步:将“现住面积”选入“检验变量”,“户口状况”选入“分组变量”,在点击“定义组”,在“组1”中键入1,在“组2”中键入2,点击“继续”、“确定”。
⑤结果输出:⑥结果解读:先用F检验对不同户口状况的居民现住面积的方差是否向相等加以验证,然后利用t检验对不同户口状况的居民现住面积的均值是否存在差异进行检验。
从独立样本检验输出图中可以看到:F统计量为5.966,p值为0.015,在显著性水平0.05下,p值小于0.05,拒绝原假设,即认为不同户口状况的居民现住面积的方差存在显著差异。
由于不同户口状况的居民现住面积的方差存在显著差异,t检验将看不假定等方差一栏。
t统计量为3.314,p值为0.001,在显著性水平0.05下,p值小于0.05,拒绝原假设,即认为不同户口状况的居民现住面积的均值有显著性差异。
SPSS均值比较与T检验
.
7
H 西0 南财经大学出版社
5.1 统计推断与假设检验
2、假设检验的几个概念 (4) 概率p值
SPSS16.0与统计数据分析
p值是当零假设正确时,观测到的样本信息出现的概率。 如果这个概率很小,以至于几乎不可能在零假设正确时出现 目前的观测数据时,我们就拒绝零假设。p值越小,拒绝零假 设的理由就越充分。但怎样的p值才算“小”呢?通常是与预 先设定的显著性水平 值比较,若 值为0.05,p值小于0.05则 认为该概率值足够小,应拒绝零假设。
.
8
H 西0 南财经大学出版社
5.1 统计推断与假设检验
SPSS16.0与统计数据分析
3、假设检验的基本步骤
➢第1步 给出检验问题的原假设;
根据检验问题的要求,将需要检验的最终结果作为零假 设。例如,需要检验某学校的高考数学平均成绩是否同往年 的平均成绩一样,都为75,由此可做出零假设,H0 :75
④配对样本T检验(Paired-Sample T Test),用于检 验两个相关的样本是否来自具有相同均值的总体。
.
4
H 西0 南财经大学出版社
5.1 统计推断与假设检验
SPSS16.0与统计数据分析
2、假设检验的几个概念
(1)统计假设
➢ 原假设:在很多情况下,我们给出一个统计假设仅仅是
为了拒绝它。例如,如果我们要判断给定的一枚硬币是
.
3
西南财经大学出版社
5.1 统计推断与假设检验
SPSS16.0与统计数据分析
1、参数检验
①均值比较(Means),用于计算指定变量的 综合描述统计量;
Compare Means子菜单
②单样本T检验(One-Sample T Test),检验单个 变量的均值与假设检验值之间是否存在差异;
实验六——平均数分析与T检验
5.1.2 假设检验的基本思想
•
5.1.3 假设检验的基本步骤
依据假设检验的基本思想,假设检验可以总结 成为以下四大基本步骤: 第一,提出原假设(记为H0)。 • 即根据推断检验的目的,对待推断的总体参 数或分布提出一个基本假设。 第二,选择检验统计量。 • 在假设检验中,样本值(或更极端值)发生 的概率并不直接由样本数据得到,而是通过计算检 验统计量观测值发生的概率而间接得到。这些检验 统计量服从或近似服从某种已知的理论分布。对于 不同的假设检验问题以及不同的总体条件,会有不 同的选择检验统计量的理论、方法和策略。
定义两总体的标识值
框中输入一个数字,大于 等于该值的对应一个总体 ,小于该值的对应另一个 总体
•
本市户口和外地户口的家庭人均住房面积的样 本平均值有一定的差距。
结论
• • •
分析结论应通过两步完成: 第一步,两总体方差是否相等的F检验。 该检验的F统计量的观察值为65.469,对应 的概率P-为0.00。如果显著性水平a为0.05,由 于概率P-小于0.05,可以认为两总体的方差有显 著差异。 • 第二步,两总体均值的检验。 • t统计量的观测值为-3.369,对应的双尾概率 P-值为0.001.如果显著性水平a为0.05,由于概 率P-小于0.05,因此认为两总体的均值有显著地 差异,及本市户口的家庭人均住房面积的平均值存 在显著差异。
统计方法
描述统计
推断统计
估计
假设检验
参数检验
非参数检验
• 假设检验的基本思路是首先对总体参数提出假设,
然后再利用样本告之的信息去验证先前提出的假设 是否成立。 • 如果样本数据不能够充分证明和支持假设, 则在一定的条件下,应拒绝假设;相反,如果样本 数据不能够充分证明和支持假设是不成立的,则不 能推翻假设成立的合理性和真实性。 • 上述假设检验推断过程所依据的基本信念是 小概率原理,即发生概率很小的随机事件,在某一 次特定的实验中是几乎不可能发生的。
SPSS比较均独立样本T检验案例解析
SPSS-比较均值-独立样本T检验案例解析2011-08-26 14:55在使用SPSS进行单样本T检验时,很多人都会问,如果数据不符合正太分布,那还能够进行T检验吗?而大样本,我们一般会认为它是符合正太分布的,在鈡型图看来,正太分布,基本左右是对称的,一般具备两个参数,数学期望和标准方差,即:N(p, Q)如果你的样本数非常少,一般需要进行正太分布检验,检验的方法网上很多,我就不说了下面以“雄性老鼠和雌性老鼠分别注射了某种毒素,经过观察分析,进行随机取样,查看最终老鼠是否活着。
问题:很多人认为,雄性老鼠和雌性老鼠分别注射毒液后,雌性老鼠存活下来的数量会比雄性老鼠多?我们将通过进行统计分析来认证这个假设是否成立。
下面进行参数设置:a 代表:雄性老鼠b代表:雌性老鼠tim 代表:生存时间,即指经过多长时间后,去查看结果0 代表:结果死亡1 代表:结果活着随机抽取的样本,如下所示:打开SPSS- 分析---检验均值---独立样本T检验,如下图所示:将你要分析的变量,移入右边的框内,再将你要进行分组的变量移入“分组变量”框内,“组别group()里面的两个参数,不能够随意设置,必须要跟样本里面的数字一致点击确定后,分析结果,如下所示:从组统计量可以看出,雄性老鼠的存活下来的均值为0.73,但是雌性老鼠存活下来的均值为1.00,很明显,雌性老是存活下来的个数明显比雄性老鼠多,但是一般我们不看这个结果,为什么?因为样本不够大,如果将样本升至10000个?也许这个均值将会发生变化,不具备统计学意义,我们一般只看独立样本检验的结果。
独立样本检验,提供了两种方法:levene检验和均值T检验两种方法Levene检验主要用来检验原假设条件是否成立,(即:假设方差相等和方差不相等两种情况)如果SIG>0.05,证明假设成立,不能够拒绝原假设,如果SIG<0.05,证明假设不成立,拒绝原假设。
进行levene检验结果判断是第一步,从上图,可以看出 sig<0.05 方差相等的假设不成立,所以看第二行,方差不相等的情况sig=0.082>0.05 即说明 P 值大于显著性水平,不应该拒绝原假设:即指:雌性老鼠和雄性老鼠在注射毒液后,存活下来的个数没有显著的差异本次分析的结果,不支持,很多人认为的:雄性老鼠和雌性老鼠分别注射毒液后,雌性老鼠存活下来的数量会比雄性老鼠多的结论。
SPSS第5章 平均数比较
5.3.2 单一样本T检验过程选择
• 顺序单击“Analyze”→“Compare Means”→“One Sample T test”命令,可打开图5.3的对话框。“Test Variable”框中的变量是需要作检验的变量,要从源变 量框中选取某个变量进入该框,然后单击向右的箭头, 再在“Test Value”参数框中输入一个定值作为假设检 验值(总体参数)。 • “Options”对话框将给出置信水平“Confidence Interval”和缺失值“Missing Value”处置方式。置信水 平必须在1-99之间,如90、95,99等(一般取95)。 缺失值的处置方式一般有两种(图5.4):一种是只 要变量中含有缺失值,该组样本都被剔除(Exclude cases Listwise);另一种是尽可能保留样本,仅剔除 被分析变量的那个变量中含有缺失值的Cases。
•1、统计检验中的假设条件
•假设是进行检验的前提,是有待确认的一种事实。例 如,某样本是否满足正态分布,两样本平均数是否源 于同一总体等等。
•假设检验中,首先要建立一个关于总体参数的假设(原 假设),然后抽取样本,检验所做假设正确与否。在进行 研究时,往往需要根据已有的理论和经验,事先对研究结 果作出一种预想希望能证实的一种假设。这种假使叫科学 假设或被择假设,记为H1;而要对总体的某种假设(论断) 作出判断时,常要对相反的假设进行统计检验,称这个假 设为零假设(或虚无假设、无偏假设),记作H0。进行假 设检验的目的是为了推翻假设,主要是推翻假设时的犯错 误概率容易把握,而承认假设正确的概率不容易把握。 •假设建立得合适与否是决定检验成败的关键,统计中的 假设检验有两个基本要求。第一,建立假设的目的是为了 推翻原假设,因为推翻假设远远比承认原假设容易,因此, 真正需要证明的往往作为备择假设,即使不能推翻原假设, 也只能说,没有足够的证据推翻原假设。第二,原假设必 须是虚无(无显著性差异)假设,即必须包括等号,因为 所有的统计分析、统计计算都建立在这个基础之上;而备 择假设一定不能包含等号。
第5章-SPSS均值比较、T检验和方差分析
本例中大于相伴概率0.461,大于显著水 平0.05,不能拒绝方差相等的假设,可 以认为两个学校学生数学成绩方差无显 著差异;
在方差相等时看T检验结果,T检验值等 于相伴概率0.423,大于显著水平0.05,不 能拒绝T检验的零假设,可以认为两个学 校学生数学平均成绩无显著差异。
多重比较
3个组之间的相伴概率都小于显著水平0.05, 说明3个组之间都存在显著差别
作业3 方差分析
某百货公司的营销部根据不同家庭的价 值观细分了女性服装市场,分为保守型 、传统型和潮流型,另外调查了不同类 型家庭收入,见下表(单位:千元)。 能否推断出不同类型的家庭的收入是否 存在明显不同?
保守型家庭收入
一、Means过程
Means过程是按用户指定条件,对样本进 行分组计算均值和标准差。
计算公式:
n
x1i
x1
i 1
n
例1
以下是某个班同学的数学成绩,比较不同性别 同学的数学成绩平均值和方差。
性别 male female
数学 99 79 59 89 79 89 99 88 54 56 23 70 80 67
作业
一家企业生产某种产品,随机抽取50 名工人,分成两个组,每组25名工人, 用A方法生产所需时间:
6.8
5
7.9
5.2
7.6
6.1
6.2
7.1
4.6
6
6.4
6.1
6.6
7.7
6.4
5
5.9
5.2
6.5
7.4
7.1
6.1
5
6.3
7
作业
用B方法生产所需时间:
5.2
6.7
SPSS均值检验(均数分析单样本T检验独立样本T检验)
SPSS均值检验(均数分析单样本T检验独⽴样本T检验)在统计学中,我们往往从样本的特性推知随机变量总体的特性。
但由于总体中个体之间存在差异,样本的统计量和总体的参数之间往往会有误差。
因此,均值不相等的样本未必来⾃不同分布的总体,⽽均值相等的样本未必来⾃有相同分布的总体。
也就是说,如何从样本均值的差异推知总体的差异,这就是均值⽐较的内容。
SPSS提供了均值⽐较过程,在主菜单栏单击“Analyze”菜单下的“Compare Means”项,该项下有5个过程,如图4-1。
平均数⽐较Means过程⽤于统计分组变量的的基本统计量。
这些基本统计量包括:均值(Mean)、标准差(Standard Deviation)、观察量数⽬(Number of Cases)、⽅差(Variance)。
Means过程还可以列出⽅差表和线性检验结果。
[例⼦]调查了棉铃⾍百株卵量在暴⾬前后的数量变化,统计暴⾬前和暴⾬后的统计量,其数据如下:暴⾬前 110 115 133 133 128 108 110 110 140 104 160 120 120暴⾬后 90 116 101 131 110 88 92 104 126 86 114 88 112该数据保存在“DATA4-1.SAV”⽂件中。
1)准备分析数据在数据编辑窗⼝输⼊分析的数据,如图4-2所⽰。
或者打开需要分析的数据⽂件“DATA4-1.SAV”。
图4-2 数据窗⼝2)启动分析过程在SPSS主菜单中依次选择“Analyze→Compare Means→Means”。
出现对话框如图4-3。
图4-3 Means设置窗⼝3)设置分析变量从左边的变量列表中选中“百株卵量”变量后,点击变量选择右拉按钮,该变量就进⼊到因⼦变量列表“Dependent List:”框⾥,⽤户可以从左边变量列表⾥选择⼀个或多个变量进⾏统计。
从左边的变量列表中选中“调查时候”变量,点击“Independent List”框左边的右拉按钮,该变量就进⼊分组变量“IndependentList”框⾥,⽤户可以从左边变量列表⾥选择⼀个或多个分组变量。
spss教程第二章--均值比较检验与方差分析
第二章均值比较检验与方差分析在经济社会问题的研究过程中,常常需要比较现象之间的某些指标有无显著差异,特别当考察的样本容量n比较大时,由随机变量的中心极限定理知,样本均值近似地服从正态分布。
所以,均值的比较检验主要研究关于正态总体的均值有关的假设是否成立的问题。
◆本章主要内容:1、单个总体均值的 t 检验(One-Sample T Test);2、两个独立总体样本均值的 t 检验(Independent-Sample T Test);3、两个有联系总体均值均值的 t 检验(Paired-Sample T Test);4、单因素方差分析(One-Way ANOVA);5、双因素方差分析(General Linear Model Univariate)。
◆假设条件:研究的数据服从正态分布或近似地服从正态分布。
在Analyze菜单中,均值比较检验可以从菜单Compare Means,和General Linear Model得出。
如图2.1所示。
图2.1 均值的比较菜单选择项§2.1 单个总体的t 检验(One-Sample T Test)分析单个总体的 t 检验分析也称为单一样本的 t 检验分析,也就是检验单个变量的均值是否与假定的均数之间存在差异。
如将单个变量的样本均值与假定的常数相比较,通过检验得出预先的假设是否正确的结论。
例1:根据2002年我国不同行业的工资水平(数据库SY-2),检验国有企业的职工平均年工资收入是否等于10000元,假设数据近似地服从正态分布。
首先建立假设:H0:国有企业工资为10000元;H1:国有企业职工工资不等于10000元打开数据库SY-2,检验过程的操作按照下列步骤:1、单击Analyze →Compare Means →One-Sample T Test,打开One-Sample T Test 主对话框,如图2.2所示。
图2.2 一个样本的t检验的主对话框2、从左边框中选中需要检验的变量(国有单位)进入检验框中。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
SPSS 提供了计算指定变量的综合描述统计 量的过程和对均值进行比较检验的过程:( :(1) 量的过程和对均值进行比较检验的过程:( ) 用于计算变量的综合统计量的Means 过程 用于计算变量的综合统计量的 [Analyze]=>[Compare Means]=>[Means] (2)用于单独样本的 检验过程 )用于单独样本的t [Analyze]=>[Compare Means]=>[OneSample T Test]
假设检验中的几个基本概念
1.原假设与备择假设 原假设与备择假设 2.两类错误 两类错误 3.检验统计量 检验统计量 4.拒绝域与临界值 拒绝域与临界值 5.显著性水平 显著性水平
例:一种零件的生产标准是直径应为10cm, 一种零件的生产标准是直径应为 , 为对生产过程进行控制, 为对生产过程进行控制,质量监测人员定期 对一台加工机床检查,确定这台机床生产的 对一台加工机床检查, 零件是否符合标准要求。 零件是否符合标准要求。如果零件的平均直 径大于或小于10cm,则表明生产过程不正常, 径大于或小于 ,则表明生产过程不正常, 必须进行调整。 必须进行调整。试陈述用来检验生产过程是 否正常的原假设和备择假设。 否正常的原假设和备择假设。 解:建立的原假设和备择假设为 H0 : u=10cm H1 : u≠10cm 10cm
例2、某省大学英语四级考试的平均成绩为 、 65分,现从某校随机抽取 份试卷,其分数 份试卷, 分 现从某校随机抽取20份试卷 为:72 76 68 78 62 59 64 85 70 75 61 74 87 83 54 76 56 66 68 62。问该校英语水平 。 与全区是否基本一致。其中, 与全区是否基本一致。其中,显著性水平为α =0.05 。
练习题
利用住房状况调查数据, 利用住房状况调查数据,推断家庭人均住房 面积的平均值是否为20平方米 其中, 平方米。 面积的平均值是否为 平方米。其中,显著 性水平为α =0.05。 。 利用保险公司人员构成的数据,推断35岁以 利用保险公司人员构成的数据,推断 岁以 下年轻人所占比例的平均值与0.5有无显著差 下年轻人所占比例的平均值与 有无显著差 异。推断具有大专及其以上教育水平的员工 的平均比例是否不低于0.8。其中, 的平均比例是否不低于 。其中,显著性水 。 平为α =0.05。
SPSS 的输出结果中给出了相应检验统计量 的实际取值, 的实际取值,但由于显著性水平根据不同要 求而有所不同, 并不给出临界值。 求而有所不同,SPSS 并不给出临界值。如 果不查概率表, 果不查概率表,就无法直接采用上面的步骤 进行检验。 进行检验。 SPSS 给出了检验统计量的概值即文献中常 见的p ),或称为相伴概率 见的 值(p-value),或称为相伴概率。利 ),或称为相伴概率。 值就可以直接进行检验。 用p 值就可以直接进行检验。p 值是在零假设 成立的情况下, 成立的情况下,检验统计量的取值等于或超 过检验统计量的实际值的概率,从而p 过检验统计量的实际值的概率,从而 值即 为否定零假设的最低显著性水平。 为否定零假设的最低显著性水平。p 值经常 被称为实际显著性水平, 被称为实际显著性水平,以区别于给定的显 著性水平α
为资料, 例1、以“Employee data.sav”为资料,计 、 为资料 算公司职工的平均受教育年数, 算公司职工的平均受教育年数,假定该地 区人口平均受教育年数为13年 现问, 区人口平均受教育年数为 年,现问,公 司职工文化程度是否等同于居民文化程度? 司职工文化程度是否等同于居民文化程度? 其中, 其中,显著性水平为α =0.05
Analyze Compare Means One Sample T test
在“Test Variables”选项框中输入需要检验 选项框中输入需要检验 的变量。 的变量。 输入一个值作为假设检验值。 在“Test Value”输入一个值作为假设检验值。 输入一个值作为假设检验值 Options”对话框中 对话框中, 在“Options”对话框中,还可以输出置信区 一般取为90%,95%,99%等。以及缺 间,一般取为 , , 等 失值的处置方式。 失值的处置方式。
N一定,不能同 一定, 一定 时减少两类错误 !
β α
拒绝域与临界值
假设检验的目的在于判断样本统计量与假设的 总体参数之间的差异。 总体参数之间的差异。不同的抽样方法对应着不同 的标准。 的标准。显著性水平就是用来判断接受和拒绝原假 表示。 设的标准, 设的标准,通常用α 表示。 1. 在一次试验中,一个几乎不可能发生的事件发生 在一次试验中, 的概率为零。 的概率为零。 2. 在一次试验中小概率事件一旦发生,我们就有理 在一次试验中小概率事件一旦发生, 由拒绝原假设。 由拒绝原假设。 3. α 由研究者事先确定。 由研究者事先确定。
假设检验的步骤
1.根据具体问题的要求,建立原假设H0和备择假 .根据具体问题的要求,建立原假设H 设H1。 2.选择一个合适的检验统计量,它应与原假设有 .选择一个合适的检验统计量, 而且当原假设H 为真时统计量的分布已知。 关,而且当原假设H0为真时统计量的分布已知。 3.给定显著性水平α ,当原假设H0为真的,求出 当原假设H 为真的, . 临界值。 临界值。 4.由样本观测值计算检验统计量的数值 按检验规 .由样本观测值计算检验统计量的数值,按检验规 对原假设作出拒绝或接受的判断。 则,对原假设作出拒绝或接受的判断。 当总体标准差未知时一般采用T分布检验 分布检验; 注:当总体标准差未知时一般采用 分布检验;当 总体标准差已知时一般采用正态分布检验。 总体标准差已知时一般采用正态分布检验。
2、单一样本T检验 、单一样本 检验
单样本T检验是指样本平均与总体平均 单样本 检验是指样本平均与总体平均 数的差异检验。样本平均数( 数的差异检验。样本平均数( x )与总体 平均数µ往往大小不一 往往大小不一, 平均数 往往大小不一 , 这差异是由于抽 样误差造成,还是本质性误差—样本根本 样误差造成,还是本质性误差 样本根本 不是来源于该总体。如果差异显著, 不是来源于该总体。如果差异显著,则认 为样本平均数与总体平均数µ的差异已不 为样本平均数与总体平均数 的差异已不 能完全认为是抽样误差了。 能完全认为是抽样误差了。
假设检验中的两类错误
1. 弃真错误) 第Ⅰ类错误(弃真错误 类错误 弃真错误 原假设为真时拒绝原假设 第Ⅰ类错误的概率记为α α被称为显著性水平 类错误(取伪错误 取伪错误) 第Ⅱ类错误 取伪错误 原假设为假时未拒绝原假设 第Ⅱ类错误的概率记为β
2.
两类 错误的关系
α和β 的关系就像 翘翘板, 翘翘板,α小β 就 大, α大β 就小
例3、某企业生产的零件直径服从正态分布, 、某企业生产的零件直径服从正态分布, 从中抽取5件测得直径分别为 件测得直径分别为: 从中抽取 件测得直径分别为:22.3,21.5, , , 22.0,21.8,21.4。问零件的平均直径是否 , , 。 为21。其中,显著性水平为α =0.05 。 。其中,
当p < α时,意味着如果给定一个真实的零假设, 意味着如果给定一个真实的零假设, 那么检验统计量的取值等于或超过实际观察到的 极端值的概率为α 。大多数学者都把这一结果解释 为支持你否定零假设而接受替代假设的证据。 为支持你否定零假设而接受替代假设的证据。有 学者称p值为 值为“ 学者称 值为“实验使零假设相信者感到吃惊的程 度的度量” 值越小, 度的度量”。 p值越小,零假设相信者吃惊的程度 值越小 越高。 越高。 为了便于记忆,我们可以把p 为了便于记忆,我们可以把p 值理解为零假设的支 持率或可信程度。 我们拒绝零假设, 持率或可信程度。当p < α时, 我们拒绝零假设, 如在0.05的显著水平下,如果 <0.05,我们就可 的显著水平下, 如在 的显著水平下 如果p , 以否定零假设。 以否定零假设。 p 在进行单侧检验时, 的大小。 在进行单侧检验时,需要比较 和 α的大小。
数据统计分析软件—— 数据统计分析软件—— SPSS
五、平均数比较与T检验 平均数比较与 检验
假设检验是非常重要的一类统计推断问题。 假设检验是非常重要的一类统计推断问题。假 设检验技术不仅可以对总体分布的某些参数, 设检验技术不仅可以对总体分布的某些参数,而且 也可以对总体本身的分布做出假设, 也可以对总体本身的分布做出假设,通过对样本的 统计分析来判定该假设是否成立, 统计分析来判定该假设是否成立,从而对总体分布 给以进一步的确认。 给以进一步的确认。 已知样本来自正态总体, 如:已知样本来自正态总体,是否有理由说它 的正态总体;再如, 是来自均值为 µ0 的正态总体;再如,已知两个相互 独立的样本,分别来自两个正态总体, 独立的样本,分别来自两个正态总体,能否说这两 个总体均值相同或方差相同。 个总体均值相同或方差相同。
3、两独立样本平均数差异T 检验
独立样本(Independent Sample)是指两个样 独立样本(Independent Sample)是指两个样 本彼此独立,没有任何关联。例如实验组与控 本彼此独立,没有任何关联。 制组、男生组与女生组、高收入组与低收入组、 制组、男生组与女生组、高收入组与低收入组、 大学数学系与物理系等。 大学数学系与物理系等。利用来自两个总体的 独立样本, 独立样本,推断两个总体的均值是否存在显著 差异。 差异。 两个独立样本均值之间差异用T 统计量进行 检验。 检验。
统计量观测值为t=3.71,自由度为 , 统计量观测值为 df=473,双尾概率 值为 双尾概率P值为 双尾概率 值为Sig=0.000< α ,拒 绝原假设,平均受教育年数不等于13年 绝原假设,平均受教育年数不等于 年。 实际上, 实际上,样本平均数与总体平均数的差 异为0.492,以95%的可靠性估计平均数在 异为 , 的可靠性估计平均数在 确实不包含13。 (13.23,13.75)之间 确实不包含 。 , )之间,确实不包含