SPSS数据分析教程-均值的比较
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
单样本T检验
选择【分析】→【比较均值】→【单样本T检 验】
单样本T检验结果
机器号 t 1 刹车片直径(mm) -.533 2 刹车片直径(mm) 5.336 3 刹车片直径(mm) -.655 4 刹车片直径(mm) -2.613 5 刹车片直径(mm) 1.847 6 刹车片直径(mm) 1.134 7 刹车片直径(mm) 2.650 8 刹车片直径(mm) -1.713 15 15 15 15 15 15 15 15 df Sig.(双侧) .602 .000 .522 .020 .085 .274 .018 .107 均值差值 -.0014858 .0142629 -.0017174 -.0045649 .0042486 .0024516 .0061813 -.0033014 差分的 95%置信区间 下限 -.007413 .008566 -.007302 -.008289 -.000655 -.002154 .001210 -.007409 上限 .004459 .019960 .003868 -.000841 .009152 .007058 .011153 .000806
单样本T检验 实例分析:
1、交通通勤时间 根据一份公共交通调查报告发现,对于那些在 一个城市乘车上下班的人来说,平均通勤时间 为19分钟,其人数总量为100万-300万。假设 一个研究者居住在一个人口240万的城市里, 想通过验证来确定通勤时间和其他城市平均水 平是否一致,于是他随机选取了26名通勤者作 为样本,收集的数据见5-1。若令显著性水平 为0.01,并假设通勤时间服从正态分布,这位 研究者能得到什么结论?
例子
打开数据文件brakes.sav,该数据为某工厂不 同机器生产的刹车片直径,已知符合质量标准 的刹车片直径应为322 mm,现在需要知道哪 些机器生产的刹车片直径不符合质量标准。
按照机器号拆分文件
需要对各个机器分别进行检验,因此需要根据 机器拆分该数据文件。打开数据文件 brakes.sav,选择【数据】→【拆分文件】
2、考试中的惊慌失措 许多学生都会在考试中遇到因为第一道题目特 别难而惊慌失措的不愉快经历,因此人们对考 试题目的安排进行了研究,以弄清它对焦虑的 影响。下面的分数是对测验焦虑的度量,有充 分的证据支持考试题目的安排对分数有影响这 一假设吗?见数据5-4
5.5配对样本T检验
两配对样本T检验用来检验来自两配对总体的 均值是否在统计上有显著性差异。常见的配对 设计方法有以下几种:
配对T检验操作
选择【分析】→【比较均值】→【配对样本T 检验(P)】
T检验结果解释
配对T检验注意事项
需要先检查两个样本是否服从正态分布。应用 直方图、Q-Q图或者K-S检验等方法来检验差 值变量的正态性。 分析变量中是否含有离群值。可以用箱图来检 查离群值的情况。 可以先计算配对样本的差值变量,然后进行单 样本的T检验。
作业
wk.baidu.com
P125 1-3
四、假设检验的步骤
1. 确定恰当的原假设和备择假设; 2. 选择检验统计量; 3. 计算检验统计量观测值发生的概率,即p 值; 4. 给定显著性水平 ,并作出决策。如果p< , 则拒绝原假设,反之,没有理由拒绝原假设。
5.2均值子菜单
一、均值过程
SPSS的均值过程是描述和分析尺度变量 (Scale)的一种有用的方法,可以获得需要 分析的变量的许多中心趋势和离散趋势的统计 指标,同时它可以对不同的组别或者交叉组别 进行比较。 均值过程可以计算一个或多个自变量类别中因 变量的子组均值和相关的单变量统计。也可以 从该过程获得单因素方差分析、eta 和线性相 关检验。
T分布和正态分布比较
t分 布 和 标 准 正 态 分 布 0.4 标准正态 t分 布 : n=3 t分 布 : n=10 t分 布 : n=26 0.35
0.3
0.25
密度函数值
0.2
0.15
0.1
0.05
0 -4
-3
-2
-1
0 x
1
2
3
4
在大样本情况下,T分布和正态分布密度函数 十分接近 在大样本情况下,T检验和U检验是等价的
在“层1的1”框中,yrsscale; 单击【下一张】,把position变量选入“层2的2”框中。
两因素的均值分析报告
Anova和Eta
由于均值过程只对第一层的自变量进行方差分 析和线性相关检验,因此两个因素或者两个以 上因素的均值分析过程的方差分析结果和单因 素一样。不同的是描述性统计量,多因素的描 述性统计量是对于各个交叉组别进行统计。
两独立样本T检验的前提条件
独立性:两样本所来自的总体互相独立。 正态性:样本来自的两个总体应服从正态分布。在样 本所来自的总体不满足正态性条件时,如果两个样本 的分布形状相似,它们的样本量相差不是太大并且样 本量较大,仍然可以应用T检验。 方差齐性:待比较的两个样本的方差相同。如果两个 组的样本量大致相等,略微偏离了方差齐性对检验结 果的精度影响不大。 在T检验中,SPSS提供了方差齐性的Levene检验, 当方差齐性不满足时,会提供方差齐性校正后的T检 验结果。
配对样本T检验实例分析:
1、看电视和读书的时间 每月读书俱乐部的成员进行了一项调查,假设 抽取了15人组成样本,得到了他们每周看电视 和读书的小时数,见数据5-5,能否得出其成 员用于看电视的时间是否比读书的时间多?
2、减肥药的效果 为了研究一种减肥药的效果,特抽取了20名试 验者进行试验,其服用该产品一个疗程前后的 体重变化见数据5-6。试用配对样本T检验的方 法判断该药物能否引起试验者体重的明显变化 ?
2、机票的折扣费 某个航班往返票的平均折扣费3月份是258元。 现随机抽取了4月份中15个往返机票的折扣费 作为一个简单随机样本,数据见5-2,请检验4 月份往返机票的折扣费是否有所增加?P值远 大于显著性水平0.05,接受零假设,即没有变 化。
5.4独立样本T检验
两独立样本是指两个样本所来自的总体相互独 立,两个独立样本各自接受相同的测量,研究 者或分析者的主要目的是分析两个独立样本的 均值是否有显著的统计差异 比较女性和男性的身高,教育从业者和金融从 业者的起始工资等,都是两独立样本的例子。
第一类错误:原假设正确,而错误地拒绝了它,即“拒真” 的错误,其发生的概率为犯第一类错误的概率。 第二类错误:原假设不正确,而错误地没有拒绝它,即“受 伪”错误,其发生的概率为犯第二类错误的概率。
三、显著性值
假设检验一般先对总体的比例、均值或分布做 出某种假设,称为原假设;然后计算在该假设 成立条件下出现该事件的概率,称为p值,或 显著性值。 如果小概率事件发生了,即 p< ,则表明样本 不支持原来的假设,应拒绝原假设而接受备择 假设;如果该事件发生的概率(或可能性)较 大,即 p> ,则不拒绝原假设。我们用 来 控制犯第一类错误的概率,即该类错误的概率 最大为 。
二、均值过程分析
本书数据文件HourlyWage.sav是对护士工资 的调查,它调查了不同岗位的护士,记录了他 们的小时工资、工作经验、年龄等指标。应用 SPSS的均值过程分析护士的小时工资、工作 经验和工作位置之间的关系。
三、均值方法操作
【分析】→【比较均值】→【均值】
均值:选项
四、双因素的均值过程分析
同一受试对象处理前后的数据,例如服用某种药物 前和服用之后的血压变化; 同一受试对象两个部位的数据, 同一样本用两种方法测量的数据; 配对的两个受试对象分别接受两种处理后的数据。
两配对样本T检验的前提条件
两样本应是配对的。即受试对象的年龄、性别、 体重等非处理因素都相同或相似; 两个样本所来自的总体应服从正态分布(大样 本情况下,T检验较为稳健)
反证法及小概率原理。所谓反证法及小概率原理即 首先在原假设正确的条件下计算出现该样本或者样 本统计量的概率,如果这种事件发生的概率很小, 譬如小于5%,那么就拒绝原来的假设,而接受备 择假设。
二、两类错误
“小概率事件在一次试验中几乎不会发生” ,但是小 概率事件并非是不可能发生,只是其发生的概率很小, 并不能完全排斥其发生的可能性。 因而假设检验有可能犯两类错误:
动手练习
数据文件GSS2004_Mod.sav中记录了男性或 者女性每周上网浏览网页的时间(变量 WWWHR,单位小时)和每天观看电视的时 间(变量TVHOURS,单位小时)。用本章学 习的技巧分析男性和女性在观看电视的时间和 上网的时间上分别就什么区别。
本章小结
本章主要介绍均值过程,它给出变量的描述性 统计量,同时可以给出相应总体的均值是否相 等的判断。 本章的重点内容为比较各组总体之间是否有统 计上的差异,它包含单样本的T检验、独立样 本的T检验和配对样本的T检验。在应用T检验 进行均值比较之前,需要进行数据的初步分析, 判断应用T检验的前提条件是否满足。另外, 需要对T检验的结果进行详细的分析,得出合 理的结论。
案例分析
数据文件creditpromo.sav记录了接受不同促销 方案的用户信用卡消费数据,现在需要检验新 的促销方法是否能促进信用卡的消费,以此决 定是否继续推进这种新促销方式。 目的是比较采用新促销方法的信用卡消费金额 均值和标准促销方法的信用卡消费金额均值, 看二者是否在统计上有显著的差异。
5.3单样本T检验
单样本T检验即检验某个变量的总体均值和某指定值 之间是否存在着显著性差异。 如果是大样本的单样本检验,统计教科书上称为U检 验,它采用服从正态分布的U统计量作为检验统计量; 如果是小样本并且样本服从正态分布,则采用服从t分 布的t统计量进行单样本T检验; 否则,采取非参数检验。T检验稳健性(Robust)较 好,如果样本分布偏离正态分布不太严重,也可采用 T检验。
案例分析
数据文件dietstudy.sav包含对“Stillman diet” 的研究结果。医生为检验某种饮食方案是否对 有家庭心脏病史的病人有效,对16个病人进行 了了试验,记录他们在实行饮食方案前后的体 重(磅)以及甘油三酸酯的水平 (mg/100ml)。 采用T检验对该饮食方案的效果进行分析。
均值的比较
—《SPSS数据分析教程》
学习目标
掌握假设检验的基本思想 掌握均值过程和输出结果的解释 掌握单样本T检验方法、应用条件和输出结果 掌握独立样本T检验方法、应用条件和输出结 果 掌握配对样本T检验方法、应用条件和输出结 果
5.1假设检验的基本思想
一、假设检验的基本思想
假设检验的思想
探索性分析
先对两种促销方式的客户消费数据进行描述性 统计分析,初步探索两种不同的促销邮件下的 客户花费情况。
正态性检验
设置正态性检验
正态性检验表
T检验
选择【分析】→【比较均值】→【独立样本T 检验】
两独立样本T检验实例分析:
1、机场等级分数比较 国际航空运输协会对商务旅游人员进行了一项 调查,以便确定多个国际机场的等级分数,最 高10分,分数越高,等级越高。假设随机选取 了两组商务旅游人员各50人,给两个机场打分 ,请判断这两个机场的等级是否相同?见数据 5-3