第8讲 差异显著性检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5)确定设置和输出结果 所有设置确定无误后,点击“确定”按钮,输出分析结 果。
3. SPSS分析结果解读
独立双样本T检验的SPSS输出结果比较简单,仅包含描述 统计和T检验两个输出结果表。 描述性统计量性别
住宿的环境卫 生 住宿的舒适性 住宿的价格 男性 女性 男性 女性 男性 N 204 198 204 198 204 均值 3.4118 3.2626 3.4853 3.2576 3.0098 标准差 .74745 .77507 .71216 .72610 .85955 均值的标准误 .05233 .05508 .04986 .05160 .06018
1.964
400
.14914
.07594 -.00015
.29842
1.963 398.256
.050
.14914
.07598 -.00023
.29851
方差方程的 Levene检验
均值方程的t检验
差分的95%置信 区间
F 假设 方差 相等 假设 方差 不相 等 .830 .363 3.174 399.030 .002 .22772 .07176 .08665 .36879 Sig. t df Sig. (双 侧) .002 均值 差值 .22772 标准 误差值 .07174 下限 上限
零假设是待检验的假设,如果待检验的假设不成立,那么 其对立假设就成立。
2.假设检验的两类错误
第一类错误: 也称为弃真错误,是指零假设H0实际上是真 实的,而检验结果却拒绝了它。出现第一类错误的概率是 显著性水平α ,因此犯第一类错误的概率是可以控制的。 第二类错误:也称为取伪错误,是指零假设H0实际上是不 真实的,而检验结果却接受了它。第二类错误的概率用β 表示。 总体情况 检验结果 零假设H0为真 对立假设H1为真 接受H0 拒绝H0 判断正确 第一类错误 第二类错误 判断正确
显著性水平值α定得越大,拒绝域就越大,就越不容易接 受原假设,反之,显著性水平值定得越小,拒绝域就越小, 就越容易接受原假设。因此,在统计检验的问题中,要注 意α值的确定问题。
使用统计软件进行假设检验,在输出的结果中,会出现P 值(Sig.),P值是判断检验结果的另一个衡量标准,是 进行检验决策的另一个依据。P值是拒绝零假设的最小值。 当P≤α时,拒绝H0,表明样本均值存在显著差异; 当P> α时,接受H0,表明样本均值不存在显著差异。
• (二)范例详析:
在广泛查阅国内有关游客满意度研究文献的基础上,并考 虑研究区的实际情况,从旅游六大要素的吃、住、行、游、 购、娱和服务所对应的“饮食、住宿、交通、资源、购物、 娱乐、服务”7个构面选择23个评价指标构建Likert 5点 量表,按非常不满意、不满意、一般、满意、非常满意5 个级别分别赋以1~5分值。将所编制的量表作为一项重要 内容编入“旅游景区游客满意度调查问卷”,用于实地调 查。 2010年8月调查组利用该问卷深入白水洋景区进行实地调 查,问卷调查遵循随机抽样原则,并现场直接回收。共发 放问卷491份,并全部回收。通过事后对问卷的检查整理, 发现无效问卷89份,共获得有效问卷402份,占发放问卷 总数的81.87%。
t
X1 X 2
2 (n1 1) S12 (n2 1) S 2 n1 n2 2
1 1 n n 2 1
~ t (n1 n2 2)
统计量t服从自由度为(n1+n2-2)的t分布。 X 1 和 X 2 分别为两组样本的均值,n1和n2分别为两 式中, 2 2 S 组样本的个数,S1 和 2 分别为两组样本的方差。
variable)。 如不同性别的游客对某景区提供的住宿条件的满意度存在 显著差异,这里视性别为自变量,满意度为因变量,即认 为这种满意度的差别是因为性别的不同引起的。 因变量 类别变量 连续变量 自变量(类别变量) 卡方检验 t检验、方差分析
二、独立样本T检验
(一)基本原理
当自变量为间断(类别)变量,因变量为连续变量时,常 使用T检验与方差检验进行有关分析。 SPSS软件提供的T检验有3种形式,分别是单样本T检验 (One-Sample T Test),独立样本T检验(Independent -Sample T Test)和成对样本T检验(Paired-Sample T Test)。 在旅游研究中,比较常用的是独立样本T检验,因而本章 仅讨论独立样本T检验。独立样本T检验在一些教科书中 被称为独立双样本T检验,顾名思义,其显然仅适用于自 变量为两组的情况。如考虑不同性别的游客心理感知差异 时,由于性别只有男女两组,此时应该采取独立样本T检 验方法进行有关检验。
4.假设检验的步骤
(1) 提出假设。
H 0 : 1 2
H1 : 1 2
(2) 选取检验统计量,并在原假设H0成立的条件下计算统计 量的值。 (3) 对于给定的显著性水平α ,决定临界值。 α的取值范围为α≤0.01,α≤0.05和α≤0.10,一般情况下, 常用α≤0.05。 当α≤0.05时,差异显著,当α≤0.01时,差异极显著。 (4) 对假设做出判断。 通过对计算获得的统计量与临界值的比较,作出接受或 拒绝零假设的决定。
2 S12 S 2 n n 1 2
也就是说,独立双样本T检验,首先必须先检验双样本的 方差是否相等,这是选择统计量进行双样本T检验的基 础,方差是否相等需要采用F检验,其统计量的计算式为:
S12 F 2 ~ F (n1 1, n2 1) S2
服从自由度为(n1-1, n2-1)的F分布。
2 2 2. 两总体方差 1 和 2 未知,但它们不相等。
此时属于两样本异方差的T检验,其t统计量的计算式为:
t X1 X 2
2 S12 S 2 n1 n2
其自由度为:
k (1 k ) df n 1 n 1 2 1
2
2
1
其中:
S12 k n1
显著差异?
要回答这些问题,我们最好先提出有关假设 。
1. 零假设和对立假设
如:我们假设不同性别的游客对某一景区提供的住宿条 件的满意程度不存在显著差异,我们以H0代表这个假 设,H0就称为“零假设”(null hypothesis)(也称为 “原 假设”或“虚无假设”)。 其对立面,不同性别的游客对某一景区提供的住宿条件的 满意程度存在显著差异,通常以H1代表,称为 “对立假 设” (alternative hypothesis)( 也称为“备择假设”)。
福建白水洋景区游客满意度评价指标
序号与题项
01 食物的新鲜程度 02 食物的特色 03 食物的卫生程度 09 交通的舒适性 10 交通的安全性 11 自然风光 17 商品质量 18 娱乐项目种类 19 娱乐项目创新性
04 食物的价格
05 住宿的环境卫生 06 住宿的舒适性
12 卫生环境
13 旅游形象 14 门票价格
一、假设检验 二、独立样本T检验 三、单因素方差分析
不同性别、不同年龄、不同教育背景、不同收入、 不同客源地的游客群体在旅游购物、游憩动机、 游憩满意度、乃至旅游影响感知等方面肯定存在 差异,但如果只探讨他们之间的微小差异是没有 意义的,我们需要了解的是他们在这些方面是否 存在显著差异。
差异显著性检验属于假设检验的范畴,因而必须 首先了解什么是假设检验(Hypothesis Testing)。
同时减少犯这两类错误的概率的唯一的方法是增大样本容 弃真错误和取伪错误的概率存在此消彼长的关系: 量,但这又是不现实的 当弃真错误的概率降低时,取伪错误的概率就会增加 因此,通常都是首先控制弃真错误的概率,即确定显著性 当取伪错误的概率降低时,弃真错误的概率就会增加 水平α
3.双侧检验和单侧检验
假设检验的两种形式 双侧检验 原假设H0 备择假设H1 µ= µ0 µ≠ µ0 单侧检验 µ≥ µ0 µ< µ0 µ≤µ0 µ> µ0
一、假设检验
(一)假设检验的基本原理
所谓假设,可以理解为是研究者对于某个有待解决的问题 所提出的暂时性或尝试性的答案。就差异显著性的假设检 验而言,其假设的陈述形式是一种差异式陈述方式。 例如: 不同性别的游客对某一景区提供的住宿条件的满意程度是 否存在显著差异? 不同收入的游客群体对某一景区自然风光的评价是否存在
2)选择进行“独立样本T检验”的变量 本例欲进行住宿条件满意度的差异性检验,所以从对话框 左侧的变量列表中选“住宿的环境卫生”、 “住宿的舒 适性”、 “住宿的价格”3个变量,使之进入右侧的“检 验变量(T)”框。
Leabharlann Baidu
3)设置分组变量 从对话框左侧的变量列表中选“性别”变量,使之进入右 侧的“分组变量(G)”框,继之点击“定义组(D)”, 在弹出的“定义组”对话框中,在“使用指定值(U)” 单选框的“组1(1)”栏输入1,在“组2(2)”输入2, 点击“继续”键,回到“独立样本T检验”窗口。割点 (C)单选框适合连续变量的情况,因而可以不用填写。 接着点击“继续”键,返回“独立样本T检验”对话框。
(1) 双侧检验 有两个临界值,两个拒 绝域,每个拒绝域的面积为 α ,原假设µ= µ0,只要 2 µ> µ0或µ<µ0有一侧出现, 就要拒绝原假设。 双侧检验按 α 查表求临界值。
2
(2) 单侧检验
有一个临界值,一个拒绝域, 拒绝域的面积为α 。 当所考察的数值越大越好时, 用单侧检验。 如考察灯泡的寿命 当所考察的数值越小越好时, 用单侧检验。 如考察产品的废品率 单侧检验按α 查表求临界值。
4)指定输出内容及缺失值处理方法 单击“选项(O)”框,开启选项对话框。
1)“置信区间(C)”编辑框:一般设置95%置信区间。 2)“缺失值”单选框:按分析顺序排除个案(A)表示 当分析计算涉及含有缺失值的变量时,才删除该记录;按 列表排除个案(L)表示只要相关变量有缺失值,则在所 有分析中均将该记录删除;本例选择前者。 3)最后单击“继续”框,返回“独立样本T检验”对话框。
独立样本T检验常用于进行两独立样本均值的比较。所谓 独立样本是指两组样本之间没有任何联系,但各自接受相 同的测量。假设两组样本的个数分别为n1和n2,检验这两 组样本的均值是否相等可以分为以下两种情况考虑。
2 1. 两总体方差 12 和 2 未知,但它们相等。 此时属于两样本等方差检验,其统计量t的计算式为:
2. 独立样本T检验的SPSS求解过程
本例中自变量为性别,因变量为满意度,由于自变量只 有男和女两组,属于间断(类别)变量,而满意度是根 据Likert 5点量表进行调查的结果,可视为连续变量, 因而可以采用独立双样本T检验的方法进行检验,以判 断男性游客与女性游客对景区住宿条件的满意度是否存 在显著差异。 1)数据输入与菜单选择 打开SPSS软件,输入有关数据,选择菜单“分析(A) →比较均值(M)→独立样本T检验(T)”,开启“独 立样本T检验”窗口。
5. 检验方法的选择
一般而言,差异显著性检验涉及的变量关系可以理解为一 种因果关系。从统计学的观点来看,这种涉及两类变量的 检验属于双变量(bivariate)的统计检验。对于双变量的 假设检验,我们必须指定其中的一个变量为自变量 (independent variable)、另一个为因变量(dependent
女性
198
3.0152
.76389
.05429
独立样本T检验
方差方程 的Levene 检验 均值方程的t检验 差分的95%置信 区间 Sig. F Sig. t df (双 侧) .050 均值差 值 标准 误差 值
下限
上限
住 宿 的 环 境 卫 生
假设 方差 相等 假设 方差 不相 等 .219 .640
20 娱乐项目安全性
21 服务态度 22 服务效率
07 住宿的价格
08 交通的便捷性
15 商品种类
16 商品特色
23 导向标志与解说
1. 提出假设
本例选择其中的住宿满意度进行独立样本T检验。根据假 设检验的原理,我们提出如下假设:
H1 :不同性别的游客对白水洋景区的住宿满意度存在显 著差异。
H 1a :不同性别的游客对白水洋景区的住宿环境卫生满 意度存在显著差异。 H 1b :不同性别的游客对白水洋景区的住宿的舒适性满 意度存在显著差异。 H 1c :不同性别的游客对白水洋景区的住宿的价格满意 度存在显著差异。