spss非参数教程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计之星示例文档:第三部份
基础统计分析方法
第十三章 非参数统计分析方法―― Nonparametric Tests 菜单详解
非参数检验最大的缺点就是检验效能较低,实际上根据国外的一项研究, 有些方法的检验效能大约在参数检验方法的 95%左右,并非低得不能接受. ――张文彤
平时我们使用的统计推断方法大多为参数统计方法, 他们都是在已知总体分布的条件 下,对相应分布的总体参数进行估计和检验. 比如单样本 u 检验就是假定该样本所在总体 服从正态分布,然后推断总体的均数是否和已知的总体均数相同. 本章要讨论的是另一大 类统计分析方法,它的着眼点不是总体参数,而是总体的分布情况,即研究目标总体的分 布是否与已知理论分布相同,或者各样本所在总体的分布位置/形状是否相同.由于这一 类方法并不涉及总体参数,因而被称为非参数方法. 非参数方法这个名称的含义指的是他的推断过程和结论均与原总体参数无关, 并非说他在推断中什么分布参数都不利用,实际上,最常用的秩和检验就是基于秩次的分 布特征推导出来的,即可能会利用到秩分布的参数. SPSS 的 Nonparametric Tests 菜单中一共提供了 8 种非参数分析方法,他们可以被分 为两大类: 1.分布类型检验方法:亦称拟合优度检验方法,即检验样本所在总体是否服从已知 的理论分布.具体包括检验二项/多项分类变量分布的 Chi-Square 过程;检验二项分类变 量分布的 Binomial 过程;检验样本序列随机性的 Runs 过程;以及检验样本是否服从各种 常用分布的 1-Sample K-S 过程. 2.分布位置检验方法:用于检验样本所在总体的分布位置/形状是否相同,我们平时 说的最多的非参数检验方法实际上指的就是这一类方法. 具体包括用于成组资料分布位置 检验的 2 Independent Samples 与 K Independent Samples 过程; 以及用于配伍资料分布位置 检验的 2 Related Samples 与 K Related Samples 过程. 实际上,上面的这些方法只是最基本,最简单的非参数检验方法.非参数检验 方法近年来发展极为迅速,已经成为了 21 世纪统计学发展的热点之一,在高级非参数检 验方法中,它已经显示出了参数检验方法绝对无法比拟的优势,如适用范围广,和稳健性 好.但是这些方法都要求使用者有非常深厚的数理统计功底,并且大都要编程完成. 除以上两类现成的方法外, 本章还将专门向大家介绍基于非参数检验原理的秩变换分 析方法,它可以作为现有方法的补充和有效扩展,大家会发现这种方法将在实际工作中非 常有用.
- 242 -
第十三章
非参数统计分析方法――Nonparametric Tests 菜单详解
§13.1
分布类型检验方法
这一大类方法的原理都是计算出实际分布和理论分布间的差异大小, 然后根据某种统 计量来求出 P 值.实际上,这些方法应用的非常广泛,比如说卡方检验就是属于这一类方 法的,而它已被广泛应用于分类资料的统计推断中.
13.1.1
Chi-Square 过程
许多朋友都以为这里进行的就是常用的行×列表卡方检验,这是一个不大不小的误 解. 行×列表卡方检验的确是属于卡方检验系列的一种, 但它的分析目的是比较两个分类 资料样本所在的总体分布是否相同,在 SPSS 中应当使用 Crosstabs 过程来拟合.此处的 Chi-Square 过程其分析目的是检验分类数据样本所在总体分布(各类别所占比例)是否与 已知总体分布相同,是一个单样本检验. 具体在做法上, 卡方检验是先按照已知总体的构成比分布计算出样本中各类别的期望 频数,然后求出观测频数和期望频数的差值,最后计算出卡方统计量,利用卡方分布求出 P 值,以得出检验结论.大家只要翻翻统计书上四格表卡方检验的原理,就会明白了. 例 13.1 某公司准备推出一个新品牌的矿泉水,现已万事俱备,就是在新产品的名称 上几位董事意见尚未统一.董事会屡议不决之后,最终决定进行抽样调查.在受访的 200 人中,52 人更喜欢名称 A,61 人更喜欢名称 B,87 人更喜欢名称 C,请问 ABC 三种名 称受欢迎的程度有无差异? 解:董事说话自然是要听的,无论他们出于什么原因选 择某种名称,如果要说服他们,就必须拿出有力的证据来才 行,统计结果就是最好的证据.如果以统计学的角度来看待 该问题, 实际上就是检验三种品牌的构成比是否均等于已知 总体的 33%.这可以用 Chi-Square 过程来完成.本例数据 录入如右图所示,操作如下: Data!Weight Cases Weight Cases by: Frequency Variable 框:num OK Analyze!Nonparametric Tests!Chi-Square Test Variable List 框:type Exact: Exact:Continue OK 分析中用到的界面如下: 【主对话框】 1.Test Variable List 框:指定需要进行检验的变量,可以同时指定多个,系统会分别 进行分析.
图 14.1
数据示意
频数变量为 num
要检验的变量为 type 要求计算确切概率
- 243 -
统计之星示例文档:第三部份
基础统计分析方法
2.Expected Range 单选框组:设定需要检验的变量的取值范围,在此范围之外的取 值将不进入分析.默认为使用数据文件中的最大和最小值作为检验范围,可使用 Use specified range 框组自行指定. 3.Expected Values 单选框组:指定已知总体的各分类构成比,默认为各类别构成比 相等,可以使用下方的 Values 自行定义,注意定义时有几个类别,就应输入几个数值, 并且数值的排列次序和数据文件中记录的排列次序应当相同, 因为它们之间存在着一一对 应的关系.
图 13.2
主对话框
【Exact 子对话框】 用于设定是否进行确切概率的计算,以及具体的计算方法.共有只计算近似概率,采 用蒙特卡罗模拟方法计算确切概率,直接计算确切概率三种选择,具体情况我们已经在卡 方检验一章中学习过了,这里不再重复.
图 13.3
Exact 子对话框
图 13.4
Options 子对话框
【Options 子对话框】 1.Statistics 复选框组:一些可供输出的统计量. " "
- 244 -
Descriptive:常用描述统计量,包括均数,最小值,最大值,标准差. Quartiles:输出四分位数.