第十三章 非参数检验
统计学第13讲 第13章 非参数检验
13.3 单变量的χ2 检验 肥胖与健康问题有关,亚特兰大疾控中心定期进行全 国青少年危机监督调查,对11631名男女青年(9到12年 级)自身体重观的部分调查结果。
表13-1 女生的自身体重观
偏瘦 419
正常 3402
过胖 1995
合计 5816
这个问题可以使用单变量χ2 检验或拟合优度检验 (goodness-of-fit test) 观测值与虚无假设下的期望值之间是否存在差异? 观测值分布是否与理论分布相吻合?
56
2
81
=56+36-81 =11
检验步骤如下: 1. H0: U U 两组等级差异是机遇所致
2. H1: U 两组等级差异不是随机的 U 3. 统计检验:曼-惠特尼 U 检验 4. 显著水平:α=0.05 5. 抽样分布:曼-惠特尼U:N1=8 , N2=7 6. 拒绝H0的判别区域:U≤10 或 U≥46,如果U在此 范围之外,就拒绝H0,否者不拒绝H0。 因为U=11>10,所以不拒绝H0 。这种药物对反应 时没有影响。
例如:研究两男两女4位朋友看电影的情况,
电影类型 被试1 被试2 男性 男性 电影类型 男性 女性
被试3 被试4
女性 女性
喜剧 6 4 1 0
悲剧 1 0 3 2
合计
喜剧 10 1 11
悲剧 1 5 6
合计 11 6 17
4≠17,这类数据不能列成交叉表,宜用参数检验
13.5 顺序量表变量—非参数检验
df=(行数-1)(列数-1)=(2-1)(2-1)=1
表13-5 男女青年体重自我感觉的期望次数 单元格的期望次数
性别 女性 男性 合计
过轻 786.78 591.22 1378.00
第十三章 非参数检验
相关样本
(二)大样本的检验
1、近似正态法
Z
r
1 r N 2 N 2
校正法:
1 r 0.5 N 2 Z N 2
其中
相关样本
N r : r 0.5 2 N r : r 0.5 2
检验过程
⑴ 提出假设
Ho:P+=P-,Ha:P+≠P-
相关样本
⑵ 确定符号(+,-,0)
1、符号检验法
1 2 3 4 5 6 7 8 9 10 11 12 13
期中 80 70 87 90 89 79 51 62 74 66 79 80 61 期末 86 75 87 97 81 88 67 74 72 94 96 93 85
符号 + + 0 + - + + + - + + + +
r=min(n+,n-) =n- =2 N= n++n- =10+2 =12 r=2,r0.10/2=2; r= r0.10/2,p>0.10
1 2 3 4 5 6 7 8 9 传统X 85 88 87 86 82 82 70 72 80 新法Y 90 84 87 85 90 94 85 88 92
相关样本
(一)小样本符号检验
⑴ 提出假设 ① 单侧检验: Ho:P+≤P-; Ha:P-≤P+
② 双侧检验 Ho:P+=P- (p=q=1/2)
概述 四、参数和非参数的比较 • 资料相同:两法结论的差异不太大。
适用于非参数的资料用非参数法,结果
准确; 适用于参数法的资料用参数法,结果更 准确。
五、方法
独立样本
概述
秩和检验法 中位数检验法
符号检验法 符号秩次(等级)检验法 单向秩次方差分样 双向秩次方差分析 柯尔莫哥洛夫检验 斯米尔诺夫检验
第13章非参数检验习题答案
第13章非参数检验教材习题答案13.1 为了解一种节能灯的使用寿命,随机抽取了8只灯泡,测得其使用寿命(:小时时)如命(单单位:小下:3250 3500 2850 3700 3010 2910 2980 3420 (1)检验该种节能灯的使用寿命是否服从正态分布?(a=0.05) (1)检验该种节能灯使用寿命的中位数是否等于3000小时?(a=0.05) 详细答案:(1)K—S检验结果如下表:精确双尾概率,不拒绝原假设,没有证据表明该种节能灯的使用寿命不服从正态分布。
(2)中位数的符号检验如下表:精确的双尾概率为,不拒绝原假设,没有证据表明该种节能灯的使用寿命的实际中位数与3000有显著差异。
13.2 利用13.1题的数据,采用Wilcoxon符号秩检验该种节能灯使用寿命的中位数是否等于3000小时?(a=0.05) 详细答案:检验结果如下表精确的双尾概率,不拒绝原假设。
没有证据表明该种节能灯的使用寿命的实际中位数与3000有显著差异。
13.3 为分析股票的每股收益状况,在某证券市场上随机抽取10只股票,得到2005年和2006股收益年的每股收益数据如下表,采用Wilcoxon符号秩检验分析:2007年与2006年相比,每,每股是否有显著提高?(a=0.05) 股票代码2006年每股收益(元)2007年每股收益(元)1 0.12 0.26 2 0.95 0.87 3 0.20 0.24 4 0.02 0.12 5 0.05 0.13 6 0.56 0.51 7 0.31 0.35 8 0.25 0.42 9 0.16 0.37 10 0.06 0.05 详细答案:配对样本的Wilcoxon符号秩检验如下表:精确的单尾,拒绝,2006年与2005年相比每股收益有显著提高。
13.4 某种品牌的彩电在两个城市销售,其中在A城市有6个商场销售,在B城市有8个商场销售,下表是各商场一年的销售量(单位:台)。
非参数验课件
秩次和秩和
“秩”即按数据大小排定的次序号,又称秩次号。编秩 就是将观察值按顺序由小到大排列,并用序号代替原始 变量值本身。用秩次号代替原始数据后,所得某些秩次 号之和,即按某种顺序排列的序号之和,称为秩和。设 有以下两组数据:
A组 4.7 6.4 2.6 3.2 5.2 B组 1.7 2.6 3.6 2.3 3.7
•编秩后,按差值的正负给秩次冠上符号。
分析步骤:
(3)求差值为正或负的秩和 差值为正的秩和以T+表示 差值为负的秩和以T-表示。 T++T-=n(n+1)/2 T=min(T+,T-)
(4)确定P值和作出推断结论:
当n≤50时,查T界值表
T在界值范围内
P>α
T在界值范围外或相等 P<α
例1 临床某医生研究白癜风病人的白介素IL6水平(u/l)在白斑部位与正常部位有无差异 ,调查的资料如表1所示:
表2 尿氟含量X(1)
2.15 2.10 2.20 2.12 2.42 2.52 2.62 2.72 2.99 3.19 3.37 4.57
12名工人尿氟含量测定的结果 差值d=X-2.15 (2) 0 -0.05 0.05 -0.03 0.27 0.37 0.47 0.57 0.84 1.04 1.22 2.42
对总体的分布类型 不作任何要求
不受总体参数的影响, 比较分布或分布位置 适用范围广;可用于任 何类型资料(等级资料, 或“>50mg” )
参数检验与非参数检验比较
参数检验 要求资料服从 某种分布
检验效率高
非参检验
1. 对资料的分布没有特殊要求,总体为 偏态、总体分布未知的计量资料(尤 其在n<30的情况)
非参数检验
组别 95-99 90-94 85-89 80-84 75-79 70-74 65-69 60-64 55-59 50-54 45-49
fo 4 12 18 28 44 72 46 40 22 18 10 314
组上限 99.5 94.5 89.5 84.5 79.5 74.5 69.5 64.5 59.5 54.5 49.5
fe 行合计数 列合计数 总次数
, fb , fd
( a b )( b d ) abcd ( c d )( b d ) abcd
注意:2×2列联表的自由度df=(2-1)(2-1)=1
例 为比较某新药与传统药物治疗脑动脉硬化的疗效, 临床试验结果见表,问两种药物的疗效有无差异? 表 两种药物治疗脑动脉硬化的疗效 处理措施 新药组 有效 无效 合计 44 24 68
41(38.18) 3(5.82)
传统药物组 18(20.82) 6(3.18) 合计 59 9
• 4、关于2×2列联表在数据合并上应注意 的问题 • 2×2列联表只是 的一个特例,实际上, 在很多情况下,变量的分类不止两个,当 我们把各部分数据合并成2×2列联表来表 达时,可能会忽略其中一些重要的变量, 造成 检验的失真,即可能会出现这样的 情况:单独分析每一个2×2列联表所得的 结果与合并成一个2×2列联表所做的 分 析结果相矛盾。
2
( 69 74 . 4 ) 74 . 4
(16 11 . 6 ) 11 . 6
22 . 2748
• 3、推断:
取 0 . 05 , df 5 1 4 , 查表得: 22 . 2748
2 2 0 . 05 ( 4 ) 2 0 . 05 ( 4 )
非参数检验(提纲)
非参数检验参数检验方法,尤其是对计量资料,需要对研究的总体作一些比较严格的假定。
例如t检验法要求总体分布是正态分布等。
在实际工作中的许多资料不符合这种要求,因此以上的参数检验方法的使用受到了限制。
近代统计学家发明了对总体分布不必作限制性假定的检验技术,这种技术称为非参数检验(Nonparametric tests)。
非参数检验法是指在总体不服从正态分布或分布情况不明时,用来检验数据资料是否来自相同总体假设的一类检验方法。
由于它的假定前堤比参数检验方法少的多,而且在收集资料方面也十分简单,例如可以用“等级”或“符号”来评定观察的结果等,故这类方法在实际中有着广泛的应用。
第一节两相关样本的显著性检验1.1 符号检验法在配对实验中,将每对(或同一)实验单位(或先后)给予两种不同的处理,比较两种处理的效果有无差异或比较一组实验单位处理先后有无不同。
凡配对计量资料不服从正态分布要求时,可选用符号检验法(Sign test)。
例题1 有x,y 12对数据,它们的数值及相差符号由表1给出。
表1 本例的数据资料序号 1 2 3 4 5 6 7 8 9 10 11 12X 3 1 6 3 2 1 4 7 3 8 4 5Y 2 4 4 7 2 2 2 5 3 6 2 2 问这两个序列数值的差异是否具有显著性(α=0.05)?1.2 符号秩和检验法符号检验中只考虑配对数据x i-y i的符号,计算十分简便,但因没有考虑到x i-y i 差值的大小,因此对资料的利用不够充分,检验的灵敏度也不够好。
符号秩和检验法是上述方法的改进,由于关注到了差值的大小,故效果较好。
凡配对计量或计数的资料,可选用符号秩和检验法(Wilcoxon法)。
例题2 为研究长跑运动对增强普通高校学生的心功能效果,对某学院15名男生进行实验,经过5个月的长跑锻炼后观察其晨脉变化情况。
锻炼前后的晨脉数据如下。
问锻炼前后晨脉间的差异有无显著性(α=0.05)?表2 长跑锻炼前后的晨脉数、差值及其秩次序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 前70 76 56 63 63 56 58 60 65 65 75 66 56 59 70 后46 54 60 64 48 55 54 45 51 48 56 48 64 50 54 差值22 22 -4 -1 15 1 4 15 14 17 19 18 -8 9 16 秩次14.5 14.5 –3.5 –1.5 8.5 1.5 3.5 8.5 7 11 13 12 -5 6 101.3 用spss对两相关样本进行非参数检验spss软件包的Nonparametric Tests过程为两相关样本通常提供了3种非参数检验方法,它们是:Sign 检验,用于对两相关样本的总体做符号检验。
第13章 有序分类变量的统计推断——非参数检验
第13章有序分类变量的统计推断— —非参数检验
13.1 非参数检验概述 13.2 两个配对样本的非参数检验 13.3 两个独立样本的非参数检验
13.1 非参数检验概述
13.1.1 非参数检验的意义 13.1.2 非参数检验预备知识
13.1.1 非参数检验的意义
非参数检验(nonparametric testing)是指 在总体不服从正态分布且分布情况不明 时,用来检验数据资料是否来自同一个 总体假设的一类检验方法。由于这些方 法一般不涉及总体参数故得名。 这类方法的假定前提比参数性假设检验 方法少的多,也容易满足,适用于计量 信息较弱的资料且计算方法也简单易行, 所以在实际中有广泛的应用。
13.1.2 非参数检验预备知识
例如我们有下面数据
Xi 15
Ri 7
9
5
18
9
3
1
17
8
8
4
5
2
13
6
7
3
19
10
这下面一行(记为Ri)就是上面一行数 据Xi的秩。
13.1.2 非参数检验预备知识
利用秩的大小进行推断就避免了不知道 背景分布的困难。这也是非参数检验的 优点。 多数非参数检验明显地或隐含地利用了 秩的性质;但也有一些非参数方法没有 涉及秩的性质。
13.2.2
分析实例
例13.1 一家日用化工企业拟采用两种去 污配方生产新型去污剂,于是挑选了一 系列沾染污渍物件进行测试,其中一项 是对清除不同污渍所需时间的测试,技 术人员想知道它们在这方面的功效是否 有差别。 数据见npara1.sav
非参数检验教学课件
如果多个配对样本得分布存在显著得差异, 那么数值普遍偏大得组秩和必然偏大,数值普 遍偏小得组,秩和也必然偏小,各组得秩之间就 会存在显著差异。如果各样本得平均秩大致相 当,那么可以认为各组得总体分布 没有显著差 异。
2、多配对样本得Kendall协同系数检验
多配对样本得Kendall协同系数检验和 Friedman检验非常类似,也就是一种多配对样 本得非参数检验,但分析得角度不同。多配对 样本得Kendall协同系数检验主要用在分析评 判者得判别标准就是否一致公平方面。她将每 个评判对象得分数都看作就是来自多个配对总 体得样本。一个评判对象对不同被判定对象得 分数构成一个样本,其零假设为:样本来自得多 个配对总体得分布无显著差异,即评判者得评 判标准不一致。
非参数检验教学课件
但许多调查或实验所得得科研数据,其总 体分布未知或无法确定。因为有得数据不就是 来自所假定分布得总体,或者数据根本不就是 来自一个总体,还有可能数据因为某种原因被 严重污染,这样在假定分布得情况下进行推断 得做法就有可能产生错误得结论。此时人们希 望检验对一个总体分布形状不必作限制。
非参数检验根据样本数目以及样本之间得关系 可以分为单样本非参数检验、两独立样本非参数检 验、多独立样本非参数检验、两配对样本非参数检 验和多配对样本非参数检验几种。
6、1 SPSS单样本K-S检验
6、1、1 统计学上得定义和计算公 式 定义:单样本K-S检验就是以两位前苏联数
学家Kolmogorov和Smirnov命名得,也就是一种 拟合优度得非参数检验方法。单样本K-S检验 就是利用样本数据推断总体就是否服从某一理 论分布得方法,适用于探索连续型随机变量得 分布形态。
Kendall协同系数检验中会计算Friedman 检验方法,得到friedman统计量和相伴概率。 如果相伴概率小于显著性水平,可以认为这10 个节目之间没有显著差异,那么可以认为这5个 评委判定标准不一致,也就就是判定结果不一 致。
非参数检验的概念与过程
非参数检验的概念与过程导言在统计学中,非参数检验是一种不依赖于总体分布假设的方法,用于对数据进行统计推断。
与参数检验相比,非参数检验更加灵活,适用于各种数据类型和样本量的情况。
本文将介绍非参数检验的基本概念及其应用过程。
什么是非参数检验?在传统的统计推断中,我们通常需要假设数据的总体分布满足某种特定的参数化模型(如正态分布)。
然而,在实际应用中,我们并不总是了解或能够准确描述数据的分布。
此时,非参数检验成为一种有力的工具。
非参数检验不依赖于总体分布的假设,而是在不对数据做过多假设的情况下,通过对样本数据的排序、秩次转换等操作,进行统计推断。
非参数检验的应用场景非参数检验广泛应用于多个领域,特别是当数据不满足参数化分布假设时。
下面列举几个常见的应用场景:1. 样本量较小在样本量较小的情况下,参数化方法可能对数据分布的假设过于苛刻,导致结果不够准确。
而非参数检验则不对数据分布做过多要求,能够更灵活地处理小样本数据。
2. 数据不满足正态分布假设正态分布假设是很多参数检验方法的基础前提。
但在实际问题中,数据往往并不服从正态分布。
非参数检验不需要对数据做分布假设,因此更适用于处理不满足正态分布假设的数据。
3. 数据有序或等级性质对于无法直接度量或比较数值大小的数据,如排名数据、生活满意度评价等,非参数检验提供了一种适用的方法。
通过对数据的秩次进行比较,我们可以推断出两组数据是否存在显著差异。
非参数检验的基本过程非参数检验通常包括以下几个基本步骤:1. 建立原假设和备择假设在进行非参数检验之前,我们需要明确所研究的问题,并建立原假设(H0)和备择假设(H1)。
原假设通常是指两组样本没有显著差异,而备择假设则相反。
2. 选择合适的非参数检验方法根据实际问题和数据类型的特点,选择合适的非参数检验方法。
常用的非参数检验方法包括Wilcoxon秩和检验、Mann-Whitney U检验、Kruskal-Wallis单因素方差分析等。
常用的非参数检验方法
常用的非参数检验方法
嘿,你知道非参数检验不?那可是超厉害的统计工具呢!常用的非参数检验方法有很多,比如秩和检验。
咱就拿它来说吧,步骤嘛,先把数据整理好,然后计算秩次,再进行统计分析。
这听起来是不是挺简单?可别小瞧它哦!注意事项也不少呢,数据得符合一定的条件才行,不然结果可就不靠谱啦。
那非参数检验安全不?稳定不?当然啦!它不像一些参数检验那么挑数据,对异常值也不那么敏感,安全性和稳定性杠杠的。
非参数检验的应用场景那可广啦!当数据不满足正态分布的时候,它就大显身手了。
优势也很明显啊,操作简单,不需要对数据做太多假设。
比如说在医学研究中,有时候数据就是不那么听话,不呈正态分布,这时候非参数检验就能派上大用场。
咱举个实际案例哈,有个研究想看看两种治疗方法的效果。
收集的数据不太符合正态分布,用非参数检验一分析,哇塞,结果一目了然。
这效果,简直绝了!
非参数检验就是这么牛,它能在很多情况下帮我们解决问题,让我们的研究更靠谱。
咱可得好好利用它。
非参数检验77页--非参数检验的过程
来自 中国最大的资料库下载
非参数检验的概念
知
识
是指在总体不服从正态分布且分布情况不明时,用来 检验数据资料是否来自同一个总体假设的一类检验方
改 法。由于这些方法一般不涉及总体参数故得名。
这类方法的假定前提比参数性假设检验方法少的多,
变 也容易满足,适用于计量信息较弱的资料且计算方法
认为挑边器是均匀。
实例1的数据可以组织成:两个变量(side面和number
次数),2个cases。但在二项分布检验前要求用number
加来权自。ww结w果.3同7。 中国最大的资料库下载
补充:二项分布检验实例
知 实例:为验证某批产品的一等品率是否达到90%,现从
识
该批产品中随机抽取23个样品进行检测,结果有19个一 等品(1-一等品,0-非一等品)。(变量2个:一等
运
Test Variables: a b c Test type:选一种或多种
比较有用的结果:看sig值,sig<.05, 拒绝零假设,认为
顾客对三种款式衬衫的喜爱程度是不相同的。
来自 中国最大的资料库下载
补充:非参数检验
知
识 以下的讲义是吴喜之教授有关
K-S Z:是通过对分布的研究来实现推断的
改
Moses extreme reactions:一个作为控制样本,另一个作为实验样本 Wald Wolfwitz Runs:是通过对游程的研究来实现推断的
实例 :甲乙两种安眠药服用后的效果。数据data12-06(2个变量:
变
组别zb和延长时间ycss, 20个cases)。试问这两种药物的疗效是否
运
认为该批产品的一等品率达到了90% 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十三章非参数检验——SPSS实验
学习目标:初步学会操作SPSS分析非参数的样本资料
一、两个独立样本检验
例13-7:教师年薪数据表
1 2 3 4 5 6 7 8 9 10 11 12
教师男 1.60 1.65 1.73 1.77 1.85 1.93 2.01 2.09 2.30 2.35 2.42 —
女 1.36 1.43 1.50 1.57 1.60 1.71 1.78 1.85 1.92 1.99 2.06 2.08
第1步:录入(或读取)数据。
定义变量:年薪(nx),性别(sex,其中男为1,女为
2),见图13-1。
图13-1 数据文件
第2步:选择“analyze”,单击“Nonparaametric Tests”中的“2 independent samples”,进入“two independent samples Test”,见图13-2。
将nx 选入“Test V ariable List”,将sex放入“grouping V ariable”,“Define Groups”字体变黑。
图13-2 two independent samples Test对话框
第3步:单击“Define Groups”进入“two independent samples:Define Groups”,见图13-3。
在sex1中输入1,sex2中输入2,单击“continue”返回,单击“OK”即可。
图13-3 two independent samples :Define Groups 对话框
输出结果与解释:
Ranks
SEX N Mean Rank Sum of Ranks
NX 1 11 14.73 162.00
2 12 9.50 114.00
Total
23
上表为秩和检验中用到的编秩情况列表,可见,男教师组的秩次要高一些(默认
是从小到大的编秩)
Test Statistics(b)
NX Mann-Whitney U 36.000 Wilcoxon W 114.000 Z
-1.847 Asymp. Sig. (2-tailed) .065 Exact Sig. [2*(1-tailed Sig.)]
.069(a)
b Grouping Variable: SEX
上表即为检验结果,一共给出了Mann-Whitney U 统计量、Wilcoxon W 统计量和Z 值,下方则分别给出了近似法计算出的P 值和确切概率法计算出的P 值,可见两种算法得出的结论一致,都是男教师和女教师的年薪的分布无显著的统计学意义,结合实际数据,可以认为男女教师年薪水平相差不大。
二、两个相关样本检验
例13-4: 表13-6 儿童入园前后血色素检验结果
1 2
3
4
5
6
7
8
9
10
刚入园1X
12.3
11.3 13.0 15.0 12.0 15.0 13.5 12.8 10.0 11.0
X12.0 14.0 13.8 11.4 14.0 14.0 13.5 13.5 12.0 14.7 入园一年2
第1步:录入(或读取)数据。
定义变量:前测血色素xss1,后测血色素xss2,见图
13-4。
.
图13-4 数据文件
第2步:选择“analyze”,单击“Nonparaametric Tests”中的“2 related samples”,进
入“two-related samples tests”,见图13-5。
分别单击“xss1”和“xss2”,进入“current selection”
中的“variable1:”和“variable2:”,再单击向右箭头进入“Test Pair[s] List”。
在“Test Type”中选择“wilcoxon”和“sign”。
最后单击“OK”即可。
图13-5 two-related samples tests对话框
结果输出
Test Statistics(b)
XSS2 - XSS1
Z -1.126(a)
Asymp. Sig. (2-tailed) .260
b Wilcoxon Signed Ranks Test
上表为秩和检验的结果,给出的是Z统计量和近似的P值。
可见两组差异无统计学意义。