第十一章非参数检验

合集下载

非参数检验的基本原理

非参数检验的基本原理非参数检验是一种利用统计方法来检验假设的一种方法，与参数检验相比，非参数检验不需要对总体的分布做出假设，更为灵活。

本文将介绍非参数检验的基本原理。

一、概述非参数检验是一种统计方法，既不要求数据符合特定分布，也不对总体参数做出假设。

与之相反，参数检验通常假设数据服从特定的分布，例如正态分布。

非参数检验的主要优点是可以更全面地处理数据，更适用于复杂的情况。

然而，非参数检验的统计效率通常较低，需要更多的样本来达到相同的置信水平。

二、基本原理1. 秩次转换非参数检验通常使用秩次转换来处理数据。

所谓秩次转换是将原始的数值转换为它们在样本中的秩次，从而消除数值的大小差异。

对于同一组数据，秩次转换后，可以应用更广泛的统计方法。

2. Wilcoxon符号秩检验Wilcoxon符号秩检验是一种非参数检验方法，主要应用于配对样本或者两组独立样本之间的差异比较。

它的基本思想是对每个观测值计算它们的符号秩，然后通过比较两组样本的秩和来判断差异是否显著。

3. Mann-Whitney U检验Mann-Whitney U检验是一种非参数检验方法，用于比较两组独立样本之间的差异。

它的基本原理是将两组样本中的所有观测值汇总，然后对这些观测值进行秩次转换，并计算两组样本排名和。

通过比较两组样本排名和的大小来判断差异是否显著。

4. Kruskal-Wallis H检验Kruskal-Wallis H检验是一种非参数的方差分析方法，用于比较三组或以上独立样本之间的差异。

它的基本原理是将所有样本的观测值汇总，然后进行秩次转换，并计算各组样本排名和的平均值。

通过比较平均排名和的大小来判断差异是否显著。

三、案例研究为了更好地理解非参数检验的原理，我们以某家公司销售部门的两个月销售额作为例子进行案例研究。

假设第一个月公司销售额为[100, 80, 120, 90, 110]，第二个月公司销售额为[95, 85, 115, 100, 105]。

第十一章-非参数检验

R>R0.05时，P>0.05， R≤R0.05时，P≤0.05
本例: R=10<R0.05＝14，n=12， P<0.05，拒绝H0，故认为A，B两种照射方式造成的急性皮肤损伤程度不同，B照射的损伤程度比A照20射24年严9月重2。1日
（ii）大样本（n>10）时, 可采用正态近似
u | R n(n 1) / 4 | 10 12(12 1) / 4 2.275 n(n 1)(2n 1) / 24 12(12 1)(2 12 1) / 24
在0.05检验水平拒绝H0，接受H1,认为三组脾淋巴细胞对HPA刺激的增值反应不全相同。
2024年9月21日
频数表法: 属于同一组段的观察值，一律取平均秩次（组中值），再以该组段频数加权，计算Hc值。表分娩时孕周与乳量的关系
乳量
早产
足月产
过期产
合计
秩次范围
平均
秩和
秩次早产足月产过期产
查标准正态分布表，得 P 值校正公式：（当相同秩次个数较多时）
| R n(n 1) / 4 |
u
n(n 1)(2n 1) / 24 (ti3 ti ) / 48
10 12(12 1) / 4 2.282
12(12 1)(212 1) / 24 [(33 3) (33 3)]/ 48
2024年9月21日
⑴ H0: 两样本来自相同总体； H1: 两样本来自不同总体（双侧）
=0.05
或H1: 样本A高于样本B（单侧）
⑵ 编秩：两样本混合编秩次，求得R1、R2.T。
相同观察值（即相同秩，ties），不同组------平均秩次。 ⑶ 确定P值作结论:
①查表法 (n0≤10，n2 n1≤10) 查附表9

第十一章非参数检验

第十一章非参数检验前面有关章节讨论的参数检验都要求总体服从一定的分布，对总体参数的检验是建立在这种分布基础上的。

例如，两样本平均数比较的t 检验和多个样本平均数比较的F 检验，都要求总体服从正态分布，推断两个或多个总体平均数是否相等。

本章引入另一类检验——非参数检验（non-parametric test ）。

非参数检验是一种与总体分布状况无关的检验方法，它不依赖于总体分布的形式，应用时可以不考虑被研究的对象为何种分布以及分布是否已知。

非参数检验主要是利用样本数据之间的大小比较及大小顺序，对两个或多个样本所属总体是否相同进行检验，而不对总体分布的参数如平均数、标准差等进行统计推断。

当样本观测值的总体分布类型未知或知之甚少，无法肯定其性质，特别是观测值明显偏离正态分布，不具备参数检验的应用条件时，常用非参数检验。

非参数检验具有计算简便、直观，易于掌握，检验速度较快等优点。

非参数检验法从实质上讲，只是检验总体分布的位置（中位数）是否相同，所以对于总体分布已知的样本也可以采用非参数检验法，但是由于它不能充分利用样本内所有的数量信息，检验的效率一般要低于参数检验方法。

例如，非配对资料的秩和检验，其效率为t 检验的86.4%，就是说以相同概率判断出差异显著，t 检验所需的样本个数要少13.6%。

非参数检验内容很多，本章只介绍常用的符号检验（sign test ），秩和检验（rank-sum test ）和等级相关分析（rank correlation analysis ）三种。

第一节符号检验一、配对资料的符号检验（一）配对资料符号检验的意义配对资料符号检验是根据样本各对数据之差的正负符号多少来检验两个总体分布位置的异同，而不去考虑差值的大小。

每对数据之差为正值用“+”表示，负值用“－”表示。

可以设想如果两个总体分布位置相同，则正或负出现的次数应该相等。

若不完全相等，至少不应相差过大，否则超过一定的临界值就认为两个样本所来自的两个总体差异显著，分布的位置不同。

第11章非参数检验——卡方检验

f (横行总次数) * (纵列总次数) N
2
a
n(ad bc)2
bc d a cb
d
第11章非参数检验——卡方2检验
一、卡方检验概述二、吻合性检验三、独立性检验
一、卡方检验原理
（一）定义检验频数资料的实际观测次数分布与理论次数分布之
间差异是否显著的方法。
（二）目的检验每一组实际观察次数与理论次数是否吻合；检验四格表中分类标志是否独立。
一、卡方检验原理
（三）公式
实际观测次数
2 ( f0 fe )2 fe
理论次数
（四）性质 1. 非负 2. 形状受df影响，当df趋近∞时，2分布为正态。 3. 实际观测次数与理论次数差异越大，2值越大；反
之，则2越小。
二、吻合性检验
实得分布与理论分布是否吻合；判断实得分布与原有分布是否之一。例1，例2，例3。
三、独立性检验
检验两种分类标志下现象间是否相互独立。
2 × 2列联表
df =（r-1）（c-1）
例4
f (横行总次数) * (纵列总次数) N
2
a
n(ad bc)2
bc d a cb
d

当df=1，f<5时，采用公式校正
例5
三、独立性检验
检验两种分类标志下现象间是否相互独立。 2 × 2列联表 df =（r-1）（c-1）

非参数验课件

秩次和秩和
“秩”即按数据大小排定的次序号，又称秩次号。编秩就是将观察值按顺序由小到大排列，并用序号代替原始变量值本身。用秩次号代替原始数据后，所得某些秩次号之和，即按某种顺序排列的序号之和，称为秩和。设有以下两组数据：
A组 4.7 6.4 2.6 3.2 5.2 B组 1.7 2.6 3.6 2.3 3.7
•编秩后，按差值的正负给秩次冠上符号。
分析步骤：
（3）求差值为正或负的秩和差值为正的秩和以T+表示差值为负的秩和以T-表示。 T++T-=n(n+1)/2 T=min（T+，T-）
（4）确定P值和作出推断结论：
当n≤50时，查T界值表
T在界值范围内
P>α
T在界值范围外或相等 P<α
例1 临床某医生研究白癜风病人的白介素IL6水平(u/l)在白斑部位与正常部位有无差异，调查的资料如表1所示：
表2 尿氟含量X(1)
2.15 2.10 2.20 2.12 2.42 2.52 2.62 2.72 2.99 3.19 3.37 4.57
12名工人尿氟含量测定的结果差值d=X-2.15 （2） 0 -0.05 0.05 -0.03 0.27 0.37 0.47 0.57 0.84 1.04 1.22 2.42
对总体的分布类型不作任何要求
不受总体参数的影响，比较分布或分布位置适用范围广；可用于任何类型资料(等级资料，或“>50mg” )
参数检验与非参数检验比较
参数检验要求资料服从某种分布
检验效率高
非参检验
1. 对资料的分布没有特殊要求，总体为偏态、总体分布未知的计量资料（尤其在n<30的情况）

第十一章非参数检验简述

不如参数检验。
• 两独立样本非参数检验方法
– 秩和检验法
– 中数检验法
• 两相关样本非参数检验方法
– 符号检验法 – 符号等级检验法 • 克—瓦式单向方差分析
第一节两独立样本非参数检验方法
一、秩和检验 • 两个样本的容量都小于或等于10时
– 将所有数据由小到大赋予秩次 – 求样本容量较小的一组数据的秩次之和“T” – 将T值与临界值作比较。若 T1 < T < T2 则差异不显著
Z T n ( n 1) / 4 n ( n 1)( 2 n 1) 24
第三节单向秩次方差分析
• 方法：将所有样本的数据合在一起，按从小到大编秩次，然后计算各样本的秩次和。如果各组没有显著性差异，各组秩次和应当相等或趋于相等；如果各组秩次和相差较大，那么各组有显著性差异的可能性较大。
例题
序号
1 2 3 4 5 n
甲校 128 114 103 92 85 5
原始分数乙校 90 91 106
丙校 89 80 101
3
3
• 2.37
Z ( r 0 .5 ) n / 2 1 2 n ( 9 0 . 5 ) 31 / 2 1 2 31 2 . 16
二、符号秩次检验
• 威尔科克松（F.Wilcoxon）提出了既考虑差数符号，又考虑差数大小的符号秩次检验法。
• 当样本容量n<25时，可用查表法进行符号秩次检验。 • 当样本容量n>25时，可用正态分布近似处理。检验统计量为：
Z
( r 0 .5 ) n / 2 1 2 n
例题
• 32名被试中有1名被试对两种包装打出相同的分数，有22名被试认为A包装比B包装好，另有9名被试认为B包装比包装A好。问：被试对两种包装的偏好程度有无显著差异？

非参数检验

组别 95-99 90-94 85-89 80-84 75-79 70-74 65-69 60-64 55-59 50-54 45-49
fo 4 12 18 28 44 72 46 40 22 18 10 314
组上限 99.5 94.5 89.5 84.5 79.5 74.5 69.5 64.5 59.5 54.5 49.5
fe 行合计数列合计数总次数
, fb , fd
( a b )( b d ) abcd ( c d )( b d ) abcd
注意：2×2列联表的自由度df=(2-1)(2-1)=1
例为比较某新药与传统药物治疗脑动脉硬化的疗效，临床试验结果见表，问两种药物的疗效有无差异？表两种药物治疗脑动脉硬化的疗效处理措施新药组有效无效合计 44 24 68
41(38.18) 3(5.82)
传统药物组 18(20.82) 6(3.18) 合计 59 9
• 4、关于2×2列联表在数据合并上应注意的问题 • 2×2列联表只是的一个特例，实际上，在很多情况下，变量的分类不止两个，当我们把各部分数据合并成2×2列联表来表达时，可能会忽略其中一些重要的变量，造成检验的失真，即可能会出现这样的情况：单独分析每一个2×2列联表所得的结果与合并成一个2×2列联表所做的分析结果相矛盾。
2

( 69 74 . 4 ) 74 . 4

(16 11 . 6 ) 11 . 6
22 . 2748
• 3、推断：
取 0 . 05 , df 5 1 4 , 查表得： 22 . 2748
2 2 0 . 05 ( 4 ) 2 0 . 05 ( 4 )

《卫生统计学》课后思考题答案

《卫生统计学》思考题参考答案第一章绪论1、统计资料可以分为那几种类型？举例说明不同类型资料之间是如何转换的？答：（1）1定量资料（离散型变量、连续型变量）、2无序分类资料（二项分类资料、无序多项分类资料）、3有序分类资料（即等级资料）；（2）例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级，应归为等级资料，若将该五个等级赋值为5、4、3、2、1，就可按定量资料处理。

2、统计工作可分为那几个步骤？答：设计、收集资料、整理资料、分析资料四个步骤。

3、举例说明小概率事件的含义。

答：某人打靶100次，中靶次数少于等于5，那么该人一次打中靶的概率≤0.05，即可称该人一次打中靶的事件为小概率事件，可以视为很可能不发生。

第二章调查研究设计1、调查研究有何特点？答：（1）不能人为施加干预措施（2）不能随机分组（3）很难控制干扰因素（4）一般不能下因果结论2、四种常用的抽样方法各有什么特点？答：（1）单纯随机抽样：优点是操作简单，统计量的计算较简便；缺点是当总体观察单位数量庞大时，逐一编号繁复，有时难以做到。

（2）系统抽样：优点是易于理解、操作简便，被抽到的观察单位在总体中分布均匀，抽样误差较单纯随机抽样小；缺点是在某些情况下会出现偏性或周期性变化。

（3）分层抽样：优点是抽样误差小，各层可以独立进行统计分析，适合大规模统计；缺点是事先要进行分层，操作麻烦。

（4）整群抽样：优点是易于组织和操作大规模抽样调查；缺点是抽样误差大。

3、调查设计包括那些基本内容？答：（1）明确调查目的和指标（2）确定调查对象和观察单位（3）选择调查方法和技术（4）估计样本大小（5）编制调查表（6）评价问卷的信度和效度（7）制定资料的收集计划（8）指定资料的整理与分析计划（9）制定调查的组织措施4、调查表中包含那几种项目？答：（1）分析项目直接整理计算的必须的内容；（2）备查项目保证分析项目填写得完整和准确的内容；（3）其他项目大型调查表的前言和表底附注。

非参数检验(提纲)

非参数检验参数检验方法，尤其是对计量资料，需要对研究的总体作一些比较严格的假定。

例如t检验法要求总体分布是正态分布等。

在实际工作中的许多资料不符合这种要求，因此以上的参数检验方法的使用受到了限制。

近代统计学家发明了对总体分布不必作限制性假定的检验技术，这种技术称为非参数检验（Nonparametric tests）。

非参数检验法是指在总体不服从正态分布或分布情况不明时，用来检验数据资料是否来自相同总体假设的一类检验方法。

由于它的假定前堤比参数检验方法少的多，而且在收集资料方面也十分简单，例如可以用“等级”或“符号”来评定观察的结果等，故这类方法在实际中有着广泛的应用。

第一节两相关样本的显著性检验1.1 符号检验法在配对实验中，将每对（或同一）实验单位（或先后）给予两种不同的处理，比较两种处理的效果有无差异或比较一组实验单位处理先后有无不同。

凡配对计量资料不服从正态分布要求时，可选用符号检验法（Sign test）。

例题1 有x,y 12对数据，它们的数值及相差符号由表1给出。

表1 本例的数据资料序号 1 2 3 4 5 6 7 8 9 10 11 12X 3 1 6 3 2 1 4 7 3 8 4 5Y 2 4 4 7 2 2 2 5 3 6 2 2 问这两个序列数值的差异是否具有显著性（α=0.05）？1.2 符号秩和检验法符号检验中只考虑配对数据x i-y i的符号，计算十分简便，但因没有考虑到x i-y i 差值的大小，因此对资料的利用不够充分，检验的灵敏度也不够好。

符号秩和检验法是上述方法的改进，由于关注到了差值的大小，故效果较好。

凡配对计量或计数的资料，可选用符号秩和检验法（Wilcoxon法）。

例题2 为研究长跑运动对增强普通高校学生的心功能效果，对某学院15名男生进行实验，经过5个月的长跑锻炼后观察其晨脉变化情况。

锻炼前后的晨脉数据如下。

问锻炼前后晨脉间的差异有无显著性（α=0.05）？表2 长跑锻炼前后的晨脉数、差值及其秩次序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 前70 76 56 63 63 56 58 60 65 65 75 66 56 59 70 后46 54 60 64 48 55 54 45 51 48 56 48 64 50 54 差值22 22 -4 -1 15 1 4 15 14 17 19 18 -8 9 16 秩次14.5 14.5 –3.5 –1.5 8.5 1.5 3.5 8.5 7 11 13 12 -5 6 101.3 用spss对两相关样本进行非参数检验spss软件包的Nonparametric Tests过程为两相关样本通常提供了3种非参数检验方法，它们是：Sign 检验，用于对两相关样本的总体做符号检验。

统计学习题第十一章非参数检验

第十一章非参数检验第一节符号检验符号检验的方法·符号检验的特点和作用第二节配对符号秩检验配对符号秩检验的方法·配对符号秩检验的效力第三节秩和检验秩和检验的方法·秩和检验的近似第四节游程检验游程的概念·游程检验的方法·差符号游程检验第五节累计频数检验累计频数检验的方法·累计频数检验的应用一、填空1．非参数检验，泛指“对分布类型已知的总体进行参数检验”（）的所有检验方法。

2．符号检验的零假设就是配对观察结果的差平均起来等于（）。

3．理论研究表明，对于配对样本非正态分布的差值d，（）是最佳检验。

4．秩和检验检验统计量U是U1和U2中较（）的一个。

5．秩尺度之统计量的均值和标准差只取决于（）。

6．（）常被用作经验分布与理论分布的比较。

7．绝对值相等的值，应将它们的秩（）。

8．符号检验，在分布自由检验中称为（）。

9．符号检验和配对符号秩检验，都只适用于（）样本。

10．数据序列ABBABAAABABBABBAAAAAB的总游程数是（）二、单项选择1．下列检验中，不属于非参数统计的方法的是（）。

A总体是否服从正态分布 B 总体的方差是否为某一个值C 样本的取得是否具有随机性D 两组随机变量之间是否相互独立2．下列情况中，最适合非参数统计的方法是（）。

A反映两个大学新生成绩的差别B 反映两个大学新生家庭人均收入的差别C 反映两个大学三年级学生对就业前景的看法差别D反映两个大学在校生消费水平的差别3．不属于非参数检验的是（）。

A符号检验B游程检验C累计频数检验 D F检验4．在累计频数检验中，卡方的自由度为（）。

A n1B 2C n2D n1+n25．配对符号秩检验的效力（）。

A 小于符号检验B 大于t 检验C 介于符号检验与t 检验之间D 无法与符号检验及t 检验比较 6．如果我们说非参数检验的效力是80%，下列哪种解释正确。

（）A 如果用参数检验需要100个数据，那么在同等的检验效力下，非参数检验只要80个数据；B 如果用非参数检验需要100个数据，那么在同等的检验效力下，参数检验只要80个数据；C 如果用参数检验需要100个数据，那么在同等的检验效力下，非参数检验只要20个数据；D 如果用非参数检验需要100个数据，那么在同等的检验效力下，参数检验只要20个数据；7．对于秩和检验，U 1、U 2和n 1、 n 2的关系是（）。

第十一章非参数检验

第一节非参数检验的基本概念及特点一、非参数检验（一）什么是“非参数”非参数模型：缺乏总体分布模式的信息。

(二）非参数检验的定义非参数检验:不需要假设总体是否为正态分布或方差是否为齐性的假设检验称非参数检验. （三)非参数检验的优点和缺点： 1、优点：一般不涉及总体参数，其假设前提也比参数假设检验少得多，适用面较广。

计算简便。

2、缺点:统计效能远不如参数检验方法。

由于当数据满足假设条件时，参数统计检验方法能够从其中广泛地充分地提取有关信息.非参数统计检验方法对数据的限制较为宽松，只能从中提取一般的信息，相对参数统计检验方法会浪费一些信息。

(四）非参数检验的特点： 1、它不需要严格的前提假设; 2、特别适用于顺序数据； 3、适用于小样本，且方法简单；4、最大的不足是不能充分利用资料的全部信息；5、不能处理“交互作用”,即多因素情况。

第二节两个独立样本的非参数检验方法一、秩和检验法秩和即秩次的和或等级之和。

秩和检验法也叫Mann —Whitney —Wilcoxon 检验，它常被译为曼－惠特尼－维尔克松检验,简称M —W-W 检验，也称Mann-Whitney U 检验。

秩和检验法与参数检验法中独立样本的t 检验法相对应。

当“总体正态”这一前提不成立时,不能用t 检验,可以用秩和检验法。

(一）秩统计量秩统计量指样本数据的排序等级.假设从总体中反复抽取样本,就能得到一个对应于样本容量1n 和2n 的秩和U 的分布.这是一个间断而对称的分布，当1n 和2n 都大于10时，秩和T 的分布近期近似正态分布,其平均数和标准差分别为()21211++=n n n T μ ()1212121++=n n n n T σ其检验值为TT σμ-=T Z(二）计算过程1、小样本：两个样本容量均小于10(n 1£10,n 2£10）例11—1：在一项关于模拟训练的实验中，以技工学校的学生为对象，对5名学生用针对某一工种的模拟器进行训练，内外让6名学生下车间直接在实习中训练，经过同样的时间后对两组人进行该工种的技术操作考核，结果如下：模拟器组:56，62，42，72，76实习组：68,50，84，78，46，92假设两组学生初始水平相同，则两种训练方式有无显著差异？表11—1 两种训练方式的成绩考核成绩成绩排列等级等级和模拟器组 (5人） 56 42 1 251=T62 56 4 42 62 5 72 72 7 76 76 8 实习组 68 46 2 412=T(6人) 50 50 3 84 68 6 78 78 9 46 84 10929211检验过程：1．建立假设 0H ：∑∑=21R R ，即两样本无显著差异 aH ：∑∑≠21R R ,即两样本有显著差异2．计算统计量1）将数据从小到大排列，见上表。

非参数检验

非参数检验又称为任意分布检验（distribution-free test），它不考虑研究对象总体分布具体形式，也不对总体参数进行统计推断，而是通过检验样本所代表的总体分布形式是否一致来得出统计结论。
非参数检验的优点：
①适用范围广，不论样本来自的总体分布形式如何，都可适用；
②某些非参数检验方法计算简便，研究者在急需获得初步统计结果时可采用；
的总体分布不同。 α=0.05
2．混合编秩
依据两组数值由小到大编秩，结果见上表。
3．求秩和并确定检验统计量T
把两组秩次分别相加求出两组的秩和值，R1=315.5，R2=149.5。因乳酸钙组样本含量较小，故 T=R2=149.5。
4．确定P值和作出推断结论以较小样本含量为n1，n1=14, n2n1=2，查附表6，两样本比较秩和检验用T界值表（双侧）。
当n1>20或（n2-n1）>10时，附表6 中查不到P值，则可采用正态近似法求u 值来确定P值，其公式如下：
u T n1(N 1) / 2 0.5 n1n2(N 1) 12
上式中T为检验统计量值，n1、n2 分别为两样本含量，N=n1+n2，0.5这连续性校正数。上式为无相同秩次时使用或作为相同秩次较少时的近似值。当两样本相同秩次较多（超过总样本数的 25%）时，应按下式进行校正，u经校正后可略增大，P值则相应减小。
式中，Ri为各组的秩和，ni为各组样本含量，N为总样本含量。
当各组相同秩次较多时，可对H值进行校正，按下式求值。
Hc H c
C 1
(t
3 j
t
j
)
(N3 N)
4．确定P值和作出推断结论
当组数K=3，每组样本含量ni≤5时，可查附表7（H界值表）得到P值。若 k>3或ni>5时，H值的分布近似于自由度为k-1的χ2分布，此时可查附表 4χ2界值表得到P值。最后按P值作出推断结论。

统计学讲义第8讲非参数检验与Ridit分析

5. 2 Independent-Samples Tests（两个独立样本检验）：完全随机设计的两样本均数比较的非参数检验，操作过程如例11.3。 6. K Independent Samples（多个独立样本检验）：完全随机设计的多个样本均数比较的非参数检验，操作过程如例11.5
7、2 Related-Samples Tests（两相关样本检验）：配对设计两样本均数的非参数检验。操作过程如例11.1、例9.1。 8、 K Related Samples Test（多个相关样本检验）：配伍设计多个样本均数的非参数检验，操作如例11.7
如果正、负秩和相差悬殊，统计量 T 特别小或特别
大，则 H0 为真的可能性很小，从T 界值表(附表12)也可看出，当 n 确定以后，T 界值的下限愈小，上限愈
大时，P 值愈小。因而可按小概率原理，拒绝H0；反之，不能拒绝H0 。随着 n增大，T 分布逐渐逼近:
均数:μT=n(n＋1)/4，
方差为:
比较，基本思想是：若H0成立，则配对数值的差值应
服从均数μT :
标准差σT :
μT =n(n+1)/4，
T n(n 1)(2n 1) / 24
的对称分布,将配对的差值按绝对值大小编秩并标上原
来差值的符号后,带正号、带负号的秩和在理论上是均
匀的, 即使有些差别,也只是随机因素造成的差别,S Test（即One-Sample KolmogorovSmirnov Test单个样本的柯尔莫哥诺夫-斯米尔诺夫检验）：用于分析变量是否符合某种分布，可检验 Normal（正态分布）、Uniform（均匀分布）、 Poisson（Poission分布）和Exponential（指数分布）。操作过程如例3.1(血糖）中所做的探索性分析。

第十一章非参数检验

第十一章非参数检验前面有关章节讨论的参数检验都要求总体服从一定的分布，对总体参数的检验是建立在这种分布基础上的。

例如，两样本平均数比较的t 检验和多个样本平均数比较的F 检验，都要求总体服从正态分布，推断两个或多个总体平均数是否相等。

本章引入另一类检验——非参数检验（non-parametric test ）。

非参数检验是一种与总体分布状况无关的检验方法，它不依赖于总体分布的形式，应用时可以不考虑被研究的对象为何种分布以及分布是否已知。

当样本观测值的总体分布类型未知或知之甚少，无法肯定其性质，特别是观测值明显偏离正态分布，不具备参数检验的应用条件时，常用非参数检验。

非参数检验具有计算简便、直观，易于掌握，检验速度较快等优点。

例如，非配对资料的秩和检验，其效率为t 检验的86.4%，就是说以相同概率判断出差异显著，t 检验所需的样本个数要少13.6%。

非参数检验内容很多，本章只介绍常用的符号检验（sign test ），秩和检验（rank-sum test ）和等级相关分析（rank correlation analysis ）三种。

每对数据之差为正值用“+”表示，负值用“－”表示。

可以设想如果两个总体分布位置相同，则正或负出现的次数应该相等。

若不完全相等，至少不应相差过大，否则超过一定的临界值就认为两个样本所来自的两个总体差异显著，分布的位置不同。

社会统计学第十一章_非参数检验

根据题意
R1＝l+2+4+5+6+7+9+11+14+17＝76
R2＝3+8+10+12+13+15+16+18+19＝114
代入下两式得
所以检验统计量U＝min(U1,U2)＝U2＝2l 由α＝0.05查附表10得
Uα(n1 ，n2)＝U 0.05(10 ，9)＝20＜2l 所以不否定零假设，说明在0.05的水平上，不能认为专科类院
2020/8/28
6
[例] 假设我们观测15个相配的对，获得两个差为零和13个差不为零，其中有11个正号，2个负号，试在2.5％的显著性水平上进行单侧检验。
[解] H0：p＝0.5 H1：p (+)＞p (―)
由α＝0.025确定否定域，查二项分布表（附表2） P (13；13，0.5)＝0.000 P (12； 13，0.5)＝0.002 P (11； 13，0.5)＝ 0.010 P (10； 13，0.5)＝0.035
本科院校环境质量的名次(秩)为： 1，2，4，5，6，7，9，11，14，17 (n1＝10)
专科院校环境质量的名次(秩)为：
3，8，10，12，13．15．16，18，19 (n2＝9)
2020/8/28
21
[解] H0：专科类院校和本科类院校的环境质量无差异 H1：专科类院校和本科类院校的环境质量有差异
如此，这些很容易理解的方法还可以用于处理
2020等/8/28级的资料和定性的信息。
3
很显然，如果把从一个正态总体中抽取的数据用分布自由来处理，其效果肯定不如相应的参数检验有力。我们一般用下述指标来确定非参数检验的“效率” 。

张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(非参数检验)【圣才出品】

1 / 30
圣才电子书十万种考研考证电子书、题库视频学习平台

相关、 2 检验都属于非参数方法。一、非参数检验的基本概念与特点（一）非参数概念 1．“非参数”概念可以从不同的角度理解。它首先指非参数模型。当总体或样本的分
布能够由有限的几个参数来确定时，就是参数模型；否则就是非参数模型。从统计学的观点出发，参数模型，是指分布的模式（pattern）已经知道（比如说已经知道总体分布为正态分布），而其中的一些具体的细节（参数）是未知的，这种对分布模式的知识可以解释为在观察样本之前所掌握的信息，利用这种事先掌握的信息，可以使研究者更有效地提炼样本中的（关于参数的）信息。
二、单样本游程检验在进行推断统计时，往往要求是随机样本。单样本游程检验就是用来检验样本随机性的非参数检验。
3 / 3统计中，两个相同符号的连续串称为游程。根据游程数来判断样本的随机性的方法就
是单样本游程检验。
圣才电子书十万种考研考证电子书、题库视频学习平台

张厚粲《现代心理与教育统计学》第 3 版笔记和课后习题含考研真题详解第 11 章非参数检验
11.1 复习笔记
本章重点非参数检验的特点与原理秩和检验法中数检验法符号检验法等级方差分析。
统计推断问题有两个共同特点：一方面它们都是在给定或假定总体的分布形式基础上，对总体的未知参数进行估计或者检验，以明确的总体分布为前提；另一方面需要满足某些总体参数的假定条件。这一类假设检验一般都称之为参数检验（parametric test）。在实践中，研究人员对所研究的总体可能知之不多，有时对参数检验中的诸多要求和假定很难完全满足，这样，在不符合参数检验的条件下，参数检验就不适用了。此时，应当使用统计学中的另一类检验方法，即非参数检验（non-parametric test）。

非参数检验教学课件

如果多个配对样本得分布存在显著得差异, 那么数值普遍偏大得组秩和必然偏大,数值普遍偏小得组,秩和也必然偏小,各组得秩之间就会存在显著差异。如果各样本得平均秩大致相当,那么可以认为各组得总体分布没有显著差异。
2、多配对样本得Kendall协同系数检验
多配对样本得Kendall协同系数检验和 Friedman检验非常类似,也就是一种多配对样本得非参数检验,但分析得角度不同。多配对样本得Kendall协同系数检验主要用在分析评判者得判别标准就是否一致公平方面。她将每个评判对象得分数都看作就是来自多个配对总体得样本。一个评判对象对不同被判定对象得分数构成一个样本,其零假设为:样本来自得多个配对总体得分布无显著差异,即评判者得评判标准不一致。
非参数检验教学课件
但许多调查或实验所得得科研数据,其总体分布未知或无法确定。因为有得数据不就是来自所假定分布得总体,或者数据根本不就是来自一个总体,还有可能数据因为某种原因被严重污染,这样在假定分布得情况下进行推断得做法就有可能产生错误得结论。此时人们希望检验对一个总体分布形状不必作限制。
非参数检验根据样本数目以及样本之间得关系可以分为单样本非参数检验、两独立样本非参数检验、多独立样本非参数检验、两配对样本非参数检验和多配对样本非参数检验几种。
6、1 SPSS单样本K-S检验
6、1、1 统计学上得定义和计算公式定义:单样本K-S检验就是以两位前苏联数
学家Kolmogorov和Smirnov命名得,也就是一种拟合优度得非参数检验方法。单样本K-S检验就是利用样本数据推断总体就是否服从某一理论分布得方法,适用于探索连续型随机变量得分布形态。
Kendall协同系数检验中会计算Friedman 检验方法,得到friedman统计量和相伴概率。如果相伴概率小于显著性水平,可以认为这10 个节目之间没有显著差异,那么可以认为这5个评委判定标准不一致,也就就是判定结果不一致。

语言统计第十一章非参数检验

检验步骤如下：
第一步：陈述零假设H0和备择假设H1
第二步：设定显著水平a
第三步：计算每一对观测值之差，并记下差的符号〔即正值还是负值〕。
第四步：不考虑差的正负号，按其绝对值从小到大排序〔即赋予每个差一个 “秩〞〕。如果差为零，即两观测值相同,那么排除在外, 不再参加以后的分析〔观测值的对子的个数N就相应减少一个〕；如差相同，那么像曼惠特尼U检验那样，将其在不并列的情况下所应占得等级的平均值
决定使用哪个检验：
原那么—当使用t检验的条件满足时，应尽量使用t 检验，因为它毕竟能更充分地利用数据中的信息，因而能更容易发现总体之间存在的真正差异。
总之，如果t检验的条件得到了满足或根本满足，就尽量使用t检验，反之，如果数据为顺序数据，或虽是等距数据，但所来自的总体严重偏态，就应使用U检验。
例如，我们请两个人在一个0-7〔0表示 “完全可以接受〞，7表示完全不可以接受〞〕的量表上对15个句子的可接受程度〔acceptability〕打分，结果如表11.3所示。
我们现在检验一下在0.05的显著水平上两人所打的分是否有显著差异〔双尾〕。我们先计算每对分数之差，记下差的符号〔表中第四列〕，其中4个差为正号，8个为负号，即S=4.由于有3 个差为零，所以有效数据只有12对，即N=12.查表得临界值为2，由于S值大于临界值，所以不能推翻零假设，因而两人的分数没有显著差异。
符号检验的原理是：如果样本所来自的总休的分布没有差异，那么正差的个数就应大体等于负差的个数。符号检验的目的就是检验一下正负差的个数之间有无显著差异。
符号检验的步骤是：记录下每一对观测值〔等级〕之差的方向，而不是差本身〔如一对观测值相等，即其差为零，就将其排除在外，观测值的对子数N也随之减少〕，然后计算符号出现次数较少的观测值的对子个数，记为S作为检验统计值。附表9给出了S的临界值，如果S值小于或等于临界值，就可以推翻零假设。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第一节非参数检验的基本概念及特点一、非参数检验（一）什么是“非参数”非参数模型：缺乏总体分布模式的信息。

（二）非参数检验的定义非参数检验：不需要假设总体是否为正态分布或方差是否为齐性的假设检验称非参数检验。

（三）非参数检验的优点和缺点： 1、优点：一般不涉及总体参数，其假设前提也比参数假设检验少得多，适用面较广。

计算简便。

2、缺点：统计效能远不如参数检验方法。

由于当数据满足假设条件时，参数统计检验方法能够从其中广泛地充分地提取有关信息。

非参数统计检验方法对数据的限制较为宽松，只能从中提取一般的信息,相对参数统计检验方法会浪费一些信息。

（四）非参数检验的特点： 1、它不需要严格的前提假设； 2、特别适用于顺序数据； 3、适用于小样本，且方法简单；4、最大的不足是不能充分利用资料的全部信息；5、不能处理“交互作用”，即多因素情况。

第二节两个独立样本的非参数检验方法一、秩和检验法秩和即秩次的和或等级之和。

秩和检验法也叫Mann-Whitney-Wilcoxon 检验，它常被译为曼－惠特尼－维尔克松检验，简称M-W-W 检验，也称Mann-Whitney U 检验。

秩和检验法与参数检验法中独立样本的t 检验法相对应。

当“总体正态”这一前提不成立时，不能用t 检验，可以用秩和检验法。

（一）秩统计量秩统计量指样本数据的排序等级。

假设从总体中反复抽取样本，就能得到一个对应于样本容量1n 和2n 的秩和U 的分布。

这是一个间断而对称的分布，当1n 和2n 都大于10时，秩和T 的分布近期近似正态分布，其平均数和标准差分别为()21211++=n n n T μ ()1212121++=n n n n T σ其检验值为TTσμ-=T Z（二）计算过程1、小样本：两个样本容量均小于10（n 1≤10,n 2≤10）例11-1：在一项关于模拟训练的实验中，以技工学校的学生为对象，对5名学生用针对某一工种的模拟器进行训练，内外让6名学生下车间直接在实习中训练，经过同样的时间后对两组人进行该工种的技术操作考核，结果如下：模拟器组：56，62，42，72，76实习组：68，50，84，78，46，92假设两组学生初始水平相同，则两种训练方式有无显著差异？表11-1 两种训练方式的成绩考核成绩成绩排列等级等级和模拟器组（5人）56 42 1 251=T62 56 4 42 62 5 72 72 7 76 76 8 实习组 68 46 2 412=T（6人）50 50 3 84 68 6 78 78 9 46 84 10929211检验过程：1．建立假设0H ：∑∑=21R R ，即两样本无显著差异 a H ：∑∑≠21R R ，即两样本有显著差异2．计算统计量1）将数据从小到大排列，见上表。

2）混合排列等级，即将两组数据视为一组进行等级排列，见上表。

3）计算各组的秩和，并确定T 值，即 T = min （T 1，T 2）=min （25，41）=25 3．比较与决策若T 1＜T ＜T 2，则接受虚无假设，拒绝研究假设。

若T ≤T 1，或T ≥T 2，拒绝虚无假设，接受研究假设。

查秩和检验表，当n 1=5，n 2=6， T 1=19，T 2=41, 因为 19<25<41, 即T1<T<T2, 所以接受虚无假设，拒绝研究假设，差异不显著。

说明两种训练的成绩无显著差异。

2、大样本：两个样本容量均大于10（n 1>10,n 2>10）例11-2：对某班学生进行注意稳定性实验男生与女生的实验结果如下，试检验男女生之间注意稳定性有否显著差异？男生：（n 1=14）19,32,21,34,19,25,25,31,31,27,22,26,26,29 女生：（n 2＝17）25,30,28,34,23,25,27,35,30,29,29,33,35,37,24,34,32 检验过程: 1．建立假设0H ：∑∑=21R R a H ：∑∑≠21R R2．计算统计量1）求秩和T 。

先混合排列等级，再计算1T 和2T ，最后确定T 。

排序如下：男生：，，，，，，，，，，，，，，17 5.11 5.11 4 5.13 5.21 5.21 5.8 5.8 5.1 27 3 5.23 5.1 女生5.23 27 6 31 5.29 25 17 17 5.19 5.29 5.13 5.8 5 27 15 5.19 5.8，，，，，，，，，，，，，，，，175.115.1145.135.215.215.85.8 5.1 273 5.23 5.1T +++++++++++++＝174＝2）求Z 值98.12.25224174-T Z TT-=-==σμ3．比较与决策2/05.098.1Z Z 〉=，05.0〈p ，拒绝虚无假设，差异达到显著性水平。

说明男女在注意稳定性上有显著差异。

二、中数检验法（一）适用条件中数检验法对应着参数检验中两独立样本平均数之差的t 检验。

中数检验法的基本思想是将中数作为集中趋势的量度，检验不同的样本是否来自中位数相同的总体。

因而其虚无假设（H0）为：两个独立样本是从具有相同中数的总体中抽取的，它也可以是双侧检验或单侧检验。

双侧检验结果若有统计学意义，意味着两个总体中数有差异（并(),2242)11714(1421n n n 211T =++⨯=++＝μ()2.2512)11714(1714211n n n n 2121T =++⨯⨯=++=σ没有方向）；单侧检验结果若有统计学意义，则表明对立假设“一个总体中数大于另一个总体中数”成立。

（二）计算过程例题13-8：为了研究核糖核酸是否可以作为记忆的促进剂，研究者以老鼠为对象分成实验组与控制组。

实验组注射RNA ，控制组注射生理盐水，然后在同样的条件下学习走迷津，如果如下（单位：时间）。

试问两组的学习成绩有无显著差异？实验组：16.7，16.8，17.0，17.2，17.4，16.8，17.1，17.0，17.2，17.1，17.2，17.5，17.2，16.8，16.3，16.9控制组：76.6，17.2，16.0，16.2，16.8，17.1，17.0，16.0，16.2，16.5，17.1，16.2，17.1，16.8，16.51．提出假设0H ：mdn mdn B A =，即两组中位数相等，或两组成绩无显著差异 a H ：mdn mdn B A ≠，即两组中位数不等，或两组成绩有显著差异2．计算统计量1）求混合中数。

将数据按大小排列，确定中数。

表13-11 中数计算表16 16.2 16.3 16.5 16.6 16.7 16.8 16.9 17 17.1 17.2 17.4 17.5 f2 3 1 2 1 1 5 1 4 4 5 1 1 F2 568910151620242930319.1616213121====++X X X Mdn N2）统计多个样本在中数上下的次数，列出列联表。

表13-12 计数表实验组控制组 ∑＞Mdn 的次数 10 5 15 ＜Mdn 的次数5 10 15 ∑1515303）求2χ值()33.3151515155510103022=⨯⨯⨯⨯-⨯⨯=χ3．比较与决策33.32=χ＜()84.3205.01=χ，p ＞0.05，差异不显著，接受虚无假设，拒绝研究假设。

说明实验组与控制组在迷津学习中差异不显著，即RNA 对记忆无明显的促进作用。

第三节配对样本的非参数检验方法一、符号检验法(一)、适用条件符号检验是以正负符号作为资料的一种非参数检验程序。

它是一种简单的非参数检验方法，适用于检验两个配对样本分布的差异，与参数检验中配对样本差异显著性t 检验相对应。

符号检验也是将中数作为集中趋势的量度，虚无假设是配对资料差值来自中位数为零的总体。

它是将两样本每对数据之差（Xi —Yi ）用正负号表示，若两样本没有显著性差异，理论上正负号应各占一半或不相上下。

相反，若正负个数相关较大，则可能存在差异，由此表明两个样本不是来自同一总体，并可推论两样本的总体存在差异。

（二）、计算过程1、小样本符号检验法N ≤25例11-4：用配对设计方法对9名运动员不同方法训练，每一个对子中的一名运动员按传统方法训练，另一名运动员接受新方法训练。

课程进行一段时间后对所有运动员进行同一考核，结果如下。

能否认为新训练方法显著优于传统方法配对 1 2 3 4 5 6 7 8 9 传统（X ） 85 88 87 86 82 82 70 72 80 新法（Y ） 90 84 87 85 90 94 85 88 92 符号（X-Y ） -++-----1）建立假设单侧检验0H ：+P ＜-P a H ：+P ＞-P2）标记配对数据之差的符号。

见上表。

3）统计符号总数N 。

符号总数中不包含0，只包括正号和负号个数和，即-++=n n N = 2 + 6 = 84）将+n ，-n 中的较小者记为r ，即()-+=n n r ,m in 5）比较与决策根据符号总和N 及显著水平值α查符号检验临界值表，见附表15。

表中列出了符号总和与显著性水平α所对应的临界值αr ，其判断规则如下表。

表11-2 单侧符号检验法的方法的统计判断规则表r 与临界值（CR ）比较P 值差异显著性 r ＞r 0.05P ＞0.05不显著2==+nr 0.01＜r ≤r 0.05r ≤r 0.010.01＜P ≤0.05P ≤0.01显著极显著查附表15，N=8时，临界值为0（0.05水平），而实得r = n += 2> r 0.05。

所以差异不显著，接受虚无假设，不能认为新法显著优于传统方法。

2、样本容量N>25时在附表15中，虽然N 是从1到90，就是说N 在这个范围内时都可以用查附表15的方法，但是在世纪中当N>25时常常使用正态近似法。

将N 分为n+和n-两部分，为二项分布，根据二项分布的原理，有21==-+q p ，N Np 21==μ，22121N N Npq =⨯⨯==σ σμ-=r Z 22N N r -= 为了更接近正态分布，采用较正公式，即()2205.0N Nr Z -+=例11-5：在教学评价活动中，要求学生对教师的教学进行7点评价（即1－7分），下表是某班学生对一位教师期中与期末的两次评价结果，试问两次结果差异是否显著？①建立假设0H ：-+=P P a H ：+P ≠-P②确定正、负号数目，正负号总数N 的r 值8=+n ，19=-n ，27=+=-+n n N ，8)19,8min(==r③计算统计量92.12/272/27)5.08(-=-+=Z④比较与决策2/05.092.1Z Z 〈=p ＞0.05，接受虚无假设，差异不显著。

第十一章 非参数检验

非参数检验的基本原理

第十一章-非参数检验

第十一章非参数检验

第11章 非参数检验——卡方检验

非参数验课件

第十一章 非参数检验简述

非参数检验

《卫生统计学》课后思考题答案

非参数检验(提纲)

统计学习题 第十一章 非参数检验

第十一章非参数检验

非参数检验

统计学讲义第8讲非参数检验与Ridit分析

第十一章非参数检验

社会统计学 第十一章_非参数检验

张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(非参数检验)【圣才出品】

非参数检验教学课件

语言统计第十一章 非参数检验

第十一章非参数检验

第11章非参数检验——卡方检验

第十一章非参数检验简述

统计学习题第十一章非参数检验

社会统计学第十一章_非参数检验

语言统计第十一章非参数检验