第十一章_非参数检验

合集下载

非参数检验的基本原理

非参数检验的基本原理

非参数检验的基本原理非参数检验是一种利用统计方法来检验假设的一种方法,与参数检验相比,非参数检验不需要对总体的分布做出假设,更为灵活。

本文将介绍非参数检验的基本原理。

一、概述非参数检验是一种统计方法,既不要求数据符合特定分布,也不对总体参数做出假设。

与之相反,参数检验通常假设数据服从特定的分布,例如正态分布。

非参数检验的主要优点是可以更全面地处理数据,更适用于复杂的情况。

然而,非参数检验的统计效率通常较低,需要更多的样本来达到相同的置信水平。

二、基本原理1. 秩次转换非参数检验通常使用秩次转换来处理数据。

所谓秩次转换是将原始的数值转换为它们在样本中的秩次,从而消除数值的大小差异。

对于同一组数据,秩次转换后,可以应用更广泛的统计方法。

2. Wilcoxon符号秩检验Wilcoxon符号秩检验是一种非参数检验方法,主要应用于配对样本或者两组独立样本之间的差异比较。

它的基本思想是对每个观测值计算它们的符号秩,然后通过比较两组样本的秩和来判断差异是否显著。

3. Mann-Whitney U检验Mann-Whitney U检验是一种非参数检验方法,用于比较两组独立样本之间的差异。

它的基本原理是将两组样本中的所有观测值汇总,然后对这些观测值进行秩次转换,并计算两组样本排名和。

通过比较两组样本排名和的大小来判断差异是否显著。

4. Kruskal-Wallis H检验Kruskal-Wallis H检验是一种非参数的方差分析方法,用于比较三组或以上独立样本之间的差异。

它的基本原理是将所有样本的观测值汇总,然后进行秩次转换,并计算各组样本排名和的平均值。

通过比较平均排名和的大小来判断差异是否显著。

三、案例研究为了更好地理解非参数检验的原理,我们以某家公司销售部门的两个月销售额作为例子进行案例研究。

假设第一个月公司销售额为[100, 80, 120, 90, 110],第二个月公司销售额为[95, 85, 115, 100, 105]。

研究生统计学讲义第8讲非参数检验与Ridit分析

研究生统计学讲义第8讲非参数检验与Ridit分析
第二节 配对设计资料的秩和检验(Wilcoxon法)
所谓秩(rank), 又称等级, 实际上就是按数值大小顺 序作1, 2, 3, …, 等级的一种编码. 秩和检验常用于有序分 类变量或不符合用参数检验的资料. 两个或多个有序分 类变量(等级资料)的比较, 如临床疗效分为治愈, 显效, 好转, 无效; 尿糖分为-, +, ++, +++, ++++;针 麻效果分为Ⅰ,Ⅱ,Ⅲ,Ⅳ级等.
-9
-7
-6 ­— -4
-5 -11
(1) H0:配对差值总体中位数Md=0; H1:配对差值总体中位数Md ≠0 .α=0.05. 差值 -20 36 -5 -2 2 0… -10 -48
rank -8 10 - 3 -1.5 1.5 … -5 -11
a.在n≤25时,可查统计用表11,用T值与T界值进行比 较.若T值在上、下界范围内,则 P 值大于相应概率; 若T值为上、下界值或范围外,则 P 值小于相应概 率. 由于n=11(因为有0),T+=11.5、T-=54.5,则统计量T =11.5. 查统计用表12,11.5在(10,56)内,双侧P>0.05, 以=0.05水准不拒绝H0,差值总体中位数与0的差异 有无统计意义,尚不能认为两法检测谷-丙转氨酶的结
值范围是0~15,
而P(T=0)=P(T=15)=1/32=0.03125,双侧概率为 0.03125×2=0.06250,已大于0.05。所以当n≤5时,用 符号秩和检验不能得出双侧概率P<0.05,故 n 必须大 于5。
1.配对设计资料比较的符号秩和检验
①例对9.1
子 编 1 2 3 4 5 6 7 8 9 10 11 12
ti为第i个相同秩次的个数
解法2:软件计算

第十一章-非参数检验

第十一章-非参数检验
R>R0.05时,P>0.05, R≤R0.05时,P≤0.05
本例: R=10<R0.05=14,n=12, P<0.05,拒绝H0,故认为A,B两种 照射方式造成的急性皮肤损伤程度不 同,B照射的损伤程度比A照20射24年严9月重2。1日
(ii)大样本(n>10)时, 可采用正态近似
u | R n(n 1) / 4 | 10 12(12 1) / 4 2.275 n(n 1)(2n 1) / 24 12(12 1)(2 12 1) / 24
在0.05检验水平拒绝H0,接受H1,认为三组脾淋巴 细胞对HPA刺激的增值反应不全相同。
2024年9月21日
频数表法: 属于同一组段的 观察值,一律取平均秩次(组 中值),再以该组段频数加权 ,计算Hc值。 表 分娩时孕周与乳量的关系
乳 量
早 产
足月 产
过期 产
合计
秩次 范围
平均
秩和
秩次 早产 足月产 过期产
查标准正态分布表,得 P 值 校正公式:(当相同秩次个数较多时)
| R n(n 1) / 4 |
u
n(n 1)(2n 1) / 24 (ti3 ti ) / 48
10 12(12 1) / 4 2.282
12(12 1)(212 1) / 24 [(33 3) (33 3)]/ 48
2024年9月21日
⑴ H0: 两样本来自相同总体; H1: 两样本来自不同总体(双侧)
=0.05
或H1: 样本A高于样本B(单侧)
⑵ 编秩:两样本混合编秩次,求得R1、R2.T。
相同观察值(即相同秩,ties),不同组------平均秩次。 ⑶ 确定P值作结论:
①查表法 (n0≤10,n2 n1≤10) 查附表9

第十一章非参数检验

第十一章非参数检验

第十一章 非参数检验前面有关章节讨论的参数检验都要求总体服从一定的分布,对总体参数的检验是建立在这种分布基础上的。

例如,两样本平均数比较的t 检验和多个样本平均数比较的F 检验,都要求总体服从正态分布,推断两个或多个总体平均数是否相等。

本章引入另一类检验——非参数检验(non-parametric test )。

非参数检验是一种与总体分布状况无关的检验方法,它不依赖于总体分布的形式,应用时可以不考虑被研究的对象为何种分布以及分布是否已知。

非参数检验主要是利用样本数据之间的大小比较及大小顺序,对两个或多个样本所属总体是否相同进行检验,而不对总体分布的参数如平均数、标准差等进行统计推断。

当样本观测值的总体分布类型未知或知之甚少,无法肯定其性质,特别是观测值明显偏离正态分布,不具备参数检验的应用条件时,常用非参数检验。

非参数检验具有计算简便、直观,易于掌握,检验速度较快等优点。

非参数检验法从实质上讲,只是检验总体分布的位置(中位数)是否相同,所以对于总体分布已知的样本也可以采用非参数检验法,但是由于它不能充分利用样本内所有的数量信息,检验的效率一般要低于参数检验方法。

例如,非配对资料的秩和检验,其效率为t 检验的86.4%,就是说以相同概率判断出差异显著,t 检验所需的样本个数要少13.6%。

非参数检验内容很多,本章只介绍常用的符号检验(sign test ),秩和检验(rank-sum test )和等级相关分析(rank correlation analysis )三种。

第一节 符号检验一、配对资料的符号检验(一)配对资料符号检验的意义 配对资料符号检验是根据样本各对数据之差的正负符号多少来检验两个总体分布位置的异同,而不去考虑差值的大小。

每对数据之差为正值用“+”表示,负值用“-”表示。

可以设想如果两个总体分布位置相同,则正或负出现的次数应该相等。

若不完全相等,至少不应相差过大,否则超过一定的临界值就认为两个样本所来自的两个总体差异显著,分布的位置不同。

第11章 非参数检验——卡方检验

第11章 非参数检验——卡方检验
f (横行总次数) * (纵列总次数) N
2
a
n(ad bc)2
bc d a cb
d
第11章 非参数检验——卡方2检验
一、卡方检验概述 二、吻合性检验 三、独立性检验
一、卡方检验原理
(一)定义 检验频数资料的实际观测次数分布与理论次数分布之
间差异是否显著的方法。
(二)目的 检验每一组实际观察次数与理论次数是否吻合; 检验四格表中分类标志是否独立。
一、卡方检验原理
(三)公式
实际观测次数
2 ( f0 fe )2 fe
理论次数
(四)性质 1. 非负 2. 形状受df影响,当df趋近∞时,2分布为正态。 3. 实际观测次数与理论次数差异越大,2值越大;反
之,则2越小。
二、吻合性检验
实得分布与理论分布是否吻合; 判断实得分布与原有分布是否之一。 例1,例2, 例3。
三、独立性检验
检验两种分类标志下现象间是否相互独立。
2 × 2列联表
df =(r-1)(c-1)
例4
f (横行总次数) * (纵列总次数) N
2
a
n(ad bc)2
bc d a cb
d

当df=1,f<5时,采用公式校正
例5
三、独立性检验
检验两种分类标志下现象间是否相互独立。 2 × 2列联表 df =(r-1)(c-1)

非参数统计(non-parametricstatistics)又称任意分布检验(

非参数统计(non-parametricstatistics)又称任意分布检验(

例11.6(P195)。
(一)建立检验假设
H0:某中药治疗四种病型 的疗效总体分布相同 H1:四个总体的分布不同 或不全同
0.05
(二)计算统计量H值 (1)编秩:a、计算各等级的合计人数 b、确定秩次范围 c、计算平均秩次 (2)求各组秩和
R1 65(139.5) 18(304.0) 30(397.5) 13(504.5)
血浆总皮质醇含量有差别(不同或不全同)。
若还希望分析具体哪些组之间有差别,需进一步两两组 间比较。方法见《卫生统计学》第五版P196,《医学统计学》 第二版P183等。
当相同秩次较多(超过25%)时,需进行如下校正。
例11.4(P193),见表11-4。
(一)建立检验假设
H0:接种三种不同菌型伤 寒杆菌存活日数总体分 布相同 H1:三个总体的位置不同 或不全同
适用于完全随机设计分组的多个样本比较(即不满足参
数统计条件的),目的在于判断多个总体分布是否相同。
例11.3(P192),见表11-3。
(一)建立检验假设
H
:血浆总皮质醇含量的
0
三个总体分布相同
H1:血浆总皮质醇含量的 三个总体分布不同或不 全同
0.05
(二)计算统计量H值
1、编秩
先将各组数据分别由小到大排列,统一编秩,不同组的
注意:等级资料对程度的比较不应选检验。
例11.5(P194)。
(一)建立检验假设
H
:吸烟工人和不吸烟工
0
人的HbCO%含量总体分布位置相

H1:吸烟工人的HbCO%含量高于不吸烟工人 的HbCO%含量
0.0(5 单侧)
(二)计算统计量u值
(1)编秩:a、计算各等级的合计人数

第十一章 非参数检验简述

第十一章 非参数检验简述

不如参数检验。
• 两独立样本非参数检验方法
– 秩和检验法
– 中数检验法
• 两相关样本非参数检验方法
– 符号检验法 – 符号等级检验法 • 克—瓦式单向方差分析
第一节 两独立样本非参数检验方法
一、秩和检验 • 两个样本的容量都小于或等于10时
– 将所有数据由小到大赋予秩次 – 求样本容量较小的一组数据的秩次之和“T” – 将T值与临界值作比较。若 T1 < T < T2 则差异 不显著
Z T n ( n 1) / 4 n ( n 1)( 2 n 1) 24
第三节 单向秩次方差分析
• 方法:将所有样本的数据合在一起,按从 小到大编秩次,然后计算各样本的秩次和。 如果各组没有显著性差异,各组秩次和应 当相等或趋于相等;如果各组秩次和相差 较大,那么各组有显著性差异的可能性较 大。
例题
序号
1 2 3 4 5 n
甲校 128 114 103 92 85 5
原始分数 乙校 90 91 106
丙校 89 80 101
3
3
• 2.37
Z ( r 0 .5 ) n / 2 1 2 n ( 9 0 . 5 ) 31 / 2 1 2 31 2 . 16
二、符号秩次检验
• 威尔科克松(F.Wilcoxon)提出了既考虑差 数符号,又考虑差数大小的符号秩次检验 法。
• 当样本容量n<25时,可用查表法进行符 号秩次检验。 • 当样本容量n>25时,可用正态分布近似 处理。检验统计量为:
Z
( r 0 .5 ) n / 2 1 2 n
例题
• 32名被试中有1名被试对两种包装打出相 同的分数,有22名被试认为A包装比B包 装好,另有9名被试认为B包装比包装A好。 问:被试对两种包装的偏好程度有无显 著差异?

语言统计第十一章 非参数检验

语言统计第十一章 非参数检验
检验步骤如下:
第一步: 陈述零假设H0和备择假设H1
第二步: 设定显著水平a
第三步:计算每一对观测值之差,并记下 差的符号〔即正值还是负值〕 。
第四步:不考虑差的正负号,按其绝对值 从小到大排序〔即赋予每个差一个 “秩 〞 〕 。 如果差为零, 即两观测值相同,那 么排除在外, 不再参加以后的分析〔观测值 的对子的个数N就相应减少一个〕 ; 如差 相同, 那么像曼惠特尼U检验那样,将其 在不并列的情况下所应占得等级的平均值
决定使用哪个检验:
原那么—当使用t检验的条件满足时,应尽量使用t 检验,因为它毕竟能更充分地利用数据中的信息, 因而能更容易发现总体之间存在的真正差异。
总之,如果t检验的条件得到了满足或根本满足, 就尽量使用t检验,反之,如果数据为顺序数据, 或虽是等距数据,但所来自的总体严重偏态,就 应使用U检验。
例如,我们请两个人在一个0-7〔0表示 “完全可 以接受〞,7表示完全不可以接受〞 〕 的量表上 对15个句子的可接受程度 〔acceptability〕 打分, 结果如表11.3所示。
我们现在检验一下在0.05的显著水平上两人所打 的分是否有显著差异 〔双尾〕 。 我们先计算每 对分数之差, 记下差的符号 〔表中第四列〕, 其中4个差为正号,8个为负号,即S=4.由于有3 个差为零,所以有效数据只有12对,即N=12.查 表得临界值为2,由于S值大于临界值, 所以不 能推翻零假设,因而两人的分数没有显著差异。
符号检验的原理是:如果样本所来自的总休的分 布没有差异,那么正差的个数就应大体等于负差 的个数。符号检验的目的就是检验一下正负差的 个数之间有无显著差异。
符号检验的步骤是: 记录下每一对观测值 〔等 级〕 之差的方向, 而不是差本身 〔如一对观测 值相等, 即其差为零, 就将其排除在外, 观测 值的对子数N也随之减少〕,然后计算符号出现 次数较少的观测值的对子个数,记为S作为检验 统计值。附表9给出了S的临界值,如果S值小于 或等于临界值,就可以推翻零假设。

统计学习题 第十一章 非参数检验

统计学习题 第十一章  非参数检验

第十一章非参数检验第一节符号检验符号检验的方法·符号检验的特点和作用第二节配对符号秩检验配对符号秩检验的方法·配对符号秩检验的效力第三节秩和检验秩和检验的方法·秩和检验的近似第四节游程检验游程的概念·游程检验的方法·差符号游程检验第五节累计频数检验累计频数检验的方法·累计频数检验的应用一、填空1.非参数检验,泛指“对分布类型已知的总体进行参数检验”()的所有检验方法。

2.符号检验的零假设就是配对观察结果的差平均起来等于()。

3.理论研究表明,对于配对样本非正态分布的差值d,()是最佳检验。

4.秩和检验检验统计量U是U1和U2中较()的一个。

5.秩尺度之统计量的均值和标准差只取决于()。

6.()常被用作经验分布与理论分布的比较。

7.绝对值相等的值,应将它们的秩()。

8.符号检验,在分布自由检验中称为()。

9.符号检验和配对符号秩检验,都只适用于()样本。

10.数据序列ABBABAAABABBABBAAAAAB的总游程数是()二、单项选择1.下列检验中,不属于非参数统计的方法的是()。

A总体是否服从正态分布 B 总体的方差是否为某一个值C 样本的取得是否具有随机性D 两组随机变量之间是否相互独立2.下列情况中,最适合非参数统计的方法是()。

A反映两个大学新生成绩的差别B 反映两个大学新生家庭人均收入的差别C 反映两个大学三年级学生对就业前景的看法差别D反映两个大学在校生消费水平的差别3.不属于非参数检验的是()。

A符号检验B游程检验C累计频数检验 D F检验4.在累计频数检验中,卡方的自由度为()。

A n1B 2C n2D n1+n25.配对符号秩检验的效力( )。

A 小于符号检验B 大于t 检验C 介于符号检验与t 检验之间D 无法与符号检验及t 检验比较 6.如果我们说非参数检验的效力是80%,下列哪种解释正确。

( )A 如果用参数检验需要100个数据,那么在同等的检验效力下,非参数检验只要80个数据;B 如果用非参数检验需要100个数据,那么在同等的检验效力下,参数检验只要80个数据;C 如果用参数检验需要100个数据,那么在同等的检验效力下,非参数检验只要20个数据;D 如果用非参数检验需要100个数据,那么在同等的检验效力下,参数检验只要20个数据;7.对于秩和检验,U 1、U 2和n 1、 n 2的关系是( )。

第十一章非参数检验

第十一章非参数检验

第一节 非参数检验的基本概念及特点一、非参数检验(一)什么是“非参数”非参数模型:缺乏总体分布模式的信息。

(二)非参数检验的定义非参数检验:不需要假设总体是否为正态分布或方差是否为齐性的假设检验称非参数检验. (三)非参数检验的优点和缺点: 1、优点:一般不涉及总体参数,其假设前提也比参数假设检验少得多,适用面较广。

计算简便。

2、缺点:统计效能远不如参数检验方法。

由于当数据满足假设条件时,参数统计检验方法能够从其中广泛地充分地提取有关信息.非参数统计检验方法对数据的限制较为宽松,只能从中提取一般的信息,相对参数统计检验方法会浪费一些信息。

(四)非参数检验的特点: 1、它不需要严格的前提假设; 2、特别适用于顺序数据; 3、适用于小样本,且方法简单;4、最大的不足是不能充分利用资料的全部信息;5、不能处理“交互作用”,即多因素情况。

第二节 两个独立样本的非参数检验方法一、秩和检验法秩和即秩次的和或等级之和。

秩和检验法也叫Mann —Whitney —Wilcoxon 检验,它常被译为曼-惠特尼-维尔克松检验,简称M —W-W 检验,也称Mann-Whitney U 检验。

秩和检验法与参数检验法中独立样本的t 检验法相对应。

当“总体正态”这一前提不成立时,不能用t 检验,可以用秩和检验法。

(一)秩统计量秩统计量指样本数据的排序等级.假设从总体中反复抽取样本,就能得到一个对应于样本容量1n 和2n 的秩和U 的分布.这是一个间断而对称的分布,当1n 和2n 都大于10时,秩和T 的分布近期近似正态分布,其平均数和标准差分别为()21211++=n n n T μ ()1212121++=n n n n T σ其检验值为TT σμ-=T Z(二)计算过程1、小样本:两个样本容量均小于10(n 1£10,n 2£10)例11—1:在一项关于模拟训练的实验中,以技工学校的学生为对象,对5名学生用针对某一工种的模拟器进行训练,内外让6名学生下车间直接在实习中训练,经过同样的时间后对两组人进行该工种的技术操作考核,结果如下:模拟器组:56,62,42,72,76实习组:68,50,84,78,46,92假设两组学生初始水平相同,则两种训练方式有无显著差异?表11—1 两种训练方式的成绩考核成绩 成绩排列 等级 等级和模拟器组 (5人) 56 42 1 251=T62 56 4 42 62 5 72 72 7 76 76 8 实习组 68 46 2 412=T(6人) 50 50 3 84 68 6 78 78 9 46 84 10929211检验过程:1.建立假设 0H :∑∑=21R R ,即两样本无显著差异 aH :∑∑≠21R R ,即两样本有显著差异2.计算统计量1)将数据从小到大排列,见上表。

非参数检验

非参数检验
非参数检验又称为任意分布检验 (distribution-free test),它不考虑 研究对象总体分布具体形式,也不对总体 参数进行统计推断,而是通过检验样本所 代表的总体分布形式是否一致来得出统计 结论。
非参数检验的优点:
①适用范围广,不论样本来自的 总体分布形式如何,都可适用;
②某些非参数检验方法计算简便, 研究者在急需获得初步统计结果时可 采用;
的总体分布不同。 α=0.05
2.混合编秩
依据两组数值由小到大编秩,结果 见上表。
3.求秩和并确定检验统计量T
把两组秩次分别相加求出两组的秩 和值,R1=315.5,R2=149.5。因乳 酸钙组样本含量较小,故 T=R2=149.5。
4.确定P值和作出推断结论 以较小样本含量为n1,n1=14, n2n1=2,查附表6,两样本比较秩和检验 用T界值表(双侧)。
当n1>20或(n2-n1)>10时,附表6 中查不到P值,则可采用正态近似法求u 值来确定P值,其公式如下:
u T n1(N 1) / 2 0.5 n1n2(N 1) 12
上式中T为检验统计量值,n1、n2 分别为两样本含量,N=n1+n2,0.5这 连续性校正数。上式为无相同秩次时使 用或作为相同秩次较少时的近似值。当 两样本相同秩次较多(超过总样本数的 25%)时,应按下式进行校正,u经校 正后可略增大,P值则相应减小。
式中,Ri为各组的秩和,ni为各组 样本含量,N为总样本含量。
当各组相同秩次较多时,可对H值进 行校正,按下式求值。
Hc H c
C 1
(t
3 j
t
j
)
(N3 N)
4.确定P值和作出推断结论
当组数K=3,每组样本含量ni≤5时, 可查附表7(H界值表)得到P值。若 k>3或ni>5时,H值的分布近似于自 由度为k-1的χ2分布,此时可查附表 4χ2界值表得到P值。最后按P值作出 推断结论。

第十一章非参数检验

第十一章非参数检验

第十一章 非参数检验前面有关章节讨论的参数检验都要求总体服从一定的分布,对总体参数的检验是建立在这种分布基础上的。

例如,两样本平均数比较的t 检验和多个样本平均数比较的F 检验,都要求总体服从正态分布,推断两个或多个总体平均数是否相等。

本章引入另一类检验——非参数检验(non-parametric test )。

非参数检验是一种与总体分布状况无关的检验方法,它不依赖于总体分布的形式,应用时可以不考虑被研究的对象为何种分布以及分布是否已知。

非参数检验主要是利用样本数据之间的大小比较及大小顺序,对两个或多个样本所属总体是否相同进行检验,而不对总体分布的参数如平均数、标准差等进行统计推断。

当样本观测值的总体分布类型未知或知之甚少,无法肯定其性质,特别是观测值明显偏离正态分布,不具备参数检验的应用条件时,常用非参数检验。

非参数检验具有计算简便、直观,易于掌握,检验速度较快等优点。

非参数检验法从实质上讲,只是检验总体分布的位置(中位数)是否相同,所以对于总体分布已知的样本也可以采用非参数检验法,但是由于它不能充分利用样本内所有的数量信息,检验的效率一般要低于参数检验方法。

例如,非配对资料的秩和检验,其效率为t 检验的86.4%,就是说以相同概率判断出差异显著,t 检验所需的样本个数要少13.6%。

非参数检验内容很多,本章只介绍常用的符号检验(sign test ),秩和检验(rank-sum test )和等级相关分析(rank correlation analysis )三种。

第一节 符号检验一、配对资料的符号检验(一)配对资料符号检验的意义 配对资料符号检验是根据样本各对数据之差的正负符号多少来检验两个总体分布位置的异同,而不去考虑差值的大小。

每对数据之差为正值用“+”表示,负值用“-”表示。

可以设想如果两个总体分布位置相同,则正或负出现的次数应该相等。

若不完全相等,至少不应相差过大,否则超过一定的临界值就认为两个样本所来自的两个总体差异显著,分布的位置不同。

社会统计学 第十一章_非参数检验

社会统计学 第十一章_非参数检验
根据题意
R1=l+2+4+5+6+7+9+11+14+17=76
R2=3+8+10+12+13+15+16+18+19=114
代入下两式得
所以检验统计量U=min(U1,U2)=U2=2l 由α=0.05查附表10得
Uα(n1 ,n2)=U 0.05(10 ,9)=20<2l 所以不否定零假设,说明在0.05的水平上,不能认为专科类院
2020/8/28
6
[例] 假设我们观测15个相配的对,获得两个差为零和13个差不为 零,其中有11个正号,2个负号,试在2.5%的显著性水平上进行单 侧检验。
[解] H0:p=0.5 H1:p (+)>p (―)
由α=0.025确定否定域,查二项分布表(附表2) P (13;13,0.5)=0.000 P (12; 13,0.5)=0.002 P (11; 13,0.5)= 0.010 P (10; 13,0.5)=0.035
本科院校环境质量的名次(秩)为: 1,2,4,5,6,7,9,11,14,17 (n1=10)
专科院校环境质量的名次(秩)为:
3,8,10,12,13.15.16,18,19 (n2=9)
2020/8/28
21
[解] H0:专科类院校和本科类院校的环境质量无差异 H1:专科类院校和本科类院校的环境质量有差异
如此,这些很容易理解的方法还可以用于处理
2020等/8/28级的资料和定性的信息。
3
很显然,如果把从一个正态总体中抽取的数据用分布 自由来处理,其效果肯定不如相应的参数检验有力。我们 一般用下述指标来确定非参数检验的“效率” 。

张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(非参数检验)【圣才出品】

张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(非参数检验)【圣才出品】
1 / 30
圣才电子书 十万种考研考证电子书、题库视频学习平台

相关、 2 检验都属于非参数方法。 一、非参数检验的基本概念与特点 (一)非参数概念 1.“非参数”概念可以从不同的角度理解。它首先指非参数模型。当总体或样本的分
布能够由有限的几个参数来确定时,就是参数模型;否则就是非参数模型。从统计学的观点 出发,参数模型,是指分布的模式(pattern)已经知道(比如说已经知道总体分布为正态 分布),而其中的一些具体的细节(参数)是未知的,这种对分布模式的知识可以解释为在 观察样本之前所掌握的信息,利用这种事先掌握的信息,可以使研究者更有效地提炼样本中 的(关于参数的)信息。
二、单样本游程检验 在进行推断统计时,往往要求是随机样本。单样本游程检验就是用来检验样本随机性的 非参数检验。
3 / 3统计中,两个相同符号的连续串称为游程。根据游程数来判断样本的随机性的方法就
是单样本游程检验。
圣才电子书 十万种考研考证电子书、题库视频学习平台

张厚粲《现代心理与教育统计学》第 3 版笔记和课后习题含考研真题详解 第 11 章 非参数检验
11.1 复习笔记
本章重点 非参数检验的特点与原理 秩和检验法 中数检验法 符号检验法 等级方差分析。
统计推断问题有两个共同特点:一方面它们都是在给定或假定总体的分布形式基础上, 对总体的未知参数进行估计或者检验,以明确的总体分布为前提;另一方面需要满足某些总 体参数的假定条件。这一类假设检验一般都称之为参数检验(parametric test)。在实践中, 研究人员对所研究的总体可能知之不多,有时对参数检验中的诸多要求和假定很难完全满 足,这样,在不符合参数检验的条件下,参数检验就不适用了。此时,应当使用统计学中的 另一类检验方法,即非参数检验(non-parametric test)。

非参数检验的概念与过程

非参数检验的概念与过程

非参数检验的概念与过程导言在统计学中,非参数检验是一种不依赖于总体分布假设的方法,用于对数据进行统计推断。

与参数检验相比,非参数检验更加灵活,适用于各种数据类型和样本量的情况。

本文将介绍非参数检验的基本概念及其应用过程。

什么是非参数检验?在传统的统计推断中,我们通常需要假设数据的总体分布满足某种特定的参数化模型(如正态分布)。

然而,在实际应用中,我们并不总是了解或能够准确描述数据的分布。

此时,非参数检验成为一种有力的工具。

非参数检验不依赖于总体分布的假设,而是在不对数据做过多假设的情况下,通过对样本数据的排序、秩次转换等操作,进行统计推断。

非参数检验的应用场景非参数检验广泛应用于多个领域,特别是当数据不满足参数化分布假设时。

下面列举几个常见的应用场景:1. 样本量较小在样本量较小的情况下,参数化方法可能对数据分布的假设过于苛刻,导致结果不够准确。

而非参数检验则不对数据分布做过多要求,能够更灵活地处理小样本数据。

2. 数据不满足正态分布假设正态分布假设是很多参数检验方法的基础前提。

但在实际问题中,数据往往并不服从正态分布。

非参数检验不需要对数据做分布假设,因此更适用于处理不满足正态分布假设的数据。

3. 数据有序或等级性质对于无法直接度量或比较数值大小的数据,如排名数据、生活满意度评价等,非参数检验提供了一种适用的方法。

通过对数据的秩次进行比较,我们可以推断出两组数据是否存在显著差异。

非参数检验的基本过程非参数检验通常包括以下几个基本步骤:1. 建立原假设和备择假设在进行非参数检验之前,我们需要明确所研究的问题,并建立原假设(H0)和备择假设(H1)。

原假设通常是指两组样本没有显著差异,而备择假设则相反。

2. 选择合适的非参数检验方法根据实际问题和数据类型的特点,选择合适的非参数检验方法。

常用的非参数检验方法包括Wilcoxon秩和检验、Mann-Whitney U检验、Kruskal-Wallis单因素方差分析等。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2014-2-7 6
[例] 假设我们观测15个相配的对,获得两个差为零和13个差不为 零,其中有11个正号,2个负号,试在2.5%的显著性水平上进行单 侧检验。 [解] H0:p=0.5 H1:p (+)>p (―) 由α=0.025确定否定域,查二项分布表(附表2) P (13;13,0.5)=0.000 P (12; 13,0.5)=0.002 P (11; 13,0.5)= 0.010 P (10; 13,0.5)=0.035 P (13) + P(12)+ P (11)=0.000 + 0.002 + 0.010 =0.012<0.025 P (13) + P (12) + P (11) +P(10)= 0.012 + 0.035=0.047>0.025 所以否定域由x等于11,12,13组成。现检验统计量 x=11,
12
配对符号秩检验的零假设基本上和符号检验以及用于 配对样本的 t 检验的零假设相同。配对符号秩检验的步骤 如下:
(1) 首先求出每对数据的差值d 。
(2) 不计正负,按绝对值大小把差值d按顺序排列起来。 (3)绝对值最小者赋秩为l,第二小者赋秩为2,……,绝对
值最大者赋秩为n (其中绝对值相等者,将它们应得的秩均分
2014-2-7
21

[解] H0:专科类院校和本科类院校的环境质量无差异 H1:专科类院校和本科类院校的环境质量有差异 根据题意 R1=l+2+4+5+6+7+9+11+14+17=76 R2=3+8+10+12+13+15+16+18+19=114 代入下两式得
所以检验统计量U=min(U1,U2)=U2=2l 由α=0.05查附表10得 Uα(n1 ,n2)=U 0.05(10 ,9)=20<2l 所以不否定零假设,说明在0.05的水平上,不能认为专科类院
2014-2-7 18
(3)分别计算两样本的秩和:样本l中所有X1,X2,…, X n1的秩和 记作R1;样本2中所有Y1,Y2,…,Y n2的秩和记作R2。 (4)秩和检验是针对两个总体具有完全相同的形式的零假设而进 行检验的。在均值差检验中,研究的重点放在中心趋势的差异上, 而不是离差的差异或形式的差异。秩和检验的零假设则可以用任 何差异形式表示出来。 (5)计算检验统计量U 。检验统计量U是对混合样本中n1+ n2个元 素根据它们的秩和和它们所属的总体标出的双重指标
2014-2-7 10
第二节 配对符号秩检验
对于配对样本,至此我们已经接触了两种 检验,即符号检验和t检验。在符号检验中, 只考虑差值d的符号而不管其大小,并且应用 二项分布检验零假设。另一方面,最有力的检 验—— t 检验,则不仅需要定距尺度,而且还 要求假定差值d服从正态分布。配对符号秩检 验兼备了上述两种检验的某些特征,其效力也 介乎两者之间。
2014-2-7 16
将[例11.2.1]与[例l0.3.1]和[例11.1.2]对比,可见配对符号秩检验 的效力比符号检验的效力高得多,而很接近于t 检验的效力。理论研 究表明,对于配对样本非正态分布的差值d,配对符号秩检验是最佳 检验。 虽然本例中n 很小,但是为了说明用法,我们仍然使用正态近似
2014-2-7
15
[解] H0:T+ =|T-|,即在总体中,正秩和等于负秩和。 H1:T+ >|T-|。 前表给出了有关资料,由此又列出了配对符号 秩检验所需要的数据。根据表中数据,可以看出负 秩和小于正秩和。因此检验统计量T 取负秩和。 T =|T-|=1.5 + 4 + 8=13.5 由α=0.025,n=13,查表得单侧检验的 T0.025(13)=l7>13.5,所以否定T+ =|T-|的零假设, 即说明该实验刺激有效。
2014-2-7 2
非参数检验,无需做出经典统计所必要的
关于分布的任何假设。唯一需要的假设是:全
部数据或数据对都出自相同的基本总体,且取 样是随机的、相互独立的。基于这种原因,非 参数检验又称为分布自由(或无分布)检验。 “无
分布”不是指总体真的无分布,而是指虽有时 对
总体分布一无所知,但仍可以进行分析。不仅 如此,这些很容易理解的方法还可以用于处理
H1:p (+)>p (―)
由上例知,B(x;13,0.5)在α=0.025显著性
水平上,单侧检验(p>0.5)否定域由 x 由11, 12,13组成。 观察前表知,在13个相配的对中,10个差为 正号,3个差为负号,即检验统计量 x=10。所 以零假设 p=0.5在2.5%显著性水平上不能被拒 绝。
[例] 设评审专家对19所大专院校按校园环境质量排 名次,环境质量最好的学校记分数为1,环境质量最差的 学技记分数为19。其中10所学校是本科院校,其他9所学 校是专科院校。假定这19所学校是分别从全部大专院校 中随机地抽取的,试问:专科类院校和本科类院校的环 境质量是否有显著性差异(α=0.05)? 本科院校环境质量的名次(秩)为: 1,2,4,5,6,7,9,11,14,17 (n1=10) 专科院校环境质量的名次(秩)为: 3,8,10,12,13.15.16,18,19 (n2=9)
双侧检验 p (+)≠p (―) 很显然,符号检验就是先假设 p=0.5,按二项分布计算正号“+”
出现次数之抽样分布,然后以样本中正号“+”出现的次数 x 作为检
验统计量。如果它是B(x;n,0.5)下的小概率事件,便否定对差分 布之中位数为零的零假设,即认为两总体存在平均水平上的差别。
由此可见,符号检验是二项检验的一种实际应用。
2014-2-7
19
检验统计量U是U1和U2中较小的一个,即U= min(U1,U2),然后用下式核对计算
U1 + U2 =n1 n2
(6)给出显著性水平α,从秩和检验表(附表10)中 查出临界值Uα,如果计算出的U值小于或等于从附表10 中查出的临界值Uα(n1 ,n2),则零假设被拒绝。
2014-2-7 20
2014-2-7 11
配对符号秩检验对于非正态分布的d 值,是
最佳检验,其检验效力大大高于符号检验。如
果 t 检验的假定成立,配对符号秩检验的检验
效力对于大、小样本都近乎为95%。因此,在
定距尺度测量的水平上,若由于样本容量太小 而不能假定正态分布的时候,配对符号秩检验 特别有用。
2014-2-7
之),再在差值前补填上符号。 (4)求得正差值的秩和T+ 及负差值的秩和T- 。我们期望 两个秩和应该近似相等。如果T+和T-相差太大,就应该否定 零假设。
2014-2-7
13
(5)取两个秩和中较小的一个,即T=min(T+ ,|T-|), 作为检验统计量。 (6)给定显著性水平α。如果n小,从配对符号秩检验 表(附表9)中直接查出临界值Tα(n)。如果n大(n>25),就 要应用正态近似法,查出Zα(单侧检验)或Zα/2(双侧检验), 同时检验统计量Z按下式计算
2014-2-7 的是各个对的结果要相互独立。 5
符号检验的零假设就是配对观察结果的差平均起来等于零:人们 期望这些差中有一半小于零(负号),而另一半大于零(正号),因此
符号检验就是对差分布之中位数为零的零假设检验。现将符号检验
的零假设和备择假设表达如下 H0:p (+)=p (―)=0.5
H1:单侧检验 p (+)>p (―)或 p (+)<p (―)
2014-2-7 1
与均值差等检验比较,非参数检验有什么优点呢? 在对均值差进行t 检验时,不仅要有定距尺度的假定, 还要有正态总体的假定。当然,对于大样本,正态总体 的假定可以放松。但正是对于小样本,这种假定最容易 出问题。因此,在满足下面两条件之一时,我们期望用 非参数检验代替均值差检验:①没有根据采用定距尺 度,但可以安排数据的顺序(即秩);②样本小且不能假 定具有正态分布。由于非参数检验不能充分利用全部现 有的资料信息。因此,如果有根据采用定距尺度,并且 如果对于小样本能够假定其具有正态性,或对大样本能 够放松对正态性假定的要求,一般宁愿使用均值差检 验,而不用非参数检验。
法计算一下检验统计量
在单侧检验中,Zα=Z0.025=1.96<2.24,我们可以否定零假
设。但必须指出,正态近似计算法没有把同数值(或同分对)的情
况考虑在内而作出修正。因此,它在同数值的数目很大时不能使用。
2014-2-7 17
第三节 秩和检验
前面我们刚刚讨论过的符号检验和配对符号秩检 验,都只适用于配对样本。当样本为独立样本时,可采 用本节所讨论的秩和检验法。其具体步骤为:
单一实验组的实验中,对于样本中每个个体的前测与后测, 如果我们并不关心(X1―X0)的具体数值,而只关心是增大 了还是减小了。具体来说,就是只研究差值 d 的符号,即 若X1>X0,记作“+”; 若X1<X0,记作“―”; 若X1=X0,删去。
那么我们面对的就将是配对样本的“符号检验”问题
了。“符号检验”并不要求配对样本出自同一个总体,重要
所以零假设 p=0.5在2.5%显著性水平上被拒绝。
2014-2-7 7
[例] 随机地选择13个单位,放映一部描述吸烟有害于身体健康 的影片,下表中的数字是各单位认为吸烟有害身体健康的职工的百分 比,现试在0.05显著性水平上,用符号检验检验实验无效的零假设。
2014-2-7
8
[解 ]
H0:p=0.5
数检验在使用100个数据时的效力等 于t检验(在正确模型条件下)使用95 个数据的效力。
2014-2-7
检验力又称检验势, 它是用1―β或[1―(犯 第二类错误的概率)] 来定义的。也就是说, 对于固定的样本容量, 检验能够否定错误假 设的能力越大,其相 对检验力越大。
相关文档
最新文档