第十一章 非参数检验
生物统计学 第11讲2 二项分布的检验+非参数检验
![生物统计学 第11讲2 二项分布的检验+非参数检验](https://img.taocdn.com/s3/m/20488decba0d4a7302763ac6.png)
配对设计 关心:差值
差值
平均
0.501
标准误差 0.18
中位数
0.49
众数
#N/A标准差源自0.70方差0.50
峰度
0.86
偏度
0.34
区域
2.8
最小值
-0.92
最大值
1.88
求和
8.01
观测数
16
• 例3 差值的描述性统计
8
解 H0:两种处理效果相同. H0 : p 0.5
HA :H0不成立
大样本时……P125,例3.32
• 例4 Wilcoxon秩和检验
19
每个总体的样本含量>5,总样本含量>15 H0:各总体分布无差异.
2.多个独立样本的秩和检验
20
试判断三种不同人群的血浆总皮质醇测定有 无差别?
正常人
0.11 0.52 0.61 0.69 0.77 0.86 1.02 1.08 1.27 1.92
肺癌病人 3.23
肺癌病人
4.2
肺癌病人 4.87
肺癌病人 5.12
肺癌病人 6.21
肺癌病人 7.18
肺癌病人 8.05
肺癌病人 8.56
肺癌病人
9.6
group 肺癌病人 矽肺0期工人 肺癌病人 矽肺0期工人 矽肺0期工人 矽肺0期工人 肺癌病人 矽肺0期工人 矽肺0期工人 矽肺0期工人 矽肺0期工人 矽肺0期工人 矽肺0期工人 肺癌病人 肺癌病人 肺癌病人 肺癌病人 肺癌病人 肺癌病人 肺癌病人
6.82 2.78 9.60 59.80
10
16
group
RD
矽肺0期工人 3.23
矽肺0期工人 3.5
第11章 非参数检验——卡方检验
![第11章 非参数检验——卡方检验](https://img.taocdn.com/s3/m/68acbbaf4b73f242326c5f5d.png)
2
a
n(ad bc)2
bc d a cb
d
第11章 非参数检验——卡方2检验
一、卡方检验概述 二、吻合性检验 三、独立性检验
一、卡方检验原理
(一)定义 检验频数资料的实际观测次数分布与理论次数分布之
间差异是否显著的方法。
(二)目的 检验每一组实际观察次数与理论次数是否吻合; 检验四格表中分类标志是否独立。
一、卡方检验原理
(三)公式
实际观测次数
2 ( f0 fe )2 fe
理论次数
(四)性质 1. 非负 2. 形状受df影响,当df趋近∞时,2分布为正态。 3. 实际观测次数与理论次数差异越大,2值越大;反
之,则2越小。
二、吻合性检验
实得分布与理论分布是否吻合; 判断实得分布与原有分布是否之一。 例1,例2, 例3。
三、独立性检验
检验两种分类标志下现象间是否相互独立。
2 × 2列联表
df =(r-1)(c-1)
例4
f (横行总次数) * (纵列总次数) N
2
a
n(ad bc)2
bc d a cb
d
当df=1,f<5时,采用公式校正
例5
三、独立性检验
检验两种分类标志下现象间是否相互独立。 2 × 2列联表 df =(r-1)(c-1)
秩和检验
![秩和检验](https://img.taocdn.com/s3/m/0ceb55360912a21614792992.png)
某药对两种病情的老年慢性支气管炎患者的疗效
合 计 秩次范围 平均秩 次 秩 单纯性 和 肺气肿
控 制 显 效 有 效 无 效 合 计
65 42 107 1~107 18 6
54
3510 2151 4740
2268 717 3634
24 108~131 119.5 53 132~184 158
30 23 13 11
(2)大样本时,正态近似法:
| T n( n 1 ) / 4 | 0.5 u n( n 1 )( 2n 1 ) / 24
校正公式:(当相持个数较多时)
u | T n( n 1 ) / 4 | 0.5 ( t3 tj ) n( n 1 )( 2n 1 ) j 24 48
12 342 602 262 H 3(15 1) 6.32 15(15 1) 5 5 5
2 i
Hc H C
分子为H值,分母C为校正数,
tj C 1 N N 校正后,Hc>H,P值减小。
3 j 3
t
HC 1
H ( t3 tj ) j N3 N
此例n1=82,n2=126,n2-n1=44, 用正态分布法。求u值
计算校正的uc值,即:
8780.5 82 208 1 / 2 0.5 u 0.4974 82 126 208 1) 12 ( /
tj ( 3 107 243 24 533 53 243 24 107 )( )( )( ) C 1 1 0.8443 3 N N 208 208
3 j 3
t
0.4974 uc 0.541 0.8443
参数检验与非参数检验的区别及优缺点.(课堂PPT)
![参数检验与非参数检验的区别及优缺点.(课堂PPT)](https://img.taocdn.com/s3/m/db3da465172ded630a1cb68d.png)
别 对总体参数进行区间 和检验分布(如位置)是否
估计或假设检验
相同
优 符合条件时,检验效 应用范围广、简便、易掌握 点 能高
对资料要求严格
缺
若对符合参数检验条件的资 料用非参数检验,则检验效 能低于参数检验
点 要求资料分布型已知
资料总体方差相等
2
如H0成立,非参数检验与参数检
验效果一样好;如H0不成立,则
n(n 1)(2n 1) / 24
如果有相同秩次,应用下面的校正公式:
T n(n 1) / 4 0.5
u
n(n
1)(2n 24
1)
1 48
(t
3 j
tj)
连续性校 正数
式中 tj 为第 j 个相同秩次的个数。如有相同秩次:3.5,3.5,6,6,6, 则∑(t3j-tj)=(23-2)+(33-3)
11
22
3
n1=6ቤተ መጻሕፍቲ ባይዱ
T1=40.5
乙种香烟
尼古丁含量
秩次
28
9.5
31
13
30
12
32
14
21
2
27
8
24
5
20
1
n2=8
T2=64.5
2
感
14
1.建立假设,确立检验水准: H0:两总体分布相同 H1:两总体分布不同 =0.05
2.计算检验统计量T值
(1)编秩 先将两组数据由小到大分别排队,再将 两组数据从小到大统一编秩,如遇相同数据在同 一组内,按位置顺序编;如相同数据不在同一 组内,应取平均秩次 。
2
感
12
二 成组设计两样本比较的秩和检验 (Wilcoxon两样本比较法)
《卫生统计学》课后思考题答案
![《卫生统计学》课后思考题答案](https://img.taocdn.com/s3/m/67fe2cea0975f46527d3e177.png)
《卫生统计学》思考题参考答案第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。
2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。
3、举例说明小概率事件的含义。
答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。
(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。
(4)整群抽样:优点是易于组织和操作大规模抽样调查;缺点是抽样误差大。
3、调查设计包括那些基本内容?答:(1)明确调查目的和指标(2)确定调查对象和观察单位(3)选择调查方法和技术(4)估计样本大小(5)编制调查表(6)评价问卷的信度和效度(7)制定资料的收集计划(8)指定资料的整理与分析计划(9)制定调查的组织措施4、调查表中包含那几种项目?答:(1)分析项目直接整理计算的必须的内容;(2)备查项目保证分析项目填写得完整和准确的内容;(3)其他项目大型调查表的前言和表底附注。
语言统计第十一章 非参数检验
![语言统计第十一章 非参数检验](https://img.taocdn.com/s3/m/f187312d03768e9951e79b89680203d8ce2f6ab9.png)
第一步: 陈述零假设H0和备择假设H1
第二步: 设定显著水平a
第三步:计算每一对观测值之差,并记下 差的符号〔即正值还是负值〕 。
第四步:不考虑差的正负号,按其绝对值 从小到大排序〔即赋予每个差一个 “秩 〞 〕 。 如果差为零, 即两观测值相同,那 么排除在外, 不再参加以后的分析〔观测值 的对子的个数N就相应减少一个〕 ; 如差 相同, 那么像曼惠特尼U检验那样,将其 在不并列的情况下所应占得等级的平均值
决定使用哪个检验:
原那么—当使用t检验的条件满足时,应尽量使用t 检验,因为它毕竟能更充分地利用数据中的信息, 因而能更容易发现总体之间存在的真正差异。
总之,如果t检验的条件得到了满足或根本满足, 就尽量使用t检验,反之,如果数据为顺序数据, 或虽是等距数据,但所来自的总体严重偏态,就 应使用U检验。
例如,我们请两个人在一个0-7〔0表示 “完全可 以接受〞,7表示完全不可以接受〞 〕 的量表上 对15个句子的可接受程度 〔acceptability〕 打分, 结果如表11.3所示。
我们现在检验一下在0.05的显著水平上两人所打 的分是否有显著差异 〔双尾〕 。 我们先计算每 对分数之差, 记下差的符号 〔表中第四列〕, 其中4个差为正号,8个为负号,即S=4.由于有3 个差为零,所以有效数据只有12对,即N=12.查 表得临界值为2,由于S值大于临界值, 所以不 能推翻零假设,因而两人的分数没有显著差异。
符号检验的原理是:如果样本所来自的总休的分 布没有差异,那么正差的个数就应大体等于负差 的个数。符号检验的目的就是检验一下正负差的 个数之间有无显著差异。
符号检验的步骤是: 记录下每一对观测值 〔等 级〕 之差的方向, 而不是差本身 〔如一对观测 值相等, 即其差为零, 就将其排除在外, 观测 值的对子数N也随之减少〕,然后计算符号出现 次数较少的观测值的对子个数,记为S作为检验 统计值。附表9给出了S的临界值,如果S值小于 或等于临界值,就可以推翻零假设。
统计学习题 第十一章 非参数检验
![统计学习题 第十一章 非参数检验](https://img.taocdn.com/s3/m/1872aedd6f1aff00bed51e63.png)
第十一章非参数检验第一节符号检验符号检验的方法·符号检验的特点和作用第二节配对符号秩检验配对符号秩检验的方法·配对符号秩检验的效力第三节秩和检验秩和检验的方法·秩和检验的近似第四节游程检验游程的概念·游程检验的方法·差符号游程检验第五节累计频数检验累计频数检验的方法·累计频数检验的应用一、填空1.非参数检验,泛指“对分布类型已知的总体进行参数检验”()的所有检验方法。
2.符号检验的零假设就是配对观察结果的差平均起来等于()。
3.理论研究表明,对于配对样本非正态分布的差值d,()是最佳检验。
4.秩和检验检验统计量U是U1和U2中较()的一个。
5.秩尺度之统计量的均值和标准差只取决于()。
6.()常被用作经验分布与理论分布的比较。
7.绝对值相等的值,应将它们的秩()。
8.符号检验,在分布自由检验中称为()。
9.符号检验和配对符号秩检验,都只适用于()样本。
10.数据序列ABBABAAABABBABBAAAAAB的总游程数是()二、单项选择1.下列检验中,不属于非参数统计的方法的是()。
A总体是否服从正态分布 B 总体的方差是否为某一个值C 样本的取得是否具有随机性D 两组随机变量之间是否相互独立2.下列情况中,最适合非参数统计的方法是()。
A反映两个大学新生成绩的差别B 反映两个大学新生家庭人均收入的差别C 反映两个大学三年级学生对就业前景的看法差别D反映两个大学在校生消费水平的差别3.不属于非参数检验的是()。
A符号检验B游程检验C累计频数检验 D F检验4.在累计频数检验中,卡方的自由度为()。
A n1B 2C n2D n1+n25.配对符号秩检验的效力( )。
A 小于符号检验B 大于t 检验C 介于符号检验与t 检验之间D 无法与符号检验及t 检验比较 6.如果我们说非参数检验的效力是80%,下列哪种解释正确。
( )A 如果用参数检验需要100个数据,那么在同等的检验效力下,非参数检验只要80个数据;B 如果用非参数检验需要100个数据,那么在同等的检验效力下,参数检验只要80个数据;C 如果用参数检验需要100个数据,那么在同等的检验效力下,非参数检验只要20个数据;D 如果用非参数检验需要100个数据,那么在同等的检验效力下,参数检验只要20个数据;7.对于秩和检验,U 1、U 2和n 1、 n 2的关系是( )。
第十一章非参数检验
![第十一章非参数检验](https://img.taocdn.com/s3/m/3e26a65bdd3383c4ba4cd23f.png)
第一节 非参数检验的基本概念及特点一、非参数检验(一)什么是“非参数”非参数模型:缺乏总体分布模式的信息。
(二)非参数检验的定义非参数检验:不需要假设总体是否为正态分布或方差是否为齐性的假设检验称非参数检验. (三)非参数检验的优点和缺点: 1、优点:一般不涉及总体参数,其假设前提也比参数假设检验少得多,适用面较广。
计算简便。
2、缺点:统计效能远不如参数检验方法。
由于当数据满足假设条件时,参数统计检验方法能够从其中广泛地充分地提取有关信息.非参数统计检验方法对数据的限制较为宽松,只能从中提取一般的信息,相对参数统计检验方法会浪费一些信息。
(四)非参数检验的特点: 1、它不需要严格的前提假设; 2、特别适用于顺序数据; 3、适用于小样本,且方法简单;4、最大的不足是不能充分利用资料的全部信息;5、不能处理“交互作用”,即多因素情况。
第二节 两个独立样本的非参数检验方法一、秩和检验法秩和即秩次的和或等级之和。
秩和检验法也叫Mann —Whitney —Wilcoxon 检验,它常被译为曼-惠特尼-维尔克松检验,简称M —W-W 检验,也称Mann-Whitney U 检验。
秩和检验法与参数检验法中独立样本的t 检验法相对应。
当“总体正态”这一前提不成立时,不能用t 检验,可以用秩和检验法。
(一)秩统计量秩统计量指样本数据的排序等级.假设从总体中反复抽取样本,就能得到一个对应于样本容量1n 和2n 的秩和U 的分布.这是一个间断而对称的分布,当1n 和2n 都大于10时,秩和T 的分布近期近似正态分布,其平均数和标准差分别为()21211++=n n n T μ ()1212121++=n n n n T σ其检验值为TT σμ-=T Z(二)计算过程1、小样本:两个样本容量均小于10(n 1£10,n 2£10)例11—1:在一项关于模拟训练的实验中,以技工学校的学生为对象,对5名学生用针对某一工种的模拟器进行训练,内外让6名学生下车间直接在实习中训练,经过同样的时间后对两组人进行该工种的技术操作考核,结果如下:模拟器组:56,62,42,72,76实习组:68,50,84,78,46,92假设两组学生初始水平相同,则两种训练方式有无显著差异?表11—1 两种训练方式的成绩考核成绩 成绩排列 等级 等级和模拟器组 (5人) 56 42 1 251=T62 56 4 42 62 5 72 72 7 76 76 8 实习组 68 46 2 412=T(6人) 50 50 3 84 68 6 78 78 9 46 84 10929211检验过程:1.建立假设 0H :∑∑=21R R ,即两样本无显著差异 aH :∑∑≠21R R ,即两样本有显著差异2.计算统计量1)将数据从小到大排列,见上表。
非参数检验综合概述PPT(30张)
![非参数检验综合概述PPT(30张)](https://img.taocdn.com/s3/m/fe7e5e3676c66137ee0619c3.png)
•
9、别再去抱怨身边人善变,多懂一些道理,明白一些事理,毕竟每个人都是越活越现实。
•
10、山有封顶,还有彼岸,慢慢长途,终有回转,余味苦涩,终有回甘。
•
11、人生就像是一个马尔可夫链,你的未来取决于你当下正在做的事,而无关于过去做完的事。
•
12、女人,要么有美貌,要么有智慧,如果两者你都不占绝对优势,那你就选择善良。
多个独立样本的非参数检验
例3 14名新生儿出生体重按其母亲的吸烟习惯分组(A组: 每日吸烟多于20支;B组:每日吸烟少于20支;C组:过去 吸烟而现已戒烟;D组:从不吸烟),具体如下。试问四个 吸烟组出生体重分布是否相同?数据见npc.sav:
A组: 2.7 2.4 2.2 3.4 B组: 2.9 3.2 3.2 C组: 3.3 3.6 3.4 3.4 D组: 3.5 3.6 3.7
两独立样本的非参数检验 (2) 检验统计量
分析结果
给 出 Mann-Whitney U 、 Wilcoxon W 统 计 量 和 Z 值 , 近 似 值 概 率 (Asymp.Sig)和精确概率值(Exact.sig)均小于0.05,结论一致,表明 猫、兔在缺氧条件下的生存时间的差异具有统计学意义,由平均秩次猫 (15.7)、兔(7.96)来看,可以认为缺氧条件下猫的生存时间长于兔。
•
3、命运给你一个比别人低的起点是想告诉你,让你用你的一生去奋斗出一个绝地反击的故事,所以有什么理由不努力!
•
4、心中没有过分的贪求,自然苦就少。口里不说多余的话,自然祸就少。腹内的食物能减少,自然病就少。思绪中没有过分欲,自然忧就少。大悲是无泪的,同样大悟无言。缘来尽量要惜,缘尽就放。人生本来就空,对人家笑笑,对自己笑笑,笑着看天下,看日出日落,花谢花开,岂不自在,哪里来的尘埃!
第11讲-独立样本(多样本)非参数检验
![第11讲-独立样本(多样本)非参数检验](https://img.taocdn.com/s3/m/cbdac13db8f67c1cfbd6b802.png)
2021/3/10
讲解:XX
14
独立样本(多样本)非参数检验2: Median 检验(中位数检验)
2021/3/10
讲解:XX
15
方法操作(来自SPSS帮助—算法)
设有K个连续型的独立样本,假设如下:
其中,θ是中位数
2021/3/10
讲解:XX
16
构建表格(Table Construction)
2021/3/10
讲解:XX
13
案例2
文件,npara3.sav,来自张文彤《SPSS统计分析基础教程》 P290
某电信公司从3所大学招聘管理人员,从而来源于3所不同大学的雇员组成了3个独 立样本。半年试用期满了以后,人力资源部对他们进行考核,并评出了这些雇员 的表现成绩,数据在0-100之间不等。请就此评价雇员的业绩在3个总体间是否存 在差异。
2021/3/10
讲解:XX
7
案例1(来源:陈希孺《非参数统计教程》P158
从三个总体中分别抽出大小为5,5,7的样本,如下:
不知总体的分布类型,请用KW检验,分析三个总体的均值是否有显著 差异,显著性水平为0.01。 友情提示:包含结
2021/3/10
讲解:XX
8
2021/3/10
讲解:XX
9
不知总体的分布类型,请问三个总体的均值是否有显著差异(用 Jonckheere-Terpstra检验)。
2021/3/10
讲解:XX
23
检验过程
1、对K个来自连续总体的样本,假设如下:
是位置参数 如果假设所有分布函数都相同,但只有位置参数(均值)不同,即
则原假设和备择假设变成:
这一点很常用,用于均值比较
第十一章非参数检验
![第十一章非参数检验](https://img.taocdn.com/s3/m/9164a94601f69e314332949f.png)
第十一章 非参数检验前面有关章节讨论的参数检验都要求总体服从一定的分布,对总体参数的检验是建立在这种分布基础上的。
例如,两样本平均数比较的t 检验和多个样本平均数比较的F 检验,都要求总体服从正态分布,推断两个或多个总体平均数是否相等。
本章引入另一类检验——非参数检验(non-parametric test )。
非参数检验是一种与总体分布状况无关的检验方法,它不依赖于总体分布的形式,应用时可以不考虑被研究的对象为何种分布以及分布是否已知。
非参数检验主要是利用样本数据之间的大小比较及大小顺序,对两个或多个样本所属总体是否相同进行检验,而不对总体分布的参数如平均数、标准差等进行统计推断。
当样本观测值的总体分布类型未知或知之甚少,无法肯定其性质,特别是观测值明显偏离正态分布,不具备参数检验的应用条件时,常用非参数检验。
非参数检验具有计算简便、直观,易于掌握,检验速度较快等优点。
非参数检验法从实质上讲,只是检验总体分布的位置(中位数)是否相同,所以对于总体分布已知的样本也可以采用非参数检验法,但是由于它不能充分利用样本内所有的数量信息,检验的效率一般要低于参数检验方法。
例如,非配对资料的秩和检验,其效率为t 检验的86.4%,就是说以相同概率判断出差异显著,t 检验所需的样本个数要少13.6%。
非参数检验内容很多,本章只介绍常用的符号检验(sign test ),秩和检验(rank-sum test )和等级相关分析(rank correlation analysis )三种。
第一节 符号检验一、配对资料的符号检验(一)配对资料符号检验的意义 配对资料符号检验是根据样本各对数据之差的正负符号多少来检验两个总体分布位置的异同,而不去考虑差值的大小。
每对数据之差为正值用“+”表示,负值用“-”表示。
可以设想如果两个总体分布位置相同,则正或负出现的次数应该相等。
若不完全相等,至少不应相差过大,否则超过一定的临界值就认为两个样本所来自的两个总体差异显著,分布的位置不同。
社会统计学 第十一章_非参数检验
![社会统计学 第十一章_非参数检验](https://img.taocdn.com/s3/m/d42d73e12b160b4e777fcf1a.png)
R1=l+2+4+5+6+7+9+11+14+17=76
R2=3+8+10+12+13+15+16+18+19=114
代入下两式得
所以检验统计量U=min(U1,U2)=U2=2l 由α=0.05查附表10得
Uα(n1 ,n2)=U 0.05(10 ,9)=20<2l 所以不否定零假设,说明在0.05的水平上,不能认为专科类院
2020/8/28
6
[例] 假设我们观测15个相配的对,获得两个差为零和13个差不为 零,其中有11个正号,2个负号,试在2.5%的显著性水平上进行单 侧检验。
[解] H0:p=0.5 H1:p (+)>p (―)
由α=0.025确定否定域,查二项分布表(附表2) P (13;13,0.5)=0.000 P (12; 13,0.5)=0.002 P (11; 13,0.5)= 0.010 P (10; 13,0.5)=0.035
本科院校环境质量的名次(秩)为: 1,2,4,5,6,7,9,11,14,17 (n1=10)
专科院校环境质量的名次(秩)为:
3,8,10,12,13.15.16,18,19 (n2=9)
2020/8/28
21
[解] H0:专科类院校和本科类院校的环境质量无差异 H1:专科类院校和本科类院校的环境质量有差异
如此,这些很容易理解的方法还可以用于处理
2020等/8/28级的资料和定性的信息。
3
很显然,如果把从一个正态总体中抽取的数据用分布 自由来处理,其效果肯定不如相应的参数检验有力。我们 一般用下述指标来确定非参数检验的“效率” 。
张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(非参数检验)【圣才出品】
![张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(非参数检验)【圣才出品】](https://img.taocdn.com/s3/m/d9a0e4b6b7360b4c2e3f64fb.png)
圣才电子书 十万种考研考证电子书、题库视频学习平台
相关、 2 检验都属于非参数方法。 一、非参数检验的基本概念与特点 (一)非参数概念 1.“非参数”概念可以从不同的角度理解。它首先指非参数模型。当总体或样本的分
布能够由有限的几个参数来确定时,就是参数模型;否则就是非参数模型。从统计学的观点 出发,参数模型,是指分布的模式(pattern)已经知道(比如说已经知道总体分布为正态 分布),而其中的一些具体的细节(参数)是未知的,这种对分布模式的知识可以解释为在 观察样本之前所掌握的信息,利用这种事先掌握的信息,可以使研究者更有效地提炼样本中 的(关于参数的)信息。
二、单样本游程检验 在进行推断统计时,往往要求是随机样本。单样本游程检验就是用来检验样本随机性的 非参数检验。
3 / 3统计中,两个相同符号的连续串称为游程。根据游程数来判断样本的随机性的方法就
是单样本游程检验。
圣才电子书 十万种考研考证电子书、题库视频学习平台
张厚粲《现代心理与教育统计学》第 3 版笔记和课后习题含考研真题详解 第 11 章 非参数检验
11.1 复习笔记
本章重点 非参数检验的特点与原理 秩和检验法 中数检验法 符号检验法 等级方差分析。
统计推断问题有两个共同特点:一方面它们都是在给定或假定总体的分布形式基础上, 对总体的未知参数进行估计或者检验,以明确的总体分布为前提;另一方面需要满足某些总 体参数的假定条件。这一类假设检验一般都称之为参数检验(parametric test)。在实践中, 研究人员对所研究的总体可能知之不多,有时对参数检验中的诸多要求和假定很难完全满 足,这样,在不符合参数检验的条件下,参数检验就不适用了。此时,应当使用统计学中的 另一类检验方法,即非参数检验(non-parametric test)。
非参数检验教学课件
![非参数检验教学课件](https://img.taocdn.com/s3/m/bd840740a7c30c22590102020740be1e650ecc88.png)
如果多个配对样本得分布存在显著得差异, 那么数值普遍偏大得组秩和必然偏大,数值普 遍偏小得组,秩和也必然偏小,各组得秩之间就 会存在显著差异。如果各样本得平均秩大致相 当,那么可以认为各组得总体分布 没有显著差 异。
2、多配对样本得Kendall协同系数检验
多配对样本得Kendall协同系数检验和 Friedman检验非常类似,也就是一种多配对样 本得非参数检验,但分析得角度不同。多配对 样本得Kendall协同系数检验主要用在分析评 判者得判别标准就是否一致公平方面。她将每 个评判对象得分数都看作就是来自多个配对总 体得样本。一个评判对象对不同被判定对象得 分数构成一个样本,其零假设为:样本来自得多 个配对总体得分布无显著差异,即评判者得评 判标准不一致。
非参数检验教学课件
但许多调查或实验所得得科研数据,其总 体分布未知或无法确定。因为有得数据不就是 来自所假定分布得总体,或者数据根本不就是 来自一个总体,还有可能数据因为某种原因被 严重污染,这样在假定分布得情况下进行推断 得做法就有可能产生错误得结论。此时人们希 望检验对一个总体分布形状不必作限制。
非参数检验根据样本数目以及样本之间得关系 可以分为单样本非参数检验、两独立样本非参数检 验、多独立样本非参数检验、两配对样本非参数检 验和多配对样本非参数检验几种。
6、1 SPSS单样本K-S检验
6、1、1 统计学上得定义和计算公 式 定义:单样本K-S检验就是以两位前苏联数
学家Kolmogorov和Smirnov命名得,也就是一种 拟合优度得非参数检验方法。单样本K-S检验 就是利用样本数据推断总体就是否服从某一理 论分布得方法,适用于探索连续型随机变量得 分布形态。
Kendall协同系数检验中会计算Friedman 检验方法,得到friedman统计量和相伴概率。 如果相伴概率小于显著性水平,可以认为这10 个节目之间没有显著差异,那么可以认为这5个 评委判定标准不一致,也就就是判定结果不一 致。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
当数据的对子个数(N)超过20个左右时,W的分布接 近正态,就可以用下面的公式计算Z值,然后进行 Z检验。
二、 符号检验
符号检验适用于顺序变量,比如在一个量表上对 句子的难度、熟悉程度、可接受程度、合乎语法 性等所打的分。对于这样的变量,不能用等距的 单位进行测量,因此每对观测值之差的大小就不 像在威尔柯克斯符号秩和检验中那么重要了,这 时只能考虑差的方向或符号。这种只涉及对成对 数据之差的正负方向的检验称为符号检验。由于 符号检验仅考虑差的符号,而不考虑差的大小 (比 如10 与 5之差同 10与1之差在该检验里没有什么 分别。
第十一章 非参数检验
第一节
曼惠特尼U检验
一、曼惠特尼U检验的用途和使用条件
二、曼惠特尼U检验的基本原理
三、检验步骤
第二节
பைடு நூலகம்
威尔柯克斯符号秩和检验与符号检验
一、威尔柯克斯符号秩和检验 二、符号检验
我们前面讨论过的假设检验都属于参数检验。我 们在第七章里谈到,这类检验的使用条件十分 “苛刻”,比如所涉及的变量必须是等距变量、 总体分布必须呈正态 总体的方差必须相等。但 是在语言研究中,经常会遇到上述条件不能满足 的情况,这时非参数检验就可以发挥作用了。但 是需要注意,虽然在使用非参数检验时,不要求 总体呈正态分布以及总体方差相等,但是仍然要 求样本是随机样本,观测值是独立的。本章介绍 几个最常用的非参数检验。
第五步:因U1(6.5)较小,所以把它作为检验 统计值U。查附表7得临界 10(N1=7,N2=8,a=0.05)。由于U值小于临界值, 所以零假设被推翻,证明两组分数之间存在显著 差异。附表7中给出的最大的N1和N2值只有20, 这是因为对于大于这个值的样本,检验统计值U 大体服从正态分布,这时就可以用Z作为检验统 计值,其计算公式是
第五步:分别计算正的等级之和及负的等级之和, 其中较小者记为W,用作检验统计值。 附表8给 出了 0.05和0.01显著意义水平的双尾检验 (0.025和0.005显著水平的单尾检验)的临界值, 表中的N为观测值的对子数(相同值的除外)或 差的个数(零差除外)。如果W值小于或等于临 界值,就推翻零假设,证明两样本所来自的总体 在分布上有显著差异。
假如想知道这两组数据之间在5%的显著水平上是 否有显著差异(双尾检验) , 检验步骤如下: 第一步:零假设: H0两组分数没有差异。 H1两组分数有差异(双尾检验) 第二步:设显著水平为0.05。
第三步:把两组数据放在一起排序:
第四步:小样本(A组)的等级之和 T=5.5+8+11+11+13+14+15=77.5,已知N1=7, N2=8,代人公式(11.1)和公式(11.2),得
例如,两位教师分别给10篇翻译作业打分,结果 如表11.2 中的前三 列:
到底两位教师所给的分数有没有显著差异呢?这 就要进行威尔柯克斯符号秩和检验,步骤如下:
第一步:陈述零假设和备择假设:
H0:两样本所来自的总休的分布之间没有差异。 H1: 两样本所来自的总体的分布之间有差异 (双尾检验) 第二步: 设显著水平为0.05
决定使用哪个检验: 原则—当使用t检验的条件满足时,应尽量使用t检 验,因为它毕竟能更充分地利用数据中的信息, 因而能更容易发现总体之间存在的真正差异。 总之,如果t检验的条件得到了满足或基本满足, 就尽量使用t检验,反之,如果数据为顺序数据, 或虽是等距数据,但所来自的总体严重偏态,就 应使用U检验。 二、曼惠特尼U检验的基本原理 U检验的零假设为:所比较的两个样本来自具有 相同分布的总体
第一步: 陈述零假设H0和备择假设H1
第二步: 设定显著水平a 第三步:计算每一对观测值之差,并记下差的符 号(即正值还是负值) 。 第四步:不考虑差的正负号,按其绝对值从小到 大排序(即赋予每个差一个 “秩” ) 。 如果差 为零, 即两观测值相同,则排除在外, 不再参加以 后的分析(观测值的对子的个数N就相应减少一 个) ; 如差相同, 则像曼惠特尼U检验那样,将 其在不并列的情况下所应占得等级的平均值作为 它们的等级。每个差的等级仍保留该差的符号。
第一节 曼惠特尼U检验
一、 曼惠特尼U检验的用途和使用条件
检验用来比较两个独立样本,以决定两者之间是 否存在 曼惠特尼检验的使 整体上的显著差异。该 检验对应于独立样本 检验, 适用于用条件没有满 足的情况。它对样本容量、 体分布等没有什么要 求,只要 总求样本为随机样本, 数据为顺序数据, 但即使如此, 对随机性的要求也没有 检验那么严 格。 检验的有效性不亚于 检验,再加上检验统计 值易于计算,因而是一个很常用的检验。
第四步:求小样本的等级之和T(如果两样本容量 相等,则计算任一样本的等级之和都可)。把小 样本的数值个数计为N1, 大样本的数值个数计为 N2, 然后用下列公式计算U1和U2的值。
第五步:将U1和U2中较小的值用作检验统计值U与 附表7中 的临界值加以比较。如果U等于或小于临 界值,就可以推翻零假设。 例如,有两篇文章,我们想了解其难度是否有差 异。我们随机选取15个被试,再随机将其分为A和 B两组(A组7人,B组8人),然后让他们分别阅 读这两篇文章,并在一个等级量表上给所读文章 的难度打分,1表示“极易”,10表示“极难”。 打分结果如表11.1所示。
当N大于25左右时,即可用Z检验,Z值的计算方 法如下:
如果在一定显著水平上,Z值大于正态分布表中的 临界值,就可推翻零假设。
小
结
但是需要注意,虽然在使用非参数检验时,不要 求总体呈正态分布以及总体方差相等,但是仍然 要求样本是随机样本,观测值是独立的。符号检 验适用于顺序变量,比如在一个量表上对句子的 难度、熟悉程度、可接受程度、合乎语法性等所 打的分。对于这样的变量,不能用等距的单位进 行测量,因此每对观测值之差的大小就不像在威 尔柯克斯符号秩和检验中那么重要了,这时只能 考虑差的方向或符号。
符号检验的原理是:如果样本所来自的总休的分 布没有差异,那么正差的个数就应大体等于负差 的个数。符号检验的目的就是检验一下正负差的 个数之间有无显著差异。
符号检验的步骤是: 记录下每一对观测值 (等 级) 之差的方向, 而不是差本身 (如一对观测 值相等, 即其差为零, 就将其排除在外, 观测 值的对子数N也随之减少),然后计算符号出现 次数较少的观测值的对子个数,记为S作为检验 统计值。附表9给出了S的临界值,如果S值小于 或等于临界值,就可以推翻零假设。
一、威尔柯克斯符号秩和检验
威尔柯克斯符号秩和检验的原理与曼惠特尼U检
验很相似: 先计算每一对观测值的差,如果零假 设成立,即两样本所来自的总体的分布之间没有 差异,那么正差与负差的个数应该大体相等,而 且正差之和与负差之和也应大休相等;但是如果 总体分布有差异,则正差与负差的个数以及正差 之和与负差之和就会有差异。威尔柯克斯符号秩 和检验的目的就是检验一下这一差异是否有显著 意义。 检验步骤如下:
例如,我们请两个人在一个0-7(0表示 “完全可 以接受”,7表示完全不可以接受” ) 的量表上 对15个句子的可接受程度 (acceptability) 打分, 结果如表11.3所示。
我们现在检验一下在0.05的显著水平上两人所打 的分是否有显著差异 (双尾) 。 我们先计算每 对分数之差, 记下差的符号 (表中第四列), 其中4个差为正号,8个为负号,即S=4.由于有3 个差为零,所以有效数据只有12对,即N=12.查 表得临界值为2,由于S值大于临界值, 所以不 能推翻零假设,因而两人的分数没有显著差异。
三、 检验步骤
第一步: 陈述零假设H0以及备择假设H1
第二步:设定显著水平a
第三步:把两样本的数据合并成一列,并标明每 个数值所来自的样本(但如果数值很少,也可以 不实际合为一列,这时就没有必要标明每个数值 所来自的样本了) 。 然后把数值从小到大 (或 从大到小) 排序, 并列数值的等级相同,即它们 应占的等级的平均值。
第二节 威尔柯克斯符号秩和检验与符号检验
曼惠特尼U检验是对应于独立样本t检验的一个非 参数检验,而对 应于成对样本(或相关样本)t检 验的非参数检验有两个:一个是威尔柯克斯符号 秩和检验;另一个是符号检验。前者适用于等距 数据,后者适用于顺序数据。两个检验的数据都 是由一对对观测值构成的,所检验的零假设也相 同,即两个变量的分布相同。但作为非参数检验, 它们对变量的分布的形状都没有什么要求。
第三步:计算各对分数之差(A-B)。
第四步:把分数之差按绝对值从小到大排序。
由于第3和第9个差为零,所以被排除在外(N随 之从10减少到8)。第2、第4和第7三个差并列, 它们本应占得等级为1、2、3,所以这三个差的 平均等级为(1+2+3)/3=2。同理,第1、第5、第 6和第8的平均等级为(4+5+6+7)/4=5.5.第10个 差的等级则为8. 第五步:正的等级之和为23 ,负的等级之和为13, 那么检验统计值W,即为13查附表8得临界值为3 。 由于W值大于临界值,所以检验无显著意义,即 不能推翻零假设,说明两位教师所给的分数之间 没有显著差异 。
(至于分布的形状则无关紧要) 。 该检验的原理 是: 如果零假设成立, 那么如果把两样本合并 起来,按大小给每一个观测值一个等级,那么来 自两样本的观测值就会随机分布在等级序列上, 把两样本的观测值所占的等级分别累加起来,两 个和应该相同或很接近。但是如果两样本之间存 在显著差异, 那么一个样本的观测值就会主要占 据等级序列的高 (上) 端, 而另一样本则主要 占据低(下)端,因而两个和就会差别很大。该 检验就是用来计算一下,在零假设成立的情况下, 两和之间存在差异的概率。