第二讲-非参数统计检验教学内容
非参数统计讲义
绪论
§1.1 非参数统计
在初等统计学中,最基本的概念是什么 在初等统计学中,最基本的概念是什么? 总体, 如:总体,样本,随机变量,分布,估计 总体 样本,随机变量,分布, 和假设检验等 和假设检验等. 其很大一部分内容是和正态理论相关的。 正态理论相关的 其很大一部分内容是和正态理论相关的。 在那里,总体的分布形式或分布族 分布形式或分布族往往是 在那里,总体的分布形式或分布族往往是 给定的或者是假定了的, 给定的或者是假定了的,所不知道的仅仅 是一些参数的值或他们的范围。 主要工 是一些参数的值或他们的范围。(主要工 作是什么?) 作是什么
然而,在实际生活中,那种对总体的分布 的假定并不是能随便做出的。 数据并不是来自所假定分布的总体;或者, 数据根本不是来自一个总体;还有可能, 数据因为种种原因被严重污染。这样,在 假定总体分布的情况下进行推断的做法就 可能产生错误的结论。 于是,人们希望在不假定总体分布的情况 下,尽量从数据本身来获得所需要的信息。 这就是非参数统计的宗旨。
注意:非参数统计的名字中的“ 注意:非参数统计的名字中的“非参数 (nonparametric)” (nonparametric) 意味着其方法不涉及描述总 体分布的有关参数;它被称为和分布无关 体分布的有关参数;它被称为和分布无关 (distribution—free) free), (distribution free),是因为其推断方法和 总体分布无关;不应理解为与所有分布( 总体分布无关;不应理解为与所有分布(例如有 关秩的分布)无关. 关秩的分布)无关. 什么是非参数统计? 什么是非参数统计? 不假定总体分布的具体形式, 不假定总体分布的具体形式,从数据本身获得 所需要的信息, 所需要的信息,通过推断方法得到相关结论的 一种分析方法。 一种分析方法。
非参检验PPT课件
Npar
两均值比较相 独关 立样 样本 本中符 符秩数号 号和检等检检验级验验法检法法(((验MSMieg法adnn(i)Wnani)lWcohxiotnne)y U ) 多均值比较随完机全区随组机::弗克里 瓦德氏曼方方差差分分析析((KFrruiesdkmalaann)d Wallis H )
非参数检验
1
非参数检验是与参数检验相对应的,参数 检验指的是在总体分布已知,满足某些 假定条件(独立性、方差齐性等),检验的 数据一般为连续数据的情况下进行的检 验。如果有些条件不能满足, 则采用非参 数检验,可以根据实际情况采用如下一 些方法进行检验, 这些检验都是在 Nonparametric tests菜单项里执行。
9
练习
• 输入以下数据并检验两组数据的差异性:
– 甲:12,14,15,12,21,31,26,21 – 乙:21,32,15,21,12,14,12,15
• 1.假设上述配对样本资料 • 2.假设上述资料不是配对样本资料
10
2020/1/1
11
3
两独立样本非参数检验例题
设有两种安眠药,考虑它们的治疗效果(失眠者服用之 后睡眠延长的小时数),现将20名患者分成两组,分别服用 一种药,收集的数据如下:
甲 1.9 0.8 1.1 0.1 0.1 4.4 5.5 1.6 4.6 3.4 乙 0.7 –1.6 –0.2 –1.2 –0.1 3.4 3.7 0.8 0.0 2.0 由于延长的时数的分布不明,我们考虑用非参数检验 ! Mann-Whitney U 类似于t检验。
由于脉博跳动的次数不服从正态分布,我们考虑用非 参数检验。
5
2020/1/1
6
多个独立样本非参数检验例1
第二讲-非参数统计检验
第二讲非参数检验1.实验目的1.了解非参数假设检验基本思想;2.会用SAS软件中的proc npar1way过程进行非参数假设检验和proc freq过程进行列联表的独立性检验。
2. 实验要求1.会用SAS软件建立数据集,并进行统计分析;2.掌握proc npar1way过程进行非参数假设检验的基本步骤;3.掌握proc freq过程进行列联表的独立性检验的基本步骤。
3.实验基本原理3.1 符号检验两种方法的处理效果无显著性差异令统计量表示新方法的处理效果优于对照方法的配对组总数。
若新方法的处理效果显著的优于对照方法,则的值应明显偏大。
因此,若对给定的置信水平,有,则拒绝。
为真时,(1)服从二项分布。
拒绝域为:(2)由中心极限定理可知,当的零分布趋于标准正态分布。
拒绝域为:3.2 Wilcoxon秩和检验(1)单边假设检验两种方法的处理效果无显著性差异 as :新方法优于对照方法。
用于检验的统计量为:若对给定的置信水平,有,则拒绝。
且的分布列为:根据观测结果计算的观测值,计算检验的p值:然后将值与显著水平作比较,若,则拒绝,否则接受。
(2)双边假设检验给定的显著水平应该满足:仅由上式还不能唯一确定,当我们对两种方法谁优谁劣不得而知时,通常取若利用p值进行检验,设,计算概率值由对称性可知,检验的p值为上述两概率中小于1/2的那一个的2倍。
例如则。
求出p值后,若p<a,拒绝,否则接受。
(3)列联表的独立性检验方法的处理效果无显著性差异:表示格子概率,表示三维列联表中事件发生的理论频数。
将概率用相应的频率频率去估计。
令其中:将样本数据代入统计量进行检验。
然后将P与显著水平作比较,若,拒绝,否则接受。
4. 实验相关SAS知识(1)独立样本的秩检验——proc npar1way过程proc npar1way过程的基本语句形式为proc npar1way [options];class variables;(proc npar1way过程不可缺少的语句)exact;(求出检验的精确p值)var variables;其中“options”可包含以下选项的部分或全部:①DATA=数据集名:指定要分析的数据集。
《非参数统计》课程教学大纲
非参数统计Non-parametricStatistics一、课程基本信息学时:48(含实验8学时)学分:3考核方式:考试,平时成绩占总成绩30%。
中文简介:非参数统计为有效地分析试验设计及其实际问题中所获得的数据提供了丰富的统计工具。
本课程从问题背景与动机、方法引进、理论基础、计算机实现、应用实例等诸多方面介绍了非参数统计方法,其内容包括:基于二项分布的检验、列联表、秩检验、Ko1mogorov-Smirnov 型统计量等。
本课程在强调实用性的同时,突出了应用方法与理论的结合。
在人才培养体系中,该课程属于选修课程,但建议每个统计学专业的学生必须掌握若干种非参数统计方法,以其作为其他重要统计方法的补充。
特别是针对名义数据分析及有序数据分析时相当有用。
二、教学目的与要求非参数统计是研究随机现象存在的统计规律的学科,其在经济、工农业生产和科学技术等领域有广泛的应用,是一门应用性很强的一门课程。
本课程(1)使学生掌握非参数理论的基本原理和方法,重点掌握单样本,多样本的位置检验和尺度检验,以及相关检验和分布检验。
注意与参数统计的区别;(2)结合实际例子,运用非参数理论,提高学生运用该工具解决实际问题的能力。
(3)使学生进一步掌握具体与抽象、偶然与必然、特殊与一般等辨证关系,培养学生辨证唯物主义观点。
三、教学方法与手段教学中主要采用课堂教学的方法,当中穿插大量的案例,同时预留课堂讨论与练习的时间让学生进行实际的操作。
本课程同时设立计算机上机课程,由老师自编实验指导书详细指导学生进行上机实践,强调动脑与动手相结合,理论与实践相结合。
o五、推荐教材和教学参考资源教材:非参数统计:基于R语言案例分析,柳向东编,暨南大学出版社,2010年12月(第1版)参考资料:1)非参数统计,王星编著,北京:中国人民大学出版社,2(X)5年1月(第一版)2)非参数统计方法,吴喜之等,北京:高等教育出版社,1996年(第1版)3)孙山泽.非参数统计讲义.北京:北京大学出版社,2000。
《非参数统计》教学大纲
《非参数统计》课程教学大纲课程代码:090531007课程英文名称:Non-parametric Statistics课程总学时:40 讲课:32 实验:8 上机:0适用专业:应用统计学大纲编写(修订)时间:2017.6一、大纲使用说明(一)课程的地位及教学目标《非参数统计》是应用统计学专业的一门专业基础课,是统计学的一个重要分支。
课程主要研究非参数统计的基本概念、基本方法和基本理论。
本课程在教学内容方面除基本知识、基本理论和基本方法的教学外,着重培养学生的统计思想、统计推断和决策能力。
通过本课程的学习,学生将达到以下要求:1.掌握非参数统计方法原理、方法,具有统计分析问题的能力;2.具有根据具体情况正确选用非参数统计方法,正确运用非参数统计方法处理实际数据资料的能力;3.具有运用统计软件分析问题,对计算结果给出合理解释,从而作出科学的定论的能力;4.了解非参数统计的新发展。
(二)知识、能力及技能方面的基本要求1.基本知识:掌握符号检验、Wilcoxon符号秩检验、Cox-Stuart趋势检验、游程检验、Brown-Mood中位数检验、Wilcoxon秩和检验、Kruskal-Wallis检验、Jonckheere-Terpstra检验、Friedman检验、Page检验、Siegel-Tukey检验、Mood检验、Ansari-Bradley检验、Fligner-Killeen检验等非参数统计方法。
2.基本理论和方法:掌握单样本模型、两样本位置模型、多样本数据模型中的位置参数非参数统计检验方法,掌握检验尺度参数是否相等的各种非参数方法,掌握各种回归的方法,掌握分布检验的各种方法,要求能在真实案例中应用相应的方法。
3.基本技能:掌握非参数统计方法的计算机实现。
(三)实施说明1. 本大纲主要依据应用统计学专业2017版教学计划、应用统计学专业建设和特色发展规划和沈阳理工大学编写本科教学大纲的有关规定并根据我校实际情况进行编写。
《非参数统计分析》教案
添加标题
添加标题
添加标题
添加标题
案例分析:通过分析具体案例,帮 助学生理解抽象概念和理论
实验操作:通过实验操作,让学生 亲身体验统计方法的应用过程
评价方式
课堂表现:观察学 生的课堂参与度、 回答问题的准确性 和思考问题的深度
作业完成情况:评 估学生对课堂内容 的理解和应用能力
小组讨论:鼓励学 生之间的合作与交 流,培养团队协作 能力
介绍非参数统计分析的基本 方法
介绍非参数统计分析在各个 领域的应用
介绍非参数统计分析的概念 和特点
介绍非参数统计分析的优缺 点和注意事项
导入:介绍非参数统计分 析的概念和背景
教学步骤
定义与概念:讲解非参数 统计分析和相关概念
方法与步骤:详细介绍非 参数统计分析的方法和步 骤
案例分析:通过具体案例 来展示非参数统计分析的 应用
总结与回顾:总结本次课 程的内容,回顾非参数统 计分析的方法和步骤
作业与思考:布置相关作 业和思考题,引导学生深 入思考
教学重点
重点知识点1:非参数统计的 基本概念
重点知识点2:非参数统计与 参数统计的区别
重点知识点3:非参数统计的 优缺点
重点知识点4:非参数统计的 应用场景
教学难点
难点概念:难以理解或掌 握的基本概念或原理
难点应用:将理论知识应 用于实际问题的能力
难点计算:复杂的统计计 算和分析方法
难点理解:对统计原理和 方法的深入理解和掌握
教学方法
案例教学法:通 过具体案例的分 析和讨论,帮助 学生理解和掌握 非参数统计分析 的基本概念和方
法。
互动式教学法: 采用课堂互动、 小组讨论等方式, 鼓励学生积极参 与,提高学生的 学习兴趣和主动
非参数统计第二版教学设计 (2)
非参数统计第二版教学设计一、教学目标本次教学旨在让学生掌握非参数统计方法的基本概念、理论和实践的应用,能够在解决实际问题中进行科学的数据分析,为后续学习和实践埋下坚实的基础。
二、教学内容1.非参数统计基本概念和理论:1.1 非参数统计与参数统计的区别1.2 统计量的定义及其性质1.3 统计分布与假设检验2.非参数统计方法的应用:2.1 单样本非参数检验2.2 多样本非参数检验2.3 非参数回归分析3.非参数统计的实验设计与实践:3.1 实验设计及数据处理3.2 常用非参数统计软件的使用三、教学方法1.讲授法:通过讲解理论知识,帮助学生理解基本概念和理论;2.例题与实操:通过案例分析和实际操作,帮助学生掌握方法的应用;3.讨论与合作:通过小组讨论和合作学习,增强学生对知识的深度理解和记忆;4.课堂演示:通过对常用非参数统计软件的演示,帮助学生了解软件的使用方法。
四、教材与参考资料•教材:《非参数统计》第2版,金\*藕斯基、屈瑞琪;•参考资料:《非参数统计方法在MATLAB中的实现》、《SPSS非参数分析方法》。
五、教学评价1.笔试:理论知识的考核;2.实操:非参数统计方法的应用题,作为衡量学生掌握能力的方面;3.讨论与表述:学生对所学知识的讨论与表述,衡量学生合作能力及对知识的掌握情况。
六、教学安排时间内容方法时间内容方法第1周非参数统计概述讲授第2-3周单样本非参数检验讲授第4-5周多样本非参数检验讲授第6-7周非参数回归分析讲授第8-9周实验设计及数据处理讲授、讨论第10-11周常用非参数统计软件使用讲授、演示第12周课程总结与答疑讲授、讨论。
《-非参数统计-》课程教学大纲上课讲义
《-⾮参数统计-》课程教学⼤纲上课讲义《⾮参数统计》课程教学⼤纲Non-parametric statistics课程代码:课程性质:专业⽅向理论课/选修适⽤专业:统计开课学期:5总学时数:32 总学分数:2.0编写年⽉:2007.5 修订年⽉:2007.7执笔:孙琳⼀、课程的性质和⽬的本课程是学习⾮参数统计和了解统计前沿的基本课程。
本课程结合S-Plus 或R 软件来讲解⾮参数统计⽅法的原理与应⽤。
本课程的⽬的是使学⽣认识到⾮参数统计⽅法是统计中最常⽤的推断⽅法之⼀,理解⾮参数统计⽅法和参数统计⽅法的区别,理解⾮参数统计的基本概念,掌握⾮参数统计的基本⽅法,能应⽤⾮参数统计⽅法去解决实际问题。
⼆、课程教学内容及学时分配第⼀章引⾔(2学时)本章内容:统计的概念,⾮参数统计的⽅法,参数统计与⾮参数统计的⽐较,本章要求:了解⾮参数统计的历史,了解⾮参数统计⽅法和参数统计⽅法的区别,认识⾮参数统计⽅法的必要性。
第⼆章 S-Plus基础(6学时)本章内容:S-Plus环境,向量的定义和表⽰,向量的基本操作,向量的基本运算,向量的逻辑运算,S-Plus 的图形功能,本章要求:熟悉在S-Plus命令⾏中S-Plus基本数据处理,掌握在S-Plus命令⾏中进⾏基本数据基本运算,能编写简单的计算函数,会绘制基本图形。
第三章单⼀样本的推断问题(6学时)本章内容:单样本推断问题,中⼼位置推断,符号检验,游程检验,Cox-staut趣势检验,分位数检验,Wilcoxon符号秩检验,分布检验,Kolmogorov-smirnov正态检验,Liliefor正态检验,中位数检验问题、定性数据检验问题和成对数据检验问题,秩和检验。
本章要求:掌握符号检验,能⽤符号检验解中位数检验问题、定性数据检验问题和成对数据检验问题。
由成对数据检验问题引出符号秩和检验。
掌握Wilcoxon秩和检验法,掌握符号秩和检验,能⽤符号秩和检验解对称中⼼的检验问题和成对数据检验问题,初步理解秩的概念。
非参数统计课件 精华版
非参数统计目录⏹第一章绪论⏹第二章S-Plus基础⏹第三章单一样本的推断问题⏹第四章两样本位置和尺度检验⏹第五章多总体的统计检验⏹第六章分类数据的关联分析⏹第七章秩相关分析和秩回归第一章绪论主要内容1. 统计的实践2. 非参数统计方法简介3. 参数统计过程与非参数统计的比较4. 非参数统计的历史5. 必要的准备知识1. 统计的实践我们周围的世界⏹符号和数据就是整个世界。
⏹数据繁衍,信息匮乏:观察数据激增,设计数据细分。
⏹数据的复杂性和不确定性的特点更为突出。
⏹数据分析方法和手段不足。
统计的方法论⏹就方法论而言,统计分析主要解决两方面的问题:–寻找数据内部差异中共同的特征。
–寻找数据之间本质的差异。
⏹统计分析的目标是从数据中发现比数据本身更为有用的知识2. 非参数统计方法简介参数方法⏹定义:样本被视为从分布族的某个参数族抽取出来的总体的代表,而未知的仅仅是总体分布具体的参数值,推断问题就转化为对分布族的若干个未知参数的估计问题,用样本对这些参数做出估计或者进行某种形式的假设检验,这类推断方法称为参数方法。
⏹比如:(1)研究保险公司的索赔请求数时,可能假定索赔请求数来自泊松分布P(a);(2)研究化肥对农作物产量的影响效果时,平均意义之下,每测量单元(可能是)产量服从正态分布N(a,b).一个典型的参数检验过程1. 总体参数Example: Population Mean2. 假定数据的形态为Whole Numbers or FractionsExample: Height in Inches (72, 60.5, 54.7) 3. 有很强的假定Example: 正态分布4. 例子: Z Test, t Test, 2Test一个例子:对两组学生进行语法测试,如何比较两组学生的成绩是否存在差异?RANK of SCORE25.020.015.010.05.00.0HistogramFor GROUP= Group1F r e q u e n c y6543210Std. Dev = 6.28 M ean = 13.0N = 12.00原始数据秩2530293424251332243032379.514.012.021.07.59.52.017.57.514.017.524.04433228473140303335182135282226.019.55.51.027.016.025.014.019.522.53.04.022.511.05.5RANK of SCORE25.020.015.010.05.00.0HistogramFor GROUP= Group2F r e q u e n c y6543210Std. Dev = 9.17 Mean = 14.8N = 15.00非参数检验过程⏹1.不涉及总体的分布–Example: Probability Distributions, Independence⏹2. 数据的形态各异–定量数据–定序数据–Example: Good-Better-Best–名义数据–Example: Male-Female⏹3.例子: Wilcoxon Rank Sum Test/Run TestF, F, F, F, F, F, F, F, M, M, M, M, M, M, MF, M, F, M, F, M, F, M, F, M, F, M, F, M, F3. 参数统计与非参数统计比较非参数检验的优点⏹对总体假定较少,有广泛的适用性,结果稳定性较好。
《非参数统计》课件
核密度估计
详细讲解核密度估计方法, 可用于估计未知分布函数 的概率密度函数。
K近邻算法
介绍K近邻算法在非参数统 计中的应用,用于分类和 估计未知函数。
常用方法本 的中位数差异,对于不 符合正态分布的数据非 常有用。
Kruskal-Wallis检验
一种非参数方法,用于 比较多个独立样本的总 体分布,可以替代方差 分析。
介绍常用于非参数统计的软件和工具,帮助读者选择适合自己的数据分析工具。
3 Q&A
解答读者在非参数统计方面的疑问和问题,提供进一步的讨论和交流。
总结
1 非参数统计的优势和劣势总结
总结非参数统计方法和传统参数统计方法的优势和劣势,帮助选择合适的分析方法。
2 非参数统计的前景和未来发展方向
讨论非参数统计的前景和未来的发展方向,以及可能的研究方向。
附录
1 参考文献
提供相关参考文献,方便读者进一步学习非参数统计的理论和应用。
2 常用软件和工具介绍
Mann-Whitney U检 验
非参数的秩和检验方法, 用于比较两个独立样本 的总体分布。
实例应用
医疗领域的应用
展示非参数统计在医疗研究 中的应用,如临床试验和数 据分析。
社会调查中的应用
探讨非参数统计在社会调查 和民意调查中的应用,如对 人口统计数据的分析。
金融风险评估中的应用
介绍非参数统计在金融领域 中的应用,如风险评估和市 场预测。
《非参数统计》PPT课件
非参数统计是一门关于数据分析的重要领域,本课件将介绍非参数统计的基 本原理、常用方法和实例应用,以及其在医疗、社会调查和金融方面的应用。
简介
非参数统计是一种不基于总体概率分布的统计方法,适用于各种数据类型,具有广泛的应用场景 和灵活性。
非参数统计主要内容Word版
非参数统计主要内容一、知识点1非参数统计方法与参数统计方法的主要区别有哪些参数统计 主要是数理统计学中的方法,基于某种分布的,比如正态分布 指数分布,进行参数估计 检验 区间预测等等非参数方法主要用于那些分布并不服从某一个已知的分布 也不知道他们的参数 不针对参数的求算进行的统计分析4符号检验与符号秩和检验的区别与联系 符号检验并没有充分利用对称分布的信息,它并不能有效地解决对称中心θ是否为原点的检查问题。
符号秩和检验 方法作为符号检验的改进,它能有效解决对称中心θ是否为原点的检验。
Wilcoxon 秩和及Wilcoxon 符号秩检验是对原假设的非参数检验,在不需要假设两个样本空间都为正态分布的情况下,测试它们的分布是否完全相同。
5Wilcoxon 检验统计量与Mann-Whitney U 统计量的计算及其关系。
这两者都是 适用与不知总体分布形态的,两独立样本,小样本资料的非参数检验。
都是 秩和检验,SPSS 读的是Mann-Whitney U 检验的结果。
Wilcoxon signed-rank test 应用于两个related samples ,Mann –Whitney U test 也叫Wilcoxon rank-sum test ,应用于两个independent samples 的情况。
公式和统计量不大一样,结果也略有所差异,但这不大影响使用这两种方法。
samples size 小的时候,是有列表的,sample size 大到20左右时,就可以使用正态分布来近似,不查表了2秩统计量的性质,秩统计量的常用数字特征(期望、方差)会计算给定样本的、相同样本的随机秩法与平均秩法3描述性统计量的计算方法(均值、方差、标准差、峰度)方差var n22ii=11s =(x -x )n-1∑期望12nx +x +...+ x x =n4k 4总体峰度 =μβσ 6会用符号检验和秩和检验处理单样本问题(配对数据)的中位数检验问题 7会用Mood 检验和Wilcoxon 秩和检验处理两样本问题 8会用Mood 检验和AB 检验方法来检验 两样本的尺度参数 9会用Kruskal-Wallis 检验方法处理多个独立样本的检验10会用Friedman检验方法处理区组设计问题4.1题目为检验两种燃料添加剂对客车每加仑汽油行驶里程数的影响是否不同,随机挑选12辆车,让每一辆车都先后使用这两种这两种添加剂。
非参数统计分析教学课件
Python
介绍
Python是一种通用编程语 言,因其易读性和易用性 而被广泛用于数据分析和 科学计算。
特点
Python拥有强大的科学计 算库,如NumPy、 Pandas和SciPy等,可进 行数据清洗、统分析等 多种任务。
教程资源
Python的在线教程和书籍 资源丰富,同时还有大量 的科学计算社区和论坛可 供交流。
数据流处理
数据流处理技术可以实时处理大规模数据,为非参数统计分析提供 新的可能性。
云计算
云计算平台可以提供弹性可扩展的计算资源,方便非参数统计分析 的进行。
THANKS
感谢观看
洗和校验。
高维数据的非参数统计分析挑战
维度诅咒
高维数据可能导致传统的非参数统计分析方法失 效,需要开发新的方法。
数据稀疏性
高维数据可能导致数据稀疏,使得统计分析结果 不稳定。
特征选择
高维数据需要进行特征选择,以减少噪声和冗余 ,提高分析效率。
大数据处理技术在非参数统计分析中的应用前景
并行计算
利用并行计算技术可以提高非参数统计分析的效率和准确性。
应用场景与优势
应用场景
适用于数据类型复杂、分布不明确或 数据量较小的情况;例如,生物医学 研究、金融数据分析、社会学调查等 领域。
优势
能够更好地揭示数据的内在结构和关 系;对数据的假设较少,避免过度拟 合和误判;同时具有较高的灵活性和 普适性,能够适用于多种场景。
02
CATALOGUE
非参数统计方法
聚类分析
01
聚类分析是一种非参数统计方法 ,用于将相似的对象归为同一类 ,将不相似的对象归为不同类。
02
聚类分析通过计算对象之间的距 离或相似性来将它们分组,常见 的聚类分析方法有层次聚类、K均 值聚类和DBSCAN聚类等。
非参数检验教学课件
如果多个配对样本得分布存在显著得差异, 那么数值普遍偏大得组秩和必然偏大,数值普 遍偏小得组,秩和也必然偏小,各组得秩之间就 会存在显著差异。如果各样本得平均秩大致相 当,那么可以认为各组得总体分布 没有显著差 异。
2、多配对样本得Kendall协同系数检验
多配对样本得Kendall协同系数检验和 Friedman检验非常类似,也就是一种多配对样 本得非参数检验,但分析得角度不同。多配对 样本得Kendall协同系数检验主要用在分析评 判者得判别标准就是否一致公平方面。她将每 个评判对象得分数都看作就是来自多个配对总 体得样本。一个评判对象对不同被判定对象得 分数构成一个样本,其零假设为:样本来自得多 个配对总体得分布无显著差异,即评判者得评 判标准不一致。
非参数检验教学课件
但许多调查或实验所得得科研数据,其总 体分布未知或无法确定。因为有得数据不就是 来自所假定分布得总体,或者数据根本不就是 来自一个总体,还有可能数据因为某种原因被 严重污染,这样在假定分布得情况下进行推断 得做法就有可能产生错误得结论。此时人们希 望检验对一个总体分布形状不必作限制。
非参数检验根据样本数目以及样本之间得关系 可以分为单样本非参数检验、两独立样本非参数检 验、多独立样本非参数检验、两配对样本非参数检 验和多配对样本非参数检验几种。
6、1 SPSS单样本K-S检验
6、1、1 统计学上得定义和计算公 式 定义:单样本K-S检验就是以两位前苏联数
学家Kolmogorov和Smirnov命名得,也就是一种 拟合优度得非参数检验方法。单样本K-S检验 就是利用样本数据推断总体就是否服从某一理 论分布得方法,适用于探索连续型随机变量得 分布形态。
Kendall协同系数检验中会计算Friedman 检验方法,得到friedman统计量和相伴概率。 如果相伴概率小于显著性水平,可以认为这10 个节目之间没有显著差异,那么可以认为这5个 评委判定标准不一致,也就就是判定结果不一 致。
非参数统计学讲义(第二章)讲稿
非参数统计学讲义第二章 单样本模型 §1 符号检验和有关的置信区间在有了一个样本n X X ,,1 之后,很自然地想要知道它所代表的总体的“中心”在哪里.例如,在对人们的收入进行了抽样之后,就自然要涉及“人均收入”和“中间收入”等概念.这就与统计中的对总体的均值(mean),中位数(median)和众数(mode)等位置参数的推断有关。
例如,在知道总体是正态分布时,要检验其均值是否为μ;一个传统的基于正态理论的典型方法是t 检验.它的检验统计量定义为ns X t /μ-=这里X 为样本均值,而211)(X X n S -∑-=为样本标准差。
t —检验的统计量在零假设下有n —1个自由度的t —分布。
检验统计量是用样本标准差s 代替了有标准正态分布的检验统计量的总体标准差后而产生的在大样本时,二者几乎相等。
t —检验也许是世界上用得最广泛的检验之一。
但是,t —检验并不稳健,在不知总体分布时,特别是小样本时,应用t —检验就可能有风险。
这时就要考虑使用非参数方法。
对于本章所要介绍的数据趋势或随机性检验,就不存在简单的参数方法.非参数方法总是简单实用的。
本章所介绍的一些检验有代表性,因此这里的讨论将比其它章节更为仔细.一旦熟悉了非参数方法的一些基本思路,后面的内容就很容易理解了.一、问题的提出【例2-1】联合国人员在世界上66个大城市生活花费指数(以纽约市1962年12为100)按自小至大的次序排列如下(这里北京的指数为99):表2-1 生活花费指数数据66 75 78 80 81 81 82 83 83 83 83 84 85 85 86 86 86 86 87 87 88 88 88 88 88 89 89 89 89 90 90 91 91 91 91 92 93 93 96 96 96 97 99 100 101 102 103 103 104 104 104 105 106 109 109 110110110111113115116117118155192在例子中,人们可能会问:①总体的平均(或者中间)水平1是多少?②北京是在该水平之上还是之下?可以假定这个样本是从世界许多大城市中随机抽样而得的所有大城市的指数组成总体.可能出现的问题是:这个总体的平均(或者中间)水平是多少?北京是在该水平之上还是之下?这里的平均(或中间)水平是一个位置参数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二讲 非参数检验1. 实验目的1.了解非参数假设检验基本思想;2.会用SAS 软件中的proc npar1way 过程进行非参数假设检验和proc freq 过程进行列联表的独立性检验。
2. 实验要求1.会用SAS 软件建立数据集,并进行统计分析;2.掌握proc npar1way 过程进行非参数假设检验的基本步骤;3.掌握proc freq 过程进行列联表的独立性检验的基本步骤。
3. 实验基本原理3.1 符号检验0:H 两种方法的处理效果无显著性差异令10i i I i ⎧=⎨⎩第个个体中新方法优于对照方法第个个体中新方法劣于对照方法1,2,,i N =L 统计量1NN i i S I ==∑N S 表示新方法的处理效果优于对照方法的配对组总数。
若新方法的处理效果显著的优于对照方法,则N S 的值应明显偏大。
因此,若对给定的置信水平α,有 {}N P S c α≥<,则拒绝0H 。
0H 为真时,(1)N S 服从二项分布1(,)2b N (),()24N N N N E S Var S ==。
拒绝域为:{}N N S Sc >(2)由中心极限定理可知,当2,1N N S N -→∞的零分布趋于标准正态分布。
拒绝域为:N S u α⎧⎫⎪⎪⎪⎪>⎨⎬⎪⎪⎪⎪⎩⎭3.2 Wilcoxon 秩和检验(1)单边假设检验0:H 两种方法的处理效果无显著性差异 as 1:H :新方法优于对照方法。
用于检验0H 的统计量为:1ns i i W I ==∑若对给定的置信水平α,有 {}s P W c α≥<,则拒绝0H 。
且s W 的分布列为:0#{;,}{}H s w n m P W w N n ==⎛⎫ ⎪⎝⎭根据观测结果计算s W 的观测值0s W ,计算检验的p 值:00{}{}s H s s H s k w p P W w P W k ≥=≥==∑然后将p 值与显著水平α作比较,若p α<,则拒绝0H ,否则接受0H 。
(2)双边假设检验给定的显著水平21,c c 和α应该满足:ε=≥+≤}{}{2100c W P c W P A H A H仅由上式还不能唯一确定21c c 和,当我们对两种方法谁优谁劣不得而知时,通常取2}{}{2100α=≥=≤c W P c W P A H A H若利用p 值进行检验,设A A W ω的观测值为,计算概率值}{}{00A A H A A H W P W P ωω≤≥或由对称性可知,检验的p 值为上述两概率中小于1/2的那一个的2倍。
例如21W P 0A A H 0}<{ω≥≤则}{20A A H W P p ω≥=。
求出p 值后,若p<a ,拒绝0H ,否则接受。
(3)列联表的独立性检验0:H 方法的处理效果无显著性差异ijk π:表示格子概率,ijk ijk m n π=表示三维列联表中事件发生的理论频数。
将概率用相应的频率频率去估计。
令222111ˆ()~()ˆr s tijk ijk i j k ijk n m Q f m χ===-=∑∑∑ 其中:(1)()f rst =--为检验特定独立性所需要独立估计的概率数目 将样本数据代入统计量进行检验。
然后将P 与显著水平α作比较,若p α<,拒绝0H ,否则接受0H 。
4. 实验相关SAS 知识(1)独立样本的秩检验——proc npar1way 过程proc npar1way 过程的基本语句形式为proc npar1way [options];class variables;(proc npar1way 过程不可缺少的语句)exact;(求出检验的精确p 值)var variables;其中“options ”可包含以下选项的部分或全部:①DATA=数据集名:指定要分析的数据集。
②ANOVA :对原始数据执行标准的单因素方差分析。
③WILCOXON :进行wilcoxon 型秩和检验。
当有两种处理方法时,进行的是wilcoxon 秩和检验;当有多种处理方法时,进行Kruskall-Wallis 检验。
④EDF :进行基于样本经验分布函数的非参数检验,包括Smirnov 检验。
若省略这些选项,SAS 系统将给出所有基于秩以及经验分布函数的非参数检验方法的分析结果。
(2)列联表的独立性检验proc freq 过程的基本语句形式为proc freq [options];tables variable1*variable2*……/options;weight variable;其中“options ”可包含以下选项的部分或全部:①DATA=数据集名:指定要分析的数据集。
②chisq:要求对生成的每个二维列联表的独立性作2χ检验,并计算依赖于2χ统计量的关联度。
③cellchi2:要求输出每个格子对总2χ统计量的贡献。
④expected:在独立性假定下输出各格子的期望频数。
⑤deviation:要求输出每个格子上的频数与期望频数之差。
⑥nocol:不输出二维列联表各格子的列百分数。
⑦norow: 不输出二维列联表各格子的行百分数。
⑧nofreq:不输出格子频数。
⑨nopercent:不输出各格子的百分数。
⑩noprint:不输出列联表,但允许输出各分析结果。
5. 实验举例5.1 Wilcoxon 秩和检验(单边和双边假设检验)例 1 为了解一种新的术后护理方法和原护理方法相比是否可以显著缩短病人手术后的恢复时间,随机的将做完某种手术的18位病人分为两组,每组9人,按不同方法护理,观测到他们的恢复时间(单位:天)如下:原方法:20,21,24,30,32,36,40,48,54新方法:19,22,25,26,28,29,34,37,38在05.0=α下检验新方法是否显著的缩短了病人手术后的恢复时间。
Wilcoxon 秩和单边假设检验SAS 程序如下:data a1;input method $ time@@;cards ; a 20 a 21 a 24 a 30 a 32 a 36 a 40 a 48 a 54 b 19 b 22 b 25 b 26 b 28 b 29 b 34 b 37 b 38 ;proc npar1way data =a1 wilcoxon ;class method;exact ;run ;结果显示α>=2181.0p ,故接受原假设0H ,即认为病人手术后采用新旧护理方法对其恢复时间无显著差异。
5.2.Smirnov 检验例2(数据见教材)SAS 程序如下:data a1;input group $ time@@;cards ; a 6.8 a 3.1 a 5.8 a 4.5 a 3.3 a 4.7 a 4.2 a 4.9 b 4.4 b 2.5 b 2.8 b 2.1 b 6.6 b 0.0 b 4.8 b 2.3 ;proc npar1way data =a1 edf ;class group;exact ;var time;run ;运行结果显示p=0.0879>0.05,即认为两种止痛药效果无显著差异;但在0.1水平上可认为两者有显著差异。
5.3.Wilcoxon 符号秩检验例3(见教材例题2.8)SAS 程序如下:data a;input id product1 product2;cards ;1 459 4142 367 3063 303 3214 392 4435 310 2816 342 3017 421 3538 446 3919 430 40510 412 390;data b;set a;diff=product1-product2;proc univariate data=b;var diff;run;运行结果显示:符号秩和检验的p值为0.1094>0.05,故认为两复合肥无显著差异;而Wilcoxon秩和检验的p值为0.0488<0.05,故认为新复合肥能显著提高小麦的产量。
5.4 多种处理方法比较的Kruskal-Wallis检验例4(见教材例题2.10)SAS程序如下:data a;input group $ weight@@;cards;a 164 a 190 a 203 a 205 a 206 a 214 a 228 a 257b 185 b 197 b 201 b 231c 187 c 212 c 215 c 220 c 248 c 265 c 281d 202 d 204 d 207 d 227 d 230 d 276;proc npar1way data=a wilcoxon;class group;(不要加入exact语句,运行非常耗时!)var weight;run;运行结果显示Pr > Chi-Square =0.2394>0.05,故认为四种食谱的营养效果无显著差异。
5.5 Friedman检验例5(见教材例题2.12)SAS程序如下:data a;input person $ emotion $ v@@;cards;p1 e1 23.1 p1 e2 22.7 p1 e3 22.5 p1 e4 22.6p2 e1 57.6 p2 e2 53.2 p2 e3 53.7 p2 e4 53.1p3 e1 10.5 p3 e2 9.7 p3 e3 10.8 p3 e4 8.3p4 e1 23.6 p4 e2 19.6 p4 e3 21.1 p4 e4 21.6p5 e1 11.9 p5 e2 13.8 p5 e3 13.7 p5 e4 13.3p6 e1 54.6 p6 e2 47.4 p6 e3 39.2 p6 e4 37.0p7 e1 21.0 p7 e2 13.6 p7 e3 13.7 p7 e4 14.8p8 e1 20.3 p8 e2 23.6 p8 e3 16.3 p8 e4 14.8;proc freq;tables person*emotion*v/scores=rank cmh noprint;run;运行结果显示p值为0.0917>0.05,故认为在催眠状态下,受试者对4种情绪状态的反应无显著差异。
5.6 列联表的独立性检验例6(数据见教材例题)SAS程序如下:data penalty;input p $ d $ count@@;cards;y w 19 y b 17 n w 141 n b 149;proc freq data=penalty;tables p*d/chisq expected nocol norow nopercent;weight count;run;6. [ 本次实验]为了研究两种化学添加剂对电池寿命的影响,对13个同类型的电池,随机的抽取6个加入甲种添加剂,其余7个加入乙种添加剂,各组电池寿命如下(单位:小时):甲组:18 24 25 27 30 35乙组:20 21 28 32 34 38 40对α=0.10,检验两种添加剂下电池的寿命是否有显著差异。