非参数统计复习过程

合集下载

非参数统计讲义

非参数统计讲义
第一章
绪论
§1.1 非参数统计
在初等统计学中,最基本的概念是什么 在初等统计学中,最基本的概念是什么? 总体, 如:总体,样本,随机变量,分布,估计 总体 样本,随机变量,分布, 和假设检验等 和假设检验等. 其很大一部分内容是和正态理论相关的。 正态理论相关的 其很大一部分内容是和正态理论相关的。 在那里,总体的分布形式或分布族 分布形式或分布族往往是 在那里,总体的分布形式或分布族往往是 给定的或者是假定了的, 给定的或者是假定了的,所不知道的仅仅 是一些参数的值或他们的范围。 主要工 是一些参数的值或他们的范围。(主要工 作是什么?) 作是什么
然而,在实际生活中,那种对总体的分布 的假定并不是能随便做出的。 数据并不是来自所假定分布的总体;或者, 数据根本不是来自一个总体;还有可能, 数据因为种种原因被严重污染。这样,在 假定总体分布的情况下进行推断的做法就 可能产生错误的结论。 于是,人们希望在不假定总体分布的情况 下,尽量从数据本身来获得所需要的信息。 这就是非参数统计的宗旨。
注意:非参数统计的名字中的“ 注意:非参数统计的名字中的“非参数 (nonparametric)” (nonparametric) 意味着其方法不涉及描述总 体分布的有关参数;它被称为和分布无关 体分布的有关参数;它被称为和分布无关 (distribution—free) free), (distribution free),是因为其推断方法和 总体分布无关;不应理解为与所有分布( 总体分布无关;不应理解为与所有分布(例如有 关秩的分布)无关. 关秩的分布)无关. 什么是非参数统计? 什么是非参数统计? 不假定总体分布的具体形式, 不假定总体分布的具体形式,从数据本身获得 所需要的信息, 所需要的信息,通过推断方法得到相关结论的 一种分析方法。 一种分析方法。

《非参数统计》课程教学大纲

《非参数统计》课程教学大纲

非参数统计Non-parametricStatistics一、课程基本信息学时:48(含实验8学时)学分:3考核方式:考试,平时成绩占总成绩30%。

中文简介:非参数统计为有效地分析试验设计及其实际问题中所获得的数据提供了丰富的统计工具。

本课程从问题背景与动机、方法引进、理论基础、计算机实现、应用实例等诸多方面介绍了非参数统计方法,其内容包括:基于二项分布的检验、列联表、秩检验、Ko1mogorov-Smirnov 型统计量等。

本课程在强调实用性的同时,突出了应用方法与理论的结合。

在人才培养体系中,该课程属于选修课程,但建议每个统计学专业的学生必须掌握若干种非参数统计方法,以其作为其他重要统计方法的补充。

特别是针对名义数据分析及有序数据分析时相当有用。

二、教学目的与要求非参数统计是研究随机现象存在的统计规律的学科,其在经济、工农业生产和科学技术等领域有广泛的应用,是一门应用性很强的一门课程。

本课程(1)使学生掌握非参数理论的基本原理和方法,重点掌握单样本,多样本的位置检验和尺度检验,以及相关检验和分布检验。

注意与参数统计的区别;(2)结合实际例子,运用非参数理论,提高学生运用该工具解决实际问题的能力。

(3)使学生进一步掌握具体与抽象、偶然与必然、特殊与一般等辨证关系,培养学生辨证唯物主义观点。

三、教学方法与手段教学中主要采用课堂教学的方法,当中穿插大量的案例,同时预留课堂讨论与练习的时间让学生进行实际的操作。

本课程同时设立计算机上机课程,由老师自编实验指导书详细指导学生进行上机实践,强调动脑与动手相结合,理论与实践相结合。

o五、推荐教材和教学参考资源教材:非参数统计:基于R语言案例分析,柳向东编,暨南大学出版社,2010年12月(第1版)参考资料:1)非参数统计,王星编著,北京:中国人民大学出版社,2(X)5年1月(第一版)2)非参数统计方法,吴喜之等,北京:高等教育出版社,1996年(第1版)3)孙山泽.非参数统计讲义.北京:北京大学出版社,2000。

非参数统计讲义通用课件

非参数统计讲义通用课件

假设检验方法
总结词
假设检验方法用于检验一个关于总体 参数的假设是否成立。
详细描述
假设检验方法包括提出假设、构造检 验统计量、确定临界值和做出决策等 步骤。常见的假设检验方法有t检验、 卡方检验、F检验等,用于判断样本数 据是否支持假设。
关联性分析方法
总结词
关联性分析方法用于研究变量之间的相关性。
02
非参数统计方法
描述性统计方法
总结词
描述性统计方法用于收集、整理、描述数据,并从数据中提取有意义的信息。
详细描述
描述性统计方法包括数据的收集、整理、描述和可视化,例如均值、中位数、 众数、标准差等统计量,以及直方图、箱线图等图形化表示。这些方法可以帮 助我们了解数据的分布、中心趋势和离散程度。
非数统计与机器学习算法的结 合将有助于解决复杂的数据分析 问题。
02
与大数据技术的融 合
非参数统计将借助大数据技术处 理海量数据,挖掘数据背后的规 律和模式。
03
与社会科学研究的 互动
非参数统计方法将为社会科学研 究提供更有效的研究工具和方法 。
决策树分析方法
总结词
决策树分析方法是一种基于树形结构的非参 数统计学习方法。
详细描述
决策树分析方法通过递归地将数据集划分为 更小的子集,构建出一棵决策树。决策树的 每个节点表示一个特征属性上的判断条件, 每个分支代表一个可能的属性值,每个叶子 节点表示一个分类结果。决策树分析可以帮 助我们进行分类、预测和特征选择等任务。
非参数统计的发展趋势
多元化发展
非参数统计将不断拓展其应用领域,从传统的医学、生物 、经济领域向金融、环境、社会学等领域延伸。
01
算法优化
随着计算能力的提升,非参数统计的算 法将进一步优化,提高计算效率和准确 性。

非参数统计讲义

非参数统计讲义

非参数统计讲义(总14页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--第一章 绪 论本章主要内容: 1.非参数方法介绍2.预备知识第一节 非参数方法介绍一. 非参数方法的概念和实例复习参数方法定义:设总体X 的分布函数的形式是已知的,而未知的仅仅是分布函数具体的参数值,用样本对这些未知参数进行估计或进行某种形式的假设检验,这类推断方法称为参数方法。

先来看两个实例。

例 供应商供应的产品是否合格某工厂产品的零件由某个供应商供应。

合格零件标准长度为(±)cm 。

这也就是说合格零件长度的中心位置为,允许误差界为,即长度在-之间的零件是合格的。

为评估近年来供应的零件是否合格,随机抽查了n=100个零件,它们的长度数据X 见第一章附表。

解答:根据我们已学过的参数统计的方法,如何根据数据来判断这批零件合格否 用参数数据分析方法,在参数统计中,运用得最多的是正态分布,所以考虑假设供应商供应的零件长度X 服从正态分布,即X ~),(2σμN其中两个参数均未知,但可用样本均值估计μ,样本方差估计2σ。

由已知的数据计算可得:零件的平均长度,即样本均值为x =,样本标准差为s=。

则零件合格的可能性近似等于)/)4.8(()/)6.8(()6.84.8(σμσμ-Φ--Φ=≤≤X P)1047.0/)4958.84.8(()1047.0/)9458.86.8((-Φ--Φ≈%66≈这个说明:约有三分之一的零件不合格,该工厂需要换另一个供销商了。

但这个结论与实际数据符不符合呢这是我们要思考的问题。

我们可以对数据做一个描述性分析,先对这100个样本数据做一个频率分布。

观察到:在这100个零件中有91个零件的长度在~之间,所以零件合格的比例为91%,超过66%很多!统计分析的结论与数据不吻合的!这是什么原因呢我们可以作出数据的直方图来分析数据的分布情况。

由图知,该数据的总体不是近似服从正态分布的!所以我们对于数据的总体分布的假设错了!问题就出在假设总体是正态分布上!继续看直方图,能否很容易就观察出来它大概是什么分布呢答案是不易看出,所以试图先确定数据的分布函数,再利用参数的方法来分析是不太容易的。

非参数统计学讲义(第二章)讲稿

非参数统计学讲义(第二章)讲稿

非参数统计学讲义第二章 单样本模型 §1 符号检验和有关的置信区间在有了一个样本n X X ,,1 之后,很自然地想要知道它所代表的总体的“中心”在哪里.例如,在对人们的收入进行了抽样之后,就自然要涉及“人均收入”和“中间收入”等概念.这就与统计中的对总体的均值(mean),中位数(median)和众数(mode)等位置参数的推断有关。

例如,在知道总体是正态分布时,要检验其均值是否为μ;一个传统的基于正态理论的典型方法是t 检验.它的检验统计量定义为ns X t /μ-=这里X 为样本均值,而211)(X X n S -∑-=为样本标准差。

t —检验的统计量在零假设下有n —1个自由度的t —分布。

检验统计量是用样本标准差s 代替了有标准正态分布的检验统计量的总体标准差后而产生的在大样本时,二者几乎相等。

t —检验也许是世界上用得最广泛的检验之一。

但是,t —检验并不稳健,在不知总体分布时,特别是小样本时,应用t —检验就可能有风险。

这时就要考虑使用非参数方法。

对于本章所要介绍的数据趋势或随机性检验,就不存在简单的参数方法.非参数方法总是简单实用的。

本章所介绍的一些检验有代表性,因此这里的讨论将比其它章节更为仔细.一旦熟悉了非参数方法的一些基本思路,后面的内容就很容易理解了.一、问题的提出【例2-1】联合国人员在世界上66个大城市生活花费指数(以纽约市1962年12为100)按自小至大的次序排列如下(这里北京的指数为99):表2-1 生活花费指数数据66 75 78 80 81 81 82 83 83 83 83 84 85 85 86 86 86 86 87 87 88 88 88 88 88 89 89 89 89 90 90 91 91 91 91 92 93 93 96 96 96 97 99 100 101 102 103 103 104 104 104 105 106 109 109 110110110111113115116117118155192在例子中,人们可能会问:①总体的平均(或者中间)水平1是多少?②北京是在该水平之上还是之下?可以假定这个样本是从世界许多大城市中随机抽样而得的所有大城市的指数组成总体.可能出现的问题是:这个总体的平均(或者中间)水平是多少?北京是在该水平之上还是之下?这里的平均(或中间)水平是一个位置参数。

《非参数统计分析》教案

《非参数统计分析》教案

添加标题
添加标题
添加标题
添加标题
案例分析:通过分析具体案例,帮 助学生理解抽象概念和理论
实验操作:通过实验操作,让学生 亲身体验统计方法的应用过程
评价方式
课堂表现:观察学 生的课堂参与度、 回答问题的准确性 和思考问题的深度
作业完成情况:评 估学生对课堂内容 的理解和应用能力
小组讨论:鼓励学 生之间的合作与交 流,培养团队协作 能力
介绍非参数统计分析的基本 方法
介绍非参数统计分析在各个 领域的应用
介绍非参数统计分析的概念 和特点
介绍非参数统计分析的优缺 点和注意事项
导入:介绍非参数统计分 析的概念和背景
教学步骤
定义与概念:讲解非参数 统计分析和相关概念
方法与步骤:详细介绍非 参数统计分析的方法和步 骤
案例分析:通过具体案例 来展示非参数统计分析的 应用
总结与回顾:总结本次课 程的内容,回顾非参数统 计分析的方法和步骤
作业与思考:布置相关作 业和思考题,引导学生深 入思考
教学重点
重点知识点1:非参数统计的 基本概念
重点知识点2:非参数统计与 参数统计的区别
重点知识点3:非参数统计的 优缺点
重点知识点4:非参数统计的 应用场景
教学难点
难点概念:难以理解或掌 握的基本概念或原理
难点应用:将理论知识应 用于实际问题的能力
难点计算:复杂的统计计 算和分析方法
难点理解:对统计原理和 方法的深入理解和掌握
教学方法
案例教学法:通 过具体案例的分 析和讨论,帮助 学生理解和掌握 非参数统计分析 的基本概念和方
法。
互动式教学法: 采用课堂互动、 小组讨论等方式, 鼓励学生积极参 与,提高学生的 学习兴趣和主动

非参数统计讲义通用课件

非参数统计讲义通用课件
案例分析
通过实际案例展示如何使用Python进行非 参数统计,包括分布拟合、假设检验和模 型选择等步骤。
SPSS实现
SPSS简介
SPSS(Statistical Package for the Social Sciences) 是一款流行的社会科学统计 软件。
操作界面
SPSS的非参数统计功能通常 在“分析”菜单下的“非参 数检验”选项中,用户可以 通过直观的界面进行操作。
聚类分析方法在数据挖掘、 市场细分等领域有广泛应用, 可以帮助我们发现数据的内 在结构和模式。
异常值检测方法
• 异常值检测方法用于识别和剔除数据中的异常值,提高数据分析的准确性和可靠性。
• 常见的异常值检测方法包括基于统计的方法、基于距离的方法、基于密度的方等。 • 基于统计的方法利用统计学原理,如z分数、IQR等,判断数据是否为异常值;基于距离的方法通过计算对象与其它对象的距离来判断是否为异常值;基于密度的方法则根据对象周围的密度变化来判断是否
解释性较差
相对于参数统计,非参数统计结果通 常较为抽象,难以直接解释其具体含 义。
假设检验能力较弱
非参数统计在假设检验方面的能力相 对较弱,对于确定性的结论和预测不 如参数统计准确。
如何克服非参数统计的局限性
01
02
03
04
利用高效计算方法
采用并行计算、分布式计算等 高效计算方法,提高非参数统
计的计算效率和准确性。
描述性统计方法在数据分析中起到基 础作用,为后续的统计推断提供数据 基础和初步分析结果。
假设检验方法
假设检验方法是一种统计推断 方法,通过提出假设并对其进
行检验,判断假设是否成立。
假设检验方法包括参数检验和 非参数检验,其中非参数检验 不依赖于总体分布的具体形式,

统计学第十八章非参数统计PPT资料(正式版)

统计学第十八章非参数统计PPT资料(正式版)
的等级数,Ri为每组的等级和
S
Ri2 (
Ri )2 n
2 12S
mn(n 1)
2自由度为n 1
谢谢观看
统计学第十八章非参数统计 1、将x,y分别由小到大列出等级,数字相同取平均等级
分析步骤: Kendall等级相关统计量
基本思想:用一个统计量来衡量以一个变量的等级为标准时,另一个变量的等级与它不一致的情况。 加上两行:Ry右边更小的等级个数(包括相等的),然后合计,之前加负号;
即一以、xS的pea等rm级an为等顺级序1相排、关列。将x,y分别由小到大列出等级,数字相同取平均等
u S 1
s
三、2k列联表的等级相关
2k列联表contingency table,可看作是按两种方法排等 级,但有许多重复等级的资料
k 1
k
k 1 k
S (Ni ti ) t j ti (N j t j )
i 1
j i 1
i1 ji1
2 s
T(N T) 3N (N 1)
(N
2 2
4、根据样本含量n查等级相关系数的统计意义 临界值表(附表9-1)rs rs0.05(n) , P
若样本含量较大,不能在附表19-1中查到临界 值,可直接查相关系数的统计意义临界值表 (附表9-1),=n-2
例19-1,P228
二、Kendall等级相关
基本思想:用一个统计量来衡量以一个变 量的等级为标准时,另一个变量的等级与 它不一致的情况。
3
Ni3 )
2
S2
2 s
卡方检验等级相关有无统计意义
Kendall 等级相关系数仍用上述公式计算。见例19-3
四、R C列联表的等级相关 用于行列分组都有等级意义时的相关分析 S=∑aijakl-∑aijast 式中i=1,…,I; j=1,…,J; k>i; l>j; s>i; t<j; Kendall等级相关统计量

非参数统计讲义四卡方检验课件

非参数统计讲义四卡方检验课件
它通过卡方统计量来衡量实际观测频数与期望频数之间的差异程度,并根据卡方分布计算出p值,从而判断差异是否具有统计 学显著性。
卡方检验的步骤与公式
03
卡方检验的步骤
确定研究问题
明确研究目的,确定研究变量和 分组。
数据收集
收集相关数据,确保数据质量。
数据整理
对数据进行整理,确保数据符合 卡方检验的要求。
它通过计算卡方统计量,评估观测频 数与期望频数之间的差异是否具有统 计学显著性。
卡方检验的适用范围
卡方检验适用于分类变量,特别是当 样本量较小或数据不符合正态分布时。
它常用于检验两个分类变量之间是否 独立,或者检验一个分类变量与一个 二项分布的随机变量之间是否相关。
卡方检验的基本思想
卡方检验基于假设检验的思想,通过比较实际观测频数与期望频数来推断变量之间的关系。
非参数统计讲义四卡 方检验课件
目录
• 非参数统计概述 • 卡方检验基本概念 • 卡方检验的步骤与公式 • 卡方检验的案例分析 • 卡方检验的优缺点与注意事项
非参数统计概述
01
定义与特点
定义
非参数统计是一种统计方法,它不依 赖于任何关于数据分布的假设,而是 基于数据本身的特点进行统计分析。
特点
非参数统计具有广泛的应用范围,可 以处理各种类型的数据,并且对数据 的分布和样本大小的要求相对较低。
卡方检验的缺点
对数据要求较高
卡方检验对于数据的完整性、准确性和独立性要求较 高,否则可能导致结果失真。
对样本量要求较高
在样本量较大的情况下,卡方检验的统计效能会降低, 导致结果不够准确。
对离群值敏感
卡方检验对于离群值较为敏感,可能导致结果偏差。
卡方检验的注意事项

非参数统计讲义一--绪论

非参数统计讲义一--绪论

秩(rank)利用秩的大小进行推断就避免 了不知道背景分布的困难。这也是大多数 非参数检验的优点。 多数非参数检验明显地或隐含地利用了秩 的性质;但也有一些非参数方法没有涉及 秩的性质。
非参数检验中秩是最常使用的概念。什么是 一个数据的秩呢?一般来说,秩就是该数据 按照升幂排列之后,每个观测值的位置。
6、非参数统计方法所推断的通常不是总体参 数 7、其通常按大小或出现先后顺序排列的资料 进行分析。 8、通常以中位数代表分布的中心,以极差代 表离散程度。
非参数统计的主要内容
内容
2独立样本 2 配对样本 /单一样本 >2独立样本
非参数检验
中位数检验 秩和检验 符号检验 Wilcoxon 检验 Kruskal-Wallis 检验
本课程的目的是使学生认识到非参数统计方法是 统计中最常用的推断方法之一,理解非参数统计 方法和参数统计方法的区别,理解非参数统计的 基本概念,掌握非参数统计的基本理论和计算, 能应用统计软件和非参数统计方法分析解决实际 问题。
统计是分析数据信息的科学 这个定义决定了统计的命运:
• 和数学不同, 统计不能欣赏自己, 它不为实际服务 就没有存在必要 • 统计必须为各个领域服务 • 统计必须和数据打交道 • 因此,统计必须和计算机结合
Ordinal
Friedm an TwoWay ANOVA by Ranks Page Test for Ordered Alternativ es
非参数统计的历史 非参数统计的形成主要归功于20世纪40年代~ 50年代化学家F.Wilcoxon等人的工作。
Wilcoxon于1945年提出两样本秩和检验,1947 年Mann和Whitney二人将结果推广到两组样本 量不等的一般情况;

非参数统计复习题

非参数统计复习题

非参数统计复习题非参数统计是一种统计方法,它不依赖于总体分布的具体形式,而是通过观测数据来进行推断和分析。

与参数统计相比,非参数统计更加灵活,适用范围更广。

在本文中,我们将回顾一些与非参数统计相关的复习题。

1. 什么是非参数统计?非参数统计是一种不依赖于总体分布的统计方法。

它不对总体分布做出任何假设,而是通过观测数据来进行统计推断。

非参数统计方法的优势在于适用范围广泛,可以处理各种类型的数据。

2. 请解释什么是秩和检验?秩和检验是一种非参数统计方法,用于比较两个独立样本的中位数是否相等。

它基于样本的秩次,将观测值转化为秩次,然后计算两个样本的秩和。

通过比较两个样本的秩和,可以判断它们是否来自同一总体。

3. 请解释什么是Wilcoxon符号秩检验?Wilcoxon符号秩检验是一种非参数统计方法,用于比较两个相关样本的中位数是否相等。

它基于样本差异的符号和秩次,通过比较符号秩和的大小来进行假设检验。

Wilcoxon符号秩检验适用于小样本或偏态分布的数据。

4. 请解释什么是Kruskal-Wallis检验?Kruskal-Wallis检验是一种非参数统计方法,用于比较三个或更多独立样本的中位数是否相等。

它基于样本的秩次,将观测值转化为秩次,并计算各组的秩和。

通过比较不同组的秩和,可以判断它们是否来自同一总体。

5. 请解释什么是Friedman检验?Friedman检验是一种非参数统计方法,用于比较三个或更多相关样本的中位数是否相等。

它基于样本差异的秩次,通过计算各组的秩和来进行假设检验。

Friedman检验适用于小样本或偏态分布的数据。

6. 请解释什么是Mann-Whitney U检验?Mann-Whitney U检验是一种非参数统计方法,用于比较两个独立样本的总体分布是否相等。

它基于样本的秩次,通过计算秩和来进行假设检验。

Mann-Whitney U检验适用于小样本或偏态分布的数据。

7. 请解释什么是Kolmogorov-Smirnov检验?Kolmogorov-Smirnov检验是一种非参数统计方法,用于比较一个样本的总体分布与一个已知分布是否相等。

非参数统计专题培训

非参数统计专题培训

样本1: n1=12 10,10,10,12,15,17,17,19,20,22,25,28;
样本2: n2=9 6,7,8,8,12,16,19,19,22;
在99D.05efine 1D00ic.2h5 otom10y2.旳56 Cut9p9.o15int 输1入04.:89100(101克.86) 96.37
96.79
99.37
在96T.90est Pr9o3p.9o4 rtion9输2.9入7 p0=108.5.208 (零96假.86设不小93.于94 100g98旳.27百分比98.3)6
gsw eight Group 1 <= 100
17
.68
.50
.108
.032
Group 2 > 100
8
.32
Total
25
1.00
双边检验旳p-值=0.108;所以,单尾检验旳p-值为0.05388。根 据这个符号检验,我们还没有充分旳证据拒绝零假设。
三、配对样本符号检验
• 配对样本问题 • 某香烟企业要了解消费者对其香烟旳电
C4 23
0.523
0.0013 0.05
(4) 此为“小概率”事件,所以拒绝H0假设。 广告效果明显!
S例PS、S软采件用使例用6: .以4旳”减减肥肥数数据据”(diedti.seatv.s为av例)。有两列50对数据。 选把在其(减变项 变 下肥中量A量面前一nb选是ael后列fSyaoizfgre重t数en-e和r量据N)a是of差tn(e减pr旳同a变肥ra步中量m后选位e是t旳入r数icbT重Te为esef量tsomtPrs(ea-D.i)rR则单(se是)l要位aLt减ie检s:dt之肥S验公a中前m旳斤p旳l问)es重题。量成令,为全另:部一个列体

课件:第六章_非参数统计

课件:第六章_非参数统计
• 非参数统计的名字中的“非参数 (nonparametric)”意味着其方法不涉及 描述总体分布的有关参数;它被称为和 分布无关(distribution—free),是因为其 推断方法和总体分布无关;不应理解为
2021/11/25 与所有分布(例如有关秩的分布)无关.13
3. 参数统计与非参数统计比较
• 2. 数据的形态各异
– 定量数据
– 定序数据
– Example: Good-Better-Best
– 名义数据
– Example: Male-Female
2021/11/25
12
非参数方法
• 在不知总体分布的情况下如何利用数据 所包含的信息呢?一组数据的最基本的信 息就是次序.如果可以把数据点按大小 次序排队,每一个具体数目都有它的在 整个数据中(从最小的数起)的位置或次 序,称为该数据的秩(rank).
17
4. 非参数统计的历史
2021/11/25
18
非参数统计的历史
• 非参数统计的形成主要归功于20世纪 40年代~50年代化学家F.Wilcoxon等人 的工作。Wilcoxon于1945年提出两样 本秩和检验,1947年Mann和Whitney
二人将结果推广到两组样本量不等的 一般情况;
2021/11/25
出。 • 数据分析方法和手段不足。
2021/11/25
6
统计的方法论
• 就方法论而言,统计分析主要解决两方 面的问题:
– 寻找数据内部差异中共同的特征。 – 寻找数据之间本质的差异。
• 统计分析的目标是从数据中发现比数据 本身更为有用的知识
2021/11/25
7
2. 非参数统计方法简介
2021/11/25

第六章 非参数统计

第六章 非参数统计
2019/3/25 版权所有 BY 统计学课程组 15
3.线性符号秩统计量
设Ri+在∣X1∣,∣X2∣,…,∣Xn∣中的秩,定义an+(.)为在 整数1,2,…,n上的非负函数,且满足an+(1),…,an+(n)不全 为0,则称
S
n
a R I X 0
n i i i 1
Χα2(m-1-r)(这种检验是右侧检验)。
(4)利用样本值X1,…,Xn计算实际频数fi,再计算经验概率p 2 m fi npi 的值。 ,据以计算 2 npi i 1

(5)结论,若
认为总体的分布函数不为F0(X);反之,则接受原假设,即认
为总体的分布函数为F0(X)。
m 1 r ,则拒绝原假设,即
地段的汽车辆数服从泊松分布。
2019/3/25
版权所有 BY 统计学课程组
25
二、符号检验
假定用总体中位数M来表示中间位置,并且X1,…,Xn
独立同分布,这意味着X1,…,Xn取大于M的概率应该与 取小于M的概率均为1/2。对于我们所研究的问题,可 以看作是只有两种可能“成功”或“失败”。成功为 “+”,即大于中位数;失败为“-”,即小于中位数M。
2019/3/25
版权所有 BY 统计学课程组
12
1.秩统计量
设X1,X2,…,Xn为来自总体X的简单随机样本(其中无重复 数据点)。记Ri为样本点Xi的秩,即
Ri
I X
j i
n
j
Xi X j Xi X j Xi
其中
1 I X j Xi 0
2019/3/25
版权所有 BY 统计学课程组

非参数统计知识点总结

非参数统计知识点总结

2*5(选择) + 2*5(名解) + 6*5(简答) + 10*3(计算)+ 5*4(推导)名解(2*5)1.渐近相对效率(P15)针对零假设只取一个值的假设检验问题,在零假设的一个邻域内,固定势,令备择假设逼近零假设,将两个统计量的样本量比值的极限定义为渐进相对效率。

具体而言,对假设检验问题H0:θ=θ0↔H1:θ≠θ0取备择假设序列θi(i=1,2,…),θi≠θ0,且limi→∞θi=θ0。

在固定势1−β之下,我们考虑两个检验统计量V ni和T mi 。

其中V ni和T mi分别是备择为θi所对应的两个检验统计量序列,n i和m i是两个统计量分别对应的样本量。

势函数满足:lim i→∞g Vn i(θ0)=limi→∞g Tm i(θ0)=α,α<limi→∞g Vn i(θi)=limi→∞g Tm i(θi)=1−β<1.如果极限e VT=limi→∞m i n i存在,且独立于θi,α和β,则称 e VT是 V 相对于 T 的渐进相对效率,简记为 ARE(A,T)。

2.顺序统计量(P18)假设总体 X 有容量为n的样本 X1,X2,…,X n,将 X1,X2,…,X n按从小到大排序后产生统计量X(1)≤X(2)≤⋯≤X(n)则称统计量 {X(1),X(2),…,X(n)} 为顺序统计量。

3.秩次设样本X1,X2,…,X n是取自总体X的简单随机抽样,X1,X2,…,X n中不超过X i的数据个数,即R i=∑Inj=1(X j≤X i)称R i为X i的秩,X i是第R i个顺序统计量,X(Ri)=X i。

【相关知识点】秩统计量令R=(R1,…,R n),R是由样本产生的统计量,称为秩统计量。

4.秩和以秩次代表原始数据后,所得某些秩次之和,即按某种顺序排列的序号之和,称为秩和。

5. 核设 X 1,X 2,…,X n 取自分布族 ℱ={F (θ),θ∈Θ},如果待估参数 θ 存在样本量为 k 的无偏估计量ℎ(X 1,X 2,…,X k ),k <n ,即满足E ℎ(X 1,X 2,…,X k )=θ,∀θ∈Θ使上式成立的最小样本量为 k ,则称参数 θ 是 k 的可估参数。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

拟合优度检验需要注意 (1)各组理论频数fei不得小于5; (2)样本单位数 n >50; (3)若某一类(组)理论频数 < 5,应与邻类 (组)合并,且k应为实际类(组)数 (4)注意 r 的取值
三、独立性检验 利用样本信息对两组数据是否彼此关联的检验。 特点在于其理论频数由样本实际频数计算得出
检验步骤
(1)建立假设 H0:两组变量独立 H1:两组变量不独立
(2)将样本资料编成 r×c列联表,并列出 实际频数Oij
(3)计算理论频数
Eij
Oi•O• j n
(4)计算检验统计量
r
2
c (O ijE i)j2
i 1 j 1
E ij
2
~ (r 1 )c( 1 )
(5)给定的α,若χ2> χα2,拒绝原假设
对分布、方差均不 作任何假定
不计具体数值,只考虑 差数的正负方向
损失了具体数值差 别的信息
检验步骤
(1)确定配对样本,识别差 异,统计正负差异个数
(2)建立假设: H0:两组数据无差异 等价于 H0: P (+) =0.5
H1: P (+) ≠0. 5
(3)计算检验统计量 大样本时:
ˆ Z P 0.5
O22 O32
O23 … O2c O33 … O3c
..
.
.
..
..
.
.
..
..
.
.
..
r Or1
Or2
Or3 … Orc
O1· O2 · O3 · .
.
.
Or ·
合计O ·j O.1 O.2 O.3 … O.c n
O ∑O O ∑O 记:
c
i•
ij
r
•j
ij
j
i
显然 n ∑Oi• ∑O• j
c
X X y O P P(X ,
) i•
P i
i
j
j1
n
i•
r
y X y O P P( P j
i1
, y ) •j
i
j
n
•j
若X、Y相互独立,应有:PX i yj P i• P •j O n i• O n •j
检验X和Y的独立性,等于检验:
H 0 : P X i y j P i • P • j
非参数统计
非参数统计的特点
不要求对总体分布 作任何限制性假定
可用于定名测定和 定序测定的变量
不以估计总体参数 为目的
方法直观,易于理 解,运算比较简单;
若总体分布能确定时,较参数方法效率差
第二节 χ2检验
一、拟合优度检验
利用样本信息对总体是否与某种假设的理论分布符 合的检验。
检验的基本思想 假设总体 X 服从某一分布, 将样本分成 K 类(组),观察样本数据在类(组) 出现的频数 f1,f2,…,fk 。在原假设 H0下,得到 每一类(组)的预期频数: fe1,fe2,…,fek 。若 H0为真, fi 与 fei 的差异应该不显著。
检验统计量
皮尔森拟合优度χ2 统计量:
∑ k
χ2=
(fi-fe)i2
f i=1 ei
~χ2(k-1)
其中: k—样本分类(组)数
皮尔森定理:如果原假设H0成立,则在样本容量 n→∞时,χ2 的分布趋向于k-1的卡方分布。
检验步骤
(1)对总体分布建立假设 H0:总体服从某种理论分布 H1:总体不服从该理论分布
设有一组观察值(X1,Y1)、(X2、Y2)…(Xn、Yn) X有1,2…r种状态, Y有1,2…c种状态,
将其编成r×c列联表(联合频数分布表), 用Oij表示X、Y同时发生的频数:
列联表形式(r×c)
y x
1
2
Y 3 …c
合计O i·
1 O11
O12
O13 … O1c
2 O21 X 3 O31
(4)确定带正负号的差值的个数为样本 容量n
(5)建立假设: H0:T+=T- H1: T+≠T-
(6)确定检验统计量T:T= min ( T+,T-) (5)设定α,当T<Tα, 拒绝H0 。
第四节 曼—惠特尼U检验 与威尔科克森检验的思想方法基本相同。特点:
两个样本 相互独立
两个样本合 在一起排序
游程
每个连续出现某一类 样本观察值的区段
游程 长度
每个区段包含的相同 样本观察值的个数
游程的个数 r可用来检验样本的随机性
游程检验方法步骤
将样本观察值顺序排列,找出中位数或平均数 以中位数或平均数为界分样本观察值为两个部分
以两部分交错形成的游程个数为检验的统计量
数据不一 定成对
检验步骤: (1)从总体A、B中分别独立抽取样本nA和nB, 将(nA+nB)个观察值从小到大排序并赋予等级 号
(2〕分别计算两个样本各自的等级和TA和TB
(3)建立假设
H0:两总体某特征无显著差异 H1:两总体某特征显著差异
(4)计算检验统计量U [ U = min (UA、UB)]
注意
H0 总体为完全给定的概率分布形式时, χ2 统 计量的自由度为k-1
H0 总体服从某种形式的概率分布时,χ2 统计 量的自由度为k-r-1 ,
r等于需要估计的参数的个数。
(2)抽样并对样本资料编成频数分布(fi) (3)以“原假设H0为真”导出一组期望频数(fei) (4)计算检验统计量χ2=∑(fi-fei)2/fei (5)给定的α查χ2表,比较χ2值与χ2临界值 (6)作出检验判断
①nA、nB<10时, UA= nAnB+ nA(nA +1)/2-TA
UB= nAnB+ nB(nB +1)/2-TB
②nA、nB>10时
Z U(nAnB/2) nAnB(nAnB1)/12
(5)设定显著性水平α,查U值表, 对于nA、nB<10,当U≤Uα,拒绝H0,
第五节 游程检验
根据样本标志表现排列所形成的游程的多少进行 判断的检验方法。亦称连贯检验
0.5 0.5
n
(尔科克森带符号的等级检验 运用两组数据差异的正、负号,并结合考虑差异
大小判断两总体是否存在差异的检验方法。
检验步骤
(1)确定配对样本数据并 计算带正负号的差异数值
(2)将差值取绝对数后排序并赋顺序 等级。相邻等值取位序平均数为等级
(3)根据原正负号赋予各等级正负号,并计 算正负等级和T+和T-
2×2的列联表资料,χ2值简算公式
x
y
1
1
a
2
c
合计 a+c
2 合计
b
a+b
d
c+d
b+d n
x2
n(ad b)c2
(ac)b (d)a (b)c (d)
第三节 成对比较检验
一、符号检验 用两组样本数据之差的正、负符号判断两个总
体特征是否存在差异的检验方法,亦称正负号检验。
特点: 来自两个总体的两个样本 可以相关,也可以独立
相关文档
最新文档