非参数假设检验

合集下载

数学建模方法-非参数假设检验

数学建模方法-非参数假设检验

两相关样本的非参数检验(2 Related Samples Test)
【例12】clinical trial.sav 比较试验药组(group=1) 治疗前血红蛋白含量(hb1)和治疗后血红蛋白含量(hb2) 有无差异.
这是两组相关计量资料的比较. 结论:P=0.018,有显著性差异.
多个相关样本的非参数检验(K Related Samples Test) 【例13】nonpara_7.sav 分析药物是否有效
两相关样本的非参数检验(2 Related Samples Test) 多个相关样本的非参数检验(K Related Samples Test)
两独立样本的非参数检验(2 Independent Samples Test) 检验两个独立样本间是否具有相同的分布. 【例8】nonpara_3.sav 比较两组人群的RD值有无差别 这是两组计量资料的比较. 选择要检验的变量和分 类变量,定义分类值(1-2),其它使用默认选项即可.从负二项分 布的结论.
单样本的K_S拟合优度检验
检验一计量资料是否服从某种理论分布,这里的分布可以 是正态分布(Normal),均匀分布(Uniform),泊松分布(Poisson), 指数分布(Exponential).
【例7】diameter_sub.sav 检验是否服从正态分布
多个独立样本的非参数检验(K Independent Samples Test) 【例10】nonpara_5.sav 比较三种药物的效果有无差别 这是三组计量资料的比较. 选择要检验的变量和分 类变量,定义分类值(1-3),其它使用默认选项即可. 结论:三组的秩和12.6,7.6,3.8,P=0.008,三种药物的 效果有显著性差异,以甲药效果最好. 【例11】nonpara_6.sav 比较三种固定钉治疗骨折的疗效 这是三组等级/频数资料的比较. 先说明频数变量, 再选择要检验的变量和分类变量,定义分类值(1-3),其它 使用默认选项即可. 结论:P=0.129,故三组无显著性差异.

参数检验和非参数检验

参数检验和非参数检验

参数检验和非参数检验参数检验和非参数检验是统计学中两种常用的假设检验方法。

参数检验假设总体服从其中一种特定的概率分布,而非参数检验则不对总体的概率分布进行特定的假设。

本文将分析和比较这两种假设检验方法,并讨论它们的优缺点和适用范围。

参数检验的基本思想是假设总体的概率分布属于一些已知的参数化分布族,例如正态分布或泊松分布。

然后根据样本数据计算出统计量的观察值,并基于它们进行假设检验。

常见的参数检验方法有t检验、F检验和卡方检验等。

以t检验为例,它适用于研究两个样本均值之间是否存在显著差异的情况。

假设我们有两组样本数据,分别服从正态分布。

可以使用t检验来计算两组样本均值的差异是否显著。

t检验基于样本均值和标准差来估计总体均值的差异,并通过计算t值和查表或计算p值来判断差异是否显著。

参数检验的优点是它们对总体概率分布的假设比较明确,计算方法相对简单,适用于数据符合特定分布的情况。

此外,参数检验通常具有较好的效率和统计性质。

然而,参数检验也有一些限制和缺点。

首先,参数检验通常对数据的分布假设要求较高,如果数据不符合指定的分布假设,则结果可能不可靠。

另外,参数检验对样本大小的要求较高,需要较大的样本才能获得可靠的检验结果。

此外,参数检验对异常值和离群值比较敏感,这可能会导致统计结论的错误。

与参数检验相比,非参数检验更加灵活,不需要对总体的概率分布做出特定的假设。

它适用于更广泛的数据类型和样本分布。

常见的非参数检验方法有Wilcoxon符号秩检验、Mann-Whitney U检验和Kruskal-Wallis检验等。

以Wilcoxon符号秩检验为例,它适用于比较两个相关样本的差异。

这个检验不要求样本数据满足正态分布的假设,它基于样本差值的秩次来判断差异是否显著。

非参数检验的优点在于其适用范围广泛,不需要对总体分布做出特定假设,对数据平均性和对称性的要求较低,对异常值和离群值的鲁棒性较好。

此外,非参数检验对样本大小的要求较低,可以在较小的样本情况下获得可靠的结果。

非参数检验的检验方法

非参数检验的检验方法

非参数检验的检验方法非参数检验是一种假设检验的方法,它不依赖于总体分布的具体形式,而是基于样本数据进行推断。

相比于参数检验,非参数检验更加灵活和普适,可以适用于更广泛的情况。

非参数检验的主要思想是通过对样本数据的排序或者秩次变换,来推断总体的性质。

下面将介绍几种常见的非参数检验方法:1. Mann-Whitney U检验(又称Wilcoxon秩和检验):Mann-Whitney U检验用于比较两个独立样本的总体中位数是否相等。

它的基本思想是将两组样本的数据合并,按照从小到大的顺序进行排列,并为每个值分配一个秩次。

然后计算两组数据秩次和之差的绝对值,该值即为检验统计量U,根据U的大小可以进行推断。

2. Kruskal-Wallis H检验:Kruskal-Wallis H检验用于比较多个独立样本的总体中位数是否相等。

它的基本思想是将所有样本的数据合并,按照从小到大的顺序进行排列,并为每个值分配一个秩次。

然后计算每个样本的秩次和,以及总体的秩次和。

根据这些秩次和的差异来进行推断。

3. 秩和检验:秩和检验是一类常见的非参数检验方法,包括Wilcoxon符号秩检验和符号秩和检验。

这两种方法都是用来比较两个相关样本的总体中位数是否相等。

基本思想是将两个样本的差的符号进行标记,并用秩次表示绝对值大小的顺序。

然后根据秩次和的大小来进行推断。

4. Friedman检验:Friedman检验用于比较多个相关样本的总体中位数是否相等。

它的基本思想是将所有样本的数据进行秩次变换,并计算每个样本的秩次和。

然后根据秩次和的差异来进行推断。

在进行非参数检验时,需要注意以下几点:1. 样本独立性:非参数检验通常要求样本之间是独立的,即样本之间的观测值不受其他样本观测值的影响。

如果样本之间存在相关性,应考虑使用相关性检验或者非参数检验的相关版本。

2. 样本大小:非参数检验对样本的大小没有严格要求,但样本大小较小时可能会影响检验的统计功效。

非参数假设检验.pptx

非参数假设检验.pptx
取 1。.据9 此,我们可以用参数 的泊1松.9分布来
计算每分钟内通过收费站的汽车为0辆、1辆、2辆、3 辆、4辆或更多的概率。
第12页/共43页
e 各概率乘以观测总数n=100,便得到理论频数 ,具体结果见下表: i ei
计算 2统计量的值:
2 (14.96 10)2 (28.42 26)2 (27.0 35)2
H0 :汽车通过收费站的辆数服从泊松分布; H1 :不服从泊松分布。
观测值分为5组,且有 u0 10,u1 26,u2 35,u4 5
第11页/共43页
回忆泊松分布
P{X x} e x , x 0,1, 2,
x!
其中 为泊松分布的期望值,是未知的,需要用样
本观测值来估计。由于100分钟内观测到190辆汽车, 所以平均每分钟观测到190/100=1.9辆汽车,故
第9页/共43页
计算 2统计量的值:
2 6 (ui ei )2
i1
ei
(27 25)2 (18 25)2 (15 25)2 (24 25)2
25
25
25
25
(36 25)2 (30 25)2 12
25
25
在本例的情况下, 统2 计量的自由度为m-1=6-1=5。
第8页/共43页
解:本例中的观测值以月为组,共分为m=6组,
每 月的销售台数即为观测的频v数i ,观测的总次
数为n=150。现欲检验是否服从(离散的)均匀 分布,即每月的销售量是否为
ei
nPi
150 6
25(台),
Pi
1 6
,i
1,
,6
为此,设
H0 :洗衣机销售量服从均匀分布;
H1 :并不服从均匀分布;

非参数假设检验方法

非参数假设检验方法

非参数假设检验方法
非参数假设检验方法,那可真是个超棒的统计利器!咱先说说它的步骤吧。

嘿,你想想看,就像搭积木一样,第一步得先明确问题,确定咱要检验啥。

然后收集数据,这数据就像是建筑材料,得好好收集。

接着计算检验统计量,这就如同给积木搭出形状。

最后根据统计量判断是否拒绝原假设。

这步骤简单易懂吧?
注意事项也不少呢!数据得有代表性,不然就像盖房子用了劣质材料,那可不行。

样本量也不能太小,不然就像小娃娃搭的积木城堡,风一吹就倒啦。

说到安全性和稳定性,那可是杠杠的!它不像有些方法那么娇气,对数据的分布要求不高。

就好比一辆越野车,能在各种路况下行驶,不用担心路况不好就抛锚。

应用场景那可多了去啦!当数据不满足参数检验的条件时,非参数假设检验方法就大显身手啦。

比如研究不同年龄段的人对某种产品的喜好,数据可能乱七八糟的,这时候非参数检验就像救星一样。

它的优势也很明显啊,操作简单,容易理解,不需要太多高深的数学知识。

就像玩游戏,不需要看厚厚的说明书就能上手。

给你举个实际案例吧。

有个公司想知道新推出的广告有没有效果,就用了非参数假设检验方法。

结果发现广告确实提高了产品的知名度。

这效果,哇塞,杠杠的!
非参数假设检验方法就是这么牛!它简单易用,安全稳定,应用场景广泛,优势明显。

赶紧用起来吧!。

假设检验——非参数检验

假设检验——非参数检验

假设检验(二)——非参数检验假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。

上一节我们所介绍的Z 检验、t 检验,都是参数检验。

它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。

参数检验就是要通过样本统计量去推断或估计总体参数。

然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检验。

这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。

非参数检验是通过检验总体分布情况来实现对总体参数的推断。

非参数检验法与参数检验法相比,特点可以归纳如下:(1)非参数检验一般不需要严格的前提假设;(2)非参数检验特别适用于顺序资料;(3)非参数检验很适用于小样本,并且计算简单;(4)非参数检验法最大的不足是没能充分利用数据资料的全部信息;(5 )非参数检验法目前还不能用于处理因素间的交互作用。

非参数检验的方法很多,分别适用于各种特点的资料。

本节将介绍几种常用的非参数检验方法。

一.2检验2检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。

22检验的方法主要包括适合性检验和独立性检验。

(一)2检验概述2是实得数据与理论数据偏离程度的指标。

其基本公式为:2 ( f0 f e)(公式11—9)fe式中,f0 为实际观察次数,f e 为理论次数。

分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2。

观察公式可发现,如果实际观察次数与理论次数的差异越小, 2值也就越小。

当 f 0 与 f e 完全相同时,2值为零。

际次数与理论次数之差的大小而变化利用2值去检验实际观察次数与理论次数的差异是否显著的方法称为2检验有两个主要的作第一,可以用来检验各种实际次数与理论次数是否吻合的这类问题统称为适合性检验; 第二, 判断计数的两组或多组资料是否相互关联还是相互独立的问 题,这类问题统称为独立性检验。

参数检验与非参数检验的区别与应用

参数检验与非参数检验的区别与应用

参数检验与非参数检验的区别与应用统计学中的参数检验和非参数检验是两种常用的假设检验方法。

本文将详细介绍参数检验和非参数检验的区别以及它们在实际应用中的具体场景。

一、参数检验参数检验是建立在对总体分布形态有所假定的基础上,通过对样本数据进行统计推断,来对总体参数进行假设检验。

它通常要求总体分布服从特定的概率分布,如正态分布。

参数检验的常见方法有:1. 单样本t检验:用于检验样本均值是否与已知总体均值有显著差异。

2. 独立样本t检验:用于比较两个独立样本的均值是否存在显著差异。

3. 配对样本t检验:用于比较同一组样本在不同条件下的均值是否存在显著差异。

4. 方差分析:用于比较多个样本组之间的均值是否存在显著差异。

参数检验的优势在于其具有较高的效率和灵敏度,适用于对总体分布形态有所了解的情况。

但它也有一些限制,如对分布形态的假设可能不成立,以及对样本量和数据类型的要求较高。

二、非参数检验非参数检验是对总体分布形态没有具体假设的情况下,通过对样本数据进行统计推断,来对总体参数进行假设检验。

非参数检验不少于参数检验的分析方法,常见的包括:1. Wilcoxon符号秩检验:用于比较两个相关样本的差异是否存在显著差异。

2. Mann-Whitney U检验:用于比较两个独立样本的中位数是否存在显著差异。

3. Kruskal-Wallis检验:用于比较多个样本组的中位数是否存在显著差异。

非参数检验的优势在于对总体分布形态没有具体要求,适用于对总体分布了解较少或不了解的情况。

它相对于参数检验来说更具广泛的适用性,但由于其推断效果较差,需要更大的样本量才能达到相同的检验效果。

三、参数检验与非参数检验的区别1. 假设要求:参数检验对总体分布形态有假设要求,如正态分布假设,而非参数检验对总体分布形态没有具体要求。

2. 统计量选择:参数检验基于已知概率分布,可以选择特定的统计量如t值、F值等;而非参数检验使用秩次统计量,如秩和、秩和秩二样序差等。

非参数检验的场景与方法

非参数检验的场景与方法

非参数检验的场景与方法非参数检验是一种统计方法,用于对数据进行假设检验,而不需要对数据的分布做出任何假设。

相比于参数检验,非参数检验更加灵活,适用于更广泛的场景。

本文将介绍非参数检验的场景和常用的方法。

一、非参数检验的场景非参数检验适用于以下场景:1. 数据不满足正态分布:在一些实际问题中,数据的分布可能不满足正态分布假设,例如长尾分布、偏态分布等。

此时,非参数检验可以更好地适应数据的特点。

2. 样本量较小:参数检验通常要求样本量较大,以保证统计推断的准确性。

而非参数检验对样本量的要求较低,即使样本量较小,也可以进行有效的假设检验。

3. 数据类型不确定:非参数检验可以适用于各种数据类型,包括连续型数据、离散型数据、有序数据等。

而参数检验通常对数据类型有一定的要求。

二、常用的非参数检验方法1. Wilcoxon符号秩检验:适用于两个相关样本的比较。

该方法将两个样本的差异转化为秩次,通过比较秩次的大小来进行假设检验。

2. Mann-Whitney U检验:适用于两个独立样本的比较。

该方法将两个样本的观测值合并后,通过比较秩次的大小来进行假设检验。

3. Kruskal-Wallis检验:适用于多个独立样本的比较。

该方法将多个样本的观测值合并后,通过比较秩次的大小来进行假设检验。

4. Friedman检验:适用于多个相关样本的比较。

该方法将多个样本的观测值转化为秩次,通过比较秩次的大小来进行假设检验。

5. Kolmogorov-Smirnov检验:适用于两个样本的分布比较。

该方法通过比较两个样本的累积分布函数来进行假设检验。

三、非参数检验的优缺点非参数检验相比于参数检验具有以下优点:1. 不需要对数据的分布做出任何假设,更加灵活。

2. 对样本量的要求较低,适用于小样本数据。

3. 适用于各种数据类型,更加通用。

然而,非参数检验也存在一些缺点:1. 相对于参数检验,非参数检验的统计效率较低。

2. 非参数检验通常需要更多的计算资源和时间。

非参数假设检验方法

非参数假设检验方法

按 =0.05,自由度为1,查2分布表得
自由度为m-1=1
上页 下页 返回
例4 验证一枚骰子是否均匀。 电话号码的数字出现的概率等等问题。 采用分组离散化方法
若X的分布函数F(x)的具有明确表达式F0(x),不含未知参数。 根据样本信息推断X的分布函数是否为F0(x).
第一步:
第二步:计算
上页 下页 返回
第三步:记数
第四步:检验 其中m为分组数
H0的拒绝域为 一般有 n > 50,npi > 5最好 npi >10,否则应重新分组。 使得npi > 5最好 npi >10.
抽取次数X 1
2
3
4 5
试验累计数 43 31 15 6
5
解 若两色球个数相等,则每次取到白球的概率为1/2 以抽取次数X为考查对象,则X服从几何分布,即
计算得
上页 下页 返回
此是 m = 5, n1 = 43, n2= 31, n3 =15, n4 = 6,n5= 5, n=100
计算有
结论:接受H0
奥地利生物学家孟德尔进行了长达八年之 久的豌豆杂交试验,并根据试验结果,运用他 的数理知识, 发现了遗传的基本规律.
孟德尔


黄色纯系
子一代 绿色纯系
子二代
上页 下页 返回
根据他的理论,子二代中, 黄、绿之比 近似为3:1,
他的一组观察结果为: 黄70,绿27 近似为2.59:1,与理论值相近.
由于随机性,观察结果与3:1总有些差距,因此有 必要去考察某一大小的差异是否已构成否定3:1理论的 充分根据,这就是如下的检验问题.
为了进行检验,还必须知道其分布,否则进行不了

数理统计实验三非参数假设检验

数理统计实验三非参数假设检验

西北农林科技大学实验报告学院名称:理学院专业年级:姓名:学号:课程:数理统计学报告日期:实验三非参数假设检验一.实验目的1. 验证某产品的合格率是否是否低于0.9.2. 检验某地区儿童身高是否符合正态分布。

3. 为研究心脏病猝死人数与日期的关系,收集到168个观测数据,利用这批样本数据推断猝死人数与日期的关系是否为2.8:1:1:1:1:1:1.4. 某工厂用甲乙两种工艺生产同一种产品,利用样本数据检验两种工艺下产品使用寿命是否存在显著差异。

二.实验要求用spss实现非参数假设检验,包括二项式检验,单样本正态分布检验,两个独立样本检验,卡方检验。

三.实验内容(一)验证某产品的合格率是否是否低于0.9.打开文件“非参数检验(产品合格率)”,点击分析->非参数检验->旧对话框->二项式,把数据“是否合格”添加到检验变量列表,把检验比例默认的0.5该为题目要求的0.9(如图所示)。

点击确定得到结论(如图所示)。

结论:由上表知,SPSS的悖假设检验案例比例小于0.9的,并且在精确显著(单侧)值sig=0.193>0.05,即接受原假设检验,即二项式检验的案例比例是大于0.9的。

(二)检验某地区儿童身高是否符合正态分布。

打开文件“非参数检验(单样本KS-儿童身高)”,点击分析->非参数检验->旧对话框->1样本,把数据“周岁儿童的身高(sg)”添加到检验变量列表,检验分布默认为常规,即正态(如图所示)。

点击确定得到结论(如图所示)。

结论:由上述的结果可以看出,周岁儿童的身高是满足正态分布其中均值为71.8571,标准差为3.97851,可知某地区的儿身高满足正态分布。

除此之外,由上面的结果中的检验值sig=0.344>0.05也可以得出原假设检验是成立的,即接受身高满足正态分布的假设。

(三)为研究心脏病猝死人数与日期的关系,收集到168个观测数据,利用这批样本数据推断猝死人数与日期的关系是否为2.8:1:1:1:1:1:1.打开文件,在变量视图窗口中,点击数据->加权个案,对话框右边选项点击加权个案,把“死亡日期”添加到频率变量中,(如图所示),点击确定。

非参数检验

非参数检验

非参数检验非参数检验是一种统计方法,用于比较两组或多组数据的差异或关联性,它并不依赖于数据的分布假设。

相比于参数检验,非参数检验通常更为灵活,可应用于各种数据类型和样本量,尤其在数据不满足正态分布的情况下表现优势。

本文旨在介绍非参数检验的基本原理、应用领域以及常见方法。

首先,非参数检验的基本原理是依赖于样本中的秩次,即将原始数据转化为秩次数据进行统计分析。

秩次是数据在全体中的相对位置,将数据转化为秩次可以消除异常值对统计结果的影响,并使数据的分布不再成为限制因素。

非参数检验的应用领域广泛,包括但不限于以下几个方面。

一、假设检验非参数检验可用于假设检验,比如检验两组样本的中位数是否存在差异。

常见的方法有Wilcoxon符号秩检验、Mann-Whitney U检验等。

在实际应用中,如果数据的分布无法满足正态分布假设,非参数检验则是一种理想的选择。

二、相关性分析非参数检验可用于判断两个变量之间的关联性。

常见的方法有Spearman秩相关系数检验、Kendall秩相关系数检验等。

这些方法的核心思想是将原始数据转化为秩次数据,通过秩次数据之间的比较来判断两个变量之间是否存在显著相关。

三、分组比较非参数检验可用于比较多个样本之间的差异。

常见的方法有Kruskal-Wallis检验、Friedman检验等。

这些方法可用于比较三个以上的样本组之间的差异,而不依赖于数据的分布假设。

在实际应用中,非参数检验需要注意以下几个问题。

一、样本容量非参数检验对样本容量的要求相对较低,适用于小样本和大样本。

然而,在样本容量较小的情况下,非参数检验可能会产生较大的误差,因此应根据实际情况选择合适的方法。

二、数据类型非参数检验可应用于各种数据类型,包括连续型数据和离散型数据。

但对于有序分类数据、定序数据和名义数据,非参数检验相较于参数检验有更好的适用性。

三、分布假设非参数检验不需要对数据的分布做出假设,这使得它更加灵活。

但是,如果数据满足正态分布假设,参数检验也是一种较为有效的选择。

非参数统计方法在假设检验中的应用研究论文素材

非参数统计方法在假设检验中的应用研究论文素材

非参数统计方法在假设检验中的应用研究论文素材一、引言假设检验是统计学中一种重要的分析方法,用于根据样本数据推断总体参数的性质。

传统的假设检验通常基于参数统计方法,即假设总体参数服从某种特定的概率分布。

然而,在实际应用中,往往无法确定总体分布的具体形式,这时就需要使用非参数统计方法。

本文旨在探讨非参数统计方法在假设检验中的应用,并提供相应的研究素材。

二、非参数统计方法概述非参数统计方法是指不对总体参数做任何假设的统计方法。

它的优势在于不依赖具体的分布假设,因此更加灵活,适用范围更广。

非参数统计方法主要包括秩和检验、分布自由度检验和重抽样检验等。

1. 秩和检验秩和检验是非参数统计方法中常用的一种方法,适用于两组或多组独立样本的比较。

该方法将观测值按照大小排列,通过比较秩和的大小来进行假设检验。

常见的秩和检验包括Wilcoxon秩和检验和Mann-Whitney U检验。

2. 分布自由度检验分布自由度检验是一种非参数的拟合优度检验方法,用于检验观测数据与某个理论分布是否一致。

该方法基于观测数据的经验分布函数,通过计算观测数据的累积概率与理论分布的累积概率之间的差异来进行假设检验。

3. 重抽样检验重抽样检验是一种基于数据重抽样的非参数统计方法。

常见的重抽样检验包括Bootstrap方法和Permutation方法。

Bootstrap方法通过随机抽样产生重复样本,从而估计总体参数的分布。

Permutation方法则通过对样本数据的重新排列来进行假设检验。

三、非参数统计方法的应用研究素材1. 秩和检验的应用研究文献1:Smith, J. et al. (2015). "A Comparative Study of Nonparametric Rank Tests for Gene Differential Expression Analysis." Journal of Biometrics, 30(4), 123-135.该研究通过比较不同的秩和检验方法在基因差异表达分析中的应用效果,探讨了不同方法的优缺点并给出了相应的建议。

非参数假设检验方法课件

非参数假设检验方法课件
特点
非参数假设检验具有灵活性、稳 健性和适用范围广等优点,能够 处理更广泛的数据类型和分布情 况,不受特定参数假设的限制。
与参数检验的区别与联系
区别
参数检验基于对总体分布的参数假设 ,如正态分布等,而非参数检验则不 依赖于这些假设。
联系
非参数检验和参数检验都是为了对总 体进行推断,只是所依据的假设不同 。在实际应用中,可以根据具体情况 选择合适的检验方法。
大,可能会导致误判。
与参数检验的优缺点比较
适用范围
参数检验方法通常需要假定数据分布的形式,适用范围相对较窄 ;而非参数检验方法无需假定分布形式,适用范围更广。
解释性
参数检验方法通常可以提供具体的参数估计和效应量估计,解释性 较强;而非参数检验方法的解释性相对较差。
计算复杂性
参数检验方法的计算过程通常较为复杂,需要使用复杂的数学公式 和推导;而非参数检验方法的计算过程相对简单。
详细描述
符号检验通过计算两组数据中正例和负例的差异数,并利用二项分布的概率公 式来计算差异显著的p值。该方法适用于小样本数据,并且对数据的分布没有严 格要求。
威尔科克森符号秩检验
总结词
威尔科克森符号秩检验是用于比较两个独立样本的差异是否显著的统计方法。
详细描述
该方法通过比较两个样本的秩和,利用威尔科克森符号秩公式计算差异显著的p 值。该方法适用于处理数据量较小的情况,并且对数据的分布没有严格要求。
05
非参数假设检验的未来 发展与展望
现有研究的不足与局限性
方法适用范围有限
01
目前非参数假设检验方法主要适用于特定类型的数据和问题,
对于复杂数据或特定领域的适用性有待提高。
理论基础尚不完备
02

非参数假设检验

非参数假设检验

结果分析:
P值>0.05,接受Ho,两套问卷测试的数据服从同样的分布。
实例演示:检验一组样本的总体分布是否与猜想的分布(任 意分布)相同:拟合优度 2 检验法 Eg3.六个企业生产汽车,每小时的产量如图:
问:这些企业的生产水平,有无显著差异? 零假设Ho:六个企业的生产能力是相同的(即产量服从均匀 分布)。 备泽假设H1:六个企业的生产能力是不全相同的(产量不服 从均匀分布)
非参数假设检验
郑丽娜
非参数假设检验(Nonparametric tests) 非参数检验与参数检验共同构成统计推断的基本内容。 参数检验是在总体分布形式已知的情况下,对总体分布的参 数如均值、方差等进行推断的方法。 但在数据分析过程中,人们往往无法对总体分布形态作简单 假定,此时参数检验的方法就不再适用了。 非参数检验是在总体方差未知或知道甚少的情况下,利用样 本数据对总体分布形态等进行推断的方法。 由于非参数检验方法在推断过程中不涉及有关总体分布的参 数,因而得名为“非参数”检验。
数据输入: 数据输入见右图:
存放数据是一列 一分钟内观察到得个数 为变量值
数据分析: 步骤1 分析 非参数检验 (Nonparametric) 1样本 K-S( 1 sample k - s )
数据分析: 步骤2 放入右边的检验变量 列表(test variable list)
数据分析: 步骤3 下面的检验分布( test distribution) 都选,因为不知道 服从什么分布。 选择选项里选择所需 的。 点确定
数据分析: 步骤4 检验类型(test type) 有四种 系统默认的是MannWhitney U检验 (序号和<铁和>检 验法) 点确定,看结果
结果分析:

Ch4--非参数假设检验

Ch4--非参数假设检验
20
(三)Mann-Whitney秩和检验法(序号和检验法)
问题:有两个总体的样本为x1,x2,…,xn与y1,y2,…,ym,可能m≠n。 两组样本可以是各自独立颠倒顺序的。检验这两组样本是否来 自同一个总体(或两组样本的总体分布是否相同)。 同样,把两组样本放在一起,按样本观察值的大小重新排 列,那么每个观察之就有一个序号(秩)。把第一组样本 x1,x2,…,xn与序号加总起来,记为w1,第二组样本序号加总起来 记为w2。 Mann-Whitney U检验的统计量是: U=min{U1,U2} 式中: • U1=nm+n(n+1)/2-w1 • U2=nm+n(n+1)/2-w2 对给定 ,查U值表,得U 。若U< U ,则总体分布相同。
9
进而,在假设p=0.5(H0)的前提下,按照B(m,p)的 概率计算公式,对r从大到小,求累计概率:
确保k2的外侧概率(即r大于等于k2的概率之和)小于 等于 /2,从而求出k2. 如果实际的“xi-yi>0”的个数在(k1,k2)中,就接 受H0:F(x)=G(x) ,即p=0.5; 否则,拒绝H0
3
参数检验与非参数检验
假设检验
参数检验
(定量数据)
非参数检验
(非定量数据)
单样本
T检验 Z检验
双样本
单样本
双样本
独立样本
配对样本
独立样本
配对样本
4
一、 两个总体分布的非参数假设检验
非参数检验(分布检验)所要处理的问题: (1) 两个总体的分布未知,它们是否相同(用两组样 本来检验); (2) (由一组样本)猜出总体的分布(假设),然后 用(另一组)样本来检验它是否正确。 需要注意的问题 两个分布是否相同,一般包含了参数(均值、方 差等)是否相同的问题。如果两个总体的分布函数形 式相同,而参数不同,也将被判别为概率分布不同。

非参数检验的名词解释

非参数检验的名词解释

非参数检验的名词解释
非参数检验是一种统计方法,用于在数据不满足正态分布或其他假设条件的情况下进行统计推断。

与参数检验相比,非参数检验不需要对总体参数做出假设,而是直接利用样本数据进行推断。

以下是相关名词解释:
1. 非参数:指在进行统计推断时,不对总体的分布形式或参数做出特定的假设。

非参数方法依赖于具体的样本数据,不依赖于总体的分布特征。

2. 假设检验:统计推断的一种方法,用于通过对样本数据进行分析来得出关于总体参数或总体分布的结论。

假设检验通常涉及对某个假设的拒绝或接受。

3. 正态分布:也称为高斯分布,是一种连续概率分布,常用于描述许多自然现象和随机变量的分布。

参数检验通常基于对总体数据服从正态分布的假设。

4. 参数检验:通过对总体参数的估计和假设进行统计推断的
方法。

参数检验通常要求数据满足特定的假设条件,如正态分布、独立性和方差齐性等。

5. 统计显著性:在假设检验中,用于评估观察到的差异或效应是否显著。

统计显著性通常以p值表示,若p值小于预设的显著性水平(如0.05),则可以拒绝零假设。

非参数检验在实际应用中具有灵活性和广泛适用性,特别适合处理样本数据不满足假设条件的情况。

它们不依赖于总体分布的形式,因此更加鲁棒,并可以应用于各种类型的数据集。

非参数假设检验

非参数假设检验

§ 7.4 非参数假设检验在§7.2中讨论了母体分布类型为已知时的参数假设检验问题.一般在进行参数假设检验之前,需要对母体的分布进行推断.本节将讨论母体分布的假设检验问题.因为所用的方法适用于任何分布或者仅有微弱假定分布,实质上是不依赖于分布的.在数理统计学中不依赖于分布的统计方法统称为非参数统计方法.这里所讨论的问题就是非参数假设检验问题.这里所研究的检验是如何用子样去似全母体分布,所以又称为分布拟合扰度检验,一般有两种:一是拟合母体的分布函数;另一是拟合母体分布的概率函数.这里我们只介绍三种检验方法:概率图纸法. 2χ-拟合优度检验和柯尔莫哥洛夫斯米尔诺夫检验.一, 概率图纸法这是一种比较直观和简便的检验方法.它适合于在现场使用.目前常见的概率图纸有正态,对数正态,二项分布,指数分布和威布尔分布概率图纸等.这里我们只介绍正态概率图纸,关于其它分布的概率图纸的构造原理和使用方法都是类似的1. 正态概率图纸的构造原理设母体ξ有分布函数F(x),{N(μ,2σ)}表示正态分布族.需要检验假设)},({)(:20σμN x F H ∈这里μ和2σ均为未知常数.在原假设0H 为真时,通过中心化变换)(2121)(22)(222σμπσπσμμσμ-Φ===⎰⎰-∞--∞---x du edt ex F x xt即σμξξμ-=)(服从正态N(0,1).函数u(x)是x 的线性函数. σμξξμ-=)( (7.13) 在(x,u(x))直角坐标平面上是一条直线.这条直线过(μ,0),且斜率为σ1. 2. 检验步骤.事实上,我们知道的不是母体ξ取出的一组子样观察值n x x ,,1 由格里汶科定理知道子样的经验分布函数)(x F n 依概率收剑于母体分布函数F(x).所以在检验母分体布函数F(x)是否属于正态分布族时,我们以大子样的经验分布函数)(x F n 作为母体分布的近似.若0H :F(x) ∈{N(μ,2σ)}为真,那末点,,,1)),(,(n i x F x i i =在正态概率图纸上应该在一条直线上.所以根据上述经验分布函数)(x F n 是母体分布函数F(x)很好的近似,点,,,1)),(,(n i x F x i i =在正态概率图纸上也应该近似地在一条直线附近.倘若点列)),(,(i i x F x 不是近似地在一条直线附近,那末只能说明F(x)不属于正态分布族.根据上述想法,用正态概率图纸去检验假设0H 的具体步骤如下.(1) 整理数据 (2) 描点(3) 目测这些点的位置, 3. 未知参数μ与2σ的估计.若通过概率图纸检验已经知道母体服从正态分布,我们就凭目测在概率图纸上画出最靠近各点,,,1)),(,()()(n i x F x i n i =的一条直线l,因为σμξξμ-=)(服从正态N(0,1),所以当0)(=-=σμξμx ,即x=μ时对应的概率F=0.5.因此,只要在概率图纸上面一条F=0.5的水平直线.这条直线与直线l 的交点的横坐标5.0x 就可以作为参数为μ的估计.又由μ(x)=1时所对应的概率F=0.8413的水平直线,这条直线与直线l 的交点的横坐标为8413.0x .这个8413.0x 显然满足18413.08413.0=-=σμμx 即μσ-=8413.0x 因此可以用差5.08413.0x x -估计σ.例 7.8 (略)见P 338 二, 2χ的似体检验法前面介绍了直观而简便的概率图纸法,它不需要很多计算就能对母体分布族作出一个统计推断,并且还能对分布所含的参数作出估计.但是这种方法因人而异,且精度不高,又不能控制犯错误的概率.这里介绍2χ-拟合检验法,它能够像各种显著性检验一样控制犯第一类错误的概率.设母体ξ的分布函数为具有明确表达式的F(x),.我们把随机变量ξ的值域R 分成k 个互不相容的区间[][][]k k k a a A a a A a a A ,,,,,,1212101-=== 这些区间不一定有相同的长度.设n x x ,,1 是容量为n 的子样的一组观测值.i n 为子样观测值n x x ,,1 中落入i A 的频数.n n ni i =∑=1在这n 次事件i A 出现的频率为nn i. 我们现在检验原假设)()(:00x F x F H =.设在原假设0H 成立下,母体ξ落入区间i A 的概率为i P ,即k i a F a F A P P i i i i ,1),()()(100=-==- (7.14)此时n 个观察值中,恰有1n 个值落入1A 内,2n 的观察值落入2A 内,k n 个观察值落入k A 内的概率为k n n n n k P P P n n n n 212121!!!!这是一个多项分布.按大数定理,在0H 为真时,频率nn i与概率i P 的差异不应太大.根据这个思想构造一个统计量2χ=∑=-ki i i i nP nP n 12)( (7.15)称做2χ-统计量.往后可以看到,用2χ表示这一统计量不是没有原因的.因为它的极限分布就是自由度为k-1的2χ-分布.为了能够把2χ-统计量用来作检验的统计量,我们必须知道它的抽样分布.我们先k=2的简单情形.在0H 成立下,221)(,)(P A P P A P i ==其中121=+P P这时,频数n n n =+21我们考察222212112)()(nP nP n nP nP n -+-=χ (7.16) 令222111,nP n Y nP n Y -=-= (7.17)显然0)(212121=+-+=+P P n n n Y Y (7.18)由此可见1Y 与2Y 不是线性独立,且21Y Y -=.于是21212221212P nP Y nP Y nP Y =+=χ 21111)1(⎥⎥⎦⎤⎢⎢⎣⎡--P nP nP n (7.19) 根据德莫弗-拉普拉斯极限定理,当n 充分大时,随机变量)1(1111P nP nP n --的分布是接近于正态的,从而推得k=2情形的分布,当n 充分大时,是接近于自由度为1的2χ-分布.对于一般情形有如下的定理.定理 7.1 当0H 为真时,即k P P ,,1 为母体的真实概率时,由(7.15)式所定义的统计量2χ的渐近分布是自由度为k-1的2χ-分布,即密度函数为⎪⎪⎩⎪⎪⎨⎧⎪⎭⎫ ⎝⎛-Γ=---,0,2121)(22321xk k e x k x f (7.20) 证 因为在n 个观测值中恰有1n 个观测值落入1A 内, 2n 的观察值落入2A 内,k n 个观察值落入k A 内的概率为k n n n n k P P P n n n n 212121!!!!这里n n n n k =+++ 21.其特征函数nk j it jk je P t t ⎪⎪⎭⎫⎝⎛=∑=112),,( ϕ (7.21) 令k j nP nP n Y jjj j ,2,1, =-=(7.22)于是有∑∑===-=kj j kj jj j Y nP nP n 12122)(χ (7.23)和∑=kj j jP Y1=0 (7.24)由此式看出,诸随机变量j Y 不是线性独立的.(k Y Y ,,1 )的联合分布的特征函数具有形状2111exp exp ),,(⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛•⎪⎪⎭⎫ ⎝⎛-=∑∑==kj j j j kj j jk nPit P nP it t t ϕ (7.25) 两边取对数得⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫⎝⎛+-=∑∑==k j j jj kj j jn nP it P n P t n i t t 111exp ln ),,(ln ϕ (7.26) 利用指数数函和对数函在0=j t 处的泰勒展开:⎪⎭⎫ ⎝⎛+-=-⎥⎥⎦⎤⎢⎢⎣⎡n nP t nP it np it j jj j jj 121exp 2ο和)(2)1ln(22x x x x ο+-=+于是)1(21211211ln ),,(ln 11212111211οοϕ+⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛--+-=⎪⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+-++-=∑∑∑∑∑∑∑=======k j k j k j j j j j j k j j j k j k j j j j kj j jk P t n i t n P t n i n P t n i n t n P t n i n P t n i t t当∞→n 时⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛--→∑∑==k j kj j j j k P t t t t 1212121),,(ln ϕ 即⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛--=∑∑==∞→k j k j j j j k n P t t t t 1212121exp ),,(lim ϕ (7.26) 作一正交变换:⎪⎪⎩⎪⎪⎨⎧=-==∑∑==kj j k j kj lj l Y P Z k l Y a Z 111,,1, (7.27) 其中lj a 应该满足1,,1,,0,11-=⎩⎨⎧≠==⋅∑=k r l r l r l a a kj rjlj 和1,,1,01-==∑=k l P akj j lj由⎪⎪⎩⎪⎪⎨⎧=-==∑∑==kj j j k kj y ij l t P u k l t a u 111,1, (7.28) 得到∑∑∑-====⎪⎪⎭⎫ ⎝⎛-1122112k j j kj i k j j j u P t t (7.29) 由(7.26)知,当∞→n 时,(k Z Z ,,1 )的特征函数⎭⎬⎫⎩⎨⎧-=∑-=∞→112121exp ),,(lim k j j k n u u u ϕ.这意味着11,,-k Z Z 的分布弱收剑于相互独立的正态N(0,1)分布,而k Z 依概率收剑于0.因此∑∑====kj j k j j Z Y 12122χ的渐近分布是自由度为k-1的2χ-分布.如果原假设0H 只确定母体分布类型,而分布中还含有未知参数m θθ,,1 则我们还不能用定理7.1来作为检验的理论依据.费歇证明了如下定理.从而解决了含未知参数情形的分布检验问题.定理 7.2 设F(x; m θθ,,1 )为母体的真实分布,其中m θθ,,1 为m 个未知参数.在F(x;m θθ,,1 )中用m θθ,,1 的极大似然估计mθθ∧∧,代替m θθ,,1 并且以F(x; mθθ∧∧,)取代(7.4)中的F(x)得到),,1;(),,1;(1m a F m a F i i iP θθθθ∧∧-∧∧∧-= (7.30)则将(7.30)代入(7.15)所得的统计量∑=∧∧-=kj i ini nn p p 122()χ (7.31)当∞→n 时有自由度为k-m-1的2χ-分布.例 7.9 (略)见P 345由例子来总结一下利用2χ-检验分布假设的步骤:(1)把母体ξ的值域划分为k 个互不相交的区间[,,,1),,1k i a a i i =+其中k a a ,1可以分别取∞∞-,;(2) 在0H 成立下,用极大似然估计法估计分布所含的未知参数; (3)在0H 成立下,计算理论概率)()(010i i i a F a F p -=+并且算出理论频数i nP ; (4)按照子样观察值n x x x ,,,21 落在区间),[1+i i a a 中的个数,即实际频数,,,1,k i n i =和(3)中算出的理论频数i nP ,计算ii i nP nP n )(2-=χ的值;(5)按照所给出的显著性水平α,查自由度k-m-1的2χ-分布表得)1(21---m k αχ,其中m 是未知参数的个数; (6)若2χ21αχ-≥,则拒绝原假设0H ,若212αχχ-<,则认为原假设0H 成立.三 柯尔莫哥洛夫似合检验------n D 检验2χ-似合检验是比较子样频率与母体的概率的.尽管它对于离散型和连续型母体分布都适用.但它是依赖于区间的划分的.因为即使原假设)()(:00x F x F H =不成立,在某种划分下还是可能有k i P a F a F a F a F i i i i i ,,1,)()()()(1001 ==-=---从而不影响(7.5)中2χ的值,也就是有可能把不真的原假设0H 接受过来.由此看到,用2χ-检验实际上只是检验了,,,1,)()(100k i P a F a F i i i ==--是否为真,而并未真正地检验母体分布F(x)是否为)(0x F .柯尔莫哥洛夫对连续母体的分布提出了一种方法.一般称做柯尔莫哥洛夫检验或n D -检验.这个检验比较子样经验分布函数)(x F n 和母体分布函数F(x)的.它不是在划分的区间上考虑)(x F n 与原假设的分布函数之间的偏差.而是在每一点上考虑它们之间的偏差.这就克服了2χ-检验的依赖于区间划分的缺点.但母体分布必须假定为连续.根据格里汶科定理,我们可以把子样经验分布函数看作实际母体分布函的缩影.如果原假设成立,它与F(x)的差距一般不应太大.由此柯尔莫哥洛夫提出一个统计量|)()(|sup x F x F D n xn -= (7.32)并且得到这统计量n D 的精确分布和极限分布K(λ).它们都不依赖于母体的分布.这里我们不加证明地引入柯尔莫哥洛夫定理.定理 7.3 设母体ξ有连续分布函数F(x),从中抽取容量为n 的字样,并设经验分布函数为)(x F n ,则|)()(|sup x F x F D n xn -=的分布函数⎪⎭⎫ ⎝⎛+<n D P n 21λ=n n n n dy y y f n n n nn n n n n 2120212,1,),,(0,021********22121-<≤⎪⎪⎪⎩⎪⎪⎪⎨⎧-≥<⎰⎰⎰+-+-+---λλλλλλλλλ 当(7.33)其中⎩⎨⎧<<<=其它当,010!),(11n n y y n y y f在∞→时有极限分布函⎪⎩⎪⎨⎧≤>--=→<∑-∞=0,00),2exp()1()()(22λλλλλ当当n j j n j K D n P (7.34) 在应用柯尔莫哥洛夫检验时,应该注意的是,原假设的分布的参数值原则上应是已知的.但在参数为未知时,近年来有人对某些母体分布如正态分布和指数分布用下列两种方法估计.()可用另一个大容量子样来估计未知参数,(2)如果原来子样容量很大,也可用来估计未知参数.不过此n D -检验是近似的.在检验时以取.较大的显著性水平为宜,一般取α=0.10-0.12.n D -检验检验母体有连续分布函数F(x)这个假设的步骤如下:(1) 从母体抽取容量为n 的子样,并把子样观察值按由小到大的次序排列;(2) 算出经验分布函⎪⎪⎩⎪⎪⎨⎧≤=<≤<=+x n j x x x nx n x x x F k j j jn 当当当,1,,1,,)(,0)()1()()1((3) 在原假设0H 下,计算观测值处的理论分布函数F(x)的值; (4) 对每一个i x 算出经验分布函数与理论分布函数的差的绝对值||)()(||)()()()1()()(i i n i i n x F x F x F x F --+与(5) 由(4)算出统计量的值(6) 给出显著性水平α,由柯尔莫哥洛夫检验的临界值表查出αα=≥)(,n n D D P的临界值α,n D ;当n>100时,可通过n D n /1,ααλ-≈查n D 的极限分布函数数值表得αλ-1从而求出α,n D 的近似值.(7) 若由(5)算出的α,n n D D ≥则拒绝原假设0H ;若α,n n D D <则接受假设,并认为原假设的理论分布函数与子样数据是似合得好的. 例 7.10 略) 见P 351定理 7.4 当样本容量21n n 和分别趋身于∞时,统计量|)()(|212121,sup x F x F D n n xn n -=有极限分布函数)(212121λλK D n n n n P n n →⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<+ ⎪⎩⎪⎨⎧≤>--=∑∞-∞=0,00),2exp()1(22λλλ当当j j j (7.35) 例 7.11 (略)见P 353。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(, t1 ], (t1 , t 2 ], , (t k 1 ,)
…,
t1
t2
tk-1
对随机变量取值数轴的分割
记 pi为总体在第 i 个区间上的概率值, 则有
p1 = P (X t1) = F(t1) p2 = P (t1 < X t2) = F(t2) - F(t1)
……
pk-1 = P (tk-2 < X tk-1) = F(tk-1) - F(tk-2) pk = P (X > tk-1) =1 - F(tk-1)
是由 n, m, (显著性水平)所决定的. 威尔可逊 ( Wilcoxon ) 给出了 W 的概率分布表, 对于给定 的显著性水平 , 可以由威尔可逊概率分布表, 依据n, m, 查出 W1 , W2 . 若W W1 或 W W2 , 则拒绝H0: F(x) = G(x) (认为两个 总体分布不同) 反之, 若W1 < W < W2 , 则接受H0: F(x) = G(x) (认为两 个总体分布相同).
U1 nm n(n 1) w1 2
U 2 nm
m(m 1) w2 2
对给定 , 查U 值表, 得 U. 若U < U , 则总体分布相同. 注意: 方法 (1), (2), (3) 是两个总体分布的比较, 与分布的具 体形式无关, 所以, 理论上可以用来检验两个任意形式的分 布是否相同.
(2) 大样本情况下, 正负号个数检验法的处理
在大样本情况下( 即 mp 10 ), 可以近似地用正态分布 来处理. 现在 p =0.5, 所以只要 m 20 即可. 用统计量:
Z U p ~ N (0,1) p (1 p ) m
在计算统计量 Z 的值z 时, 在式中要用 u (即n+ /m)代替U.
3. 检验两个总体的分布是否相同的第三种方法: Whitney 秩和检验法 ( 序号和检验法 )
Mann-
问题: 有两个总体的样本观测值 x1,x2,·,xn 与y1,y2 ,·,ym , · · · · 可能m n . 两组样本是可以各自独立颠倒顺序的. 检验这 两组样本是否来自同一个总体 (或两组样本的总体分布是 否相同). 同样, 把两组样本放在一起, 按样本观测值的大小重新排 序, 那么每个观测值就有一个序号( 秩 ). 把第一组样本x1, x2,·,xn的序号(秩) 加总起来, 记为 w1 .把第二组样本y1 · · ,y2 ,·,ym的序号(秩) 加总起来, 记为 w2 . · · Mann-Whitney U检验的统计量是: U = min {U1, U2 } 式中:
(1) 小样本情况下, 正负号个数检验法的处理
小样本情况下, 正负号个数检验法的处理, 与 5.3.1 小节 的处理原理相同, 只不过 5.3.1 节是单尾检验, 我们现在要做 双尾检验 (检验两个方向的备择假设). 以计算“xi - yi>0的个数为 r ”的概率为例, 对给定 的, 在假设p = 0.5 (H0假设)的前提下, 按照B(m, p) 的概率 计算公式, 对 r 从小到大, 求累积概率:
第六章
非参数假设检验
§ 6.1 总体分布的非参数假设检验
非参数假设检验(分布检验)所处理的问题是: (1)两个总体的分布未知,它们是否相同(用两组 样本来检验); (2)(由一组样本)猜出总体的分布(假设),然 后用(另一组)样本检验它是否正确。
需要注意的问题是,两种分布是否相同,一般包 含了参数(均值、方差等)是否相同的问题。如果两 个总体的分布函数形式相同,而参数不同,也将被判 别为概率分布不同。
记 ni 为样本 x1,x2,·,xn 中落在区间 i 中的个数(频次或频 · · 数),那么,频率ni /n (n 至少为50, 最好100 以上)与 概率 pi 之差应当很小,否则就应当拒绝假设H0 (总体的累 积概率分布函数为 F(x) ).
可以证明 (K. Pearson), 在 H0 成立的条件下, 统计量:
如果我们把xi = yi 的个数记为n0, 并从样本总数 n 中扣 除, 则 m = n – n0 , 表示了n 个样本中 xi yi的个数。 m 个样本对中, 把xi - yi > 0的个数记为n+ , xi - yi < 0 的个数记为n- , 则有m = n+ + n- . 设整数 r 满足: 0 r m, 则可以由下式计算出 “xi - yi > 0的个数为n+ ” 的概率 :
配对样本:
是按照问题本身的属性,“天然”配对的。也就是说, 不能各自独立地颠倒顺序。
例:用两套问卷测量 20 个管理人员的素质,两套问卷的满 分都是200分,两套问卷测得的结果如表:
卷A
卷B
147 150 152 148
146 151 154 147
155
152
146
147
149
148
148
146
151
于是, 我们又假设检验:
H0 : p = 0.5 ( 即 F(x) = G(x) )
H1 : p 0.5 (即 F(x) G(x)) . 对于显著性水平, 只要判断 | z |是否大于 z /2 ( 或者z的显 著性水平是否小于), 就可以得出拒绝还是接受H0: p = 0.5 ( 即 F(x) = G(x) )了.
P(r k1 )

2
确保k1的外侧概率小于等于/2, 从而求出k1.
进而, 在假设p = 0.5 (H0假设) 的前提下, 按照B(m, p) 的概率计算公式, 对 r 从小到大, 求累积概率:
P(r k
2
)

2
确保 k2 的外侧概率小于等于/2, 从而求出k2 .
如果实际的“xi - yi > 0的个数n+ ”在(k1 ,k2)中就接受 H0 : p = 0.5 ( 即 F(x) = G(x) ), 否则拒绝H0 ,认为p 0.5, 即 F(x) G(x) .
根据上表, 算得正负号如下表:
+ + + + + + + + + + + 0 +
此时, 正负号的个数 m =19, 所要检验的参数 p =0.5 , mp10,我们这里按大样本类型来处理. 统计出正号的个数 n+ =12 . 设定随机变量 U , 若xi - yi > 0出现, 令U = 1 , 若xi - yi < 0出 现, 令 U = 0 . 于是可以计算出 z 统计量的值如下:
16.40
16.00
17.10
16.90
问: 两种激励法的效果有无显著性差异(两种激励方法 的总体分布是否相同)?
该检验问题可以用参数检验的方法来检验两种激励方 法的平均效果有无显著性差异.
2. 检验两个总体的分布是否相同的另一种方法: Wilcoxon 秩和检验法 (序号和检验法)
设有两个总体的样本观测值 x1,x2,·,xn 与y1,y2 ,·, · · · · ym , 可能 m n . 两组样本是可以各自独立颠倒顺序的. 不妨设 n m , 把两组样本放在一起, 按样本观测值的大 小重新排序, 那么每个观测值就有一个序号, 称为秩. 把样 本个数少的这组样本x1,x2,·,xn的序号(秩) 加总起来, · · 记为 W . 如果两个总体的分布相同, 那么样本x1,x2,·, · · xn与y1,y2 ,·,ym 应当是均匀混合的, 也就是说, W 不能太 · · 小, 也不能太大. W 太小, 说明样本x1,x2,·,xn较多地集 · · 中在左段. W 太大, 说明样本 x1,x2,·,xn 较多地集中在 · · 右段. 由于n m , W 应当比另一组样本的序号之和小一些. 也 就是说, W应当在某两个数字之间: W1 < W < W2. W1 , W2
§ 6.2 一个总体分布的非参数假设检验
1、检验总体分布是否与猜想的分布 F(x) 相同: 拟合优度 2 检验法 问题: 假设(猜测)总体的概率密度函数为 f (x) ( 若总体 为离散型, 则假设总体的概率分布列为 P {X = xi}= Pi ), 用 一组样本 x1,x2,·,xn来检验假设是否成立. · · 作法: (1) 零假设H0 :总体的累积概率分布函数为 F(x) , 备择假设H1 :总体的累积概率分布函数不是 F(x). (2) 在数轴上选取 k-1 个分点 t1,t2,·, t k-1 , 将数轴上分 · · 为 k 个区间(可以是不等区间):
152
150
150
卷A
卷B
147 148 147 150
146 146 148 153
149
147
149
146
152
148
147
149
154
152
153
150
正负号检验的一个重要的前提是:样本xi 或 yi 不能各自独 立地颠倒顺序。
ቤተ መጻሕፍቲ ባይዱ
例:用两套问卷测量 20 个管理人员的素质,两套问卷的 满分都是200分,测得结果如上表。问:两套问卷有无显 著性差异(本质是两套问卷的结果的分布是否相同)?
解:依据关于正负号的二项分布B(m,p)来检验 p 是 否为0.5 , 即 H0 : p = 0.5 ( 即 F(x) = G(x) ) H1 : p 0.5 ( 即 F(x) G(x) ) .
如果接受 p = 0.5 的假设, 就接受F(x) = G(x)的假设, 否则 就拒绝F(x) = G(x)的假设. 这种解决问题的思路是: 把非参数检验的问题转化为参 数检验问题来处理.
例: 用两种激励方法, 分别对同样工种的两个班组(每个班 组 7 个人)进行激励, 测得激励后业绩增长 (%), 数据如表:
相关文档
最新文档