非参数假设检验-第四次课新
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对于多数参数检验方法,都有一种或几种 相对应的非参数检验方法,如下表所示。
参数检验与非参数检验方法的对应表
参数检验方法
t检验法
t检验法 (配对样本) 单因素方差分析 多因素方差分析
相关系数
非参数检验方法 两个独立样本的中位数检验
两个独立样本的秩和检验 成对比较、单样本正负号检验 成对比较、单样本符号秩检验
1
起点标杆位置 2 3 4567
8 总数
获胜 频数
29
19
18
25 17 10 15 11
144
均匀分布检验
检验总体的二项分布
二项分布检验的基本思想:根据搜集到的样 本数据,推断总体分布是否服从某个指定的二项 分布。
其零假设:样本来自的总体与所指定的某个 二项分布不存在显著的差异。
SPSS中的二项分布检验,在样本小于等于30 时,按照计算二项分布概率的公式进行计算;样 本数大于30时,计算的是Z统计量,认为在零假 设下,Z统计量服从正态分布。
df
6
As ymp. Sig. .331
a.0 cells (.0%) have expected frequencies les s than 5. The minimum expected cell frequency is 33.7.
卡方检验要求样本量是充分大的,使用时建 议样本容量应该不小于30,同时每个单元中 的期望频数不能太小,如果有类别的频数小 于5,则建议将它与相邻的类别合并,如果有 20%的单元期望频数都小于5,就不能再使用 卡方检验了。
续
35家住户的发病情况
住户 发病情况 住户 发病情况 住户
1
1
13
1
25
2
0
14
1
26
3
1
15
1
27
4
1
16
1
28
5
1
17
0
29
6
1
18
0
30
7
0
19
1
31
8
0
20
1
32
9
0
21
0
33
10
0
22
0
34
11
1
23
1
35
12
1
24
1
发病情况
1 1 0 1 0 0 1 0 0 0 0
Runs Test
练习:赛马比赛时,任一马的起点位置是起跑 线上所指定的标杆位置。现有8匹马的比赛,位 置1是内侧最靠近栏杆的跑道,位置8是外侧离栏 杆最远的跑道,下表是某赛马在一个月内某特定 圆形跑道上的纪录,并且按照起点的标杆位置分 类。试检验起点标杆位置对赛马结果的影响。
马在8个圆形跑道的起点标杆位置上获胜的纪录
K个独立样本的H检验法 Friedman 检验法
Spearman 秩相关系数
非参数检验的优点
与参数检验方法对比,非参数检验方法具有以下优点: ▪ 检验条件宽松,适应性强。参数检验假定总体分布为
正态、近似正态或以正态分布为基础而构造的t分布或 分2 布;非参数检验不受这些条件的限制,弥补了参数 检验的不足,对于非正态的、方差不等的以及分布形 状未知的数据都适用。 ▪ 检验方法灵活,用途广泛。非参数检验不但可以应用 与定距、定比等连续变量的检验,而且适用于定类、 定序等分类变量的检验。对于那些不能直接进行四则 运算的定类数据和定序数据,运用符号检验、符号秩 检验都能起到好的效果。 ▪ 非参数检验的计算相对简单,易于理解。由于非参数 检验更多地采用计数的方法,其过程及结果都可以被 直观地理解,为使用者所接受。
Z
K 0.5np np(1 p)
K:观察变量取值的样本个数,
当K小于n/2时,取加号;p为检
验概率。
练习
练习:某地某一时期内出生35名婴儿,其中 女孩儿19名(Sex=0),男孩儿16名(Sex=1)。 问,该地区出生婴儿的性别比例与通常的男女性 别比例(总体概率约为0.5)是否不同?数据如 下表所示:
周日
Observ ed N Expected N Residual
1
31
33.7
-2.7
2
38
33.7
4. 3
3
70
67.3
2. 7
4
80
67.3
12.7
5
29
33.7
-4.7
6
24
33.7
-9.7
7
31
33.7
-2.7
Total
303
Test Statistics
周日 Chi-Squaare 6.891
非参数假设检验-第四次课新
单击此处添加副标题内容
非参数假设检验
追求
非参数检验是相对于参数检验而言的,这两 种检验方法在实际中都有广泛的应用,但它们有着 不同的数理统计原理和应用场合。
在统计学的发展过程中,最先出现的推断统 计方法都对样本所属总体的性质作出若干假设,即 对总体的分布形状作某些限定,例如Z检验、t检验, 假设样本的总体分布加以某些限定,把所要推断的 总体数字特征看作未知的“参数”进行推断,称之 为参数统计方法(Parameter statistical methods) 或限定分布统计方法(distribution-specified statistical methods),基于此所做的假设检验就称 为参数检验(Parametric test)。常用的检验如t检 验、Z检验、F检验等都是参数检验。
非参数检验的缺点
非参数检验也有一些不可避免的缺点:
▪ 非参数检验方法对总体分布的假定不多,适应 性强,但方法本身也就缺乏针对性,其功效不 如参数检验。
▪ 非参数检验使用的是等级或符号秩,而不是实 际数值,方法虽简单,但会失去许多信息,因 而检验的有效性也就比较差。例如对于一批适 用于t检验的配对资料,如果采用符号秩检验 处理,其功效将低于t检验,如果用符号检验 处理则效率更低,因为它对信息的利用更不充 分。当然,如果假定的分布不成立,那么非参 数检验就是更值得信赖的。
帕累托分布(Pareto)
均匀分布(Uniform)
T分布(Student T)
半正态分布(Half-normal) 威布尔分布(Weibull)
对数正态分布(Lognormal)
选择比率估测的公式,每次只能选择一项。
r 3/8 Blom’s方法:使用公式:n 1 / 4
Van der Waerden方法:使用公式: r n1
非参数假设检验需要处理的问题:
(1)猜出总体的分布(假设),用另一组样本检验。
(2)两个总体的分布未知,它们是否相同;
一个总体分布的非参数假设检验 内容 两个总体分布的非参数假设检验
多个总体分布的非参数假设检验
一个总体:单样本总体分布的检验
SPSS的
独立样本非参数检验 两个总体
非参数检验
配对样本非参数检验
Test Value a Total Cases Number of Runs Z Asymp. Sig. (2-tailed)
a. User-specif ied.
发病 情况 1.00 35 14
-1. 339 .181
单样本的Kolmogorov—Smirnov检验
单样本K—S检验是一种拟合优度的非参数检 验,是利用样本数据推断总体是否服从某一理论 分布的方法,适用于探索连续性随机变量的分布 形态。进行Kolmogorov-Smirnov Z检验,是将一 个变量的实际频数分布与正态分布(Normal)、均 匀分布(Uniform)、泊松分布(Poisson)进行比较。
Mean
Std. Dev iation
Most Extreme Dif ferences
Absolute Positiv e
2 k (f0 fe)2
i1
fe
例题
例题:某地一周内每日患忧郁症的人数如表 所示,请检验一周内每日人们忧郁的数是否满足 1:1:2:2:1:1:1。
周日 1
患者数 31
SPSS实现 过程
2
38 1.定义变量;
3
70 2.变量加权;
4
80 3.进入Analyze菜单
5
29
6
24
7
31
用于选择计算非参数检验统计量对应的P值 的方法。SPSS提供了3种计算P值的方法:
续
35名婴儿的性别
婴儿 性别 婴儿 Sex 婴儿 Sex
1
1
13
1
25
1
2
0
14
1
26
1
3
1
15
1
27
0
4
1
16
1
28
0
5
1
17
0
29
0
6
1
18
0
30
0
7
0
19
0
31
1
8
0
20
0
32
0
9
0
21
0
33
0
10
0
22
0
34
0
11
1
23
1
35
0
12
1
24
1
Binomial Test
Observed
Asymp. Sig.
依时间或其他顺序排列的有序数列中,具有 相同的事件或符号的连续部分称为一个游程。调 用Runs过程可进行游程检验,即用于检验序列中 事件发生过程的随机性分析。
例题
例题:某村发生一种地方病,其住户沿一条河排 列,调查时对发病的住户标记为“1”,对非发病 的住户标记为“0”,共20户,其取值如下表所示 :
参数检验只有在关于总体分布的假设成立时,所 得出的结论才是正确的,所以它在很多场合不便 应用,于是统计学家发展了许多对总体不作太多 或严格限定的统计推断方法,这些方法一般不涉 及总体参数的假设,与之相对应的统计方法通常 称为非参数统计(Nonparametric statistics)或 自由分布统计方法(Distribution-free statiscal methods),基于此所做的假设检验则称为非参 数检验(Nonparametric test)或自由分布统计 检验(Distribution-free statistical test)。非参 数检验的前提假设比参数检验方法少很多,也容 易满足,适用于已知信息相对较少的数据资料, 而且它的计算方法也简便易行。
SPSS实现K—S检验的过程如下:
(1)根据样本数据和用户的指定构造出理论分 布,查分布表得到相应的理论累计概率分布函 数 F0 (x) 。 (2)利用样本数据计算各样本数据点的累积概 率,得到检验累计概率分布函数 S0 (x) 。 (3)计算 F0 (和x) S在0 (x相) 应的变量值点X上的差, 得到差值序列。单样本K—S检验主要对差值序 列进行研究。
Asymptotic only:渐进性的显著性检验,适合 于样本服从渐进分布或较大样本。
Monte Carlo:不依赖渐进性方法估测精确显 著性,这种方法在数据不满足渐进性分布,而 且样本数据过大以致不能计算精确显著性时特 别有效。
Exact:精确计算法,即准确计算观测结果的 统计概率。计算量较大,适用于小样本。
Category N
Prop.Test Prop(2. -tai led)
性 别Group 1 1
16
.46
.50
.736a
Group 2 0
19
.54
Total
35
1.00
a.Based on Z Approximati on.
单样本变量值的随机性检验(游程检验)
单样本变量值的随机性检验是对某变量的取 值出现是否随机进行检验,也称游程检验。
是根据变量分布的分位数对所指定的理论分布 分位数绘制的图形。
Test Distribution提供13种概率分布:
拉普拉斯分布(Laplace) 贝塔分布(Beta)
逻辑斯谛分布(Logistic) 卡方分布(Chi-square)
指数分布(Exponential) 正态分布(Normal)
伽玛分布(Gamma)
独立样本非参数检验 多个总体 配对样本非参数检验
一个总体分布的检验
检验总体的正态分布 检验总体的卡方分布 检验总体的二项分布 单样本变量值的随机性检验(游程检验) 单样本的Kolmogorov—Smirnov检验
检验总体的正态分布的图示法
P-P正态概率分布图(Graphs P-P) 是根据变量的累计比例对所指定的理论分布累 计比例绘制的图形。 Q-Q正态概率单位分布图(Graphs Q-Q)
例题
例题:某地144个周岁儿童身的高数据如下表, 问该地区周岁儿童身高频数是否成正态分布?
身高区间
Байду номын сангаас
人数
64—
2
68—
4
69—
7
70—
16
71—
20
72—
25
73—
24
74—
22
76—
16
78—
2
79—
6
83—
1
One-Sample Kolmogorov-Smirnov Test
N Normal Parameters a,b
Rankit方法:使用公式:r 1 / 2 n
Tukey方法:使用公式:r 1 / 3
式中:
n 1/ 3
n:个案的数目
r:从1到n的秩次
若与某个概率分布的统计图一致,即被检验 的数据符合所指定的分布,则代表个案的点簇在 一条直线上。
检验总体的卡方分布 总体分布的卡方检验的原理:如果从一个随机 变量X中随机抽取若干个观察样本,这些观察样 本落在X的K个互不相交的子集中的观察频数服 从一个多项分布,该多项分布当K趋于无穷时, 就近似服从X的总体分布。 因此,假设样本来自的总体服从某个期望分布 或理论分布,同时获得样本数据各子集的实际观 察频数,则可依据下面统计量作出推断: