非参数统计检验方法的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
论文投稿领域:数理经济与计量经济学
非参数统计检验方法的应用
阮曙芬1 程娇翼 1 张振中2
(1.中国地质大学数理学院,武汉 430074;2.中南大学数学科学与计算学院,长沙 410075)
摘要:本文对非参数统计中常用的三种假设检验方法进行了简单的介绍。运用
Kruskal-Wallis 检验方法对2002年前三季度的上海股市综合指数收益率数据进行了周末效应的检验,结果表明2002年上海股市综合指数收益率不具有周末效应。 关键字:符号检验;Wilcoxon 秩和检验;Kruskal-Wallis 检验
1引言
非参数统计是统计分析的重要组成部分。非参数假设检验是在总体分布未知或者总体分布不满足参数统计对总体所做的假定的时候,分析样本特点,寻找相应的非参数检验统计量。本文就是以此为出发点,介绍了非参数统计中假设检验常用的几个检验方法:符号检验、Wilcoxon 秩和检验和Kruskal-Wallis 检验,然后结合具体的问题和数据,在统计软件SAS 中作相应的非参数检验。
2非参数假设检验介绍
2.1 配对样本的符号检验
符号检验是根据正、负符号进行假设检验的方法。这种检验方法用于配对设计数值变量资料的假设检验,常常是差值不服从正态分布或者总体分布未知的情况下不能用t 检验的时候使用。其原理是对差值进行编制并冠以符号,然后对正负秩和进行比较检验。
设随机变量12,,...,n X X X 相互独立同分布,分布为()F x ,()F x 在0x =连续。假设检验问题
2.2 两独立样本的Wilcoxon 秩和检验
Wilcoxon 秩和检验的理论背景如下:有两个总体,一个总体的样本为12,,...,n X X X ,相互独立同分布,分布为()F x ;另一个样本为12,,...,n Y Y Y ,相互独立同分布,分布为()G x ,()F x ,
()G x 连续。问随机变量Y 是否随机大于随机变量X ,即检验
0H :()()F x G x ≡,1H :()()F x G x ≥,且有某些点不等号成立。
将12,,...,n X X X ,12,,...,n Y Y Y 共m n +个随机变量一起排序,产生对应的秩
11(,...,;,...,)m n R Q Q R R =。则Wilcoxon 秩和检验统计量为:1
n
i i W R ==∑即12,,...,n Y Y Y 在混合样
本中的秩的和为Wilcoxon 秩和检验统计量。 2.3多样本的Kruskal-Wallis 检验
Kruskal-Wallis 检验一般对多个总体的分布情况进行检验。其理论基础为:假设有m 种处理,对于第j 个检验体实行第i 种处理产生的效果记为ij x ,其分布函数为()i F x 。即
0H :12()()...()n F x F x F x ===;1H :存在i 和'i ,'()()i i F x F x ≠。
设观测值为{,1,2,...,;1,2,...,}ij x i m j n ==。全体样本数为N ,ij x 的顺位记为ij r
。假定
检验方法为:00,N N k k H k k H >→≤→拒绝不拒绝。
k 近似服从自由度为1m -的2χ分布。因此2(1)m α
χ-,2
(1)N k m αχ=-为自由度为1m -的2χ
分布的右侧的α分位数点。
3 Kruskal-Wallis 检验的应用
股市的周末效应是指周一的收益率比其他交易日收益率低,且风险较大;周五的收益率
比其他交易日高,且相对风险较小。下面分别对2002年的前三季度的上证综合指数进行周末效应的分析。
本实证分析中,样本为2002年1月4日到2002年9月27日的上海股市综合指数(数据来源于/stock/company/sh000001/20031012.html )。指数收益率的计算公3.1收益率分布状况的分析
首先计算收益率序列的方差,均值,偏度和峰度初步判断该序列是否服从正态分布。然后利用Kolmogorov-Smirnov 等检验结果对收益率进行正态性检验。 [SAS 程序]
创建数据集:将excel 数据导入SAS 中,然后在分析家中利用数据计算得到: r0=p/lag1(p)和r=log(r0);
data sasuser.chx1 sasuser.chx2 sasuser.chx3 sasuser.chx4 sasuser.chx5; set sasuser.ch01; select (w);
when(1) output sasuser.chx1;
when(2) output sasuser.chx2;
when(3) output sasuser.chx3;
when(4) output sasuser.chx4;
when(5) output sasuser.chx5;
end;
run;
proc univariate data=sasuser.ch01;
var r;
run;
[SAS结果输出]见表1汇总
偏度和峰度分别为0和3,所以我们可以初步断定指数收益率序列为非正态分布。为了进一步
图1 上证综合指数收益率分布的直方图
图2 上证综合指数收益率分布的概率图
包括Kolmogorov-Smirnov检验统计量在内的四种检验正态分布的检验统计量均表明上海综合指数收益率序列不服从正态分布,图1和图2也说明了这一点。所以要采用非参数方法进行以后的周末效应的检验。
3.2周末效应存在性的Kruskal-Wallis检验
我们利用Kruskal-Wallis检验2002年前三季度上证综合指数收益率的周末效应的存在性。
[SAS程序]
proc npar1way wilcoxon data=sasuser.ch01;
class w;
var r;
run;
[SAS结果输出]
-------------------------------------------------------------------------
T he NPAR1WAY Procedure
Wilcoxon Scores (Rank Sums) for Variable r
Classified by Variable w
w N Sum of Scores Expected Under H0 Std Dev Under H0 Mean Score
5 33 2576.0 2805.0 252.150749 78.060606