第二讲-非参数统计检验

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二讲非参数检验

1. 实验目的

1. 了解非参数假设检验基本思想;

2. 会用SAS 软件中的proc nparlway 过程进行非参数假设检验和 proc freq 过程进行列联表的独立性检验。

2. 实验要求

1. 会用SAS 软件建立数据集,并进行统计分析;

2. 掌握proc nparlway 过程进行非参数假设检验的基本步骤;

3. 掌握proc freq 过程进行列联表的独立性检验的基本步骤。

3. 实验基本原理

3.1符号检验

H 0:两种方法的处理效果无显著性差异

令 li = *

1 第i 个个体中新方法优于对照方法

.0 第i 个个体中新方法劣于对照方法 i=1,2,|||,N

统计里S N

N

=瓦I i

i T

S N 表示新方法的处理效果优于对照方法的配对组总数。

若新方法的处理效果显著的优于对 照方法,则S N 的值应明显偏大。因此,若对给定的置信水平

[,有 P

「S N - 八

则拒绝H 0。

1

N

N

(1) S N 服从二项分布b(N ,-) E(S N )

,Var (S N ) 。拒绝域为: 2 2

4

'S

N S

N

c ;

H 。为真时,

(2)由中心极限定理可知,当

的零分布趋于标准正态分布

3.2 Wilcox on 秩和检验 (1)单边假设检验

H o :两种方法的处理效果无显著性差异 as H i ::新方法优于对照方法。

n

用于检验H o 的统计量为:W s I i

i 4

若对给定的置信水平,有P

[

W s - C 「:〉,则拒绝H o

。且W s

的分布列为:

P H °{W S =

w #{w ;n

,m}

' 了 N 、

1 1

n

根据观测结果计算W s

的观测值W s

,计算检验的p 值:

p= P H o

{W s

-

W s }八 P H °{W S

k}

k _w s

然后将p 值与显著水平:•作比较,若p ::: :•,则拒绝H 0,否则接受H 0。

(2)双边假设检验

给定的显著水平:-,C |和

c 2应该满足:

P H 0{W A 乞 c 1}

P H 0

{W A - c 2}

=

仅由上式还不能唯一确定 &和C 2,当我们对两种方法谁优谁劣不得而知时,通常取

P

H °{W A

22 c 1}

= P

H °{W A - c 2}

= ~

若利用p 值进行检验,设 W A

的观测值为'A ,计算概率值

P H °{W A - A }或P H °{W A 「A }

由对称性可知,检验的p 值为上述两概率中小于1/2的那一个的2倍。例如 0 乞 P

H °{ W

A - ' A ^V 2

则 p = 2P

H 0{W A - • ■ A }。求出 p 值后,若 p

拒绝域为:

(3)列联表的独立性检验

H o :方法的处理效果无显著性差异

二jk :表示格子概率,m jk二n: jk表示三维列联表中事件发生的理论频数。将概率用相

应的频率频率去估计。

”Q2J gk 一%)2V2(f)

令Q ~ (f)

i =i j k=i nn i j k

其中:f二(rst -1) - (为检验特定独立性所需要独立估计的概率数目)

将样本数据代入统计量进行检验。然后将P与显著水平:•作比较,若p ::: :•,拒绝H0,否则接受H0。

4. 实验相关SAS知识

(1)独立样本的秩检验proc npar1way过程

proc npar1way过程的基本语句形式为

proc n par1way [opti on s];

class variables; ( proc n par1way 过程不可缺少的语句)

exact; (求出检验的精确 p值)

var variables;

其中"options ”可包含以下选项的部分或全部:

①DATA数据集名:指定要分析的数据集。

②ANO VA对原始数据执行标准的单因素方差分析。

③WILCOXO N进行wilcoxon型秩和检验。当有两种处理方法时,进行的是wilcoxon秩和检

验;当有多种处理方法时,进行Kruskall-Wallis 检验。

④EDF:进行基于样本经验分布函数的非参数检验,包括Smirnov检验。

若省略这些选项,SAS系统将给出所有基于秩以及经验分布函数的非参数检验方法的

分析结果。

(2)列联表的独立性检验

proc freq 过程的基本语句形式为

proc freq [opti on s];

tables variable1*variable2* .. /opti ons;

weight variable;

其中"options ”可包含以下选项的部分或全部:

①DATA数据集名:指定要分析的数据集。

②chisq:要求对生成的每个二维列联表的独立性作2检验,并计算依赖于2统计量的关联

度。

③cellchi2:要求输出每个格子对总2统计量的贡献。

④expected:在独立性假定下输出各格子的期望频数。

⑤deviatio n:要求输出每个格子上的频数与期望频数之差。

⑥nocol:不输出二维列联表各格子的列百分数。

⑦norow:不输出二维列联表各格子的行百分数。

⑧nofreq:不输出格子频数。

⑨nopercent:不输出各格子的百分数。

⑩nopri nt:不输出列联表,但允许输出各分析结果。

5. 实验举例

5.1 Wilcox on秩和检验(单边和双边假设检验)

例1 为了解一种新的术后护理方法和原护理方法相比是否可以显著缩短病人手术后的恢

复时间,随机的将做完某种手术的18位病人分为两组,每组9人,按不同方法护理,观测到他

们的恢复时间(单位:天)如下:

原方法:20,21,24,30,32,36,40,48,54

新方法:19,22,25,26,28,29,34,37,38

在〉=0.05下检验新方法是否显著的缩短了病人手术后的恢复时间。

Wilcox on秩和单边假设检验SAS程序如下:

data a1;

in put method $ time@@;

cards;

a 20 a 21 a 24 a 30 a 32 a 36 a 40 a 48 a 54

b 19 b 22 b 25 b 26 b 28 b 29 b 34 b 37 b 38 pro

c npar1way data=a1 wilcoxon; class method; exact;

run;

结果显示p =0.2181 故接受原假设H。,即认为病人手术后采用新旧护理方法对其恢

复时间无显著差异。

相关文档
最新文档