非参数统计(non-parametricstatistics)又称任意分布检验(.
SAS备课笔记_非参数检验
非参数检验非参数统计分析方法(Non-parametric statistics )是相对参数统计分析方法而言的,又称为不拘分布(distribution-free statistics) 的统计分析方法或无分布形式假定(assumption free statistics )的统计分析方法。
其中包括Wilcoxon 秩和检验、Kruskal-Wallis 秩和检验、friedman 秩和检验等,它们分别对应不同设计类型的资料。
SAS中对于非参数分析方法功能的实现主要由npar1way 过程来完成,从过程名字就可以看出,在此过程的处理进程中,只能一次指定一个因素进行分析。
下面我们先来了解一下npar1way 过程的语句格式以及各语句和选项的基本功能。
一、npar1way 过程语句格式简介npar1way 过程属于SAS的STAT模块,对于统计学教科书上所涉及的非参数统计方法几乎都可以通过此过程来完成。
Npar1way 过程的基本语句格式如下。
PROC NPAR1WAY选<项> ;BY 变量名;CLASS变量名;EXACT统计量选项</ 运算选项> ;FREQ变量名;OUTPUT < OUT=数据集名> < 选项> ;VAR 变量名;RUN;QUIT;Proc npar1way 语句标志npar1way 过程的开始,默认情况下(不列举任何选项):npar1way 过程对最新创建的数据集进行分析,将缺失数据排除在分析过程之外;执行方差分析过程(等同于ANOV A 选项),对样本分布位置的差异进行检验(与选项WILCOXON, MEDIAN, SAV A GE 以及VW 等效),并进行经验分布函数检验(等同于EDF 选项)。
此语句后可用的选项见下表。
Proc npar1way 语句选项及其含义选项名称选项功能或含义AB 运用Ansari-Bradley 评分进行分析DATA=数据集名指定要进行分析的数据集MEDIAN 运用中位数评分进行分析,即进行中位数检验NOPRINT 禁止所有的输出,用在仅需要创建输出数据集时ST 运用Siegel-Tukey 评分进行分析ANOVA 对原始数据进行方差分析EDF 要求计算基于经验分布的统计量MISSING 指定分组变量的缺失值为一有效的分组水平SAVAGE 运用Savage 评分进行分析VW 运用Van der Waerden评分进行分析计算CORRECT=NO 在两样本时,禁止Wilcoxon 和Siegel-Tukey 检验的连续性校正过程KLOTZ 运用Klotz 评分进行分析MOOD 运用Mood评分进行分析SCORES=DATA 以原始数据为评分值进行分析WILCOXON 对两样本进行Wilcoxon 秩和检验,对多样本进行Kruskal-Wallis 检验1. exact 语句exact 语句要求SAS 对指定的统计量(选项)进行精确概率的计算。
非参数统计
例外
例外
有的统计问题,从不同的角度,可以理解为参数性的,也可以理解为非参数性的。例如线性回归(见回归分 析)问题,若关心的是估计回归系数,它只是有限个实参数,因而可以看成是参数性的。但是,如果对随机误差 的分布类型没有作任何假定,则从问题的总体分布这个角度看,也可以看成是非参数性的。
统计方法
统计方法
谢谢观看
重要的非参数统计方法秩方法是基于秩统计量(见统计量)的一类重要的非参数统计方法。设有样本 X1,X2,…,Xn,把它们由小到大排列,若Xi在这个次序中占第Ri个位置(最小的占第1个位置),则称Xi的秩为 Ri(i=1,2,…,n)。1945年F.威尔科克森提出的"两样本秩和检验"是一个有代表性的例子。设X1,X2,…,Xm 和Y1,Y2,…,Yn分别是从分布为 F(x)和 F(x-θ)的总体中抽出的样本,F连续但未知,θ也未知,检验假设 H:θ=0,备择假设为θ>0(见假设检验)。记Yi在混合样本(X1,X2,…,Xm,Y1,Y2,…,Yn)中的秩为Ri, 且为诸秩的和,当W >C时,否定假设H,这里C决定于检验的水平。这是一个性能良好的检验。秩方法的一个早期 结果是C.斯皮尔曼于1904年提出的秩相关系数。设(X1,Y1),(X2,Y2),…,(Xn,Yn)是从二维总体(X,Y) 中抽出的样本,Ri为Xi在(X1,X2,…,Xn)中的秩,Qi为Yi在(Y1,Y2,…,Yn)中的秩,定义秩相关系数为 (Ri,Qi)(i=1,2,…n)的通常的相关系数(见相关分析)。它可以作为X、Y之间相关程度的度量,也可用于检 验关于X、Y独立性的假设。
次序统计量和U统计量在非参数统计中也有重要应用。前者可用于估计总体分布的分位数(见概率分布)、 检验两总体有相同的分布及构造连续总体分布的容忍限和容忍区间(见区间估计)等。后者主要用于构造总体分 布的数字特征的一致最小方差无偏估计(见点估计)及基于这种估计的假设检验。
常用非参数统计方法
•2020/10/16
例10.3 在研究白血病时,测得鼠脾的DNA含量如表 10.3第(1)、(3)、(5)、(7)栏。问不同病情的鼠脾 DNA含量有无差别?
•2020/10/16
一、建立假设检验,确定检验水准
❖H0:四种鼠脾DNA含量总体分布位置相同
•2020/10/16
➢正态近似检验,公式为:
• 当相同秩次较多时,
•2020/10/16
等级资料的形式
• 例10.2 用某药治疗不同病情的老年慢性支气管炎病 人,疗效见表10.2第(1)、(2)两栏,问该药对两种病 情的老年慢性支气管炎病人的疗效是否相同?
•常错误采用 卡方检验
•2020/10/16
•统计量
•2020/10/16
正态近似法公式确定概率P:
•2020/10/16
统计学基本内容
•分析资料的步骤:
•1、确定资料的类型:
•
分类资料、定量资料;
•2、选择适当的统计方法;
•3、作出统计推断结论。
•定量资料的分析: • t检验 Z(U)检验 (F检验)
•分类资料的分析: • 检验
•2020/10/16
非参数检验又称任意分布检验(distribution-free test) 。
➢ 优点:资料分布特征要求较低,适用范围广,收集资料方便 ;对不满足参数方法的资料,效率高。
➢ 缺点:对适宜用参数方法的资料,若用非参数法处理,没 有充分利用资料提供的信息,导致检验效能下降。犯第Ⅱ 类错误概率比参数检验大。
一、假设
• H0:两种病情病人的疗效分布相同。 • H1:两种病情病人的疗效分布不同。 • α=0.05
非参数统计(non-parametricstatistics)又称任意分布检验(
例11.6(P195)。
(一)建立检验假设
H0:某中药治疗四种病型 的疗效总体分布相同 H1:四个总体的分布不同 或不全同
0.05
(二)计算统计量H值 (1)编秩:a、计算各等级的合计人数 b、确定秩次范围 c、计算平均秩次 (2)求各组秩和
R1 65(139.5) 18(304.0) 30(397.5) 13(504.5)
血浆总皮质醇含量有差别(不同或不全同)。
若还希望分析具体哪些组之间有差别,需进一步两两组 间比较。方法见《卫生统计学》第五版P196,《医学统计学》 第二版P183等。
当相同秩次较多(超过25%)时,需进行如下校正。
例11.4(P193),见表11-4。
(一)建立检验假设
H0:接种三种不同菌型伤 寒杆菌存活日数总体分 布相同 H1:三个总体的位置不同 或不全同
适用于完全随机设计分组的多个样本比较(即不满足参
数统计条件的),目的在于判断多个总体分布是否相同。
例11.3(P192),见表11-3。
(一)建立检验假设
H
:血浆总皮质醇含量的
0
三个总体分布相同
H1:血浆总皮质醇含量的 三个总体分布不同或不 全同
0.05
(二)计算统计量H值
1、编秩
先将各组数据分别由小到大排列,统一编秩,不同组的
注意:等级资料对程度的比较不应选检验。
例11.5(P194)。
(一)建立检验假设
H
:吸烟工人和不吸烟工
0
人的HbCO%含量总体分布位置相
同
H1:吸烟工人的HbCO%含量高于不吸烟工人 的HbCO%含量
0.0(5 单侧)
(二)计算统计量u值
(1)编秩:a、计算各等级的合计人数
第十二章 非参数检验(Nonparametric test)
正态近似法
n>50时,T分布近似正态分布可用正 态近似法作u检验:
u T T | T n(n 1) / 4 | 0.5
T
n(n 1)(2n 1) / 24
相同秩次较多时的校正值:
| T n(n 1) / 4 | 0.5
uc n(n 1)(2n 1) / 24
(ti3 ti ) / 48
由Wilcoxon于1945年提出
又称 Wilcoxon 符号秩和检验
常用于检验差值的总体中位数是否等 于零
P198 例12.1 为比较定量骨超声测定仪 与磁共振成象仪对原发性骨质疏松性椎 体骨折诊断结果是否有差别,某医师分 别对16例伴有脊椎压缩性骨折绝经妇女, 采用两法检测硬度(Stiffness)(%), 结果见表12-1。问两法检测结果是否有 差别?
表12-1 两法测定硬度(Sstiffness)的结果(%)
观察对象 骨超声 磁共振 差值 差值为正秩次 差值为负秩次
(1)
(2) (3) (4)
(5)
(6)
1
40
20
20
10.5
2
52
42
10
6
3
40
42
-2
1
4
30
32
-2
2
5
38
25
13
8
6
43
12
31
12
7
75
75
0
-
-
8
20
27
-7
5
9
65
非参数检验是一种有效的分析方法。
秩和检验
(Rank sum test)
又称秩转换的非参数检验
医学统计学精品教学第十章-非参数检验精品文档
1
第十章 非参数秩和检验
吴库生 汕头大学医学院预防医学教研室
参数统计与非参数统计
1、参数统计(parametric statistics) 样本所来自的总体分布具有某个已知
的函数形式(如正态分布),而其中有 的参数是未知的,统计分析的目的是对 这些未知的参数进行估计或检验。
2019/10/13
28
符号秩和检验的SPSS实现
2019/10/13
秩和检验
29
Wilcoxon Signed Ranks Test
结 果
Ranks
N Mean RankSum of Ranks
光 电 比 色 法 -Negative Ranks
5a
氰 化 高 铁 法 Positive Ranks
5b
4.60 6.40
X
41.00±29.81
14.75±11.73
方差齐性检验:
F
S12(大) S22(小)
864.94816.2863 137.5929
F F0.05,(7,7) 4.99
P<0.05
两样本方差不齐,不能应用t检验
2019/10/13
医学统计学-秩和检验
31
采用Wilcoxon两独立样本秩和检验
10
Contents
第一节 配对资料的符号秩和检验(Wilcoxon配对法) 第二节 两独立样本比较的秩和检验(Wilcoxon两样本
法) 第三节 完全随机设计多个样本比较的秩和检验
(Kruskal-Wallis检验)
2019/10/13
秩和检验
11
第一节 两配对样本差值的符号秩和检验 (Wilcoxon signed rank test)
统计名词解释
名词解释:1,总体(population):总体指根据研究目的所确定的同质的观察单位的全体。
更确切的说,它是同质的所有观察单位某种观察值的集合。
可分为有限总体和无限总体。
总体中只包含有限个观察单位者为有限总体,反之为无限总体。
2,样本(sample):从总体中随机抽取部分观察单位的测量结果集合称为样本。
样本应具有可靠性和代表性。
样本的可靠性是指样本的确是来自同一总体,具有同质性;代表性是必须采用随机抽样方法从总体中获得的足够多的观察单位。
3,参数(parameter):参数是用来表示总体分布特征的统计数字。
统计中常用的总体参数有描述总体分布中心位置或集中趋势的总体平均数指标;有描述总体离散度的总体变异指标。
4,统计量(statistic):统计量是依据样本观察值推算出的反映样本分布特征(如样本平均数、样本变异等)的一些量。
5,误差(error):观察值与真值之差称为误差。
误差分为过失误差、系统误差和随机误差三类。
6,抽样误差(sampling error):抽样误差是随机误差中的一种,它是由抽样所至的样本统计量与总体参数间的差异。
抽样误差愈小,用样本推算总体的精确度就愈高,反之亦然。
7,正态分布(normal distribution)和标准正态分布():由密度曲线f(x) = (1/√2π)×(1/σ)×EXP[(-1/2)×(x-x0)^2/σ^2]确定的中间高、两边低、左右对称的连续随机变量的分布称为正态分布。
记为N(μ,σ2) ,其中μ为总体均数σ为总体标准差;把总体均数为0,把总体标准差为1的正态分布N(0,1)称为标准正态分布。
一般正态分布可以通过μ=(x-μ)/σ转化为标准正态分布。
8,抽样误差(sampling error):在抽样研究中,由抽样所至的样本与总体参数间的差异称为抽样误差。
9,标准误(standard error):标准误就是样本统计量的标准差,它反映了统计量间的变异程度,也间接的反映抽样误差的大小。
非参数统计(non-parametricstatistics)又称任意分布检验(.33页文档
15、机会是不守纪律的。。——非洲 2、最困难的事情就是认识自己。——希腊 3、有勇气承担命运这才是英雄好汉。——黑塞 4、与肝胆人共事,无字句处读书。——周恩来 5、阅读使人充实,会谈使人敏捷,写作使人精确。——培根
非参数统计(nonparametricstatistics)又称任
意分布检验(.
11、战争满足了,或曾经满足过人的 好斗的 本能, 但它同 时还满 足了人 对掠夺 ,破坏 以及残 酷的纪 律和专 制力的 欲望。 ——查·埃利奥 特 12、不应把纪律仅仅看成教育的手段 。纪律 是教育 过程的 结果, 首先是 学生集 体表现 在一切 生活领 域—— 生产、 日常生 活、学 校、文 化等领 域中努 力的结 果。— —马卡 连柯(名 言网)
非参数统计分析NonparametricTests菜单详解
非参数统计分析――Nonparametric Tests菜单详解非参数统计分析――Nonparametric Tests菜单详解平时我们使用的统计推断方法大多为参数统计方法,它们都是在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。
比如单样本u检验就是假定该样本所在总体服从正态分布,然后推断总体的均数是否和已知的总体均数相同。
本节要讨论的统计方法着眼点不是总体参数,而是总体分布情况,即研究目标总体的分布是否与已知理论分布相同,或者各样本所在的分布位置/形状是否相同。
由于这一类方法不涉及总体参数,因而称为非参数统计方法。
SPSS的的Nonparametric Tests菜单中一共提供了8种非参数分析方法,它们可以被分为两大类:1、分布类型检验方法:亦称拟合优度检验方法。
即检验样本所在总体是否服从已知的理论分布。
具体包括:Chi-square test:用卡方检验来检验二项/多项分类变量的几个取值所占百分比是否和我们期望的比例有没有统计学差异。
Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一分为二。
Runs Test:用于检验样本序列随机性。
观察某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。
一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。
One-Sample Kolmogorov-Smirnov Test:采用柯尔莫哥诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。
2、分布位置检验方法:用于检验样本所在总体的分布位置/形状是否相同。
具体包括:Two-Independent-Samples Tests:即成组设计的两独立样本的秩和检验。
Tests for Several Independent Samples:成组设计的多个独立样本的秩和检验,此处不提供两两比较方法。
秩和检验
⑤ 个别数据偏大或数据一端或两端是不确定数值, (必选)
如“>50kg”等。
表 9-5 两组人痰液嗜酸性粒细胞的秩和计算 嗜酸性 粒细胞 ( 1) + ++ +++ 合计 健康人 ( 2) 5 18 16 5 44 例数 病人 (3) 11 10 3 0 24 合计 (4) 16 28 19 5 84 统一编秩 秩次范围 (5) 1—16 17—44 45—63 64—88 平均秩次 ( 6) 8.5 30.5 54.0 66.0 秩和 (病人组) ⑺=(3)×⑹ 93.5 305.0 162.0 0.0 T1=560.5
12
(1)建立检验假设,确定检验水准
• H0:两法测得结果相同,即差值的总体中位数Md=0 • H1:两法测得结果不相同,即差值的总体中位数Md≠0 α=0.05
单侧检验呢?
13
(2)求差值、编秩、求秩和并确定检验统计量:
①省略所有差值为0的对子数,并从观察单位数中减去0个数 ②按差值的绝对值从小到大编秩,若相同秩的符号不同则取平 均秩,符号相同可依次编秩。 ③任取正秩和或负秩和为T,本例取T+=15.5。
上表中:
单侧 1行 2行 3行 4行
2014-2-18
双侧 P=0.1 P=0.05 P=0.02 P=0.01
25
P=0.05 P=0.025 P=0.1 n1≥10则可用正态近似法:
| T n1 ( N 1) / 2 | 0.5 u n1n2 ( N 1) /12
非参数检验
非参数检验的优点:
①适用范围广,不论样本来自的 总体分布形式如何,都可适用;
②某些非参数检验方法计算简便, 研究者在急需获得初步统计结果时可 采用;
的总体分布不同。 α=0.05
2.混合编秩
依据两组数值由小到大编秩,结果 见上表。
3.求秩和并确定检验统计量T
把两组秩次分别相加求出两组的秩 和值,R1=315.5,R2=149.5。因乳 酸钙组样本含量较小,故 T=R2=149.5。
4.确定P值和作出推断结论 以较小样本含量为n1,n1=14, n2n1=2,查附表6,两样本比较秩和检验 用T界值表(双侧)。
当n1>20或(n2-n1)>10时,附表6 中查不到P值,则可采用正态近似法求u 值来确定P值,其公式如下:
u T n1(N 1) / 2 0.5 n1n2(N 1) 12
上式中T为检验统计量值,n1、n2 分别为两样本含量,N=n1+n2,0.5这 连续性校正数。上式为无相同秩次时使 用或作为相同秩次较少时的近似值。当 两样本相同秩次较多(超过总样本数的 25%)时,应按下式进行校正,u经校 正后可略增大,P值则相应减小。
式中,Ri为各组的秩和,ni为各组 样本含量,N为总样本含量。
当各组相同秩次较多时,可对H值进 行校正,按下式求值。
Hc H c
C 1
(t
3 j
t
j
)
(N3 N)
4.确定P值和作出推断结论
当组数K=3,每组样本含量ni≤5时, 可查附表7(H界值表)得到P值。若 k>3或ni>5时,H值的分布近似于自 由度为k-1的χ2分布,此时可查附表 4χ2界值表得到P值。最后按P值作出 推断结论。
非参数统计(non-parametricstatistics)又称任意分布检验(.PPT33页
31、园日涉以成趣,门虽设而常关。 32、鼓腹无所思。朝起暮归眠。 33、倾壶绝余沥,窥灶不见烟。
34、春秋满四泽,夏云多奇峰,秋月 扬明辉 ,冬岭 秀孤松 。 35、丈夫志四海,我愿不知老。
41、学问是异常珍贵的东西,从任何源泉吸 收都不可耻。——阿卜·日·法拉兹
42、只有在人群中间,才能认识自 己。——德国
43、重复别人所说的话,只需要教育; 而要挑战别人所说的话,则需要头脑。—— 玛丽·佩蒂博恩·普尔
44、卓越的人一大优点是:在不利与艰 难的遭遇里百折不饶。——贝多芬
45、自己的饭量自己知道。——苏联
生物统计学:非参数检验
{ n+,n-}= n+=2 。
3、统计推断 当n=15时, 查附表11 得 临 界 值K0.05(15)=3 , K0.01(15) = 2 , 因 为 K = 2 = K0.01(15),P≤0.01,表明噪数与总体中位数比较的符号检验
1、建立假设 HO:样本所在的总体中位数=已知总体中 位数; HA :样本所在的总体中位数≠已知总体 中位数。 (若将备择假设 HA 中的“≠”改为“<” 或“>”,则进行一尾检验)
依赖于特定分布类型, 比较的是参数
优点:方法简便、易学易用,易于推广使用、应用范围广;可 用于参数检验难以处理的资料(如等级资料,或含数值 “>50mg”等)。 缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数 检验会损失部分信息,其检验效能低;样本含量较大时,两者 结论常相同。
第一节 符号检验
非参数检验的弱点 可能会浪费一些信息 特别当数据可以使用参数模型的时候 大样本手算相对麻烦 一些表不易得到
参数检验 (parametric test)
非参数检验 (nonparametric test)
已知总体分布类型,对 未知参数进行统计推断
对总体的分布类型不作严 格要求 不受分布类型的影响, 比较的是总体分布位置
124.3 147.9 -15.7 7.9 +
1、提出无效假设与备择假设
HO :该地成年公黄牛胸围的平均数=140厘米, HA :该地成年公黄牛胸围的平均数≠140厘米。
2、计算差值、确定符号及其个数 样本各观测值与总体 平均数的差值及其符号列于表 11-2 ,并由此得 n+=6 ,n-=4 ,
非参数统计的名字中“非参数”意味着其方法不 涉及描述总体分布的有关参数;
9-非参数检验
3 j
tj)
N N
3
【例】某医生分别测定了10名正常人、单纯性肥胖 和皮质醇增多症患者血浆中总皮质醇的含量见下表。 问三组人的血浆总皮质醇含量有无差别
三组人的血浆总皮质醇测定值(g/L)
正常人 测定值 0.4 1.9 2.2 2.5 2.8 3.1 3.7 3.9 4.6 7.0 秩 次 1 4 6 8 9 10.5 12 13 15 18 单纯性肥胖 测定值 0.6 1.2 2.0 2.4 3.1 4.1 5.0 5.9 7.4 13.6 秩 次 2 3 5 7 10.5 14 16 17 19 24 皮质醇增多症 测定值 9.8 10.2 10.6 13.0 14.0 14.8 15.6 15.6 21.6 24.0 秩 次 20 21 22 23 25 26 27 28 29 30
1
【例】测得铅作业与非铅作业工人的血铅值 (mol/L)如表第(1)、(3)栏,问两组工人 的血铅值有无差别?
两组工人血铅值的秩和检验
非铅作业组 (1) 0.24 0.24 0.29 0.34 0.43 0.58 0.62 秩次 (2) 1 2 3 4 5 6 7 铅作业组 (3) 0.82 0.86 0.96 1.20 1.63 2.06 2.11 n1=7 秩次 (4) 9 10.5 12 14 15 16 17 T1=93.5
检验步骤(2)
三组人的血浆总皮质醇测定值(g/L) 正常人 测定值 秩 次 0.4 1 1.9 4 2.2 6 2.5 8 2.8 9 … … Ri 96.5 ni 10 单纯性肥胖 测定值 秩 次 0.6 2 1.2 3 2.0 5 2.4 7 3.1 10.5 … … 117.5 10 皮质醇增多症 测定值 秩 次 9.8 20 10.2 21 10.6 22 13.0 23 14.0 25 … … 251 10
非参量统计
5
6 7 8
72
95 68 95769 Nhomakorabea 63 85
-4
0 5 10
0 + +
16
0 25 100
18
19 20 21
63
95 88 75
67
88 79 60
-4
7 9 15
+ + +
16
49 81 225
9
10 11 12 13
98
60 72 94 96
90
64 78 86 89
8
-4 -6 8 7
例:考察两种不同类型的肥料A和B对玉米的增 产效果。共选择10块地,随机抽取n1=5块地施 用A肥料,n2=5块地施用B肥料,结果如下表:
A肥料 84 76 86 70 94
B肥料
122
90
92
106
100
问:A、B两种肥料对玉米的增产效果是否不同? 解:H0:A=B(两种肥料有相同的效果) HA:A≠B (两种肥料有不同的效果) (包括A>B 或A<B,双侧检验) 如果零假设成立的话,则A、B在同一序列中应该 相间出现。也就是说,A、B出现的秩和应该相同。
+
+ +
64
16 36 64 49
22
23 24 25
95
78 85 82
90
82 73 86
5
-4 12 -4 81
+
+ -
25
16 144 16 1229
∑
假设:H0:两种学习方法的效果相同。 HA:新的学习方法(A)优于原法(B)。单侧检验 解:n-=8 n+=15 n0=2 n=25-2=23 S=8
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
H 0:血浆总皮质醇含量的三个总体分布相同 H1:血浆总皮质醇含量的三个总体分布不同或不全同 0.05
(二)计算统计量H值 1、编秩
先将各组数据分别由小到大排列,统一编秩,不同组的
相同数据取平均秩次。 2、求各组秩和 R
i 本例 R1=96.5 R2= 117.5 R3=251 3、计算统计量 H 值 2 n 为各组例数 R i 12 i H ( ) 3( N 1) N n N ( N 1) n i i 12 96.52 117.52 2512 H ( ) 3(30 1) 18.12 30(301) 10 10 10
(二)计算统计量 1.编秩
将两组数据分别由小到大排列,统一编秩,不同组的
相同数据取平均秩次。 2.求秩和并确定检验统计量
当样本例数不等时,以样本例数小者为 n ,取较小 1 样本的秩和为 T ;当样本例数相等时,可任取一组的秩和
为T 。
本例 n1 10
n2 12
T 170
(三)确定 P 值,作出推论 l、查表法
;
T
在上下界值范围外时,则 P 。
n 9
T 的界值范围是5-40 0.05
P 0.05
按=0.05水准,不拒绝 H 0,故不能认为两法测定 空气中 CS 2的含量有差别。
2、正态近似法
当对子数n 50时,计算统计量 u值。
T n(n 1) / 4 0.5 u n(n 1)(2n 1) / 24
(三)确定P值,作出推论
若每组的样本例数不是很小时,统计量H渐进地服从 自由度 组数k-1 的 2分布,通过查 2界值表得到相应 的P值。 若 H 2 0.05( ) 若 H 2 0.05( ) 则 P 0.05 则 P 0.05
本例 3-1=2 H 2 0.05(2)
3、确定统计量秩和 T
分别求正负秩次之和,任取 T 或 T 为统计量 T 。
T 10 .5
(三)确定P值,作出推论 1、查表法 适用于对子数 n 50 时,根据对子数查配对比较的符号秩 和检验用
T
界值表(P234,附表6)。
判断:若现有统计量 若现有统计量
T
在上下界值范围内时,则 P
第十一章
非参数统计方法
非参数统计(non-parametric statistics)又称任
意分布检验(distribution-free test)。这类检验不
对总体参数进行比较,而是用于分布之间的比较, 检验资料的总体分布型是任意的。本章主要介绍这 类检验中的秩和检验(rank sum test)。
第一节 非参数统计的适用条件
适用条件:无特殊要求,实际应用中不满足参 数统计条件的资料均可用。 其应用范畴也很广泛,定量资料和定性资料的 差异比较、分布拟合、相关性分析等都可进行。
第二节 秩和检验
秩和检验(rank sum test)是将原始资料在不分 组的情况下从小到大排顺序,即编秩次,然后分组 将秩次相加得到各组秩和,若比较组间秩和相差不 大,则认为各组间无差异。 优点是适用范围较广,缺点是不能充分利用资 料所提供的信息,统计效率往往较低(仅限于与参 数统计比较)。
当相同秩次较多时,可用以下公式校正。
u c
T n(n 1) / 4 0.5 3 t ) ( t j j n(n 1)(2n 1) j 24 48
例11.1
j是出现相同秩次的编号 t 为第j个相同秩次的个数 j
3 3 (t j t j )(2 2)6 j
二、完全随机设计两样本比较的秩和检验
按=0.05水准,拒绝H 0,接受H1,可认为两组小 鼠生存日数不同,试验 组生存日数较对照组长 。 以平均秩次(T )确定两组生存日数的 长短。
170 T 17 1 10
83 T 6.9 2 12
2、正态近似法 当
n1 、n2
超出附表7范围时,计算
ቤተ መጻሕፍቲ ባይዱu 值。
T n ( N 1) / 2 0.5 1 u n n ( N 1) / 12 1 2
相同秩次较多(超过25%)时,进行如下校正。
u u / c c
c 1(t 3 t ) /( N 3 N ) j j
c
称为校正系数。
本例
(t 3 t ) (23 2) (23 2) 12 j j
三、完全随机设计多个样本比较的秩和检验
完全随机设计多个样本比较的秩和检验(Kruskal-Wallis 法)又称H检验。 适用于完全随机设计分组的多个样本比较(即不满足参 数统计条件的),目的在于判断多个总体分布是否相同。 例11.3(P192),见表11-3。 (一)建立检验假设
当n1 10,n2 20时查两样本比较的秩和检验用T界 值表(P235,附表7)。 判断:若T在表中界值范围内时,其P大于相应的概 率;若T在表中界值范围外时,其P值小于相应的概率。 本例 n1 10,n2 12 今 T 170 T0.05的界值范围是 84 146。
故 P 0.05
一、配对设计数据的符号秩和检验(Wilcoxon配对法) 适用于配对设计非正态分布资料的差异比较。
例11.1(P189)。
(一)建立检验假设
H 0:差值的总体中位数M d 0 H1:差值的总体中位数M d 0 0.05
(二)计算统计量 1、求各对数值的差数 2、编秩 按差值的绝对值由小到大编秩,并将秩次按差值的正负 分两栏。 注意: 编秩时,(1)遇有绝对值相等、符号相反的差值 时,各取平均秩次。(2)符号相同的相等差数不必取平均秩 次。(3)当差值为0时,则不计秩次,但对子数要相应地减 去0的个数。
完全随机设计两样本比较的秩和检验(Wilcoxon两样 本比较法)适用于完全随机设计分组的两个定量资料样本比 较,且不符合参数检验条件,目的在于判断两总体分布是否 相同。
例11.2(P191),见表11-2。 (一)建立检验假设
H 0:两组小鼠生存日数总体分布相同 H1:两组小鼠生存日数总体分布不同 0.05