第13章+非参数检验
SPSS教程-非参数检验
一般用来对两个独立样本的均数、中位数、离 散趋势、偏度等进行差异比较检验。
两个样本是否独立,主要看在一个总体中抽取 样本对另外一个总体中抽取样本有无影响。
Mann-Whitney检验
=0.18576
计算表
SPSS基本操作
SPSS基本操作
SPSS基本操作
SPSS基本操作
SPSS基本操作
单样本K-S检验
利用样本数据推断样本来自的总体是否服从某一理论 分布,是一种拟合优度的检验方法,适用于探索连续 型随机变量的分布
步骤
计算各样本观测值在理论分布中出现的理论累计概率值F(x) 计算各样本观测值的实际累计概率值S(x) 计算理论累计概率值与实际累计概率值的差D(x) 计算差值序列中最大绝对差值D
针麻效果
(1) Ⅰ Ⅱ Ⅲ Ⅳ
表
肺癌 (2) 10 17 19 4
三种病人肺切除术的针麻效果比较肺化脓症Fra bibliotek肺结核
(3)
(4)
24
48
41
65
33
36
7
8
合计 (5) 82 123 88 19
SPSS基本操作
与例7的操作相同
随机区组设计资料的秩和检验
M检验(Friedman法)法计算步骤
将每个区组的数据由小到大分别编秩 计算各处理组的秩和Ri 求平均秩:R=1/2b(k+1) 计算各处理组的( Ri-R) 求M 查M界值表,F近似法
参数统计(parametric statistics) : 在 统计推断 中,若样本所来自的总体分布为已知的函数形式 (正态/近似正态分布),但其中的参数未知,统 计推断的目的就是对这些未知参数进行估计/检验, 这类统计推断方法称参数统计。
第十三章 非参数检验
相关样本
(二)大样本的检验
1、近似正态法
Z
r
1 r N 2 N 2
校正法:
1 r 0.5 N 2 Z N 2
其中
相关样本
N r : r 0.5 2 N r : r 0.5 2
检验过程
⑴ 提出假设
Ho:P+=P-,Ha:P+≠P-
相关样本
⑵ 确定符号(+,-,0)
1、符号检验法
1 2 3 4 5 6 7 8 9 10 11 12 13
期中 80 70 87 90 89 79 51 62 74 66 79 80 61 期末 86 75 87 97 81 88 67 74 72 94 96 93 85
符号 + + 0 + - + + + - + + + +
r=min(n+,n-) =n- =2 N= n++n- =10+2 =12 r=2,r0.10/2=2; r= r0.10/2,p>0.10
1 2 3 4 5 6 7 8 9 传统X 85 88 87 86 82 82 70 72 80 新法Y 90 84 87 85 90 94 85 88 92
相关样本
(一)小样本符号检验
⑴ 提出假设 ① 单侧检验: Ho:P+≤P-; Ha:P-≤P+
② 双侧检验 Ho:P+=P- (p=q=1/2)
概述 四、参数和非参数的比较 • 资料相同:两法结论的差异不太大。
适用于非参数的资料用非参数法,结果
准确; 适用于参数法的资料用参数法,结果更 准确。
五、方法
独立样本
概述
秩和检验法 中位数检验法
符号检验法 符号秩次(等级)检验法 单向秩次方差分样 双向秩次方差分析 柯尔莫哥洛夫检验 斯米尔诺夫检验
非参数检验
非参数检验的概念
非参数检验又称为任意(不拘) 非参数检验又称为任意(不拘)分布检验 distributiontest), ),这类方法 (distribution-free test),这类方法并不依赖总
非 参 数 检 验
体分布的具体形式,应用时可以不考虑研究变量 体分布的具体形式, 为何种分布以及分布是否已知,进行的是分布之 为何种分布以及分布是否已知, 间而不是参数之间的检验,故又称非参数检验
参数检验的特点
分析目的:对总体参数(µ π)进行估计或检验。 进行估计或检验。 分析目的:对总体参数(
非 参 数 检 验
分布:要求总体分布已知, 分布:要求总体分布已知,如:
•连续性资料——正态分布 连续性资料——正态分布 •计 数 资 料——二项分布、POISSON分布等 ——二项分布 POISSON分布等 二项分布、
序号 (1) 1 2 3 4 5 6 7 8 9 10 11 12
数据 (2) 39 42 45 43 52 45 22 48 40 45 40 49
排秩 ( 3)
非 参 数 检 验
非 参 数 检 验
疗效
A组 (1 ) 15 11 20 8
B组 (2 ) 12 3 7 4
排秩
平均秩次
控制 显效 有效 近控
参数检验方法的局限
非 参 数 检 验
t检验 成组t 成组t检验要求:正态、方差相等、个体独立 配对t 配对t检验要求:差值正态、个体独立 方差分析 单因素多水平比较方差分析要求:正态、方差 相等、个体独立 多个分析因素时方差分析要求:分布、方差、 个体独立性
定性无序分类资料
非 参 数 检 验
两组性别结构是否相同? 两组某种不良反应的发生率是否相同? 多组发生率是否相同? 多组构成是否相同?
spss使用教程非参数检验
SPSS二项分布检验就是根据收集到的样本 数据,推断总体分布是否服从某个指定的二项 分布。其零假设是H0:样本来自的总体与所指 定的某个二项分布不存在显著的差异。
第24页/共152页
SPSS中的二项分布检验,在样本小于或等 于30时,按照计算二项分布概率的公式进行计 算;样本数大于30时,计算的是Z统计量,认 为在零假设下,Z统计量服从正态分布。Z统计 量的计算公式如下
人数 2 4 7 16 20 25 24 22 16 2 6 1
第49页/共152页
实现步骤
图10-12 在菜单中选择“1-Sample K-S”命令
第50页/共152页
图10-13 “One-Sample Kolmogorov-Smirnov Test”对话框
第51页/共152页
图10-14 “One-Sample K-S:Options”对话框
第28页/共152页
表10-2
35名婴儿的性别
婴儿
Sex
婴儿
Sex
婴儿
Sex
1
1
13
1
25
1
2
0
14
1
26
1
3
1
15
1
27
0
4
1
16
1
28
0
5
1
17
0
29
0
6
1
18
0
30
0
7
0
19
0
31
1
8
0
20
0
32
0
9
0
21
0
33
0
10
第13章非参数检验习题答案
第13章非参数检验教材习题答案13.1 为了解一种节能灯的使用寿命,随机抽取了8只灯泡,测得其使用寿命(:小时时)如命(单单位:小下:3250 3500 2850 3700 3010 2910 2980 3420 (1)检验该种节能灯的使用寿命是否服从正态分布?(a=0.05) (1)检验该种节能灯使用寿命的中位数是否等于3000小时?(a=0.05) 详细答案:(1)K—S检验结果如下表:精确双尾概率,不拒绝原假设,没有证据表明该种节能灯的使用寿命不服从正态分布。
(2)中位数的符号检验如下表:精确的双尾概率为,不拒绝原假设,没有证据表明该种节能灯的使用寿命的实际中位数与3000有显著差异。
13.2 利用13.1题的数据,采用Wilcoxon符号秩检验该种节能灯使用寿命的中位数是否等于3000小时?(a=0.05) 详细答案:检验结果如下表精确的双尾概率,不拒绝原假设。
没有证据表明该种节能灯的使用寿命的实际中位数与3000有显著差异。
13.3 为分析股票的每股收益状况,在某证券市场上随机抽取10只股票,得到2005年和2006股收益年的每股收益数据如下表,采用Wilcoxon符号秩检验分析:2007年与2006年相比,每,每股是否有显著提高?(a=0.05) 股票代码2006年每股收益(元)2007年每股收益(元)1 0.12 0.26 2 0.95 0.87 3 0.20 0.24 4 0.02 0.12 5 0.05 0.13 6 0.56 0.51 7 0.31 0.35 8 0.25 0.42 9 0.16 0.37 10 0.06 0.05 详细答案:配对样本的Wilcoxon符号秩检验如下表:精确的单尾,拒绝,2006年与2005年相比每股收益有显著提高。
13.4 某种品牌的彩电在两个城市销售,其中在A城市有6个商场销售,在B城市有8个商场销售,下表是各商场一年的销售量(单位:台)。
非参数假设检验方法
按 =0.05,自由度为1,查2分布表得
自由度为m-1=1
上页 下页 返回
例4 验证一枚骰子是否均匀。 电话号码的数字出现的概率等等问题。 采用分组离散化方法
若X的分布函数F(x)的具有明确表达式F0(x),不含未知参数。 根据样本信息推断X的分布函数是否为F0(x).
第一步:
第二步:计算
上页 下页 返回
第三步:记数
第四步:检验 其中m为分组数
H0的拒绝域为 一般有 n > 50,npi > 5最好 npi >10,否则应重新分组。 使得npi > 5最好 npi >10.
抽取次数X 1
2
3
4 5
试验累计数 43 31 15 6
5
解 若两色球个数相等,则每次取到白球的概率为1/2 以抽取次数X为考查对象,则X服从几何分布,即
计算得
上页 下页 返回
此是 m = 5, n1 = 43, n2= 31, n3 =15, n4 = 6,n5= 5, n=100
计算有
结论:接受H0
奥地利生物学家孟德尔进行了长达八年之 久的豌豆杂交试验,并根据试验结果,运用他 的数理知识, 发现了遗传的基本规律.
孟德尔
…
…
黄色纯系
子一代 绿色纯系
子二代
上页 下页 返回
根据他的理论,子二代中, 黄、绿之比 近似为3:1,
他的一组观察结果为: 黄70,绿27 近似为2.59:1,与理论值相近.
由于随机性,观察结果与3:1总有些差距,因此有 必要去考察某一大小的差异是否已构成否定3:1理论的 充分根据,这就是如下的检验问题.
为了进行检验,还必须知道其分布,否则进行不了
非参数检验
200
取显著性水平为0.05,查 2 分布表得临界值
2 0.05
(4)
9.488
,由于
2统计量大于临界值,所以应该拒
绝原假设,即认为消费者对各种品牌茶叶的偏好是有差
别的。
二、符号检验
1. 单样本位置的符号检验
一个随机样本,有 n 个数据
x1,x2,…,xn,其实际的总体中位数为
M,假定的中位数是某个特定值,记 做 M0 。位置检验是检验真实的中位 数和假定的中位数的关系:大于、等 于还是小于。
品牌,每一种只标上A、B、C、D、E,随机抽取1000消费 者,每人都品尝五种茶叶,然后把最偏好的茶叶的字母 写下来。下表是整理后的消费者偏好的频数分布。要求 判断消费者对这几种品牌茶叶的偏好有没有差异?
各种品牌茶叶爱好者的频数分布
喜欢的品牌
A B C D E
合计
人数
220 302 175 80 223
一、 检验
属于拟合程度检验,它是利用随机 样本对总体分布与某种特定
分布拟合程度 的检验 。
检验步骤:
① 确立原假设和备择假设。 ② 按照“原假设为真”的假定,导出 一组期望频数或理论频数。 ③ 计算 2 统计量 。
2 k ( fi ei )2
i1
ei
若统计量的值较大,拒绝原假设。
【例10.14】假定有五种不同牌号的茶叶,但都未标明
市场调查
【例10.15】领导者的领导水平是可以训练的吗?
根据人的聪明程度、人品、受教育状况等,随机抽取30 人配成15对,每对中有一人随机选择受训,另一人不受 训。经过一段时间后,按被设计好的问题评价他们的领 导水平,结果如下表所示。
领导水平评价表
非参数检验
两种方法治疗扁平足效果观察
建立假设
病例号
原始记录 A法 B法
量化值 A法 B法
差值
秩次
H0:两法疗效差值的总体中位数
1 2
为0;
3
4
H1:差值的总体中位数不为0。
5
6
=0.05
7
8
计算检验统计量
9
10
编秩:
11
12
求秩和:T+=61.5,T-
13
=4.5
14 15
好
差
好
好
好
差
好
中
差
中
中
差
好
中
好
差
秩和(rank sum): 同组秩次之和;在一定程度上反映了等级 的分布位置。
秩和检验:就是通过秩次的排列求出秩和,进行假设检验。
11
非参数检验 (nonparametric test )
非参数检验的最常用方法——秩和检验( rank test ) 利用秩的大小进行推断就避免了不知道背景分布的
困难。这也是非参数检验的优点。 多数非参数检验明显地或隐含地利用了秩的性质;
但也有一些非参数方法没有涉及秩的性质。 掌握对数据进行编秩的方法是学习秩和检验的基本
要求。
12
非参数检验 (nonparametric test )
非参数检验的最常用方法——秩和检验( rank test )
A组: - 、、+、+、+、+、++、++、++、++、+++、+++
适用条件: (1)上述两种设计类型的资料不满足参数检 验条件。 (2)配对设计等级资料的比较。
非参数检验
组别 95-99 90-94 85-89 80-84 75-79 70-74 65-69 60-64 55-59 50-54 45-49
fo 4 12 18 28 44 72 46 40 22 18 10 314
组上限 99.5 94.5 89.5 84.5 79.5 74.5 69.5 64.5 59.5 54.5 49.5
fe 行合计数 列合计数 总次数
, fb , fd
( a b )( b d ) abcd ( c d )( b d ) abcd
注意:2×2列联表的自由度df=(2-1)(2-1)=1
例 为比较某新药与传统药物治疗脑动脉硬化的疗效, 临床试验结果见表,问两种药物的疗效有无差异? 表 两种药物治疗脑动脉硬化的疗效 处理措施 新药组 有效 无效 合计 44 24 68
41(38.18) 3(5.82)
传统药物组 18(20.82) 6(3.18) 合计 59 9
• 4、关于2×2列联表在数据合并上应注意 的问题 • 2×2列联表只是 的一个特例,实际上, 在很多情况下,变量的分类不止两个,当 我们把各部分数据合并成2×2列联表来表 达时,可能会忽略其中一些重要的变量, 造成 检验的失真,即可能会出现这样的 情况:单独分析每一个2×2列联表所得的 结果与合并成一个2×2列联表所做的 分 析结果相矛盾。
2
( 69 74 . 4 ) 74 . 4
(16 11 . 6 ) 11 . 6
22 . 2748
• 3、推断:
取 0 . 05 , df 5 1 4 , 查表得: 22 . 2748
2 2 0 . 05 ( 4 ) 2 0 . 05 ( 4 )
非参数检验
非参数检验的优点:
①适用范围广,不论样本来自的 总体分布形式如何,都可适用;
②某些非参数检验方法计算简便, 研究者在急需获得初步统计结果时可 采用;
的总体分布不同。 α=0.05
2.混合编秩
依据两组数值由小到大编秩,结果 见上表。
3.求秩和并确定检验统计量T
把两组秩次分别相加求出两组的秩 和值,R1=315.5,R2=149.5。因乳 酸钙组样本含量较小,故 T=R2=149.5。
4.确定P值和作出推断结论 以较小样本含量为n1,n1=14, n2n1=2,查附表6,两样本比较秩和检验 用T界值表(双侧)。
当n1>20或(n2-n1)>10时,附表6 中查不到P值,则可采用正态近似法求u 值来确定P值,其公式如下:
u T n1(N 1) / 2 0.5 n1n2(N 1) 12
上式中T为检验统计量值,n1、n2 分别为两样本含量,N=n1+n2,0.5这 连续性校正数。上式为无相同秩次时使 用或作为相同秩次较少时的近似值。当 两样本相同秩次较多(超过总样本数的 25%)时,应按下式进行校正,u经校 正后可略增大,P值则相应减小。
式中,Ri为各组的秩和,ni为各组 样本含量,N为总样本含量。
当各组相同秩次较多时,可对H值进 行校正,按下式求值。
Hc H c
C 1
(t
3 j
t
j
)
(N3 N)
4.确定P值和作出推断结论
当组数K=3,每组样本含量ni≤5时, 可查附表7(H界值表)得到P值。若 k>3或ni>5时,H值的分布近似于自 由度为k-1的χ2分布,此时可查附表 4χ2界值表得到P值。最后按P值作出 推断结论。
非参数检验综合概述PPT(30张)
•
9、别再去抱怨身边人善变,多懂一些道理,明白一些事理,毕竟每个人都是越活越现实。
•
10、山有封顶,还有彼岸,慢慢长途,终有回转,余味苦涩,终有回甘。
•
11、人生就像是一个马尔可夫链,你的未来取决于你当下正在做的事,而无关于过去做完的事。
•
12、女人,要么有美貌,要么有智慧,如果两者你都不占绝对优势,那你就选择善良。
多个独立样本的非参数检验
例3 14名新生儿出生体重按其母亲的吸烟习惯分组(A组: 每日吸烟多于20支;B组:每日吸烟少于20支;C组:过去 吸烟而现已戒烟;D组:从不吸烟),具体如下。试问四个 吸烟组出生体重分布是否相同?数据见npc.sav:
A组: 2.7 2.4 2.2 3.4 B组: 2.9 3.2 3.2 C组: 3.3 3.6 3.4 3.4 D组: 3.5 3.6 3.7
两独立样本的非参数检验 (2) 检验统计量
分析结果
给 出 Mann-Whitney U 、 Wilcoxon W 统 计 量 和 Z 值 , 近 似 值 概 率 (Asymp.Sig)和精确概率值(Exact.sig)均小于0.05,结论一致,表明 猫、兔在缺氧条件下的生存时间的差异具有统计学意义,由平均秩次猫 (15.7)、兔(7.96)来看,可以认为缺氧条件下猫的生存时间长于兔。
•
3、命运给你一个比别人低的起点是想告诉你,让你用你的一生去奋斗出一个绝地反击的故事,所以有什么理由不努力!
•
4、心中没有过分的贪求,自然苦就少。口里不说多余的话,自然祸就少。腹内的食物能减少,自然病就少。思绪中没有过分欲,自然忧就少。大悲是无泪的,同样大悟无言。缘来尽量要惜,缘尽就放。人生本来就空,对人家笑笑,对自己笑笑,笑着看天下,看日出日落,花谢花开,岂不自在,哪里来的尘埃!
非参数检验
➢ 编秩:数据相等则取平均秩,
➢ 求秩和
➢ 计算检验统计量H值
H 12 N(N 1)
Ri2 3( N 1) ni
出生体重(kg)xij ABCD
相应秩次 Rij A BCD
2.7 2.9 3.3 3.5
3
4
7 11
2.4 3.2 3.6 3.6
2 5.5 12.5 12.5
2.2 3.2 3.4 3.7
χ 2 12
R
2 i
3(N1)
N(N1) ni
χ2
12 14(14 1)
152
4
152 3
37.52 4
37.52 3
3(14
1)
χ 2 9.375
χ
2 c
1
χ2
(t
3 j
t
j
)
n3 n
1
(23
9.375 2) (33 3) (23
143 14
2)
9.50
四、随机区组设计资料的秩和检验 (Friedman test)
正态近似法
如果n1或n2-n1超出附表的范围,可按下式 计算u值:
u | T n1(N 1) / 2 | 0.5 n1n2 (N 1) / 12
在相同秩次较多时,应用下式进行校正:
uC u / C
C 1
(t
3 j
t
j
)
/(N
3
N)
tj为第j组相同秩次的个数
频数表资料(或等级资料)两样本资料比较
xi (2) 86 71 77 68 91 72 77 91 70 71 88 87
12 对双胞胎兄弟心理测试结果
后出生者得分 差 值
第13章 有序分类变量的统计推断——非参数检验
第13章有序分类变量的统计推断— —非参数检验
13.1 非参数检验概述 13.2 两个配对样本的非参数检验 13.3 两个独立样本的非参数检验
13.1 非参数检验概述
13.1.1 非参数检验的意义 13.1.2 非参数检验预备知识
13.1.1 非参数检验的意义
非参数检验(nonparametric testing)是指 在总体不服从正态分布且分布情况不明 时,用来检验数据资料是否来自同一个 总体假设的一类检验方法。由于这些方 法一般不涉及总体参数故得名。 这类方法的假定前提比参数性假设检验 方法少的多,也容易满足,适用于计量 信息较弱的资料且计算方法也简单易行, 所以在实际中有广泛的应用。
13.1.2 非参数检验预备知识
例如我们有下面数据
Xi 15
Ri 7
9
5
18
9
3
1
17
8
8
4
5
2
13
6
7
3
19
10
这下面一行(记为Ri)就是上面一行数 据Xi的秩。
13.1.2 非参数检验预备知识
利用秩的大小进行推断就避免了不知道 背景分布的困难。这也是非参数检验的 优点。 多数非参数检验明显地或隐含地利用了 秩的性质;但也有一些非参数方法没有 涉及秩的性质。
13.2.2
分析实例
例13.1 一家日用化工企业拟采用两种去 污配方生产新型去污剂,于是挑选了一 系列沾染污渍物件进行测试,其中一项 是对清除不同污渍所需时间的测试,技 术人员想知道它们在这方面的功效是否 有差别。 数据见npara1.sav
卫生统计学第二版习题册方积乾答案与解析
卫生统计学第二版习题册方积乾答案与解析第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。
2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。
3、举例说明小概率事件的含义。
答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施;(2)不能随机分组;(3)很难控制干扰因素;(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便:缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。
(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小:缺点是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计:缺点是事先要进行分层,操作麻烦。
(4)整群抽样:优点是易于组织和操作大规模抽样调查:缺点是抽样误差大。
3、调查设计包括那些基本内容?答:(1)明确调查目的和指标;(2)确定调查对象和观察单位;(3)选释调查方法和技术;(4)估计样本大小;(5)编制调查表;(6)评价问卷的信度和效度;(7)制定资料的收集计划;(8)指定资料的整理与分析计划;(9)制定调查的组织措施。
4、调查表中包含那几种项目?答:(1)分析项目直接整理计算的必须的内容;(2)备查项目保证分析项目填写得完整和准确的内容;(3)其他项目大型调查表的前言和表底附注。
医学统计学-非参数检验秩和检验
正态近似法 当n>50,可采用正态近似法,计
算u值。
T -n(n+1)/4-0.5 u=
n(n+1)(2n+1)/24
正态近似法
若相同秩次较多,应作校正计算。
T-n(n+1)/4-0.5
检验
诊断试验ROC曲线分析
配对设计差值比较的符号秩和检验 由Wilcoxon1945年提出,又称 Wilcoxon符号秩和检验,常用于检验 差值的总体中位数是否等于零。
分析步骤:
(1)建立检验假设,确定检验水准 Ho:差值总体中位数Md=0 H1:差值总体中位数Md≠0 α=0.05
(2)编秩:
依赖于特定分布类 型,比较的是参数
不受分布类型的影响,比 较的是总体分布位置
优点:方法简便、易学易用,易于推广使用、 应用范围广;可用于参数检验难以处理的资料 (如等级资料,或含数值“>50mg”等 )
缺点:方法比较粗糙,对于符合参数检验条件者,采用 非参数检验会损失部分信息,其检验效能较低;样本含 量较大时,两者结论常相同
例2 9名 肺炎病人的治疗结果:
疗效
治愈 治愈 死亡 无效 治愈 有效 治愈 有效 无效
秩次
12 9 7 3 5 4 6 8
平均秩次 2.5 2.5 9 7.5 2.5 5.5 2.5 5.5 7.5
SPSS中的菜单位置
基于秩次的非参数检验
• 两个独立样本比较的非参数检验 • 多个独立样本比较的非参数检验 • 配对样本比较的非参数检验 • 随机区组设计多个样本比较的非参数
13六西格玛黑带 非参数检验
② minitab:Mann Whitney检验 6
B
202
9
符 号 检 验
M W W
符 号 秩 检 验 相多 等样 的本 检均 验值
Wilcoxon
2-续.穆德(Mood)中位数检验法
员工 工艺 全厂排名 混合样本秩
Mood1中位数检验A: 名次 与 培训8方法
1
名次 的4 Mood 中位A数检验 21
“+”:对A的偏好;“-”对B的偏好;
0.0029 0.0192
0.0161
0.0537 0.1208 0.1934
在H0为真的情况下, 加号的个数服从
p=0.50的二项分布
0.2256
0.1934 0.1208 0.0537
0.0192+0.0192=0.0384 若加号个数<3或>9, 则拒绝H0.
目录
1 符号检验 2 曼-惠特尼-威尔科克森检验 3 威尔科克森符号秩检验 4 多样本均值相等的检验
3.威尔科克森符号秩检验
单总体均值的检验
Z检验、t检验
基本条件: 正态总体
符号检验
精度不高,容易犯第二类错误
威尔科克森 符号秩检验
分布非正态
单个总体的中位数检验 均值等于给定值的检验 (分布对称) 配对检验 (单总体均值是否为0)
员工B工艺全培厂训排M名a42nnN-W中h位itAAn数ey
检验和2置1 信区间: 52
A,
B2 3
1 T=1+2+83+5=11 5
2 (Tmin=512+2+3+4=106;
3 T查ma表x=6:+171+2T8+L=91=320,)T7U=28,
第12讲 相关样本(多样本)非参数检验
Q
2 (k 1)[k C 2 ( C ) j ] j
k C j Ri2
~ 2 (k 1)
Q=0.529
在0.05显著性水平下,可用R软件求出临界值
ห้องสมุดไป่ตู้
2 0.95
(3) 7.81
Q小于临界值,接受原假设,认为评者间差异不显著。
2 d
• 1提出假设: • 2计算统计量: • 其中,
2 Sd
2.56
2 ( d d ) i
n 1
3.972
d 2.93
查T分布表,得临界值为2.3,所以,t的绝对值大于2.3,落入拒绝域,认为改 制前后的竞争力有显著差异。
2问解题过程:
由上表可知,S+ =1, S- =7,可以初步判断,正数的个数太少,前后差别显著。 准确判断可查符号检验临界值表,下页。 结论:接受原假设,认为没有显著差异。 若企业先后进行了两种改革,一是承包制(改制1),二是股份制(改制2), 还是判断前后竞争力有无显著差异,又该如何做?
对于K个相关样本,原假设是:
H0:这K个样本的所有位置参数都相同。 1、对每一行排序求秩,有结时用平均秩。 2、计算每一个样本的秩和。
R j rank ( xij ), j 1, 2,..., k
i 1
其中, n是每个样本的大小,因为是相关样本,所以n相同。
n
3、求每个样本的平均秩: j 4、(无结时)统计量为:
若企业先后进行了两种改革一是承包制改制1二是股份制改制2还是判断前后竞争力有无显著差异又该如何做
引例: 改制前后,某厂八个车间竞争性的比较:
1假设总体是正态分布,问改革后,竞争性有无显著差异?2若不是正态分布,又 如何?说出解题思路。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学
STATISTICS (第三版)
结的处理
(ties)
很多情况下,数据中会出现相同的观测值,那么 对它们进行排序后,这些相同观测值的排名显然 是并列的,也就是说它们的秩是相等的,这种情 况被称为数据中的“结” 对于结的处理,通常是以它们排序后所处位置的 平均值作为它们共同的秩 当一个数据中结比较多时,某些非参数检验中原 假设下检验统计量的分布就会受到影响,从而需 要对统计量进行修正 ( 一般情况下,软件会自动 作出修正)
统 计 学
(第三版)
2008
作者 贾俊平
统计学
STATISTICS (第三版)
统计名言
对正确问题的近似答案,胜过对 错的问题的精确答案。
——John W.Tukey
13 - 2 2008年8月
第 13 章 非参数检验
13.1 单样本的检验 13.2 两个及两个以上样本的检验 13.3 秩相关及其检验
2008年8月
13 - 13
统计学
STATISTICS (第三版)
总体分布类型的检验
(K-S检验)
【例 13.2】沿用第 7 章的例 7.7 。对某汽车配件提 供商提供的 10 个样本进行检测,得到其长度 数据如下(单位:cm)
12.2 12.4 10.8 11.3 12.0 12.2 11.8 12.0 11.9 12.3
用SPSS进行符号检验
13 - 20 2008年8月
统计学
STATISTICS (第三版)
中位数的符号检验
(SPSS sign test)
【例13.3】SPSS的输出结果
零件长度小于等于中位数的有 10个,大于中位数的只有6个。 而参数为 (16,0.5) 的二项分布变量大于等于 15 的概率为 0.227 。精确双尾概率为 P=0.454>0.05,不拒绝原假设。没有证据 表明该企业生产零件的实际中位数与15cm有显著差异
统计学
STATISTICS (第三版)
学习目标
非参数检验及其用途 单样本的非参数检验方法 两个及以上样本的非参数检验方法 秩相关及其检验方法 用SPSS进行非参数检验 非参数检验与参数检验的比较
13 - 4 2008年8月
统计学
STATISTICS (第三版)
不同商圈的报纸发行量是否有差异?
13 - 6 2008年8月
第 13 章 非参数检验
13.1 单样本的检验
13.1.1 总体分布类型的检验 13.1.2 中位数的符号检验 13.1.3 Wilcoxon符号秩检验
13.1 单样本的检验 13.1.1 总体分布类型的检验
统计学
STATISTICS (第三版)
总体分布类型的检验
(二项分布检验)
13.1 单样本的检验 13.1.2 中位数的符号检验
统计学
STATISTICS (第三版)
中位数的符号检验
(sign test)
13 - 18
检验总体中位数是否等于某个假定的值 设一个随机样本有n个数据,总体中位数的实际值为M, 假设的总体中位数值为 M0 。当样本中的数据大于假设的 中位数时,用“+”号表示,小于假设的中位数时,用“-” 表示;对于恰好等于假设的中位数的数据予以剔出 若关心实际的M与假设的M0是否有差别,应建立假设 H0: M=M0 ; H1: M≠M0 计算检验统计量 S+ 和S-。S+表示每个样本数据与 M0与差 值符号为正的个数; S- 表示每个样本数据与 M0 差值符号 为负的个数 计算P值并作出决策。若P<,拒绝原假设
13 - 24 2008年8月
统计学
STATISTICS (第三版)
Wilcoxon符号秩检验
(Wilcoxon signed ranks test)
检验总体参数(如中位数)是否等于某个假定的 值。它是对符号检验的一种改进,弥补了符 号检验的不足,要比单纯的符号检验更准确 一些(对应的参数检验—单样本均值检验) 检验步骤
用SPSS进行二项分布检验
13 - 11 2008年8月
统计学
STATISTICS (第三版)
总体分布类型的检验
(SPSS binomial test)
【例13.1】SPSS的输出结果
表中的合格品的观察比例为0.8,检验比例为0.9。精确单尾概 率为 0.098 ,它表示如果该批产品的合格率为 0.9 ,那么 25 个 产品中合格品数量小于等于 20 个的概率为 0.098 。 P>0.05, 不 拒绝原假设,没有证据表明该批产品的合格率不是0.9
检验该供货商生产的配件长度是否服从正态分 布?(=0.05)
13 - 14
2008年8月
统计学
STATISTICS (第三版)
总体分布类型的检验
(SPSS K-S检验)
第1步:选择【Analyze】【Nonparametric
Test】【1-Sample K-S】进入主对话框 第2步:将待检验的变量选入【Test Variable List】(本例为“配件长度”) 第3步:点击【Exact】,并在对话框中选择 【Exact】,点击【OK】
2008年8月
统计学
STATISTICS (第三版)
中位数的符号检验
(sign test)
【例13.3】某企业生产一种零件,规定其长度的中位 数为15厘米,现从某天生产的一批零件中随机抽 取16只,测得其长度(单位:cm)如下
15.1 14.5 14.8 14.6 15.2 14.8 14.8 14.6
15
59 10 50
291 126 250
218 42 89
10 196 8
67 60 52
39
22 53 47 144 151 181 78 11 23 93
118
103 20 77 217 151 90 3 139 18 30
289
40 171 35 171 109 51 64 13 62 92
用SPSS进行K—S检验
13 - 15 2008年8月
统计学
STATISTICS (第三版)
总体分布类型的检验
(SPSS K-S检验)
【例13.2】SPSS的输出结果
精确双尾概率为0.602>0.05,不拒绝原假设。没有证据 表明该供货商提供的汽车配件长度不服从正态分布
13 - 16 2008年8月
统计学
STATISTICS (第三版)
总体分布类型的检验
(SPSS binomial test)
第1步:指定“频数”变量:点击【Data】【WeightCases】,将“频数”选入【Frequency Variable】 【OK】 第2步:选择【Analyze】【Nonparametric Tests-Binomial】选项进入主对话框 第3步:将待检验的变量选入【Test Variable List】(本例为“合格品”) 第4步:在【Test Proportion】中输入检验的概率 (本例为0.9),点击【OK】
2008年8月
13 - 12
统计学
STATISTICS (第三版)
总体分布类型的检验
(K-S检验)
单样本的 K-S 检验 (Kolmogorov-Smirnov 检验 ) 是用来 检验抽取样本所依赖的总体是否服从某一理论分布 其方法是将某一变量的累积分布函数与特定的分布进 行比较。设总体的累积分布函数为F(x),已知的理论 分布函数为F0(x) ,则检验的原假设和备择假设为 H0: F(x)=F0(x) ; H1: F(x)≠F0(x) 原假设所表达的是:抽取样本所依赖的总体与指定的 理论分布无显著差异 SPSS 提供的理论分布有正态分布、 Poisson 分布、 均匀分布、指数分布等
14.8 15.1 15.3 14.7 15.0 15.2 15.1 14.7 检验该企业生产零件的中位数与15cm是否有显著 差异?(=0.05)
13 - 19
2008年8月
统计学
STATISTICS (第三版)
中位数的符号检验
(SPSS sign test)
第1步:选择【Analyze】【Nonparametric Tests-Binomial】选项进入主对话框 第2步:将待检验的变量选入【Test Variable List】(本例为“零件长度”) 第3步:点击【Define Dichotomy】,中在【Cut point】框中输入总体中位数的假设值15, 在【Test Proportion】框内输入二项分布的参 数0.5,点击【OK】
P( X x) C nx p x q n x
若“成功”的次数的概率小于给定的显著性水平,则拒绝原 假设,表明抽取样本所依赖的总体与特定概率为 p的二项分布 有显著差异(样本数据不是来自某个特定概率为p的二项分布)
2008年8月
13 - 9
统计学
STATISTICS (第三版)
总体分布类型的检验
二项分布检验(binomial test)是通过考察二分类变量的每个类 别中观察值的频数与特定二项分布下的期望频数之间是否存 在显著差异,来判断抽取样本所依赖的总体是否服从特定概 率为P的二项分布 二项分布检验的原假设是:抽取样本所依赖的总体与特定的 二项分布无显著差异 根据二项分布知识,一个服从二项分布的随机变量,在n次试 验中,出现“成功”的次数的概率为
计算各样本观察值与假定的中位数的差值, 并取绝对值 将差值的绝对值排序,并找出它们的秩 计算检验统计量和P值,并作出决策
13 - 25 2008年8月