第11讲 独立样本(多样本)非参数检验ppt课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

你会解释吗?
26
本例中,T=?
把T标准化,就得到统计量:
其中,
K
T * T T 服从标准正态分布 T
N 2 nk2
T
k 1
4
K
N (N 1)(2N 5) nk (nk 1)(2nk 5) 2A2 5A1
2 T
k 1
72
K
K
[ nk (nk 1)(nk 2)]( A2 2A1) [ nk (nk 1)]A1
P小于0.05,拒绝原假设,认为分
布不同。
21
R操作: x=matrix(c(2,3,1,4,7,0),ncol=3) chisq.test(x)
22
独立样本(多样本)非参数检验3: Jonckheere-Terpstra 检验
案例4(来源:陈希孺《非参数统计教程》P158
从三个总体中分别抽出大小为5,5,7的样本,如下:
某电信公司从3所大学招聘管理人员,从而来源于3所不同大学的雇员组成了3个独 立样本。半年试用期满了以后,人力资源部对他们进行考核,并评出了这些雇员 的表现成绩,数据在0-100之间不等。请就此评价雇员的业绩在3个总体间是否存 在差异。
14
独立样本(多样本)非参数检验2: Median 检验(中位数检验)
8
9
SPSS操作
10
点击“定义范围”,如下,再 继续,确定!
11
可看出差异较大
拒绝原假设,认为分布 不同
12
R操作
• X1=c( • X2=c( • X3=c( • X4=c( • X=list(x1,x2,x3,x4) • Kruskal.test(x)
13
案例2
文件,npara3.sav,来自张文彤《SPSS统计分析基础教程》 P290
k
Ri R i1 (N
N
N 1 ni ) 2
5、构造统计量:
H
12 N (N 1)
k i 1
ni (Ri
R)2
12 N (N 1)
k i 1
ni (Ri
N 1)2 2
思考:H=0说明什么?
实战:开头案例,计算KW统计量。
5
有结时要计算“结统计量”
设有样本:
它有两个结:X2,X4,X9都是0.20,结长为3; X1和X6都是0.45,结长为2。 其它4个值也视作特殊的结,结长为1. 结统计量计算方法:先把数据从小到大排列,
19
计算过程
• 计算出中位数=4, 左表是原始数据 右表(上)是观测频数oij
右表(下)是期望频数Eij
1组
2组
3组
5
7
2
4
3
3
6
5
3
4
6
1
6
5
2
1
1
1组
2组
3组
行合计
小于等于中位数
2
大于中位数
3
列合计
5
1组
2组
3组
行合计
小于等于中位数
2
大于中位数
3
列合计
5
可依据上表数据计算卡方统计量。
20
SPSS操作:
15
方法操作(来自SPSS帮助—算法)
设有K个连续型的独立样本,假设如下:
其中,θ是中位数
16
构建表格(Table Construction)
17
构建统计量并计算P值
即相应行合计乘以列合计比上总计 它服从K-1个自由度的卡方分布,计算统计量,然后查表,可得结 果。
18
案例3 用中位数检验做案例1
S1(1, 2)
n1是样本1的大小,n2是样本2的大小,S1是将样本1和2混合排秩后样本 1的秩和。同理,有
U13
n1n3
n1(n1 1) 2
S1 (1, 3)
n1是样本1的大小,n3是样本3的大小,S1是将样本1和3混合排秩后样本 1的秩和。同理,有
U 23
n2n3
n2
(n2 2
1)
S2 (2,3)
2
传统的非参数统计
• 单样本非参数检验
• 两样本(独立和相关)非参数检 验
• 多样本(独立和相关)非参数检

3
独立样本(多样本)非参数检验主要方法
12.1 Kruskal-Wallis H 检验
12.2 Median检验 12.3 Jonchheere-Terpstra检验
4
• KW检验方法和步骤
案例
某电信公司从3所大学招聘管理人员,从而来源于3所不同大学的雇员组成了3个独 立样本。半年试用期满了以后,人力资源部对他们进行考核,并评出了这些雇员 的表现成绩,数据在0-100之间不等。请就此评价雇员的业绩在3个总体间是否存 在差异。
1
第11讲 独立样本(多样本)非参数检验1:
Kruskal-Wallis H检验
共有6个结,结长分别为
1 1, 2 3,3 1, 4 2,5 1,6 1,
本例中,结统计量为
(1, 2 ,3, 4,5, 6 ) (1,3,1, 2,1,1)
6
有结时的KW修正统计量
Hc
q
H
(其中,q为结的个数)
1
(
3 r
r
)
/( N
3
N
)
r 1
可以证明,KW统计量服从k-1个自由度的卡方分布。
式中,K是样本数,本例是3。将公式展 开可得:
T U12 U13 U23
式中,U的下角标的第一个数是公式中的 k1,范围 是从1到2,U的下角标的第2个 数是k2,范围是从2到3
25
Uk1k 2
nk1nk 2
nk1 (nk1 2
1)
Sk1(k1, k2 )
具体到本) 2
k 1
k 1
36N (N 1)(N 2)
8N (N 1)
M
M
A1 ti (ti 1); A2 ti2 (ti 1)
i 1
i 1
t为结长,M为所有样本混合排序后结的个 数
27
部分中间结果和答案
SPSS操作,同前面克罗斯考尔-瓦利斯检验或中位数检验。 结果:
你会解释每 一个数吗?
28
作业:
可查卡方分布表,如果H落入接受域,则接受原假设,认为三个总体分布相 同;反之,则拒绝原假设,认为三个总体分布不同。
7
案例1(来源:陈希孺《非参数统计教程》P158 从三个总体中分别抽出大小为5,5,7的样本,如下:
不知总体的分布类型,请用KW检验,分析三个总体的均值是否有显著 差异,显著性水平为0.01。 友情提示:包含结
由克罗斯考尔和瓦里斯于1952年设计。
操作步骤:1、具体而言,就是把大小为n1,n2,…,nk的K个样本混合 起来(容量为N),从小到大排序,求秩。
2、对每一个样本的观测值的秩求和(Ri,i=1,2,…,k)。
3、求每个样本的平均秩,
Ri
Ri ni
(i
1, 2,..., k)
4、再求所有k个样本的总平均秩,
对案例2数据进行Jonckheere-Terpstra检验。
29
不知总体的分布类型,请问三个总体的均值是否有显著差异(用 Jonckheere-Terpstra检验)。
23
检验过程
1、对K个来自连续总体的样本,假设如下:
是位置参数 如果假设所有分布函数都相同,但只有位置参数(均值)不同,即
则原假设和备择假设变成:
这一点很常用,用于均值比较
24
至少有一个不相等
相关文档
最新文档