非参数统计 秩相关分析和秩回归

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

从而Kendall协同相关系数W可以表示为:
1 n Ri. n Ri. i 1 W i 1 SST
n 2
R
i 1
n
2 i.
k 2 n(n 1) 2 / 4
k 2 ( n 3 n) /12
k 实际检验时,可以查零分布表,在n固定, 时:
变量1 样本(秩) x11(R11) x21(R21) … xn1(Rn1) 变量2 …… x12(R12) x22(R22) xn2(Rn2) 变量k x1k(R1k) x2k(R2k) xnk(Rnk) 和 R1. R2. … Rn.
H0 : k个变量不相关 H1 : k个变量相关
每列的秩和为:
A1 … Ar 行和
r n11 n22 ... nrr 一致性的度量公式: Po pii n i 1
Kappa一致性检验
与一致性相反的是独立性。
Pe pi. p.i
i 1
r
Kappa统计量:
Po Pe K 1 Pe
(Kappa系数)
特别,当Po=1,则K=1,显然非对角线上的元素都为0, 这时,一致性非常好。若Po=Pe,则K=0,则认为一致性较 差。具体一致性程度的划分为三种:
第二节 Kendall相关检验

计算Kendall秩相关系数
31 5 0.722 9 *8 / 2

即双胞胎儿童间的智力相关程度为0.722
多变量Kendall协同系数检验
Kendall协同相关系数用于考察多个变量之间的相关性。 例如,歌手大赛中,评委对歌手的评分是否一致?变量 之间的协同系数检验也是以多变量的秩检验为基础的。
检验员2 检验员1 优等 合格 不合格
优等
17 5 10
合格
4 12 3
不合格
8 0 13
合计 29 17 26
合计
32
19
21
72
问两个检验员检验结果是否一致?
Kappa一致性检验
一般的 r×r联列表: B1 p11 … pr1 p.1 …… … … … Br p1r … prr p.r
列和
p1. … pr. p..
60
第二节 Kendall相关检验
(xi,yi) 63,60 68,64 70,65 71,80 77,76 85,81 86,88 87,72 91,96 (xi,yi)以下的一 致对 8 7 6 3 3 2 1 1 0 Nc=31 (xi,yi)以下的非一 致对 0 0 0 2 1 1 1 0 0 Nd=5
1 n 1 n R i )(Qi i1 Qi )] n i 1 n rs n n 1 n 1 n (R i i 1 R i ) 2 i 1 (Qi i 1 Qi ) 2 i1 n n
i1[(R i
n
秩相关系数可简化为: rs 1
6 n(n 2 1)

n
在出现打结的时候,需要使用修正公式计算。
例7.1
解答
t 0.01 (10) 3.169
c0.01 (12) 0.727
t 0.01/2 (10) 3.169
Kendall 相关系数及检验
Kendall(1938)提出一种类似于Spearman秩相关的检验方法, (x j , y j ) 从两变量 是否协同(concordant)来检验变量之间的相关性。 首先引入协同的概念: 若 (x j x i )(y j yi ) 0 , j i 则称数对 (xi , yi ) 和(x j , y j ) 协同。
第七章 秩相关分析和秩回归
相关系数的度量百度文库
常用的相关系数有三种:
1. Pearson相关系数
r
( x x )( y y )
i 1 i i
n
( xi x )
i 1
n
2
( yi y ) 2
i 1
n
2. Spearman秩相关系数
rs
( R R )(Q Q)
若 (x j xi )(y j yi ) 0 , j i 则称数对 (xi , yi ) 和 (xi , yi )不协同。
H0 : X与Y不相关 H1 : X与Y正相关.
N c 表示协同的 数对的数目, 表示不协同的数对数目。则 Kendall Nd 系数定义为:
Nc Nd Nc Nd 2S N c N d n(n 1) / 2 n(n 1) 2 n sign((x i x j )(yi y j )) n(n 1) 1i j
解答
> Po<-PA[1,1]+PA[2,2]+PA[3,3] > Po [1] 0.5833333 > Pe<-sum(cPA*rPA) > Pe [1] 0.3466435 > K<-(Po-Pe)/(1-Pe) >K [1] 0.3622675 (较低)
一元线性回归

多元线性回归
练习: 双胞胎儿童间的智力相关程度分析。 某幼儿园对9对双胞胎的智力进行测验,并按百分制 打分。现将资料列示如表 :

双胞胎的对数编号 (i) 先出生的儿童(xi) 后出生的儿童(yi) 1 86 88 2 77 76 3 68 64 4 91 96 5 70 65 6 71 80 7 85 81 8 87 72 9 63
拒绝H0, 体重与肺活量有关系.
1 0 38 7
x<-c(75,95,85,70,76,68,60,66,80,88) y<-c(2.62,2.91,2.94,2.11,2.17,1.98,2.04,2.2,2.65,2.69) cor.test(x,y,meth="kendall")
第二节 Kendall相关检验
当Z Z0.025 1.96, 则K 0

检验员2 检验员1 优等 合格 不合格 合计
优等 合格
不合格 合计
17 5
10 32
4 12
3 19
8 0
13 21
29 17
26 72
解答
>A [,1] [,2] [,3] [1,] 17 4 8 [2,] 5 12 0 [3,] 10 3 13 > PA<-A/sum(x) > PA [,1] [,2] [,3] [1,] 0.23611111 0.05555556 0.1111111 [2,] 0.06944444 0.16666667 0.0000000 [3,] 0.13888889 0.04166667 0.1805556 > rPA<-rowSums(PA) > cPA<-colSums(PA)
(R i Qi ) 2
i 1
n
检验
在零假设成立时,
n2 T rs 1 rs2
服从自由度为 n 2的t分布。 t , 时表示正相关。在 T 存在重复数据的时候,可以采用平均秩,结不多的时候, T仍然可以采用。 在大样本情况下,可以采用正态近似进行检验:
n 1rs N(0,1)
Kappa一致性检验
实际问题:
1) 两家不同医院的专家对同一X光片会诊诊断结果是否 一致?
2) 公司的两个部门领导对一个项目的鉴定意见是否一 致? ……
H0 : 两种方法不一致 H1 : 两种方法一致
Kappa一致性检验
按光洁程度将产品分为三类: 优等品、合格品和不合格
品。两位检验员分别对72件产品进行检验,检验结果如下:
多元线性回归系数估计

X1=c(-0.05, 0.25,0.60,0, 0.25,0.20, 0.15,0.05,-0.15, 0.15, 0.20, 0.10,0.40,0.45,0.35,0.30, 0.50,0.50, 0.40,-0.05, -0.05,-0.10,0.20,0.10,0.50,0.60,-0.05,0, 0.05, 0.55) X2=c( 5.50,6.75,7.25,5.50,7.00,6.50,6.75,5.25,5.25,6.00, 6.50,6.25,7.00,6.90,6.80,6.80,7.10,7.00,6.80,6.50, 6.25,6.00,6.50,7.00,6.80,6.80,6.50,5.75,5.80,6.80) Y=c( 7.38,8.51,9.52,7.50,9.33,8.28,8.75,7.87,7.10,8.00, 7.89,8.15,9.10,8.86,8.90,8.87,9.26,9.00,8.75,7.95, 7.65,7.27,8.00,8.50,8.75,9.21,8.27,7.67,7.93,9.26) lm.sol<-lm(Y~X1+X2) summary(lm.sol)
pi I{d j d i }, P pi
j i n i 1 n
q i I{d j d i }, Q q i
j i i 1

PQ n(n 1) / 2
例7.2
d1,d2,……,
d10
Nc=38, Nd=7
tao=2*31/90=0.6889 结论:
i 1 i i
n
( Ri R )
i 1
n
2
(Qi Q ) 2
i 1
n
3. Kendall τ相关系数

Nc Nd N Nd c N c N d n(n 1) / 2 2 n sign(( xi x j )( yi y j )) n(n 1) 1i j
i
i 1
n
n(n 1) 2
分析: 如果各个变量之间具有协和一致性, 会出现某行的行 和Ri.较大或较小。因此各行的秩和可能相差很大。
1 Ri. Ri. , n i 1 i 1
n n 2
1 n kn( n 1) 其中R.. Ri. n i 1 2
n 这样的样本共有 2 n(n 1) / 2 个数对,用
其中 S Nc Nd ,易知 1 1
在 取大值的时候拒绝. H 0 具体检验时可以查零分布表, 大样本时可以采用正态近似。打结情况下用正态修正。
另一种转换形式: 将X的数据由小到大排序, 由于协同性考虑Y的秩, 记为: d1,d2,…,dn, 计算
1) K 0.4, 3) K 0.8
较低 较高
2)0.4 K 0.8 中度
Kappa一致性检验
理论上可推导
var( K ) 1 [ Pe Pe2 pi. p.i ( pi. p.i )] n(1 Pe )2 i
则正态近似
Z
K ~ N (0,1) var( K )
k(n 1)W 2 1 n
拒绝域:{W>c}
当样本中有结点时,采用修正的Kendall协和系数
W
c
R
g
2 i.
k 2 (n 3 n) k T 12
3 i
( R i. ) / n
2
T (
i )
例7.3
> x1<-c(41,43,39.5,38,40.5,41,40,38.5,44,39) > x2<-c(55.7,56.3,54.5,54.2,55.1,55.4,54.5,54.2,56.9,54.5) > x3<-c(8.6,9.2,8,5.6,6.8,8,8.6,7.4,9.8,7.4) > y1<-rank(x1) > y2<-rank(x2) > y3<-rank(x3) > Rh<-y1+y2+y3 > SSR<-sum(Rh*Rh)-(sum(Rh))^2/10 > SSR [1] 657.5 > Wc<-12*SSR/(9*(10^3-10)-3*(5*(2^3-2)+(3^3-3))) > ka<-3*(10-1)*Wc > qchisq(0.95,9) [1] 16.91898 %查表值 > ka [1] 24.35185 %计算值 (拒绝H0, 三个因素一致相关)
7.1 Spearman秩相关系数及检验
检验问题 设样本 (X, Y) {(X1, Y1 ),,(X n , Yn )} 来自总体
F(x, y) :
H0 : X与Y不相关 H1 : X与Y正相关.
设 R i 是 X i 在 (X1 , X2 ,, Xn ) 中的秩,Q i 是 Yi 在 (Y1 , Y2 , , Yn )中 的秩。Spearman秩相关系数:
相关文档
最新文档