非参数统计讲义五--相关性度量
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
-1
1
1
1
-1
Nd乘积为 负的个数。
1
1 -1
1
1百度文库-1
NC N D 8 2 8-2 = - = =0.6 2 C5 10 10 10
86 77 68 91 70 71 85 87 63
88 76 64 96 65 80 81 72 60
X<-c(86, 77, 68, 91, 70, 71, 85, 87, 63) Y<-c(88, 76, 64, 96, 65, 80, 81, 72, 60) cor.test(X, Y, method = "kendall")
Kendall相关系数
Kendall Tau-b相关系数,有结修正公式 非参数的相关系数,比较成对观测样本.
r
(sgn(xi
x j )sgn(y i y j ))
(T0 T1 )(T0 T2 )
X
Y
7
1 3
17. 5 1.5 17
一、对X从小到大排序,
二、对Y计算SIGN(G3-1.5)
proc corr data= nc spearman; var x; with y; run;
X Y 86 88
SIGN(XI-XJ)
-1 -1 1 1
SIGN(YI-YJ)
-1 -1 1 -1 -1
77 76 68 64
91 96 87 72
C 5* 4 / 2 10
2 5
Nc乘积为 正的个数。
…
… … …
xn
yn Rxn Ryn
Charles Spearman秩相关系数
r
( RX
) (RX I RX(RYI RY )
2 I
RX ) RYI RY ) (
2
1
n(n2 1)
6 di2
RXi秩 RYi秩 Di=Rxi-Ryi
第二个公式只有无节时成立。
最大积雪深度X 5.10 3.50 7.10 6.20 8.80 7.80 4.50 5.60 8.00 6.40
Y
Sp earman's rho
X
Y
**. Co rrelation i s si gnificant at th e 0.01 level (2 -tailed).
一、两个分类变量的相关
二、两个顺序变量有相关
三、分类变量与顺序变量的相关
四、mobiphon
分 类 变 量
有 序 变 量
155 127 131 153 180 144 189 172 160 170 176 179 163 173
33 38 10 57 89 42 70 78 23 68 77 58 63 89
RX
3 1 7 5 10 8 2 4 9 6
RY
2 1 7 5 9 8 3 4 10 6
Sp earman's rho X
Corre lations RANK of X RANK of Y RANK of X Pe arson Correla tion 1 .976** Si g. (2-tailed ) .000 N 10 10 RANK of Y Pe arson Correla tion .976** 1 Si g. (2-tailed ) .000 N 10 10 **. Co rrelation i s sig nificant at the 0.01 level (2-tailed).
3 1 7 5 10 8 2 4 9 6
2 i
2 1 7 5 9 8 3 4 10 6
6(4) rs 1 1 0.975758 2 n(n 1) 10(100 1)
6 d
1 0 0 0 1 0 1 0 1 0 4
公式只有无节时成立。
x<-c(1,2,3,4,5,6); y<-c(6,5,4,3,2,1) cor.test(x, y, method = "spearman")
SPEARMAN秩和相关(spearman rank correlation coefficient) Spearman等级相关分析 秩相关的Spearman等级相关分析 秩相关(rank correlation)又称等级相关
X
Y RX RY
x1
y1 Rx1 Ry1
x2
y2 Rx2 Ry2
x3
y3 Rx3 Ry3
一、Spearman相关
二、Kendall 相关
三、Cronbach系数
四、定性数据相关,
Pearson相关
(1)用于度量线性关系,
(2)用于连续数据
rxy
(x
i 1
n
i
x )(y i y )
2
(x
i 1
n
i
x ) (y i y )
i 1
n
2
s xy sxsy
sum= n(n-1)/2= 9*8/2=36
7 17.5 8 6 9 18
1
26
26/36
例:研究温度与产品采收率之间的关系,10次试 验结果,计算spearman, Kendall相关系数
温度 45
52 54 63 62 68 75 76 92 88
成品采 收率 100 111 120 133 140 152 160 171 180 195
r 2 1/2 1/2 t (n 2) ( ) 2 1r
非参数相关 (1)用于度量单调关系(不一定线性),相 依关系度量(measures of association)
(2)可用于定序数据,适用于某些不能准确 地测量指标值而只能以严重程度、名次先后、 反映大小等定出的等级资料,也适用于某些 不呈正态分布或难于判断分布的资料。
1 2 3 4 5 2 4 7 1 6 400 360 300 295 280
6
7 8 9 10
3
10 9 8 5
350
200 260 220 385
data nc ; input x y @@; datalines;
2 6 8 400 4 280 3 220 5 360 7 350 10 385 300 1 200 9 295 260
Y
**. Co rrelation i s si gnificant at th e 0.01 level (2 -tailed).
X
Y
RX
RY
d2
5.1 3.5 7.1 6.2 8.8 7.8 4.5 5.6 8 6.4
1907 1287 2693 2373 3260 3000 1947 2273 3313 2493
Corre lations Ke ndall's tau _b X Co rrelation Coefficient Si g. (2-tailed ) N Co rrelation Coefficient Si g. (2-tailed ) N Co rrelation Coefficient Si g. (2-tailed ) N Co rrelation Coefficient Si g. (2-tailed ) N X 1.000 . 10 .911** .000 10 1.000 . 10 .976** .000 10 Y .911** .000 10 1.000 . 10 .976** .000 10 1.000 . 10
data nc ;
input x y @@; datalines; 162534435261 proc corr data= nc spearman;
var x;with y;run;
例: 某公司想要知道是否职工期望成为好的销售员而实 际上就能有好的销售记录。为了调查这个问题,公司的 副总裁仔细地查看和评价了公司10个职工的初始面试摘 要、学科成绩、推荐信等材料,最后副总裁根据他们成 功的潜能给出了单独的等级评分。二年后获得了实际的 销售记录,得到了第二份等级评分,见表 中所示。统 计问题为是否职工的销售潜能与开始二年的实际销售成 销售成绩 绩一致。 职工编号 潜能等级rx Y
灌溉面 积Y 1907.00 1287.00 2693.00 2373.00 3260.00 3000.00 1947.00 2273.00 3313.00 2493.00
X
5.1 3.5 7.1 6.2 8.8 7.8 4.5 5.6 8 6.4
Y
1907 1287 2693 2373 3260 3000 1947 2273 3313 2493
8
2 6 9 5 4
6
2 5 18 4 3
三、=SIGN(G3-1.5)
四、求符号和sum
五、组合数n(n-1)/2
六、T=Sum/(n(n-1)/2)
X
Y
=SIGN(G31.5)
=SIGN(G4-2
=SIGN(G517)
1 2 3 4 5 6
1.5 2 17 3 4 5
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 -1 -1 -1 1 -1 1 1 1 1 1 1 1 1 1 1 1 1 1 -1 1
Corre lations Co rrelation Coefficient Si g. (2-tailed ) N Co rrelation Coefficient Si g. (2-tailed ) N X 1.000 . 10 .976** .000 10 Y .976** .000 10 1.000 . 10