第四章_相关测量法与测量层次

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2、取值范围[-1,1] 完全正相关
rs = 1
1 di = n ( n 2 − 1) ∑ 3
2
rs = −1
十个乡的经济水平与卫生水平
队名 A B C D E F G H I J 经济 1 2 3 4 5 6 7 8.5 8.5 10 卫生 1 3 4 5 8 6.5 9.5 6.5 9.5 2 d
假设样本容量为n,变量x共有n个等级,分别取值为 x1,x2,x3 …,xn,变量y也有n个等级,分别取值为y1,y2,y3, …,yn。 假设每一个个案对应的x值、y值分别为:(x1,y1)(x2, y2)(x3,y3)…(xn,yn)。 2 2 2 2 2 2 ( x1 − y1 ) = d1 ;( x2 − y2 ) 它们等级差的平方分别为: = d2 ;( x3 − y3 ) = d3 …
y 高 低
x
高 n1 n3
低 n2 n4
n1n4 − n3n2 G= n1n4 − n3n2
y 高 低
x
高 a b
低 c d
ad − bc G= ad + bc
父辈文化 子辈文化 大学 中学 小学
大学
中学
小学
ns = 118(130 + 32 + 43 + 98) + 37(32 + 98) + 18(43 + 98) + 130 × 98 = 55842
73 + 76 − ( 54 + 50 ) = = 0.47 2 (100 ) − ( 54 + 50 )
3、使用条件
价值取向 物质报酬 人情关系 职业 制造业 105/72.4% 40/27.6% 服务业 45/64.3% 25/35.7% 70 总数 150/69.8% 65/30.2% 215
40(1 − 100 ) + 60(1 − 100 ) = 48(人)
当知道x与y有关系时,预测y的总误差E2:
10 40 30 20 10(1- )+40(1- )+30(1- )+20(1- )=40(人) 50 50 50 50
E1 -E 2 48-40 τ= = =0.17 E1 48
当不知道x与y有关系时,预测y的总误差E1:
四名学生的成绩等级
学生 A B C D 成绩等级 数学 4 3 2 1 英文 2 3 1 4
wenku.baidu.com
C =6
2 4
AB AC AD BC BD CD
ns = 2, nd = 4
ns + nd 2 + 4 G= = = −0.33 ns − nd 2 − 4
3、取值范围[-1,1]
nd=0 ,G=1; ns=0,G=-1 ns>nd,G>0; ns<nd,G<0
同序对数n1*(n5+n6+n8+n9)
n4的同序对数n4*(n8+n9) n2 的同序对数n2*(n6+n9) n5的同序对数n5*n9 ns= n1*(n5+n6+n8+n9)+ n4*(n8+n9)+ n2*(n6+n9)+ n5*n9 n7的异序对数 n7*(n2+n5+n3+n6) n4的异序对数n4*(n2+n3)。 n8的异序对数n8*(n3+n6) n5的异序对数n5*n3 nd= n7*(n2+n5+n3+n6)+ n4*(n2+n3)+ n8*(n3+n6)+ n5*n3
n11 n21 n31 n*1 当x与y无关时: n = n = n = K = n 1* 2* 3*
i =1
Σ max nij = max ( n* j )
c
n12 n22 n32 n*2 = = =K= n1* n2* n3* n
λy=0
y x y1 y2 … yj … yr ni*
c
x1 n11
= 57.931 + 32.142 = 90.073
τ=
E1 − E2 90.698 − 90.073 = = 0.007 E1 90.698
二、τ相关测量法
1、基本逻辑 y x 南方 面食为主 10 米食为主 40 北方 30 20 总数 40 60
50 50 100 总数 当不知道x与y有关系时,预测y的总误差E1: 40 60
145 总数 c Σ max ( n ij ) − max ( n* j ) λy = i=1 n − max ( n* j )
E1 = ∑
E2 = ∑
(n − Fy ) Fy n
=
( 215 − 150 ) *150 + ( 215 − 65) *65 = 90.698
215 215
( Fx − f ) f (145 − 105 )105 + (145 − 40 ) 40 ( 70 − 45 ) 45 + ( 70 − 25 ) 25 = + Fx 145 70
设x=x 时,Y的众值次数: max ( n2 j ) 设x=x3时,Y的众值次数: max ( n3 j ) 设x=xc时,Y的众值次数: max ( ncj )
( )
Σmax ( nij )
c i=1
E2 = n − Σ max ( n ij )
c i=1
PRE=
=
n − max ( n* j ) − [n − Σ max ( n ij )]
n − max ( n* j )
(用于分析不对称关系)
=
Σ max ( nij ) − max ( ni* )
r j =1
n − max ( ni* )
Σ max ( n ij ) + Σ max ( n ij ) − max ( ni* ) + max ( n* j )
r c
λ=
j=1
118 18 9
37 130 43
15 32 98
nd = 15(18 + 130 + 9 + 43) + 37(18 + 9) + 32(9 + 43) + 130 × 9 = 6833
ns − nd 55842 − 6833 G= = = 0.78 ns + nd 55842 + 6833
※在不知道x值的情况下,预测y值,所犯的错
误总数 E1 是多少? 就y变量来说,其众值对应的次数: max n* j 在不知道x值时,预测y值所犯的误差: E = n − max 1
( )
※在知道x值时,预测y值产生的误差 E2是多少?
设x=x 时,Y的众值次数: max n1 j
1 2
(n )
*j
n 当知道x与y有关系时,预测y的总误差E2:
E1 = ∑
(n − Fy ) Fy
E1 − E2 τ= E1
( Fx − f ) f E2 = ∑ Fx
n=样本容量 f=某条件次数 Fy=y变量的某个边缘次数 Fx=x变量的某个边缘次数
2、取值范围[0,1] 3、使用条件
三、小结与讨论
λ系数、τ系数均以消减误差比例为基础,而且 在计算过程中依据的都是列联表形式。 当列联表中各列的众值处于同一行时,λ系数永 远为0,无法准确说明两变量之间的相关关系。 此时需要选用τ系数。 各变量值比例失调时,τ系 数也要慎用。 几率比
c
E1 − E2 E1
n − max ( n* j )
i=1
=
i=1
Σ max ( n ij ) − max ( n* j )
c
n − max ( n* j )
λy =
i=1
Σ max ( n ij ) − max ( n* j )
c
r n − max ( ni* ) − n − Σ max ( nij ) j=1 λx = n − max ( ni* )
同序对、异序对、同分对?
单元 A B C D E
2 5
x 3 3 3 1 2
y 2 1 1 1 3
5 ! C = = 10 2!* ( 5-2 )!
2、基本逻辑 设有两个定序变量x、y。 个案A (xi,yi);个案B(xj,yj) 在不知道x变量时,估计或预测y变量的误差E1: ns + nd E1 = ns同序对数 nd异序对数 2 根据x变量估计或预测y变量的误差E2:E2 = nd E1 − E2 PRE = ns + nd E1 G= ns − nd ns + nd ns − nd − nd 2 2 = ns − nd = = ns + nd ns + nd ns + nd 2 2
d2
rs = 1 −
6∑ d i 2 n(n − 1)
2
6(87.5) = 1− = +0.47 2 10 (10 -1)
二、Gamma等级相关
1、基本概念 设个案A变量x和y的取值分别为xi,yi,个案B对应 的变量值分别为xj,, yj, > y ; xi > x j yi xi < x j , yi < y j j AB 同序对AB 异序对- xi < x j , yi > y j ; xi > x j , yi < y j AB x变量同分对- xi = x j , yi ≠ y j AB y变量同分对- xi ≠ x j , yi = y j AB xy变量同分对- xi = x j , yi = y j
第四章 相关测量法与测量层次
第一节 两个定类变量:λ,τ
一、λ相关测量法
1、基本逻辑 假设有x、y两个定类变量,其中x是自变量,y是因变量。 y y1 y2 … yr ni* n1r n1* n2r n2* ncr nc* n*r n x x1 n11 n12 x2 n21 n22 … xc nc1 nc2 n*j n*1 n*2
i=1
总数
理想工 作 9 41 4 54
增广见 闻 3 7 4 14
40 50 10 100
λ=
j=1
Σ max ( n ij ) + Σ max ( n ij ) − max ( ni* ) + max ( n* j ) 2n − max ( ni* ) + max ( n* j )
x2

xi

xc
n*j n11 ni2 …
ni2 ncj n2r n2r
ncj … n2r n
n11

ni2

ncj
n = Σ max ( nij )
i =1
λy=1
例题:
表1 100名青年人的性别与志愿 志愿 性别 男 快乐家庭 理想工作 增广见闻 总数
λy =
c
总数 女 30 10 0 40 40 50 10 100
(xn -yn) = d
2
2 n
斯皮尔曼等级相关系数
rs = 1 −
6∑ d i
2
2
n(n − 1)
x1 = y1; x2 = y2; x3 = y3…xn =yn
完全负相关
( x1 , y1 ) = (1, n);( x2 , y2 ) = (2, n − 1) ( x3 , y3 ) = (3, n − 2)…( xn , yn ) = (n,1)
第二节 两个定序变量
一、斯皮尔曼等级相关系数
1、基本逻辑 x-丈夫的家庭地位 y-妻子的家庭地位 (1.很低;2.较低;3.一般;4.较高;5.很高) 五对夫妇:(1,2)(2,3)(3,4)(4,5)(5, 1) 每对夫妇家庭地位等级差的平方: 2 2 (2 − 3) 2 (3 − 4) 2 (4 − 5) 2 (5 − 1) (1 − 2) 完全正相关;完全负相关
2n − max ( ni* ) + max ( n* j )
i=1
用于分析 对称关系
2、取值范围[0,1] y y1 y2 … yr ni* n1r n1* n2r n2* ncr nc* n*r n x x1 n11 n12 x2 n21 n22 … xc nc1 nc2 n*j n*1 n*2
4、利用列联表计算ns、nd y 高 中 低 x 高 n1 n2 n3 中 n4 n5 n6 低 n7 n8 n9
以n1为基础讨论:
n1 * ( n1 − 1) n1 ! = x、y变量的同分对 C = 2!* n − 2 ! 2 ( 1 )
2 n1
y的同分对数n1*(n4+n7)
x的同分对数n1*(n2+n3)
10 40 10 60
i=1
Σ max ( n ij ) − max ( n* j ) n − max ( n* j )
40 + 30 − 50 = = 0.40 100 − 50
表2:100名青年人的志愿与其朋友志愿列联表
自己志愿 (y) 快乐家庭 理想工作 增广见闻 总数
r c
知心朋友志愿(x) 快乐家 庭 28 2 2 32
相关文档
最新文档