相关测量法与讲解学习
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
c d ,即b: c ad ac bd
•
即无论X1怎么变,Y1和Y2的
值始终是一致的。
• (请回顾PRE的涵义及其计算过程!! 2020/6/20
2×2表的相关测量
• 对于2×2表,差值(ad-bc)的大 小,反映了变量关系的强弱。
• 2×2表可以运用系数和Q系数来测量 相关程度,两者都是以差值(ad-bc) 为基础进行讨论的。同时,也都是把关 系强度的取值范围定义在[-1,+1]之间 。但对什么情况算作关系最强,系数和 Q系数的测定有所不同。
一、2×2表——Φ系数和Q系
当列联表中的两数个变量都只有二
种取值时,就称作2×2表。如下表
:
X
Y
X1
X2
Y1
A
B
Y2
C
D
A+B C+D
A+C B+D N=A+B+C+D
2020/6/20
首先分析当变量间无相关,即相 互独立时频次间的关系。
• 根据变量独立的要求有:
• •或
a b ,即a: d bc ac bd
全部感冒并不关心。 设想有如下结果:
新药 安慰药
未感冒
50
28
患感冒
0
22
2020/6/20
现在对上表计算系数和Q
系数。
5 0 2
0 .5
(5 0 2)0 8 (2)5 2 ( 0 0 )2 ( 8 2)2
•
Q=
22500 1 22500
• 这时用Q系数反映新药与 感冒的关系更为合理。
2020/6/20
如果是对称的情况,即:
•
x与y可相互预测,不分自变项
与依变项,则:
mx my(MxMy) 2N(MxMy)
2020/6/20
Lambda 相关测量的性质:
• (1) 系数的取值范围o1 ;
• (2) 具有PRE意义; • (3) 对称与不对称的情况下,有不同的公式
; • (4)具有以众数作为预测的特点,不理会众
数以外的分布; • (5) 当众数集中在一行或一列时,会使得
=0,这是 的灵敏度有问题。
2020/6/20
例1. 性别与某种社会态度的条件次
数分布表
态度
性别
男
女
总数
容忍
96
反对
24
18 114 62 86
总数 120
80 200
2020/6/20
解:性别是自变量,态度是依变量, 为不对 称关系
M y 1 ,1 m y 9 4 6 6 1 2 ,N 5 2
如下表: 如何求PRE呢?换句话说, 如何求E1和E2呢?
2020/6/20
X Y
Y1
Y2 . . . . Yr
fi
X1
X2
Xc
fj
f11
f12
f1c
f1j
f21
f22
f2c
f2j
.
.
.
.
.
.
.
.
.Fra Baidu bibliotek
.
.
.
.
.
.
.
fr1
fr2
frc
frj
fi1
fi2
fic
N
• E1=N-My
•
E: XX
2
1
判断众数次数为my1,误差
• yx
•
my My N My
158 114 0 .51 200 114
• 即表示中等相关,用x预测y(即用性别 预测态度)可以减少51%的误差。
2020/6/20
结论表 表1-2 性别对态度的影响
态度
容忍 反对 (总数)
性 男 % 80.0 20.0 (120) =0.51
别 女 % 22.5 77.5 (80)
2020/6/20
1. 系数
adbc
(ab)c(d)a(c)b(d)
2020/6/20
2×2表有如下形式, 有最小值 。
X
X1
X2
Y
Y1
0
B
Y2
C
0
0bc (ob)c(o)o(c)b(o)=-1
2020/6/20
当 1 时, 称作全相关。
• 为达到完全相关,必须做到有 一组对角线上的值都为零。总结起 来:
2020/6/20
较完整的研究结论:
• 学生的态度有显著的性别差
异,80%的男生表示容忍,
77.5%的女性表示反对,男生中
表示反对的仅20.0%,而女性中
表示容忍的仅占22.5%,用性别
预测学生的态度,可消减51%的
误差。
这样就可以了
2020/6/20
吗?为什么?
例2. 调查了100名青年人与其知心朋 友的志愿,条件次数分布如下表:
为fi1-My1;
• x x2 判断众数次数为my2,误
差为fi2-My2; • x xc 判断数次数为myc,误差
为fic-Myc;
• 2020/6/20 总误差为E2=fic-my=N-my。
进而
•
•
P
R
EE1E2
NMy(N
my)
E2
NMy
•
• PRE myMy yx (不对称
)
NMy
• ;对系于数r×和c表Q系,数有两,类仅讨适论用方于法2×。2表
• 一类是以 值X 为2 基础来讨论变量的 相关性。
• 一类是以减少误差比例(PRE)为 准则来讨论变量间的相关性。
2020/6/20
1.Lambda相关测量法
• Lambda相关测量法,又称为格特曼 的 可 预 测 度 系 数 ( Guttmans coefficient of predictability),其基本逻辑是计算以一个定 类变项的值来预测另一个定类变项的值时 ,如果以众值为预测的准则,可以减少多 少误差。消减的误差在全部误差中所占的 比例愈大,就表示这两个变项的相关愈强 。2020/6/20
那么,在一般情况下,如何选 择系数和Q系数呢?
• 取决于研究的对象。 • 当自变量的不同取值都会影响因变量
时,则应用 系 数。例如,研究性别与
报考大学类别之间的关系。 • 相反,在上述新药的研究中,控制
组服用安慰药的结果,我们并不关心, 类似这种实验性研究,应选择Q系数。
2020/6/20
二、r×c表
• 0 两变量相互独立; • 1 ,b、c同时为零或a、d同
时为零; • 1 为一般情况。
2020/6/20
2.Q系数(尤拉的Q系数)Yule`s
•
Q ad bc
ad bc
1 Q 1
•
对于 Q 系数,只要 a、b、c、d中
有一个是零,则||=1。
2020/6/20
它所对应的实际情况是,如进行配对样本的 研究,其中样本1为实验组,样本2为控制组 ,现在要研究某种新药能否预防感冒。这时 我们关心的是凡是吃了新药的人,能否全部 不感冒。而对不吃新药只吃安慰药的人是否
• 其中:My=Y变项的众值次数; • my=X变项的每个值之下y变项的众值
次数;
• 2020/6/20N=全部个案数目。
同理:
• 若以Y为自变量,X为依变量,则
•
xy
mx Mx NMx
• 其中:Mx为x变项的众值次数; • mx为y变项的每个值之x变项的众值
次数;
•
2020/6/20
N为全部个案数目。
•
即无论X1怎么变,Y1和Y2的
值始终是一致的。
• (请回顾PRE的涵义及其计算过程!! 2020/6/20
2×2表的相关测量
• 对于2×2表,差值(ad-bc)的大 小,反映了变量关系的强弱。
• 2×2表可以运用系数和Q系数来测量 相关程度,两者都是以差值(ad-bc) 为基础进行讨论的。同时,也都是把关 系强度的取值范围定义在[-1,+1]之间 。但对什么情况算作关系最强,系数和 Q系数的测定有所不同。
一、2×2表——Φ系数和Q系
当列联表中的两数个变量都只有二
种取值时,就称作2×2表。如下表
:
X
Y
X1
X2
Y1
A
B
Y2
C
D
A+B C+D
A+C B+D N=A+B+C+D
2020/6/20
首先分析当变量间无相关,即相 互独立时频次间的关系。
• 根据变量独立的要求有:
• •或
a b ,即a: d bc ac bd
全部感冒并不关心。 设想有如下结果:
新药 安慰药
未感冒
50
28
患感冒
0
22
2020/6/20
现在对上表计算系数和Q
系数。
5 0 2
0 .5
(5 0 2)0 8 (2)5 2 ( 0 0 )2 ( 8 2)2
•
Q=
22500 1 22500
• 这时用Q系数反映新药与 感冒的关系更为合理。
2020/6/20
如果是对称的情况,即:
•
x与y可相互预测,不分自变项
与依变项,则:
mx my(MxMy) 2N(MxMy)
2020/6/20
Lambda 相关测量的性质:
• (1) 系数的取值范围o1 ;
• (2) 具有PRE意义; • (3) 对称与不对称的情况下,有不同的公式
; • (4)具有以众数作为预测的特点,不理会众
数以外的分布; • (5) 当众数集中在一行或一列时,会使得
=0,这是 的灵敏度有问题。
2020/6/20
例1. 性别与某种社会态度的条件次
数分布表
态度
性别
男
女
总数
容忍
96
反对
24
18 114 62 86
总数 120
80 200
2020/6/20
解:性别是自变量,态度是依变量, 为不对 称关系
M y 1 ,1 m y 9 4 6 6 1 2 ,N 5 2
如下表: 如何求PRE呢?换句话说, 如何求E1和E2呢?
2020/6/20
X Y
Y1
Y2 . . . . Yr
fi
X1
X2
Xc
fj
f11
f12
f1c
f1j
f21
f22
f2c
f2j
.
.
.
.
.
.
.
.
.Fra Baidu bibliotek
.
.
.
.
.
.
.
fr1
fr2
frc
frj
fi1
fi2
fic
N
• E1=N-My
•
E: XX
2
1
判断众数次数为my1,误差
• yx
•
my My N My
158 114 0 .51 200 114
• 即表示中等相关,用x预测y(即用性别 预测态度)可以减少51%的误差。
2020/6/20
结论表 表1-2 性别对态度的影响
态度
容忍 反对 (总数)
性 男 % 80.0 20.0 (120) =0.51
别 女 % 22.5 77.5 (80)
2020/6/20
1. 系数
adbc
(ab)c(d)a(c)b(d)
2020/6/20
2×2表有如下形式, 有最小值 。
X
X1
X2
Y
Y1
0
B
Y2
C
0
0bc (ob)c(o)o(c)b(o)=-1
2020/6/20
当 1 时, 称作全相关。
• 为达到完全相关,必须做到有 一组对角线上的值都为零。总结起 来:
2020/6/20
较完整的研究结论:
• 学生的态度有显著的性别差
异,80%的男生表示容忍,
77.5%的女性表示反对,男生中
表示反对的仅20.0%,而女性中
表示容忍的仅占22.5%,用性别
预测学生的态度,可消减51%的
误差。
这样就可以了
2020/6/20
吗?为什么?
例2. 调查了100名青年人与其知心朋 友的志愿,条件次数分布如下表:
为fi1-My1;
• x x2 判断众数次数为my2,误
差为fi2-My2; • x xc 判断数次数为myc,误差
为fic-Myc;
• 2020/6/20 总误差为E2=fic-my=N-my。
进而
•
•
P
R
EE1E2
NMy(N
my)
E2
NMy
•
• PRE myMy yx (不对称
)
NMy
• ;对系于数r×和c表Q系,数有两,类仅讨适论用方于法2×。2表
• 一类是以 值X 为2 基础来讨论变量的 相关性。
• 一类是以减少误差比例(PRE)为 准则来讨论变量间的相关性。
2020/6/20
1.Lambda相关测量法
• Lambda相关测量法,又称为格特曼 的 可 预 测 度 系 数 ( Guttmans coefficient of predictability),其基本逻辑是计算以一个定 类变项的值来预测另一个定类变项的值时 ,如果以众值为预测的准则,可以减少多 少误差。消减的误差在全部误差中所占的 比例愈大,就表示这两个变项的相关愈强 。2020/6/20
那么,在一般情况下,如何选 择系数和Q系数呢?
• 取决于研究的对象。 • 当自变量的不同取值都会影响因变量
时,则应用 系 数。例如,研究性别与
报考大学类别之间的关系。 • 相反,在上述新药的研究中,控制
组服用安慰药的结果,我们并不关心, 类似这种实验性研究,应选择Q系数。
2020/6/20
二、r×c表
• 0 两变量相互独立; • 1 ,b、c同时为零或a、d同
时为零; • 1 为一般情况。
2020/6/20
2.Q系数(尤拉的Q系数)Yule`s
•
Q ad bc
ad bc
1 Q 1
•
对于 Q 系数,只要 a、b、c、d中
有一个是零,则||=1。
2020/6/20
它所对应的实际情况是,如进行配对样本的 研究,其中样本1为实验组,样本2为控制组 ,现在要研究某种新药能否预防感冒。这时 我们关心的是凡是吃了新药的人,能否全部 不感冒。而对不吃新药只吃安慰药的人是否
• 其中:My=Y变项的众值次数; • my=X变项的每个值之下y变项的众值
次数;
• 2020/6/20N=全部个案数目。
同理:
• 若以Y为自变量,X为依变量,则
•
xy
mx Mx NMx
• 其中:Mx为x变项的众值次数; • mx为y变项的每个值之x变项的众值
次数;
•
2020/6/20
N为全部个案数目。