三种常用的不同变量之间相关系数的计算方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三种常用的不同变量之间相关系数的计算方法
1.定类变量之间的相关系数.
定类变量之间的相关系数,只能以变量值的次数来计算,常用λ系数法,
其计算公式为:
(3.2.12)
式中,为每一类x中y分布的众数次数;为变量y各分类次数的众数次数;n为总次数。一般来说,λ系数在0~1之间取值,值越大表明相关程度越高。
例如,性别与对吸烟的态度资料见表3—2。
表3—2 性别与对吸烟态度
态度y
性别x
男女合计(Fy)
容忍反对37
15
8
42
45
57
合计(Fx)52 50 102
从y的分布来看,对吸烟的态度众数是“反对”,众数次数为57,即=57。再从x的每
一个分组(男、女)中y的次数分布来看,男性中y的分布众数是“容忍”,次数为37(f1m);女性中y的分布众数是“反对”,次数为42(f2m);总次数为102(n)。于是,
从计算结果可知,性别与对吸烟态度的相关程度为0.49,属于中等相关。
2.定序变量之间的相关系数
定序变量之间的相关测量常用Gamma系数法和Spearman系数法。Gamma系数法计算公式为:
(3.2.13)
式中,G为系数;Ns为同序对数目;Nd为异序对数目。
所谓序对是指表明高低位次的两两配对,如果一对个案在变量x,y的分类表现位次一致,则为同序对;如果位次相反,则为异序对。
G系数取值在—1--十1之间。G=1,表示完全正相关;G=-1,表示完全负相关;G=0,表示完全不相关;-1 (3.2.14) 式中,P为系数;D为所测定的两个数列中每对项目之间的登记差,这个差的正值之和等于负值之和;N为项数。系数p主要代表两个定序变量的等级相关程度,其取值范围和相关程度含义与G系数相同。 3.定距变量之间的相关系数 定距变量之间的相关测量常用Pearson系数法。对于未分组资料,Pearson系数法计算公式为: 对于已分组资料,Pearson系数法计算公式为 r系数取值范围和相关程度的含义与G系数相同。