4相关测量法与测量层次

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
其它级序相关测量法:肯德尔的tau系数和斯皮尔曼的rho系数 (1)tau系数有三种:tau-a、tau-b、tau-c。他们都适于分析对称关系,系
数值没有消减误差比例的意义。 tau系数的基本逻辑,是计算同序对数与异序对数之差在全部的可能对数 中所占的比例。 (2)rho系数:特点是在计算每个个案在两个变项上的等级时,不仅要区 别二者的高低差异,而且还要计算二者差异的确切数值。 rho是对称相关测量法,要求同分情况不多,统计值-1~+1,表示相关的 程度和方向,其平方值具有消减误差比例的意义。
测量两个定距变项相关程度的最好尺度; r本身不表示消减误差比例,r2表示以线性回归方程作为预测工具时所能减
少的误差比例。 r 系数 与 b 系数不同的地方,是r 系数假定X与Y的关系是对称的,而且r
的统计值是由-1至+1,同时r的平方值具有消减误差的意义。这个 r2 值, 称为决定系数。
注意:
第四章 相关测量与测量层次
第一节 两个定类变项: Lambda, tau-y
1.Lambda相关测量法(对称与不对称) (1)基本逻辑:以一个定类变项的值来预测另一个定类变项的值时,如果以
众数作为预测的准则,可以减少多少误差。 (2)两种形式: 对称形式: 不对称形式:
(3)缺点:比较粗略,不够灵敏。它以众值为预测的准则,不理会众值以外 的次数分布。若众值集中在条件次数表上的同一行或同一列,则Lambda 相关系数为0。
(3)Gamma系数:统计值-1~+1,表示相关的程度与方向,分析最适用于分 析两个定序变项之间的对称关系。
(4)dy系数:统计值-1~+1,表示相关的程度与方向,该方法假定两个定 序变项之间的关系不对称。
(5)简单线性回归分析:分析两定距变项的不对称关系。其作用是以直线 回归方程式Y’=bX+a来运算自变项(X)的数值,从而预测或估计依变项 (Y)的数值。方程式中的回归系数b,显示自变项对依变项的影响的大 小与方向,但其数值大小随变项的衡量单位而定,不是由-1~+1.
(1)Lambda系数:统计值0~1,分析两个定类变项的关系,也可分析一个 定类变项与一个定序变项的关系。它有两种形式:__假定是对称关系, ___假定是不对称关系。
(2)tau-y系数:统计值0~1,分析两个定类变项的关系,也可分析一个定 类变项与一个定序变项的关系。只适合于分析不对称关系。在分析两变 项间的相关时,其敏感度高于Lambda。
比较E值与r值,如果两值相差愈大,变项之间的关系越可能是非线性的。 然而,将E与r比较,只能知道非线性的程度,不能反映曲线的形状。
第五节 定类变项与定序变项:Lambda,tau-y
如果遵守变项的测量层次准则,适合的统计法是威尔科森的区分系数,其基 本逻辑是根据各个个案在定类变项上所属的类别来估计他们在定序变项 上的相对等级,故此是属于不对陈相关的测量法,其系数值由0至1,但 没有消减误差比例的意义。
(6)积距相关系数:分析两定距变项的对称关系,统计值由-1~+1,其平 方值r2具有消减误差比例的意义。R系数值还可表示简单线性回归方程式 在预测时的准确程度。但r系数是假定两变项间具有直线关系,若两者的 关系显然是非直线性,则用其它方法,比如相关比率。
(7)相关比率:分析一定类变项与一定距变项的不对称关系,也可分析定 序变项与定距变项的关系。统计值0~1,数值E2具有消减误差比例的意义 。
分析一个定序变量与一个定距变量的相关时,除了可以应用相关比率系 数外,也有些社会学研究将定序变量看作时定距变量,因此采用皮尔逊 积距相关系数,甚至进行线性回归分析。
如教育水平分高、中、低,本来是定序变量,但我们可以给分数如下: 高=2;中=1;低=0,然后将这些分数当作定距资料来分析。
如果我们坚持严谨的科学态度,就不按上面的方法做。然而不少社会学 研究抱着“虽不中亦不远矣”的态度,还是将定性资料看作定距资料处 理,为求方便统计分析。当前大部分社会学研究者还是接受这个做法。 其中的一个重要原因,是在积距相关与回归分析法的基础上比较容易进 行多变项的统计分析。
(3)同序对:某对个案在两个变项上的相对等级是相同的;Ns表同序对总数。 异序对:某对个案在两个变项上的相对等级是不同的;Nd表异序对总数。 如果Ns与Nd的相差愈大,表示两变项的相关愈强。如果Ns大于Nd,表示两变项
成正比,反之成反比。
1. Gamma相关测量法(对称) 基本逻辑:根据任何两个个案在某变量上的等级来预测他们在另一个变
第四节 定类变项与定距变项:相关比率与非线性相关
1、相关比率( E2 )法 (1)又称为Eta平方系数法(简写为E2)是以一个定类变项(X)为自变量,
以一个定距变项(Y)为依变量。它是根据自变项的每一个值来预测或估 计依变项的均值。由于有一个变量是定类变量,所以eta系数值(E)介于 0-1之间,没有负值,其平方值eta平房系数(E2)具有 削减误差比例的 意义。 (2)计算公式:
以上的相关测量法是根据条件次数表来计算统计值,而不是根据条件百分 表。但如果把根据条件次数表计算出来的相关统计值写在条件百分表上 ,会使我们的研究结果既详尽又精简。
第二节 两个定序变项: Gamma, dy
(1)Gamma系数适用于分析对称关系,dy系数适用于分析不对称关系。但两者 的系数值在-1至+1之间,既表示相关的程度,也表示相关的方向,而且都 具有消减误差的含义。
(2)Gamma系数与dy系数统称为级序相关法,该方法的基本逻辑是要求:根据 任何两个个案在某变项上的等级来预测他们在另一个变项上的等级时, 可以减少的误差是多少。
则用测量不对称关系的萨默斯dy系数。 dy系数公式:dy = ( Ns – Nd ) / ( Ns + Nd + Ty ) dy的系数值通常
小于Gamma系数值,因为dy公式中分母的数值较大。 注意:原则上用dy分析不对称关系,Gamma分析对称关系。然而颇多社会
学研究即使是区分了自变量与依变量,也选用Gamma系数。这种做法,不 够严谨,但大致可以接受。一般来说,选择相关测量法的首要准则是变 量的测量层次。至于关系是否对称,是属于次要的考虑。
第七节 综合
1、进行统计分析时,先要简化每一个变项的分布,可运用次数、百分率、 集中趋势测量法和离散趋势测量法等统计奇数。
2、了解每个变项的情况后,就要进一步分析一个变项与另一个变项之间的 关系。其基本方法是把资料作交互分类,形成条件次数表。
3、在选择相关测量法时,首要准则是变项的测量层次,其次是关系的对称 与否。当前社会学研究中常采用的具有消减误差比例意义的相关测量法 具有以下七种:
r系数所要表示的,是以线性回归方程式作为预测的工具时所能减少的误差 比例。因此,如果r系数值越大,就表示线性回归方程式的预测能力越强。
在社会学研究中,通常是先计算r系数值,然后才决定是否运用简单线性回 归分析法来预测数值。如果r系数值很小,就不要用线性回归方程来作预测, 因为那样做所犯的错误会很大。
Lambda,tau-y测量法; 将定序变看作定类变量。虽然损失了定序变量的数学性质,但方便
了统计工作,故经常被采用。
注:相关系数值在相互比较时,意义更加突出。但是,要进行相互比较,就 要尽可能采用同样的相关测量法。
第六节 定序变项与定距变项:相关比率
如果遵守变项的测量层次准则,适合的统计法是贾斯彭的多序相关系数,这 是对称相关的测量法,系数值由-1至+1,可作消减误差的解释。但该方 法要假定两变项具有直线的相关,且要假定:如果定序变项改用定距层 次来测量,则其数值会作常态分布。因而颇多社会学研究改用相关比率, 即将定序变项。看作定类变项。
简单线性回归应注意的两点: 1. 要求X与Y的关系是直线的,即两者在坐标图上的散点分布有直线的
趋势;否则(呈曲线趋势或无规律)不适用; 2. X与Y的关系是非对称的,只能用X来预测Y,而不能Y用来预测X;
回归系数b的意义:b的大小表示X对Y的影响有多少。B值是代表每增加一 个单位的X值时,Y值的变化有多大。若b=0,表示X对Y没有影响,即 X变但Y不变;若b值愈大,表示x变化时所引起的Y变化愈大。B值有 正负之分,不限于-1至+1,若是正值就表示X对Y有正向效果。
第三节 两个定距变项:简单线性回归与积距相关
1.简单线性回归分析(不对称) (1)根据一个直线方程式,以一个自变项(X)的数值来预测一个依变项(Y)的数值。
这个方程式是: Y’=bX+a.
X是自变项数值,b为回归系数,表示回归线的斜率,a是截距,即回归线与Y轴的 交点。
(2)假设条件:自变量X与因变量Y的关 系具有直线的性质。 (3)图中的回归线由均值构成,原则上 以之来预测Y值所犯的错误是最小的。 (4)回归分析法的目的,是要找出一个 错误最小的方法来预测依变量的数值. (5)绘制回归线的准则:最小平方法。 其目的是使回归方程预测时所犯的误差 总数最小。
2、非线性相关:相关比率系数的另外一个作用:分析两个定距变量间的非 线性关系(比r系数值要优越)
相关比率所测量的是定距变量值(Y)在不同的定类变量值(X)中的差异 情况。这种相互比较的方式,不用要求两个变量具有线性关系。因此,如 果两个定距变量间的关系可能是非线性的,则我们将其中的 一个变量看 作是定类变量,然后用相关比率系数来测量相关情况。
r系数基本上是一种对称相关测量法,即不用区分自变量与依变量。然而颇 多社会学家不愿吹毛求疵,只要两个变项都是定距变项,则无论关系是否 对称都应用r系数。该做法与Gamma系数的应用情况相似。不够严谨,但可 以接受。 其次,r系数与简单线性回归分析都是假定X与Y的关系具有直 线的性质。如果这个假定不符合实际情况,就会犯错误。
因此,b值是表示自变项对依变项的影响的大小和方向,它是一个分析不 对称关系的统计法。
回归系数b的含义: b值表示自变量对因变量的影响的大小与方向;(结合P102例题说明) b = △Y / △X b值没有上限,社会学应用中,很少用b值来表示两变量间的相关程 度。
ห้องสมุดไป่ตู้
2.积距相关测量法(对称) Pearson相关系数r:测量两个变项的相关程度与方向. 公式(P 103 )
2.tau-y相关测量法(不对称) (1)特点:在计算系数值时会包括所有的边缘次数和条件次数。 (2)计算公式:
(3)tau-y在计算系数值时,会包括全部的边缘次数和条件次数,所以敏 感度较高,具有消减误差比例的意义。 因此,如果是不对称的关系,最好选用tau-y来简化两个变项的相 关情况。此外也可以选用phi相关系数、列联相关系数、V相关系数等方 法来测量两个定类变项的关系。它们都是假定两变项的关系是对称的, 但其统计值没有消减误差比例的意义。
量上的等级时,可以减少的误差是多少; 公式推导:G=(Ns-Nd) / (Ns+Nd). G的绝对值愈大,表示估计时所犯的错
误可能性愈小; 前面提到的尤拉Q系数是Gamma系数的一种特殊方式,当两个定序变项都
是二分的,则Q=G
2. dy相关测量法(不对称) 如果认为两个定序变量,其中一个是自变量(X),另一个是依变量(Y),
相关文档
最新文档