双变量的统计分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5
另一种值得注意的性质是相关方向, 也可用统计法予以测量。变量之间的关 系可以分为正与负两个方向。所谓正相 关表示当一个变量的值增大时,另一个 变量的值也增大;所谓负相关则表示当 一个变量的值增加时,另一个变量的值 却减少。这里要注意,相关方向的分析 只限于定序以上层次的变量,因为这些 变量的值有高低或多少之分。至于定类 变量,则没有相关方向的问题。
PRE=
E1 E 2 E1
10
3、相关分析
1、λ相关:用于测量两个定类变量间 的相关关系。 2、G相关:用于测量两个定序变量 间的关系 。
11
λ相关测量法的基本逻辑是计算以一个定 类变量的值来预测另一个定类变量的值 时,如果以众数作为预测的准则,可以 减除多少误差。
12
λ相关测量法有两种形式:一种是对称形 式,用λ表示,即用于测量的两个变量间 的关系是对等的(即相互有影响而非一 个引起了另一个),没有自变量与因变 量之分。
19
16
Ns Nd
G=
Ns Nd
式中Ns表示同序对数目,Nd表示异序对数目。所谓 同序对是指某对个案在两个变量上的相对等级相同, 如果不相同,则称为异序对。
17
文化程度与收入的交互分类表
18
1994年辛普森杀妻案发生时,某研究 机构针对辛普森是否有罪做了一个民 意调查,调查对象由400名不同性别、 种族的人组成,调查结果如下:认为 辛普森有罪的为:白人男性 82人, 黑人男性60人,白人女性44人,黑人 女性16人;人为辛普森无罪的为:白 人男性18人,黑人男性40人,白人女 性56人,黑人女性84人。请制作列联 表,并说明对这个问题的态度是否与 性别和种族有关。
6
数据所显示的相关(或无关) 关系,实际上也可能并不反映 变量间存在(或不存在)有意 义的关系。
7
(二)相关测量法 1、相关测量法就是以一个统 计值表示变量与变量间的关 系,这个统计值称为相关系 数。
8
相关测量法有很多种,我们在选择时首 先要注意变量的测量层次,不同层次的 变量要用不同的相关测量法。其次,要 注意两个变量之间的关系是否对称。另 一项选择标准,就是统计值的意义。有 些相关测量法所计算出来的统计值除相 关程度外,还含有其它意义,我们最好 选择统计值有意义的相关测量法。在统 计学中有一组相关测量法,其统计值具 有消减误差比例的意义,称为PRE测量 法。这组测量法常用在社会学研究中。
9
2、消减误差比例
有两个变量X和Y,现在假定不知道X的值,我们在 预测Y值时所产生的全部误差是E1。如果知道X的 值,我们可以根据X的每个值来预测Y值;假定误 差的总数是E2,则以X值来预测Y值时所减少的误 差就是:E1—E2。这个数值(E1—E2)与原来全 部误差(E1)相比,就是消减误差比例。可用下面 的公式表示:
第十一章 双变量统计分析
一、交互分类表(又名列联表) 二、消减误差比例 三、相关分析(实际上就讲这个)
1
一、交互分类表
交互分类表又称列联表,是指同时依据两个变量的 值,将所研究的个案分类。 500名工人的文化水平(自变量)与工资收入(因变 量)交互分类表(人)
2百度文库
500名工人文化水平与工资收入的交互百分表(%)
mx my(MxMy)
λ=
2n(MxMy)
13
另一种是非对等的,用λy表示,即所 测量的两个变量有自变量与因变量之 分,X是自变量,Y是因变量。(即一 个引起了另一个 )
my My
λy=
n My
14
根据下表的资料计算λ系数 表10-3性别与吸烟态度的交互分类(人)
15
2、G相关
G相关测量法的基本逻辑是:根据任何两个个案在 某变量上的等级来预测他们在另一个变量上的等级 时,可以减少的误差是多少。换言之,G相关测量 法是以每对个案之间的相对等级作为预测的准则。
3
二、相关分析
(一)统计相关的性质
所谓相关,是指一个变量的值与另一个变 量的值有连带性。也就是一个变量的值发生 变化,另一个变量的值也发生变化,则两个 变量就是相关的了。
4
两个变量之间的相关程度 有强弱之分,可用统计法予 以测量。大多数统计以0代表 无相关,1代表完全相关,介 于0和1之间的数值越大,表 示相关程度越强。
另一种值得注意的性质是相关方向, 也可用统计法予以测量。变量之间的关 系可以分为正与负两个方向。所谓正相 关表示当一个变量的值增大时,另一个 变量的值也增大;所谓负相关则表示当 一个变量的值增加时,另一个变量的值 却减少。这里要注意,相关方向的分析 只限于定序以上层次的变量,因为这些 变量的值有高低或多少之分。至于定类 变量,则没有相关方向的问题。
PRE=
E1 E 2 E1
10
3、相关分析
1、λ相关:用于测量两个定类变量间 的相关关系。 2、G相关:用于测量两个定序变量 间的关系 。
11
λ相关测量法的基本逻辑是计算以一个定 类变量的值来预测另一个定类变量的值 时,如果以众数作为预测的准则,可以 减除多少误差。
12
λ相关测量法有两种形式:一种是对称形 式,用λ表示,即用于测量的两个变量间 的关系是对等的(即相互有影响而非一 个引起了另一个),没有自变量与因变 量之分。
19
16
Ns Nd
G=
Ns Nd
式中Ns表示同序对数目,Nd表示异序对数目。所谓 同序对是指某对个案在两个变量上的相对等级相同, 如果不相同,则称为异序对。
17
文化程度与收入的交互分类表
18
1994年辛普森杀妻案发生时,某研究 机构针对辛普森是否有罪做了一个民 意调查,调查对象由400名不同性别、 种族的人组成,调查结果如下:认为 辛普森有罪的为:白人男性 82人, 黑人男性60人,白人女性44人,黑人 女性16人;人为辛普森无罪的为:白 人男性18人,黑人男性40人,白人女 性56人,黑人女性84人。请制作列联 表,并说明对这个问题的态度是否与 性别和种族有关。
6
数据所显示的相关(或无关) 关系,实际上也可能并不反映 变量间存在(或不存在)有意 义的关系。
7
(二)相关测量法 1、相关测量法就是以一个统 计值表示变量与变量间的关 系,这个统计值称为相关系 数。
8
相关测量法有很多种,我们在选择时首 先要注意变量的测量层次,不同层次的 变量要用不同的相关测量法。其次,要 注意两个变量之间的关系是否对称。另 一项选择标准,就是统计值的意义。有 些相关测量法所计算出来的统计值除相 关程度外,还含有其它意义,我们最好 选择统计值有意义的相关测量法。在统 计学中有一组相关测量法,其统计值具 有消减误差比例的意义,称为PRE测量 法。这组测量法常用在社会学研究中。
9
2、消减误差比例
有两个变量X和Y,现在假定不知道X的值,我们在 预测Y值时所产生的全部误差是E1。如果知道X的 值,我们可以根据X的每个值来预测Y值;假定误 差的总数是E2,则以X值来预测Y值时所减少的误 差就是:E1—E2。这个数值(E1—E2)与原来全 部误差(E1)相比,就是消减误差比例。可用下面 的公式表示:
第十一章 双变量统计分析
一、交互分类表(又名列联表) 二、消减误差比例 三、相关分析(实际上就讲这个)
1
一、交互分类表
交互分类表又称列联表,是指同时依据两个变量的 值,将所研究的个案分类。 500名工人的文化水平(自变量)与工资收入(因变 量)交互分类表(人)
2百度文库
500名工人文化水平与工资收入的交互百分表(%)
mx my(MxMy)
λ=
2n(MxMy)
13
另一种是非对等的,用λy表示,即所 测量的两个变量有自变量与因变量之 分,X是自变量,Y是因变量。(即一 个引起了另一个 )
my My
λy=
n My
14
根据下表的资料计算λ系数 表10-3性别与吸烟态度的交互分类(人)
15
2、G相关
G相关测量法的基本逻辑是:根据任何两个个案在 某变量上的等级来预测他们在另一个变量上的等级 时,可以减少的误差是多少。换言之,G相关测量 法是以每对个案之间的相对等级作为预测的准则。
3
二、相关分析
(一)统计相关的性质
所谓相关,是指一个变量的值与另一个变 量的值有连带性。也就是一个变量的值发生 变化,另一个变量的值也发生变化,则两个 变量就是相关的了。
4
两个变量之间的相关程度 有强弱之分,可用统计法予 以测量。大多数统计以0代表 无相关,1代表完全相关,介 于0和1之间的数值越大,表 示相关程度越强。