等级相关定序
教统考试重点
名词解释1、统计数据:2、随机抽样:在对某一特定总体中抽取样本时,总体中每一个个体被抽取的可能性是同等的,而且任何个体之间彼此被抽取的机会是独立的。
3、机械抽样:又叫等距抽样,就是把总体中的所有个体按一定顺序编号,然后依固定的间隔距离取样。
4、分层抽样:也叫分类抽样或类型抽样,它是按与研究内容有关的因素或指标,先将总体划分成几部分,然后从各部分中进行简单随机抽样。
5、整群抽样:从总体中抽出来的研究对象,不是以个体为单位,而是以整群为单位的抽样方法,称为整群抽样。
6、抽样误差:随机样本的统计量与总体参数之差,它的存在是客观的。
7、参数估计:根据样本统计量对相应总体参数所做的估计。
8、点估计:用样本的某一统计量的确定值来估计相应总体参数值的方法。
9、区间估计:以样本统计量的抽样分布形态为理论依据,并按一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。
10、统计量:样本的特征值叫做统计量,又叫做特征值。
是从一个样本中计算出来的一些量数,他可以描述一组数据的状况。
11、置信度:指估计总体参数落在某区间正确的概率或可能性,也就是12、置信区间:指在某一置信度下,总体参数所在的区域距离或区域长度。
13、小概率事件:将一次试验中发生的概率小于或等于0.05是事件称为小概率事件。
14、显著性水平:估计时允许犯错误的概率。
15、相关样本:两个样本内个体之间存在着一一对应关系,则称两个样本为相关样本。
16、独立样本:两个样本内的个体是随机抽取的,它们之间不存在一一对应关系。
17、积差相关分析:当两个变量都是正态连续变量,而且两者之间呈线性关系时,表示这两个变量之间的相关称为积差相关。
18、等级相关分析:以等级次序排列或以等级次序表示的变量之间的相关。
19、质与量相关分析:需要计算相关的两列变量一列为等比或等距的测量数据,另一列是按性质划分的类别,欲求这样两列变量的直线相关,称之为质量相关。
各种相关系数介绍与对比
各种相关系数介绍与对比各种相关系数介绍与对比按照变量的不同测量层次对各种相关系数简单介绍:1、定类变量——定类变量用于测量两个定类变量的相关系数,主要有Lambda 与T au-y两种。
(1)Lambda(λ)系数分为:对称形式——用于测量两个变量间的关系是对等的,即无自变量与因变量之分。
非对称形式——测量两个变量间的关系有自变量与因变量之分。
(2) Tau-y系数:用于测量变量间非对称关系的。
2、定序变量——定序变量如果测量两个定序尺度变量间的关系,可用Gamma系数、dyx系数和斯皮尔曼等级相关系数。
(1)Gamma(G)系数:分析两个变量间的对等关系,即无自变量与因变量之分。
(2)dyx系数:等级相关系数,两个变量间的关系是非对称的。
(3)斯皮尔曼(Spearman)等级相关系数(ρ):考虑单个个案在两个变量上的等级差异,测量两变量间对等相关关系。
3、定距变量——定距变量测量两个定距变量相关系数的最常用指标是皮尔森(Pearson)相关系数(γ)。
(要求N≥50而且两个变量的分布应近似于正态分布。
)4、定类变量——定距变量两个变量中,自变量为定类变量,因变量为定距变量时,采用相关比率来测量两者间相关程度。
(又称eta平方系数 E)5、定类变量——定序变量对一个定类变量例如性别,与一个定序变量例如收入水平关系的分析:第一,用theta系数(θ),专门测量定类变量与定序变量间关系有无和强度,非对称关系。
第二,采用λ系数和Tau-y系数,即将定序变量作为定类变量处理。
6、定序变量——定距变量处理一个定序变量例如教育水平,与一个定距变量如年均收入之间的关系,采用二种办法:第一,将定序变量看作定类变量,采用相关比例测量法。
第二,将定序变量看作定距变量,采用γ相关系数。
小结:在分析两个变量关系时,选择哪种相关系数,主要考虑两个方面:1、变量的测量层次;2、变量关系的类别,即是对等的还是非对称的。
斯皮尔曼等级相关的适用条件
斯皮尔曼等级相关的适用条件斯皮尔曼等级相关(Spearman's rank correlation)是一种用于度量两个变量之间的非线性相关性的统计方法。
它适用于以下条件:
1. 数据类型:斯皮尔曼等级相关适用于有序变量(例如,顺序数据或等级数据),以及非参数数据。
它可以用于定序数据和连续数据,不要求数据服从特定的分布。
2. 非线性相关:斯皮尔曼等级相关是一种非参数方法,因此可以用于度量非线性相关性。
它不受数据的线性关系影响,适用于任何单调的关系。
3. 异常值:斯皮尔曼等级相关对于异常值比较鲁棒,不会过于受到异常值的影响。
4. 小样本:与皮尔逊相关系数相比,斯皮尔曼等级相关在样本量较小时也能提供较为可靠的结果。
5. 等级数据:当变量的实际数值不是特别重要,而重要的是变量之间的排序关系时,可以使用斯皮尔曼等级相关。
需要注意的是,斯皮尔曼等级相关是一种非参数方法,它是通过将原始数据转换为等级数据,然后计算等级之间的相关性来进行分析的。
虽然斯皮尔曼等级相关对于一些特定情况下的数据非常适用,但在某些情况下,皮尔逊相关系数等其他方法可能更合适。
在选择合适的相关分析方法时,需要根据数据的性质和研究目的进行判断。
1/ 1。
社会统计学教学大纲
社会统计学教学大纲课程名称:社会统计学英文名称:social statistics课程编号:12600722j使用专业:社会工作专业总学时数:48学时总学分:3学分大纲撰写人:文法学院社工系马永方内容简介社会统计学是社会学主干课之一,与社会学调查研究方法结合起来,完整地介绍了当代社会调查研究的科学方法和资料处理技术。
社会统计学则侧重介绍资料的收集、整理、分析和推论的处理技术。
从事社会工作研究理论和实践的人都有必要掌握社会统计学这门有用的工具。
本课程共7章。
第一章导论,介绍社会统计学和相关概念,第二章统计资料的搜集,第三章统计资料的整理,第四章到第七章是统计分析。
第四章和第五章是描述统计,第六到第七章是统计推断,第六章概率论是统计推断的基础,统计推断有两个基本内容:假设检验第七章。
一、讲授的主要内容第一章社会学研究和统计分析(2学时)第一节社会学研究的科学性第二节社会调查资料的特点和统计学的运用第二章单变量统计描述分析第一节分布统计表统计图第二节集中趋势测量法第三节离散趋势测量法第三章概率(3学时)第一节基础概率第二节概率分布、均值和方差第四章二项分布及其他离散型随机变量的分布(3学时)第一节二点分布第二节排列与组合第三节二项分布第四节多项分布第五节超几何分布第六节泊松分布第五章正态分布、常用统计分布和极限定理(3学时)第一节什么是正态分布第二节标准正态分布第三节标准正态分布表的使用第四节常用统计分布第五节大数定理和中心极限定理第六章参数估计(4学时)第一节名词解释第二节参数的点估计第四节正态总体的区间估计第五节大样本区间估计第七章假设检验(4学时)第一节统计假设第二节统计检验的基本步骤一、建立假设二、求抽样分布三、选择显著性水平和否定域四、计算检验统计量五、判定第八章单总体假设检验(4学时)第一节大样本假设检验第二节小样本假设检验第九章二总体假设检验第一节引言第二节大样本二总体假设检验第三节小样本二总体假设检验第十章列联表(4学时)第一节什么是列联表第二节列联表的检验第三节列联强度第十一章等级相关(定序变量之间)(4学时)第一节斯皮尔曼等级相关系数第二节Gamma等级相关第三节其他等级相关系数第十二章回归与相关(6学时)第一节回归研究的对象第二节回归直线方程的建立与最小二乘法第三节回归方程的假定与检验第四节相关第五节用回归方程进行预测第十三章方差分析(3学时)第一节引言第二节一元方差分析第三节二元方差分析第四节多元方差分析第十四章非参数检验(4学时)第一节非参数检验第二节符号检验第三节符号秩检验第四节累计频次检验第十五章抽样(4学时)第一节引言第二节抽样调查方法第四节样本容量的确定二、参考书目1. 社会统计学,卢淑华,北京大学出版社,2005年第三版.2.社会统计学,张彦,高等教育出版社,2005年第一版.3.社会统计学导论,周德民、贺翠微,中南大学出版社,2004年第一版.教学大纲说明一、教学目的与课程性质任务本课程属于专业限选课,是社会工作专业课程体系的重要组成部分。
等级相关
Gamma系数是一个定序—定序变量间的统计系数值,
范围在-1—1之间。绝对值越接近1,表明两个变量之间
高度关联,越接近0,表明关联度越低。 6.对统计结果进行分析
的个案中同序数量ns对与异序对数量nd来衡量。
3 2 1
ns多于nd 两变量正相关 nd多于ns 两变量负相关 ns等于nd 两变量不相关
根据同序对与异序对数量原理,可得等级相关系数Gamma。
Ns - Nd Gamma= Ns + Nd
Gamma系数有削减误差比例的意义。
三、Gamma的取值范围与等级相关的方向
两定序变量所有个案间nd=0,则G=1,完全正相关 两定序变量所有个案间ns=0,则G=-1,完全负相关 Gamma取值范围:[-1, 1]
例如:根据样本量为500人的文化程度与代际流动的
抽样调查,得统计表,求G值。
ns=118*(130+43+32+98)+37*(32+98)+18*(43+98)+130*98=55842 nd=15*(130+18+43+9)+37*(18+9)+32*(43+9) +130*9=6833
第七讲
等级相关分析
(定序变量—定序变量)
胡书芝
一、等级相关中的名词 1、同序对
(same ordered pair)
如果个案A符合(Xi,Yi),个案B符合(Xj,Yj),且 Xi>Xj,Yi>Yj,则称个案A与个案B构成同序对。 可见, 同序对只要求X变化与Y变化方向相同,并没有要求变化量 要相等。
社会统计学(卢淑华),第一章资料
一、社会统计学的发展
统计学的两大流派:数理统计学派和社 会统计学派
数理统计学派的原创始人是比利时的A ·凯特靳, 其最大的贡献就是将法国的古典概率引入统计 学,用纯数学的方法对社会现象进行研究; 社会统计学派的首倡者是德国的K·克尼斯,他 认为统计研究的对象是社会现象,研究方法为 大量观察法。
例:中学升学率调查
课题确定:升学率差异较大;学生择校
初探:收集文献,前人研究;咨询相关人员; 典型个案观察(好坏各2-3所中学)
假设:构思影响因素:1、师资专业水平,2、 学生入学水平,3、父母教育水平;
师资水平高
升学率高
入学成绩好
升学率高
父母教育水平高
升学率高
续例
操作化定义:如,师资:学历、职称、 获奖等;学生水平:考分、地域、性别 等;父母水平:学历、职业、教育子女的 时间等(注意:每一个定义就是一个变量, 要注意变量的各种可能取值)
1、混淆统计联系与因果关系 根据观测数据得到的统计联系(如相关 关系)只是因果关系存在的必要条件, 而不是充分条件。
2、事后解释错误 将探测性研究或描述性研究得到的理论 假设反过来作为假设检验来看待。
统计分析中常见的错误
3、生态学错误 混淆宏观模式与微观模式。 如:教育、经济水平越高的地区生育水平 越低,不能引申为个人教育水平与生育 水平的关系。 4、还原论错误 根据较低层次研究单位的分析结果推断较 高层次单位的运行规律。
联合国有关组织规定: 若低于0.2表示收入绝对平均; 0.2-0.3表示比较平均; 0.3-0.4表示相对合理; 0.4-0.5表示收入差距较大; 0.6以上表示收入差距悬殊。
二、社会学不社会统计学
1、社会学研究的重要环节 ▲课题---了解课题---假设---术语---问卷---调查---校核---统计
统计学中的定序数据分析方法与应用
统计学中的定序数据分析方法与应用统计学是一门研究数据收集、分析和解释的学科,它在各个领域中都扮演着重要的角色。
在统计学中,定序数据是一种特殊的数据类型,它包含了一些有序的类别或变量。
本文将介绍定序数据的分析方法和应用。
一、定序数据的定义和特点定序数据是一种有序的数据类型,它包含了一些有序的类别或变量。
与定量数据相比,定序数据不能进行数值计算,但它们仍然包含有用的信息。
定序数据的特点是有序性和等距性,即不同类别之间存在一定的顺序关系,并且类别之间的间隔是相等的。
二、定序数据的分析方法1. 描述性统计分析描述性统计分析是对定序数据进行总结和描述的方法。
常用的描述性统计分析方法包括频数分布、百分比和累计百分比等。
通过这些方法,我们可以了解定序数据的分布情况和特征。
2. 排序方法排序方法是一种常用的定序数据分析方法,它可以将定序数据按照一定的规则进行排序。
常用的排序方法包括等级和秩次排序。
等级排序是根据定序数据的大小将其分为不同的等级,而秩次排序是根据定序数据的大小为其分配一个秩次。
3. 等级相关系数分析等级相关系数分析是一种用于测量定序数据之间相关性的方法。
常用的等级相关系数包括斯皮尔曼等级相关系数和肯德尔等级相关系数。
这些系数可以帮助我们判断定序数据之间的相关性强度和方向。
4. 非参数检验方法非参数检验方法是一种用于比较定序数据之间差异的方法,它不依赖于数据的分布假设。
常用的非参数检验方法包括符号检验、秩和检验和秩和检验等。
这些方法可以帮助我们判断定序数据之间是否存在显著差异。
三、定序数据的应用定序数据的分析方法在各个领域中都有广泛的应用。
以下是一些典型的应用场景:1. 医学研究在医学研究中,定序数据的分析方法可以用于评估不同治疗方法的效果。
例如,可以使用定序数据的等级相关系数分析方法来评估不同药物的疗效。
2. 企业管理在企业管理中,定序数据的分析方法可以用于评估员工的绩效。
例如,可以使用定序数据的排序方法来确定员工的等级和秩次。
第十一章 等级相关(定序-
x
i
平均成绩 7.5 1 4 7.5 9 5 10 3 2 6
y
i
d
0
i
dHale Waihona Puke 2 i-1.5 1.5 0.5 1 0 -1 -0.5 1 1
2.25 2.25 0 0.25 1 0 1 0.25 1 1 ∑ 9.00
3, s 的统计检验
目的:通过对抽样数据的检验,确认总体中也存在等级 相关。 H0 : ps = 0 x y 总体变量x与变量y等级相关 H1 : p s ≠ 0( p s > 0或 p s < 0) 统计量: n−2 当 n ≥ 10 时,统计量 t = r s 1 − 2 当
2、 s 的取值范围:
完全正等级相关: 完全正等级相关: =1 s )(2; ) (1;1)( ;2) … ; )( 完全负等级相关: 完全负等级相关: r s = −1 )(2; (1;n)( ;n-1)… ; )( ) 取值范围为: 取值范围为: ,−1] [1 Spearman等级相关是以变量没有相同等级为前提 等级相关是以变量没有相同等级为前提 如果相同等级不太多的话, 的,如果相同等级不太多的话,可采用平均等级的来 计算
四、 Gamma系数的检验 系数的检验
H
:γ H0 :
1
=0 γ ≠0
G
统计量:
z=
n +n
s 2
d
1− G
n
N (0,1)
双侧检验,拒绝域的临界值查表 Zα/2 双侧检验,
练习11-3:在某地选取409名已婚男人,研究他们 对母亲的感情会否影响他们对婚姻的适应,并问 是否有总体推论价值。 婚姻适应 平淡 差 一般 很好 32 28 15 75 丈夫对母亲的感情 不错 41 47 69 157 良好 26 41 61 128 很好 28 22 59 109
简述相关关系的种类
简述相关关系的种类相关关系有四种类型:(1)定类相关;(2)定序相关;(3)定距相关;(4)等级相关。
两个变量的相关性,既可能出现在各种相关关系中,也可能不出现在相关关系中。
如果两个变量X与Y之间没有相关关系,那么Y也就不存在反映X的变量,但并不意味着X就不存在。
例如,我们在某些活动中可以测出自己的技能水平,而这种活动本身又可以提高我们的技能水平。
从这里我们可以看出,两个变量X与Y的相关关系一定发生在活动中,即只有当活动本身具有能够影响X的属性时,才能进行研究。
这是两个随机变量,随机变量X是另外一个随机变量Y的函数,那么X=f(Y)。
当x是一个常数时, x=f(y)成立,这时候X与Y之间呈线性关系,可以用一个函数来表示。
当x为一个随机变量,并且函数满足一定的条件时,则称X与Y之间呈正相关关系,也就是说,在一定的条件下,如果对Y进行测试,则X的值会大于Y。
总体上说,在正常情况下, X与Y之间的关系呈非线性关系。
然而,若当X是已知的而Y未知时,其表现形式与线性相关关系却很相似。
因此,当我们在正常情况下得到的结论,当我们在特殊情况下进行实验、测量或者计算时,应该引起我们注意。
事物之间都是普遍联系的,所以它们之间也有可能存在着不同的相关关系。
从微观角度看,相关关系是两个(或多个)变量之间的一种依赖关系,比如对每个变量的观察都可以导致其他变量值的变化,就说明了它们之间存在相关关系。
从宏观角度看,相关关系指的是一个事物或一个现象和另一个事物或现象之间的内在关系,比如人民币汇率上升和出口增加之间的相关关系。
从上述的分析中,我们可以归纳出,当人民币汇率上升时,出口会增加;而当人民币汇率下降时,出口会减少。
对于连续型变量来说,两个变量X与Y之间相互独立,并无关系,但在统计学上,把这样的两个变量叫做独立样本,简称独立变量。
如果对两个随机变量X与Y的相关分析用控制变量法来进行,当Y是随机变量时,使X与Y的相关系数(r)达到最大,并使其方差最小,就可以认为X与Y之间呈现相关关系。
8.等级相关分析(3) Microsoft PowerPoint 演示文稿
s 1
6 d i2 n(n 1)
i 1 2
n
教学评价与测量60 例
2013.10
根据样本数据计算得到的斯皮尔曼等级相关系数s ,分 两种情况进行假设检验。 原假设H0:ρs = 0,总体中变量 x 和变量 y 等级无关 备择假设H1:ρs ≠ 0,总体中变量 x 和变量 y 等级相关 统计量: 大样本 n ≧30
2.根据以下资料,分析学生的考试成绩与交卷名次是否有关。
交卷名次 考试成绩 1 90 2 74 3 74 4 60 5 68 6 86 7 92 8 60 9 78 10 74 11 78 12 64
3.以下是文化程度代际流动的抽样调查资料
父辈子辈 大学 大学 118 中学 37 小学 15
中学
小学
计算伽玛等级相关系数
G ns nd 6 4 0.2 ns nd 6 4
教学评价与测量60 例
2013.10
根据样本数据计算得到的Gamma等级相关系数G,必须进行 假设检验。 原假设H0:,总体等级无关 备择假设H1:≠0,总体等级相关 统计量:
|Z|=14.0471 > 1.96 = Z0.05/2,在 a=0.05显著性水平拒绝H0,即 总体等级相关,并且 G 值具有推断总体的价值。
教学评价与测量60 例
2013.10
247
计算斯皮尔曼等级相关系数:
s 1
6 d i2 n(n 1)
i 1 2 n
1
6 247 0.1364 12(122 1)
教学评价与测量60 例
2013.10
原假设H0:ρs = 0,(总体中考试成绩的名次与交卷名次无关) 备择假设H1:ρs > 0,(总体中先交卷的考试成绩高) 计算统计量
第11章 统计分析—双变量
10- 13 10-
社会 统计学
2、方差齐性检验和t检验结果 、方差齐性检验和t
F值>F 0.025 (n 1-1,n 2-1), 说明方差不齐。
10- 14 10-
P值小于给定的显著性水平α, 说明方差不齐。
P值小于给定的显著性水平α, 拒绝原假设。
社会 统计学
社会 统计学
10- 44 10-
社会 统计学
10- 45 10-
社会 统计学
【例2】“年龄段”与“忙碌程度”
10- 46 10-
社会 统计学
10- 47 10-
社会 统计学
10- 48 10-
社会 统计学
10- 49 10-
社会 统计学
斯皮尔曼等级相关系数(spearman)在这: 斯皮尔曼等级相关系数(spearman)在这: Analyze Correlate Bivariate
2、 比较重要 3、 一般 5、 很不重要 6 、说不清楚
10- 40 10-
社会 统计学
1、将被访者学历与“读书的地位”都看成 定类变量,作列联相关的检验。 2、被访者学历与“读书的地位”均为定序 量,作等级相关检验。
10- 41 10-
社会 统计学
10- 42 10-
社会 统计学
10- 43 10-
社会 统计学
二、独立样本T 检验 独立样本T
Analyze Compare Means
IndependentIndependent-Samples检验变量栏 T Test,
打开Independent-Samples T Test对 IndependentTest对
分组变量栏, 话框 只能有一个分 组变量
等级相关分析
(2)异序对
(different ordered pair)
如果个案A符合(Xi,Yi),个案B符合(Xj,Yj),且 Xi>Xj,Yi<Yj或Xi<Xj,Yi>Yj ,则称个案A与个案B构成异 序对。可见,异序对只要求X变化与Y变化方向相反,并没 有要求变化量的绝对值要相等。
(3)同分对(Tied pair)
个案 n1 n2 n3 n4 n5 n6
X
(文化程度)
Y
(幸福指数)
n1-n2:
n1-n3:
x同分
x同分
n1-n4: 同序对 n1-n5: 异序对 n1-n6: 同序对
3 3 3 1 2 4
2 4 1 1 3 5
再以n2、n3、n4、n5为基础讨论
二、Gamma系数的确定
等级相关中两个变量之间的相互关系可以从两个变量
第七讲
等级相关分析
(定序变量—定序变量)
胡书芝
一、等级相关中的名词 1、同序对
(same ordered pair)
如果个案A符合(Xi,Yi),个案B符合(Xj,Yj),且 Xi>Xj,Yi>Yj,则称个案A与个案B构成同序对。 可见, 同序对只要求X变化与Y变化方向相同,并没有要求变化量 要相等。
须进行统计检验。对于等级相关仍然可以采用卡方检验
定序变量之间相关的显著性,也可以通过基于Gamma系
数的统计量进行相关显著性的检验。
五、上机操作步骤:
1.打开目标数据文件,进入Analyze主菜单; 2.激活Statistics菜单选Descriptive Statistics中的Crosstabs命令项; 3.弹出Crosstabs对话框中,在对话框左侧的 变量列表中选择一个或多个变量进入Row(s)框,作
第十讲 双变量相关分析.
本讲内容
相关分析的基本目的与内容 列联相关(交叉)分析(定类vs定类) 等级相关(定序vs定序) 积距相关(定距vs定距)
第一节 相关分析的基本目的与内容
1.相关关系:变量与变量之间的一种共变关 系,即当x变量发生变化时,y变量也相应发 生变化。如身高增加,体重也相应增加。
性相关。
1. Pearson相关系数计算
计算公式为:
2. 分析思路
假设两个变量之间不存在相关关系(相互独 立),那么每个单元格中应该出现的频次被 视为期望频次(理论值Eij),如果实际测量 的频次(观察频次Oij )和Eij比较接近,我们 就认为所作的假设是正确的,反之,则认为 假设是错误的。
3. 列联分析的使用
使用列联分析的目的在于判断:确定两个变 量之间是否存在相关,以及相关强度如何, 这种相关性是否可以从样本推论到总体?
2.相关分析就是对两个变量之间相关关系的 分析,主要分析的内容包括3个方面: (1)x与y之间是否存在相关关系?检验 (2)x与y之间相关关系的特征?(强相关 /弱相关;正相关/负相关;线性/非线性) (3)x与y之间的相关特征能否推论总体?
3. 相关分析的选择
第二节 列联相关分析—交叉表
1.列联分析是根据两个定类变量的取值进行 交互分类形成二维表来分析变量间是否相关 的一种方法。如:
相关强度主要通过一系列的统计量参数来测 量,如列联系数、Lambda系数,C系数, V系数,等等。
第三节 等级相关分析
等级相关分析用类分析两个定序变量之间的 相关关系;可以分析两个定序变量之间相关 的强度及方向。
相关强度采用spearman等级相关系数和 Kendall‘s tau-b系数,属于非参数测量方 法。在大样本的情况下,可以采用交叉表分 析,并通过gamma系数判断。
定类,定序,定距,定比
定类,定序,定距,定⽐
在统计学中,统计数据主要可分为四种类型,分别是定类数据,定序数据,定距数据,定⽐变量。
1.定类数据(Nominal):名义级数据,数据的最低级,表⽰个体在属性上的特征或类别上的不同变量,仅仅是⼀种标志,没有序次关系。
例如, ”性别“,”男“编码为1,”⼥“编码为2。
2.定序数据(Ordinal):数据的中间级,⽤数字表⽰个体在某个有序状态中所处的位置,不能做四则运算。
例如,“受教育程度”,⽂盲半⽂盲=1,⼩学=2,初中=3,⾼中=4,⼤学=5,硕⼠研究⽣=6,博⼠及其以上=7。
3.定距数据(Interval):具有间距特征的变量,有单位,没有绝对零点,可以做加减运算,不能做乘除运算。
例如,温度。
4.定⽐变量(Ratio):数据的最⾼级,既有测量单位,也有绝对零点,例如职⼯⼈数,⾝⾼。
两定序变量的等级相关
成绩名次 交卷名次
1 2 3 4.5 4.5 7 7 7 9 10 11.5 11.5 7 1 6 9 11 2 3 10 5 12 4 8
D
-6 1 -3 -4.5 -6.5 5 4 -3 4 -2 7.5 3.5
交卷 1 名次 考试 成绩 2 3 4 5 6 7 8 9 10 11 12
90 74 74 60 68 86 92 60 78 74 78 64
问:这12名学生交卷名次与成 绩是否相关?
解:由于交卷名次是定序变量,因考试
成绩也应转换为定序变量,以求等级相 关,为此,以考试成绩排名次,但在78 分,74分和60分出现同分现象,这时应 取其平均名次:
(一)名词解释:
1.同序对NS 调查对象A在变量X和Y上的等级(xi,yi),
调查对象B在变量X和Y上的等级(xj,yj) 如果xi>xj,则yi>yj 称A和B为同序对 例如:A交卷是第2名xi, 分数是90分yi B交卷是第3名xj,分数是86分yj
同序对Ns: same ordered pair
这5对夫妇地位等级记作: (1,2)
(2,3) (3,4) (4,5) (5,1) 现在来计算每一对夫妇地位的等级差的 平方 (1-2)2 (2-3)2 (3-4)2 (4-5)2 (5-1)2
可以想象,等级差的平方和极小值是零,
它表示双方家庭都是严格按照高配高、低 配低的。它称作完全的正等级相关。 (1-1)2 (3-3)2 (2-2)2 (4-4)2 (5-5)2
第九章
社会统计学社会学测量尺度复习资料大纲总结
1、四种测量尺度:(1)定类尺度:按现象性质差异进行的辨别与区分。
测量结果形成定类变量或指标。
定类变量或指标确切的值是以文字表述的,可用数值标识,但仅起标签作用。
各类别间是平等的,没有高低、大小、优劣之分。
分类的原则:穷尽性或无遗性;互不重叠或互斥性属性:对称性;传递性(2)定序尺度:按现象顺序差异进行的辨别与区分。
测量结果形成定序变量或指标。
定类变量或指标确切的值是以文字表述的,可用数值标识,但仅起标签作用。
定序变量或指标各类别间有高低优劣之分,不能随意排列。
(3)定距尺度:按现象绝对数量差异进行的辨别与区分。
测量结果形成定距变量或指标。
定居变量或指标的值以数字表述,有计量单位可进行加减运算,不能进行乘除运算。
各类别间有大小之分,但没有绝对零点。
(4)定比尺度:按现象绝对差异与相对差异进行的辨别与区分。
测量结果形成定比变量或指标。
定比变量或指标确切的值以数字表述,有计量单位,可加减。
有绝对意义上的零点,可乘除。
2、测量尺度的作用:(1)决定数据的整理、显示方法。
(2)决定数据的分析方法。
(3)决定计算机的处理方法。
3、对测量尺度的判断:测量精度、计算方法、信息数量4、条形图和直方图的区别:条形图:是以长方形的长度(宽度相同)来表示次数或百分率的多少,为求清楚长方形之间可以分开(当然也可以不分),宽度没有意义。
直方图:又称矩形图,以一个矩形的面积(长宽)表示每组数值的次数或百分率的多少。
与条形图的不同。
条形图的宽度没有意义,直方图的长度与宽度均有意义;直方图各个矩形要相连排列,条形图可以分开。
5、累加次数:累加次数就是把次数逐级相加起来,分为两种;一种是向上累加(cf↑),一种是向下累加(cf ↓),其作用是使我们容易知道某值以下(或以上)之次数总和。
向上累积表示由低层向高层累加。
向下累积表示由高层向低层累加。
6、众值:众值(Mo)就是次数最多之值。
对于定类变项,以众值作预测所犯的错误是最小的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Txy
1 2
f11( f11 1)
1 2
f12 ( f12
1)
1 2
f33 ( f33
1)
四名学生的成绩等级
学生
数学
成绩等级 英语 统计学 心理学
A
4
2
4
1
B
3
3
3
2
C
2
1
2
3
D
1
4
1
4
个案对数 1 n(n 1) 1 4(4 1) 6
变量上的相对等级所能犯的误差
PRE= E1 E2
1 2
(nS
nd ) nd
nS
nd
E1
1 2
(nS
nd
)
nS nd
四名学生的数学等级与英文等级的关系:
G NS Nd 2 4 0.33 NS Nd 2 4
成负相关的关系
四名学生的数学等级与统计学等级的关系:
3、同分对(tied pair)
X同分对:设A (xi,yi)和B (xj,yj),如果xi=xj, yi yj,则称A和 B为x同分对,记作TxY同分对:设A (xi,yi)和B (xj,yj),如果xi xj,yi = yj,则称A和B 为y同分对,记作Ty
X、Y同分对:设A (xi,yi)和B (xj,yj),如果xi = xj,yi = yj,则称A和B为xy同分对,记作Txy
第九章 等级相关(定序-定序)
第一节 gamma相关系数和dy系数 第二节 肯德尔Tau系数 第三节 spearman相关系数
第一节 gamma相关系数和dy系数
一、基本概念和基本思路
统计学家Goodman和Kruskal的Gamma系数和萨 默斯(Somers)的dy系数 ,用于两个定序变量,系数 都介于-1和+1之间,绝对值越大表示相关程度越强, 正的表示正相关,负的表示负相关,这两个系数都具 有消减误差意义
G NS Nd 6 0 1 NS Nd 2 4
成正相关的关系
四名学生的数学等级与心理学等级的关系:
G NS Nd 0 6 1 NS Nd 2 4
成负相关的关系
Gamma 相关测量法属于对称相关测量法
三 单位个数众多的计算
nS n11(n22 n32 ) n21(n32 ) nd n31(n12 n22 ) n21(n12 )
高 9 10 6 25
中 8 30 12 50
低 3 5 17 25
合计 20 45 35 100
对于“高—高”9人来说, 共可得同序对数为:
9(30+12+5+17)=576
根据列联表中的频次计算Ns和Nd
yx 高
中
低 Ns=f11(f22+f23+f32+f33)+f12
高
f11 f21 f31 (f23+f33)+f21(f32+f33)
二,Gamma相关测量法
G NS Nd NS Nd
G 0,无相关 0<G<1,正相关 -1<G<0,负相关
Gamma系数具有消减误差意义
E1
1 2
(nS
nd
)
表示在预测或估计任何一对个案的相对等级可能犯的最大错误
E2 nd 表示以一对个案在一个变量上的相对等级来预测其在另一对
x
123
y
1 n11 n21 n31
2 n12 n22 n32
练习
住户人口密度与婆媳冲突之关系
婆媳关系
高
高
23
中
11
低8总数源自42住户密度中低
20
4
55
28
27
24
102
56
总数 47 94 59
200
计算住户人口密度与婆媳冲突之间的Gamma系数,并解释 其意义
四、 Gamma系数的检验
H0: 0 H1 : 0
设个案A在变量x和y具有等级(xi,yi),个案B 在变量x和y具有等级(xj,yj),如果xi>xjyi>yj, 则称A和B为同序对,记作Ns
2、异序对(different ordered pair)
设A (xi,yi)和B (xj,yj),如果xi>xj,yi<yj则 称A和B为异序对,记作Nd
试就以下数据,列举其中的
同序对、异序对和同分对 AB、AC:x同分对,
case
x
y
AD:同序对,AE:异序对
A
3
2
B
3
1
C
3
1
D
1
1
E
2
3
BC:xy同分对,BD:y同分对 BE:异序对
CD:y同分对,CE:异序对 DE:同序对
根据列联表中的频次计算Ns和Nd
经济
教育程度
合
收入 高 中 低 计
中
f12 f22 f32 +f22(f33)
低
f13 f23 f33
Nd=f31(f12+f22+f13+f23)+f21 (f12+f13)+f32(f13+f23)+f22(f13)
高中低
Y同分对(根据列计算):
高
f11 f21 f31
中
f12 f22 f32
低
f13 f23 f33
Ty=f11(f21+f31)+ f21(f31) +f12(f22+f32)+ f22(f32)+ f13(f23+f33)+ f23(f33)
基本思路:根据任何两个个案在某变量上的等级来预 测他们在另一个变项上的等级时,可能减少的误差比 例
个案对数 1 n(n 1) 2
同序对:某对个案在两个变量上的相对等级是相同的 异序对:某对个案在两个变量上的相对等级是不同的
ns代表同序对的总数 nd 代表异序对的总数
1、同序对(same ordered pair)
很好
15 69 61 59 204
75 157 128 109 409
五 dy相关测量法
dy
NS Nd NS Nd Ty
Ty 代表在因变量上同分的对数
dy测量不对称变量的相关
2
2
数学和英语成绩两个变量: ns 2,nd 4 数学和统计学成绩两个变量:ns 6,nd 0 数学和心理学成绩两个变量:ns 0,nd 6
ns和nd 相差越大,表示两个变量的相关越强 ns和nd 相差越小,表示两个变量的相关越弱 ns大于nd 表示两变量成正相关,ns小于nd 表示两变量成负相关
统计量:
z G
ns nd N(0,1)
1G2
n
双侧检验,拒绝域的临界值查表 Zα/2
练习 :在某地选取409名已婚男人,研究他们对母 亲的感情会否影响他们对婚姻的适应,并问是否 有总体推论价值。
婚姻适应
丈夫对母亲的感情
平淡 不错 良好 很好
差
32 41 26 28 127
一般
28 47 41 22 138