4相关测量法与测量层次

合集下载

社会统计学笔记

社会统计学笔记

1·社会学研究:就是运用科学的方法来搜集和分析社会事实,以理解社会现象之间的关系。

2·科学研究:就是运用客观的、逻辑的和系统的方法来搜集事实及分析事实。

3·社会学研究的整个历程,大致上可以分为三个阶段:(1)筹划,(2)执行,(3)总结。

4·初步探索步骤:(1)收集有关的文献,(2)咨询那些对研究的题目有经验、有知识的人,进行了解,(3)观察个案。

5·假设:就是根据我们对问题的了解,假定现象与现象之间的关系。

就是假定某一现象的变化与另一种现象的变化具有某种关系。

假设的方式:函数式(要求变项之数值有高低之分)、差异式(不存在高低之分)6·较为常用的研究方式:实验法、社会调查法。

(皆可验证假设)①实验法的逻辑:有意的改变A变项,然后看看B变项是否随着变化;如果B变项显然是随着A变项的变化而变化,就说明A变项对B变项有影响。

②社会调查法特点:在研究过程中不改变社会现状,只求就地取材,然后以统计方法推算变项与变项之间的关系。

7·能够有效地验证假设的实验法称为典型或理想实验法8·社会调查法可以分为两大类:一是叙述性调查(重点是报道社会事实,较少分析社会事实(即变项)之间的因果关系),一是解释性调查(目的是要证明不同的变项之间是否有因果关系)。

9·全体调查:就是从所有研究对象中搜集资料。

抽样调查:就是从全体的研究对象中科学的抽出一个数目较少的样本,然后据此样本的资料推论全体的情况。

10·个案研究:就是选择一个或几个个案(即研究对象),作深入的接触和观察,目的是对所研究的问题作深入的了解。

11·横剖研究:指的是在同一时期搜集资料,目的是理解各种社会现象(即变项)在某时期的相关情况的研究。

纵贯研究:是指在不同时期搜集的,目的在了解社会现象(即变项)在不同时期中的变动情况的研究。

12·纵贯研究分为两种:趋势研究、同组研究(指的是在不同时期调查相同的样本)。

社会统计学第四章相关测量法与变量层次

社会统计学第四章相关测量法与变量层次
▪ Lambda 相关测量法有两种形式。一种是对称形式 ,简写是λ系数,即不分自变量与因变量。另一种 是量不 ,对 一称 个形 是式 因, 变简量写。是λy系数,即要求一个是自变
2020/12/1
3
λ系数
E1的定义:
未知y与x有关之前,如果预测y值,唯一可资依据的就是y本 身的分布。由于y与x无关,所以只能根据y的行边缘和(与x 无关)去预测y,也即由y的行边缘和中最大者——众值,去 预测y,可能性最大。
2020/12/1
7
λ系数与尤拉Q系数
Q adbc 9 09-01 010 80 00.9 07 adbc 9 09 01 0108200
my My nMy
( 9 09) 0 -100 80 0 .8 20 -1 000100
2020/12/1
8
λ系数的缺点
Lambda相关测量法的特点是以众值作为预测的准则,不理会 众值以外的次数分布。因此,如果全部众值集中在条件次数 表的同一列或同一行中,则Lambda系数便会等于0.
Gamma系数
▪ 级序相关法的基本逻辑是要求出;根据任何两个 个案在某变量上的等级来预测他们在另一个变量 上的等级时,可以减少的误差是多少。
▪ 同序对与异序对:假设样本的全部个案数目是n ,就会组成1/2n(n-1)对个案。某对个案在两个变 量上的相对等级时相同,则成为同序对;如果是 不相同,则成为异序对。
表 青年人与其知心朋友的志愿
mx2n (m M yx(M Mxy)My) ( 2 8 4 ( 2 4 1 ) 1 ( 2 ) 0 ( - 5 8 4 0 4 5 7 1 ) ) ( -0 5 4 5) 0 0 .4
y
my My nMy
( 2 84 17 ) -5 02 60.52 10 -500 50

测量的层次

测量的层次


1.标记 识别的记号,当数字被用做标记时,它并不是 表示数量多少,也不能做数量运算。 例如,足球运动等活动用号码区分运动员,3号 球员、6号球员、9号球员,但是不能说3号运 动员+6号运动员=9号运动员。 2.类别 变量不同状态的度量。 例如,性别:男、女



例如,将“文盲与半文盲” 、“小学毕业”、 “初中毕业”、“高中或中专毕业”、“大专 或大学毕业及以上”


分别于数字1、2、3、4、5来代表。12345,
但是不能说1+2=3。

2)某些时候,定序层次的测量结果可近似的看 作是定距层次的运用。 例如,“非常赞成” 、“比较赞成” 、“中 立”、“不太赞成” 、“很不赞成”。


四、定比测量

Hello!
又称比例测量或等比测量,除具有上述三种测
量的全部性质之外,具有一个有实际意义的绝
对的零点,其数据可以加减或乘除运算。

例如,年龄、工资、出生率、性别比、离婚率 张三工资6800、李四3400,那么6800 ÷3400=2,张三的工资是李四的2倍。
定比测量与 定距测量如 何区分?


此时,研究者可以认为,这样的变量在测 量的尺度上的取值基本上是平均划分的, 即“非常赞成” 与“比较赞成” 之间的距
离也基本上等同于“比较赞成” 与“中立”
之间的距离。
三、定距测量

Hello!
又称等距测量或区间测量,它不仅能将 社会现象或事物区分为不同的类别、不 同的等级,而且可以确定它们相互的间 隔距离和数量差别。

例如,人的智商正常在90~110之间。 张三智商125、李四智商110,那么,张三智商比 李四智商高15, 125-110=15。 “三九” 天,测量到漠河的气温-25℃,三亚气温 15℃,对该结果分析: 1)仅仅了解漠河与三亚两地的气温,是定类测量 的结果 2)了解到三亚气温比漠河气温高,则是定序测量 的结果

社会统计学第四章相关测量法与变量层次

社会统计学第四章相关测量法与变量层次
n8(n9)
同分对:
Txy
n(1 n1 1) 2
n9
(n9 2
1)
例:计算G系数与dy系数
文化程度 婚姻美满
美满
大学 9
中学 16
小学 5
一般
8
30
18
不美满
3
4
7
同序对:9(30+18+4+7)+8(4+7)+16(18+7)+30(7)=1229 异序对:5(8+30+3+4)+18(3+4)+16(8+3)+30(3)=617 同分对:9(16+5)+16(5)+8(30+18)+30(18)+3(4+7)+4 (7)=1254 G系数=0.33 dy系数=0.22
E2的定义:
当已知y与x有关之后,如果再去预测y值,则可借 助x预测y。即用各类x条件下,y的条件分布中的 众值去预测y,可能性最大。
分析:
E2 = n —∑max(nij)
1)E2 = 0 (即∑max(nij) = n,即各类x条件下的 众值皆为最大值)
2)E2 = n (即∑max(nij) = 0,即各类x条件下的 众值皆为最小值)
例:对称与不对称λ系数
▪ 表 青年人与其知心朋友的志愿
自己志愿
快乐家庭
知心朋友志愿
理想工作
增广见闻
总数
快乐家庭
28
9
3
40
理想工作
2
41
7
50
增广见闻
2
4
4
10

社会统计学第四章(一)

社会统计学第四章(一)
4
5
例子1:
6
例子2:
7
λ和λy数值的含义:
①两个定类变量的相关强度。 ②用一个变量来预测另一个变量的时候,能够消减 的误差比例。
8
例子3:
9
二、tau-y相关测量法:tau-y
• • • • •
适用于分析两个定类变量的相关关系。 分析不对称关系。 具有消减误差比例的意义(PRE)。 取值范围:【0,1】。 逻辑:根据X的取值预测Y的取值时,所能 消减的误差比例。
21
本章结束!
22
3
第一节 两个定类变量: λ,tau-y
一、 Lambda相关测量法: λ和 λy
• • • • • 适用于分析两个定类变量的相关关系。 λ分析对称关系,λy分析不对称关系。 具有消减误差比例的意义(PRE)。 取值范围:【0,1】。 逻辑:根据一个变量的取值预测另一个变量的 众值时,所能消减的误差比例。
适用于分析两个定序变量的相关关系。 分析对称关系。 具有消减误差比例的意义(PRE)。 取值范围:【-1,1】。 逻辑:根据任何两个个案在某变量上的等级 来预测它们在另一个变量上的等级时,能减 少的误差比例。
20
G值的示用一个变量预测另一个变量时能够消减的误 差比例。
10
11
tau-y数值的含义:
①两个定类变量的相关强度。 ②用X来预测Y的时候,能够消减的误差比例。
12
• 对称关系可用Lambda测量法,而不对称关系最好 用tau-y测量法。
13
14
• 课堂作业: 以下是男、女青年对古典音乐是否喜爱的抽样调查: 请计算相关系数,并解释含义。


喜爱 无所谓 不喜爱
第二篇
统计叙述:单变量与双变量

第四章 相关测量法预测量层次

第四章  相关测量法预测量层次

LOGO
二、dy相关测量法(萨默斯Somers dy系数) Gamma系数属于对称相关测量法 如果认为某定序变项是自变项 (X), 另一个变项是因变项 (Y),最好采用 适宜于简化不对称关系的dy系数。
LOGO
N N dyx= N N T
s d s d
y
(x是自变量、y为因变量) 其中:Ns是同序对数 Nd是异序对数 Ty是只在因变量y上同分的对数
LOGO
①dyx 是非对称的测量 X Y ②-1dyx1 ③具有PRE意义
LOGO
个案众多时同序对、异序对及同分对的求法。 按X、Y由小到大排列的抽象的次数分布表: ns--同序对的数目;右下余子式 nd--异序对的数目;左下余子式 TY--Y的同分对的数目;同排后余子式
LOGO
dy=
Ns N d 6003 2204 N s N d Ty 6003 2204 4141
dy=0.308
LOGO
结论(1)婆媳冲突是与住户人口 密度成正比,即住户的人口密度 愈高会引起婆媳的冲突愈大,
(2)如果以住户人口密度的高低 预测估计婆媳冲突的大小,可以 消减30.8%的误差。
X 2 f12 f22 f32
Y
1 2 3
1
f11 f21 f31
3
f13 f23 f33
例:在某城市调查200户人家,想知道住户的人 口密度与婆媳冲突是否有关系。
交互分类之后的次数分布如下表:
LOGO
婆媳 冲突 高 中 低
住 高 23 11 8 中 20 55 27

密 低 4 28 24

LOGO
第一节 两个定类变量的相关
一、Lambda相关测量法(对称与不对称) 基本逻辑:以一个定类变量值来预测另一个变量 值时,若以众数作为预测的准则,则可减少的误 差是多少。

4第四章 测量法

4第四章 测量法

3、累积量表
由一组表示不同社会距离或社会交往程度的
陈述组成,要求被试根据自己的看法对这些
陈述表态,测量人们相互间交往的程度、相
互关心的程度或者对某一群体所持的态度及
所保持的距离。 鲍格达斯社会距离量表
表一 测量人们对同一群体的态度
愿意 不愿意
★一组问题之间具有较强 的逻辑关系 ★除特例外,量表本身的 逻辑结构使我们可以进行 推论:当一个人拒绝了量 表中一项关系,那么他也 必将拒绝这一关系后面所 有更强的关系。
★定距测量和定比测量的的唯一区别就是是否 有真实意义的零点的存在.(*、/)
(五)不同测量层次间的关系
测量层次越高,测量结果所含的信息量越大 高层次测量可以做低层次处理
定性测量举例:性别
定序测量举例:重视程度
不是很重 要
一般重 要
很重要
生命中最很 重要的事情
定距测量举例:IQ
95 100 105 110 115
(三)定距测量(Interval Measures)
★ 也称为间距测量或区间测量。它不仅能够将社 会现象或事物区分为不同的类别和等级,而且可 以确定它们相互之间的间隔距离和数量差别,如 智商。 ★ 定距测量是以等距离的测量单位,去衡量不 同的类别或等级间的距离。 ★定距测量没有绝对零点,因此这一测量类型所 得出的数据只能做加减,不能做乘除等运算.(+、-)
定比测量举例:收入
0
¥1000
¥2000
¥3000
¥4000
¥5000
¥6000
练习:
用哪一种测量层次来测量下列变量? 1、种族 2、在一场比赛中的排名顺序(第一、二、三等) 3、家庭中的子女数目 4、国家的人口总数 5、对核能的态度(非常支持、支持、反对、非常 反对) 6、籍贯 7、政治倾向(非常自由、有些自由、有些保守、 非常保守)

社会研究的统计应用常考内容

社会研究的统计应用常考内容

社会研究的统计应用第一章科学方法与社会研究历程1、定类测量层次定类层次是指变项的值只能把研究对象分类,即只能决定研究对象是同类抑或不同类,具有=与≠的数学特质。

定类层次有两个原则,一是互斥性,即类与类之间要互相排斥,每个研究对象只能归入一类;另一个是无遗性,即所有研究对象均有归属,不可遗漏。

适用于简化一个定类变项资料的方法,有次数分布、比例、比率、图示和对比值等。

2、定序测量层次定序层次是指能确定值的次序,即变项的值能把研究对象排列高低或大小,具有>或<的数学特质。

定序层次包括了定类层次的特质。

3、定距测量层次定距层次是指能够确定值与值之间的距离,即变项之值与值间的距离是可以知道的,因为具有加与减的数学特质。

定距层次包括了定序与定类层次的特质。

4、定比测量层次定比测量层次是最高的测量层次,其数值中的零值是绝对的、固定的,因而除了具备分类、排序以及加减的特质外,还具有×与÷的数学特质。

第二章简化一个变项之分布第一节基本技术一、定类层次1、次数分布(f):变项内每一个值在原资料中出现的次数情况。

2、比例(p):就是将每类的次数(f)除以总数(N)。

3、比率:就是把计算比例时的所用的基数变大,使读者容易领会,如可转化为百分率、千分率、万分率等。

4、对比值:对比值就是将两类数值相除,得到一个比值。

二、定序层次1、累加次数(cf):就是把次数逐级相加起来。

分为两种,一种是向上累加,另一种是向下累加。

其作用是使我们容易知道某值以下或以上之次数总和。

2、累加百分率(c%):就是将各级的百分率逐级相加。

三、定距层次1、组限:就是每组的范围,包括上限和下限。

统计表上所标示的组限不是真实的组限。

真实下限=标示下限-0.5;真实上限=标示上限+0.5。

2、组距:就是每个组的宽度,即组的真实上限与真实下限之差。

3、组中点:就是真实上限与真实下限的平均数。

4、矩形图:以一个矩形的面积(长×宽)表示每组数值之次数或百分率的多少。

测量层次2:定距测量与定比测量

测量层次2:定距测量与定比测量
《社会调查与统计分析》
第五章 测量
知识点3 测量层次2:
定距测量与定比测量
学习导航
测量层次
定距测量 定比测量 四种测量层次的联系
测量层次
史蒂文斯于1951年创立了测量层次(Levels of Measurement) 分类法。
测量层次
定类测量
定序测量
定距测量
定比测量
1. 定距测量(interval measures)
温度
天气预报:沈阳:最高温度3℃,最低-7℃
大连:最高温度6℃,最低-2℃
两地最高温度相差3℃
沈阳最低温度较大连最低温度低5℃
大连最高温度是沈阳最高温度的2倍
2. 定比测量(ration measures)
定比测量也称为等比测量或比例测量,是一种能够测量 事物间比例、倍数关系的测量方法。
定比测量的特点
定距测量也称为间距测量或区间测量。它不仅能够将社 会现象或事物区分为不同的类别、不同的等级,而且可 以确定它们相互之间的间隔距离和数量差别。
定距测量的特点
定距测量可将定距指标转换为数字, 不仅能反映社会现 象的类别和序列,而且能反映社会现象的具体数量,计 算出它们之间的距离,可进行加减运算。 定距测量中的“零”并不是绝对的“无”,而是以某种 人为的标准设置的标志值。
定类测量 定序测量 定距测量 定比测量
类型(=、 次序(<、 间距(+、 比率(×、
≠)
>)
-)
÷)










3. 四种测量层次的联系
(2)测量层次比较高的变量可以转等级的测量并不是必须的。 比如:年龄——定比

测量的层次

测量的层次

四、定比测量
Hello!
又称比例测量或等比测量,除具有上述三种测 量的全部性质之外,具有一个有实际意义的绝 对的零点,其数据可以加减或乘除运算。
例如,年龄、工资、出生率、性别比、离婚率
张三工资6800、李四3400,那么6800 ÷3400=2,张三的工资是李四的2倍。
定比测量与 定距测量如 何区分?
例如,将“文盲与半文盲” 、“小学毕业”、 “初中毕业”、“高中或中专毕业”、“大专 或大学毕业及以上”
分别于数字1、2、3、4、5来代表。12345, 但是不能说1+2=3。
2)某些时候,定序层次的测量结果可近似的看 作是定距层次的运用。
例如,“非常赞成” 、“比较赞成” 、“中 立”、“不太赞成” 、“很不赞成”。
的结果
3)进一步了解到三亚气温比漠河气温高40℃, 15 ℃-(-25 ℃ )=40 ℃,则是定距测量的结果。
1.注意事项
定距测量中的“0”不具有数学中的含义,而是表 示特定的意义,如水的温度是0℃。
所以我们可以说50 ℃与40 ℃之间的差距等于30 ℃与20 ℃的间的差距,但是40 ℃并不比20 ℃热 一倍。
层次。
一、定类测量
Hello!
又称类别测量或定名测量,测量层次最低。 它本质是一种分类体系,将研究对象的不 同属性或特征加以区分,标以不同名称或 符号,确定其类别。
可分为两类:标记和类别
1.标记 识别的记号,当数字被用做标记时,它并不是
表示数量多少,也不能做数量运算。 例如,足球运动等活动用号码区分运动员,3号
1.测量的层次从低到高 2.高层次的测量具有低层次的功能 3.明确不同的测量层次,在数据分析中采用相对应

测量的内容与层次

测量的内容与层次
组成该变量的

例如对人们的性别、婚姻状况、宗教信 仰等特征的测量就是定性测量。人们将研 究对象分成了“男性与女性”,“已婚、 未婚、离婚”,等等。 • 在定性测量中,我们唯一能判断的就是 两个人是一样的还是不一样的。例如,婚 姻状况,我们只能看出已婚还是未婚。
定序测量

定序测量也称为等级测量或顺序测量。根据 变量的属性进行逻辑排列就是定序测量。该测量 层次描述了变量的属性沿着某个维度的排列序列。 比如,社会经济地位是由高、中、低三种属性组 成的。测量人们的文化程度,可分为文盲、半文 盲、小学、初中、高中、大专、大学及以上。定 序测量除了能看出两个人是否一样,还可以说一 个比另一个更怎样。
110
115
定比测量 举例:收 入(单位 元)
0
1000
2000
3000
4000
测量层次总结
• 上述四种测量层次是由高到低,逐渐上升 的。高层次具有低层次的所有功能,即它 既可以测量低测量层次所测量的内容,也 可以测量低层次测量所无法测量的内容。 同时,高层次的测量还可以作为低层次的 测量处理。比如年龄是个定比变量。但是 若只需要观察年龄与某些定序变量之间的 关系(如依年龄再分组,分为年老、中年 和年轻。),那么年龄也可以作为定性变 量。
不同测量层次采用的统计方法
• 测量定类与定类(或定序)变量之间的关系,我们选用λ系数, 比如调查不同性别学生对抽烟的赞成或反对的差别可以用入系数测量。 测量结果采用卡方检验。入系数取值为0到1之间,没有消减误差比的 作用。 • 测量定序与定序变量之间的关系采用G系数,G系数取值在-1到1 之间,例如对不同教育程度的工人收入水平进行测量可用G系数,对 样本结果的检验采用Z检验,首先将G系数转化为Z值,然后采用Z检验。 G系数同时具有消减误差比的作用,也就是用X预测Y值时可以消减G取 值的误差比。 • 测量定类(或定序)与定距变量的关系通常用E系数,或E2系数。 E取值为-1到1之间,E系数本身没有消减误差比作用,但E2系数具有消 减误差比作用。比如调查不同职业者的收入,收入这里为定距变量, 可用E系数计算二者关系,结果采用F检验。 • 定距与定距变量之间的关系用r系数测量,r取值为-1到1之间,为 对称系数,r2具有消减误差比作用,比如调查不同年龄工人的收入状 况,年龄与收入关系的统计可以用r系数计算,结果采用F或t检验。

统计学小知识四种测量尺度与变量状态

统计学小知识四种测量尺度与变量状态

统计学小知识四种测量尺度与变量状态在统计分析实际运用上,变量决定于所使用测量方法或测量尺度(scale),对于同一个测量对象,可以利用不同的测量尺度来测量,得到不同的测量结果,也就是不同的测量变量。

从测量的层次来看,测量尺度可以区分为名义、顺序、等距、比率四种层次,因此变量又可以分为名义变量、顺序变量、等距变量和比率变量。

这四种变量分别由四种对应的量尺所测得。

相同的变量名称,可以用不同的量尺来测量,反映出不同的测量内容。

01四种尺度的性质四种测量尺度中,最粗略者称为名义尺度(nominal scale)。

名义尺度的测量方式是针对被观察者的某一现象或特质,评估所属类型种类,并赋予一个特定的数值。

由名义尺度所测量到的变数,称为名义变量。

如性别(男、女)、籍贯(北京市、长春市等等)、种族(本省、外省、原住民)、婚姻状态(未婚、已婚、离婚、丧偶等)、就读学校等等。

较高一个等级的测量尺度是顺序尺度(ordinal scale),它是指对于被观察者其某一现象的测量内容,除了具有分类意义外,各类别间存在特定大小顺序关系。

以顺序尺度测量到的变量称为顺序变量,如大学教授等级(教授、副教授、助理教授、讲师)、教育程度(大学以上、大学、高中、初中、初中及以下)、社经地位(高、中、低)等,皆为顺序尺度所测得之顺序变量。

第三,等距尺度(interval scale)(或称间距尺度)的测量,是针对被观察者的某一现象或特质,依某特定的标准化单位,测定程度上的特性。

等距尺度测量得到的数值,除了具有分类、顺序意义外,数值大小反应了两个被观察者的差距或相对距离。

以等距尺度测量得到的变量,称为等距变量,其数值兼具分类、次序和差距的意义。

如以温度计量出的'温度’、以考试决定的'成绩’、以智力测验测得的'智商’等。

等距尺度的一个重要特性,是其单位只有相对的零点,而无绝对的零点。

相对零点的使用,使得数值与数值的比值,仅具有数学的意义,而缺乏实务意义,研究者应避免直接取用两个等距变量的数值相乘除比较。

SPSS-4-多变量的描述性统计资料

SPSS-4-多变量的描述性统计资料

系数法。
dy =(P+Q)/(P+Q+Ty)
P:同序对数, Q:异序对数,Ty:具有相同Y值而不同X值的同序对数。
四、相关测量法和测量层次
2、两个定序变量:Gamma , dy
(3)SPSS的实现 Analyze → Descriptive Statistics → Crosstabs → Statistics
相关系数。 结果显示: t2(年龄)与t7(政治成绩)之间的积矩相关系数R为-0.513,
说明年龄越大的考生所取得的政治成绩越低。
下表中第二行,Ordinal by Ordianl Spearman Correlation是针对定序定序变量测得的Spearman(斯皮尔曼)相关系数。即将两定距变量的值按大 小顺序排列,只使用其定序的数学特征,来检测两数列秩序之间的相互关联。
PRE的数值越大,就表示以X值预测Y值时能够减少的误差所占的比例越大; 也就是说,X与Y的相互关系越强。若E1 = E2 ,表示用X预测Y产生的误差与不 以X来预测Y所产生的误差相等,则PRE=0,反映X与Y是不相关的。
四、相关测量法和测量层次
1、两个定类变量:Lambda(λ) ,tau-y(τ)
若两个变量都属于定类测量层次,可用Lambda相关测量法, 也可用古德曼(Goodman)和古鲁斯卡(Kruskal)的tau-y相 关测量法。两者各有不同特色,但相关系数都具有PRE的意义。
(1)λ相关测量法 λ是基于消减误差比例的原理(PRE)上的相关测度,λ反映了当用一个变
量的值来预测其它变量的值时误差的减少量。它是一种对称关系 (Symmetrical)的测度,即两变量不区分自变量和因变量,因而可以计算三 种不同的λ值,一种是两变量对称考量时的λ值;还有两种是两变量处于不对 称考量时,以行变量作为因变量的λ值,以及以列变量作为因变量的λ值。这 三种方法通常不会产生相同的λ值,因此,必须注意两变量的对称关系,若 是非对称的,要指明哪一个是因变量,即最令人感兴趣的被预测的那个变量。 当要计算λ统计量时,SPSS将显示出这个对称的λ和两个不对称的λ三个值。

社会统计学社会学测量尺度复习资料大纲总结

社会统计学社会学测量尺度复习资料大纲总结

1、四种测量尺度:(1)定类尺度:按现象性质差异进行的辨别与区分。

测量结果形成定类变量或指标。

定类变量或指标确切的值是以文字表述的,可用数值标识,但仅起标签作用。

各类别间是平等的,没有高低、大小、优劣之分。

分类的原则:穷尽性或无遗性;互不重叠或互斥性属性:对称性;传递性(2)定序尺度:按现象顺序差异进行的辨别与区分。

测量结果形成定序变量或指标。

定类变量或指标确切的值是以文字表述的,可用数值标识,但仅起标签作用。

定序变量或指标各类别间有高低优劣之分,不能随意排列。

(3)定距尺度:按现象绝对数量差异进行的辨别与区分。

测量结果形成定距变量或指标。

定居变量或指标的值以数字表述,有计量单位可进行加减运算,不能进行乘除运算。

各类别间有大小之分,但没有绝对零点。

(4)定比尺度:按现象绝对差异与相对差异进行的辨别与区分。

测量结果形成定比变量或指标。

定比变量或指标确切的值以数字表述,有计量单位,可加减。

有绝对意义上的零点,可乘除。

2、测量尺度的作用:(1)决定数据的整理、显示方法。

(2)决定数据的分析方法。

(3)决定计算机的处理方法。

3、对测量尺度的判断:测量精度、计算方法、信息数量4、条形图和直方图的区别:条形图:是以长方形的长度(宽度相同)来表示次数或百分率的多少,为求清楚长方形之间可以分开(当然也可以不分),宽度没有意义。

直方图:又称矩形图,以一个矩形的面积(长宽)表示每组数值的次数或百分率的多少。

与条形图的不同。

条形图的宽度没有意义,直方图的长度与宽度均有意义;直方图各个矩形要相连排列,条形图可以分开。

5、累加次数:累加次数就是把次数逐级相加起来,分为两种;一种是向上累加(cf↑),一种是向下累加(cf ↓),其作用是使我们容易知道某值以下(或以上)之次数总和。

向上累积表示由低层向高层累加。

向下累积表示由高层向低层累加。

6、众值:众值(Mo)就是次数最多之值。

对于定类变项,以众值作预测所犯的错误是最小的。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
其它级序相关测量法:肯德尔的tau系数和斯皮尔曼的rho系数 (1)tau系数有三种:tau-a、tau-b、tau-c。他们都适于分析对称关系,系
数值没有消减误差比例的意义。 tau系数的基本逻辑,是计算同序对数与异序对数之差在全部的可能对数 中所占的比例。 (2)rho系数:特点是在计算每个个案在两个变项上的等级时,不仅要区 别二者的高低差异,而且还要计算二者差异的确切数值。 rho是对称相关测量法,要求同分情况不多,统计值-1~+1,表示相关的 程度和方向,其平方值具有消减误差比例的意义。
分析一个定序变量与一个定距变量的相关时,除了可以应用相关比率系 数外,也有些社会学研究将定序变量看作时定距变量,因此采用皮尔逊 积距相关系数,甚至进行线性回归分析。
如教育水平分高、中、低,本来是定序变量,但我们可以给分数如下: 高=2;中=1;低=0,然后将这些分数当作定距资料来分析。
如果我们坚持严谨的科学态度,就不按上面的方法做。然而不少社会学 研究抱着“虽不中亦不远矣”的态度,还是将定性资料看作定距资料处 理,为求方便统计分析。当前大部分社会学研究者还是接受这个做法。 其中的一个重要原因,是在积距相关与回归分析法的基础上比较容易进 行多变项的统计分析。
第七节 综合
1、进行统计分析时,先要简化每一个变项的分布,可运用次数、百分率、 集中趋势测量法和离散趋势测量法等统计奇数。
2、了解每个变项的情况后,就要进一步分析一个变项与另一个变项之间的 关系。其基本方法是把资料作交互分类,形成条件次数表。
3、在选择相关测量法时,首要准则是变项的测量层次,其次是关系的对称 与否。当前社会学研究中常采用的具有消减误差比例意义的相关测量法 具有以下七种:
因此,b值是表示自变项对依变项的影响的大小和方向,它是一个分析不 对称关系的统计法。
回归系数b的含义: b值表示自变量对因变量的影响的大小与方向;(结合P102例题说明) b = △Y / △X b值没有上限,社会学应用中,很少用b值来表示两变量间的相关程 度。
2.积距相关Leabharlann 量法(对称) Pearson相关系数r:测量两个变项的相关程度与方向. 公式(P 103 )
2.tau-y相关测量法(不对称) (1)特点:在计算系数值时会包括所有的边缘次数和条件次数。 (2)计算公式:
(3)tau-y在计算系数值时,会包括全部的边缘次数和条件次数,所以敏 感度较高,具有消减误差比例的意义。 因此,如果是不对称的关系,最好选用tau-y来简化两个变项的相 关情况。此外也可以选用phi相关系数、列联相关系数、V相关系数等方 法来测量两个定类变项的关系。它们都是假定两变项的关系是对称的, 但其统计值没有消减误差比例的意义。
量上的等级时,可以减少的误差是多少; 公式推导:G=(Ns-Nd) / (Ns+Nd). G的绝对值愈大,表示估计时所犯的错
误可能性愈小; 前面提到的尤拉Q系数是Gamma系数的一种特殊方式,当两个定序变项都
是二分的,则Q=G
2. dy相关测量法(不对称) 如果认为两个定序变量,其中一个是自变量(X),另一个是依变量(Y),
(3)Gamma系数:统计值-1~+1,表示相关的程度与方向,分析最适用于分 析两个定序变项之间的对称关系。
(4)dy系数:统计值-1~+1,表示相关的程度与方向,该方法假定两个定 序变项之间的关系不对称。
(5)简单线性回归分析:分析两定距变项的不对称关系。其作用是以直线 回归方程式Y’=bX+a来运算自变项(X)的数值,从而预测或估计依变项 (Y)的数值。方程式中的回归系数b,显示自变项对依变项的影响的大 小与方向,但其数值大小随变项的衡量单位而定,不是由-1~+1.
r系数所要表示的,是以线性回归方程式作为预测的工具时所能减少的误差 比例。因此,如果r系数值越大,就表示线性回归方程式的预测能力越强。
在社会学研究中,通常是先计算r系数值,然后才决定是否运用简单线性回 归分析法来预测数值。如果r系数值很小,就不要用线性回归方程来作预测, 因为那样做所犯的错误会很大。
(1)Lambda系数:统计值0~1,分析两个定类变项的关系,也可分析一个 定类变项与一个定序变项的关系。它有两种形式:__假定是对称关系, ___假定是不对称关系。
(2)tau-y系数:统计值0~1,分析两个定类变项的关系,也可分析一个定 类变项与一个定序变项的关系。只适合于分析不对称关系。在分析两变 项间的相关时,其敏感度高于Lambda。
第二节 两个定序变项: Gamma, dy
(1)Gamma系数适用于分析对称关系,dy系数适用于分析不对称关系。但两者 的系数值在-1至+1之间,既表示相关的程度,也表示相关的方向,而且都 具有消减误差的含义。
(2)Gamma系数与dy系数统称为级序相关法,该方法的基本逻辑是要求:根据 任何两个个案在某变项上的等级来预测他们在另一个变项上的等级时, 可以减少的误差是多少。
Lambda,tau-y测量法; 将定序变看作定类变量。虽然损失了定序变量的数学性质,但方便
了统计工作,故经常被采用。
注:相关系数值在相互比较时,意义更加突出。但是,要进行相互比较,就 要尽可能采用同样的相关测量法。
第六节 定序变项与定距变项:相关比率
如果遵守变项的测量层次准则,适合的统计法是贾斯彭的多序相关系数,这 是对称相关的测量法,系数值由-1至+1,可作消减误差的解释。但该方 法要假定两变项具有直线的相关,且要假定:如果定序变项改用定距层 次来测量,则其数值会作常态分布。因而颇多社会学研究改用相关比率, 即将定序变项。看作定类变项。
比较E值与r值,如果两值相差愈大,变项之间的关系越可能是非线性的。 然而,将E与r比较,只能知道非线性的程度,不能反映曲线的形状。
第五节 定类变项与定序变项:Lambda,tau-y
如果遵守变项的测量层次准则,适合的统计法是威尔科森的区分系数,其基 本逻辑是根据各个个案在定类变项上所属的类别来估计他们在定序变项 上的相对等级,故此是属于不对陈相关的测量法,其系数值由0至1,但 没有消减误差比例的意义。
则用测量不对称关系的萨默斯dy系数。 dy系数公式:dy = ( Ns – Nd ) / ( Ns + Nd + Ty ) dy的系数值通常
小于Gamma系数值,因为dy公式中分母的数值较大。 注意:原则上用dy分析不对称关系,Gamma分析对称关系。然而颇多社会
学研究即使是区分了自变量与依变量,也选用Gamma系数。这种做法,不 够严谨,但大致可以接受。一般来说,选择相关测量法的首要准则是变 量的测量层次。至于关系是否对称,是属于次要的考虑。
第四章 相关测量与测量层次
第一节 两个定类变项: Lambda, tau-y
mbda相关测量法(对称与不对称) (1)基本逻辑:以一个定类变项的值来预测另一个定类变项的值时,如果以
众数作为预测的准则,可以减少多少误差。 (2)两种形式: 对称形式: 不对称形式:
(3)缺点:比较粗略,不够灵敏。它以众值为预测的准则,不理会众值以外 的次数分布。若众值集中在条件次数表上的同一行或同一列,则Lambda 相关系数为0。
第三节 两个定距变项:简单线性回归与积距相关
1.简单线性回归分析(不对称) (1)根据一个直线方程式,以一个自变项(X)的数值来预测一个依变项(Y)的数值。
这个方程式是: Y’=bX+a.
X是自变项数值,b为回归系数,表示回归线的斜率,a是截距,即回归线与Y轴的 交点。
(2)假设条件:自变量X与因变量Y的关 系具有直线的性质。 (3)图中的回归线由均值构成,原则上 以之来预测Y值所犯的错误是最小的。 (4)回归分析法的目的,是要找出一个 错误最小的方法来预测依变量的数值. (5)绘制回归线的准则:最小平方法。 其目的是使回归方程预测时所犯的误差 总数最小。
(6)积距相关系数:分析两定距变项的对称关系,统计值由-1~+1,其平 方值r2具有消减误差比例的意义。R系数值还可表示简单线性回归方程式 在预测时的准确程度。但r系数是假定两变项间具有直线关系,若两者的 关系显然是非直线性,则用其它方法,比如相关比率。
(7)相关比率:分析一定类变项与一定距变项的不对称关系,也可分析定 序变项与定距变项的关系。统计值0~1,数值E2具有消减误差比例的意义 。
简单线性回归应注意的两点: 1. 要求X与Y的关系是直线的,即两者在坐标图上的散点分布有直线的
趋势;否则(呈曲线趋势或无规律)不适用; 2. X与Y的关系是非对称的,只能用X来预测Y,而不能Y用来预测X;
回归系数b的意义:b的大小表示X对Y的影响有多少。B值是代表每增加一 个单位的X值时,Y值的变化有多大。若b=0,表示X对Y没有影响,即 X变但Y不变;若b值愈大,表示x变化时所引起的Y变化愈大。B值有 正负之分,不限于-1至+1,若是正值就表示X对Y有正向效果。
(3)同序对:某对个案在两个变项上的相对等级是相同的;Ns表同序对总数。 异序对:某对个案在两个变项上的相对等级是不同的;Nd表异序对总数。 如果Ns与Nd的相差愈大,表示两变项的相关愈强。如果Ns大于Nd,表示两变项
成正比,反之成反比。
1. Gamma相关测量法(对称) 基本逻辑:根据任何两个个案在某变量上的等级来预测他们在另一个变
以上的相关测量法是根据条件次数表来计算统计值,而不是根据条件百分 表。但如果把根据条件次数表计算出来的相关统计值写在条件百分表上 ,会使我们的研究结果既详尽又精简。
r系数基本上是一种对称相关测量法,即不用区分自变量与依变量。然而颇 多社会学家不愿吹毛求疵,只要两个变项都是定距变项,则无论关系是否 对称都应用r系数。该做法与Gamma系数的应用情况相似。不够严谨,但可 以接受。 其次,r系数与简单线性回归分析都是假定X与Y的关系具有直 线的性质。如果这个假定不符合实际情况,就会犯错误。
相关文档
最新文档