SPSS-4-多变量的描述性统计资料

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Column: 选中,显示列百分比;例:显示占 列变量“教育水平”中“高”的总人数的百分 比。
Total: 选中,显示总和百分比;例:显示占 所有被调查人数的百分比。
三、简化相关与消减误差
1、相关系数(Coefficient of association) 相关测量法就是以一个统计值表示变量与变量之
二、交互分类表 Cross table
右图是志愿与教育水平的 交互分类表,且只是频数表, 没有显示百分比。
显示百分比:Analyze → Descriptive Statistics → Crosstabs → Cells
在左图左下角Percentages栏显示的就是百 分比选项:
Row:选中,显示行百分比;例:显示占行 变量“志愿”中“快乐家庭”的总人数的百分 比。
社会学研究的主要目标是预测或解释社会现象的变 化。
如,有一种社会现象Y(志愿),我们想预测或理 解其变化的情况。预测或解释时,难免有误差(即错 误);假定另一种社会现象X(教育水平)是与Y有关 系的,如果我们根据X的值来预测Y的值理应可以减少 若干误差。而且,X与Y的关系越强,所能减少的预测 误差就越多;换言之,所消减的误差有多少,可以反 映X与Y的相关强弱程度。
一、相关的概念
正相关
负相关
不相关
线性相关-正相关
非线性相关1
非线性相关2
一、相关的概念
4、相关除了注意强弱与方向这两个性质外,还要注意 两个变量是否有因果关系。
两个变量的相关可能有因果关系(当原因变量发生 变化时,结果变量也随着发生变化);
两个变量的相关也可能没有因果关系,而是发生共同变化。
X→ Y 一个变量为因X(称为自变量,Independent variable) 一个变量为果Y(称为因变量,dependent variable)
PRE的数值越大,就表示以X值预测Y值时能够减少的误差所占的比例越大; 也就是说,X与Y的相互关系越强。若E1 = E2 ,表示用X预测Y产生的误差与不 以X来预测Y所产生的误差相等,则PRE=0,反映X与Y是不相关的。
四、相关测量法和测量层次
1、两个定类变量:Lambda(λ) ,tau-y(τ)
三、简Baidu Nhomakorabea相关与消减误差
4、消减误差比例(PRE测量法)
现在假定不知道X的值,我们在预测Y值时所产生的全部误差是E1(见图1); 如果知道X的值,我们可以根据X的每个值来预测Y的值;假定误差总数是E2(见 图2),则以X的每个值来预测Y值时所减少的误差就是:E1 - E2(见图2的阴影 部分)。这个数值( E1 - E2 )与原来的全部误差( E1 )相比,就是消减误差 比例。用公式表示为: PRE = ( E1 - E2 )/ E1
二、交互分类表 Cross table
2、SPSS的实现
Analyze → Descriptive Statistics → Crosstabs
在左图中将因变量志愿[y]选到行 中(Row),将自变量教育水平[x] 选到列中(Column)。
左图中Layer是分层变量框,如果 还要考察不同性别的人关于志愿与 教育水平的关系,可以将性别变量 选入此框中,还可以进一步的分层 下去。
第四讲 多变量的描述性统计
一、相关的概念 二、交互分类表 三、简化相关与消减误差 四、相关测量法和测量层次
一、相关的概念
案例:
在某地区调查1000名青年人的最大志愿,其中 有40%的人选择快乐家庭、50%的人选择理想工 作和10%的人选择增广见闻。我们要问:为什么 这些青年的最大志愿会有不同? 若同时调查了这些青年人的受教育水平,分为高 (本科或以上程度)、中(高中程度)、低(初 中或以下程度),人数比例分别为10%、60%和 30%。我们可以追问:青年人的志愿与其受教育 水平是否相关呢?换言之,是否因为教育水平不 同,所以人生志愿也不同?
若两个变量都属于定类测量层次,可用Lambda相关测量法, 也可用古德曼(Goodman)和古鲁斯卡(Kruskal)的tau-y相 关测量法。两者各有不同特色,但相关系数都具有PRE的意义。
(1)λ相关测量法 λ是基于消减误差比例的原理(PRE)上的相关测度,λ反映了当用一个变
量的值来预测其它变量的值时误差的减少量。它是一种对称关系 (Symmetrical)的测度,即两变量不区分自变量和因变量,因而可以计算三 种不同的λ值,一种是两变量对称考量时的λ值;还有两种是两变量处于不对 称考量时,以行变量作为因变量的λ值,以及以列变量作为因变量的λ值。这 三种方法通常不会产生相同的λ值,因此,必须注意两变量的对称关系,若 是非对称的,要指明哪一个是因变量,即最令人感兴趣的被预测的那个变量。 当要计算λ统计量时,SPSS将显示出这个对称的λ和两个不对称的λ三个值。
不对称关系(asymmetrical relationship):变量X影响 Y,而Y不影响X。 表示为: X → Y
对称关系(symmetrical relationship):变量X和Y不 确定或不区分影响的方向。表示为: X ←→ Y
二、交互分类表 Cross table
1、交互分类表:同时根据两个变量的值,将所研究的 个案分类。
一、相关的概念
1、相关:是指一个变量的值与另一个变量的值有连 带关系。
换言之,如果一个变量的值发生变化,另一个变 量的值也有变化,则两个变量就是相关了。
2、相关程度: 相关有强弱之分 0:无相关 1:完全相关 介于0与1之间的数值越大,表示相关的程度越强。
3、相关的方向: +0.8 -0.8 正相关—一个变量值越大,另一个变量值也越大。 负相关—一个变量值越大,另一个变量值却越小。
表 1000名青年人的教育水平与志愿
交互分类表又称 列联表。
一般将自变量(如,教育水平)放在表的列(Columns,即表的顶 端);将因变量(如,志愿)放在表的行(Rows,即表的旁边)。
上表单元格中显示的是频数,而且表下端显示的总数也不相等,因而 不利于进行比较;为求相互比较从而知道两个变量间的相互关系,就必 须标准化;最常用的,将频数显示为百分比,就按照100进行了标准化, 这样就利于比较了。
间的关系。这个值,通常称为相关系数。
2、相关测量法有很多种,怎样选择? 首先要注意变量的测量层次:定类、定序、定距。
属于不同测量层次的变量,就要用不同的相关测量法。
3、相关系数的意义 (1)表示两变量间的相关程度的大小 (2)还希望具有消减误差比例的作用。
三、简化相关与消减误差
4、消减误差比例(PRE测量法) Proportionate Reduction in Error (简称 PRE)
相关文档
最新文档