spss卡方检验与相关分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【Options钮】
Zero-order correlations 给出包括协变量在 内所有变量的相关方阵。
说明,上年发表的论文数对当年的立项课题数的线性影 响非常弱。前面的是属于虚假相关。
上机作业五
1、以实验3中保存的“数据8.sav”为例,完 成以下任务: 求出性别与工资等级的列联表,要求按性别 输出百分比,求出相关系数,并进行卡方检 验,理解所得结果。 2、对居民储蓄数据中的多选项进行列联表 分析。(要求先定义多选项变量集,用分类 法做频数分析,再选择一个变量,做列联表 分析) 3、试以spss自带的某一个数据文件为例 (建议使用1991U.S.General Social Survey数据)进行分析,了解变量是否相 关,发掘数据中变量间的规律性。
计算某个统计量时,在这一对变量 中排除有缺省值的观测值。 对于任何分析,有缺省值的观测值 都会被排除。
一般,如果r的绝对值大于0.8,则认为两变 量之间具有较强的线性相关关系;如果r小 于0.3,则认为两变量之间具有较弱的线性 相关关系。 当然,相关关系的程度与样本的容量大小 也有很大的关系。
例1:为研究高等院校人文社会科学研究中 立项课题数会受哪些因素影响,收集1999 年31个省市自治区部分高校有关社科方面 的数据,研究立项课题数(当年)与投入 的具有高级职称的人年数(上年)、发表 论文数(上年)之间是否具有较强的线性 关系。
【Variables框】用于选入需要进行偏相关 分析的变量,至少需要选入两个。可多选。 【Controlling for框】用于选择需要在偏相 关分析时进行控制的协变量,如果不选入, 则进行的就是普通的相关分析。 【Display actual significince level复选框】 用于确定是否在结果中给出确切的P值,一 般选中。
从表中可看出,权威主义和地位欲的相关系数 为0.818,这表明权威主义越高的人地位欲也越高。 权威主义与地位欲不相关的假设检验值为0.001,否 定假设,即权威主义与地位欲是相关的。
例3:定序变量的Kendall分析实例
仍用前例中的数据(数据文件:权威(Spearman相 关).sav) 。操作过程相同,只是在第3)步在Correlation Coefficients栏内选择Kendall’s选项。结果如下:
自变量
1 男性 2 女性 总计
每月工资平均 数 752.40 601.97 680.95
N 452 409 861
因变量
统计结果显示,当性别取值不同时,收入变量 的取值发生了变化,因此性别与月收入有关。
变量关系的统计类型
定类 定类 列联 cross-tabulate 定序 列联 cross-tabulate 定距 方差分析 (分组平均数) compare means
Cor relat ions 权威主义 Kendall's tau_b 权威主义 Correlation Coefficient 1.000 Sig. (2-tailed) . N 12 地位欲 Correlation Coefficient .667** Sig. (2-tailed) .003 N 12 **. Correlation is significant at the .01 level (2-tailed). 地位欲 .667** .003 12 1.000 . 12
Flag significant correlations 用于确定是否在结果中用星号标记有统计 学意义的相关系数,一般选中。此时 P<0.05的系数值旁会标记一个*,P<0.01的 则标记两个**。
Options 对话框
对每一个变量 输出均值、标准 差和无缺省值的 观测数。 对每一个变量 输出交叉距阵和 协方差距阵。
权威主义和地位欲的相关系数为0.667,这表明权 威主义越高的人地位欲也越高。权威主义与地位欲不 相关的假设检验值为0.003,否定假设,即权威主义与 地位欲是相关的。结果类似于Spearman分析。
(四)Partial过程
相关分析计算两个变量间的相关系数,分 析两个变量间线性关系的程度。但是往往 因为第三个变量的作用,使相关系数不能 真正反映两个变量间线性程度。例如,可 以控制年龄和工作经验两个变量的影响, 估计工资收入与受教育程度之间的相关程 度,这就是偏相关分析。
定距 Eta 系数
定距
Spearman Spearman 相 相关系数 关系数 同 序 - 异 序 对测量 Pearson 相 关系数
相关分析之三——关系性质
直线相关与曲线相关 正相关与负相关 完全相关与完全不相关
一、列联相关(第四章已讲)
(一)列联分析的基本原理 自变量发生变化,因变量取值是否也
变量关系强度的含义:指两个变量相关程度 的高低。统计学中是以准实验的思想来分 析变量相关的。通常从以下的角度分析: A)两变量是否相互独立。 B)两变量是否有共变趋势。 C)一变量的变化多大程度上能由另一变量 的变化来解释。
变量关系强度测量的主要指标
定类 定类 定序
卡方类测量 Lamda 等
定序
卡方类测量 Lamda 等
Bivariate Correlations 对话框
Pearson复选框 选择进行积差相关分析, 即最常用的相关分析,其计算连续变量或 等间隔测度变量间的相关系数。计算该相 关系数时,不仅要求两相关变量均为正态 变量,而且样本数(N)一般不应少于30。
Kendall‘s tau-b复选框 计算Kendall’s等级相 关系数,其计算定序变量间的线性相关关系。 (有打结现象时) Spearman复选框 计算Spearman相关系数。 也是计算等级相关系数(定序与定序)。最 常用的非参数相关分析(秩相关),适用于 连续等级资料。 (无打结现象) 以上三种相关分析可以选择其中之一,也可 以同时多选。如果参与分析的变量是连续变 量,选择Kendall's tau-b或Spearman相关, 则系统自动对连续变量的值先求秩,再计算 其秩分数间的相关系数。
性别与四级英语考试通过率的相关统计
1 通过考试 1 男性 2 女性 总计 40% 40% 40% 2 未通过考试 60% 60% 60%
表述:统计结果显示,当性别取值不同时,通过率变量 的取值并未发生变化,因此性别与考试通过率无关。 自变量的不同取值在因变量上无差异,两变量无关。 自变量的不同取值在因变量上有差异,两变量有关。
权威主义和地位欲评秩
学生 A B C D 1 E 8 F G H I J K L
权威主义 2 6 5 地位欲 3 4 2
1 10
9
11
8
3
4 12 7
7 12 5
11
9
10 6
分析步骤:பைடு நூலகம்
1)输入数据,依次单击Analyze—Correlate— Bivariate,打开Bivariate Correlations对话框 2)选择power和position 变量进入 Variables框中。 3)在Correlation Coefficients栏内选择Spearman。 4)在Test of Significance栏选择Two-tailed。 5)选择Flag significant correlation。 6)单击Options按钮,选择Mean and standard deviations、Cross-product deviations and covariances、Exclude cases pairise选项。 7)单击OK。
发生变化。
比较边缘百分比和条件百分比的差别。
卡方测量用来考察两变量是否独立(无关)。
Pij Pi. P. j
二、相关分析(Correlate)
(一)简介
相关分析用于描述两个变量间联系的密切 程度,其特点是变量不分主次,被置于同 等的地位。检验的原假设为相关系数为0。 可选择是单尾检验还是双尾检验。
(三)Bivariate相关分析
在进行相关分析时,散点图是重要的工具, 分析前应先做散点图,以初步确定两个变 量间是否存在相关趋势,该趋势是否为直 线趋势,以及数据中是否存在异常点。否 则可能得出错误结论。 Bivariate相关分析的步骤:输入数据后,依 次单击Analyze—Correlate—Bivariate, 打开Bivariate Correlations对话框
定序
列联 cross-tabulate 积差相关 spearman correlation
积差相关 spearman correlation 积矩相关 pearson correlation 积矩相关 pearson correlation 回归 regression
定距
相关分析之二——关系强度
第五章
相关分析与检验
相关分析之一——有关与无关
寻找变量间的关系是科学研究的首要目
的。变量间的关系最简单的划分即:有关 与无关。
在统计学上,我们通常这样判断变量之
间是否有关:如果一个变量的取值发生 变化,另外一个变量的取值也相应发生 变化,则这两个变量有关。如果一个变 量的变化不引起另一个变量的变化则二 者无关。
可以画散点图先进行判断。
Graphs-legacy-scatter
Analyze-correlate--Brivariate
例2:定序变量的Spearman分析实例 为了研究集团迫使个人顺从的效应, 一些研究者用量表和为测量地位欲而设计 的一种量表对12名大学生进行调查。欲知 道对权威主义的评分之间相关的信息,数 据如下。
在Analyze的下拉菜单Correlate命令项中 有三个相关分析功能子命令Bivariate过程 (二变量相关分析)、Partial过程(偏相关分 析)、 Distances过程(距离分析)。
(二)相关分析类型
Bivariate过程用于进行两个或多个变量间的 相关分析,如为多个变量,给出两两相关的 分析结果。 Partial过程,当进行相关分析的两个变量的 取值都受到其他变量的影响时,就可以利用 偏相关分析对其他变量进行控制,输出控制 其他变量影响后的相关系数。 Distances过程用于对同一变量各观察单位间 的数值或各个不同变量间进行相似性或不相 似性分析,一般不单独使用,而作为因子分 析等的预分析。
结果分析:
Cor relati ons 权威主义 Spearman's rho 权威主义 Correlation Coefficient 1.000 Sig. (2-tailed) . N 12 地位欲 Correlation Coefficient .818** Sig. (2-tailed) .001 N 12 **. Correlation is significant at the .01 level (2-tailed). 地位欲 .818** .001 12 1.000 . 12
例:立项课题数与发表论文数之间 的净相关系数研究。
立项课题数与发表论文数之间有较强的正 线性相关系数。但是,这种关系可能掺入 了投入高级职称的人年数的影响。投入高 职称的人年数与论文数(上年发表)、立项课 题数的简单相关系数分别为0.953和0.944, 因此,可以把这个变量控制起来,研究立 项课题数与发表论文数之间的净相关系数, 进行偏相关分析。