相关分析(完整)资料

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关分析过程
1
概念
相关分析 偏相关分析
品质相关
2
相关分析的概念
3
确定性关系与非确定性关系
区别:
确定型关系:是通常的函数关系,如圆的面
积与半径之间的关系:S= r2 不确定型关系:例如,人的身高与体重之间 的关系。
变量之间的相关关系有两种:确定型关系和不确定型关 系。相关分析是研究变量之间不确定关系的统计方法。
52
参考:张厚粲和徐建平,2009,p296;马庆国,2002,p. 260
42
对于非四格表,当期望频数小于5的格子小于20%,
用Pearson卡方一行的结果。否则,用似然比一行 的结果。 以上是关于读取哪一行的结果的指南。至于读取哪 一列的结果,可以按下面的指南来判断:如果期望 频数小于5的格子多于20%,就不能使用ASYMP.sig 的结果。此时,应该在SPSS卡方检验中选择使用 Exact Test(确切概率法),以Exact Test的结果 为准(软件也同时显示ASYMP.sig的结果) http://www.doc88.com/p-494332847825.html http://wenku.baidu.com/view/7cb6c1482e3f5727 a5e96280.html http://zhidao.baidu.com/question/213672845.h tml?fr=qrl&index=2
地区经济增长 1.000 .644 . .000 24 24 .644 1.000 .000 . 0 24 .773 1.000 .000 .000 24 0 相关性 1.000 . .695 23 .083 1.000 .695 . 0
游客增长% .791 .000 .773 .000
. .083
t
0.98 14 2 1 0.98
2
17.2792
13
散点图
相关系数为0,即零相关,但不能立即判定两
个变量没有关系
14
15
例子:马庆国CH8CH9CH10投资额与依据
16
例子:马庆国CH8CH9CH10投资额与依据
简单相关分析:修改运行语句 注意WITH前后有空格 A B with C D,只计算A和C、D之间和B和C、D 之间的相关
简单相关系数
工资 教育
偏相关系数
工龄
26
偏相关分析的概念
相关分析通过计算两个变量之间的相关系数,分析变 量间线性相关的程度。在多元相关分析中,由于受到 其他变量的影响,pearson相关系数只是从表面上反 映两个变量相关的性质,往往不能真实地反映变量之 间的线性相关程度,甚至会给人造成相关的假象。因 此,在某些场合中,简单的pearson相关系数并不是 刻画相关关系的本质统计量。 当其他变量被固定住,即将它们控制起来后,给定的 任意两个变量之间的相关系数叫偏相关系数。偏相关 系数才是真正反映两个变量相关关系的统计量。
43
卡方检验的注意点
抽样的代表性!
“在搜集计数数据时,最容易出现有偏样本
而又最易被忽视。因此,在应用卡方检验分 析计数资料,进行统计推论时,要特别小心 谨慎,防止产生有偏样本,注意控制那些影 响数据的因素。” (张厚粲和徐建平,2009, p. 296) 如:抽样的随机性、样本比例、问卷引导语 等 例子:支持vs不支持
45
品质相关的论文实例
纳迪,2009。如何解读统计图表:研究报告
阅读指南,pp60-81
46
47
质量相关
定名变量和定距变量的相关
点二列相关:张厚粲和徐建平,2009,
pp134-137 蓝石ETA 法:10.3;附录K;ETA法不检验结 果的显著性。
48
49
概念
相关分析 偏相关分析
张厚粲和徐建平,2009,p112
11
Effect size of Pearson’s r
请双击以打开图标:
Cohen, J (1992). "A power primer". Psychological Bulletin 112 (1): 155–159.
12
皮尔逊相关系数的显著性检验
举例:14个学生英语考试成绩与每个学生掌
44
PHI系数和Cramer’s V
适用于:两个变量都是定名或者二分变量。 2×2:用PHI(真正的二分变量);更多分类,则用
Cramer’s V(蓝石,2011,p. 180) PHI系数:张厚粲和徐建平,2009,pp143-5 蓝石例子:附录K SPSS步骤:分析-描述统计-交叉表 和品质相关/卡方检验的关系:PHI和Cramer’s V的 输出结果中,给出了相关系数,公式参见张厚粲和徐 建平,2009,p143。同时给出显著性概率。这里的显 著性概率就是通过卡方检验来计算得出的。也就是说, 卡方检验可以分析两个定名变量是否显著相关,而 PHI和Cramer’s V则能给出相关系数。另参考张厚粲 和徐建平,2009,p. 145页最上方例子
34
35
品质相关
计数数据
二维度列联表
36
37
38
马庆国书,pp.258-260
39
40
41
Yete校正:对2×2列联表进行卡方检验,单元格的期望次数低于10 但是大于5时,要用Yete连续性校正一行的结果;
Fisher精确概率检验法:对2×2列联表进行卡方检验,当某个单元 格内期望次数低于5,或者样本总人数低于20时, 用本行结果。
17
斯皮尔曼(spearman)相关系数
对数据分布形态不作要求Βιβλιοθήκη Baidu
适用于定序或以上度量尺度 例子:10名学生的数学和语文成绩,计算其
相关系数
18
斯皮尔曼(spearman)相关系数
斯皮尔曼(spearman)相关系数,用于反映两
个定序或等级变量的相关程度。计算时要首先 对变量值求秩。对两个配对测量的变量X和Y的 测度值在各自序列中求秩后,斯皮尔曼相关系 数的计算公式与皮尔逊相关系数公式相同。 两个定距度量尺度的变量也可以计算等级相关 系数,但精确度不如积差相关系数(张厚粲和 徐建平,2009,p. 122)。故二者只报告一个。
品质相关
50
《公共管理定量分析: 方法与技术》,袁政,p76;另外参考张厚粲和徐建平, 2009,p150
51
相关系数不能相除,不能说前者是后者的几
倍 相关系数值的大小表明两列数据相互间的相 关程度。相关系数为-0.6和0.6,强度一致, 只是方向不同。 目的:用一个变量去预测另一个变量的值
22
马庆国例子同前
23
练习
马庆国:CH9数学语文成绩
24
练习
积差相关:蓝石10.1节;
等级相关:张奇,data6-02;蓝石10.2节;
25
偏相关系数(partial correlations)
偏相关系数:它描述的是当控制了一个或几
个附加变量的影响时两个变量的相关性。例 如可以控制工龄的影响,来研究工资收入与 受教育程度之间的相关关系。
31
虚假相关(spurious correlation)
控制了第三个变量后,两个变量之间本来存
在的相关关系不存在了。 例子:
鞋子大小与言语能力 数学成绩与语文成绩 8-13岁儿童的握力和数学成绩 个人收入与大学阶段的成功
张厚粲和徐建平,2009,pp148-9
32
33
练习
偏相关:张奇,data6-03;
19
斯皮尔曼(spearman)相关系数公式
20
二元变量的相关过程
1. 执行命令: Analyze correlatebivariate (二元变量) 打开对话框; 选择两个变量或更多的变量; Correlation coefficient栏中3个复选项
Pearson:连续变量 Kendall’s tau-b:两个等级变量或类型变量 Spearman :两个等级变量或类型变量 (系统将会自动对变量值求秩)
30
Missing values:

马庆国:CH9偏相关商客旅

相关性 控制变量 商业投资万元 -无-a 商业投资万元 相关性 显著性(双侧) df 0 地区经济增长 相关性 显著性(双侧) df 24 游客增长% 相关性 .791 显著性(双侧) df 24 游客增长% 商业投资万元 显著性(双侧) df 0 地区经济增长 相关性 显著性(双侧) df 23 a. 单元格包含零阶 (Pearson) 相关。
27
28
二元变量的偏相关过程
1. 执行命令: Analyze correlatepartial correlations (偏变量), 打开对话框; 选择两个变量或更多的变量; 选择至少一个控制变量移入控制变量栏; Test of significance
Two-tailed One-tailed
Test of significance
Two-tailed One-tailed
21
Flags significant correlations:加星号
二元变量的相关过程
单击options按钮 Statistics栏中的选项只当在主对话框选择 pearson相关系数时才会被激活:
9
皮尔逊(pearson)相关系数
X
n i 1
RXY
i
X Yi Y
2 n

2
X
n i 1
i
X Yi Y
i 1
10
积差相关的适用条件
成对数据 两个变量的总体都符合正态分布:取大样本进
行正态分布非参数检验 两个变量都是连续变量(scale) 两列变量之间的关系是直线性的:散点图+文 献
握的单词量的相关系数是0.98,检验其显著 性? 选择 =0.05,根据自由度df=14-2=12,查 找t分布表得:t0.05/2=2.1788。 结论:因为t=17.2792> t0.05/2=2.1788,表明 线性相关系数是显著的。
t r n2 1 r
2
t n 2
6
相关系数不能相除,不能说前者是后者的几
倍 相关系数值的大小表明两列数据相互间的相 关程度。相关系数为-0.6和0.6,强度一致, 只是方向不同。 目的:用一个变量去预测另一个变量的值
7
8
皮尔逊(pearson)相关系数
皮尔逊(pearson)相关系数,是一般常见的
线性相关系数,一般用R表示:变量Y和X之间 线性相关的程度。R在(0,1)之间为正相关; 在(-1,0)之间为负相关;等于1为完全正 相关;-1为完全负相关;0为不相关。 又称:积差相关、积矩相关(productmoment coefficient of correlation) 计算公式为:
Mean and standard deviations Cross-product deviations and covariances:叉积离差 阵和协方差阵
Missing values:


Exclude cases pairwise:成对剔除参与计算的具有缺 失值的观测量 Exclude cases listwise:剔除具有缺失值的所有观测 量
4
相关关系的统计学分类
因果关系、共变关系
单相关和复相关 直线相关和曲线相关
正相关、负相关、零相关
完全相关、完全不相关、不完全相关
本讲研究范围:不确定性的线性相关关系
《公共管理定量分析: 方法与技术》,袁政,p62
5
《公共管理定量分析: 方法与技术》,袁政,p76;另外参考张厚粲和徐建平, 2009,p150
Display actual significance level:加星号
29
二元变量的偏相关过程
单击options按钮 Statistics栏中的选项
Mean and standard deviations Zero-order correlations:零阶相关系数阵,即pearson 相关系数矩阵; Exclude cases pairwise:成对剔除参与计算的具有缺 失值的观测量 Exclude cases listwise:剔除具有缺失值的所有观测 量
相关文档
最新文档