第四讲 相关分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 【双变量】Bivariate过程:用于进行两个或多 过程: 双变量】 过程 个变量间的相关分析,如为多个变量, 个变量间的相关分析,如为多个变量,给出两 两相关的分析结果。 两相关的分析结果。 • 【偏相关】Partial过程:当进行相关分析的两 偏相关】 过程: 过程 个变量的取值都受到其他变量的影响时, 个变量的取值都受到其他变量的影响时,就可 以利用偏相关分析对其他变量进行控制, 以利用偏相关分析对其他变量进行控制,输出 控制其他变量影响后的相关系数。 控制其他变量影响后的相关系数。 • 【距离】Distances过程:用于对同一变量各观 距离】 过程: 过程 察单位间的数值或各个不同变量间进行相似性 或不相似性分析,一般不单独使用, 或不相似性分析,一般不单独使用,而作为因 子分析等的预分析。 子分析等的预分析。
2012-5-20
经济与管理学院
三峡大学
例题2:定序变量的 例题 :定序变量的Spearman分析实例 分析实例 为研究集团迫使个人顺从的效应, 为研究集团迫使个人顺从的效应,一 些研究者用F量表和为测量地位欲而设计 些研究者用 量表和为测量地位欲而设计 的一种量表对12名大学生进行调查 名大学生进行调查。 的一种量表对 名大学生进行调查。欲 知道对权威主义的评分之间相关的信息。
2012-5-20
经济与管理学院
三峡大学
2.偏相关系数及其检验 2.偏相关系数及其检验 假定有x1 x1、 x2、 3个变量 个变量, 假定有x1、 x2、 x3 3个变量,要求计算剔除变 x3的影响后变量x1、 x2之间的偏相关系数 的影响后变量x1 之间的偏相关系数, 量x3的影响后变量x1、 x2之间的偏相关系数,记为 r12,3,x3为可控变量 为可控变量。 r12,3,x3为可控变量。 −
2012-5-20
10. 10.09
7074.2
341.5
39.2
相关分析用于描述两个变量间联系的密切程 度,其特点是变量不分主次,被置于同等的地位。 在【分析】的下拉菜单相关命令项中有三个 相关分析功能子命令: 【双变量】过程、【偏相关】过程、 【距离】 过程,分别对应着相关分析、偏相关分析和相似 性测度的三个spss过程。
2012-5-20
经济与管理学院
三峡大学
2012-5-20
经济与管理学院
三峡大学
3.某田间实验小区1999年观测到的土壤降雨侵蚀数据, 3.某田间实验小区1999年观测到的土壤降雨侵蚀数据,分析 某田间实验小区1999年观测到的土壤降雨侵蚀数据 在扣除降雨量影响的情况下, 在扣除降雨量影响的情况下,土壤侵蚀量与降雨强度的相关 性? 降雨量(MM) 日期 土壤侵蚀量 降雨量(MM) 降雨强度 MM/H) 吨/平方公里 (MM/H) 8.19 429.2 16.5 32.6 8.24 3663.8 101.4 60.0 9.02 96.6 13.4 25.6 9.04 289.0 32.0 9.6 9.14 537.9 40.7 15.0 9.15 704.0 73.5 19.4 9.17 472.4 56.8 30.9 9.20 1020.1 32.0 18.0
等级相关系数: (2)Spearman 等级相关系数:适用于度量定序变量与
定序变量之间的相关。 定序变量之间的相关。
rs = 1 −
6 ∑ ( xi − y i ) 2 n ( n − 1)
2
其中 x i , y i 分别是两个变量按大小
(或优劣)排位的等级 , n 是样本容量,当 n f 20 时 可利用 t统计量检验。
2012-5-20
经济与管理学院
三峡大学
第二节 Baidu Nhomakorabea相关分析
主要功能和原理介绍 1.偏相关分析的基本概念 1.偏相关分析的基本概念 在多变量的情况下, 在多变量的情况下,变量之间的相关关系是很 复杂的。 复杂的。 如:农作物产量与降与量之间的关系中实际还 包含温度对产量的影响。 包含温度对产量的影响。 商品的需求与价格关系, 商品的需求与价格关系,注意收入水平的影响 等等。 等等。 偏相关分析是指在对其他变量的影响进行控制 偏相关分析是指在对其他变量的影响进行控制 的条件下, 的条件下,分析多个变量中某两个变量之间的线性 相关程度,计算偏相关系数。 相关程度,计算偏相关系数。
2012-5-20
经济与管理学院
三峡大学
经济与管理学院
三峡大学
第一节 两变量的相关分析
• • • • 主要功能 1.相关分析的基本概念 . 2.相关系数及其检验 . 相关系数: (1)Pearson相关系数:适用于等距类型的变量。是 ) 相关系数 适用于等距类型的变量。 运用最广的一种相关程度统计量。检验用t统计量 统计量: 运用最广的一种相关程度统计量。检验用t统计量: 其中统计量t服从自由度 服从自由度(n-2)的分布。 的分布。 其中统计量 服从自由度 的分布
2012-5-20
经济与管理学院
三峡大学
二、【双变量 】Bivariate相关分析 先做散点图, 先做散点图,初步确定两个变量是否存在 相关趋势,该趋势是否为直线趋势, 相关趋势,该趋势是否为直线趋势,以及数据 中是否存在异常点。否则可能出错误结论。 中是否存在异常点。否则可能出错误结论。 步骤: 分析】 相关分析】 步骤:【分析】—【相关分析】Correlate—【双 — 销售额 价格 变量】 变量】Bivariate 2.00 46.00 例题1 连续变量实例: 例题1:连续变量实例:
经济与管理学院
三峡大学
第四讲 相关分析 过程) (Correlate过程) 过程
2012-5-20
在统计学上, 在统计学上,我们通常这样判断变量之间 是否有关:如果一个变量的取值发生变化, 是否有关:如果一个变量的取值发生变化,另 外一个变量的取值也相应发生变化, 外一个变量的取值也相应发生变化,则这两个 变量有关。 变量有关。如果一个变量的变化不引起另一个 变量的变化则二者无关。 变量的变化则二者无关。 变量关系强度的含义:指两个变量相关程 变量关系强度的含义 指两个变量相关程 度的高低。 度的高低。统计学中是以准实验的思想来分析 变量相关的。通常从以下的角度分析: 变量相关的。通常从以下的角度分析: A)两变量是否相互独立。 )两变量是否相互独立。 B)两变量是否有共变趋势。 )两变量是否有共变趋势。 C)一变量的变化多大程度上能由另一变量的 ) 变化来解释。 变化来解释。
2012-5-20
经济与管理学院
三峡大学
双变量关系强度测量的主要指标
定类 定序 卡方类检测 卡方类检测 定距 Eta系数 Eta系数
定类 定序
Spearman相 Spearman 相 相关系数 关系数 Pearson相 相 关系数
定距
2012-5-20
经济与管理学院
三峡大学
一、相关分析 —— Correlate菜单
中山柏生长量与四个气候因素的偏相关综合 结果:相关性强弱排序:月均气温、月均湿度、 结果:相关性强弱排序:月均气温、月均湿度、 月均日照时数。 月均日照时数。
2012-5-20
经济与管理学院
三峡大学
练习: 练习:
1.某地29名13岁男童身高(cm)、体重(kg) 1.某地29名13岁男童身高(cm)、体重(kg) 某地29 岁男童身高 )、体重 和肺活量(ml)的数据如下表, 和肺活量(ml)的数据如下表, 试对该资料作肺活 量相关因素的偏相关分析, 量相关因素的偏相关分析,并对按影响程度因素进 行排序。见数据date10 date10行排序。见数据date10-05 2.数据data10-06是某公司太阳镜销售情况。 2.数据data10-06是某公司太阳镜销售情况。 数据data10 是某公司太阳镜销售情况 分析销售量与平均价格、 分析销售量与平均价格、广告费用和日照时间之间 的关系,并作图协助分析。 的关系,并作图协助分析。此题使用偏相关分析是 否有实际意义? 否有实际意义?
编号 1 2 消费支出 20 15 可支配收入 25 18 3 40 60 4 30 45 5 42 62 6 60 88 7 65 92 8 70 99 9 53 75 10 78 98
试分析消费支出与可支配收入之间的关系? 试分析消费支出与可支配收入之间的关系? 2. 利用 利用data10-02银行雇员数据,分析初始工资高 银行雇员数据, 银行雇员数据 低是否与受教育程度有关? 低是否与受教育程度有关?
2012-5-20
经济与管理学院
三峡大学
2012-5-20
经济与管理学院
三峡大学
偏相关分析结果汇总: 偏相关分析结果汇总:
月均气温 生长量 自由度 显著性水平 0.9774 7 0 月均湿度 0.731 7 0.025 月均日照时数 月降雨量 0.6318 7 0.068 -0.4906 7 0.18
权威主义和地位欲评秩
A B 学生 权威主义 2 6 地位欲 3 4
2012-5-20
C 5 2
D E 1 10 1 8
F 9
G H 8 3
I 4 7
J 12 12
K 7 5
L 11 9
11 10 6
经济与管理学院
三峡大学
相关系数为0.818,表明权威主义越高的人 相关系数为0.818, 0.818 地位欲也越高。不相关假设检验值为0.001 0.001, 地位欲也越高。不相关假设检验值为0.001,否 定假设(原假设是不相关), ),即二者是高度相 定假设(原假设是不相关),即二者是高度相 关的。 关的。
它也是用来度量三峡大学经济与管理学院201392定类定序定距定类卡方类检测卡方类检测eta系数定序spearman相关系数spearman相关系数pearson相关系数定距双变量关系强度测量的主要指标三峡大学经济与管理学院201392一相关分析correlate菜单相关分析用于描述两个变量间联系的密切程度其特点是变量不分主次被置于同等的地位
t = rs
n−2 2 1 − rs
t f t a /(或p p a)表明r统计显著 2 t ≤ t a /(或p ≥ a)表明r统计不显著 2
等级相关系数: (3) Kendall tua-b 等级相关系数:它也是用来度量
序次变量间的线性相关关系。 序次变量间的线性相关关系。这里的度量原理是把所有的样本 是否都增加来判断总体模式。 点配对 , 看每一对中的 x 和 y 是否都增加来判断总体模式。
2012-5-20
经济与管理学院
三峡大学
例题3 定序变量的 分析实例: 例题3、定序变量的Kendall分析实例: 分析实例 仍用前例中的数据
相关系数为0.667,表明权威主义越高的人地 相关系数为0.667, 0.667 位欲也越高。不相关假设检验值为0.003 0.003, 位欲也越高。不相关假设检验值为0.003,否定假 即权威主义与地位欲是相关的。 设,即权威主义与地位欲是相关的。
3.00 4.00 3.00 4.00 5.00
2012-5-20
42.00 41.00 43.00 39.00 38.00
经济与管理学院
三峡大学
结果表明: 结果表明:销售额 与价格高度负线性 相关。 相关。
2012-5-20
经济与管理学院
三峡大学
练习: 练习:
1.假设对 户居民家庭的月可支配收入和消费支出 假设对10户居民家庭的月可支配收入和消费支出 假设对 进行调查,见练习51。 单位: 进行调查,见练习 。 单位:百元
r 12,3 =
r
12
r r
13
23
1 − r 13 1 − r 23
2 2
偏相关系数r12,3的显著性检验公式为: 偏相关系数r12,3的显著性检验公式为: r12,3的显著性检验公式为
t =
2012-5-20
r
1−
1 2 ,3
n−3
r
2 1 2 ,3
经济与管理学院
三峡大学
例题:四川绵阳地区 年生中山柏的数据 年生中山柏的数据, 例题:四川绵阳地区3年生中山柏的数据,分析月 生长量与月平均气温、月降雨量、月平均日照时数、 生长量与月平均气温、月降雨量、月平均日照时数、 月平均湿度这四个气候因素哪个因素有关。 月平均湿度这四个气候因素哪个因素有关。
r=
∑(x − x)( y − y)
i =1 i i
n
t=
2
r 1− r 2
∑(x − x) ∑( y − y)
2 i =1 i i =1 i
n
n
n−2 t f t a /(或p p a )表明r统计显著 2
t ≤ t a /(或p ≥ a )表明r统计不显著 2
2012-5-20
经济与管理学院
三峡大学
相关文档
最新文档