《SPSS统计分析》第10章 相关分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
12.990 16.290 17.990 19.290
12.500 15.800 17.500 18.800
11.500 14.800 16.500 17.800
2.200 5.500 7.200 8.500
3.300 5.000 6.300
3.300
1.700 3.000
5.000 1.700
1.300
3.分析两个变量间线性关系的程度。往往因为第三个变量的作用,使相关系数不能真正反映两个 变量间的线性程度。 这是应该控制一个变量的变化求另两个变量间的相关系数,也就是说, 在第三个变量不变的情况下,两个变量的线性程度。
CORRELATIONS /VARIABLES=VCP with HEIGHT WEIGHT /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE .
6.300 3.000 1.300
1.800 1.500 3.200 4.500
2.700 6.000 7.700 9.000
5.000 8.300 10.000 11.300
12.000 15.300 17.000 18.300
9: 9 14.790 14.300 13.300
4.000 1.800 1.500 3.200 4.500
返回
典型相关分析
返回
典型相关分析概念
典型相关分析是用来描述两组随机变量间关 系的统计分析方法。
通过线性组合,可以将一组变量组合成一个 新的综合变量。虽然每组变量间的线性组合有无 数多个,但通过对其施加一些条件约束,能使其 具有确定性。
典型相关分析就是要找到使得这两个由线性 组合生成的变量之间的相关系数最大的系数。
学习通过编程解决偏相关问题
返回
距离分析
Distance
返回
距离分析的主对话框图
返回
不相似性距离测度选择项对话框
返回
相似性测度选择项对话框
返回
距离分析实例
观测量间的欧氏距离(第4版)
Proxim ity Matr ix
1: 1 2: 2 3: 3 4: 4 5: 5 6: 6 7: 7 8: 8 9: 9 10:10 11:11 12:12
生 长 量(cm) 月 平 均日 照 时 数 月 平 均湿 度 月 降 雨量 (mm) 月 平 均气 温 (c)
Mean 9.4592 98.8917 80.2500 85.2167 15.9833
Std. Dev iation 7.17787
34.66262 3.36087
97.48834 7.49919
9.300 11.500 14.800 16.500 17.800 13.300
8.800 6.500
.500
4: 4 10.790 10.300
9.300
2.200 5.500 7.200 8.500 4.000
.500 2.800 9.800
Euc lidean Dis tance
5: 5 6: 6 7: 7 8: 8
返回
习题及解答 【题3】
1. 两个变量的对应关系不具有唯一性时,相关分析研究他们之间线性关系的密切程度。
变量Y随着变量X的增加(或减少)而增加(或减少),称为两个变量之间存在着线性关系,也称 这两个变量线性相关。
相关系数的数值范围是在-1 ~+1之间。当一个变量随着另一个变量的增加而减少,这种相关关系 称为负相关。相关系数小于0。
返回
偏相关分析的选择项对话框
返回
偏相关应用实例 【例5】输出1
四川绵阳地区3年生中山柏的数据,分析月生长量与月平均气温、月降雨量、月 平均日照时数、月平均湿度这四个气候因素哪个因素有关。数据来源于袁佳祖 编著《灰色系统理论》,数据编号data10-03。
Des criptive Statistics
简单明了的相关表
返回
秩相关实例【例3】
各雇员的工作分类(jobcat)、受教育程度(Educ)、起始工资与当前工资间的 关系。Educ数值数小于24(options对话框中定义的),因此标为Ordinal属于有 序分类变量。
非参相关矩阵
返回
秩相关实例【例4】
data10-02为某次全国武术女子前10名运动员长拳和长兵器两项得分数据,要求分 析这两项得分是否存在线性关系。
表 10-19 第二组变量在典型变量中的 标准典型系数
返回
表 10-20 第一组变量在典型变量中的典型载荷
表 10-21 第一组变量在典型变量中的交叉载荷
返回
表 10-22 第二组变量在典型变量中的典型载荷
表 10-23 第二组变量在典型变量中的交叉载荷
返回
表 10-24 解释方差的比例
返回
习题10及参考答案
1: 1
.490 1.490 10.790 12.990 16.290 17.990 19.290 14.790 10.290 7.990
.990
2: 2 .490
1.000 10.300 12.500 15.800 17.500 18.800 14.300
9.800 7.500
.500
3: 3 1.490 1.000
第10章 相 关 分 析
Correlations
返回
目录
相关分析的概念与相关分析过程 两个变量间的相关分析
简单实例 二个变量间的相关分析过程与实例 秩相关及其实例
偏相关分析过程与实例 距离分析过程与实例 典型相关分析 习题及参考答案 结束
返回
相关分析的概念与相关分析过程
返回
有关公式:
Pearson积矩相关
7.000
12:12 .990 .500 .500
9.800 12.000 15.300 17.000 18.300 13.800
9.300 7.000
返回
不相似性矩阵
观测量间的欧氏距离
返回
变量间不相似性分析例题【例7】输出
变量间的不相似性测度 标准化后的欧氏距离
返回
变量间的相似性测度例题
相关系数矩阵
Cor relations
肺 活 量 Pearson Correlation
身高
体重
.600**
.751**
Sig. (2-tailed) N
.001
.000
29
29
**. Correlation is s ignif icant at the 0.01 level (2-tailed).
返回
习题及解答【题3】
xz2.z1 yz2 .z1
(1
r2 xz2 .z1
)(1
r2 yz2 .z1
)
Pearson偏相关系数假设检验的t统计量:
tቤተ መጻሕፍቲ ባይዱ nk 2r 1 r2
其中,r是相应的偏相关系数,n是观测量数,k是控制变量的数目, n-k-2是自由度。当t>t0.05(n-k-2)时,p<0.05拒绝原假设
返回
偏相关分析的主对话框
N 12 12 12 12 12
各变量的描述统计量
生长量与各变量间Pearson相关分析结果
返回
偏相关分析输【例5】输出2:
返回
偏相关分析输【例5】输出2:
返回
偏相关分析结论
生长量 自由度 不相关概率p
月均气温
.9774 ( 7) 0.000
月均湿度
.7310 ( 7) 0.025
月均日照时数
Spearman相关系数
rxy
n
(xi x)(yi y)
i 1
n
n
(xi x)2 ( yi y)2
i 1
i 1
θ
(Ri R)(Si S )
(Ri R) 2 (Si S ) 2
式中Ri是第i个x值的秩,Si是第i个y值的秩。
R S 分别是Ri和Si的平均值。
返回
有关公式:
Kendall’s tau-b与Spearman相关系数
返回
偏相关分析
返回
偏相关的有关公式:
控制了z的条件下,x、y之间的偏相关系数 :
rxy,z
rxy rxz ryz
(1
r2 xz
)(1
r2 yz
)
控制了两个变量z1、z2,变量x、y之间的偏相关系数:
r xy,z1z2
r r r xy.z1
Kendall’s tau-b :
sgn(xi x j ) sgn(yi y j )
τ i j (T0 T1 )(T0 T2 )
其中
1
sgn(z)
0
1
if z 0 if z 0 if z 0
T0 n(n - 2)/2 ; T1 ti (ti 1) / 2 ; T2 ui (ui 1) / 2
2. 提供了三个相关分析方法:Pearson相关适合于分析正态分布的两个连续变量(测量方法定义 为scale的尺度变量)间的相关系数。对于非正态分布的尺度测量的变量或顺序测量的等级变 量(order)应该使用Spearman 和Kendall‘s tau-b方法计算相关系数。后者考虑了结点的影 响。
ti(或ui)是x(或y)的第i 组结点x(或y)值的数目,n为观测量数。
返回
有关公式:关于相关系数统计意义的检验
Pearson和Spearman 相关系数假设检验t值计算公式:
t n2r 1 r2
式中r是相关系数,n是样本观测量数,n-2是自由度。 当t>t0.05(n-2)时,p<0.05拒绝原假设;
返回
相关分析菜单项
返回
两个变量间的相关分析
返回
二元变量相关分析主对话框
返回
输出选择项对话框
返回
两变量间相关分析实[例1]
安徽省国民收入与城乡居民存款余额的相关分析 (使用默认参数)
返回
两变量间相关分析实[例2]
描述统计量
返回
两变量间相关分析实[例2]
Pearson相关系数矩阵
返回
两变量间相关分析实[例2]
4.500 6.800 13.800
10:10 10.290
9.800 8.800
.500 2.700 6.000 7.700 9.000 4.500
2.300 9.300
This is a diss imilarity matrix
11:11 7.990 7.500 6.500 2.800 5.000 8.300 10.000 11.300 6.800 2.300
1. 什么是两个变量间的线性相关?两个变量间的相关系数的数值范围是什么? 负相关系数反映的是两个变量数值间的什么样的关系?
2. SPSS提供了几个求相关系数的方法?个适应什么样的变量? 3. 在data10-05中记录了29个被试的身高、体重、肺活量的数据,试分析肺活 量与哪个因素线性相关程度更高。说明为 什么要计算偏相关? 4、在data10-02中是474名职工的职务等级jobcat、起始工资salary、现工资 salary、受教育程度educ、本单位工作经历(月)jobtime、以前工作经历 (月)prevexp,id为职工编号。分析该公司起始工资的确定与什么因素有关。 当前工资与什么因素有关。 5. data10-06是某公司太阳镜销售情况。分析销售量与平均价格、广告费用和 日照时间之间的关系。作图协助分析。此题使用偏相关分析是否有实际意义?
返回
典型相关分析过程
返回
典型相关分析-实例分析
【 例 8 】 随机抽取某高中高一男生 38 人,测试反映 其体力和运动能力的 12 项测试指标,测试结果数据资料 已存放在数据文件 data10-07 中。各测试指标如下。
体力测试指标:反复横向跳(次)、纵跳( cm )、背力 ( kg )、握力( kg )、台阶试验(指数)、立定体前屈 ( cm )、俯卧上体后仰( cm )(俯卧背伸测验)。
.6318 ( 7) 0.068
月降雨量
-0.4906 ( 7) 0.180
中山柏生长量与四个气候因素的偏相关综合结果
返回
偏相关基本程序
PARTIAL CORR /VARIABLES= hgrow hsun BY humi rain temp /SIGNIFICANCE=TWOTAIL /MISSING=LISTWISE
运动能力测试指标: 50 米跑(秒)、跳远( cm )、投球 ( m )、引体向上(次)、耐力跑(秒)。
试分析高中生的体力与运动能力是否相关。
返回
相关系数
返回
典型相关性
返回
表 10-16 第一组变量在典型变量中的 表 10-17 第一组变量在典型变量中的
标准典型系数
非标准典型系数
返回
表 10-18 第二组变量在典型变量中的 标准典型系数
PARTIAL CORR /VARIABLES= VCP with WEIGHT BY HEIGHT /SIGNIFICANCE=TWOTAIL /MISSING=LISTWISE .
PARTIAL CORR /VARIABLES= VCP with HEIGHT BY WEIGHT /SIGNIFICANCE=TWOTAIL /MISSING=LISTWISE .
做偏相关,执行这样两个程序。