利用SPSS进行相关分析(第八章)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
③于是其中的 xi 和 yi 的取值范围被限制在1和n之间,且可被简
化为:
r
1
6 n(n2
Di2 ,其中 n
1)
i1
Di2
n i1
(Ui
Vi )2
多元统计分析
①如果两变量的正相关性较强,它们秩的变化具有同步性,于
n
n
是 Di2 (Ui Vi )2 的值较小,r趋向于1;
i 1
i 1
②如果两变量的正相关性较弱,它们秩的变化不具有同步性,
系数和Kendall 相关系数等。
1.Pearson简单相关系数(适用于两个变量都是数值型的数
据)
R xy
n
(
xi
x)(
y i
y)
i 1
n
2n
2
( xi x)
i 1
i 1
(
yi
Байду номын сангаас
y)
Pearson简单相关系数的检验统计量为:
t r n 2 ~ t(n 2) 1 r2
多元统计分析
2. Spearman等级相关系数
个变量的取值来估计另一个变量的取值,这就是回归分析。 绘制散点图和计算相关系数是相关分析最常用的工具,它
们的相互结合能够达到较为理想的分析效果。
多元统计分析
二、绘制散点图
2.1 散点图的特点 散点图:是将数据以点的形式画在直角坐标系上,通过观
察散点图能够直观的发现变量间的相关关系及它们的强弱程度和 方向。
多元统计分析
利用SPSS进行相关分析 (Correlations)
多元统计分析
一、 相关分析概述
1.1 统计关系与函数关系 客观事物之间的关系大致可分为两大类关系:
(1)函数关系:当一个或几个变量取一定的值时,另一个 变量有确定值与之相对应,我们称这种关系为确定性的函数关系。
(2)统计关系:两事物之间的一种非一一对应的关系,即 当一个变量x取一定值时,另一变量y无法依确定的函数取唯一确 定的值。
(1)提出原假设,即两总体无显著的线性关系。 (2)选择检验统计量,即不同的相关系数。 (3)计算检验统计量的观测值和对应的概率值。 (4)决策:两总体之间有或者没有线性相关关系。
多元统计分析
3.2 相关系数的种类
对不同类型的变量应采用不同的相关系数来度量,常用的
相关系数主要有Pearson简单相关系数、Spearman等级相关
多元统计分析
1.3 正线性相关与负线性相关 线性相关可以分为: (1)正线性相关:两个变量线性的相随变动方向相同。 (2)负线性相关:两个变量线性的相随变动方向相反。
1.4 相关分析与回归分析 如果仅仅研究变量之间的相互关系的密切程度和变化趋势,
并用适当的统计指标描述。这就是相关分析。 如果要把变量间相互关系用函数表达出来,用一个或多
①Spearman等级相关系数用来度量定序变量间的线性相关关系,
②设计思想与Pearson简单相关系数相同,只是数据为非定距的,
故计算时并不直接采用原始数据 (xi , yi ) ,而是利用数据的秩, 用两变量的秩 (Ui ,Vi ) 代替 (xi , yi ) 代入Pearson简单相关系数
计算公式
n
n
于是 Di2 (Ui Vi )2 的值较大,r趋向于0;
i 1
i 1
③小样本下,在零假设成立时, Spearman等级相关系数服从
④|r|>0.8表示两变量有较强的线性关系; |r|<0.3表示两变 量之间的线性关系较弱
多元统计分析
2.对样本来自的两总体是否存在显著的线性关系进行推断
由于存在随机抽样和样本数量较少等原因,通常样本相关系 数不能直接用来说明样本来自的总体是否具有显著的线性相关性, 而需要通过假设检验的方式对样本来自的总体是否存在显著的线 性相关关系进行统计推断。基本步骤是:
多元统计分析
1.2 线性相关和非线性相关 统计关系可再进一步分为:
(1)线性相关:当一个变量的值发生变化时,另外的一个 变量也发生大致相同的变化。在直角坐标系中,如现象观察值的 分布大致在一条直线上,则现象之间的相关关系为线性相关或直 线相关(Linear correlation)。
(2)非线性相关:如果一个变量发生变动,另外的变量 也随之变动,但是,其观察值分布近似的在一条曲线上,则变量 之间的相关关系为非线性相关或曲线相关(Curvilinear correlation)
利用SPSS绘制散点图 【图形(Graps)】 【旧对话框)】
【散点/点状(Scatter)】
多元统计分析
简单散点图 ①表示一对变量间统计关系的散 点图,点击定义。 ②将纵轴变量选入【Y 轴】, ③将横轴变量选入【X轴】, ④将分组变量选入【设置标记】: 用该变量分组,并在一张图上用 不同颜色绘制若干个散点图。 ⑤将标记变量选入【标注个案】: 将标记变量的各变量值标记在散 点图相应点的旁边。
完全正相关 y
x
r=0.7~0.8
正相关
y
x
r=0
无相关 y
x
r=-1
完全负相关
r=-0.7 ~ -0.8 x
负相关
x
r=0
无相关
多元统计分析
2.2 散点图应用举例 例8-3为了分析影响生猪养殖的原因,我们选取以下代表生猪生 产的主要指标:Y1肉猪出栏头数(万头)、Y2生猪年底存栏头 数(万头)、Y3猪肉产量(万吨)、Y4出口活猪数量(万头)。 对生猪生产有影响的指标有:X1猪(毛重)生产价格指数 (1977年为100)、X2粮食产量(万吨)、X3粮食零售价格指 数(1977=100)、X4农村居民人均纯收入(元)、X5乡村总人口 数(万人)、X6全国人均猪肉消费量(斤)。
多元统计分析
多元统计分析
多元统计分析
多元统计分析
三、 计算相关系数
3.1 相关系数的特点 利用相关系数进行变量间线性关系的分析通常需要完成以
下两个步骤:
1.计算样本相关系数r
①相关系数r的取值在-1~+1之间 ②r>0表示两变量存在正的线性相关关系;r<0表示两变量 存在负的线性相关关系
③r=1表示两变量存在完全正相关;r=-1表示两变量存在 完全负相关;r=0表示两变量不相关
在实际分析中,散点图经常表现出某些特定的形式。如绝大 多数的数据类似于“橄榄球”的形状,或集中形成一根“棒状”, 而剩余的少数数据点则零散地分布在四周。通常“橄榄球”和 “棒状”代表了数据对的主要结构和特征,可以利用曲线将这种 主要结构的轮廓描绘出来,是数据的主要特征更突出。
多元统计分析
y
y
r=1
相关文档
最新文档