第7章 SPSS的相关分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

7.2 SPSS在简单相关分析中的应用
2、相关系数
虽然相关图能够展现变量之间的数量关系,但这也只是种直观判断方法。因此, 可以计算变量之间的相关系数。对不同类型的变量应当采取不同的相关系数来度 量,常用的相关系数主要有: 皮尔逊(Pearson)相关系数
常称为积差相关系数,适用于研究连续变量之间的相关程度。例如,收入和储 蓄存款、身高和体重等变量间的线性相关关系。注意Pearson相关系数适用于线 性相关的情形,对于曲线相关等更为复杂的情形,系数的大小并不能代表其相关 性的强弱。它的计算公式为:
Step03:选择相关系数类型
图中的【Correlation Coefficients(相关系数)】选项组中可以选择计算 简单相关系数的类型。
● Pearson:系统默认项,即积差相关系数,计算连续变量或是等间距测度 的变量间的相关分析。
● Kendall:等级相关,计算分类变量间的秩相关。 ● Spearman:等级相关,斯皮尔曼相关系数。 对于非等间距测度的连续变量,因为分布不明可以使用等级相关分析,也可 以使用Pearson 相关分析;对于完全等级的离散变量必须使用等级相关分析相 关性。当资料不服从双变量正态分布或总体分布型未知,或原始数据是用等级 表示时,宜用Spearman 或Kendall相关。
7.2 SPSS在简单相关分析中的应用
(3)非参数相关系数表 表7-5列出了两种股票指数的Kendall和Spearman相关系数,
分别等于0.994和0.985;同时它们的概率P值也远小于显著性 水平。但本案例中,Spearman相关系数和Kendall相关系数都 小于Pearson相关系数,显然这是由于在秩变换或数据按有序 分类处理时损失信息所导致的。
从斯皮尔曼等级相关适用条件中可以看出,等级相关的应用范围要比积差相关 广泛,它的突出优点是对数据的总体分布、样本大小都不做要求。但缺点是计算 精度不高。斯皮尔曼等级相关系数常用符号 来表示。其基本公式为:
式中:D是两个变量每对数据等级之差,n是两列变量值的对数。 Spearman相关系数计算公式可以完全套用Pearson相关系数的计算公式,但公式中的
两个变量之间的相关程度用相关系数r的绝对值表示,其绝对值越接 近1,表明两个变量的相关程度越高;其绝对值越接近于0,表明两个变量 相关程度越低。如果其绝对值等于零1,则表示两个变量完全直线相关。 如果其绝对值为零,则表示两个变量完全不相关(不是直线相关)。
7.1.2 相关分析
3.Байду номын сангаас关系数
变量相关的方向通过相关系数r所具有的符号来表示,“+” 号表示正相关,即0≤r≤1。“﹣”表示负相关,即0≥ r ≥ ﹣1。在使用相关系数时应该注意下面的几个问题。 (1)相关系数只是一个比率值,并不具备与相关变量相同的测量 单位。 (2)相关系数r 受变量取值区间大小及样本数目多少的影响比较 大。 (3)来自于不同群体且不同质的事物的相关系数不能进行比较。 (4)对于不同类型的数据,计算相关系数的方法也不相同。
7.1.2 相关分析
2.相关系数
相关系数是在直线相关条件下,说明两个变量之间相关程度以及相 关方向的统计分析指标。相关系数一般可以通过计算得到。作为样本相关 系数,常用字母r表示;作为总体相关系数,常用字母ρ表示。
相关系数的数值范围是介于–1与 +1之间(即–1≤ r ≤1),常用 小数形式表示,一般要取小数点后两位数字来表示,以便比较精确地描述 其相关程度。
7.2 SPSS在简单相关分析中的应用
7.2.1 简单相关分析的基本原理
简单相关分析是研究两个变量之间关联程度的统计方法。它主要是通过 计算简单相关系数来反映变量之间关系的强弱。一般它有图形和数值两 种表示方式。
1、相关图 在统计中制作相关图,可以直观地判断事物现象之间大致上呈现何
种关系的形式。相关图是相关分析的重要方法。利用直角坐标系第一象 限,把第一个变量置于横轴上,第二个变量置于纵轴上,而将两个变量 对应的变量值用坐标点形式描绘出来,用以表明相关点分布状况的图形, 这就是相关图
计量的Bootstrap估计。 ● 描述统计表支持均值和标准差的Bootstrap 估计。 ● 相关性表支持相关性的Bootstrap 估计。
7.2 SPSS在简单相关分析中的应用
Step07:单击【OK】按钮,结束操作,SPSS软件自动输出结果。
7.2 SPSS在简单相关分析中的应用
7.2.3 实例分析:股票指数之间的联系
7.2 SPSS在简单相关分析中的应用
7.2 SPSS在简单相关分析中的应用
3. 实例结果及分析
(1)描述性统计分析表 执行完上面的操作后,首先给出的是当前样本进行描述性统计的结果,
如表7-3所示。可以看到样本容量都等于10,道琼斯工业平均指数和 标准普尔指数的平均均值分别为7743.60和945.10,两者差距显著。 同时,两者的方差差距也很明显。
1. 实例内容
道琼斯工业平均指数(DJIA)和标准普尔指数500(S&P 500) 都被用做股市全面动态的测度。DJIA是基于30种股票的价格动 态;S&P 500是由500种股票组成的指数。有人说S&P 500是股 票市场功能的一种更好的测度,因为它基于更多的股票。表72显示了DJIA和S&P 500在1997年10周内的收盘价。请计算它们 之间的样本相关系数。不仅如此,样本相关系数告诉我们DJIA 和S&P 500之间的关系是怎样的?
7.2 SPSS在简单相关分析中的应用
(2)Pearson相关系数表 接着SPSS列出了道琼斯工业平均指数和标准普尔指数的Pearson相关 系数表7-4。可以看到,两种指数的Pearson系数值高达0.995,非常 接近1;同时相伴概率P值明显小于显著性水平0.01,这也进一步说明 两者高度正线性相关。
所以,通过以上分析看到,道琼斯工业平均指数和标准普尔 指数具有高度正相关性,一个指数的上涨或上跌时,另一个指 数也会伴随着上涨或下跌。
7.2 SPSS在简单相关分析中的应用
7.3 SPSS在偏相关分析中的应用
7.3.1 偏相关分析的基本原理 1.方法概述
简单相关分析计算两个变量之间的相互关系,分析两个变量间线 性关系的程度。但是现实中,事物之间的联系可能存在于多个主体之 间,因此往往因为第三个变量的作用使得相关系数不能真实地反映两 个变量间的线性相关程度。例如身高、体重与肺活量之间的关系,如 果使用Pearson 相关计算其相关系数,可以得出肺活量、身高和体重 均存在较强的线性相关性质。但实际上呢,对体重相同的人而言,身 高值越大其肺活量也不一定越大。因为身高与体重有着线性关系,肺 活量与体重有着线性关系,因此得出了身高与肺活量之间存在较强的 线性关系的错误结论。偏相关分析就是在研究两个变量之间的线性相 关关系时控制可能对其产生影响的变量。
7.2 SPSS在简单相关分析中的应用
7.2 SPSS在简单相关分析中的应用
Step02:选择检验变量
在【Bivariate Correlations(双变量相关)】对话框左侧的候选变量列表框 中选择两个个或两个以上变量将其添加至【Variables(变量)】列表框中,表 示需要进行简单相关分析的变量。
相关关系反映出变量之间虽然相互影响,具有依存关系,但彼此之间是不能一 一对应的。例如,学生成绩与其智力因素、各科学习成绩之间的关系、教育投资额 与经济发展水平的关系、社会环境与人民健康的关系等等,都反映出客观现象中存 在的相关关系。
7.1 相关分析概述
2.相关关系的类型
(1)根据相关程度的不同,相关关系可分为完全相关、不完全相关和 无相关。
Spearman等级相关系数用来度量顺序水准变量间的线性相关关系。它是利用 两变量的秩次大小作线性相关分析,适用条件为:
① 两个变量的变量值是以等级次序表示的资料; ② 一个变量的变量值是等级数据,另一个变量的变量值是等距或比率数据,
且其两总体不要求是正态分布,样本容量n不一定大于30。
7.2 SPSS在简单相关分析中的应用
SPSS将自动计算它的相关系数、检验统计量和对应的概率P值。
7.2 SPSS在简单相关分析中的应用
7.2.2 简单相关分析的SPSS操作详解 Step01:打开主菜单
选择菜单栏中的【Analyze(分析)】→【Correlate(相关)】 →【Bivariate(双变量)】命令,弹出【Bivariate Correlati ons(双变量相关)】对话框,如图7-1所示,这是简单相关检验 的主操作窗口。
7.2 SPSS在简单相关分析中的应用
Step04:假设检验类型选择 在图中的【Test of Significance(显著性检验)】选项组中可以选
择输出的假设检验类型,对应有两个单选项。 ● Two tailed:系统默认项。双尾检验,当事先不知道相关方向(正
相关还是负相关)时选择此项。 ● One tailed:单尾检验,如果事先知道相关方向可以选择此项。 同时,可以勾选【Flag significant Correlations(标记显著性相关)】
7.2 SPSS在简单相关分析中的应用
2. 实例操作 表给出了道琼斯工业平均指数和标准普尔指数在同一时间点的 数值。由于这些数值都是连续型变量,同时根据两个股票指数 的散点图,可见它们呈显著的线性相关,因此可以采用Pearso n相关系数来测度它们之间的相关性。但为了比较,我们也计 算了这两组变量的Kendall和Spearman相关系数。
x和y用它们的秩次代替即可。
7.2 SPSS在简单相关分析中的应用
Kendall’s等级相关系数 它是用于反映分类变量相关性的指标,适用于两个变量均为有序分
类的情况。这种指标采用非参数检验方法测度变量间的相关关系。它利 用变量的秩计算一致对数目和非一致对数目。显然,如果两变量具有较 强的正相关,则一致对数目U应较大;但若两变量相关性较弱,则一致对 数目U和非一致对数目V应大致相等。故按照此思想,可得其定义为:
第7章 SPSS的相关分析
7.1 相关分析概述
7.1.1 相关的基本概念
1. 函数关系和相关关系
函数关系是指事物或现象之间存在着严格的依存关系,其主要特征是它的确定 性,即对一个变量的每一个值,另一个变量都具有惟一确定的值与之相对应。变量 之间的函数关系通常可以用函数式Y=f(x)确切地表示出来。例如,圆的周长C对于 半径r的依存关系就是函数关系:C=2πr。
值是缺失的个案。 ● Exclude cases listwise:表示剔除所有含缺失值的个案后再进行
分析。
7.2 SPSS在简单相关分析中的应用
7.2 SPSS在简单相关分析中的应用
Step06:相关统计量的Bootstrap估计 单击【Bootstrap】按钮,在弹出的对话框中可以进行如下统
复选框。它表示选择此项后,输出结果中对在显著性水平0.05下显著 相关的相关系数用一个星号“*”加以标记;对在显著性水平0.01下 显著相关的相关系数用两个星号“**”标记。
7.2 SPSS在简单相关分析中的应用
Step05:其他选项选择 单击【Options (选项)】按钮,弹出的对话框用于指定输出内容和 关于缺失值的处理方法,主要包括以下选项。
① Statistics:选择输出统计量。 ● Means and standard deviations:将输出选中的各变量的观测值数
目、均值和标准差。 ● Cross-product deviations and covariances:输出反映选中的每
一对变量之间的叉积离差矩阵和协方差矩阵。 ② MissingValues:用于设置缺失值的处理方式。它有两种处理方式: ● Exclude cases pairwise:系统默认项。剔除当前分析的两个变量
(2)根据变量值变动方向的趋势,相关关系可分为正相关和负相关。 (3)根据变量关系的形态,相关关系可分为直线相关和曲线相关。 (4)根据研究变量的多少,可分为单相关、复相关。
7.1.2 相关分析
1.相关分析的作用
(1)判断变量之间有无联系 (2)确定选择相关关系的表现形式及相关分析方法 (3)把握相关关系的方向与密切程度 (4)相关分析不但可以描述变量之间的关系状况,而且用来进行预测。 (5)相关分析还可以用来评价测量量具的信度、效度以及项目的区分度等。
利用相关系数r的大小可以判断变量间相关关系的密切程度,具体见表所示。
7.2 SPSS在简单相关分析中的应用
7.2.1 简单相关分析的基本原理
7.2 SPSS在简单相关分析中的应用
对Pearson简单相关系数的统计检验是计算t统计量,t统计量服从n-2个自由 度的t分布。SPSS会自动计算r统计量和t值,并依据t分布表给出其对应 的相伴概率值。
相关文档
最新文档