SPSS-相关分析与回归分析专题
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关分析 与 回归分析
五、SPSS中相关分析─Correlation菜单
在Analyze的下拉菜单Correlate命令项中有三个相关 分析功能子命令: Bivariate(两两相关分析过程) Partial (偏相关分析过程) Distances(距离分析过程)
相关分析 与 回归分析
相关系数的计算
样本的相关系数一般用r表示,总体的相关系数一般用p表 示。 对于不同类型的变量,相关系数的计算公式不同。在相关 分析中,常用的相关系数有: Pearson简单相关系数:对定距连续变量的数据进行计算。 如测度收入和储蓄,身高和体重。 Spearman等级相关系数:用于度量定序变量间的线性相关 关系。如军队教员的军衔与职称。 Kendall r相关系数:用非参数检验方法来度量定序变量间 的线性相关关系。计算基于数据的秩。
相关分析 与 回归分析
四、相关系数
相关分析的主要目的是研究变量之间关系的密切程度, 以及根据样本的资料推断总体是否样关。反映变量之间关 系紧密程度的指标主要是相关系数 r 。相关系数 r 取值在 -1 到+1之间,当数值愈接近-1或+1时,说明关系愈紧密,接 近于0时,说明关系不紧密。
相关分析 与 回归分析
在通常使用的距离中,最常用的是欧式距离。
相关分析 与 回归分析
案例:打开“地区经济发展水平指标.sav”
相关分析 与 回归分析
参数设置:
分析变量例表
距离的计算对象
距离的测度类型
相关分析 与 回归分析
结果分析:
相关分析 与 回归分析
(1)案例处理摘要。“案例处理摘要”表格给出了数 据使用的基本情况。主要是对有无缺失值的统计信息, 可见本例的11个案例没有缺失,全部用于分析。 (2)近似矩阵。“近似矩阵”表格给出的是各变量之 间的相似矩阵,图中以线框标注了相关系数较大的几对 变量。它们在进一步的分析中应重点关注,或者直接对 其进行适当的预处理(例如变量约减)
相关分析 与 回归分析
R2取值在0-1之间, R2越接近于1,说明回归方程对样 本数据点的拟合优度越高。
线性回归
相关分析 与 回归分析
回归方程的统计检验 回归方程的拟合优度检验(相关系数检验) R2 多元线性回归的拟合优度检验采用 统计量,称为调整的 判定系数或调整的决定系数,数学定义为
i 1
2
(1)
最小二乘估计就是寻找参数β 0 、β 1、… β p的估计值β ̂0 、β ̂ ̂ 1、… β p,使式(1)达到极小。通过求极值原理(偏导为零) 和解方程组,可求得估计值,SPSS将自动完成。
线性回归
相关分析 与 回归分析
回归方程的统计检验 回归方程的拟合优度检验(相关系数检验) 一元线性回归的拟合优度检验采用R2统计量,称为判定 系数或决定系数,数学定义为
R2
2 ˆ ( y y ) i 2 ( y y ) i i 1 i 1 n n
其中
2 ˆ ( y y ) i i 1
n
n
称为回归平方和(SSA) 称为总离差平方和(SST)
2 ( y y ) i i 1
线性回归
回归方程的统计检验
回归方程的拟合优度检验(相关系数检验)
相关分析 与 回归分析
举例: 分析身高与肺活量之间的相关性,要控制体重在 相关分析过程中的影响。 1.设置偏相关分析的参数。 依次单击“Analyze-Correlate-Patial”执行偏相 关分析。其主设置面板如图所示:
相关分析 与 回归分析
0阶偏相关 (Pearson)
1阶偏相关
显著相关
相关分析 与 回归分析
不相似性测度 a、对定距变量的测度可以使用的统计量有Euclid欧氏距离、 平方欧氏距离、契比雪夫距离等。 b、对定序变量,使用卡方不相似测度和Phi方不相似测度。 c、对二值(只有两种取值)变量,使用欧氏距离、平方欧 氏距离、Lane and Williams 不相似测度。 相似性测度: a、对定距变量的测度,主要有统计量Pearson相关或余弦距 离。 b 、对二值变量的相似性测度主要包括简单匹配系数、Jacc ard相似性指数等。
Bivariate过程
相关分析 与 回归分析
Bivariate过程用于进行两个或多个变量间的参数与非 参数相关分析,如为多个变量,给出两两相关的分析 结果。这是correlate菜单中最常用的一个过程,包括自 动计算Pearson简单相关系数、T检验统计量和对应的 概率P值。
相关分析 与 回归分析
相关不显著
相关分析 与 回归分析
(1)描述性输出,“描述性统计量”表格给出了三个 变量的基本统计信息,包括均值、标准差和频率。 (2)相关性输出,“相关性”表格给出了所有变量的0 阶偏相关(Pearson简单相关)系数和1阶偏相关系数的 计算结果果、以及它们各自的显著性检验P值。分析结 果显示:在体重 不变的条件下,身高与肺活量之间不 存在显著 线性相关关系。
相关分析 与 回归分析
线性回归
线性回归
函数关系 事物关系
相关分析 与 回归分析
(一一对应)
统计关系 线性相关
(非一一对应)
非线性相关
线性回归
相关分析 与 回归分析
回归分析(regression analysis) 确定两种或两种以上变数间相互依赖的定量 关系的一种统计分析方法。 涉及的自变量的多少 a. 一元回归分析 b. 多元回归分析 自变量和因变量之间的关系类型, a. 线性回归分析 b. 非线性回归分析
研究者把非确定性关系称为相关关系。
相关分析 与 回归分析
三.相关分析的特点和应用
相关关系是普遍存在的,函数关系仅是相关关系的特 例。 1.相关关系的类型 相关关系多种多样,归纳起来大致有以下6种: 强正相关关系,其特点是一变量X增加,导致另一变量 Y明显增加,说明X是影响Y的主要因素。 弱正相关关系,其特点是一变量X增加,导致另一变量 Y增加,但增加幅度不明显。 强负相关关系,其特点是X增加,导致Y明显减少,说 明X是影响Y的主要因素
相关分析 与 回归分析
Distances过程
相关分析 与 回归分析
距离分析:此过程可以在观测记录之间或者 不同变量 之间进行相似性和不相似性分析。相似性分析可以用 于检测观测值的接近程度,不相似性分析可用于考察 各变量的内在联系和结构。该过程一般不单独使用, 而是作为因子分析、聚类分析和多维尺度分析等的预 分析过程,以帮助了解复杂数据集的内部结构,为进 一步的分析做准备。 与距离分析有关的统计量分为相似性测度和不相似性 测试两大类。
相关分析 与 回归分析
相关分析与回归分析专题 (Correlation & regression)
相关分析 与 回归分析
相关分析
(Correlation Analysis)
相关分析 与 回归分析
一、相关分析的意义:
研究问题过程:单变量分析 双变量分析 多变量分析 多变量分析与单变量分析的最大不同:揭示客观事物之间 的关联性。 所以,相关分析的意义和目的在于: (1)在统计学中有理论与实践意义 (2)对相关关系的存在性给出判断 ( 3 ) 对相关关系的强度给出度量和分析
相关分析 与 回归分析
2.相关分析的应用 (1)相关分析可以在影响某个变量的诸多变量中判断 哪些是显著的,哪些是不显著的。而且在得到相关分析 的结果后,可以用于其他分析,如回归分析和因子分析。 (2) 相关分析方法已广泛用于心理学、教育学、医 学、经济学等各学科。它对试验数据的处理、经验公式 的建立、管理标准的测定、自然现象和经济现象的统计 预报,都是一种方便而且有效的工具。
相关分析 与 回归分析
二、相关分析的概念
变量之间的关系分为确定性关系和非确定性关系。 确定性关系:当一个变量值(自变量)确定后,另一个 变量值(因变量)也就完全确定了,确定性关系往往可以 表示成一个函数的形式,比如圆的面积和半径的关系: S=π r² 非确定性关系:给定了一个变量值后,另一个变量值可 以在一定范围内变化,例如家庭的消费支出和家庭收入的 关系。
举例:对肺活量和体重
做相关分析
1.打开SAV数据。
2.用散点图初步观察两变量 间有无相关趋势,依次单击 菜单“Graphs-Chart Builder ”打开图形构建器,选择做 散点图(Scatter /Dot)。
相关分析 与 回归分析
3.设置相关分析的参数。 依次单击“Analyze-Correlate-Bivariate”执 行两变量相关分析。其主设置面板如图所示:
线性回归
相关分析 பைடு நூலகம் 回归分析
回归分析一般步骤: •确定回归方程中的解释变量(自变量)和被 解释变量(因变量) •确定回归模型 •建立回归方程 •对回归方程进行各种检验 •利用回归方程进行预测
线性回归
线性回归模型
相关分析 与 回归分析
一元线性回归模型是指只有一个解释变量的线性 回归模型,用于揭示被解释变量与另一个解释变量 之间的线性关系。 一元线性回归数学模型:
y 0 1x1 2 x2 pxp
其中β 0、β 1、… β p都是未知参数,分别称为回归常 数和偏回归系数,ε称为随机误差,是一个随机变量, 且同样满足两个前提条件: E( ε )=0 var(ε)=σ2
线性回归
回归参数的普通最小二乘估计(OLSE)
相关分析 与 回归分析
线性回归方程确定后的任务是利用已经收集到的样本数据,根 据一定的统计拟合准则,对方程中的各参数进行估计。普通最 小二乘就是一种最为常见的统计拟合准则。 最小二乘法将偏差距离定义为离差平方和,即 n
Q( 0, 1, p) ( yi E ( yi ))
相关分析 与 回归分析
弱负相关关系,其特点是变量X增加,导致Y减少,但 减少幅度不明显,说明X是Y的影响因素,但不是唯一 因素。 非线性相关关系,其特点是X、Y之间没有明显的线性 关系,却存在着某种非线性关系,说明X仍是影响Y的 因素。 不相关,其特点是X、Y不存在相关关系,说明X不是 影响Y的因素。
变量列表
待分析变量列表
相关系数 显著性检验选项
相关分析 与 回归分析
相关分析 与 回归分析
(1)描述性输出,“描述性统计量”表格给出了两 个变量的基本统计信息,包括均值、标准差和频率。
(2)相关性输出,“相关性”表格给出的是Pearson 相关系数及其检验结果:“相关系数”表格给出的 是两个非参数相关系数及其检验结果。可见,3个相 关系数在0.01和0.05的显著性水平(双边检验)上都 非常显著,从而推断体重和肺活量之间存在着明显 的正相关关系。
y 0 1x
其中β 0和β 1是未知参数,分别称为回归常数和回归 系数,ε称为随机误差,是一个随机变量,且应该 满足两个前提条件: E( ε )=0 var(ε)=σ2
线性回归
线性回归模型
相关分析 与 回归分析
多元线性回归模型是指有多个解释变量的线性回归 模型,用于揭示被解释变量与其他多个解释变量之间 的线性关系。 多元线性回归数学模型:
相关分析 与 回归分析
Partial 过程
相关分析 与 回归分析
偏相关分析也称净相关分析,它在控制其他变量的线性 影响下分析两变量间的线性相关,所采用的是工具是偏 相关系数(净相关系数)。运用偏相关分析可以有效地 揭示变量间的真实关系,识别干扰变量并寻找隐含的相 关性。如控制年龄和工作经验的影响,估计工资收入与 受教育水平之间的相关关系。 Partial过程,当进行相关分析的两个变量的取值都受 到其他变量的影响时,就可以利用偏相关分析对其他变 量进行控制,输出控制其他变量影响后的相关系数。
相关分析 与 回归分析
Pearson相关系数应用广泛,其计算公式及其性质如下:
r
( x x)( y y) ( x x) ( y y )
2
2
r 0.3 微弱相关、 0.3 r 0.5 低度相关 0.5 r 0.8 显著相关、 0.8 r 1 高度相关 当r 0时,表示x与y为正相关 当r 0时,表示x与y为负相关 当 r 0时,表示x与y不相关