第10章 相关与回归分析PPT教学课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
利用逐步回归进行选择。
通过SPSS软件得到三个自变量:
➢ Salary Pre MBA(x1)
➢ Five Year Gain(x2)
➢ Years To Payback(x3)
菜单:“Analyze”>“Regression”
y 1 0 6 . 8 9 2 1 . 0 5 5 x 1 ->0 . “8 8 L3 ix n2 e a3 r2 ”. 4 4 2 x 3
第10章 相关 与回归分析
统计数据分析基础教程
―基于SPSS和Excel的调查数据分析
第10章 相关与回归分析
本章内容
第10章 相关 与回归分析
10.1 问题的提出 10.2 定量变量的线性相关分析 10.3 利用SPSS实现线性相关分析 10.4 定量变量的线性回归分析 10.5 利用SPSS实现线性回归分析 10.6 利用Excel图表实现一元线性回 归分析 10.7 利用Excel回归分析工具实现多 元线性回归分析
响程度:在Five Year Gain(x2)和Years To Payback(x3) 不变的条件下,Salary Pre MBA(x1)每增加(或减少)1个 单位,Salary Post MBA平均增加(或减少)1.055个单位。 ➢ (3)Five Year Gain(x2)对Salary Post MBA(y)的影响 程度:在Salary Pre MBA(x1)和Years To Payback(x3) 不变的条件下,Five Year Gain(x2)每增加(或减少)1个单 位,Salary Post MBA平均增加(或减少)0.883个单位。 ➢ (4)Years To Payback(x3)对Salary Post MBA(y)的影 响程度:在Salary Pre MBA(x1)和Five Year Gain(x2)不 变的条件下,Years To Payback(x3)每增加(或减少)1个单 位,Salary Post MBA平均增加(或减少)32.442个单位。
10.1 问题的提出
第10章 相关 与回归分析
发现变量之间的统计关系,并且用此规律来帮助人们进行 决策才是统计实践的最终目的。
一般来说,统计可以根据目前所拥有的信息(数据)来建 立人们所关心的变量和其他有关变量的关系。这种关系一 般称为模型(Model)。
假如用Y表示感兴趣的变量,用X表示其他可能与Y有关的 变量(X也可能是若干变量组成的向量),则所需要的是建 立一个函数关系Y=f(X)。
这里Y称为因变量或响应变量(Dependent Variable, Response Variable),而X称为自变量,也称为解释变量 或 协 变 量 ( Independent Variable , Explanatory Variable,Covariate)。
建立这种关系的过程就叫做回归(Regression)。
第10章 相关 与回归分析
对于例10-1,利用SPSS可以很容易得
到进入MBA前后工资之间的线性相关系
数。
菜单:“Analyze”->“Correlate”
>“Bivariate”
结果:进入MBA前后工资的线性相关 系数r=0.924,且检验的p值为0.000,说 明这两个变量线性相关,因此可以考虑
10.1 问题的提出
第10章 相关 与回归分析
例10-1 有美国60个著名商学院的数据,包括的变 量有GMAT分数、学费、进入MBA前后的工资等。
进入MBA前后工资的散点图。可以看出,进入 MBA前工资高的,毕业后工资也高。
希望能够建立一个模型描述这个关系。
180
Salary Post MBA
140
10.5 利用SPSS实现线性回归分
第10章 相关 与回归分析
析
对于例10-1,关心的是Salary Post MBA(y)和什么有关。
y 1 0 6 . 8 9 2 1 . 0 5 5 x 1 0 . 8 8 3 x 2 3 2 . 4 4 2 x 3
利用求得的多元线性回归方程可知:
➢ (1)三个自变量都正向影响Salary Post MBA(y); ➢ (2)Salary Pre MBA(x1)对Salary Post MBA(y)的影
最小二乘法就是寻找一条直线,使得所有点到该直 线的竖直距离(即按因变量方向的距离)的平方和最 小。这样的直线很容易通过计算机得到。用数据寻找 一条直线的过程也叫做拟合(Fit)一条直线。
10.5 利用SPSS实现线性回归分
第10章 相关 与回归分析
析
对于例10-1,关心的是Salary Post
MBA(y)和什么有关。
Pearson相关系数又称相关系数或线性相关系数。 它是由两个变量的样本取值得到,是一个描述线性相 关强度的量,一般用字母r表示。取值在-1和+1之间 。当两个变量有很强的线性相关时,相关系数接近于 +1(正相关)或-1(负相关),而当两个变量线性相 关程度较弱时,相关系数就接近0。
10.3 利用SPSS实现线性相关分 析
100
60
25
35
45
55
65
Salary Pre MBA
10.2 定量变ห้องสมุดไป่ตู้的线性相关分析
第10章 相关 与回归分析
如果两个定量变量没有关系,就谈不上建立模型或 进行回归。但怎样才能发现两个定量变量有没有关系 呢?最简单的直观办法就是画出它们的散点图。
散点图很直观,但如何在数量上描述相关呢?这里 介绍一种对相关程度的度量: Pearson相关系数( Pearson’s Correlation Coefficient)。
相关分析与回归分析
第10章 相关 与回归分析
相关分析是分析客观事物之间关系的数量分 析方法。客观事物之间的关系大致可归纳为 两大类关系,分别是函数关系和统计关系。 相关分析是用来分析事物之间统计关系的方 法。 回归分析是一种应用极为广泛的数量分析方 法。它用于分析事物之间的统计关系,侧重 考察变量之间的数量变化规律,并通过回归 方程的形式描述和反映这种关系,帮助人们 准确把握变量受其他一个或多个变量影响的 程度,进而为预测提供科学依据。
10.4 定量变量的线性回归分析
第10章 相关 与回归分析
回归分析是研究变量间相关关系的最重要、最常用 的统计方法,它在工农业生产、金融保险、商业与科 研管理、气象地质等方面都有极其广泛的应用,为解 决实际中的预测、控制等问题提供了强有力的工具。
最小二乘回归(Least Squares Regression)。 古汉语“二乘”是平方的意思。