第十章 相关分析与回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
❖ 前一个变量被称为被解释变量(Explained Variable)或因变量(Dependent Variable)
❖ 后一个(或一些)变量被称为解释变量 (Explanatory Variable)或自变量 (Independent Variable)。
一 、回 归 分 析 概念、种类、步骤
❖ (2)回归分析的特点
ˆ1
n xy x n x2 ( x)2
y
注: ˆ1 的符号与相关系数r是一致的。
3、一元线性回归方程的评价和检验
(1)拟合优度 拟合优度检验(Goodness of Fit Test)主要用来检验 样本回归函数与实际观测点的“接近”程度。拟合优度 检验是通过对 的样本点距其样本均值的离差平方和的 分解来进行的。
❖ B.可决系数
❖ 把回归平方和占总平方和的比例定义为可决系数,
❖ 因此样本拟合优度可用下面的可决系数(或判定系数)
度量:
R2 ESS 1 RSS TSS TSS
可决系数 的取值范围为[0,1],越接近1,说明实际观测点 离样本线越近,拟合优度越高。当R2 =1时,说明总离差完全 由所估计的样本回归直线来解释;当 R2 =0时,说明回归直 线没有解释任何离差,即模型中的自变量与因变量完全无关。
3、一元线性回归方程的评价和检验
❖ (2)显著性检验
❖ A.回归方程的显著性检验
❖ 回归方程的显著性检验主要是要考察所选择的变量是否 从总体上对被解释变量起线性作用,即各个解释变量前 的参数是否不全为零。
❖ 如果所设定的回归方程没有意义,意味着回归方程中所 有解释变量对被解释变量没有解释能力,反映在系数上 就是所有解释变量的系数都为零。
正负弱弱相相关关
0-0<.3r ≤≤r0.<30
正负低低度度相相关关
-00..53≤<rr ≤<0-.05.3
正负显显著著相相关关
-00.5.<8r≤r≤<0.-08.5
正负高高度度相相关关
0-.18<<rr<<-10.8
3、相关系数的显著性检验
(1)提出假设:H1: 0;H0:
(2)计算检验的统计量: t r n 2 ~ t(n 2) 1 r2
❖ 相关图(Correlogram)
❖ 是将原始资料绘制成散点图,判断变量之间的相关关系。 即它是以直角坐标系的横轴代表变量 ,纵轴代表变量 , 将两个变量之间相对应的变量值用坐标点的形式描绘出来, 用来反映两个变量之间的相关关系的图形。
三、相关系数
❖ 1、概念
❖ 相关系数(Correlation Coefficient)是测定变量之间 相关密切程度的统计指标。如果相关系数是根据总体全部 数据计算的,称为总体相关系数,记为ρ ;如果相关系数 是根据样本数据计算的,称为样本相关系数,记为r 。
多元 线性 回归
一元 非 线性回

多元 非线性
回归
一 、回 归 分 析 概念、种类、步骤
❖ 3、回归分析的步骤
❖ 首先,估计回归系数。回归分析的主要任务是建立能够 近似反映真实总体回归函数的样本回归函数。在建立了 理论模型之后首要的任务就是估计模型中的未知参数- 回归系数。
❖ 其次,估计随机误差项的方差。回归模型除了需要估计 回归系数以外,还得估计总体随机误差项的方差,它可 以反映理论模型误差的大小,是检验模型时必须利用的 一个重要参数。
4
7.6
58
不月5能产否量认与全单3.部位2 的成同本类两企个8业变6中量 6 存在8线.5性相关。 50
7
9.7
42
8
6.8
63
9
2.1
91
合计 53.7
613
1)H1: 0;H0:
2) t r n 2 ~ t(n 2) 1 r2
-0.9886
92 1 0.98862
-17.37
❖ 计算公式如下:
XY XY
r
n xy ( x y)
n x2 ( x)2 n y2 ( y)2
三、相关系数
❖ 1、概念
❖ 相关系数(Correlation Coefficient)是测定变量之间 相关密切程度的统计指标。如果相关系数是根据总体全部 数据计算的,称为总体相关系数,记为ρ ;如果相关系数 是根据样本数据计算的,称为样本相关系数,记为r 。
一 、回 归 分 析 概念、种类、步骤
❖ (3)回归分析的任务
❖ 回归分析的基本任务是在相关分析的基础上,具体 描述因变量对自变量的线性依赖关系的形式,即寻 找能够清楚表达变量间相关关系的数学表达式,并 根据这个表达式进行估计、预测等。
2、回归分析的种类
线性回归
回归分析
非线性回归
一元 线性 回归
相关表现形式
x 直线相关
y
非线性(曲线)相关
x
相关关系近似地表现为曲线 。
曲线相关
2、相关关系的种类
y
完全相关
函数关系
相关密切程度
不完全相关
介于完全相关 与无相关之间
无相关
互不影响
y 完全相关
y
不完全相关
无相关
x x
x
二、相关分析与回归分析
❖ 1、相关分析与回归分析的含义
❖ 相关分析(Correlation Analysis)和回归分析 (Regression Analysis)是研究现象之间相关关系的两种 基本方法。所谓相关分析,就是用一个指标来表明现象之 间的相互依存关系的密切程度,其任务是对变量之间是否 存在必然的联系、联系的方式、变动的方向作出符合实际 的判断。
❖ 计算公式如下:
XY XY
r
n xy ( x y)
n x2 ( x)2 n y2 ( y)2
2、相关系数特点
1 r 1 相关密切程度
完全线性相关
无线性相关
不完全线性相关
完全线性正相关 完全线性负相关
不完全线性正相关 不完全线性负相关
r =1 r =-1 r =0 0<r <1 -1<r <0
❖ 第三,回归模型的检验。回归模型中的未知参数估计之 后,还必须对其进行理论意义检验、统计学检验、计量 经济学检验等,以此说明模型能不能很好地解释现实的 现象。
二 、 一元线性回归分析
❖ 1、一元线性回归模型 ❖ 2、一元线性回归模型估计 ❖ 3、一元线性回归模型检验
1、一元线性回归模型建立
一元线性回归模型
二、相关分析与回归分析
❖ 2、相关分析与回归分析的关系
❖ (2)区别
❖ 相关分析研究变量之间相关的方向和相关的程度。但不能指出变量之 间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量 的变化情况。
❖ 回归分析则是研究变量之间相互关系的具体形式,确定一个相关的数 学方程式,可以从一个变量的已知量推算另一个变量的未知量。
总体回归模型(函数)
因变量
总体斜率系数
Y X
总体截距项 自变量
随机误差项 的基本假定:
样本回归模型(函数)
样本斜率系数
样本截距项
残差
总体回归直线
零均值
样本回归直线
E(Y / X ) o 1X
随机误差
同方差
yˆ ˆ0 ˆ1 x
无序列相关 y的估计值
线性无关
离差(残差)
Y E(Y | X ) 正态分布
❖ 相关分析不必确定变量中哪个是自变量,哪个是因变量,涉及到的变 量都可以是随机变量。
❖ 而回归分析必须事先确定变量中哪个是自变量,哪个是因变量。一般 回归分析中因变量是随机变量,而自变量是确定变量。
三、相关分析的作用
❖ 在生产、经营和社会经济现象的研究中,对变量之间的相 关关系进行分析的目的在于根据数据确定变量之间的相关 关系及其程度,探索出其内在的数量规律性。为进一步分 析变量之间的因果关系奠定基础。
❖ 相关关系(Correlation ship)是变量之间的一种不确定的 依存关系。
❖ 相关关系与函数关系有一定的联系。由于有观察或测量误 差等原因,函数关系在实际中往往通过相关关系表现出来。 在研究相关关系时,又常常要使用函数关系的形式来表现, 以便找到相关关系的一般数量表现形式。
2、相关关系的种类
e y yˆ
总体回归直线与样本回归直线
Y
yˆ ˆ0 ˆ1x
ei
i
ˆ1
ˆ0
E(Y | X ) 0 1X
X
2、一元线性回归模型的估计
——最小二乘法
yˆ ˆ0 ˆ1 x
Y
e y yˆ 点到直线的纵向距离
X
Q ( y yˆ)2 e2 min 求ˆ0、ˆ1
最小二乘法估计
将Q对 ˆ0 和 ˆ1 求偏导数并令其等于零:
❖ 回归分析,就是根据相关关系的具体形态,选择一个合适 的数学模型,对存在相关关系的变量之间数量变化的一般 关系进行测定,以确定相关变量之间的数量关系。
二、相关分析与回归分析
❖ 2、相关分析与回归分析的关系
❖ (1)联系
❖ 相关分析和回归分析有着密切的联系,可以相互补充。相 关分析需要依靠回归分析来表明现象数量关系的具体形式, 而回归分析则需要依靠相关分析来表明现象数量变化的相 关程度。只有当变量之间存在高度相关时进行回归分析才 有意义。
3、一元线性回归方程的评价和检验
❖ A.
(Yt Y )2 (Yˆt Y )2 (Yt Yˆt )2
TSS ESS RSS
❖ 在给定样本中,TSS 不变,如果实际观测点离样本回归 线越近,则 ESS在TSS 中占的比重越大,说明自变量对 因变量的解释能力越强,直线拟合得越好。
3、一元线性回归方程的评价和检验
3、一元线性回归方程的评价和检验
❖ A.回归方程的显著性检验
❖ F检验步骤:
❖ 第一步,提出原假设和备则假设。 H0 : 1 0; H1 : 1 0
❖ 正确使用相关分析和回归分析的工具,可以帮助人们在多 个影响因素中,找出主要的影响因素,舍去次要的因素, 更好地抓住主要矛盾,对现象进行深入分析,为决策者提 供相关政策建议。
四、相关分析的内容
❖ 确定现象之间有无相关关系 ❖ 确定相关关系表现形式 ❖ 确定相关关系的密切程度和方向
第二节 相关关系判断
t 3)查表 (n 2) t0.025(7) 2.3646 2
拒绝域
拒绝域
1 -
- 17.37 -2.3646 0
4)比较
2.3646
5)决策: 0
第三节 回 归 分 析 ❖ 一 、 回归分析概念、种类和步骤 ❖ 二 、 一元线性回归分析 ❖ 三、多元线性回归分析 ❖ 四、非线性回归分析
单(一元)相关
1个y、 1个x。
变量多少
复(多元)相关
1个y、2个(以上)x。
偏相关
1个y、2个(以上)x, 其他x固定,研究1个y、1个x的相关关系
2、相关关系的种类
y来自百度文库
正相关
X增加,y增加。
x
相关方向
y
正相关
负相关
X增加,y减少。
x
负相关
2、相关关系的种类
线性(直线)相关
y
相关关系近似地表现为直线
❖ 一、表式法
❖ 二、图示法 ❖ 三、相关系数
一、表示法
❖ 相关表(Correlation Table)
❖ 是根据原始资料编制的表格,是反映变量之间相关关系的 统计表。具体做法是将某一个变量按其取值的大小排列, 然后再将与其相关的其他变量的对应值平行排列,便可以 得出一个简单的相关图。
二、图示法
一 、回 归 分 析 概念、种类、步骤
❖ 1、回归分析的概念
❖ (1)回归分析就是对存在相关关系的变量之间数量 变化的一般关系进行测度,通过建立数学模型,研 究一个变量关于另一个(或一些)变量的具体依赖 关系的计算方法。
❖ 其用意在于通过后者的已知或设定值,去估计和 (或)预测前者的(总体)均值。
❖ 第一、如果模型研究一个变量对另一个变量的依赖 关系,则两个变量不是对等的,要区分因变量和自 变量。
❖ 第二、回归分析可以根据回归方程,用自变量的数 值推算因变量的估计值。
❖ 第三、如果两个变量无明显的因果关系或互为因果 关系,可以建立两个线性回归方程式:一个以 为自 变量, 为因变量的回归方程;一个以 为自变量, 为因变量的回归方程,两个方程是相互独立的,不 能相互替换。
(3)根据 查表得出临界值、拒绝域。
(4)作出决策。
拒绝域
拒绝域
若 t >t,拒绝H0
1-
t a/2
0
t a/2
计算:产量与单位成本间的相关系数并进行显著性检验(α=0.05)
相关系数计算表
xxyy2
序号
月产量 x (千件)
单位成本 y (元)
1
4.1
80
2 r 6.30.988726
3
5.4
71
第十章
相关分析与回归分析
内容摘要
❖ 第一节 相关分析与回归分析概述
❖ 第二节 相 关 关 系 判 断 ❖ 第三节 回 归 分 析
第一节 相 关 分析与回归分析概述
❖ 一、相关关系的概念和种类
❖ 二、相关分析与回归分析 ❖ 三、相关分析的作用 ❖ 四、相关分析的内容
一、相关关系的概念和种类
❖ 1、相关关系的概念
相关文档
最新文档