第二章 回归分析基本方法_PPT幻灯片
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
称i为观察值Yi围绕它的期望值E(Y|Xi)的离差
(deviation),是一个不可观测的随机变量,又称 为随机干扰项(stochastic disturbance)或随机误 差项(stochastic error)。
(*)
(*)式称为一元总体回归函数(方程)PRF的随 机设定形式。表明被解释变量除了受解释变量的系统 性影响外,还受其他因素的随机性影响。
X1n
X21 X22
X2n
Xk1 Xk2
Xknn(k1)
0
1
Βιβλιοθήκη Baidu
β
2
k ( k 1 ) 1
1
μ
2
n
n1
样本回归函数:用来估计总体回归函数
记样本回归线的函数形式为:
Y ˆif(X i)ˆ0ˆ1 X i
称为一元样本回归函数(sample regression function, SRF)。
注意: 这里将样本回归线看成总体回归线的近似替代
则
样本回归函数的随机形式/样本回归模型:
同样地,样本回归函数也有如下的随机形式:
Y i Y ˆ i ˆi ˆ0 ˆ 1 X i e i
§2.1 回归分析概述
一、变量间的关系及回归分析的基本概念 二、一元总体回归函数 三、随机扰动项 四、一元样本回归函数(SRF)
§2.1 回归分析概述
一、变量间的关系及回归分析的基本概念
1、变量间的关系 经济变量之间的关系,大体可分为两类:
(1)确定性关系或函数关系:研究的是 确定现象非随机变量间的关系。
• 含义:
回归函数(PRF)说明被解释变量Y的平均状 态(总体条件期望)随解释变量X变化的规律。
• 函数形式:
可以是线性或非线性的。
E (Y |X i)01 X i
为一线性函数。其中,0,1是未知参数,称为
回归系数(regression coefficients)。 。
三、随机扰动项
记
i Y iE (Y|X i)
▼回归分析的主要目的:根据样本回归函数SRF,估计
总体回归函数PRF。
即,根据 估计
Y i Y ˆ i e i ˆ0 ˆ1 X i e i
Y i E ( Y |X i) i 0 1 X i i
注意:这里PRF可能永 远无法知道。
§2.2 线性回归模型
一、多元线性回归模型 二、多元线性回归模型的基本假定
模型中解释变量的数目为(k+1)
Y i 0 1 X 1 i 2 X 2 i k X k ii
也被称为总体回归函数的随机表达形式。它 的
非随机表达式为: E ( Y i | X 1 i , X 2 i , X k ) i 0 1 X 1 i 2 X 2 i k X ki
(2)统计依赖或相关关系:研究的是非确 定现象随机变量间的关系。
例如: 函数关系:
圆 面 f,半 积 径 半 2 径
统计依赖关系/统计相关关系:
农作 f气 ,物 降 温 ,阳 产 雨 ,施 光 量 量 肥
对变量间统计依赖关系的考察主要是通过相关分析(correlation analysis)或回归分析(regression analysis)来完成的:
• 概念:
在给定解释变量Xi条件下被解释变量Yi的期望 轨迹称为一元总体回归线(population regression line),或更一般地称为一元总体回归曲线 (population regression curve)。
相应的函数:
E (Y|X i)f(X i)
称为(双变量)一元总体回归函数(population regression function, PRF)。
由于方程中引入了随机项,成为计量经济学模型, 因此也称为一元总体回归模型。
随机误差项主要包括下列因素的影响:
1)在解释变量中被忽略的因素的影响; 2)变量观测值的观测误差的影响; 3)模型关系的设定误差的影响; 4)其它随机因素的影响。
产生并设计随机误差项的主要原因: 1)理论的含糊性; 2)数据的欠缺; 3)节省原则。
式 中 , e i称 为 ( 样 本 ) 残 差 ( 或 剩 余 ) 项 ( re sid u a l) , 代 表
了 其 他 影 响 Y i 的 随 机 因 素 的 集 合 , 可 看 成 是 i 的 估 计 量 ˆi 。
由于方程中引入了随机项,成为计量经济模型,因此 也称为一元样本回归模型(sample regression model)。
正 相 关 线 性 相 关 不 相 关 相 关 系 数 :
统 计 依 赖 关 系
负 相 关1XY1
正 相 关 非 线 性 相 关 不 相 关
负 相 关
有 因 果 关 系 回 归 分 析 无 因 果 关 系 相 关 分 析
二、一元总体回归函数
回归分析关心的是根据解释变量的已知或 给定值,考察被解释变量的总体均值,即当解 释变量取某个确定值时,与之统计相关的被解 释变量所有可能出现的对应值的平均值。
方程表示:各变量X值固定时Y的平均响应。
j也被称为偏回归系数,表示在其他解释变
量保持不变的情况下,Xj每变化1个单位时,Y 的均值E(Y)的变化;
或者说j给出了Xj的单位变化对Y均值的“直
接”或“净”(不含其他变量)影响。
总体回归模型n个随机方程的矩阵表达式为
Y X β μ
其中
1
X1 1
X11 X12
四、一元样本回归函数(SRF)
总体的信息往往无法掌握,现实的情况只能是在 一次观测中得到总体的一个样本。
问题:能从一次抽样中获得总体的近似的信息吗? 如果可以,如何从抽样中获得总体的近似信息?
该样本的散点图(scatter diagram):
样本散点图近似于一条直线,画一条直线以尽好地拟合该 散点图,由于样本取自总体,可以该线近似地代表总体回归线。 该线称为一元样本回归线(sample regression lines)。
一、多元线性回归模型
多元线性回归模型:表现在线性回归模型中的 解释变量有多个。
一般表现形式:
Y i 0 1 X 1 i 2 X 2 i k X k ii i=1,2…,n
其中:k为解释变量的数目,j称为回归参数
(regression coefficient)。
习惯上:把常数项看成为一虚变量的系数,该 虚变量的样本观测值始终取1。这样: