第2章 简单线性回归Final

合集下载

计量经济学第2章 简单线性回归模型

计量经济学第2章 简单线性回归模型

1.1回归分析与回归函数
对回归的现代解释与古典意义有很大的不同 定义:是关于研究一个叫做被解释变量(Y)的变量
对另一个或多个叫做解释变量(X)的变量的依赖 关系,其用意在于通过后者的已知或设定值去估计 或预测前者的均值。其中“依赖关系”,反映在一 定的函数形式上:
注意: E(Y X ) F(X1, X2,, Xk )
1.1回归分析与回归函数
1855年,高尔顿发表《遗传的身高 向平均数方向的回归》一文,他和 他的学生通过观察1078对夫妇,以 每对夫妇的平均身高作为自变量, 取他们的一个成年儿子的身高作为 因变量,分析儿子身高与父母身高 之间的关系。 发现: 当父母越高或越矮时,子女的身高 会比一般儿童高或矮,但是,当父 母身高走向极端,子女的身高不会 象父母身高那样极端化,其身高要 比父母们的身高更接近平均身高, 即有“回归”到平均数去的趋势。
其中,μ为随机误差项(stochastic error)或随机扰动 项(stochastic disturbance ),表明除X之外影响Y的因素: 忽略无数可能事件的影响 测量误差
1.1回归分析与回归函数
例:假定E(Y|Xi)对X是线性的:
E(Y Xi ) 1 2 Xi 线性总体回归函数
-1.2 -0.8 -0.4 0.0 0.4 0.8 Nhomakorabea1.2 Y
因而,要进一步研究变量之间的相关关系,就需要学习回归 分析方法。
1.1回归分析与回归函数
二、回归分析
“回归”这个词最早由英国生物学家高尔顿在遗传学
中提出。
法兰西斯·高尔顿(1822.2.16-1911.1.17), 英国人类学家、生物统计学家、英国探险家、 优生学家、心理学家、差异心理学之父,也 是心理测量学上生理计量法的创始人,遗传 决定论的代表人物。 高尔顿平生著书15种,撰写各种学术论文220 篇,涉猎范围包括地理、天文、气象、物理、 机械、人类学、民族学、社会学、统计学、 教育学、医学、生理学、心理学、遗传学、 优生学、指纹学、照像术、登山术、音乐、 美术、宗教等,是一位百科全书式的学者。

二简单线性回归模型

二简单线性回归模型

• 当不满足小样本性质时,需进一步考察估 计量的大样本或渐近性质: • (4)渐近无偏性,即样本容量趋于无穷大 时,是否它的均值序列趋于总体真值; • (5)一致性,即样本容量趋于无穷大时, 它是否依概率收敛于总体的真值; • (6)渐近有效性,即样本容量趋于无穷大 时,是否它在所有的一致估计量中具有最 小的渐近方差。
二. 普通最小二乘法(OLS)
• 给定一组样本观测值(Xi, Yi)(i=1,2,…n)要 求样本回归函数尽可能好地拟合这组值. • 普通最小二乘法(Ordinary least squares, OLS) 给出的判断标准是:二者之差的平方和
ˆ Q Yi - Y i
1
n

Y - ˆ
将样本回归线看成总体回归线的近似替代
总体:Yi = E(Y∣Xi)+ ui =β1+β2 Xi + ui 样本:
ˆ ˆ X ˆ Y i 1 2
ˆ Y i
为E(Y∣Xi)的估计量,也就是样本条件均值
ˆ 为β 的估计量 i i
样本回归函数的函数形式应与设定的总体回归函数的函数形式一致。
每 月 家 庭 人 均 消 费 支 出 Y
E(Y∣X i ) 2098 2414
每 月 家 庭 人 均 收 入 X 4000 4500 5000 5500 6000 6500 2269 2304 2646 2917 3068 3383 2364 2435 2819 3028 3488 3797 2424 2467 2934 3166 3689 4109 2473 2726 3028 3321 3755 4261 2523 2828 3131 3527 3899 4546 2581 2946 3244 3690 3920 4757 2675 2976 3408 3829 4253 4771 2716 3150 3496 3993 4441 4872 2817 3174 3522 4174 4673 2936 3349 3677 4350 4764 2954 3384 3776 4474 3025 3514 3919 3136 3658 4119 3327 3747 2730 3047 3363 3679 3995 4312

计量经济学-第2章-简单线性回归模型

计量经济学-第2章-简单线性回归模型
y=33.73+0.516 x
这一方程表明:父母平均身高每增减一个单位时,其成年 子女的身高仅平增减0.516个单位。
注意几个概念
● Y 的条件分布
当解释变量 X 取某固定值时(条件),Y 的值不 确定,Y 的不同取值形成一定的分布,即Y 的条
件分布。
Y
● Y 的条件期望
对于X 的每一个取值, 对Y 所形成的分布确
(一)回归分析的基本思想和方法及“回归”名称的由来 英国统计学家高尔顿(F.Galton,1822-1911)
和他的学生皮尔逊(K.Pearson,1856-1936)在 研究父母身高与其子女身高的遗传问题时,观察了 1078对夫妇,以每对夫妇的平均身高作为,而取他们 的一个成年儿子的身高作为,将结果在平面直角坐标 系上绘成散点图,发现趋势近乎一条直线,计算出的 回归直线方程为
性”
计量经济学中:
线性回归模型主要指就参数而言是“线性”,因为
只要对参数而言是线性的,都可以用类似的方法估计其
参数。
14
三、随机扰动u项
◆概念:
Y
各个 Yi 值与条件均值

E(Y Xi ) 的偏差 ui代表
u

排除在模型以外的所有
因素对 Y 的影响。
Xi
X
◆性质:ui 是期望为0有一定分布的随机变量 重要性:随机扰动项的性质决定着计量经济方
计量经济学关心:变量间的因果关系及隐藏在随 机性后面的统计规律性,这有赖于回归分析方法
6
4. 回归分析
回归的古典意义: 高尔顿遗传学的回归概念 ( 父母身高与子女身高的关系)
回归的现代意义: 一个应变量对若干解释变量 依存关系 的研究
回归的目的(实质): 由固定的解释变量归与回归分析的内容

第二章-简单线性回归模型-PPT精选文档

第二章-简单线性回归模型-PPT精选文档

经济变量之间的因果关系有两种
:确定性的因果关系与随机的因果关 系。前者可以表示为数学中的函数关 系,后者不能像函数关系那样比较精 确地描述其变化规律,但是可以通过 分析大量的统计数据,找寻出它们之 间的一定的数量变化规律,这种通过 大量统计数据归纳出的数量变化规律 称之为统计相关关系,进而称为回归 关系。研究回归关系的方法称为回归 分析方法,表示回归关系的数学式子 称为回归方程。
由于变量Y的非确定性是由于它受
一些随机因素的影响,因此可以 认为,当给定变量 X 的一个确定 值之时,所对应的变量 Y 是一个 随机变量,记作Y|X 。假定条件随 机变量 Y|X 的数学期望值是存在 的,即 E( Y|X ) 存在,由于同一随 机变量的数学期望值是惟一的, 故 E(Y|X ) 能够由 X 的值惟一地确 定,于是 E(Y|X )是变量X 的函数
二、总体回归模型
假设 X 为一个经济变量,Y 为另一个经 济变量,且变量 X 与 Y 之间存在着非确定 性的因果关系,即当 X 变化时会引起 Y 的 变化,但这种变化是随机的。例如,某种 饮料的销售量与气温的关系,销售量受气 温的影响而变化,但其变化又不能由气温 惟一确定;再比如,家庭的周消费额与周 收入之间的关系等等。
第二章 简单线性回归模型
本章主要讨论:
●回归分析与回归函数 ●简单线性回归模型参数的估计 ●拟合优度的度量 ●回归系数的区间估计和假设检验 ●回归模型预测
第一节 回归分析与回归函数
一、相关分析与回归分析 (一)经济变量之间的相互关系
相关关系 1、总体相关 变量之间具有本质上的联系 2、样本相关 变量的样本观察值之间相关
2400
X
非线性相关:
Y
80
70

第二章 简单线性回归模型

第二章  简单线性回归模型

第二章 简单线性回归第一节 概述一 两个变量之间的关系让我们在给定一个变量的条件下,研究另一个变量与给定变量的关系。

在给定变量条件下,变量Y 与给定变量X 的关系主要有两种关系:一种是变量Y 与变量X 由方程)(X f Y =所决定的确定性函数关系。

对于变量X 的定义域中的任一给定值,在变量Y 的值域中都有一个唯一确定的值与给定值相对应。

这种关系是我们在数学中早已研究过的函数关系,而且我们在宏观经济学和微观经济学中的研究的变量之间的关系在形式上往往以函数关系的形式出现。

另一种关系是在变量X 的值给定的条件下,变量Y 的值并不是完全确定的,而是以某个值为中心的一个完整的概率分布,而这个中心与给定变量X 的关系则是完全确定的。

我们称这种关系为随机性关系。

显然,这两种关系是全然不同的。

为了明确这两种关系的区别我们通过一个假想的例子来说明。

假设我们在课堂上进行一系列实验以决定某种玩具在不同价格的需求量。

用t p 表示该种玩具在时刻t 的价格,t q 表示该种玩具在时刻t 的需求量.首先,我们假设经过实验得到如下结果。

上述结果表示在价格为25的任何时刻,需求量都为1,在价格为20的任何时刻,需求量都为3,在价格为15的任何时刻,需求量都为5,等等。

这些结果所表明的需求量与价格之间的关系就是确定性关系。

这种关系可用下列线性方程表示:t t p q 4.011-= (2.1)其次,我们假设经过实验得到下列结果。

表2.1t p t q25 ⎪⎩⎪⎨⎧的时刻实验中有的时刻实验中有的时刻实验中有25% 2%05 125% 020 ⎪⎩⎪⎨⎧的时刻实验中有的时刻实验中有的时刻实验中有25% 4%05 325% 25 ⎪⎩⎪⎨⎧的时刻实验中有的时刻实验中有的时刻实验中有25% 10%05 925% 8上述结果表示在价格为25的时刻中,有25%的需求量为0,50%的需求量为1,25%的需求量为2;在价格为20的时刻中,有25%的需求量为2,50%的需求量为3,25%的需求量为4;……;在价格为5的时刻中,有25%的需求量为8,50%的需求量为9,25%的需求量为10。

2简单线性回归模型

2简单线性回归模型
简单线性回归模型第二章学习要点一简单线性回归模型的设定二简单线性回归模型的基本假定三简单线性回归模型参数的估计方法四参数估计量的统计性质五拟合优度的度量六回归系数的区间估计和假设检验七回归模型预测八eviews应用经济变量间的相互关系确定性的函数关系
第二章
简单线性回归模型
学习要点
一、简单线性回归模型的设定 二、简单线性回归模型的基本假定 三、简单线性回归模型参数的估计方法 四、参数估计量的统计性质 五、拟合优度的度量 六、回归系数的区间估计和假设检验 七、回归模型预测 八、EViews应用
Yi

ui
X
ui Yi E(Yi X i ) Yi 1 2 X i
3、样本回归函数(SRF)
样本回归线: 对于X 的一定值,取得 Y 的样本观测值,可计算其条件均 值,样本观测值条件均值的轨迹称为样本回归线。 样本回归函数: 如果把应变量 Y的样本条件均值表示为解释变量 X 的某种 函数,这个函数称为样本回归函数(SRF)。
i
X)
2
1
(4)
wi X i
x x
Xi
x
Xi X
x (X X ) x

2 i i 2 i
X i2 XX i
2

x
xi2
2 i
1

最小二乘估计量b的无偏估计量
(1)b1

i 1
n
n
xi
x
i 1
n
2 i
Yi
i 1
n
xi
2 x i i 1 n
2wn 1wn u n 1u n ) n 1 2 2 2 Var (b1 ) u wi u n 2 i 1 x i

Chapter 2 简单线性回归模型

Chapter 2 简单线性回归模型

2. 相关分析是对称(symmetric)对待 X 和 Y 不区分解释变量(自变量)和被解释变量(因变量) ,两个变量都是随机的 例:统计考试成绩和数学考试成绩相关系数
四、回归分析与因果关系 1. 回归分析研究一个变量对另一个变量统计上的依存关系,但是并不表明 两个变量之间有因果关系。
2. 因果关系的建立一定是来自于统计关系之外,最终应该来自于理论。 (所 以要有经济理论) 例:降水量与产量 统计上并没有否定以下回归关系的存在 降水量 = beta0 + beta1*产量 + error 但是直觉告诉我们产量并不能决定降水量,产量并不是降水量的原因。
Variance: var X ≡ E X
μ
E X
2
μ
Covariance: Cov X, Y ≡ E X
μ
Y
μ
E XY
E X E Y
3. 线性相关系数(correlation coefficient) 总体(population)相关系数 Corr X, Y Cov X, Y Var X Var Y
(2) 回归线: 对于每一个 X 的取值,都有 Y 的条件期望 E(Y|Xi)与之对应,代表这些 Y 的 条件期望的点的轨迹所形成的直线或曲线,称为回归线。

Y 的条件分布:当解释变量 X 取某固定值时(条件) ,Y 的值不确定,Y 的不同取值形成一定的分布,即 Y 的条件分布。

Y 的条件期望:对于 X 的每一个取值,对 Y 所形成的分布确定其期望或 均值,称为 Y 的条件期望或条件均值,E(Y|X)
3. 用 x 的变化解释 y 的变化要解决的三个问题 问题 1:因为两个变量之间的关系是非精确的关系(not exact relationship) , 如何让其它因素也影响 y? ε 代表影响 y 的其他因素

第二章-简单线性回归模型-计量经济学

第二章-简单线性回归模型-计量经济学
Y
● Y 的条件期望
对于X 的每一个取值, 对Y 所形成的分布确
定其期望或均值,称
为Y 的条件期望或条
件均值 E(Y Xi )
Xi
X
17
回归线与回归函数
●回归线:
对于每一个 X 的取值, Y 都有 Y 的条件期望
E(Y Xi ) 与之对应,
代表这些 Y 的条件期
望的点的轨迹所形成
的直线或曲线,称为
1874 1906 1068 2066 2185 2210 2289 2313 2398 2423 2453 2487 2586
2110 2225 2319 2321 2365 2398 2487 2513 2538 2567 2610 2710
2388 2426 2488 2587 2650 2789 2853 2934 3110
2436 2588 2672 2736 2801 2893 2902 3027 3155 3260
5300
2765 2853 2900 3021 3065 3146 3278 3305 3423
5800
3022 3156 3401 3669
26
析:
家庭消费支出主要取决于家庭可支配收入,但不是唯一取决于家 庭可支配收入,还会受到其他各种不确定性因素的影响,因而可支配 收入相同的不同家庭的消费支出各不相同。
总体回归曲线与总体回归函数
给定解释变量条件下被解释变量的期望轨迹称为总体回 归曲线(population regression curve),或总体回归线 (population regression line)。
描述总体回归曲线的函数称为总体回归函数 (population regression function)。

庞皓计量经济学第二章简单线性回归模型学习辅导

庞皓计量经济学第二章简单线性回归模型学习辅导

第二章 简单线性回归模型学习辅导一、本章的基本内容(一)基本内容图2.1 第二章的基本内容(二)本章的教学目标在计量经济模型中,只有两个变量且为线性的回归模型是最简单的,称为简单线性回归模型。

简单线性回归模型形式简单,估计和检验的结果表述较为容易,其原理可以直接用代数式和平面坐标图形去直观表述,更容易使初学者理解和接受。

而且先讨论简单线性回归模型,使其对计量经济学的理论和思想有较深刻的认识,然后可以很容易拓展到更一般的多元的情况。

所以,本章从简单线性回归模型入手,讨论计量经济学最基本的理论与方法,为以后各章对计量经济学理论与方法的拓展和深化打下基础。

本章的教学目标是:深刻理解计量经济分析的基本思想;明确估计计量经济模型的基本假定;掌握估计和检验计量经济模型的基本思想和方法;能够运用简单线性回归模型作经济结构分析和经济预测等方面的应用;并要求初步掌握EViews最基本的操作方法。

二、重点与难点分析1. 从条件期望的角度深刻认识回归函数的实质总体回归函数(PRF)是将总体被解释变量Y的条件期望表现为解释变量X的某种函数。

总体回归函数所体现的实际是经济现象或经济变量之间的客观规律性。

由于受种种偶然因素的影响, 经济变量之间的数量规律在经济现象的个别观测值中难以直接观测,只有从变量条件期望的角度才能揭示经济现象数量关系的规律性。

作为经济总体运行的客观规律,总体回归函数是客观存在的,但是在实际的经济研究中总体回归函数通常又是未知的,只能根据经济理论和研究者的实践经验去设定。

在计量经济学研究中,“计量”的根本目的是去揭示客观存在的经济数量规律,也就是要努力寻求总体回归函数。

我们所设定的计量经济模型实际就是在设定总体回归函数的具体形式。

样本回归函数(SRF)是将被解释变量Y的样本条件均值表示为解释变量X的某种函数。

样本回归线会随着抽样波动而变化,每次抽样都能获得一个样本,也就可以拟合出一条样本回归线,所以样本回归函数是不唯一的。

计量经济学(第二章简单线性回归)

计量经济学(第二章简单线性回归)
Y SRF1 SRF2
X
样本回归线不是总体回归线,只是未知 总体回归线的近似。
1.6.3 残差 ei
定义:ei = Yi −Y i ∧ Y 那么有: i = Yi + ei 对上例,有:

Yi = Yi + ei = β 1 + β 2 X i + ei



回归分析的思路
样本
一定方法得出 近似看成是
零均值:E (Yi / X i ) = f ( X i ) Var (Yi / X i ) = σ 2 同方差: Cov 无自相关: (Yi , Y j ) = 0, i ≠ j 正态性: Yi ~ N ( f ( X i ), σ 2 )
2.2 普通最小二乘法(OLS)
基本思想 数学过程 估计结果
相关系数取值区间[-1,1]。 相关系数具有对称性,即 ρ xy = ρ yx; X,Y都是随机变量,相关系数只说明其 线性相关程度,不说明其非线性关系, 也不反映他们之间的因果关系; 样本相关系数是总体相关系数的样本估 计量; 简单线性相关包含了其他变量的影响。
1.3 回归分析和相关分析
1.3.1 回归分析 古典意义:高尔顿遗传学的回归概念; 现代含义:一个应变量对若干解释变 量依存关系的研究; 回归分析的目的:由固定的解释变量 去估计和预测应变量的平均值;
三种距离
Y A( X i , Yi ) 横向距离 纵 向 距离 距 离

SRF A B
B( X i , Y i )
X
纵向距离 e i = Yi − Yi = Yi − β 过程
详见课本P24 举例:见Eviews练习1
2.2.3 OLS估计结果的离差形式

第二章简单线性回归模型

第二章简单线性回归模型

取偏导数并令其为0,可得正规方程
( ei2 ) ˆ1
2
(Yi ˆ1 ˆ2 Xi ) 0
( ei2 ) ˆ2
2
(Yi ˆ1 ˆ2 Xi ) Xi 0

或整理得
Yi nˆ1 ˆ2 Xi
XiYi ˆ1
Xi ˆ2
X
2 i
ei 0 ei Xi 0
用克莱姆法则求解得以观测值表现的OLS估计量:
(说明:正态性假定并不影响对参数的点估计,所以有时不列
入基本假定,但这对确定所估计参数的分布性质是需要的。且
根据中心极限定理,当样本容量趋于无穷大时,u
的分布会趋
i
近于正态分布。所以正态性假定有合理性)
5
在对 u i的基本假定下 Y 的分布性质
由于
Yi 1 2 X i ui
其中的 1, 2和 X i是非随机的, u i 是随机变量,因此
在给定X的条件下,u i的条件
方差为某个常数 2
Y
E(Y Xi )
Var(ui X i ) E[ui E(ui X i )]2 2
Xi X
3
假定3:无自相关假定:
随机扰动项 u i的逐次值互不相关
Cov(ui ,u j ) E[ui E(ui )][u j E(u j )]
E(uiu j ) 0
但与扰动项u是不相关的。(从变量X角度看是外生的) 注意: 解释变量非随机在自然科学的实验研究中相对 容易满足,经济领域中变量的观测是被动不可控的, X非随机的假定并不一定都满足。
2
2.对随机扰动项u的假定
假定1:零均值假定:
u 在给定X的条件下, i 的条件期望为零
E(ui Xi ) 0
假定2:同方差假定:

第二章 简单线性回归模型2PPT课件

第二章 简单线性回归模型2PPT课件

(TSS) (ESS) (RSS)
19
总变差 y(i2 TSS):应变量Y的观测值与其平均
值的离差平方和(总平方和)
解释了的变差
^
y
2 i
(ESS):应变量Y的估计值与
其平均值的离差平方和(回归平方和)
剩余平方和 ei2(RSS):应变量观测值与估计
值之差的平方和(未解释的平方和)
20
变差分解的图示
u 在给定 X
的条件下,
ui
i 的条件方差为某个常数
2
V ar(u i X i)E [u iE (u i X i)]22
6
假定3:无自相关假定
随机扰动项 u i 的逐次值互不相关
C o v ( u i,u j) E [ u i E ( u i) ] [ u j E ( u j) ] E (u iuj)0 (ij)
Y
Yi
• ei来自残差
^
(Yi-Y)总变差
SRF
^
(Yi-Y)来自 回归
Y
Xi
X
21
三、可决系数ห้องสมุดไป่ตู้
以TSS同除总变差等式两边:
TSSESSRSS 或 TSS TSS TSS
计量经济学
第二章 简单线性回归模型
标题添加
点击此处输入相 关文本内容
前言
点击此处输入 相关文本内容
标题添加
点击此处输入相 关文本内容
点击此处输入 相关文本内容
第二节 简单线性回归模型的最小二乘估计
本节基本内容:
● 简单线性回归的基本假定 ● 普通最小二乘法 ● OLS回归线的性质 ● 参数估计式的统计性质
假定3:无自相关假定 C ov(Y i,Yj)0 (ij)

第二章简单线性回归

第二章简单线性回归
第二章
简单线性回归模型
本章主要介绍: 回归分析和回归方程 简单线性回归模型的最小二乘估计 回归系数的区间估计和假设检验 拟合优度的度量 回归预测
何谓简单线性回归模型


只有两个变量的线性回归模型,称为简单 线性回归模型,也叫做双变量模型,或者 一元线性回归模型。 模型形式为:
Y 1 2 X u
1.3 回归分析和相关分析
1.3.1 回归分析 是对一个应变量对若干解释变量依存 关系的研究; 其目的是:由固定的解释变量去估计 和预测应变量的平均值等。
1.3.2 回归函数、回归线

应变量Y的条件期望E(Y/Xi )随着解释变量 X的变化而有规律地变化。把这种变化关 系用函数表示出来,就是回归函数:
1.4.2 总体回归函数的表现形式
1. 2.
条件均值形式,如 E(Y/Xi ) 1 2 Xi 随机设定形式。 对于一定的 X i ,Y的各个个别值 Yi 分布 在 E(Y/Xi ) 的周围,其差令为 u i ,则: Yi E(Y / X i ) ui 对上例,有 ui Yi ( 1 2 X i ) 也即:Yi 1 2 X i ui
问:能否从该样本估计总体回归函数PRF?
表 2.1.3 家庭消费支出与可支配收入的一个随机样本 Y X 800 594 1100 638 1400 1122 1700 1155 2000 1408 2300 1595 2600 1969 2900 2078 3200 2585 3500 2530
回答:能

概念:
在给定解释变量Xi条件下被解释变量Yi的期望 轨迹称为总体回归线(population regression line), 或更一般地称为总体回归曲线(population regression curve)。

计量经济学课件:第二章 简单线性回归模型

计量经济学课件:第二章 简单线性回归模型

第二章 简单线性回归模型第一节 回归分析与回归方程一、回归与相关 1、变量之间的关系(1)函数关系:()Y f X =,其中Y 为应变量,X 为自变量。

(2)相关关系或统计关系:当一个变量X 或若干个变量12,,,k X X X 变化时,Y 发生相应的变化(可能是不确定的),反之亦然。

在相关关系中,变量X 与变量Y 均为不确定的,并且它们之间的影响是双向的(双向因果关系)。

(3)单向因果关系:(,)Y f X u =,其中u 为随机变量。

在计量经济模型中,单一线性函数要求变量必须是单向因果关系。

在(单向)因果关系中,变量Y 是不确定的,变量X 是确定的(或可控制的)。

要注意的是,对因果关系的解释不是靠相关关系或统计关系来确定的,并且,相关关系与统计关系也给不出变量之间的具体数学形式,而是要通过其它相关理论来解释,如经济学理论。

例如,我们说消费支出依赖于实际收入是引用了消费理论的观点。

2、相关关系的类型 (1) 简单相关 (2) 复相关或多重相关 (3) 线性相关 (4) 非线性相关 (5) 正相关 (6) 负相关 (7) 不相关3、用图形法表示相关的类型上述相关类型可直观地用(EViews 软件)画图形来判断。

例如,美国个人可支配收入与个人消费支出之间的相关关系可由下列图形看出,它们为正相关关系。

15002000250030003500150020002500300035004000PDIP C E其中,PDI 为(美)个人可支配收入,PCE 为个人消费支出。

PDI 和PCE 分别对时间的折线图如下PROFIT 对STOCK 的散点图为05010015020025050100150STOCKP R O F I T其中,STOCK 为(美)公司股票利息,PROFIT 为公司税后利润,表现出明显的非线性特征。

以下是利润与股息分别对时间的序列图(或称趋势图)05010015020025020406080100120140GDP 对M2的散点图为02000040000600008000010000050000100000150000M2G D P其中M2为(中国)广义货币供应量,GDP 为国内生产总值。

第2讲 简单线性回归

第2讲 简单线性回归

ˆ ˆ ˆ ui yi b 0 b1xi
2 i 1 i 1
n
n


2
10
推导方法(一)

如果直接解上述方程我们得到下面两式:
ˆ y b
n i 1 n i
ˆ x 0 b 0 1 i

ˆ b ˆ x 0 x y b i i 0 1i
i 1
45
例:CEO的薪水和资本权益报酬率

对估计量的解释:

963.19:常数项的估计值衡量了当roe为零时CEO的薪 水。


18.5:b1 的估计值反应了ROE若增加一个百分点工资 将增加18500美元。 如果 roe=30, 估计的薪水应该是多少?
46
使用 Stata 进行OLS回归


我们已经推导出公式计算参数的OLS估计值,所幸的是 我们不必亲手去计算它们。
2
43
例:CEO的薪水和资本权益报酬率
obsno 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 salary 1095 1001 1122 578 1368 1145 1078 1094 1237 833 567 933 1339 937 2011 roe 14.1 10.9 23.5 5.9 13.8 20 16.4 16.3 10.5 26.3 25.9 26.8 14.8 22.3 56.3 salaryhat 1224 1165 1398 1072 1219 1333 1267 1265 1157 1450 1442 1459 1237 1375 2005 uhat -129 -164 -276 -494 149 -188 -189 -171 80 -617 -875 -526 102 -439 6
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

OLS回归线总是通过样本的均值。
ˆ ˆ y b 0 b1 x
39
OLS的代数性质

我们可把每一次观测看作由被解释部分和 未解释部分构成.
ˆ ˆ yi yi ui

预测值和残差在样本中是不相关的
ˆ ˆ cov( y i , u i ) 0
40
OLS的代数性质
ˆ ˆ ˆ ˆ ˆ ˆ cov( y i , u i ) E ( y i E ( y i ))( u i E ( u i )) ˆ ˆ E (( y i E ( y i )) u i ) ˆ ˆ ˆ E ( y i u i ) y E (u i ) ˆ ˆ ˆ E [( b 0 b 1 x i ) u i ] ˆ ˆ ˆ ˆ b 0 E (u i ) b 1 E ( xi u i ) 0
41
更多术语

定义总平方和为
SST
( yi y )
i 1
n
2
42
更多术语
总平方和SST是对y在样本中所有变动的度 量,即它度量了y在样本中的分散程度 将总平方和除以n-1,我们得到y的样本方差。

43
更多术语

解释平方和定义为
SSE

i 1
n
y)2 ( yi

它度量了y的预测值的在样本中的变动
n
Therefore, SST = SSE + SSR. 该证明中我们使用了一个事实, 即样本中因变量的拟合值 和残差不相关.
48
Goodness-of-Fit
拟合优度


我们如何衡量样本回归线是否很好地拟合了样本 数据呢? 可以计算模型解释的总平方和的比例,并把它定 义为回归的R-平方 R2 = SSE/SST = 1 – SSR/SST
34
例:CEO的薪水和资本权益报酬率


变量salary衡量了已1000美元为单位的年薪,其最小值, 均值和最大值分别为:(min, mean, max)=(223, 1281, 14822). Roe=净收入/所有者权益,为三年平均值。 N=209. 估计得到的关系为: (estimated salary)=963.191 + 18.501 roe.

8
简单二元回归模型例子

如:简单的工资方程 wage= b0 + b1(years of education) + u

上述简单工资函数描述了受教育年限和工资之间的关 系, b1 衡量了多接受一年教育工资可以增加多少。
9
关于u的假定

假定总体中误差项u的平均值为零 E(u) = 0 (2.5)
44
更多术语

残差平方和定义为
SSR=
ˆ2 ui

残差平方和度量了残差的样本变异
45
SST, SSR and SSE
y 的总变动可以表示为已解释的变动SSE和 未解释的变动SSR之和,即 SST=SSE+SSR

46
证明 SST = SSE + SSR
ˆ ˆ y y y y y y ˆ ˆ u y y ˆ ˆ ˆ ˆ u 2 u y y y y ˆ ˆ SSR 2 u y y SSE
普通最小二乘法的推导


目标是通过选择参数值,使得在样本中矩条件也可以成 立。 样本中矩条件可以表示为:
n n
1
y
n i 1 n
i
ˆ ˆ b 0 b 1 xi 0

1

i 1
ˆ ˆ xi y i b 0 b 1 xi 0


21
普通最小二乘法的推导
根据样本均值的定义以及加总的性质,可将第一个条件 写为
该假定是否具有很大的限制性呢?

10
关于u的假定

比如, E(u)=5. 那么 y = (b0 +5)+ b1x + (u-5), 所以, E(u*)=E(u-5)=0. 上述推导说明我们总可以通过调整常数项来实现 误差项的均值为零, 因此该假定的限制性不大。

11
条件期望零值假定
我们需要对u和 x之间的关系做一个关键假定。理 想状况是对x的了解并不增加对u的任何信息。换 句话说,我们需要u和x完全不相关: E(u|x) = E(u)

5
术语注解

在简单二元回归模型y = b0 + b1x + u中, y通常被称
为因变量,左边变量,被解释变量,或回归子。

x通常被称为自变量,右边变量,解释变量,回归元, 协变量,或控制变量。
6

等式y = b0 + b1x + u只有一个非常数回归元。我们称之为 简单回归模型, 两变量回归模型或双变量回归模型.
计量经济学
第二章 (1) 简单二元回归 y = b0 + b1x + u
1
本章大纲


简单回归模型的定义 普通最小二乘法的推导 OLS的操作技巧

测量单位和函数形式
OLS估计量的期望值和方差 过原点回归
2
本节主要内容
本章目的:以估计教育回报率为例 一些术语的注解 一个简单假定 条件期望零值假定 何为普通最小二乘法 普通最小二乘法的推导

14
条件期望零值假定

假设期末成绩分数取决于出勤次数和影响学生现 场发挥的因素,如学生个人素质。 score =b0 + b1attend +u
那么上述模型中假设(2.6)何时能够成立?

15
普通最小二乘法的推导


回归的基本思想是从样本去估计总体参数。
我们用{(xi,yi): i=1, …,n} 来表示一个随机样本,
12
条件期望零值假定
由于我们已经假定了E(u) = 0,因此有E(u|x) = E(u) = 0。该假定是何含义? E(u|x) = E(u) = 0. (2.6)
13
条件期望零值假定 在教育一例中,假定u 代表内在能力,条件期望 零值假定说明不管解释教育的年限如何,该能力 的平均值相同。 E(ability|edu=6)=E(ability|edu=18)=0.

b0 , b1被称为回归系数。 b0也被称为常数项或截矩项,或 截矩参数。 b1代表了回归元x的边际效果,也被成为斜率 参数。
u 为误差项或扰动项,它代表了除了x之外可以影响y的 因素。

7

线性的含义: y 和x 之间并不一定存在线性关系, 但是,只要通过转换可以使y的转换形式和x的转 换形式存在相对于参数的线性关系,该模型即称 为线性模型。 如, y=eb0+b1x+u 。
并假定每一观测值满足yi = b0 + b1xi + ui。
16
总体回归线,样本观察点和相应误差 y . E(y|x) = b0 + b1x y4 u4 { y3 y2
} u1
u2 {.
.} u3
y1
.
x1
x2
x3
x4
x
17
普通最小二乘法的推导
首先由E(u|x) = E(u) = 0 可知: Cov(x,u) = E(xu) = 0 为什么? 由于 Cov(x,u) = E(xu) – E(x)E(u) 而由E(u|x) = E(u) = 0 可得Cov(x,u) = E(xu) =0。

3
我们学习的目标是什么?

教育的回报率
假如已经收集到一个具有代表性的样本:村子 里面小学同学(100人) (Xi,Yi):(教育水平,工资的差别)(i=1, …,100) 问题:教育水平提高对工资的作用有多大?


简单演示如何操作
4
两个要点
我们需要对残差的性质做出什么样的假设 ? 基于数据样本,如何估计模型(参数)?
24
OLS斜率估计法总结 斜率估计量等于样本中x 和 y 的协方差除以x的方 差。 若x 和 y 正相关则斜率为正,反之为负。


25
关于OLS的更多信息 OLS法是要找到一条直线,使残差平方和最小。 残差是对误差项的估计,因此,它是拟合直线 (样本回归函数)和样本点之间的距离。

26
样本回归线,样本数据点和相关的误差估计项 y y4
û{ 4
.
ˆ ˆ ˆ y b 0 b1 x
y3 y2
û {. 2
.} û3
y1
}û . 1
x1 x2
x3
x4
x
27
推导方法二

正式解一个最小化问题,即通过选取参数而使下列值最 小:
ˆ u i
2 i 1
n

n i 1
ˆ b x ˆ yi b 0 1 i

2
28
推导方法二

如果直接解上述方程我们得到下面两式,这两个式子等 于前面两式乘以n
y
n i 1 n
i
ˆ ˆ b 0 b 1 xi 0


i 1
ˆ ˆ xi y i b 0 b 1 xi 0


29
本节小结


介绍简单线性回归模型 介绍通过随机样本的数据运用普通最小二乘法估 计斜率和截距的参数值
35
例:CEO的薪水和资本权益报酬率

对估计量的解释:

963.19:常数项的估计值衡量了当roe为零时CEO的薪 水。
相关文档
最新文档