第2章 简单回归模型

合集下载

第二章 经典线性回归模型

第二章 经典线性回归模型

它表明,对于n个时期t =1,ຫໍສະໝຸດ Baidu,…,n,该模型成立。
6
更一般的形式为:
Yi xi ui
i 1,2,...,n
(2.4)
即模型对X和Y的n对观测值(i=1,2,…,n)成立。 (2.3)式一般用于观测值为时间序列的情形,在横 截面数据的情形,通常采用(2.4) 式。
7
二、 多元线性回归模型 在许多实际问题中,我们所研究的因变量的变动 可能不仅与一个解释变量有关。因此,有必要考虑 线性模型的更一般形式,即多元线性回归模型:
第二部分,et 代表观测点对于回归线的误差,称 为拟合或预测的残差 (residuals):
ˆ et Yt Yt

t=1,2,……,n t=1,2,……,n
ˆ ˆ et Yt X t
26
如何决定估计值 和 ? 残差平方和
我们的目标是使拟合出来的直线在某种 意义上是最佳的,直观地看,也就是要求估 计直线尽可能地靠近各观测点,这意味着应 使各残差尽可能地小。要做到这一点,就必 须用某种方法将每个点相应的残差加在一起, 使其达到最小。理想的测度是残差平方和, 2 即 ˆ et (Yt Yt ) 2
4
这里斜率β的含义是解释变量增加一个单位所引起 的因变量的变动。例如在(2.2)式中,β的含义是个人可 支配收入增加一个单位所引起的消费的增加量,经济 学中称之为边际消费倾向(MPC)。截距α的含义是 解释变量为0时α的值。截距α有时有经济含义,但大 多数情况下没有,因此,在计量经济分析中,通常不 大关注α的取值如何。

第2讲 简单线性回归

第2讲 简单线性回归


Cov(x,u) = E(xu) – E(x)E(u)
而由E(u|x) = E(u) = 0 可得Cov(x,u) = E(xu) =0。
16
普通最小二乘法的推导


可将u = y – b0 – b1x代入以得上述两个矩条件。 这样我们可以得到两个矩条件约束: E(y – b0 – b1x) = 0 E[x(y – b0 – b1x)] = 0
n
i
0
32
OLS的代数性质

OLS回归线总是通过样本的均值。
ˆ b ˆx yb 0 1
33
OLS的代数性质
我们可把每一次观测看作由被解释部分和 未解释部分构成. ˆi u ˆi yi y 预测值和残差在样本中是不相关的

ˆi , u ˆi ) 0 cov(y
34
OLS的代数性质
计量经济学
(1) 简单二元回归 y = b0 + b1x + u
1
本章大纲


简单回归模型的定义 普通最小二乘法的推导 OLS的操作技巧

测量单位和函数形式
OLS估计量的期望值和方差 过原点回归
2
讲义大纲
一些术语的注解 一个简单假定 条件期望零值假定 何为普通最小二乘法 普通最小二乘法的推导
44

第二章 简单回归模型

第二章 简单回归模型

第二章简单回归模型

2.1 简单回归模型的定义

选择题

(1)在简单线性回归模型y=β0+β1x+u中,y通常被称为()。

A、被解释变量

B、因变量

C、响应变量

D、回归子

答案:ABCD

难易程度:较难

(2)若变量x的一个变化可以导致变量y的一个变化,我们称变量x为()。

A、因变量

B、被解释变量

C、解释变量

D、响应变量

答案:C

难易程度:容易

(3)在方程y=β0+β1x+u中,β0是()。

A、因变量

B、自变量

C、斜率参数

D、截距参数

答案:D

难易程度:容易

判断题

(1)在简单线性回归模型y=β0+β1x+u中,u表示的是除了x之外,其他因素对y的影响。

答案:对

难易程度:容易

2.2 斜率参数的含义

选择题

(1)在简单线性回归模型y=β0+β1x+u中,当误差项u保持不变,即∆u=0时,y的变化量∆y()。

A、等于β1x

B、不等于β1x

C、等于β1∆x

D、不等于β1∆x

答案:C

难易程度:容易

2.3 零条件均值假定

填空题

(1) 均值独立假定与误差项平均值为零假定相结合时,能得到假定。

答案:零条件均值

难易程度:容易

选择题

(1) 在简单线性回归模型y=β0+β1x+u中,均值独立假定的含义是()。

A、E(u|x)=0

B、E(u)=0

C、E(u|x)≠E(u)

D、E(u|x)=E(u)

答案:D

难易程度:较难

判断题

(1) 在简单线性回归模型y=β0+β1x+u中,我们总可以通过调整β1,使得 E(u)=0成立。

答案:错

难易程度:较难

2.4 总体回归函数

选择题

(1)简单线性回归模型y=β0+β1x+u的总体回归函数为()

学习笔记:伍德里奇《计量经济学》第五版-第二章 简单回归模型

学习笔记:伍德里奇《计量经济学》第五版-第二章 简单回归模型

~除了x 以外影响y 的因素?

~y 和x 的函数关系?

~何以确定在其他条件不变的情况下刻画了y 和x 的关系

由以上得简单线性模型(simple linear regression model ):y = b0+ b1x + u (2.1)

y :因变量

x :自变量

u :误差项(干扰项),即“观测不到的”因素

(该模型没有限制x 和u 的关系,因此不能说明x 对y 的影响

2.4节是如何解决x 的初始值不同时,同样变化量对y 的影响的?E(u) = 0 (2.5)

(代价:方程中要包含截距b0 因为这样可以通过微调截距项来使第一个假定一定成立

对u 做的第一个假定:

E(u|x) = E(u)(2.6)

(前提:u 和x 是随机变量

均值独立假定(任何给定x 下u 的平均值都一样):E(u|x)= 0 (2.7)

结合均值独立与均值为0,得零条件期望假定:E(y|x) = b0 + b1x (2.8)

(E(y|x)称为总体回归函数(population regression function ,PRF ),说明了y 的均值是如何随着x 的变动而变动的

结合方程(2.1)和假定(2.7)得条件均值函数:

一、y 和x

关系的起点

随机变量:具有数值特征并由一个实验决定其结果的变量

•(是为了解决协方差受度量单位影响的问题,是协方差的改进)(u 和x 不相关,u 也能和x ²相关,对于大部分回归不行)相关系数(仅衡量线性相关程度):

•yi = b0 + b1xi + ui (2.9)

抽取一个容量为n 的随机样本E(u)=0 (2.10)

[经济学]第二章 简单线性回归模型

[经济学]第二章 简单线性回归模型

1/6 1/6 1/6 1/6 1/6 1/6 -
1/6 1/6 1/6 1/6 1/6 1/6 -
1/5 1/5 1/5 1/5 1/5 -
1/7 1/7 1/7 1/7 1/7 1/7 1/7
1/6 1/6 1/6 1/6 1/6 1/6 -
1/7 1/7 1/7 1/7 1/7 1/7 1/7
第二章 简单线性回归模型
第一节 回归分析与回归函数
一、相关分析与回归分析 (一)经济变量间的相互关系 经济变量之间的关系,大体可分为两类:


确定性关系或函数关系 统计依赖关系或相关关系
经济变量之间的相关关系可用散点图描述。
例2.1 假如有一个乡村由20户人家构成的总体,我们研 究每月家庭的平均消费支出 Y 与平均可支配收入 X 之 间的关系,统计数据如下:
互关系的具体形式,从而不能从一个变量的
变化去推测另一个变量的变化,要做到这一 点,还需要进行回归分析。
回归( Regression) “回归”一词最先由 F.高尔顿(F. Galton)在 《家庭身材相似性》一文中提出。 高尔顿发现: 虽然有一个趋势,父母高,儿女也高;父母矮, 儿女也矮。但给定父母的身高,儿女辈的身高 却趋向或者回归到全体人口的平均身高。 高尔顿称之为“回归到中等”。
“回归” 的现代释义
通过一个或多个解释变量在重

第二章 简单线性回归模型

第二章  简单线性回归模型
14
总体回归函数中引进随机扰动项的主要原因:
9
3、 回归分析与相关分析的联系和区别
联系:都是研究相关关系的方法。
区别: 相关分析: * 主要是为刻画变量间的相关程度;
* 不考虑变量之间的因果关系,不区分解释变量和因变量,两变量对称.
* 所涉及的变量都为随机变量。 回归分析: * 则要通过建立回归方程,去估计(预测)因变量的平均值; * 需要区分变量之间的因果关系; * 因变量是随机变量(有一定的概率分布),自变量是非随机变量。
其它百 货公司 的广告 费 X2 2000
— … — 2500
这些数据是否能揭示出 Whitney公司所做的报纸广告带来的真 实收益?
5
广告费与销售额的散点图
2600000
2400000
2200000 Y 2000000 1800000
1600000
0 10000 20000 X1 30000 40000 50000
r
4、相关系数虽能度量变量的线性相关程度,但不能确定变量之间的因果关 系,也不能说明它具体接近哪一条直线。
4
例 以下资料是Whitney公司连续26周销售额和广告成本以及该 城市各主要百货公司的销售总额(含Whitney公司的)和估计的竞 争对手的广告费(美元)
Whitney公司
周次 1 2 … 25 26 销售额 Y 2170787 1994291 … 1680685 2266506 广告费 X1 11900 14900 … 10900 9800 百货公司 销售总额 3710113 3369873 … 2819941 3897689

(完整版)第二章(简单线性回归模型)2-5答案

(完整版)第二章(简单线性回归模型)2-5答案

2.5 回归模型预测

一、判断题

1.f

Y ˆ是对个别值f Y 的点估计。(F ) 2.预测区间的宽窄只与样本容量n 有关。(F )

3.f

Y ˆ对个别值f Y 的预测只受随机扰动项的影响。(F ) 4.一般情况下,平均值的预测区间比个别值的预测区间宽。(F )

5.用回归模型进行预测时,预测普通情况和极端情况的精度是一样的。(F )

二、单项选择题

1.某一特定的X 水平上,总体Y 分布的离散度越大,即2σ越大,则( A )。

A .预测区间越宽,精度越低

B .预测区间越宽,预测误差越小

C 预测区间越窄,精度越高

D .预测区间越窄,预测误差越大

2.在缩小参数估计量的置信区间时,我们通常不采用下面的那一项措施(D )。

A.增大样本容量n

B. 预测普通情形而非极端情形

C.提高模型的拟合优度

D.提高样本观测值的分散度

三、多项选择题

1.计量经济预测的条件是(ABC )

A .模型设定的关系式不变

B .所估计的参数不变

C.解释变量在预测期的取值已作出预测 D .没有对解释变量在预测期的取值进行过预测 E .无条件

2.对被解释变量的预测可以分为(ABC )

A.被解释变量平均值的点预测

B.被解释变量平均值的区间预测

C.被解释变量的个别值预测

D.解释变量预测期取值的预测

四、简答题

1.为什么要对被解释变量的平均值以及个别值进行区间预测?

答:由于抽样波动的存在,用样本估计出的被解释变量的平均值f

Y ˆ与总体真实平均值()f f X Y E 之间存在误差,并不总是相等。而用f

Y ˆ对个别值f Y 进行预测时,除了上述提到的误差,还受随机扰动项的影响,使得总体真实平均值()f f X Y E 并不等于个别值f Y 。 一般而言,个别值的预测区间比平均值的预测区间更宽。

第二讲 简单回归模型

第二讲 简单回归模型

n
计量经济学导论
30
OLS估计的斜率参数
ˆ 1
xi x yi y
i 1
n
x 和 y之间的样本协方差
X f 22001时
1 287393020.1 8726.168 2.048 216.8978 30 784713231.9 8726.17 280.79
即是说:当2008年 X f =22001元时,居民人均消费水平平均值 置信度95%的预测区间为(8445.38,9006.96)元。
dependentvariable因变量lefthandsidevariableexplainedvariable被解释变量regressand回归子17计量经济学导论刘愿我们一般称x为independentvariable自变量righthandsidevariableexplanatoryvariable解释变量controlvariables控制变量18计量经济学导论刘愿简单回归的术语因变量自变量被解释变量解释变量响应变量控制变量被预测变量预测变量回归子回归元19计量经济学导论刘愿simpleassumption一个简单的假设变量u称为errorterm误差项或者disturbance扰动项代表除了x之外影响y的其它因素
即是说:当2008年 X f =22001元时,居民人均 消费水平个别值置信度95%的预测区间为(8200.66, 9251.68)元。

第2章 简单回归模型习题

第2章 简单回归模型习题
值,都有 E ˆ0 =0, E ˆ1 1
换言之,ˆ0 对 0 而言是无偏的,ˆ1 对1而言
是无偏的
引理: n 1 (xi x) 0
i 1
n
n
n
n
2 (xi x)( yi y) (xi x)yi ( xi nx) y (xi x)yi
i 1
i 1
i 1
i 1
n1 yi ˆ0 ˆ1xi 0
i 1
推导出
OLS的操作技巧——OLS统计量的代数性质
n
yˆiuˆi 0
i 1
OLS的操作技巧——拟合优度
•定义
–总平方和SST

yi y 2
–解释平方和SSE

yˆi y 2
–残差平方和SSR

uˆi2
OLS的操作技巧——拟合优度
普通最小二乘法的推导——样本回归线和样 本回归函数
• yˆ ˆ0 ˆ 1x中的符号读作cap
•它是总体回归函数 E y | x 0 1x 的一个样本
估计。总体回归函数是固定而又未知的,切记 这一点非常重要 •针对截距是0的情况,将在第六节中介绍
OLS的操作技巧
(x, y)
OLS的操作技巧——拟合值和残差
给定一个样本,选择估计值 ˆ0 和 ˆ1,使得
n
n1 yi ˆ0 ˆ1xi 0
i 1

第二讲简单回归模型

第二讲简单回归模型

人均GDP(元)X
381
419
463
492
528
583
695
858
963
1112
1366
1519
1644
1893
2311
4
年份
全体居民消费水平(元)Y
1993
1393
1994
1833
1995
2355
1996
2789
1997
3002
1998
3159
1999
3346
2000
3632
2001
3869
2002
8726.17m 525.51
即是说:当2008年 X f =22001元时,居民人均
消费水平个别值置信度95%的预测区间为(8200.66, 9251.68)元。
13 13
本章STATA命令语句
1.散点图:scatter y x 2.相关系数:corr y x
pwcorr y x,sig 3.回归:reg y x 4.预测:predict yy,xb(拟合值预测)
从散点图可以看出居民消费水平 (Y)和人均GDP (X)大体呈现为 线性关系。为分析中国居民消费 水平随人均GDP变动的数量规律性,可以建立如下 简单线性回归模型:
Yt 12Xt ut
6

第二章(简单线性回归模型)2-2答案

第二章(简单线性回归模型)2-2答案

2.2 简单线性回归模型参数的估计

一、判断题

1.使用普通最小二乘法估计模型时,所选择的回归线使得所有观察值的残差和达到最小。(F)

2.随机扰动项和残差项是一回事。(F )

3.在任何情况下OLS 估计量都是待估参数的最优线性无偏估计。(F )

4.满足基本假设条件下,随机误差项i μ服从正态分布,但被解释变量Y 不一定服从正态分 布。 ( F )

5.如果观测值i X 近似相等,也不会影响回归系数的估计量。 ( F )

二、单项选择题

1.设样本回归模型为i 01i i ˆˆY =X +e ββ+,则普通最小二乘法确定的i

ˆβ的公式中,错误的是( D )。

A .

()()

()

i i 1

2

i X X Y -Y ˆX X β--∑∑= B .()

i i i i 12

2i i n X Y -X Y ˆ

n X -X β∑∑∑∑∑=

C .i i 122i X Y -nXY ˆX -nX β∑∑=

D .i i i i 12x

n X Y -X Y ˆβσ∑∑∑= 2.以Y 表示实际观测值,ˆY 表示回归估计值,则普通最小二乘法估计参数的准则是使( D )。

A .i i ˆY Y 0∑(-)=

B .2

i i ˆY Y 0∑

(-)=

C .i i ˆY Y ∑(-)=最小

D .2

i i ˆY Y ∑

(-)=最小 3.设Y 表示实际观测值,ˆY 表示OLS 估计回归值,则下列哪项成立( D )。

A .ˆY

Y = B .ˆY Y = C .ˆY Y = D .ˆY Y = 4.用OLS 估计经典线性模型i 01i i Y X u ββ+=+,则样本回归直线通过点( D )。

第二章 简单线性回归模型

第二章 简单线性回归模型

µi
E (µ i X i )
0
0
0
0
0
0
0
0
0
随机误差项主要包括下列因素的影响: 随机误差项主要包括下列因素的影响:
1)在解释变量中被忽略的因素的影响; 2)变量观测值的观测误差的影响; 3)模型关系的设定误差的影响; 4)其它随机因素的影响。
产生并设计随机误差项的主要原因
• 1)理论的含糊性; • 2)数据的欠缺; • 3)节省原则
350 300 250 200 150 100 50 0 50 52 54 56 58 60 62 系列1 系列2 系列3 系列4 系列5 系列6 系列7 系列8 系列9
在计量经济学中线性模型的“线性” 在计量经济学中线性模型的“线性”有两种解释 次课) (1次课) 次课
(1)模型就变量而言是线性的; (2)模型就参数而言是线性的;
称µi为观察值Yi围绕它的期望值E(Y|Xi)的离差(deviation), 离差( ) 离差 是一个不可观测的随机扰动项, 则有总体回归函数的随机设定形式:
Yi = β 1 + β 2 X i + µ i
仍然取例1的数据说明
X
Y 的条件均值
60 55
90 75
120 95
150 115
180 135
每月家庭可支配收入(X) 60 51 54 57 每 月 家 庭 消 费 支 出 (Y) 58 90 58 68 74 77 85 88 120 79 83 84 89 92 95 98 102 105 108 110 150 93 100 104 105 110 113 114 118 121 124 128 130 135 180 114 119 124 125 128 131 132 136 142 142 144 146 153 154 210 128 132 141 145 150 152 153 156 159 161 164 170 177 182 240 150 158 159 164 168 171 175 179 183 185 191 192 200 270 179 181 186 188 191 199 203 204 209 210 300 190 194 198 206 214 226 232 235 240 330 209 211 230 239 260 261

第二章 经典线性回归模型

第二章 经典线性回归模型

S ˆ ˆ 2(1)(Yt X t ) 0 ˆ S ˆ ˆ 2( X t )(Yt X t ) 0 ˆ
22
这个例子生动地说明了生物学中“种”的概念 的稳定性。正是为了描述这种有趣的现象, Galton引进了“回归”这个名词来描述父辈身高x 与子代身高y的关系。 尽管“回归”这个名称的由来具有特定的含义 ,人们在研究大量的问题中变量x与y之间的关系 并不具有这种“回归”的含义,但借用这个名词 把研究变量x与y之间统计关系的数学方法称为“ 回归”分析。
模型的良好性质只有在大样本下才能 得到理论上的证明
19
二、最小二乘估计
(一)关于最小二乘法的历史回顾 最小二乘法最早称为回归分析法。由著名的英国 生物学家、统计学家道尔顿(F.Gallton,1822-1911) 。早年,道尔顿致力于化学和遗传学领域的研究。道 尔顿研究英国男子中父亲们的身高与儿子们的身高之 间的关系时,创立了回归分析法。
20
ห้องสมุดไป่ตู้
1. F.Gallton关于父辈身高与子辈身高之间关系的研 究 1889年F.Gallton和他的学生、现代统计学的奠基者 之一K.Pearson(1856-1911)收集了1078个家庭的身
高、臂长和腿长的记录。企图寻找出儿子身高与父亲身高 之间关系的具体表现形式。在观看散点图时,发现近乎于 一条直线。计算出的回归直线方程为:

计量经济学 第二章 简单线性回归模型案例分析 PPT

计量经济学 第二章 简单线性回归模型案例分析 PPT
即是说:当地区城镇居民人均总收入达到25000元时,城镇居 民每百户计算机拥有量 平均值置信度95%的预测区间为 (80.6219,86.9473)台。
12
个别值区间预测:
XFLeabharlann Baidu25000时:
Yf
Yˆf
mt2ˆ
11(Xf n
X)2 xi2
8 3 .7 8 4 6 m 2 .0 4 5 8 .0 2 7 9 5 7 1 1 5 4 4 3 0 2 8 .9 8 1 8 3 .7 8 4 6 m 1 6 .7 1 9 0 3 11 1 2 1 0 5 0 2 3 3
2011年中国各地区城镇居民每百户计算机拥有量和人均 总收入
模型设定:
为了初步分析城镇居民家庭平均每百户计算机拥有量 (Y)与城镇居民平均每人全年家庭总收入(X)的关系, 作以X为横坐标,以Y为纵坐标的散点图。 从散点图可以看出城镇居民家庭 平均每百户计算机拥有量(Y)与 城镇居民平均每人全年家庭总收 入(X) 大体呈现线性关系。 可以建立如下简单线性回归模型:
5、简单线性回归的基本假定:对模型和变量的假定、对 随机扰动项u的假定(零均值假定、同方差假定、无自 相关假定、随机扰动与解释变量不相关假定、正态性 假定)
6、普通最小二乘法(OLS)估计参数的基本思想及估计 量;OLS 估计量的分布性质及期望、方差和标准误差; OLS估计式是最佳线性无偏估计量。

第二章简单线性回归模型

第二章简单线性回归模型

(说明:正态性假定并不影响对参数的点估计,所以有时不列
入基本假定,但这对确定所估计参数的分布性质是需要的。且
根据中心极限定理,当样本容量趋于无穷大时,u
的分布会趋
i
近于正态分布。所以正态性假定有合理性)
5
在对 u i的基本假定下 Y 的分布性质
由于
Yi 1 2 X i ui
其中的 1, 2和 X i是非随机的, u i 是随机变量,因此
在给定X的条件下,u i的条件
方差为某个常数 2
Y
E(Y Xi )
Var(ui X i ) E[ui E(ui X i )]2 2
Xi X
3
假定3:无自相关假定:
随机扰动项 u i的逐次值互不相关
Cov(ui ,u j ) E[ui E(ui )][u j E(u j )]
E(uiu j ) 0
(i j)
假定4:解释变量
X
是非随机的,或者虽然
i
X i 是随
机的但与扰动项 u i不相关 (从随机扰动 u i角度看)
Cov(ui , Xi ) E[ui E(ui )][ Xi E( Xi )] 0
4百度文库
假定5:对随机扰动项分布的正态性假定,
即假定u i服从均值为零、方差为 2的正态分布 ui ~ N (o, 2 )
但与扰动项u是不相关的。(从变量X角度看是外生的) 注意: 解释变量非随机在自然科学的实验研究中相对 容易满足,经济领域中变量的观测是被动不可控的, X非随机的假定并不一定都满足。

第二章 简单线性回归模型

第二章  简单线性回归模型
数据的要求: 真实性、完整性、可比性
15
计量经济模型的建立
经济模型是对实际经济现象或过程的一种数学模 拟,是对复杂经济现象的简化与抽象 特点:只能在一定假定前提下
忽略次要因素,突出主要因素
16
可利用来建立计量经济模型的关系:
行为关系(如生产、投资、消费) 生产技术关系 (如投入产出关系) 制度关系(如税率) 定义关系
经济研究中的回归分析概述
• 回归分析(regression analysis)是确定两种或两 种以上变量间相互依赖的定量关系的一种统计分 析方法,目的在于了解两个或多个变量间是否相 关、相关方向与强度,并建立数学模型以便观察 特定变数来预测研究者感兴趣的变量。
2
经济研究中的回归分析
理论 数量化 经济 模型
显然,对旅游起决定性影响作用的是“中国居民的收 入水平”以及“入境旅游人数”等因素。 “旅游业总收入”(Y)与“居民平均收入”(X1)或 者“入境旅游人数”(X2)有怎样的数量关系呢? 能否用某种线性或非线性关系式 Y= f ( X ) 去表现这 种数量关系呢? 具体该怎样去表现和计量呢?
为了不使问题复杂化, 我们先在某些标准的(古典的) 假定条件下,用最简单的模型,对最简单的变量间数 量关系加以讨论
计量经济模型的数学形式:
线性模型:如 Yi 1 2 X 2i 3 X3i ui
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ui 为误差,u ˆi 为残差。
江西财经大学(彭树宏)
27
江西财经大学(彭树宏)
28
五、OLS估计量的期望值和方差
• 2的无偏估计量为:
ˆ2
n 2
1
ˆi2 SSR /n 2 u
ˆ ˆ 2 ,被称为回归标准误。 • ˆ 2 代入方差公式(2.57)和(2.58),我 • 将 ˆ ) 的无偏估计量,进 ˆ ) 和 Var ( 们就能得到 Var ( 1 0 ˆ 的标准差的无偏估计量。 ˆ 和 而得到 0 1
ˆ 和 ˆ 最小化残差平方和 选择 1 0
ˆ ˆ y u
2 i i i 1 i 1 n n 0
i 1
计算(2.17)和(2.19)仅需的假定是样本中的xi 不完全相等( (2.19) 的分母不为零)。 (2.19)式的分子、分母同除以n-1即为x和y的样 本协方差和x的样本方差。 11 江西财经大学(彭树宏)
• 方法:从总体中抽取一个样本来对总体参数进行 估计
抽取 总体 估计
江西财经大学(彭树宏) 5 江西财经大学(彭树宏) 6
样本
1
二、普通最小二乘法的推导
• 令{(xi,yi): i=1, …,n}表示从总体中抽取的一 个容量为n的随机样本,对每个i都有:
yi = 0 + 1xi + ui (2.9) ui包括除xi之外所有影响yi的因素,它是第i 次观测的误差项。
.} û3
E ( y | x) 0 1 x
• 总体回归函数是固定而又未知的,给定一个样本 就能通过OLS得到一个样本回归函数。 • 例2.3、2.4、2.5
江西财经大学(彭树宏) 13
y1
.} û1
x1
江西财经大学(彭树宏)
x2
x3
x4
x
14
三、OLS的操作技巧
OLS统计量的代数性质
ˆx 1 i

2
由最优化一阶条件可得到式(2.17)和(2.19)给出的 普通最小二乘估计量。
江西财经大学(彭树宏) 12
2
二、普通最小二乘法的推导
• 样本回归函数 y4
三、OLS的操作技巧
拟合值和残差
û4 {
.
ˆ ˆx ˆ y 0 1
ˆ ˆ x ˆ y 0 1
• 总体回归函数 y3 y2 û2 {.
江西财经大学(彭树宏) 3
结合(2.5)和(2.6),得到
E(u|x)=0
(零条件均值假定)
总体回归函数
E(y|x)= 0 + 1x
江西财经大学(彭树宏)
(2.8)
4
一、简单回归模型的定义
二、普通最小二乘法的推导
• 问题:如何估计总体回归方程
y = 0 + 1x + u (2.1)
中的参数0和1?
17 江西财经大学(彭树宏) 18
• 定义判定系数为: • 数据点都落在同一直线上时,R2=1,OLS提供 了数据的一个完美拟合。一个接近零的R2值表明 OLS给出了一个糟糕的拟合。 ˆ i 的样本相关系数的平方。 • R2等于 yi和 y
江西财经大学(彭树宏)
3
四、度量单位和函数形式
在简单回归中加入非线性因素 • 线性模型(例2.3) • 半弹性模型(例2.10) • 弹性模型(例2.11)
五、OLS估计量的期望值和方差
OLS估计量的方差
• 在假定SLR.1~SLR.4下,OLS估计量的方差可以计算 出来。增加假定SLR.5,是因为它简化了估计量方差 的计算,而且它还意味着,普通最小二乘法具有某种 有效性。 • 2 被称为误差方差。
江西财经大学(彭树宏) 23 江西财经大学(彭树宏) 24
二、普通最小二乘法的推导
• 例子:15个家庭的年收入和年储蓄数据
江西财经大学(彭树宏) 7 江西财经大学(彭树宏) 8
二、普通最小二乘法的推导
零条件均值假定意味着,在总体中,u与x 不相关,即x和u之间的协方差为零。我们 有:
E(u)=0 (2.10) Cov(x,u)=E(xu)-E(x) •E(u)=0 (2.11)
江西财经大学(彭树宏) 2
一、简单回归模型的定义
y = 0 + 1x + u y:因变量;x:自变量
一、简单回归模型的定义
假定
E(u)=0 E(u|x)=E(u) (2.5) (2.6)
(2.1)
0:截距参数;1 :斜率参数
u:误差项 u表示除x之外其他影响y的因素,可以把u看作是“观测 不到”的因素。(解决了问题① ) 1度量了其他因素不变的情况下(Δu=0) ,x对y的线性 影响(Δy=1Δx) 。 (解决了问题②和半个问题③,1 如何确定?)
u=y- 0 - 1x
n
n
1

x i y i ˆ 0 ˆ 1 x i 0


i 1
(2.14 ) (2.15 )
代入(2.10)和( 2.11),得 江西财经大学(彭树宏)
ˆ 和 ˆ • 由以上两个方程,可解得 0 1
9 江西财经大学(彭树宏) 10
二、普通最小二乘法的推导
五、OLS估计量的期望值和方差
误差方差的估计 • 误差和方差的区别:误差出现在包含总体参数 0 ˆ 和 ˆ 的方程 和 1 的方程中,残差出现在使用 1 0 中;误差无法观测,但残差却可以从数据中计算 出来。 yi 0 1 xi ui
ˆ ˆ x u ˆi yi 0 1 i
ˆ y ˆx 0 1
n
二、普通最小二乘法的推导
另一种方法 定义y在x=xi时的拟合值为
ˆ i ˆ 0 ˆ 1 x i y
(2.17)
ˆ 1

( x i x )( y i y )
n
i 1

( xi x )2
(2.19)
第i次观测的残差为
ˆ ˆx ˆi yi y ˆ i yi u 0 1 i
二、普通最小二乘法的推导
• E(y – 0 – 1x) = 0 (2.12) • E[x(y – 0 – 1x)] = 0 (2.13) • (2.12)和(2.13)的样本对应值为:
n
n
1

i1
y
i
ˆ 0 ˆ 1 x
i

0
由总体回归函数y = 0 + 1x + u ,得
四、度量单位和函数形式
江西财经大学(彭树宏)
19
江西财经大学(彭树宏)
20
四、度量单位和函数形式
“线性”回归的含义:“线性”是指对参数线性 而非对变量线性。 • 线性回归 • 非线性回归
五、OLS估计量的期望值和方差
OLS的无偏性
江西财经大学(彭树宏)
21
江西财经大学(彭树宏)
22
五、OLS估计量的期望值和方差
n n
三、OLS的操作技巧
拟合优度 • 定义总平方和(SST)、解释平方(SSE)和残 差平方和(SSR)为:
① OLS残差和及其样本均值都为零(由(2.Fra Baidu bibliotek4)式得)
0 n 回归元和OLS残差的样本协方差为零(由(2.15)式 n 得)
i i 1


0,
i 1
i


ˆi 0 x iu
ˆ / se ˆ1

x
i
x
2

1
2
江西财经大学(彭树宏)
29
5
第2章 简单回归模型
一.简单回归模型的定义 二.普通最小二乘法的推导 三.OLS的操作技巧 四.度量单位和函数形式 五.OLS估计量的期望值和方差 六.过原点回归
江西财经大学(彭树宏) 1
一、简单回归模型的定义
• y和x是两个代表某个总体的变量,研究y如何随x 而变化? • 例:y是大豆产出,x是施肥量;y是小时工资,x 是受教育年数;y是社区的犯罪率,x是警察的数 量。 • 写出用x解释y的模型时面临的问题:①应该如何 考虑其他影响y的因素?②y和x的函数关系是怎 样?③何以确定在其他条件不变的情况下刻画了y 和x之间的关系?
4
五、OLS估计量的期望值和方差
• 用y的条件均值和 条件方差表示零 条件均值假定和 同方差假定有:
五、OLS估计量的期望值和方差
• 当假定 SLR.5不满 足时,便称 误差项表现 出异方差 性。(例 2.13)
江西财经大学(彭树宏)
25
江西财经大学(彭树宏)
26
五、OLS估计量的期望值和方差
• 有了同方差假定,便可以证明如下定理:
i1
③ 点
( x, y )
总在OLS回归线上(由(2.16)式得)
江西财经大学(彭树宏) 15 江西财经大学(彭树宏) 16
三、OLS的操作技巧
• y的总变异总能表示成解释了的变异和未解释的 变异之和:
yi
四、度量单位和函数形式 改变度量单位对OLS统计量的影响 • 若因变量乘以一个常数c(自变量没有变 化),则OLS截距和斜率的估计值都扩大 为原来的c倍。 • 若自变量乘以一个常数c (因变量没有变 化),则OLS斜率系数将被除以c,而截距 系数则没有变化。
相关文档
最新文档