第三章-一元线性回归
第三章 一元线性回归模型
第三章 一元线性回归模型一、预备知识(一)相关概念对于一个双变量总体,若由基础理论,变量和变量之间存在因果),(i i x y x y 关系,或的变异可用来解释的变异。
为检验两变量间因果关系是否存在、x y 度量自变量对因变量影响的强弱与显著性以及利用解释变量去预测因变量x y x ,引入一元回归分析这一工具。
y 将给定条件下的均值i x i yi i i x x y E 10)|(ββ+=(3.1)定义为总体回归函数(PopulationRegressionFunction,PRF )。
定义为误差项(errorterm ),记为,即,这样)|(i i i x y E y -i μ)|(i i i i x y E y -=μ,或i i i i x y E y μ+=)|(i i i x y μββ++=10(3.2)(3.2)式称为总体回归模型或者随机总体回归函数。
其中,称为解释变量x (explanatory variable )或自变量(independent variable );称为被解释y 变量(explained variable )或因变量(dependent variable );误差项解释μ了因变量的变动中不能完全被自变量所解释的部分。
误差项的构成包括以下四个部分:(1)未纳入模型变量的影响(2)数据的测量误差(3)基础理论方程具有与回归方程不同的函数形式,比如自变量与因变量之间可能是非线性关系(4)纯随机和不可预料的事件。
在总体回归模型(3.2)中参数是未知的,是不可观察的,统计计10,ββi μ量分析的目标之一就是估计模型的未知参数。
给定一组随机样本,对(3.1)式进行估计,若的估计量分别记n i y x i i ,,2,1),,( =10,),|(ββi i x y E 为,则定义3.3式为样本回归函数^1^0^,,ββi y ()i i x y ^1^0^ββ+=n i ,,2,1 =(3.3)注意,样本回归函数随着样本的不同而不同,也就是说是随机变量,^1^0,ββ它们的随机性是由于的随机性(同一个可能对应不同的)与的变异共i y i x i y x 同引起的。
第三章_地理要素间的相关分析和回归分析 (1)PPT课件
i 1
② 根据取极值的必要条件,有
Q
a
Q
b
n
i1
n
i1
2[yi 2[yi
(abxi )] 0 (abxi )]xi 0
(3.2.4)
14
正规方程组
n
a
n
xi b
n
yi
i1
i1
n i1
xi
a
n i1
xi2
b
n i1
xi
yi
(3.2.5)
③ 解上述正规方程组(3.2.5)式,得到 参数a与b的拟合值
BXTY
b A -1 B (X T X ) 1(X T Y )
17
实例:最大积雪深度与灌溉面积
在我国西北的干旱地区,灌溉用水在相当程 度上依赖于山上的积雪。因此,积雪量与灌 溉面积之间会形成因果关系。
为了估计山上积雪融化对河流下游灌溉的影 响,在山上建立观测站,测得连续10年的观 测数据。
借助回归分析,建立数学模型,进行某种预 测和解释性的分析。
18
例1:为了估计山上积雪融化后对下游灌溉的影响,在山上建 立了一个观测站,测量了最大积雪深度(X)与当年灌溉面积
数据的下标; 为随机变量。 i
需要解决的问题:
1) 在回归模型中如何估计参数a、b?
2) 模型的假设是否正确?需要检验。 3)利用回归方程对y进行预测或对x进行控制?
11
1.参数估计:最小二乘法(Ordinary Least Squares)
记 aˆ 和 bˆ 分别为参数a与b的拟合值,则一
元线性回归模型为
回归分析,就是对具有相互联系的要素,根据其联 系的形态,选择一个合适的数学模式,用来近似地 表达要素间平均变化关系。
计量经济学习题集及答案
第一章导论⒈单项选择题⑴计量经济学是一门()学科。
A.测量B.经济C.统计D.数学⑵狭义计量经济模型是指()。
A.投入产出模型B.生产函数模型C.包含随机方程的经济数学模型D.模糊数学模型⑶计量经济模型分为单方程模型和()。
A.随机方程模型B.行为方程模型C.联立方程模型D.非随机方程模型⑷计量经济研究中的数据主要有两类:一类是时间序列数据,另一类是()。
A.总量数据B.横截面数据C.平均数据D.相对数据⑸同一统计指标按时间顺序记录的数据列称为()。
A.横截面数据B.时间序列数据C.虚拟变量数据D.混合数据⑹横截面数据是指()。
A.同一时点上不同统计的单位、相同统计指标组成的数据B.同一时点上相同统计的单位、相同统计指标组成的数据C.同一时点上相同统计的单位、不同统计指标组成的数据D.同一时点上不同统计的单位、不同统计指标组成的数据⑺样本数据的质量问题,可以概括为完整性、准确性、可比性和()。
A.时效性B.一致性C.广泛性D.系统性⑻对模型参数估计值的符号和大小合理性进行的检验,属于()。
A.经济意义检验B.计量经济准则检验C.统计准则检验D.稳定性检验⑼在计量经济学中,通常所说的二级检验指的是()。
A.经济意义检验B.计量经济准则检验C.统计准则检验D.稳定性检验⑽计量经济模型的应用领域主要有()。
A.结构分析、经济预测、政策评价、验证和发展经济理论B.弹性分析、乘数分析、政策模拟C.结构分析、生产技术分析、市场均衡分析D.季度分析、年度分析、中长期分析⒉多项选择题⑴使用时间序列数据进行经济计量分析时,要求指标统计()。
A.对象及范围可比B.时间可比C.口径可比D.计算方法可比E.内容可比⑵一个计量经济模型主要由以下几部分构成()。
A.变量B.参数C.随机误差项D.方程的形式E.数据⑶计量经济模型成功的三要素包括()。
A.理论B.应用C.数据D.方法E.检验⑷以下可以作为单方程计量经济模型解释变量的有()。
气象统计方法课件 3回归分析
当b<0,回归直线斜率为负,预报量y随预报因子x增加而减少, 反映预报量与因子是负相关; 当b>0,回归直线斜率为正,预报量y随预报因子x增加而增加, 反映预报量与因子是正相关。
二、回归问题的方差分析
1、意义 评价回归方程的优劣。
2、预报量的方差可以表示成回归估计值的方差 (回归方差)和误差(残差)方差之和。
1
n
n i 1
( yi
y)2
1 n
n i 1
( yˆi
y)2
1 n
n i 1
( yi
yˆ )2
(4)
即: sy2 syˆ2 se2
• 方差分析表明,预报量y的变化可以看成由 前期因子x的变化所引起的,同时加上随机 因素e变化的影响,这种前期因子x的变化影 响可以用回归方差的大小来衡量。如果回 归方差大,表明用线性关系解释y与x的关系 比较符合实际情况,回归模型比较好。
xi
n i 1
yi
n
n
n
b0
i 1
xi
b
i 1xi 2源自i 1xiyi
(3)
(3)式称为求回归系数的标准方程组。
回归系数也可直接表示为:
b0 y bx
n
b
xi yi nxy
i 1
n
xi2 nx 2
i 1
Sxy Sx2
将 b0 =y bx 代入回归方程 yˆi =b0 bxi,得
回归分析与相关分析的区别:
1. 相关分析中,变量x、y处于平等的地位;回归分析中,
变量y称为因变量,处在被解释的地位,x称为自变量, 用于预测因变量的变化。 2. 相关分析中所涉及的变量x和y都是随机变量;回归分 析中,因变量y是随机变量,自变量x可以是随机变量, 也可以是非随机的确定变量。 3. 相关分析主要是描述两个变量之间线性关系的密切程 度;回归分析不仅可以揭示变量x对变量y的影响大小, 还可以由回归方程进行预测和控制。
第三章 一元线性回归模型
第三章一元线性回归模型第一节一元线性回归模型及其基本假设一元线性回归模型第二章回归分析的基本思想指出,由于总体实际上是未知的,必须根据样本回归模型估计总体回归模型,回归分析的目的就是尽量使得样本回归模型接近总体回归模型,那么采取什么方法估计样本回归模型才使得估计出的样本回归模型是总体回归模型的一个较好估计值呢?这里包括两个问题:一是采用什么方法估计样本回归模型;二是怎样验证估计出的样本回归模型是总体回归模型的一个较好估计值。
这些将在接下来的内容中讲到。
这一章介绍最简单的一元线性回归模型,下一章再扩展到多元线性回归模型。
一元线性回归模型及其基本假设一、一元线性回归模型的定义一元线性回归模型是最简单的计量经济学模型,在该一元模型中,仅仅只含有一个自变量,其一般形式为:yi = β0 + β1xi + μi(3.1.1)其中yi是因变量,xi是自变量,β0、β1是回归参数,μi是随机项。
由于式(3.1.1)是对总体而言的,也称为总体回归模型。
随机项μ代表未被考虑到模型中而又对被解释变量y有影响的所有因素产生的总效应。
二、一元线性回归模型的基本假设由于模型中随机项的存在使得参数β0和β1的数值不可能严格计算出来,而只能进行估计,在计量经济学中,有很多方法可以估计出这些参数值,但采用什么方法能够尽可能准确地估计出这些参数值,取决于随机项μ和自变量x的性质。
因此,对随机项μ和自变量x的统计假定以及检验这些假定是否满足的方法,在计量经济学中占有重要的地位。
估计方法中用得最多的是普通最小二乘法(Ordinary Least Squares),同样为了保证利用普通最小二乘法估计出的参数估计量具有良好的性质,也需要对模型的随机项μ和自变量x 提出若干种假设。
当模型中的随机项μ和自变量x满足这些假设时,普通最小二乘法就是适合的估计方法;当模型中的随机项μ和自变量x不满足这些假设时,普通最小二乘法就不是适合的方法,这时需要利用其他的方法来估计模型。
一元线性回归分析PPT课件
拟合程度评价
拟合程度是指样本观测值聚集在样本回归线周围的紧
密程度. ( Y t Y ) ( Y ˆ t Y ) ( Y t Y ˆ t)
n
n
n
(Y t Y )2 (Y ˆt Y )2 (Y t Y ˆ)2
t 1
t 1
t 1
n
(Yt Y)2 :总离差平方和,记为SST;
t1
n
第8页/共40页
例
食品序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
求和
脂肪Xt 4 6 6 8 19 11 12 12 26 21 11 16 14 9 9 5
热量Yt 110 120 120 164 430 192 175 236 429 318 249 281 160 147 210 120
第1页/共40页
回归分析的分类
一个自变量
一元回归
回归分析
两个及以上自变量
多元回归
线性 回归
非线性 回归
线性 回归
非线性 回归
第2页/共40页
一元线性回归模型
(一)总体回归函数
Yt=0+1Xt+ut
ut是随机误差项,又称随机干扰项,它是一个特殊的 随机变量,反映未列入方程式的其他各种因素对Y的 影响。
(ˆ1t(n2)Sˆ1)
2
第15页/共40页
回归分析的Excel实现
“工具”->“数据分析”->“回归”
第16页/共40页
ˆ 0
S ˆ 0
ˆ 1
S ˆ 1
(ˆ0t(n2)Sˆ0)
2
(ˆ1t(n2)Sˆ1)
2
第17页/共40页
第三章 一元线性回归
LOGO
三、一元线性回归模型中随机项的假定
( xi , yi ),i,j=1,2,3,…,n后,为了估计(3.1.5) 在给定样本观测值(样本值) 式的参数 0和 1 ,必须对随机项做出某些合理的假定。这些假定通常称 为古典假设。
假设1、解释变量X是确定性变量,不是随机变量; 假设2、随机误差项具有零均值、同方差和不序列相关性: E(i)=0 Var (i)=2 i=1,2, …,n i=1,2, …,n
ˆ i ) ( y i 0 1 xi ) 2 Q( 0,1) ( yi y
2 i 1 i 1 n n
(3.2.3)
ˆ , ˆ ,使式 所谓最小二乘法,就是寻找参数 0,,1 的估计值 0 1 ˆ , ˆ 满足: (3.2.3)定义的离差平方和最小,即寻找 0 1
y 1 x
2 y 0 2 x
LOGO
二是被解释变量x与参数 之间为线性关系,即参数 仅以一次方的 形式出现在模型之中。用数学语言表示为:
y 1 0
y 0 2 0
2
y x 1
2 y 0 2 1
在经济计量学中,我们更关心被解释变量y与参数
之间的线性关系。因
第三章 一元线性回归
3.1 一元线性回归模型 3.2 回归参数 0,1 的估计 3.3 最小二乘估计的性质 3.4 回归方程的显著性检验
3.5 预测和控制
LOGO
3.1 一元线性回归模型
一、回归模型的一般形式
1、变量间的关系 经济变量之间的关系,大体可分为两类:
(1)确定性关系或函数关系:变量之间有唯一确定性的函数关 系。其一般表现形式为:
对于总体回归模型,
y f ( x1, x2 ,, xk ) u
计量第三章答案
第三章 一元经典线性回归模型的基本假设与检验问题 3.1TSS,RSS,ESS 的自由度如何计算?直观含义是什么?答:对于一元回归模型,残差平方和RSS 的自由度是(2)n -,它表示独立观察值的个数。
对于既定的自变量和估计量1ˆβ和2ˆβ,n 个残差 必须满足正规方程组。
因此,n 个残差中只有(2)n -个可以“自由取值”,其余两个随之确定。
所以RSS 的自由度是(2)n -。
TSS 的自由度是(1)n -:n 个离差之和等于0,这意味着,n 个数受到一个约束。
由于TSS=ESS+RSS ,回归平方和ESS 的自由度是1。
3.2 为什么做单边检验时,犯第一类错误的概率的评估会下调一半?答:选定显著性水平α之后,对应的临界值记为/2t α,则双边检验的拒绝区域为/2||t t α≥。
单边检验时,对参数的符号有先验估计,拒绝区域变为/2t t α≥或/2t t α≤-,故对犯第I 类错误的概率的评估下下降一半。
3.3 常常把高斯-马尔科夫定理简述为:OLS 估计量具有BULE 性质,其含义是什么? 答:含义是:(1)它是线性的(linear ):OLS 估计量是因变量的线性函数。
(2)它是无偏的(unbiased ):估计量的均值或数学期望等于真实的参数。
比如22ˆ()E ββ=。
(3)它是最优的或有效的(Best or efficient ):如果存在其它线性无偏的估计量,其方差必定大于OLS 估计量的方差。
3.4 做显著性检验时,针对的是总体回归函数(PRF )的系数还是样本回归函数(SRF )的系数?为什么?答:做显著性检验时,针对的是总体回归函数(SRF )的系数。
总体回归函数是未知的,也是研究者所关心的,所以只能利用样本回归函数来推测总体回归函数,后者是利用样本数据计算所得,是已知的,无需检验。
(习题)3.5 以下陈述正确吗?不论正确与否,请说明理由。
(1)X值越接近样本均值,斜率的OLS估计值就越精确。
第三章回归分析预测方法
1984
539
7136
1992
769
8683
1985
577
7658
1993
801
9317
1986
613
7784
1994
855
9675
1987
644
8108
2019
842
8542
1988
670
7583
2019
860
8584
1989
695
8002
2019
890
9612
1990
713
8442
2019
920
x
相关但无
线性关系
-3
-2
-1
0
1
2
3
x
2、回归分析与相关分析
研究和测度两个或两个以上变量之间关系的方 法有回归分析和相关分析。
相关分析。研究两个或两个以上随机变量之 间线性依存关系的紧密程度。通常用相关系 数表示,多元相关时用复相关系数表示。
回归分析。研究某一随机变量(因变量)与 其他一个或几个普通变量(自变量)之间的 数量变动的关系。
回本章目录
一、一元线性回归模型
一元线性回归(Linear regression),只研究一个 自变量与一个因变量之间的统计关系。
对于只涉及一个自变量的简单线性回归模型可表
示为: yb0b1xe
其中,b0和b1称为模型的参数;e是随机误差项,
又称随机干扰项,有 e N0,2
在线性回归模型中加入随机误差项是基于 以下原因:
第一节 引言
本章学习目的与要求:
通过本章的学习,了解回归分析预测法 的概念,掌握回归分析中各系数的计算方法 及回归预测方法,能够运用Excel工具来进行 预测。
第3章 一元回归模型:假设检验
ui ~ N (0, )
2
回顾:正态分布由来
高尔顿钉板
回顾:正态分布由来
高尔顿钉板
回顾:正态分布的平均值和方差
第327页
第三章 一元回归模型:假设检验
3.1 古典线性回归模型的基本假定
第三章 一元回归模型:假设检验
3.1 古典线性回归模型的基本假定
第三章 一元回归模型:假设检验
问:随机误差项
答:使用残差项
se(b2 ) var(b2 )
u i 的方差 2 不知道怎么办?? ei 的方差来估计随机误差项的方差:
EViews 回归结果
第三章 一元回归模型:假设检验
3.3 OLS估计量的性质
高斯-马尔科夫定理:
如果满足古典线性回归模型的基本假定,则OLS 估计量是最优线性无偏估计量(Best Linear Unbiased Evaluation , BLUE)。
3.1 古典线性回归模型的基本假定
二、对随机误差项
u i 的假定:
5. 解释变量与随机误差项不相关。
cov(ui , X i ) 0
6. 随机误差项之间不相关(无自相关、无序列相关)。
cov(ui , u j ) 0
i j i, j 1, 2,..., n
回顾:变量间的相关性
相关系数
第三章 一元回归模型:假设检验
3.3 OLS估计量的性质
1. 线性: b1和b2是线性估计量,即它们是Y的线性函数:
b1 Y b2 X
x y ( X X )(Y Y ) b x (X X ) X Y nXY X nX
i i i i 2 2 i 2 i i i 2 i 2
计量地理学第三章——2 回归分析
例1
一元线性回归方法的基本公式为:
y a bx
式中:a,b为待定参数,其表达式如下:
b Lxy Lxx
n i 1
xi yi
1 n
n
(
i 1
xi )(
n i 1
n i 1
xi2
1 n
n
(
i 1
xi )2
yi )
a y bx
变差 来源 回归
误差
总和
平方和
自由度
n
SSR (Yˆi Y )2
地区编号 1 2 3 4 5 6 7 8
月平均销售收 入(万元)y
31
40
30
34
25
20
35
40
月平均广告支 出(万元)x
5 10 5
7
4
3
7
9
要求:对于不同的月平均广告支出预测月平均销售收入
解:由计算结果可知,回归方程为
SST=338.875 SSR=314.532 SSE=24.343
Y 14.669 2.753X
因此,对于不同的月平均广告支出,其月平均销售收入的预测 结果如下:单位:万元
月平均广告支出 平均收入的点预测 平均收入的区间预测
6
31.187
(25.956,36.418)
8
36.693
(31.296,42.090)
12
47.705
(40.872,54.538)
直线回归、相关分析的注意事 项:
1)相关分析只是以相关系数来描述两个变量间线性相关 的程度和方向,并不阐明事物间存在联系的本质,也不是两事 物间存在联系的证据。要阐明两事物间的本质联系,必须凭专 业知识从理论上加以论证。因此,把两个毫无关系的事物放在 一起作相关分析是毫无意义的。同样,回归分析也要有实际意 义。
第三章-一元线性回归
第三章 一元线性回归第一部分 学习指导一、本章学习目的与要求1、掌握一元线性回归的经典假设;2、掌握一元线性回归的最小二乘法参数估计的计算公式、性质和应用;3、理解拟合优度指标:决定系数R 2的含义和作用;4、掌握解释变量X 和被解释变量Y 之间线性关系检验,回归参数0β和1β的显著性检验5、了解利用回归方程进行预测的方法。
二、本章内容提要(一)一元线性回归模型的假设条件 (1)E (i ε)=0 (i =1,2,……,n ),即随机误差项分布的均值为零。
(2)Var (i ε)=2σ (i =1,2, ……,n ),即随机误差项方差恒定,称为同方差。
(3)C o v (i ε,j ε)=0,(任意i ≠j ,i ,j =1,2, ……,n ),即随机误差项之间互不 相关。
(4)解释变量X 是非随机的,换句话说,在重复抽样下,X 的取值是确定不变的。
(5)i ε~N (0,2σ),即随机误差项服从均值为0,方差为2σ的正态分布。
前四个假定就是著名的高斯—马尔科夫假定或者称为回归分析的经典假定。
(二)一元线性回归最小二乘法估计参数的计算公式及性质 1、一元线性回归最小二乘法估计参数的计算公式为:()()()112101ˆˆˆni i xy i nxx ii x x y y S S x x y xβββ==⎧--⎪⎪==⎪⎨-⎪⎪=-⎪⎩∑∑ 2、一元线性回归最小二乘法估计参数的性质与估计量的性质 (1)残差的总和等于0,即∑=ni i1ˆε=0。
(2)残差的平方和最小,即∑=n i i12ˆε最小。
(3)被解释变量Y 的实际观测值i y 之和等于其拟合值ˆi y之和,从而i y 的均值y 与i y ˆ的均值y ˆ也相等。
(4)残差ˆi ε与ˆi y 互不相关,即1ˆˆ0ni i i y ε==∑。
(5)回归直线通过解释变量X 和被解释变量Y 的均值点(,)x y 。
3、OLS 法得到的估计量的性质(1) 线性性,即参数估计量是关于被解释变量Y 取值的线性函数。
第三章 一元模型的参数估计PPT课件
4
一、参数的普通最小二乘估计(OLS)
给定一组样本观测值(Xi, Yi)(i=1,2,…n)要 求样本回归函数尽可能好地拟合这组值.
离差
要求样本函数仅可能好的拟合这组数值,我们可以考虑 使观测值Yi与样本回归值之差(残差ei)尽可能的小, 使之尽可能的接近PRF,即:
第三章 一元回归模型的参数估计
一、参数的普通最小二乘估计(OLS) 二、最小二乘估计量的数值性质 三、一元线性回归模型的基本假设 四、最小二乘估计量的统计性质 五、参数估计量的概率分布及随机干
扰项方差的估计 六、最小二乘估计(OLS)的精度或标准误
1
整体概况
概况一
点击此处输入 相关文本内容
01
概况二
2、 ∑ei2=f(^0 , ^1 ),即残差平方和是估计量^0 , ^1
的某个函数。 3、用OLS原理或方法选出来的^0 , ^1 ,将使得对
于给定的样本或数据残差平方和尽可能的小。 7
方程组(*)称为正规方程组(normal equations)。
8
记
x i2(X i X )2X i2 1 n X i2
点击此处输入 相关文本内容
02
概况三
点击此处输入 相关文本内容
03
2
单方程计量经济学模型分为两大类: 线性模型和非线性模型
•线性模型中,变量之间的关系呈线性关系 •非线性模型中,变量之间的关系呈非线性关系
一元线性回归模型:只有一个解释变量
Y i 01X ii
i=1,2,…,n
Y为被解释变量,X为解释变量,0与1为待估 参数, 为随机干扰项
6
普通最小二乘法(Ordinary least squares, OLS)给出的判断标准是:二者之差的
计量经济学-第3章(一元线性回归模型)-文档资料
即:
Yi E (Yi X i ) u i
Yi的变化可以分为两部分,一部分是可以由Xi的变化解释 的,另一部分来自随机扰动。Yi向Xi所解释的“平均水平”回 归,这就是“回归”的含义。而斜率系数β 1是指,Xi每变化一 个单位,Yi平均变化β 1个单位。β 0是样本回归直线的截距。
《计量经济学》,王少平、杨继生、欧阳志刚主编
假定2:解释变量是外生变量。 即
Cov(ui , u j ) 0
i j , i, j 1, 2,
,N
《计量经济学》,王少平、杨继生、欧阳志刚主编 (3.1.5)
二、普通最小二乘法(OLS)
基于假定3,我们对模型(3.1.1)取条件期望,则有: E (Yi X i ) 0 1 X i 3.1.6) (
5
第一步 构造含有待估计系数的残差平方和 并对其求最小
N Q ˆ ˆ X )0 2 ( Y i 0 1 i ˆ N N 0 i 1 2 ˆ ˆ X )u ˆ ˆi min Q u ( Y i i 0 1 i ˆ ˆ N , 1 i 1 Q i2 ˆ ˆ X )X 0 (Y i 3.1.70 i ( ) 1 i ˆ i 1 1
N 就是说,如果我们能得到不同于最小 由于最小二乘估计量拥有一个“好” 即样本容量趋于无穷大时,估计量依 二乘估计量的其他线性无偏估计量, 渐近有效性 的估计量所应具备的有限样本性质, 概率收剑于总体的真实值,即: 其方差大于或者等于最小二乘估计量 ˆ) P lim( 它也拥有大样本特性,即渐近无偏性、 i i 的方差。 一致性、渐近有效性。 即样本容量趋于无穷大时,估计量 其中:符号“ Plim”表示概率极限,因
人教版高中数学选择性必修3《一元线性回归模型及其应用》PPT课件
46
48
51
(1)作出散点图;
(2)建立成绩y关于次数x的经验回归方程;
(3)作出残差图;
(4)计算R2,并用R2说明拟合效果的好坏.
解 (1)该运动员训练次数x与成绩y之间的散点图如图所示,由散点图可知,
它们之间具有线性相关关系.
8
(2)∵ =39.25,=40.875, ∑ xi2 =12 656,
人数y/万 12.39 20.02 25.57 30.26 35.77 37.57 40.23 40.95 41.73 43.71
^ =-157.74+77.62z,
^
故所求的经验回归方程为y =-157.74+77.62ln x.
素养形成
思维脉络
课前篇 自主预习
情境导入
恩格尔系数是根据恩格尔定律得出的比例数,指居民家庭中食物支出占消
费总支出的比重,是表示生活水平高低的一个指标.其计算公式:恩格尔系
数=食物支出金额÷总支出金额.
一个家庭收入越少,家庭收入中或者家庭总支出中用来购买食物的支出所
占的比例就越大,随着家庭收入的增加,家庭收入中或者家庭支出中用来购
均匀地分布在横轴的两边,说明残差比较符合一元线性回归模型的假定
3.我们可以用决定系数 R2 来比较两个模型的拟合效果,R2 的计算公式为
n
2
i=1
n
R =1-
^
∑ (y i -y i )2
2
∑ (y i -y)
i=1
n
.R 越大,表示残差平方和 ∑
2
i=1
^ 2
(yi-yi ) 越小,即模型的拟合效果越
^
∑ (yi -y )2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 一元线性回归第一部分 学习指导一、本章学习目的与要求1、掌握一元线性回归的经典假设;2、掌握一元线性回归的最小二乘法参数估计的计算公式、性质和应用;3、理解拟合优度指标:决定系数R 2的含义和作用;4、掌握解释变量X 和被解释变量Y 之间线性关系检验,回归参数0β和1β的显著性检验5、了解利用回归方程进行预测的方法。
二、本章内容提要(一)一元线性回归模型的假设条件 (1)E (i ε)=0 (i =1,2,……,n ),即随机误差项分布的均值为零。
(2)Var (i ε)=2σ (i =1,2, ……,n ),即随机误差项方差恒定,称为同方差。
(3)C o v (i ε,j ε)=0,(任意i ≠j ,i ,j =1,2, ……,n ),即随机误差项之间互不 相关。
(4)解释变量X 是非随机的,换句话说,在重复抽样下,X 的取值是确定不变的。
(5)i ε~N (0,2σ),即随机误差项服从均值为0,方差为2σ的正态分布。
前四个假定就是著名的高斯—马尔科夫假定或者称为回归分析的经典假定。
(二)一元线性回归最小二乘法估计参数的计算公式及性质 1、一元线性回归最小二乘法估计参数的计算公式为:()()()112101ˆˆˆni i xy i nxx ii x x y y S S x x y xβββ==⎧--⎪⎪==⎪⎨-⎪⎪=-⎪⎩∑∑ 2、一元线性回归最小二乘法估计参数的性质与估计量的性质 (1)残差的总和等于0,即∑=ni i1ˆε=0。
(2)残差的平方和最小,即∑=n i i12ˆε最小。
(3)被解释变量Y 的实际观测值i y 之和等于其拟合值ˆi y之和,从而i y 的均值y 与i y ˆ的均值y ˆ也相等。
(4)残差ˆi ε与ˆi y 互不相关,即1ˆˆ0ni i i y ε==∑。
(5)回归直线通过解释变量X 和被解释变量Y 的均值点(,)x y 。
3、OLS 法得到的估计量的性质(1) 线性性,即参数估计量是关于被解释变量Y 取值的线性函数。
(2)无偏性,即参数估计量的均值等于参数本身,也就是E (1ˆβ)=1β,E (0ˆβ)=0β (3)方差最小性,即在参数的所有线性无偏估计中,OLS 估计量是方差最小的。
该性质也称为方差有效性。
由(1)、(2)、(3)条性质知,根据最小二乘法得到的参数估计量是最优线性无偏估计量(Best Linear Unbias Estimator ),简称BLUE 估计量。
(三)拟合优度指标:决定系数R 21、总离差平方和的分解(TSS )TSS= ESS+RSS 即:总离差平方和=回归平方和+残差平方和其中:2ˆESS ()i y y =-∑,称为回归平方和(Explained Sum of Square );2ˆRSS ()i i y y =-∑,称为残差平方和(Residual Sum of Square )。
2、决定系数R 22201222ˆˆˆ()()ESS TSS ()()i ii iyy x y R y y yy ββ-+-===--∑∑∑∑= ()()2222211222()ˆˆ()i i i i i i n x x x x y y n y y ββ--=--∑∑∑∑∑∑ 决定系数2R 反映的是回归方程的拟合程度,值越大说明拟合优度越好,反之越差。
(四)变量之间线性关系的显著性检验1、解释变量X 和被解释变量Y 之间线性关系检验解释变量X 和被解释变量Y 之间线性关系检验,使用F 检验。
21-=n RSS ESSF ~)2,1(-n F如果计算出的F 值大于在给定的显著性水平α下的临界值(1,2)F n α-,则接受备择假设1H ,说明解释变量X 对被解释变量Y 有显著影响,即两者线性关系显著。
如果经计算出的F 值小于在给定的显著性水平α下的临界值(1,2)F n α-,则接受原假设0H ,说明解释变量X 对被解释变量Y 没有显著影响,即两者线性关系不显著。
在Eviews 软件中,通常只要看F 值所对应的概率p 。
在Eviews 软件中用Prob (F-statistic )表示,它被定义为Prob (F-statistic )=p ={(1,2)}P F n F ->。
由概率统计知识知,只要F 值所对应的概率p 小于给定的显著性水平α,就一定有F 值大于临界值(1,2)F n α-。
也就是说,只要比较Prob (F-statistic )和α的大小就可以判断两变量线性关系是否显著。
2、回归参数0β和1β的显著性检验计量经计学中,主要是针对回归参数真值是否为零来进行显著性检验的。
对回归参数0β和1β的显著性检验使用t 检验。
(1)回归参数1β的显著性检验),(~ˆ2211∑ixN σββ,实际应用中,总体方差2σ通常是未知的, 2ˆσ=RSS 2n -=22-∑n e i。
)2(~ˆˆˆ1ˆ112211--=-=∑n t S xt iβββσββ检验步骤如下:①对总体参数提出假设H 0: b 1=0, H 1:b 1¹0 ②以原假设H0构造t 统计量,并由样本计算其值1ˆ1ˆββS t =③给定显著性水平a ,查t 分布表,得临界值)2(2/-n t α;④比较,判断,若|t |>)2(2/-n t α则拒绝H0 ,接受H 1 ; 若|t t|£)2(2/-n t α,则拒绝H 1 ,接受H 0 。
(2)回归参数0β的显著性检验仿照回归参数1β的显著性检验方法,构造统计量:)2(~ˆˆˆ0ˆ02220-=-=∑∑n t S xn Xt iiββσββ具体步骤与回归参数1β的显著性检验步骤相同。
(五)总体均值和个别值的预测1、总体均值的点估计在给定0X x =条件下,0(|)E Y x 的点估计值或称为预测值为:10ˆˆˆyx ββ=+。
2、总体均值的区间估计在给定显著性水平α的条件下,0(|)E Y x 的置信区间为: (0ˆy-2(2)t n α-0ˆ()s y , 0ˆy +2(2)t n α-0ˆ()s y ) 其中,0ˆ()s y=3、个别值的区间估计在给定显著性水平α的条件下,(0ˆy-2(2)t n α-0()s δ, 0ˆy +2(2)t n α-0()s δ)其中:0()s δ=s 一般用σˆ代替。
第二部分 重点、难点解析一、一元线性回归分析的一般步骤一元线性回归分析有以下几个主要步骤:第一步,根据研究的目的和内容确定被解释变量Y 和解释变量X ,即变量的选择问题。
选择解释变量的一个原则是:既要与被解释变量Y 有密切的关系,又要考虑变量资料的可得性,还要兼顾模型简洁。
第二步,模型的设定。
模型设定从根本上来说,是根据研究的经济现象,依据相应的经济理论加以确定的。
可以说,依据的经济理论正确与否是模型建立的关键。
当然对经济现象历史分析的实践经验也是模型设定的重要依据。
实践中,当经济理论和实践经验都较为缺乏时,比如,研究一个从未研究过的新问题时,人们通常的做法是:根据所收集到的资料作散点图,再依据散点图的形状来确定模型应采用的形式。
第三步,参数估计。
根据设定的模型,利用已经收集到的样本数据,应用最小二乘法对模型中的参数进行估计。
目前关于最小二乘法估计的软件很多,如Eviews ,SAS 等都可以用来对参数进行估计,包括回归参数0β,1β以及随机误差项的方差2σ的估计。
第四步,模型的检验和修正。
当模型中的参数估计出来以后,模型基本上就建立了。
但是模型建立的好坏还需对模型本身及其参数作必要的检验。
常用的检验经济检验、统计检验、计量经济检验以及残差图检验。
如果模型通过了以上所有检验,则模型拟合较好,可以进行实际运用。
如果某一种检验没有通过,就需要找出其未通过的原因,并根据具体情况对模型、估计方法等进行修正或调整。
第五步,模型的运用。
模型的运用是回归分析的目的和问题的出发点。
回归模型的一个重要应用是进行预测,或者通过预测达到控制目的。
就一元线性回归分析而言,就是给定解释变量X的一个特定值,来预测对应被解释变量Y的平均值和个别值。
整个过程以流程图的形式给出如下:二、如何根据Eviews软件回归的结果进行模型的检验(一)回归直线拟合优度的检验在Eviews软件运行结果中,可以直接得到拟合优度2R的值,“R-squared”即是2R统计量,“Adjusted R-squared”即是调整的2R统计量。
(二)回归系数估计量的显著性检验在Eviews软件中,通常只要看t值所对应的概率p,在Eviews软件中用Prob.表示,它被定义为Prob.= p={(2)||}P t n t->。
由概率统计知识知,只要t值所对应的概率p小于给定的显著性水平α,就一定有t值的绝对值大于临界值2(2)t n α-。
也就是说,只要比较Prob.和α的大小就可以判断β和1β与0是否有显著差异。
(三)回归方程的显著性检验在Eviews软件中,通常只要看F值所对应的概率p。
在Eviews软件中用Prob(F-statistic)表示,它被定义为Prob(F-statistic)=p={(1,2)}P F n F->。
由概率统计知识知,只要F值所对应的概率p小于给定的显著性水平α,就一定有F值大于临界值(1,2)F nα-。
也就是说,只要比较Prob(F-statistic)和α的大小就可以判断两变量线性关系是否显著。
三、残 差 图 分 析(一)残差图分析的依据标准回归模型假定随机误差项满足零均值、同方差、不相关等假定。
特别地,为了进行统计推断还要求随机误差项服从正态分布,即i ε~N (0,2σ)。
如果样本回归模型对数据拟合是良好的话,那么i ε的估计ˆi ε就应该反映i ε的这些分布特性,即ˆi ε应近似服从N (0,2σ),从而有ˆi ε/σ~N (0,1),并称ˆi ε/σ为标准化残差。
考虑到σ一般是未知的,用ˆσ==s 表示,从而有:*ˆˆˆˆ/i i εεσ==~N (0,1) (二)标准化残差图主要形式: 1.回归方程拟合较好如果由(i x ,*ˆi ε)构成的点绝大多数落在(-2,+2)的水平带状区间之中,且不带有任何系统趋势、完全随机地分布在该带状之中,则说明采用的回归方程对样本数据的拟合是良好的,见下图。
图 3.6 回归方程拟合较好的残差图2.回归方程具有某种曲线形式如果总体回归方程本质上是曲线,而我们回归时却采用的是直线,此时标准化残差图就会表现出某种曲线形状,产生所谓的系统性偏差。
图3.7给出了两种可能的形状。
回归方程具有曲线形式的残差图3.样本数据中存在一个或多个异常点当样本数据中存在异常点时,一个最明显的特征是,这些异常点明显地离开大多数数据点,见下图。