3.1 多元线性回归模型 - 副本
【精品】3.1矩阵基础及多元线性回归模型
截距项和偏回归系数
总体回归函数的随机表达式:
Yi 0 1 X 1i 2 X 2 i k X ki i
(1) j (j1) 称为 偏回归系数 表示在其他解释变量保持不变的情况下,Xj每变化1个单 位时,Y的条件均值 E(Y | X 1 , X 2 , X k ) 的变化; 或者说j给出了Xj的单位变化对 Y均值的“直接”或“净” (不含其他变量)影响。 (2) 0 (j1) 称为 截距项,它给出了所有未包含到模型中的 变量对Y的平均影响。
• • • • • • 多元线性回归模型 多元线性回归模型的参数估计 多元线性回归模型的统计检验 多元线性回归模型的预测 回归模型的其他形式 回归模型的参数约束
25
§3.1 多元线性回归模型
一、多元线性回归模型 二、多元线性回归模型的基本假定
26
多元线性回归模型的引入
一元(双变量)线性回归模型在实践中 对许多情况往往无法描述。 例如:对某商品的需求很可能不仅依赖于它 本身的价格,而且还依赖于其他相互竞争(互 替)或相互补充(互补)的产品价格。此外,还 有消费者的收人、社会地位,等等。因此, 我们需要讨论因变量或回归子Y,依赖于两个 或更多个解释变量或回归元的模型。
21
幂等矩阵 • 令A为nn对称矩阵。如果AA=A,则称 A是幂等矩阵。
• 幂等矩阵的性质: 令A为nn幂等矩阵 (1) rank(A)=tr(A) (2) A是半正定的。
22
矩阵微分
(1) 对于一个给定的n1向量a,对所有n1向量x,定义线性函 数 f(x)= a’x,则f 对x的导数是1n阶偏导数向量a’,即: why? (2) 对一个nn的对称矩阵A,定义
其随机表示式:
计量经济学作业(建立多元线性回归模型)- 副本
税收与三大产业的关系模型目录目录 (1)1.研究背景 (2)2.数据的搜集 (2)3.建立多元线性回归模型 (3)3.1模型估计 (3)3.2模型检验 (6)3.2.1经济意义检验 (6)3.2.2拟合优度检验 (7)3.2.3.F检验 (7)3.2.4 t检验 (7)3.2.5多重共线性检验 (7)3.2.6自相关性检验 (12)3.2.7自相关的修正 (13)3.2.8 异方差性检验 (14)3.2.9异方差的修正 (17)4结论 (22)5参考文献 (22)1.研究背景税收是调控经济运行的重要手段。
经济决定税收,税收反作用于经济。
税收作为经济杠杆,通过增税与减免税等手段来影响社会成员的经济利益,引导企业、个人的经济行为,对资源配置和社会经济发展产生影响,从而达到调控宏观经济运行的目的。
政府运用税收手段,既可以调节宏观经济总量,也可以调节经济结构。
我国税收收入增长率在“下降”,而“质量”却在“提高”。
财政部税政司发布的“2013年一季度税收收入情况分析”显示,2013年一季度全国税收总收入完成27399.20亿元,比去年同期增加2418.96亿元,增长10.3%.从中可以看出,一季度的税收收入增长速度改变了以往税收收入超GDP较多的增长形势,呈现低速增长的态势。
近年来,我国大力发展的高新技术产业、金融业、物流业三大支柱产业,成为纳税大户排行榜上最引人注目的三大集团军。
这三大产业名家荟萃,在本届的三大排行表上纷纷崭露头角。
因此,税收与三大产业的发展有着密不可分的联系,本文将用计量经济学的有关方法来建立具体模型探究它们之间的具体关系。
2.数据的搜集1993-2012年中国税收收入与三大产业数据统计:单位:亿元3.建立多元线性回归模型3.1模型估计新建一个excel文档,将数据编辑入excel文档,进入Eviews软件包,键入file/open/foreign data as Workfile,将excel文档导入Eviews,再进行回归分析的结果:(命令:LS Y C X1 X2 X3)输入命令(scat X1 Y)、(scat X2 Y)、(scat X3 Y)得到如下的散点图:估计结果为ýi=1755.421-0.79X1i+0.215X2i+0.355X3i(1.7731)(-4.6973)(2.4552)(4.6580)R2=9985 F=3588.752 DW=1.5649括号内为t统计量值。
实验优化设计-多元线性回归模型
其中:n-k-1为残差平方和的自由度,n-1为总 体平方和的自由度。
*2、赤池信息准则和施瓦茨准则 为了比较所含解释变量个数不同的多元 回归模型的拟合优度,常用的标准还有: 赤池信息准则(Akaike information criterion, AIC) e e 2 ( k 1 ) AIC ln n n 施瓦茨准则(Schwarz criterion,SC)
2、关于拟合优度检验与方程显著性检验关系的讨论 由
RSS /( n k 1 ) R 1 与 TSS /( n 1 )
2
ESS /k F RSS /( nk 1 )
可推出: 或
n 1 R 1 n k 1 kF
2
R2 /k F ( 1R2)/( nk 1 )
e e k AC ln ln n n n
这两准则均要求仅当所增加的解释变量能够 减少AIC值或AC值时才在原模型中增加该解释变 量。
二、方程的显著性检验(F检验)
方程的显著性检验,旨在对模型中被解释变 量与解释变量之间的线性关系在总体上是否显著 成立作出推断。 1、方程显著性的F检验 即检验模型
i i
0i
i i
1 i1 i
k i ki
i
=0
所以有: 注意:一个有趣的现象
i i i i 2
2 2 ˆ ˆ TSS ( Y Y ) ( Y Y ) RSS ESS i i i
ˆ ˆ Y Y Y Y Y Y ˆ ˆ Y Y Y Y Y Y ˆ ˆ Y Y Y Y Y Y
对于中国居民人均消费支出的例子: 一元模型:F=285.92
二元模型:F=2057.3
第3章多元线性回归
E (β XX1Xε-β)(β XX1Xε-β)
E XX1Xεε XXX1 XX1XE(εε )XXX1
XX1XE( 2In )XXX1 2 XX1
3.3 参数估计量的性质
i 1
i 1
ˆ
2
n
1 p
1
SSE
n
1 p
(ee) 1
n
1 p
1
n i 1
ei2
是σ2的无偏估计
3.2 回归参数的估计
三 、回归参数的最大似然估计
y~N(Xβ ,σ 2In)
似然函数为
L
(2 )n
2
2
n
2
exp(
1
2
2
(y - Xβ)(y - Xβ))
βˆ (XX)-1 Xy
3.2 回归参数的估计
二、回归值与残差
称 yˆi ˆ0 ˆ1xi1 ˆ2xi2 ˆp xip 为回归值
yˆ Xβˆ X(XX)-1 Xy H X(X X)-1X
称为帽子矩阵,其主对角线元素记为hii ,则
3.2 回归参数的估计
二、回归值与残差
n
tr(H ) hii p 1 i 1
此式的证明只需根据迹的性质tr(AB)=tr(BA),因而
tr(H) tr(X(XX)-1X) tr(XX(XX)-1) tr(Ip1) p 1
3.2 回归参数的估计
二、回归值与残差
e y yˆ y Hy (I- H)y
x 2
Lxx
x 2
Lxx
2
L xx
第三章(1) 多元线性回归模型课件
分离差的大小
解释的那部分离差的大小。也
称剩余平方和。
第三章 多元线性回归模型
§ 3-3 多元线性回归模型的统计检验 一、 拟合优度检验 检验模型对样本观测值的拟合程度。用在总离差分解 基础上确定的可决系数R2 (调整的可决系数 ) 度量。 1、总离差平方和的分解
总离差平方和TSS 回归平方和ESS
3、随机误差项在不同 样本点之间是独立的,
Cov( i,
不存在序列相关
因为 i与 j相互独立,有:
j)=0 i≠j
无自相关假定表明:产生 误差(干扰)的因素是完 全随机的,此次干扰与彼 次干扰互不相关,互相独 立。由此应变量Yi的序列 值之间也互不相关。
第三章 多元线性回归模型
§ 3-1 多元线性回归模型及其基本假定
3、有效性(最小方差性):
指在所有线性、无偏估计量中, OLS参数估计量的 方差最小。
4、 服从正态分布,即:
其中,
, G2是随机误差项的方差,
Cjj是矩阵(X’X)-1 中第j行第j列位置上的元素。
第三章 多元线性回归模型
§ 3-2 多元线性回归模型的参数估计
一、 参数的最小二乘估计
二、 OLS估计量的统计性质及其分布
三、随机误差项方差Q2的估 计
参数估计的另一项任务是: 求随机误差项 i 的分布参数
称作回归标准差 (standard error of regression), 常作为对所估计回归线的拟
合优度的简单度量。
i~N(0, Q2)
随机误差项 i 的 方差的估计量为:
可以
证明:
说明 是QS 的无偏估计量。
t-Statistic 6.411848 22.00035 4.187969
多元线性回归模型
多元线性回归模型多元线性回归是一种用于分析多个自变量与一个因变量之间关系的统计方法。
在这种分析中,我们试图根据已知自变量的值来预测因变量的值。
该模型常用于市场研究、金融分析、生物统计和其他领域。
在本文中,我们将介绍多元线性回归的基础概念和实践应用。
一般来说,线性回归的目的是找到一个线性函数y=ax+b来描述一个因变量y与一个自变量x的关系。
但是,在现实生活中,我们通常需要考虑多个自变量对因变量的影响。
这时就需要采用多元线性回归模型来描述这种关系。
多元线性回归模型可以表示为:y=b0 + b1x1 + b2x2 + … + bnxn + ε其中,y是因变量,x1, x2, …, xn是自变量,b0, b1, b2, …, bn是回归系数,ε是误差项,反映了因变量和自变量之间未能被回归方程中的自变量解释的差异。
多元线性回归的重要性质是,每个自变量对因变量的影响是独立的。
也就是说,当我们同时考虑多个自变量时,每个自变量对因变量的解释将被考虑到。
多元线性回归模型的核心是确定回归系数。
回归系数表明了自变量单位变化时,因变量的变化量。
确定回归系数的一种方法是最小二乘法。
最小二乘法是一种通过最小化实际值与预测值之间的差值来确定回归系数的方法。
我们可以使用矩阵运算来计算回归系数。
设X为自变量矩阵,y为因变量向量,则回归系数向量b可以通过以下公式计算:b = (XTX)-1XTy其中,XT是X的转置,(XTX)-1是X的逆矩阵。
在计算回归系数之后,我们可以使用多元线性回归模型来预测因变量的值。
我们只需要将自变量的值代入回归方程中即可。
但是,我们需要记住,这种预测只是基于样本数据进行的,不能完全代表总体数据。
多元线性回归模型有很多实际应用。
一个常见的例子是用于市场营销中的顾客预测。
通过对顾客的年龄、性别、教育程度、收入等数据进行分析,可以预测他们的购买行为、购买频率和购买方式等,这些预测结果可以帮助企业做出更好的营销决策。
§3.1 多元线性回归模型
Y = Xβ+ μ β
1 X 11 1 X 12 X= M M 1 X 1n X 21 L X k1 X 22 L X k 2 M M X 2 n L X kn n×( k +1)
β0 β 1 β= β 2 M β k ( k +1)×1
1 2 μ= M n n×1
i ~ N (0, σ 2 )
上述假设的矩阵符号表示 上述假设的矩阵符号表示 式: 假设1 +1)矩阵 是非随机的, +1, 假设1,n×(k+1)矩阵 是非随机的,且X的秩ρ=k+1, × +1)矩阵X是非随机的 的秩 +1 满秩。 即X满秩。 满秩 假设2 假设2,
1 E ( 1 ) E (μ = E M = M = 0 ) E ( ) n n
样本回归函数: 样本回归函数:用来估计总体回归函数
Yi = β 0 + β 1 X 1i + β 2 X 2i + L + β ki X ki
其随机表示式: 随机表示式:
Yi = β0 + β1 X1i + β2 X2i +L+ βki Xki + ei
样本回归函数的矩阵表达: 样本回归函数的矩阵表达:
第三章 经典单方程计量经济学模 型:多元回归
多元线性回归模型 多元线性回归模型的参数估计 多元线性回归模型的统计检验 多元线性回归模型的预测 回归模型的其他形式 回归模型的参数约束
§3.1 多元线性回归模型
一、多元线性回归模型 二、多元线性回归模型的基本假定
一、多元线性回归模型
Yi =β0 +β1X1i +β2X2i ++βk Xki +i
多元线性回归模型
多元线性回归模型引言:多元线性回归模型是一种常用的统计分析方法,用于确定多个自变量与一个连续型因变量之间的线性关系。
它是简单线性回归模型的扩展,可以更准确地预测因变量的值,并分析各个自变量对因变量的影响程度。
本文旨在介绍多元线性回归模型的原理、假设条件和应用。
一、多元线性回归模型的原理多元线性回归模型基于以下假设:1)自变量与因变量之间的关系是线性的;2)自变量之间相互独立;3)残差项服从正态分布。
多元线性回归模型的数学表达式为:Y = β0 + β1X1 + β2X2 + ... + βnXn + ε其中,Y代表因变量,X1,X2,...,Xn代表自变量,β0,β1,β2,...,βn为待估计的回归系数,ε为随机误差项。
二、多元线性回归模型的估计方法为了确定回归系数的最佳估计值,常采用最小二乘法进行估计。
最小二乘法的原理是使残差平方和最小化,从而得到回归系数的估计值。
具体求解过程包括对模型进行估计、解释回归系数、进行显著性检验和评价模型拟合度等步骤。
三、多元线性回归模型的假设条件为了保证多元线性回归模型的准确性和可靠性,需要满足一定的假设条件。
主要包括线性关系、多元正态分布、自变量之间的独立性、无多重共线性、残差项的独立性和同方差性等。
在实际应用中,我们需要对这些假设条件进行检验,并根据检验结果进行相应的修正。
四、多元线性回归模型的应用多元线性回归模型广泛应用于各个领域的研究和实践中。
在经济学中,可以用于预测国内生产总值和通货膨胀率等经济指标;在市场营销中,可以用于预测销售额和用户满意度等关键指标;在医学研究中,可以用于评估疾病风险因素和预测治疗效果等。
多元线性回归模型的应用可以为决策提供科学依据,并帮助解释变量对因变量的影响程度。
五、多元线性回归模型的优缺点多元线性回归模型具有以下优点:1)能够解释各个自变量对因变量的相对影响;2)提供了一种可靠的预测方法;3)可用于控制变量的效果。
然而,多元线性回归模型也存在一些缺点:1)对于非线性关系无法准确预测;2)对异常值和离群点敏感;3)要求满足一定的假设条件。
3经典多元线性回归模型
假设4:E(μ︱X)=0
12 Var ( X ) E ( ' X ) E n 1 0
2
1 n
n
2
其中,i=1,2, …,n
ˆ ˆ ˆ ˆ Y i 0 1 X i 1 2 X i 2 k X ik e i
其中,i=1,2, …,n
上述样本回归函数的矩阵表达式分别为:
ˆ ˆ Y X
ˆ Y X e
ˆ Y1 ˆ Y2 ˆ Y Y ˆ n n 1
普通最小二乘估计 最大似然估计 矩估计 参数估计量的统计性质 样本容量问题
多元线性回归模型参数估计的任务: (1)求出反映变量之间数量关系的结构参数估计 量 ˆ j ,j=0,1,…,k; 2 ˆ 。 (2)求出随机误差项方差的估计量
3.2.1普通最小二乘估计
X 1k X 2k X nk n ( k 1)
0 1 2
k
1 2 n
n 1
给出总体的一个样本,可估计样本回归函数, 近似代表未知的总体回归函数。 样本回归函数可表示为:
ˆ ˆ ˆ ˆ Y 0 1 X 1 2 X
给出一组观测值(Xi1,Xi2,…,Xik;Yi),i=1,2, …,n; 总体回归模型还可写成如下形式:
Yi 0 1 X i 1 2 X i 2 k X ik i
第八章:多元线性回归模型-PPT精选文档
表示: 各变量 X值固定(即给定)时 Y的平均响 应(即均值)。
j也被称为偏回归系数,表示在其他解释变
量保持不变的情况下,X j每变化1个单位时,Y的 均值E(Y)的变化; 或者说j给出了X j的单位变化对Y均值的 “直接”或“净”(不含其他变量)影响。
用来估计总体回归函数的样本回归函数为:
§3.2 多元线性回归模型的估计
一、普通最小二乘估计
*二、最大或然估计(Maximum Likelihood) *三、矩估计(Moment Method)
四、参数估计量的性质
* 五样本容量问题
六、估计实例
说 明
(注:参数有两类:结构参数和分布参数,分布参数是 指随机误差项的均值和方差) 估计方法: 3大类方法:OLS、ML或者MM – – 在经典模型中多应用OLS 在非经典模型中多应用ML或者MM
ˆ ˆ ˆ ˆ ˆ Y X X X i 0 1 1 i 2 2 i ki ki
ˆ ˆ ˆ ˆ X X X e 其随机表示式: Y i 0 1 1 i 2 2 i ki ki i
ei称为残差或剩余项(residuals),可看成是 总体回归模型中随机扰动项i的近似替代。
n
Q
ˆ ˆ ˆ ˆ ( Y ( X X X )) i 0 1 1 i 2 2 i k k i
i 1
n
2
• 于是得到关于待估参数估计值的正规方程组:
ˆ ˆ X ˆ X ˆ X ) SY S( 0 1 1i 2 2i k ki i ˆ ˆ X ˆ X ˆ X ) X SY X S( 0 1 1i 2 2i k ki 1i i 1i ˆ ˆ X ˆ X ˆ X ) X SY X S( 0 1 1i 2i 2i k ki 2i i 2i ˆ ˆ X ˆ X ˆ X ) X SY X S( 0 1 1i 2 2i k ki ki i ki
多元线性回归模型
多元线性回归模型在市场的经济活动中,经常会遇到某一市场现象的发展和变化取决于几个影响因素的情况,也就是一个因变量和几个自变量有依存关系的情况。
而且有时几个影响因素主次难以区分,或者有的因素虽属次要,但也不能略去其作用。
例如,某一商品的销售量既与人口的增长变化有关,也与商品价格变化有关。
这时采用一元回归分析预测法进行预测是难以奏效的,需要采用多元回归分析预测法。
多元回归分析预测法是指通过对两个或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。
当自变量与因变量之间存在线性关系时,称为多元线性回归分析。
多元回归分析可以达到以下目的。
(1)了解因变量和自变量之间的关系是否存在,以及这种关系的强度。
也就是以自变量所解释的因变量的变异部分是否显著,且因变量变异中有多大部分可以由自变量来解释。
(2)估计回归方程,求在自变量已知的情况下因变量的理论值或预测值,以达到预测目的。
(3)评价特定自变量对因变量的贡献,也就是在控制其他自变量不变的情况下,该处变量的变化所导致的因变量变化情况。
(4)比较各处变量在拟合的回归方程中相对作用大小,寻找最重要的和比较重要的自变量。
假定被解释变量Y与多个解释变量x1,x2,…,x k之间具有线性关系,是解释变量的多元线性函数,称为多元线性回归模型,即:式中,Y为被解释变量;x j(j=1,2,…,k)为k个解释变量,β(j j=1,2,…,k)为k个未知参数,β0是常数项,β1,β2,…,βk是回归系数,β1是x2,x3,…,x k固定时,x1每增加一个单位对Y的效应,即x1对Y的偏回归系数,同理,β2是x2对Y的偏回归系数;μ为随机误差项。
被解释变量Y的期望值与解释变量x1,x2,…,x k的线性方程为:式(4.19)称为多元总体线性回归方程,简称总体回归方程。
对于n组观测值,其方程组形式为:多元线性回归模型包含多个解释变量,多个解释变量同时对被解释变量发生作用,若要考察其中一个解释变量对被解释变量的影响就必须假设其他解释变量保持不变来进行分析。
多元线性回归的计算模型
多元线性回归的计算模型[1]一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。
当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回归。
设y为因变量,为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为:其中,b0为常数项,为回归系数,b1为固定时,x1每增加一个单位对y的效应,即x1对y的偏回归系数;同理b2为固定时,x2每增加一个单位对y的效应,即,x2对y的偏回归系数,等等。
如果两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描述为:其中,b0为常数项,为回归系数,b1为固定时,x2每增加一个单位对y的效应,即x2对y的偏回归系数,等等。
如果两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描述为:y = b0 + b1x1 + b2x2 + e建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是:(1)自变量对因变量必须有显著的影响,并呈密切的线性相关;(2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的;(3)自变量之彰应具有一定的互斥性,即自变量之彰的相关程度不应高于自变量与因变量之因的相关程度;(4)自变量应具有完整的统计数据,其预测值容易确定。
多元性回归模型的参数估计,同一元线性回归方程一样,也是在要求误差平方和()为最小的前提下,用最小二乘法求解参数。
以二线性回归模型为例,求解回归参数的标准方程组为解此方程可求得b0,b1,b2的数值。
亦可用下列矩阵法求得即[编辑]多元线性回归模型的检验[1]多元性回归模型与一元线性回归模型一样,在得到参数的最小二乘法的估计值之后,也需要进行必要的检验与评价,以决定模型是否可以应用。
第三讲 多元线性回归分析(整理)
或者表示为
(3.2.3)
它是介于0到1之间的一个数。 越大,模型对数据的拟合程度就越好,解释变量对被解释变量的解释能力越强。当 =1时,被解释变量的变化100%由回归直线解释,所有观测点都落在回归直线上。当 =0时,解释变量与被解释变量之间没有任何线性关系。
可以证明: ,因此有
= (3.2.3)*
借助于计量经济软件EViews对表3.1.1中的样本回归方程作F检验。
F统计量的值:F=146.2973,n=18,n-k-1=18-2-1=15,在5%的显著性水平下,查自由度为(2,15)的F分布表,得临界值 ,因为F=146.2973 ,故模型总体是显著的。即家庭收入与户主受教育年限对家庭书刊消费水平的共同影响是相当显著的。
在例3.1.1中,EViews软件的估计结果显示AIC与SC的值分别为11.20和11.35,分别大于只包含一个解释变量比如家庭收入时的相应值13.14和13.24,从这一点看,可以说户主受教育年数可以作为解释变量包括在模型中。
3.2.3 偏相关系数
3.2.4 回归模型的总体显著性检验:F检验
回归模型的总体显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。
9
611.1
1768.8
10
1222.1
1981.2
18
793.2
1998.6
14
660.8
2196.0
10
792.7
2105.4
12
580.8
2147.4
8
612.7
2154.0
10
890.8
2231.4
14
1121.0
2611.8
第三章多元线性回归模型分析(一
§3.2 参数的OLS估计
•参数的OLS估计
附录:极大似然估计和矩估计
投影和投影矩阵 分块回归和偏回归 偏相关系数
一、参数的OLS估计 普通最小二乘估计原理:使样本残差x22 +…+ xk k +
ˆ 关键问题是选择的估计量b(或 β ),使得残差平方和最 小。 残差为:
例:
Ct β1 β 2 Dt β3 Lt ut
其中,Ct=消费,Dt=居民可支配收入 Lt=居民拥有的流动资产水平 β 2的含义是,在流动资产不变的情况下,可支配收入变动一个 单位对消费额的影响。这是收入对消费额的直接影响。 收入变动对消费额的总影响=直接影响+间接影响。 (间接影响:收入流动资产拥有量消费额) 但在模型中这种间接影响应归因于流动资产,而不是收入,因 而,β 2只包括收入的直接影响。 在下面的模型中:
2 iK
β1
X
X
ikYi
按矩阵形式,上述方程组可表示为:
2 X i1
... ... ... ...
X
即
... ...
iK X i1
(X ' X )
ˆ X11 X 21 X i1X iK β 1 ˆ X12 X 22 ... β 2 = ... ... ... ... 2 ˆ X iK X1K X 2 K β k
(3)
写成一般形式为:
Y=X+
(4)
针对式(4),在这里主要讲参数估计和统计推断,但在 此之前,我们要先回顾一下什么模型才是多元线性回归模型, 即了解线性回归模型的6大假设,这一点十分重要。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
注意:“linear in the parameters”的含义是什么?
2、关于解释变量的假设
• 确定性假设。X values are fixed in repeated sampling. More technically, X is assumed to be nonstochastic.
ˆ ˆ X ˆ X ˆ X ˆ Y i 0 1 1i 2 2i ki ki ˆ ˆ X ˆ X ˆ X e Yi 0 1 1i 2 2i ki ki i
样本回归函数的矩阵表示
ˆ Xβ ˆ Y
ˆ 0 ˆ ˆ 1 β ˆ k
• 与随机项不相关假设。The covariances between Xi and μi are zero.
cov( X i , i ) 0, i 1, 2, , n E ( X i i ) 0, i 1, 2, , n
由确定性假设可以推断。
• 观测值变化假设。X values in a given sample must not all be the same. • 无完全共线性假设。There is no perfect multicollinearity among the explanatory variables.
ˆ e Y Xβ
e1 e2 e e n
二、多元线性回归模型的基本假设
1、关于模型关系的假设
• 模型设定正确假设。The regression model is correctly specified.
• 线性回归假设。The regression model is linear in the parameters。
假设3,E(X’)=0,即 E ( ) X X E ( ) E 0
i i
X Ki i
1i
i
X E ( ) Ki i
1i
i
假设4,向量 有一多维正态分布,即
方程表示:各变量X值固定时Y的平均响应。
j 也被称为 偏回归系数 ,表示在其他解释变
量保持不变的情况下, Xj 每变化 1 个单位时, Y 的均值E(Y)的变化; 或者说 j给出了 Xj 的单位变化对 Y均值的“直 接”或“净”(不含其他变量)影响。
总体回归模型的矩阵表示
Y X β μ
E ( i X i ) 0, i 1, 2, , n
由模型设定正确假设推断。
• 同方差假设。The conditional variances of μi are identical.(Homoscedasticity)
Var ( i X i ) 2 , i 1, 2, , n
第三章 经典单方程计量经济学模型:多元回归
• • • • • • 多元线性回归模型 多元线性回归模型的参数估计 多元线性回归模型的统计检验 多元线性回归模型的预测 回归模型的其他形式 回归模型的参数约束
§3.1 多元线性回归模型
一、多元线性回归模型 二、多元线性回归模型的基本假定
一、多元线性回归模型
μ~ N (0, 2 I )
同一元回归一样,多元回归还具有如下两个重要假设:
假设5,样本容量趋于无穷时,各解释变量的方差趋于有 界常数,即n∞时,
1 1 2 x ( X ji X j ) 2 Q j ji n n
或
1 x x Q n
其中:Q为一非奇异固定矩阵,矩阵x是由各解释变量 的离差为元素组成的nk阶矩阵
Yi 0 1 X 1i 2 X 2 i k X ki i
也被称为 总体回归函数 的 随机表达形式 。它的 非随机表达式为:
E (Yi | X 1i , X 2i , X ki ) 0 1 X 1i 2 X 2i k X ki
是否满足需要检验。
• 序列不相关假设。The correlation between any two μi and μj is zero.
Cov( i , j X i , X j ) 0, i, j 1, 2,, n, i j
是否满足需要检验。
4、随机项的正态性假设
• 在采用OLS进行参数估计时,不需要正态性假 设。在利用参数估计量进行统计推断时,需要 假设随机项的概率分布。 • 一般假设随机项服从正态分布。可以利用中心 极限定理(central limit theorem, CLT)进行 证明。 • 正态性假设。The μ’s follow the normal distribution.
1 1 X 1 X 11 X 12 X 1n X 21 X 22 X 2n X k1 X k2 X kn n ( k 1 )
Y1 Y Y 2 Yn n1
0 1 β 2 k ( k 1)1
1
12 1 n n E 2 n 1 n
0 2I 2
var( 1 ) cov( 1 , n ) 2 cov( , ) var( ) n 1 n 0
i ~ N (0, 2 ) i ~ NID(0, 2 )
5、CLRM 和 CNLRM
• 以上假设(正态性假设除外)也称为线性回归 模型的经典假设或高斯(Gauss)假设,满足 该假设的线性回归模型,也称为经典线性回归 模型(Classical Linear Regression Model, CLRM)。 • 同时满足正态性假设的线性回归模型,称为经 典正态线性回归模型(Classical Normal Linear Regresx k 1 x x 1n x kn
假设6,回归模型的设定是正确的。
1 2 μ n n 1
样本回归函数与样本回归模型
• 从一次抽样中获得的总体回归函数的近似,称为样 本回归函数(sample regression function)。 • 样本回归函数的随机形式,称为样本回归模型 (sample regression model)。
适用于多元线性回归模型。
时间序列数据作 样本时间适用
• 样本方差假设。随着样本容量的无限增加,解 释变量X的样本方差趋于一有限常数。
2 ( X X ) / n Q , i
n
3、关于随机项的假设
• 0均值假设。The conditional mean value of μi is zero.
多元线性回归模型:表现在线性回归模型中的 解释变量有多个。 一般表现形式:
Yi 0 1 X 1i 2 X 2 i k X ki i
i=1,2…,n
其中:k为解释变量的数目,j称为回归参数 (regression coefficient)。 习惯上:把常数项看成为一虚变量的系数,该 虚变量的样本观测值始终取1。这样: 模型中解释变量的数目为(k+1)
上述假设的矩阵符号表示 式:
假设1,n(k+1)矩阵X是非随机的,且X的秩=k+1, 即X满秩。
假设2,
1 E (1 ) E (μ) E 0 E ( ) n n
1 ) E E (μμ n