(微观计量经济学教案)多元选择模型.
计量经济学课程第4章(多元回归分析)
§4.1 多元线性回归模型的两个例子
一、例题1:CD生产函数
Qt AKt 1 Lt 2 et
这是一个非线性函数,但取对数可以转变为一个 对参数线性的模型
ln Qt 0 1 ln Kt 2 ln Lt t
t ~ iid(0, 2 )
注意:“线性”的含义是指方程对参数而言是线 性的
R 2 1 RSS /(N K 1) TSS /(N 1)
调整思想: 对 R2 进行自由度调整。
Page 20
基本统计量TSS、RSS、ESS的自由度:
1.
TSS的自由度为N-1。基于样本容量N,TSS
N i1
(Yi
Y
)2
因为线性约束 Y 1 N
Y N
i1 i
而损失一个自由度。
分布的多个独立统计量平方加总,所得到的新统计量就服从
2 分布。
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
Page 23
双侧检验
概 率 密 度
概率1-
0
2 1 / 2
2 /2
图4.3.1
2
(N-K-1)的双侧临界值
双侧检验:统计值如果落入两尾中的任何一个则拒绝原假设
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
Page 24
单侧检验
概 率 密 度
概率 概率
0
2 1
2
图4.3.2 (2 N-K-1)的单侧临界值
H0:
2
2,
0
HA :
2
2 0
第3章 多元线性回归模型 《计量经济学》PPT课件
于是:
βˆ
ˆ1 ˆ 2
0.7226 0.0003
0.0003 1.35E 07
15674 39648400
01.0737.71072
⃟ 正规方程组 的另一种写法
对于正规方程组 XY XXβˆ
XXβˆ Xe XXβˆ
于是 Xe 0 (*)
或
ei 0
(**)
X jiei 0
i
(*) 或( ** )是多元线性回归模型正规方程 组的另一种写法。
第三章 经典单方程计量经济学模型: 多元线性回归模型
• 多元线性回归模型 • 多元线性回归模型的参数估计 • 多元线性回归模型的统计检验 • 多元线性回归模型的预测 • 回归模型的其他形式
§ 3. 1 多元线性回归模型
一、多元线性回归模型 二、多元线性回归模型的基本假定
一、多元线性回归模型
多元线性回归模型 : 表现在线性回归模型 中的解释变量有多个。
的秩 =k+1 ,即 X 满秩。
假设 2. 随机误差项零均值,同方差。
0
0
0
E
(μ
μ
)
E
1
n
1
n
E
12
n 1
1 n
2 n
var(1 ) cov(1, n ) 2 0
2I
cov(
n
,
1
)
var(n )
0
2
i E(i )
βˆ (xx)1 xY
ˆ0 Y ˆ1 X 1 ˆk X k
⃟ 随机误差项的方差的无偏估计
可以证明,随机误差项的方差的无偏 估计量为:
ˆ 2
ei2 n k 1
ee n k 1
计量经济学-3章:多元线性回归模型PPT课件
YXβ ˆe
Y ˆ Xβ ˆ
4/5/2021
.
17
2 模型的假定
(1) 零均值假设。随机误差项的条件期望为零,即 E(ui)=0 ( i=1,2,…,n)
其矩阵表达形式为:E(U)=0 (2)同方差假设。随机误差项有相同的方差,即
Var(ui)E(ui2) 2 (i=1,2,…,n)
(3)无自相关假设。随机误差项彼此之间不相关,即
(i=1,2,…,n)
上式为多元样本线性回归函数(方程),简称样本回归函 数(方程)(SRF, Sample Regression Function).
ˆ j (j=0,1,…,k)为根据样本数据所估计得到的参数估计量。
4/5/2021
.
13
(4)多元样本线性回归模型
对应于其样本回归函数(方程)的样本回归模型:
4/5/2021
.
3
教学内容
一、模型的建立及其假定条件 二、多元线性回归模型的参数估计:OLS 三、最小二乘估计量的统计性质 四、拟合优度检验 五、显著性检验与置信区间 六、预测 七、案例分析
4/5/2021
.
4
回顾: 一元线性回归模型
总体回归函数 E (Y i|X i)01X i
总体回归模型 Y i 01Xiui
0 0
2 0 0 2
0
0
0 0 0 2
2I n
4/5/2021
.
u1un
u2un
un2
20
(4)解释变量X1,X2,…,Xk是确定性变量,不是随机 变量,与随机误差项彼此之间不相关,即
Cov(Xji,ui)0 j=1,2…k , i=1,2,….,n
02-14.5 其他受限因变量模型
素。通过调查取得了市民收入(INC)与支持与否( y )的数
据,其中如果选民支持则yi取0,中立取1,不支持取2。
2、受限因变量模型
现实的经济生活中,有时会遇到这样的问题,因
变量是连续的,但是受到某种限制,也就是说所
得到的因变量的观测值来源于总体的一个受限制
乘出租车,乘公共汽车,还是骑自行车。
多元选择模型
上述3个例子代表了多元选择问题的不同类型。前两个
例子属于有序选择问题,所谓“有序”是指在各个选择项
之间有一定的顺序或级别种类。而第3个例子只是同一
个决策者面临多种选择,多种选择之间没有排序,不
属于有序选择问题。
与一般的多元选择模型不同,有序选择问题需要建立
数据,来自于美国国势调查局[U.S.Bureau of the
Census(Current Population Survey, 1993)],其中y
表示已婚妇女工作时间, x1~ x4分别表示已婚妇
女的未成年子女个数、年龄、受教育的年限和丈
夫的收入。
2.1 删失回归模型
例
删失模型的实例
只要已婚妇女没有提供工作时间,就将工作时间
换句话说,yi*的所有负值被定义为0值。我们称
这些数据在0处进行了左截取(删失)(left
censored)。而不是把观测不到的 yi* 的所有负
值简单地从样本中除掉。删失回归模型的一种典
型处理方法,也称为Tobit模型。
2.1 删失回归模型
例
删失模型的实例
本例研究已婚妇女工作时间问题,共有50个调查
作零对待,符合删失回归模型的特点。
2.2 截断回归模型
计量经济学庞皓课件(第三章 多元线性回归模型)
怎样分析多种因素的影响?
分析中国汽车行业未来的趋势,应具体分析这样一些问题: 中国汽车市场发展的状况如何?(用销售量观测) 影响中国汽车销量的主要因素是什么?
(如收入、价格、费用、道路状况、能源、政策环境等)
各种因素对汽车销量影响的性质怎样?(正、负) 各种因素影响汽车销量的具体数量关系是什么? 所得到的数量结论是否可靠? 中国汽车行业今后的发展前景怎样?应当如何制定汽车的 产业政策? 很明显,只用一个解释变量已很难分析汽车产业的发展, 还需要寻求有更多个解释变量情况的回归分析方法。
ˆk
k
c jj
~
N (0,1)
21 21
2 未知时βˆ 的标准化变换
因 2 是未知的, 可用 ˆ 2 代替 2 去估计参数的
标准误差:
●
当为大样本时,用估计的参数标准误差对
^
β
作
标准化变换,所得 Z 统计量仍可视为服从正态分
布
●当为小样本时,用估计的参数标准误差对 βˆ 作标 准化变换,所得的 t 统计量服从 t 分布:
( X X )1 X 2 IX ( X X )1
2 ( X X )1
注意
βˆ 是向量
(i 1, 2,L ( j 1, 2,L
n) n)
(由无偏性)
(由OLS估计式)
(由同方差性)
其中:
ˆ ( X X )1 X Y ( X X )1 X ( Xβ + u) β ( X X )1 X u
0
两边左乘 X
X Y = X Xβˆ + X e
根据最小二乘原则 则正规方程为
Xe = 0
X Xβˆ = X Y
14
OLS估计式
计量经济学第5章多元线性回归模型PPT课件
在命令栏中输入命令:ls y c x1 x2回车后即得到 估计的结果:
第25页/共53页
估计的回归方程为:
Yˆt 1688.174 0.288774X1t 12.82854X 2t
这个回归结果说明,在价格指数保持不变的条件下, 平均工资增加1元,消费水平增加约0.29元;在平 均工资不变的条件下,价格指数每增加一个百分点, 消费水平会增加约12.83元。 由这个结果可以得到,价格指数对消费的影响程度 是较高的。
Y1 1 X11 X 21 ... X k1 0 u1
Y2
1
X 12
X 22
...
X
k
2
1
u
2
... ... ... ... ... ... ..(. 5-2.8..)
Yn
1
X 1n
X 2n
...
X
kn
k
u
n
其中
Y1
1
Y
Y2
X
1
X 11 X 12
... ... ...
式(5-21)、(5-22)、(5-23)称为正规方程, 由其组成的方程组称为正规方程组。
第14页/共53页
可从中解出诸 ˆ j :
ˆ0 Y ˆ1X1 ˆ2 X 2
ˆ1
yi x1i
x
2 2i
yi x2i
x1i x2i
x12i x22i ( x1i x2i ) 2
ˆ2
第27页/共53页
(1)各变量的均值在回归直线上
由式(5-24)即得: Y ˆ0 ˆ1X1 ˆ2 X2 (2)Y估计值的均值等于Y的实际值的均值
即: Yˆ Y (3)残差的均值为0
计量经济学实验教学案例实验三 多元回归模型
实验三多元回归模型【实验目的】掌握建立多元回归模型和比较、筛选模型的方法。
【实验内容】建立我国国有独立核算工业企业生产函数。
根据生产函数理论,生产函数的基本形式为:()ε,ftY=。
其中,L、K分别为生产过程中投入的劳动与资金,L,,K时间变量t反映技术进步的影响。
表3-1列出了我国1978-1994年期间国有独立核算工业企业的有关统计资料;其中产出Y为工业总产值(可比价),L、K分别为年末职工人数和固定资产净值(可比价)。
资料来源:根据《中国统计年鉴-1995》和《中国工业经济年鉴-1995》计算整理【实验步骤】一、建立多元线性回归模型㈠建立包括时间变量的三元线性回归模型;在命令窗口依次键入以下命令即可:⒈建立工作文件: CREATE A 78 94⒉输入统计资料: DATA Y L K⒊生成时间变量t : GENR T=@TREND(77) ⒋建立回归模型: LS Y C T L K 则生产函数的估计结果及有关信息如图3-1所示。
图3-1 我国国有独立核算工业企业生产函数的估计结果 因此,我国国有独立工业企业的生产函数为:K L t y 7764.06667.06789.7732.675ˆ+++-=(模型1) t =(-0.252) (0.672) (0.781) (7.433)9958.02=R 9948.02=R 551.1018=F模型的计算结果表明,我国国有独立核算工业企业的劳动力边际产出为0.6667,资金的边际产出为0.7764,技术进步的影响使工业总产值平均每年递增77.68亿元。
回归系数的符号和数值是较为合理的。
9958.02=R ,说明模型有很高的拟合优度,F 检验也是高度显著的,说明职工人数L 、资金K 和时间变量t 对工业总产值的总影响是显著的。
从图3-1看出,解释变量资金K 的t 统计量值为7.433,表明资金对企业产出的影响是显著的。
但是,模型中其他变量(包括常数项)的t 统计量值都较小,未通过检验。
(微观计量经济学教案)二元选择模型
2
exp( x 2 2)
2、重复观测值不可以得到情况下二元Probit 离散选择模型的参数估计
ln L
fi fi Xi Xi 1 Fi F y 0 y 1 i
i
i
q i f (q i X i ) Xi F (q i X i ) i 1
n i 1
n
i
Xi
0
qi 2 yi 1
• 关于参数的非线性函数,不能直接求解,需采用 完全信息最大似然法中所采用的迭代方法。
• 应用计量经济学软件。
• 这里所谓“重复观测值不可以得到”,是指对每 个决策者只有一个观测值。如果有多个观测值, 也将其看成为多个不同的决策者。
例 贷款决策模型
• 注意,在模型中,效用是不可观测的,人们能够 得到的观测值仍然是选择结果,即1和0。
• 很显然,如果不可观测的U1>U0,即对应于观测 值为1,因为该个体选择公共交通工具的效用大于 选择私人交通工具的效用,他当然要选择公共交 通工具; • 相反,如果不可观测的U1≤U0,即对应于观测值 为0,因为该个体选择公共交通工具的效用小于选 择私人交通工具的效用,他当然要选择私人交通 工具。
§9.1
离散被解释变量数据计量经济学 模型(一)—二元选择模型 Models with Discrete Dependent Variables—Binary Choice Model
一、二元离散选择模型的经济背景 二、二元离散选择模型 三、二元Probit离散选择模型及其参数估计 四、二元Logit离散选择模型及其参数估计 五、二元离散选择模型的变量显著性检验
标准正态分布或逻 辑分布的对称性
计量经济学4多元回归分析推断
计量经济学:多元回归分析推断引言多元回归分析是计量经济学中常用的一种分析方法,用于探究多个自变量对一个因变量的影响关系。
本文将介绍多元回归分析的基本概念和原理,并且解释如何使用多元回归分析进行推断。
多元回归模型多元回归模型可以表示为:multivariate_regression_model其中,Y是因变量,表示我们想要解释的变量;X1, X2, …, Xk是自变量,表示对因变量有可能影响的变量;β0, β1, β2, …, βk是回归系数,表示自变量对因变量的影响程度;ε是误差项,表示我们未能观测到的其他影响因素。
多元回归模型的目标是通过估计回归系数,来解释因变量与自变量之间的关系,并且用这个模型进行推断。
多元回归模型的估计多元回归模型的估计可以使用最小二乘法进行。
最小二乘法的基本思想是,通过最小化因变量Y与预测值Y_hat之间的平方差,来求解回归系数的估计值。
最小二乘法估计的求解过程,可以用矩阵表示如下:multivariate_regression_estimation其中,X是自变量的矩阵,Y是因变量的向量,X T表示X的转置,(-1)表示矩阵的逆运算。
多元回归的推断多元回归模型的估计结果可以用于进行推断。
对回归系数进行假设检验,可以判断自变量对因变量是否有显著影响。
常用的假设检验有以下几种:1. 假设检验回归系数是否等于零:用于判断自变量是否对因变量有显著影响。
2. 假设检验回归系数是否等于某个特定值:用于判断自变量对因变量的影响是否等于某个理论值。
3. 假设检验多个回归系数是否同时等于零:用于判断自变量组合的整体影响是否显著。
假设检验的结果通常使用P值进行解释。
如果P值小于预先设定的显著性水平(通常为0.05),则拒绝原假设,认为回归系数是显著不等于零的。
多元回归的解释力度除了进行推断以外,多元回归模型还可以用于解释因变量的变异程度。
通过计算决定系数(R-squared),可以评估自变量对因变量的解释力度。
计量经济学多元模型
2010级国际经济与贸易专业计量经济学论文题目:我国居民消费水平影响因素的实证分析姓名:李湘怡班级:国贸101学号:50号指导老师:郑明贵外语外贸学院二O一三年五月我国居民消费水平影响因素的实证分析摘要:就我国近阶段消费方面出现的一些情况,利用1996年至2010年的相关数据对我国消费的影响因素进行实证分析。
目的在于进一步了解我国消费的因素。
通过相关的背景理论提出问题;搜集了相关的数据,利用EVIEWS软件对计量模型进行了参数估计和检验,并加以修正。
本文主要是通过对影响居民消费水平的主要因素分析揭示中国居民消费水平的现状及问题。
关键字:居民消费GDP 银行存款利率绪论:改革开放以来,我国居民收入与消费水平不断提高,居民消费结构升级和消费需求扩张成为我国经济高速增长的主要动力,特别是进入20世纪90年代以来,居民消费需求对国民经济发展的影响不断增大,对国民经济产生的拉动作用。
我国经济逐步由短缺经济走向过剩经济、由卖方市场转向买方市场,社会消费需求不足,居民消费问题显得更加突出。
特别是对于如何启动内需,扩大居民消费变得越来越重要。
本文中采用实证分析法,引入了影响居民消费水平的国内生产总值、居民人居收入、居民家庭恩格尔系数和银行储蓄存款利率,分析我国居民消费水平的影响因素,这对于正处于转型期的我国经济有极其重要的经济意义文献综述:居民消费水平是指居民在物质产品和劳务的消费过程中,对满足人们生存、发展和享受需要方面所达到的程度。
通过消费的物质产品和劳务的数量和质量反映出来。
凯恩斯在《货币通论》中提出了绝对收入假说,其主要理论观点是认为,人们的消费支出是由其当期的可支配收入决定的。
当人们的可支配收入增加时,其中用于消费的数额也会增加,但是消费增量在收入增量中的比重是下降的,因此随收入的增加,人们的消费在收入中的比重是下降的,而储蓄在收入中所占的比重则是上升的。
杜森贝利的相对收入假说认为,在稳定的收入增长时期,总储蓄率并不取决于收入;储蓄率要受到利率、收入预期、收入分配、收入增长率、人口年龄分布等多种因素变动的影响;在经济周期的短周期阶段中,储蓄率取决于现期收入与高峰收入的比率,从而边际消费倾向也要取决于这一比率,这也就是短期中消费会有波动的原因,但由于消费的棘轮作用,收入的减少对消费减少的作用并不大,而收入增加对消费的增加作用较大;短期与长期的影响结合在一起了。
多元选择模型
• 调查样本,有效样本303份。 • 首先将定义的全部变量放进模型中进行估计,并通过比较 各个变量的P值来考虑具体剔除哪些变量以及对哪些变量 考虑将其交互影响的效应放进模型中去。 • 小城镇、县级市、地级市、省级城市和超大城市依次取值 1、2、3、4、5。
迁移目标 小城镇 县级市 地级市 省级城市 超大城市
ik
k 0
J
exp(X i j Z j )
多元logit(ML)估计
对数似然函数的形式:
ln L( y, X , ) yij ln pij
i 1 j 1 J J yij ( X i j Z j ) ln[ exp(X i k Z k )] i 1 j 1 k 0 n n J
现有收入 -0.00144* -0.00032** -0.00028**
log(2/5) -0.2800*** log(3/5) log(4/5) -0.1136* -0.0856
-0.1578*** -0.00030**
• 从教育程度来看,所有系数都是负值,教育程度越高的农 村劳动力越愿意进入规模较大的城市;从显著性水平来看, 相对于超大城市来说,县级市被选择的可能性最小,其次 是小城镇,然后是地级城市,而教育程度相似的农村劳动 力在省级城市与超大城市之间的选择没有明显的差异。 • 从家庭情况来看,所有系数都是负值,也就是说家庭情况 越好的农村劳动力越愿意进入规模较大的城市;从显著性 水平来看,相对于超大城市来说,省级城市最不容易被选 中,其次是县级市,而小城镇与地级市之间没有明显区 别。 • 从现有收入来看,所有系数都是负值,也就是说目前收入 越高的农村劳动力越愿意进入规模较大的城市;再从显著 性水平来看,所有系数都是显著的,这说明相对于任何级 别的城市而言,农村劳动力都更倾向于超大城市。
《多元选择模型》课件
感谢您的观看
THANKS
《多元选择模型》ppt课件
目 录
• 多元选择模型概述 • 多元选择模型的原理 • 多元选择模型的应用实例 • 多元选择模型的优缺点 • 多元选择模型与其他模型的比较 • 多元选择模型的前沿研究与展望
01
多元选择模型概述
定义与特点
定义
多元选择模型是一种统计模型, 用于处理分类结果或有序分类结 果,例如选择题或评分等级。
多元选择模型的发展历程
早期发展
多元选择模型起源于20世纪50年代, 最初用于心理学和医学领域的分类问 题。
广泛应用
最新进展
近年来,随着大数据和机器学习技术 的兴起,多元选择模型在处理大规模 数据集和复杂分类问题方面取得了新 的进展。
随着计算机技术的发展,多元选择模 型在20世纪80年代开始广泛应用于社 会科学和市场营销领域。
应用领域
多元选择模型适用于多级选择问 题,如高考成绩影响因素分析; 而Probit模型适用于二元选择问 题,如是否购买某商品。
与神经网络模型的比较
总结词
参数估计方法、假设条件、应用领域
参数估计方法
多元选择模型采用最大似然估计法,而神经网络模型采用 反向传播算法进行参数调整。
假设条件
多元选择模型假设因变量是二元的或多级的,且自变量与 因变量之间的关系是线性的;而神经网络模型不作此假设 ,能够处理复杂的非线性关系。
参数估计方法、假设条件、应 用领域
02 参数估计方法
多元选择模型采用最大似然估 计法,而Probit模型采用最大 似然估计法或最小二乘法。
03
假设条件
04
多元选择模型假设因变量是二元 的或多级的,且自变量与因变量 之间的关系是线性的;而Probit 模型假设因变量是二元且自变量 与因变量之间的关系是线性的。
《计量经济学》第三章-多元线性回归模型(1)
两边乘 X 有: X Y = X Xβˆ + X e
因为 Xe = 0 ,则正规方程为:
X Xβˆ = X Y
22
OLS估计式
由正规方程 多元回归中 二元回归中
X Xβˆ = X Y ( X X )kk 是满秩矩阵,其逆存在
βˆ = (X X)-1 X Y
ˆ1 Y - βˆ2 X2 - βˆ3X3
注意: x 和 y为 X,Y 的离差
23
二、OLS估计式的性质
OLS估计式
1.线性特征: βˆ = (X X)-1 X Y
βˆ 是 Y的线性函数,因 ( X X)-1 X 是非随机
或取固定值的矩阵
2.无偏特性: E(βˆk ) βk
24
3. 最小方差特性
在 βk 所有的线性无偏估计中,OLS估计 βˆk具有
E
u2
E
u2
0
un
E
un
0
假设2&3:
Var(U ) E(U EU)(U EU) E(UU )
E(u1u1) E(u1u2 ) E(u1un ) 2 0 0
E
(u2u1
)
E(u2u2 )
E
(u2un
)
0
2
0
E
(unu1
)
E(unu2 )
E(unun )
求偏导,令其为0:
( ei2 )
ˆ j
0
20
即
-2 Yi - (ˆ1 ˆ2 X2i ˆ3X3i ... ˆki Xki ) 0
-2 X2i Yi - (ˆ1 ˆ2X2i ˆ3X3i ... ˆki Xki ) 0
ei 0 X2iei 0
多元选择模型
在有序因变量模型中,因变量的值仅仅反映排序, 因而对其数值及间隔并无特殊要求。
例:序列(1,2,3,4)等同于序列(1,10,30,100)
因变量必须是整数,可以利用EVIEWS的函数功能 做转换(@Round, @Floor, @Ceil)
假设残差项u服从标准正态分布或logit分布,则可得 排序选择模型的概率形式。每个Y的概率为:
3
(二)有序模型:观察到的因变量Y表示出按数值大 小(ordered)或重要性 (ranked)排序的分类结果:
例1:个人达到的教育水平分文盲、小学、初中、高中、
大学、研究生等 例2:考试成绩分优秀、良好、及格和不及格等;学生奖 学金等级; 例3:评价意见调查分非常不满意、不满意、一般、满意、 非常满意等 例4:住房选择:租房、小户型、大户型、别墅 例5:银行信誉等级
Pr(Yi 0 X i , i , ) Pr(Yi 1 ) Pr(X u 1 ) F ( 1 X i ) Pr(Yi 1 X i , i , ) Pr( 1 Yi 2 ) Pr( 1 X u 2 ) F ( 2 X i ) F ( 1 X i ) Pr(Yi M X i , i , ) Pr(Y M ) Pr(X u M ) 1 F ( M X i )
第十章 多元选择模型
(Multiple-choice models)
1
本章内容
一、无序多元选择模型 二、有序因变量模型(Ordered data) 三、计数模型(Count data)
2
一、基本概念
对于多元选择模型,可以根据因变量的性质分为有序选择模 型和无序选择模型两种类型。
计量经济学单方程多元线性计量经济模型
1.拟合优度的含义 模型是否能比较好地解释因果关系 2.几个概念
总离差平方和: TSS ( yi y)2 回归平方和: ESS ( yˆi y)2 残差平方和: RSS ( yi yˆi )2
◆ TSS RSS ESS
TSS = RSS + ESS ?
TSS ( yi y)2 [( yi yˆi ) ( yˆi y)]2 TSS RSS ESS 2 ( yi yˆi )( yˆi y)
en yn yˆn yn yˆn
残差平方和可表示为:
n
n
n
Q ee ei2 ( yi yˆi )2 [ yi (ˆ0 ˆ1xi )]2
i 1
i 1
i 1
如何评价回归方程的好坏呢:残差平方和最小!
为么不是残差和最小?
n
Q [ yi (ˆ0 ˆ1xi )]2 i 1
E(11)
Cov(U
)
E
(
2 1
)
E(12 ) E(22 )
E(1n ) E(2n )
E(n1) E(n2 ) E(nn )
11
Cov(U
)
E
2 1
12 22
1n
2n
E(UU
)
n1 n2 nn
③解释变量是确定性变量,解释变量之间不相关, 随机误差项与解释变量之间不相关
◆通用性:有无常数项及任意多个解释变量
y1
Y
y2 :yn
1
X
1
x11 x12
x21 x22
xk1 xk2
1 x1n x2n xkn
⑴通过正规方程组导出参数估计式
e Y Yˆ Y Yˆ e
多元选择模型课件
学习交流PPT
1
一、多元离散选择模型的经济背景
学习交流PPT
2
1、经济生活中的多元选择问题
• 一般的多元选择问题 • 排序选择问题
• 将选择对象按照某个准则排队,由决策者从中选择。 • 决策者对同一个选择对象的偏好程度。
• 嵌套选择问题
学习交流PPT
3
2、社会生活中的多元选择问题
• 一般的多元选择问题 • 排序选择问题 • 嵌套选择问题
• 三是考虑到不同方案之间的相关性的情况。
Multinomial Logit Model 多项式Logit模型 名义Logit模型
Conditional Logit Model 条件Logit模型
Nested Logit模型 嵌套模型
学习交流PPT
10
⒉多元名义Logit离散选择模型及其参数估计
e Xij P( yi j) J
2*** -0.2800 0.0727
3*
-0.1136 0.0660
4
-0.0856 0.0696
1
-0.1299 0.1084
2*
-0.0943 0.0552
3
-0.0337 0.0452
4*** -0.1578 0.0586
P值 0.4032 0.0118 0.0104 0.0006 0.0184 0.0001 0.0852 0.2184 0.2310 0.0877 0.4556 0.0071
eZl
L
eZl
l1
Jl
L
eXj
j1
ll1eZl
L Jl
l1
eXj
j1
lZl
学习交流PPT
25
计量经济学课件:第三章 多元线性回归模型
第三章 多元线性回归模型第一节 多元线性回归模型及基本假定问题:只有一个解释变量的线性回归模型能否满足分析经济问题的需要?简单线性回归模型的主要缺陷是:把被解释变量Y 看成是解释变量X 的函数是前提是,在其它条件不变的情况下,并且,所有其它影响Y 的因素都应与X 不相关,但这在实际情况中很难满足。
怎样在一元线性回归的基础上引入多元变量的回归? 看教科书第72—73页关于汽车销售量的影响因素的讨论。
一、多元线性回归模型的意义1、建立多元线性回归模型的意义,即一元线性回归模型的缺陷,多个主要影响因素的缺失对模型的不利影响。
在一元线性回归模型中,如果总体回归函数的设定是正确的,那么,根据样本数据得到的样本回归模型就应该有较好的拟合效果,这时,可决系数就应该较大。
相反,如果在模型设定时忽略了影响被解释变量的某些重要因素,拟合效果可能就会较差,此时可决系数会偏低,并且由于忽略了一些重要变量而对误差项的影响会加大,这时误差项会表现出一些违背假定的情况。
2、从一个解释变量到多个解释变量的演变。
一个生产函数的例子,一个商品需求函数的例子,(教材第74页)。
二、多元线性回归模型及其矩阵表示1、一般线性回归模型的数学表达式。
设 12233i ii k k ii Y XXXu ββββ=+++++i=1,2,3,…,n在模型表达式里,1β仍是截距项,它反映的是当所有解释变量取值为零时,被解释变量Y 的取值;j β(j=2,3,…,k )为斜率系数,它的经济含义:在其它变量不变的情况下,第j 个解释变量每变动一个单位,Y 平均增加(或减少)j β个单位,这就是所谓的运用边际分析法对多元变量意义下回归参数的解释。
因此,称j β为偏回归系数,它反映了第j 个解释变量对Y 的边际影响程度。
4、2、总体回归函数,即12233(|)i i i k ki E Y X X X X ββββ=++++3、样本回归函数,即12233ˆˆˆˆˆi i k k iY X X Xββββ=++++ 4、将n 个样本观测值代入上述表达式,可得到从形式上看,像似方程组的形式。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(d
i
ij
Pij ) X i
j 1,2, , J
n 2 ln L Pij (1( j l ) Pil ) X i X i j l i 1
1 1( j l ) 0
如果j l 如果j l
由对数似然函数最大化的一阶条件,利用Newton 迭代方法可以迅速地得到方程组的解,得到模型 的参数估计量。
• Logit模型计算的简便性是有条件的。即选择方案 是不相关的,具体包括:
–Uij=Vij+εij,εi是独立的; –Pi/Pk与其它选择方案的属性无关,与选择方案的个数 无关; –Pi关于其它选择方案属性的弹性是不变的,与i无关。
• 上述条件只有在选择方案的差异相同的情况下才 能得到满足。
• 在相关文献中有数学证明。
*代表的是90 %的显著性水 平, **代表的是95 %的显著性水 平, ***代表的是 99%的显著性 水平。
• 将模型的结果整理出来,并对每个解释变量进行分析。 • 例如:教育程度、家庭情况及现有收入对迁移目标的影响:
因变量 log(1/5)
教育程度 -0.2475**
家庭情况 -0.1299 -0.0943* -0.0337
• 一是研究选择某种方案的概率与决策者的特征变 量之间的关系;
• 二是研究选择某种方案的概率与决策者的特征变 量以及方案的特征变量之间的关系; • 三是考虑到不同方案之间的相关性的情况。
Multinomial Logit Model 多项式Logit模型 名义Logit模型
Conditional Logit Model 条件Logit模型
P( y i j )
e
J
X ij X ij
e
j 0
F (ij ) e
• 效用模型的解释变量中包括所有影响选择的因素, 既包括决策者所具有的属性,也包括备选方案所 具有的属性。 • 备选方案所具有的属性是随着方案的变化而变化 的。 • 决策者所具有的属性中一部分是随着方案的变化 而变化的,而一部分是不随着方案的变化而变化 的。 • 用Zij表示随着方案的变化而变化的那部分解释变 量,Wi表示不随着方案的变化而变化的那部分解 释变量。
一、多元离散选择模型的经济背景
1、经济生活中的多元选择问题
• 一般的多元选择问题
• 排序选择问题 – 将选择对象按照某个准则排队,由决策者从中 选择。 – 决策者对同一个选择对象的偏好程度。
• 嵌套选择问题
2、社会生活中的多元选择问题
• 一般的多元选择问题
• 排序选择问题 • 嵌套选择问题
二、一般多元离散选择Logit模型
• 调查样本,有效样本303份。 • 用SAS统计软件进行估计与分析。 • 首先将定义的全部变量放进模型中进行估计,并通过比较 各个变量的P值来考虑具体剔除哪些变量以及对哪些变量 考虑将其交互影响的效应放进模型中去。 • 小城镇、县级市、地级市、省级城市和超大城市依次取值 1、2、3、4、5。
迁移目标 小城镇 县级市 地级市 省级城市 超大城市
Jl
X j l
Pj l
e
Jl
X j l X j l
e
j 1
Pl
e Z l I l l
l 1
L
e Z l I l l
3、估计方法
• 两阶段最大似然法,是一种有限信息估计方法。 其具体步骤是:
– 在组内,作为一个简单的条件Logit模型,估计参数; – 计算每组的“内值”; – 将每组看成是一种选择方案,再进行简单的条件Logit 模型的估计,得到参数Γ和T的估计量。此时用到的贡 献变量是Zl和Il。
• 完全信息最大似然法。将对数似然函数写为:
ln L
ln ( P
i 1
n
jl
Pl ) i
四、排序多元离散选择模型
Multivariate Choice Model for Ordered Dada
ln L
d
i 1 j 1
n
J
ij ( X ij
Xi )
Xi
P X
j 1 ij
J
ij
n 2 ln L i 1
P (X
j 1 ij
J
ij
X i )( X ij X i )
• 由对数似然函数最大化的一阶条件,利用 Newton 迭代方法可以迅速地得到方程组的解, 得到模型的参数估计量。
⒈ 一般多元选择Logit模型的思路
• 如果决策者i在(J+1)项可供选择方案中选择了 第j项,那么其效用模型为:
U ij X ij ij
P(U ij U ik ) k 0,1,2, , J k j
如果(J+1)个随机误 差项互不相关,并且 服从Weibull分布 ij
三、嵌套多元离散选择模型
1、问题的提出
• (J+1)个不同的选择方案之间具有相关性,而且必 须考虑这种相关性,表现为模型随机误差项相关。
• 可行的思路是将(J+1)个选择方案分为L组,在 每组内部的选择方案之间不具有相关性,而组间 则具有相关性。 • 就是将条件Logit模型中隐含的齐次方差性条件放 松,允许方差在组间可以不同,但在组内仍然是 同方差的。 • 这样的模型被称为Nested Logit模型。
§9.2
离散被解释变量数据计量经济学 模型(二)— 多元选择模型 Models with Discrete Dependent Variables—Multiple Choice Model
一、多元离散选择模型的经济背景 二、一般多元离散选择Logit模型 三、嵌套多元离散选择模型 四、排序多元离散选择模型
另一种估计方法
• 可以计算得到相对于基准方案的对数概率比为:
ln( ln( Pij Pi 0 Pij Pik ) Xi j ) X i ( j k )
• 两点注意:
假设了原模型中(J+1)个随机误差项互不相关。 对估计结果的解释不同。
例题
• 农村异地转移劳动力的迁移目标研究。 • 被解释变量:迁移目标,即小城镇、县级市、地级市、省 级城市和超大城市,依次取值1、2、3、4、5。 • 解释变量:个人特征和目前所在地属性。连续变量包括受 教育程度、家庭规模、家庭内其他劳动力人数、家庭负担、 原有收入、现有收入,目前所在地属性中的所在地农村人 口、国内生产总值、城乡居民储蓄余额、粮食产量、中学 生在校人数、小学生在校人数等。离散变量包括性别、婚 姻状况、收入稳定与否,目前所在地所属级别与家乡所在 地所属级别等。 • 虽然作为被解释变量的城市规模本身是有序的,但是对于 农村劳动力来说,选择进入哪一个级别的城市,本身是无 序的,因此对于城市化迁移目标构造多元名义logit离散选 择模型。
现有收入 -0.00144* -0.00032** -0.00028**
log(2/5) -0.2800*** log(3/5) log(4/5) -0.1136* -0.0856
-0.1578*** -0.00030**
• 从教育程度来看,所有系数都是负值,教育程度越高的农 村劳动力越愿意进入规模较大的城市;从显著性水平来看, 相对于超大城市来说,县级市被选择的可能性最小,其次 是小城镇,然后是地级城市,而教育程度相似的农村劳动 力在省级城市与超大城市之间的选择没有明显的差异。 • 从家庭情况来看,所有系数都是负值,也就是说家庭情况 越好的农村劳动力越愿意进入规模较大的城市;从显著性 水平来看,相对于超大城市来说,省级城市最不容易被选 中,其次是县级市,而小城镇与地级市之间没有明显区 别。 • 从现有收入来看,所有系数都是负值,也就是说目前收入 越高的农村劳动力越愿意进入规模较大的城市;再从显著 性水平来看,所有系数都是显著的,这说明相对于任何级 别的城市而言,农村劳动力都更倾向于超大城市。
说明
• 在多元离散选择模型中,因为Probit模型需要对 多元正态分布的整体进行评价,所以它的应用受 到限制。
• 逻辑分布更适合于效用最大化时的分布选择,所 以应用最多的多元离散选择模型是Logit模型。 • Logit模型的似然函数能够快速可靠地收敛,当方 案或者决策个体数量较大时,计算比较简便。
1、Nested Logit模型
P( j , l ) Pjl e
L X j l Z l X j l Z l
表示对选择第l组产 生影响的变量
e
l 1 j Biblioteka 1Jl表示在第l组内对 选择第j种方案产 生影响的变量
X e j l e Zl Pjl Pj l Pl J L l X j l Zl e e j 1 l 1
频数 15 62 84 72 70
百分比 4.95 20.46 27.72 23.76 23.10
累计频数 15 77 161 233 303
累计百分比 4.95 25.41 53.14 76.90 100.00
• 由于得到了频数,可以采用“对数概率模型”进行估计。
• 最终模型的估计结果(部分)
变量 常数项 模型序号 系数估计 1 2** 3** 4*** 教育程度 1** 2*** 3* 4 家庭情况 1 2* 3 4*** 1.2137 2.7685 2.3962 3.6742 -0.2475 -0.2800 -0.1136 -0.0856 -0.1299 -0.0943 -0.0337 -0.1578 标准差 1.4518 1.0998 0.9351 1.0665 0.1050 0.0727 0.0660 0.0696 0.1084 0.0552 0.0452 0.0586 P值 0.4032 0.0118 0.0104 0.0006 0.0184 0.0001 0.0852 0.2184 0.2310 0.0877 0.4556 0.0071