第五章:回归模型的函数形式与变量类型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(4)做 Y 对 X 和 Z1i 的回归 如果根据 t 检验 Z1i 的系数是统计显著的,则拒绝 H0
Y ) Y (5)求 Z 2i anti log(ln i i
(6)做 LnY 对 X 或 LogX 和 Z2i 的回归 如果 Z2i 的系数是统计显著的,则拒绝 H1
2. 半对数模型:如何测度增长率
在线性模型和对数线性模型之间选择:MWD检验
零假设H0:线性模型:Y是X的线性函数。
备择假设H1:对数线性模型:LnY是X或LnX的线性函数。
MWD检验步骤如下:
(1)估计线性模型,得到 Y的估计值
Y i
Y (2)估计线性对数模型,得到 LnY 的估计值 ln i
(3)求
(ln Y) Z1i ln Y i i
再假设 Y*与 Xi 之间存在如下线性关系:
Logistic分布
Y* Xi i
P(Yi 1| X i ) P( X i i 0)
P( i X i ) F ( X i ) 1 i 1 e
e P t Xi 1 e
2
概率函数
(Yi 0 1 X i )2
L( 0 , 1 , 2 ) P(Y1 , Y2 ,Yn )
1 (2 )
n 2
e
2 ( Y X ) i 0 1 i 2 2
1
似然函数
1 L ln L n ln( 2 ) 2 (Yi 0 1 X i ) 2 2
二、非线性模型的特殊含义与应用
虽然某些非线性模型对于我们估计来说存在一
定的困难,但结合实际经济活动,它们往往有着
特殊的含义和重要的应用。
弹性模型
1. 双对数模型:如何度量弹性
Yi AX i
dY Y dX X
拓展:多元对数线性回归模型
ln Yi 0 1 ln X1i 2 ln X 2i i
• 虚拟变量的性质; • 虚拟变量的设定规则; • 虚拟变量的引入方式; • 参数邹检验; • 被解释变量的类型; • 线性概率模型初步; • 极大似然估计法原理。
一、虚拟变量的性质
• 常见定量变量:收入、产出、成本、价格、重量、 温度等 • 常见定性变量:性别、种族、肤色、宗教、民族、 婚姻、政团关系等
i 1 n n
xi
xi
)]
似然函数
ln[ L( )] [ yi ( xi ) ln(1 e
i 1
n
xi
)]
ln[ L( )] e [ yi ]0 xi 1 e i 1
n
xi
n ln[ L( )] e [ yi ]xi 0 xi 1 e i 1
测量。
以农民工是否愿意转移就业为例,构建如下回归
方程:
Yi X i ei
其中,Yi 是一个二分类变量, Xi 表示第 i 个农民
工年收入。如果第i个农民工转移,则 Yi =1,否则
Yi =0。
E(Yi | X i ) X i P(Yi 1| X i )
因变量为二分类变量的线性回归模型也被称为线性概率模型,LPM
一个重要应用:农业技术进步率的测量
Y Ae K L M
t
• 比较线性和双对数回归模型:究竟选择哪个模型呢?
• 规律之一:根据数据作图,依图趋势建模。
Y LnY
0
X
0
LnX
• 为什么不根据r2选择模型? 1.要比较两个模型r2值,因变量的形式必须相同; 2.根据r2定义,线性模型和双对数模型度量意义不同。
增长率模型
ln Yt 0 1t t
dY d ln Y 1 Y dt dt
增长率
3. 线性-对数模型
增长模型
Yt 0 1 ln X t t
dY dY 1 d ln X dX X
解释变量每百分比变动引起因变量的绝对变化量
三、非线性普通最小二乘法
*
如何用最大似然法估计Logistic回归模型的参数
假设有由 N 个案例构成的总体,Y1, Y2, …, YN。从中随
机抽取 n 个案例作为样本,观测值标注为 y1, y2, …, yn。设 pi=P( yi =1|xi ) 为给定 xi 的条件下得到结果 yi =1 的条件概率; 而在同样条件下得到结果 yi =0 的条件概率为 P( yi=0|xi)=1-pi。 于是,得到一个观测值的概率为 P( yi) = piyi(1-pi)1-yi
Y 1edu 2 exp 3 exp
2
一般地,关于解释变量的非线性问题都可以通
过变量置换变成线性问题。
2. 函数变换法
适用对象:幂函数模型、指数函数模型
如果是关于参数的非线性问题,变量置换法就无能为
力了,函数变换是常用的方法
Q AK L e
C ab e
法相同的结果。
与最小二乘法相比,最大似然估计法既可以用于线性模型, 也可以用于非线性模型估计。
由于Logistic回归是非线性模型,因此最大似然估计法是最
常用的模型估计方法。
Y 0 1 X
Yi N (0 1 X i , )
2
1 ຫໍສະໝຸດ Baidu(Yi ) e 2
1 2
E(Yi | X i ) X i P(Yi 1| X i ) P(Yi 0 | X i ) 1 P(Yi 1| X i ) 1 X i
假设有一个理论上存在的连续反应变量 Y* 代表事件发 生的可能性,其值域为负无穷到正无穷。当该变量的值跨 越一个临界值 C(如 C=0),便导致事件发生,则有: 当 Y*>0时,Yi=1,否则 Yi=0
应用举例与解释
主 效 应
交互项
交 互 效 应
虚拟变量引入交互项的重要应用:双重差分
Yit 0 1directit 2timeit (direct time)it 3 X it it
X 改革前(time=0): Yit 0 3 it
对照组(direct=0): X 改革后 (time=1) : Y Y 3 it it 0 2 it 2 双重差分
ln Yt 0 1t t
Q AK L e
Y ab X e
1 Y ab X
到目前为止,在所考虑的线性回归模型中, 解释变量都是数值变量或定量变量。但事实上有 些时候,解释变量可能是定性变量。
虚拟变量(Dummy Variables)
主要讲解内容
主 效 应
交互项
以性别和受教育程度为例
交 互 效 应
Y
一致回归
Y
平行回归
0
X
0 X
Y
Y
0
X
0
X
并行回归
相异回归
四、参数邹检验
Y H0:参数稳定
o
Xi
X
邹氏参数稳定性检验步骤:
首先,分别以两个连续的时间序列作为两个样本运用总 模型式进行回归,得到相应的残差平方和RSS1和RSS2;
然后,将两个序列并为一个大样本后运用总模型式进行
• 非线性普通最小二乘法及其应用。
一、模型的类型与变换
至今为止,我们都假设未知的总体回归线是线性的, 拟合优度检验及变量显著性检验也都是对函数形式的线性 检验。 然而,在实际经济活动中,经济变量的关系是复杂的, 直接表现为线性关系的情况并不多见。
1. 变量置换法
适用对象:倒数模型、多项式模型
1 Q ab P
0 定量化
具备或不具备某种性质
不具备某种性质
基准类
D
1
具备某种性质
二、虚拟变量的设定规则
一般原则:如果定性变量有 m 种分类,则 需要引入(m-1)个虚拟变量。 如果不符合该原则,则会陷入虚拟变量陷阱, 即完全共线性或多重共线性。
三、虚拟变量的引入方式
方式1:加法方式
以性别和受教育程度为例
方式2:乘法方式
Y f ( X1, X 2 ,, X k ; 0 , 1,, k )
一个参数为例
Yi f ( X i , ) i
) (Y f ( X , ))2 Q( i i
i 1 n
n ) dQ df ( Xi , ))( 2 (Yi f ( X i , )0 d d i 1
xi
非线性迭代求解
回归、一元、多元
计量基础
函数形式、变量类型、模型设定
自相关、异方差、多重共线和随机解释变量
方法论
理论拓展
回归模型的函数形式与变量类型
授课:梁海兵
参数线性,变量线性
现实问题:许多经济现象,参数线性/变量线 性回归模型并不适合!
参数线性,变量非线性
主要讲解内容
• 模型的类型与变换;
• 非线性模型的特殊含义与应用;
Q
3. 复杂函数模型与级数展开法
f ''(0) 2 f ( n ) (0) n Pn ( x) f (0) f '(0) x x x 2! n!
4. 无法线性化的模型
一般形式为: Y
非线性函数
f ( X1, X 2 ,, X k )
可线性函数
Y f ( X1, X 2 ,, X k )e
就业收入 就业时间
以研究劳动力市场就业 为例 就业意愿
就业种类
六、线性概率模型初步
当因变量是一个分类变量而不是一个连续变量
时,线性回归就不适用。 实际上,许多社会科学的观察都只是分类的而 不是连续的。如政治学中否选举某候选人、经济学 中是否签订一个合同、社会学中犯罪、逃学、迁移、
结婚、离婚、生育、患病等都可以按照分类变量来
L( ) pi yi (1 pi )(1 yi )
i 1
n
ln[ L( )] ln[ pi (1 pi )
yi i 1 n
n
(1 yi )
]
[ yi ln( pi ) (1 yi ) ln(1 pi )]
i 1 n
pi [ yi ln( ) ln(1 pi )] 1 pi i 1 e [ yi ( xi ) ln(1 )] xi 1 e i 1 [ yi ( xi ) ln(1 e
Yit
X 一重差分 改革前(time=0):Yit 0 1 3 it 直管组(direct=1):
Yit 2
X 改革后(time=1):Yit 0 1 2 3 it
五、被解释变量类型
Y 0 1 X1 2 X 2
) df ( Xi , ))( ( Y f ( X , )0 i i d i 1
n
非线性最小二乘法:应用举例
数学SAT分数函数 1975-2007美国人口增长率
墨西哥1955-1974生产函数 假设:消费收入的指数函数 假设:消费收入的倒数函数
Yi AX i
回归,得到大样本下的残差平方和RSSR; 最后,通过F统计量,在事先给定的显著性水平下进行假 设检验。 如果F大于相应的临界值,则拒绝原假设,认为发生了结
构变化,参数是非稳定的。
[ RSSR ( RSS1 RSS2 )] / (k 1) F F[k 1, n1 n2 2(k 1)] ( RSS1 RSS2 ) / [n1 n2 2(k 1)]
Xi
事件发生
e P t Xi 1 e
Xi
事件不发生
1 1 P t Xi 1 e P Xi i e 1 P i
P i ln( ) Xi 1 P i
七、最大似然估计
在线性回归模型估计未知总体参数时主要采用最小二乘法, 这一方法的原理是根据线性回归模型选择参数估计值,使因变 量的观测值与模型估计值之间的离差平方值为最小。而最大似 然估计法则是统计分析中另一常用模型参数估计方法。 在线性回归分析中,最大似然估计法可以得到与最小二乘