计量经济学之虚拟变量
计量经济学导论:ch07 多元回归分析:虚拟变量

d j系数含义可解释为:保持其他因素不变,信用等级为j
级的城市和信用等级为零级的城市之间在MBR上的差异。 其中,j 1, 2,3, 4。
问题:两种估计方法中,哪种方法更优?
16
例7.7 相貌吸引力对工资的影响
在劳动力市场中,除了存在性别歧视之外,还 可能存在相貌、身高等歧视。如果将样本相貌 分为三类:一般水平、低于一般水平、高于一 般水平,并以一般水平组作为基组,分别对男 人、女人估计方程得:
y = b0 + d0d + b1x + u
This can be interpreted as an intercept shift
If d = 0, then y = b0 + b1x + u If d = 1, then y = (b0 + d0) + b1x + u
The case of d = 0 is the base/benchmark group
虚拟变量与非虚拟变量之间也有交互作用,使 得出现不同的斜率。
female 0,男性组截距是b0,受教育的斜率是b1; female 1,女性组的截距是b0 d0,受教育的斜率是b1 d1。
24
25
我们关心的两个假设: ➢ 男性和女性受教育的回报是相同的。
H0:d1 0
➢ 受教育水平相同的男性和女性的平均工资相同。
将式7.13中的调整R 平方与把排名作为一个单独变量得到
的调整R 平方比较,前者是0.905,后者是0.836。所以,式
7.13 增加了回归的灵活性。 另外,式 7.13中所有其他变量都变得不显著了,联合显著性
【精品】计量经济学实验报告(虚拟变量)

【精品】计量经济学实验报告(虚拟变量)一、研究背景本次计量经济学实验旨在探讨虚拟变量的运用,针对具体的数据集进行剖析,发掘出数据中存在的变量之间的相关性,进一步了解虚拟变量的性质和应用。
二、研究数据与模型本次实验所使用的数据主要来自于美国地区居民的生活经历与工作情况。
我们采用了线性回归模型来建立数据之间的相关性。
其中,自变量包括:年龄、性别、收入、婚姻状态、教育程度、是否有孩子和是否居住在城市;因变量为每周工作时间。
首先,我们运用SPSS对数据进行了初步的分析。
结果显示,数据存在了年龄、性别、收入、婚姻状态、教育程度、是否有孩子和是否居住在城市等多个变量。
其中,包括了虚拟变量。
我们选取了其中一个虚拟变量进行研究,即“是否有孩子”。
在该变量中,响应值为“是”、“否”,我们将其转换为虚拟变量,即0表示没有孩子,1表示有孩子。
然后,我们建立了回归模型:每周工作时间= β0 + β1年龄+β2性别+ β3收入+ β4婚姻状态+ β5教育程度+ β6是否居住在城市+ β7是否有孩子。
最后,我们选取了样本数据中的500个数据进行模型拟合,其中250条数据表示没有孩子,250条数据表示有孩子。
三、实验结果通过数据分析软件的运算,我们得出了模型拟合的结果。
模型拟合结果如下:从结果中我们可以看出,虚拟变量“是否有孩子”对于每周工作时间的影响显著,其系数为2.01,t值为4.8,显著性水平为0.01,说明儿童数量对于家长的工作时间有显著的影响。
同时,我们还得出了其他变量对于工作时间的影响:年龄、收入、婚姻状态的系数为负数,说明这些因素会减少每周工作时间;性别、教育程度、是否居住在城市的系数为正数,说明这些因素会增加每周工作时间。
四、结论通过本次实验,我们可以得出以下结论:1.虚拟变量是计量经济学中常见的方法之一,在处理定量变量与定性变量时能够有效的将其转换为数值变量。
2.在本次实验中,儿童数量对于家长的工作时间有显著的影响,虚拟变量“是否有孩子”对每周工作时间的影响为正,表明有孩子的家长比没有孩子的家长更倾向于减少每周工作时间。
计量经济学第5章 虚拟变量模型

在经济计量模型中除了有量的因素外还有质的因 素,质的因素包括被解释变量为质的因素和解释变量 为质的因素。如果被解释变量为质的因素,主要是逻 辑回归要涉及的内容。本章就解释变量和被解释变量 为质的因素也就是存在虚拟解释变量和虚拟被解释变 量时如何进行参数估计等一系列问题进行讨论。
1
为基础类型截距项。
12
三、虚拟变量的作用 ⑴ 可以描述和测量定性因素的影响。
⑵ 能够正确反映经济变量之间的相互关系,提 高模型的精度。
⑶ 便于处理异常数据。
即将异常数据作为一个特殊的定性因素
1 , 异常时期
D
0
,
正常时期
13
第二节 虚拟解释变量模型
一 、截距变动模型(加法模型)
虚拟变量与其它变量相加,以加法形式引入模
Y i 0 1 D 1 i 2 D 2 i 3 X i u i
Y i ------年支出医疗保健费用支出 X i ------居民年可支配收入
18
1 , 高中
D 1i
0
,
其他
1 , 大学
D 2i
0
,
其他
于是:小学教育程度:
E (Y i X i,D 1 i 0 ,D 2 i 0 )03 X i
7
二、虚拟变量的设置规则
虚拟解释变量模型的设定因为质的因素的多少 和这些因素特征的多少而引入的虚拟变量也会不同。
以一个最简单的虚拟变量模型为例,如果只包 含一个质的因素,而且这个因素仅有两个特征,则 回归模型中只需引入一个虚拟变量。如果是含有多 个质的因素, 自然要引入多个虚拟变量。
8
如果只有一个质的因素,且该质的因素具有 m 个 相互排斥的特征(或类型、属性),那么在含有截距 项的模型中,只能引入 m-1 个虚拟变量,否则会陷入 所谓“虚拟变量陷阱”(dummy variable trap),产 生 完全的多重共线性,会使最小二乘法无解;在不含有 截距项的模型中, 引入 m 个虚拟变量不会导致完全 的多重共线性,不过这时虚拟变量参数的估计结果, 实际上是 D = 1 时的样本均值。
金融计量经济第五讲虚拟变量模型和Probit、Logit模型

原始模型:
YX (5.8)
• 其中Y为观测值取1和0的虚拟被解释变量,X为 解释变量。
• 模型的样本形式: yi Xii
(5.9)
• 因为E(i)0
,E所(y以i)Xi
• 令: p i P ( y i 1 ) 1 p i P ( y i 0 )
• 于是有: E ( y i) 1 P ( y i 1 ) 0 P ( y i 0 ) p i
其它季度
1, 三季度
D3
0,
其它季度
• 小心“虚拟变量陷阱”!
精品课件
三、虚拟变量的应用
• 1、在常数项引入虚拟变量,改变截距。
y i0D 1 x 1 i kx k iu i (5.1)
• 对上式作OLS,得到参数估计值和回归模型:
y ˆiˆ0ˆD ˆ1 x 1 i ˆkx ki(5.2)
金融计量经济第五讲
虚拟变量模型和Probit、Logit模 型
精品课件
第一节 虚拟变量的一般应用
一、虚拟变量及其作用 1.定义:取值为0和1的人工变量,表示非量化
(定性)因素对模型的影响,一般用符号D表 示。例如:政策因素、地区因素、心理因素、 季节因素等。 2.作用: ⑴描述和测量定性因素的影响; ⑵正确反映经济变量之间的相互关系,提高模型 的精度; ⑶便于处理异常数据。
yˆt ˆ ˆxt yˆt ˆ ˆxt ˆ2 yˆt ˆ ˆxt ˆ3 yˆt ˆ ˆxt ˆ4
精品课件
一季度 二季度 三季度 四季度
例题:美国制造业的利润—销售额行为
• 模型:利 t 1 润 2 D 2 t 3 D 3 t 4 D 4 t ( 销 ) t u t售
0.503543 0.500354 1.13E+03 1.99E+09 -13241.74 1.648066
计量经济学虚拟变量

在实际分析当中,根据T检验的结 果,将不显著的季度虚拟变量从模型 中消除,用剩下的显著的虚拟变量对 模型进行估算就足够。
(2), 没有常数项的时候,可以设第4季 度的季度虚拟。
Yi 1D1 2D2 3D3 4D4 ui
(3),虚拟变量的陷阱
Yi a 1D1 2D2 3D3 4D4 ui
2,存在结果性变化。 3,需要对难以量化的数据进行处理。
• 计量经济中的虚拟变量,在明确其引入理 由基础上,被用于很多的多元回归模型。
二,虚拟变量的类型
1,临时虚拟
临时虚拟,也称为突发性虚拟。为了更好的对模型进行估算,经常需 要在回归模型中排除一些由突发性事件产生的异常值(outlier),及其对 模型的影响,例如战争,地震,内乱,罢工等。
• 第一季度到第四季度的常数项为:
第一季度:a 1
Yi (a 1) X i ui
第三季度:a 3
Yi (a 3 ) X i ui
第四季度: a
Yi a X i ui
• 现在第四季度是基准,分别表示第 四季度与各季度之差。
数虚拟变量和常数虚拟变量。
Yi a 1X i 2D ui
1 异常时期 D=
0 平时
Yi a 1Xi 2D1 3D2 ui
1
D1= 0
发生地震的年份 其他年份
1
D2= 0
发生水灾的年份 其他年份
2,定性数据的虚拟处理
学历,性别,人种等定性的差异
3,季度虚拟
(1),定义:季度虚拟是通过回归模型的常 数项的变化(斜率回归系数一定)来掌握 季度和月度等季节变化,因此,从技术角 度成为“常数项虚拟”。
这种“量化”通常是通过引入“虚拟变量” 来完成。根据这些因素的属性类型,构造只取 “0”或“1”的人工变量,通常称为虚拟变量 (dummy variables),记为D。
计量经济学课件虚拟变量

通过引入虚拟变量,可以更准确地刻画经济现象的非线性特征,从而提高计量经济学模型 的精度和预测能力。
拓展应用领域
虚拟变量的引入使得计量经济学模型能够应用于更多的领域,如金融、环境、社会等,进 一步拓展了计量经济学的应用范围。
未来研究方向和趋势
深入研究虚拟变量的理论 和方法
未来研究将进一步深入探讨虚 拟变量的理论和方法,包括虚 拟变量的选择、设定和估计方 法等,以更准确地刻画经济现 象。
https://
未来研究将积极推动虚拟变量 在交叉学科领域的应用,如环 境经济学、金融经济学等,以 促进不同学科之间的交流和合 作。
WENKU DESIGN
WENKU DESIGN
2023-2026
END
THANKS
感谢观看
KEEP VIEW
WENKU DESIGN
WENKU DESIGN
WENKU
REPORTING
要点二
虚拟变量的设置原则
在设置虚拟变量时,需要遵循完备性 和互斥性的原则。完备性要求虚拟变 量的取值能够覆盖所有可能的情况, 而互斥性则要求不同虚拟变量之间不 能存在重叠或交叉的情况。
要点三
虚拟变量的回归系数 解释
在线性回归模型中,虚拟变量的回归 系数表示该定性因素对因变量的影响 程度。当虚拟变量取值为1时,其对 应的回归系数表示该水平与参照水平 相比对因变量的影响;当虚拟变量取 值为0时,则表示该水平对因变量没 有影响。
参数估计与假设检验
参数估计
采用最小二乘法等估计方法,对引入虚拟变量后的模型进行参数估计,得到各 解释变量的系数估计值。
假设检验
根据研究问题和假设,构建相应的原假设和备择假设,通过t检验、F检验等方 法对参数进行假设检验,判断虚拟变量对模型的影响是否显著。
虚拟变量(中级计量经济学总结(四川大学,杨可扬)

虚拟变量(Wooldridge chapter 7 ,13and Gujarati chapter 9)本章所有内容都赋予一个统一的例题来总结:0121234 *** wage female married educ female married female educ married educ ub d d b b b b =+++ ++++ 显然本例是在研究性别、婚姻状况、教育状况同收入之间的 关系问题。
一,单个虚拟变量01 wage female ub d =++ 0 01(|0) (|1) E wage female E wage female b b d == ==+ 也就是说,男性的平均工资为 0 b ,而女性的平均工资为 01 b d + 。
检验 这两组平均工资是否显著不同只需检验 female 是否显著。
如果female 显著且 1ˆ d <0 则说明存在性别歧视。
这也是典型的用虚拟变量 来标志截距的不同。
换成对数——水平形式: 01 log() wage female u b d =++ 则男女之间工资 的百分比差异为: 1 100*[exp()1]d - 以下作一个简单的证明,表明以上公式不仅适用于虚拟变量:111011 101 101 10 1010log() log()log() log(/) / 1 %*100(1)*100 y x u y y y y y y e y y e y y y y e y bb b b b b b =++ -= = = - =- - D ==- 二,双个虚拟变量及其交互012 wage female married ub d d =+++ 02 012 (|0,) (|1,) E wage female married married E wage female married marriedb d b d d ==+ ==++ 因此 1 d 表示在给定婚姻状况条件下, 男女的工资差异。
计量经济学之虚拟变量

一、虚拟变量 为什么要引入“虚拟变量” ??
许多经济变量是可以定量度量的或者说是可以直接观测的 如商品需求量、价格、收入、产量等
但是也有一些影响经济变量的因素无法定量度量或者说无法直接观测 如职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节
对某些产品(如冷饮)销售的影响等。
为了能够在模型中反映这些因素的影响,并提高模型的精度,需要将 它们人为地“量化”,这种“量化”通常是通过引入“虚拟变量”来完成的。
这种用两个相异数字来表示对被解释变量有重要影响而自身又没有观测数值的一 类变量,称为虚拟变量。
虚拟变量的特点是:
1.虚拟变量是对经济变化有重要影响的不可测变量。 2.虚拟变量是赋值变量,一般根据这些因素的属性类型,构造只取 “0”或“1” 的人工变量,通常称为虚拟变量,记为D。这是为了便于计算而把定性因素这样数量 化的,所以虚拟变量的数值只表示变量的性质而不表示变量的数值。
则进口消费品的回归模型可建立如下:
Yt
0
1 X t
2(Xt
X
* t
)
Dt
t
转折期回归示意图
4. 虚拟变量交互效应分析
当分析解释变量对变量的影响时,大多数情形只是分析了解释变量自身变动对被 解释变量的影响作用,而没有深入分析解释变量间的相互作用对被解释变量影响。
前面讨论的分析两个定性变量对被解释变量影响的虚拟变量模型中,暗含着一个假定:
冷饮的销售额与季节因素的关系
如果只取六个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则其中
1 X11 L 1 X12 L
1 ( X D) 1
X 13 X 14
计量经济学第九章虚拟变量

虚拟变量的类型
季节虚拟变量
用于反映季节变动对经济活动的影响。
政策虚拟变量
用于反映某项政策实施前后对经济活 动的不同影响。
地区虚拟变量
用于反映不同地区之间经济活动的差 异。
行业虚拟变量
用于反映不同行业之间经济活动的差 异。
虚拟变量的引入原因
解决遗漏变量问题
01
当某些重要变量无法直接观测或获取时,可以通过引入虚拟变
在模型中引入虚拟变量与解释变量的交互项,通过 改变斜率的值来反映不同组别之间的差异。
斜率变动模型的应用
适用于研究不同组别之间在某一解释变量上 的边际效应差异,如不同教育水平对收入的 影响等。
含有多个虚拟变量的模型
含有多个虚拟变量的模型的定义
当模型中引入多个虚拟变量时,称为含有多个虚拟变量的模型。
含有多个虚拟变量的模型的设定
VS
使用计算变量功能
可以使用SPSS的计算变量功能手动创建虚 拟变量。在数据视图中,点击“转换”菜 单下的“计算变量”选项。在弹出的对话 框中,输入虚拟变量的名称和标签,并在 计算表达式中输入相应的逻辑表达式。例 如,对于分类变量`industry`,可以使用如 下表达式生成虚拟变量
SPSS中实现虚拟变量的方法
截距变动模型的设
定
在模型中引入虚拟变量,通过改 变截距项的值来反映不同组别之 间的差异。
截距变动模型的应
用
适用于研究不同组别之间在某一 解释变量上的平均差异,如不同 性别、不同地区等。
斜率变动模型
斜率变动模型的定义
当虚拟变量不仅影响模型的截距项,还影响 解释变量的斜率时,称为斜率变动模型。
斜率变动模型的设定
通过比较政策虚拟变量的系数,可以分析 出政策变动对市场需求的影响程度。
第五章虚拟变量-第八章虚拟变量

1
问题的提出
1、计量经济学模型,需要经常考虑属性因素 的影响。例如,职业、战争与和平、繁荣与 萧条、文化程度、灾害、季节 2、属性因素往往很难直接度量它们的大小。 只能给出它们的“Yes—D=1”或”No—D=0”、 或者它们的程度或等级。 3、为了反映属性因素和提高模型的精度, 必须将属性因素“量化”。通过构造0-1型 的人工变量来量化属性因素。
入虚拟变量? (2)如果认为季节因素使利润对销售额的变化额发生变异,
应如何引入虚拟变量?
33
(3)如果认为上述二种情况都存在,又应如何引 入虚拟变量?
请对上述三种情况分别设定利润模型。
34
树立质量法制观念、提高全员质量意 识。20.10.1620.10.16F riday, October 16, 2020 人生得意须尽欢,莫使金樽空对月。02:54:4202:54: 4202:5410/16/2020 2:54:42 AM 安全象只弓,不拉它就松,要想保安 全,常 把弓弦 绷。20.10.1602:54:4202:54O ct-2016-Oct-20 加强交通建设管理,确保工程建设质 量。02: 54:4202:54:4202:54F riday, October 16, 2020 安全在于心细,事故出在麻痹。20.10.1620.10.1602: 54:4202:54:42October 16, 2020 踏实肯干,努力奋斗。2020年10月16日上午2时54分 20.10.1620.10.16 追求至善凭技术开拓市场,凭管理增 创效益 ,凭服 务树立 形象。2020年10月16日星期 五上午2时54分 42秒02:54:4220.10.16 严格把控质量关,让生产更加有保障 。2020年10月 上午2时 54分20.10.1602:54O ctober 16, 2020 作业标准记得牢,驾轻就熟除烦恼。2020年10月16日星期 五2时54分42秒 02:54: 4216 October 2020 好的事情马上就会到来,一切都是最 好的安 排。上 午2时54分42秒 上午2时54分02:54:4220.10.16 一马当先,全员举绩,梅开二度,业 绩保底 。20.10.1620.10.1602: 5402:54:4202: 54:42Oct-20 牢记安全之责,善谋安全之策,力务 安全之 实。2020年10月16日 星期五2时54分 42秒Fr iday, October 16, 2020 相信相信得力量。20.10.162020年10月 16日星 期五2时54分42秒20.10.16
计量经济学实验报告虚拟变量

实验三:虚拟变量模型一、研究的目的与要求根据下表2009年我国城镇居民人均收入与住房方面消费性支出的统计资料建立我国城镇居民住房方面消费性支出函数。
二、模型设立1、问题描述:2009年我国城镇居民人均收入对住房方面消费性支出的影响。
2、数据:我国城镇居民家庭抽样调查资料项 目 住房平均每人全部年收入 (元)D 困难户 0 最低收入户 0 低收入户 0 中等偏下户 0 中等收入户 0 中等偏上户 1 高收入户 1 最高收入户1三、相关图分析;1. 键入命令:SCAT X Y ,则人均收入与住房方面消费性支出的相关散点图如下图所示。
从相关图可以看出,前5个样本点(即中低收入家庭)与后3个样本点(中、高收入)的消费性支出存在较大差异,因此,为了反映“收入层次”这一定性因素的影响,设置虚拟变量如下:10D ⎧=⎨⎩ 中等偏高及高收入家庭 中、低收入家庭2. 构造虚拟变量。
使用SMPL和GENR命令直接定义。
DATA D1GENR XD=X*D13. 估计虚拟变量模型:再由t检验值判断虚拟变量的引入方式,并写出各类家庭的消费性支出函数。
虚拟变量模型的估计结果如下:Dependent Variable: YMethod: Least SquaresDate: 01/03/12 Time: 15:25Sample: 2001 2008Included observations: 8Variable Coefficient Std. Error t-Statistic Prob.??XD1XDCR-squared????Mean dependent var Adjusted R-squared????. dependent var. of regression????Akaike info criterion Sum squared resid????Schwarz criterion Log likelihood????F-statisticDurbin-Watson stat????Prob(F-statistic)我国城镇居民住房方面消费性支出函数的估计结果为:ˆ19.002880.016400327.11850.018709i i i i yx D XD =-+-+ =t (2R = 2R = F = =虚拟变量的回归系数的t 检验都是显着的,且模型的拟合优度很高,说明我国城镇居民中低收入家庭与中等偏高及高收入家庭对住房的消费性支出,在截距和斜率上都存在着明显差异,所以以加法和乘法方式引入虚拟变量是合理的。
计量经济学虚拟变量模型

例如,比较收入时考察性别的作用。当研究男性
收入是否高于女性时,是将女性作为比较的基础
(参照物),故有男性为“1”,女性为“0”。
例1
(1)
D
=
教育水平考虑三个层次:高中以下, 高中, 大学及其以上
这时需要引入两个虚拟变量:
1 高中 1 大学及
D 1 0 其他 D 2 0
其他
3、虚拟变量的设置原则
虚拟变量的个数须按以下原则确定:
模型中有截距项时,每一定性变量所需的虚拟变 量个数要比该定性变量的类别数少1,即如果有m个 定性变量,只在模型中引入m-1个虚拟变量。
虚拟解释变量的应用
➢ 结构变化分析 ➢ 交互效应分析 ➢ 分段回归分析
1、结构变化分析
结构变化的实质是检验所设定的模型在样本期内 是否为同一模型。以下的平行回归、共点回归、不 同的回归三个模型均不是同一模型。 平行回归模型的假定是斜率保持不变(加法类 型); 共点回归模型的假定是截距保持不变(乘法类 型); 相异回归模型的假定是截距、斜率均为变动的 (加法、乘法类型的组合)。
第六章 虚拟变量模型
男女大学生消费真有差异吗?
男女生在消费上存在差异。为了了解男、 女生的消费支出结构差异,应当如何建 立模型? 面临的问题:如何把男女生这样的非数 量变量引方程?
问题的一般性描述
在实际建模中,一些定性变量具有不可忽视的重要 影响。例如,研究某个企业的销售水平,产业属性 (制造业、零售业)、所有制(私营、非私营)、 地理位置(东、中、西部)、管理者的素质、不同 的收入水平等是值得考虑的重要影响因素,但这些 因素共同的特征是定性描述的。 如何对非定量因素进行回归分析?
计量经济学讲义04虚拟变量

虚拟变量(dummy variable)在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。
例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质不同等因素的影响。
这些因素也应该包括在模型中。
由于定性变量通常表示的是某种特征的有和无,所以量化方法可采用取值为1或0。
这种变量称作虚拟变量,用D表示。
虚拟变量应用于模型中,对其回归系数的估计与检验方法与定量变量相同。
1.截距移动设有模型,y= β0 + β1 x t + β2D + u t ,t其中y t,x t为定量变量;D为定性变量。
当D = 0 或1时,上述模型可表达为,β0 + β1x t + u t , (D = 0) y t D = 1 y t = β0+β2 D = 0(β0 + β2) + β1x t + u t , (D = 1) β0x t D = 1或0表示某种特征的有无。
反映在数学上是截距不同的两个函数。
若β显2著不为零,说明截距不同;若β2为零,说明这种分类无显著性差异。
例:中国成年人体重y(kg)与身高x(cm)的回归关系如下:–105 + x D = 1 (男)y = - 100 + x - 5D =– 100 + x D = 0 (女)注意:①若定性变量含有m个类别,应引入m-1个虚拟变量,否则会导致多重共线性,称作虚拟变量陷阱(dummy variable trap)。
②关于定性变量中的哪个类别取0,哪个类别取1,是任意的,不影响检验结果。
③定性变量中取值为0所对应的类别称作基础类别(base category)。
④对于多于两个类别的定性变量可采用设一个虚拟变量而对不同类别采取赋值不同的方法处理。
如:1 (大学)D = 0 (中学)-1 (小学)。
2.斜率变化以上只考虑定性变量影响截距,未考虑影响斜率,即回归系数的变化。
当需要考虑时,可建立如下模型:y= β0 + β1 x t + β2 D+ β3 x t D + u t ,t其中x t为定量变量;D为定性变量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
前面讨论的分析两个定性变量对被解释变量影响的虚拟变量模型中,暗含着一个假定:
两个定性变量是分别独立地影响被解释变量的 但是在实际经济活动中,两个定性变量对被解释变量的影响可能存在一定的交互作 用,即一个解释变量的边际效应有时可能要依赖于另一个解释变量。 为描述这种交互作用,可以把两个虚拟变量的乘积以加法形式引入模型。
: 一个以性别为虚拟变量来考察职工薪金的模型如下:
Yi 0 1 X i 2 Di i
Yi Xi Di =1 ——代表男性 ——为职工的薪金;
——为职工工龄; Di =0 ——代表女性
三、虚拟变量的引入
虚拟变量作为解释变量引入模型有两种基本方式:加法方式和乘法方式。 1. 加法方式
为了能够在模型中反映这些因素的影响,并提高模型的精度,需要将 它们人为地“量化”,这种“量化”通常是通过引入“虚拟变量”来完成的。
这种用两个相异数字来表示对被解释变量有重要影响而自身又没有观测数值的一 类变量,称为虚拟变量。
虚拟变量的特点是:
1.虚拟变量是对经济变化有重要影响的不可测变量。 2.虚拟变量是赋值变量,一般根据这些因素的属性类型,构造只取 “0”或 “1”的人工变量,通常称为虚拟变量,记为D。这是为了便于计算而把定性因素这样 数量化的,所以虚拟变量的数值只表示变量的性质而不表示变量的数值。 一般的,基础类型和肯定类型取值为1;比较类型和否定类型 取值为0。
D1i 0 1 X i 2 D2i i
D1i=
1 0
第i个人是有车者 第i个人是无车者
D2i=
1
0
第i个是白领职业
其它
两大模型:线性概率模型和Logit模型
一、线性概率模型(LPM) 1.什么是线性概率模型(前面所述的是否购买小汽车的模型就属于一个 LPM) 2.线性概率模型的估计:由于直接采用OLS法对模型进行估计,将会遇到一 些特殊的问题,使得估计结果失去了合理的经济解释,因而需要寻求相应的处理方法。 (1) 随机扰动项μi的非正态性 1-β0-β1 Xi 当Yi=1时 当Yi=0时
2. 乘法方式 ——斜率的变化
根据消费理论,消费水平C主要取决于收入水平X。但在一个较长的时期,人 们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往 出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。
设
Dt=
则消费模型可建立如下:
1 0
正常年份 反常年份
Ct 0 1 X t 2 Dt X t t
这时,可以t*=1979为转折期,以1979年的国民收入Xt*为临界值,设如下虚拟变量:
Dt=
1 0
t≥t* t < t*
则进口消费品的回归模型可建立如下:
Yt 0 1 X t 2 ( X t X t* )Dt t
转折期回归示意图
4. 虚拟变量交互效应分析
当分析解释变量对变量的影响时,大多数情形只是分析了解释变量自身变动对被 解释变量的影响作用,而没有深入分析解释变量间的相互作用对被解释变量影响。
Yi=α0+α1D1i+α2D2i+α3(D1iD2i)+βXi +μi
α1为是否发展油菜籽生产对农副产品生产总收益的截距差异系数; α2为是否发展养蜂生产对农副产品生产总收益的截距差异系数; α3为同时发展油菜籽生产和养蜂生产时对农副产品生产总收益的交互效应系数。 α0 ~ α3组成截距水平。
四、虚拟变量的设置原则例如:Leabharlann 1)表示性别的虚拟变量可取为
D1=
1 0
男性 女性
2)表示文化程度的虚拟变量可取为 D2=
1
0
本科及以上学历
本科以下学历
3)表示地区的虚拟变量可取为
D3=
1 0
城市 农村
二、虚拟变量模型
同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型。 在模型中,虚拟变量可作为解释变量,也可作为被解释变量,但主要 是用作解释变量。 例如
Yt 0 1Dt 1 X t 2 ( Dt X t ) t
其中,Y为储蓄,X为收入,Dt为虚拟变量
Y
改革开放以后 改革开放以前
X
改革开放前后储蓄函数示意图
3.临界指标的虚拟变量的引入
在经济发生转折时,可通过建立临界指标的虚拟变量模型来反映。
进口消费品数量Y主要取决于国民收入X的多少,中国在改革开放前后,Y对X的回归关系明显不同。
(X
第二节
虚拟被解释变量
当虚拟变量作为被解释变量时,其作用是对某一经济现象或活动进行“是” 与“否”的判断或决策。
研究是否购买商品住房、是否参加人寿或财产保险、是否能按期偿还贷款、 新产品在市场上是否畅销、对某一改革措施所持的态度等。 某些人有汽车,而其他人没有。假定这种所有权函数的决定因素是收入和职业, 则可设定模型为:
上述职工薪金模型(8-1)中性别虚拟变量的引入就采取了加法方式,
在该模型中,如果仍假定
女职工的平均薪金为:
E i =0,则
E Yi X i , Di 0 0 1 X i
男职工的平均薪金为:
E Yi X i , Di 1 0 2 1 X i
每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1, 即如果定性变量有m个类别,则只在模型中引入m-1个虚拟变量。
Yt 0 1 X1t … k X kt 1D1t 2 D2t 3 D3t 4 D4t t
冷饮的销售额与季节因素的关系
Y (X
D)
如果只取六个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则其中
1 1 1 D) 1 1 1 X 11 X 12 X 13 X 14 X 15 X 16 X k1 Xk2 X k3 Xk4 X k5 Xk6 1 0 0 0 1 0 0 1 0 0 0 1 0 0 1 0 0 0 0 0 0 1 0 0
这里,虚拟变量 Dt 以与 Xt 相乘的方式引入了模型中,从而可用来 考察消费倾向的变化。
正常年份:
E(Ct X t , Dt 1) 0 (1 2 ) X t
反常年份:
E(Ct X t , Dt 0) 0 1 X t
不同年份消费倾向示意图
如果在模型中同时使用加法和乘法两种方式引入虚拟变量,则回归线的截距和斜率都会改变。 例如: 对于改革开放前后储蓄-收入模型,可设定为