第八章虚拟变量回归new
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二节 虚拟变量的设定
一、虚拟变量的引入方式
(1)加法方式
Yi=a+bxi+αDi+εi
a+α
等价为:
当Di =0时:Yi=a+bxi+εi a 当Di =1时:Yi=(a+α)+bxi+εi
D=1
α D=0
以加法方式引入,反映定性因素对截距的影响
第八章虚拟变量回归new
(2)乘法方式
Yi=a+bxi+βXDi+εi
第八章虚拟变量回归new
利用t检重验第合判其(回断余1归D)情、检种况X验情都D结系况表果数下明:的模模显型型著结结性构构,是不得稳稳定到定四的。种, (1)a2=a1,b2=b1,两个回归模型没有显著差异。 (2)a2≠a1,b2=b1,两个回归模型之间的差异仅仅
表现在截距平上行。回归 (斜3)率a存2=a在1,显汇b著合2≠差回b异归1,。两个回归模型的截距相同,但 (4)a2≠a1,b2≠b1,表明两个回归模型完全不同。
相异回归
第八章虚拟变量回归new
三、分段回归 设虚拟变量为:
分段回归模型设置成:
x>x* x<x*
使用虚拟变量能如 实描述不同阶段的 经济关系,又未减 少估计模型时样本 容量,保证了估计
精度。
Yi= a+bxi+β(xi-x*)Di+εi
其中,x*是已知的临界水平(分段点)。
这样各段的函数为:
Yi= a +bxi+εi Yi= (a-β)+(b+β)xi+εi
用t检验判断α 、β是否显著的不等于零,进而确 定虚拟变量的具体引入方式。
【例】现有1998年我国城镇居民人均收入与彩 电每百户拥有量的统计资料。
第八章虚拟变量回归new
观察相关图
从相关图可以看出, 前3个样本点与后5个样 本点存在较大差异,因 此,可设置虚拟变量反 映“收入层次”:
中高收入家庭
低收入家庭
思考:若是多因素、多个属性水平的问题,如何设置?
第八章虚拟变量回归new
第三节 虚拟变量的特殊应用
一、调整季节波动
例如,用季度数据分析某公司利润y与销售 收入x之间的相互关系时,为研究四个季度的季 节性影响,引入三个虚拟变量(设第1季度为基 础类型):
第i+1季度
i=1,2,3
其他季度 利润函数可取为 :
1999
1987 11954.5 3073.3 835.7 2000
1988 14922.3 3801.5 728.2 2001
1989 16917.8 5146.9 1374.2 2002
1990 18598.4 7119.8 1923.4 2003
国民总收入 (GNI)
城乡居民人 民币储蓄存 款年底余额
第八章虚拟变量回归new
为比较两年的消费函数是否有显著差异,设置虚拟
变量:
1999年
1998年
并且合并两年的数据,估计以下模型:
Yi= a1 +b1xi+αDi+βXDi +εi 其中α=a2-a1 ,β=b2-b1。
第八章虚拟变量回归new
使用EViews软件的估计过程如下:
CREATE U 16
第八章虚拟变量回归new
为了研究1978—2003年期间城乡居民储蓄存款随收入的 变化规律是否有变化,考证城乡居民储蓄存款、国民总收 入随时间的变化情况,如下图所示:
第八章虚拟变量回归new
从上图中,尚无法得到居民的储蓄行为发生明显改变 的详尽信息。若取居民储蓄的增量( ),并作时序 图(见左下图):
第八章虚拟变量回归new
表8.1 国民总收入与居民储蓄存款
单位:亿元
城乡居民 城乡居民
城乡居民人 城 乡 居 民
年 份
国民总收 人民币储 入 蓄存款年
(GNI) 底余额
人民币储 蓄存款增 加额(
)
年 份
国民总收 入 (GNI)
民币储蓄存 款年底余额
()
人民币储 蓄存款增 额
()
百度文库
()
1978 3624.1 210.6
第八章虚拟变量回归new
第八章 虚拟变量回归
本章主要讨论:
●虚拟变量及其作用 ●虚拟变量设定 ●虚拟解释变量的回归 ●虚拟被解释变量的回归(选讲,不包括)
第八章虚拟变量回归new
第一节 虚拟变量及其作用
一、定义
反映品质指标变化、数值只取0和1的人工变量,
用符号D来表示。
如:
城镇居民
农村居民
销售旺季 销售淡季
表8.1 国民总收入与居民储蓄存款 (续) 单位:亿元
城乡居 城乡居
民人民 民人民
年 国民总收 币储蓄 币储蓄 年 份 入 (GNI) 存款年 存款增 份
底余额 加额
() ( )
1984 7206.7 1214.7 322.2 1997
1985 8989.1 1622.6 407.9 1998
1986 10201.4 2237.6 615
第八章虚拟变量回归 new
2020/11/27
第八章虚拟变量回归new
引子:男女大学生消费真有差异吗?
在对在校学生的消费行为进行的调查中,发现在校 生的消费行为呈现多元化的结构。人际交往消费、 手机类消费、衣着类消费、化妆品类消费、电脑类 消费、旅游类消费占有较大的比例;而食品类消费、 学习用品类消费不突显。 显然,男女生在消费上存在差异。为了了解男、女 生的消费支出结构差异,应当如何建立模型?
()
73142.7 76967.2 80579.4 88254 95727.9 103935.3 116603.2
46279.8 53407.5 59621.8 64332.4 73762.4 86910.6 103617.7
城乡居民人 民币储蓄存 款增加额 ()
7759 7615.4 6253 4976.7 9457.6 13233.2 16631.9
其中y ,x分别是居民住房消费支出和可支配收 入,虚拟变量设为:
第八章虚拟变量回归new
农村居民 城镇居民
高收入家庭 低收入家庭
这样可以反映各类居民家庭的住房消费情况:
城市低收入家庭
(D1=0,D2=0)
城市高收入家庭 农村低收入家庭 农村高收入家庭
(D1=0,D2=1) (D1=1,D2=0) (D1=1,D2=1)
建立工作文件
DATA
YX
(输入1998、1999年消费支出和收入的数据,1~8期
为1998年资料,9~16期为1999年资料)
SMPL
18
样本期调为1998年
GENR
D1=0
输入虚拟变量的值
SMPL
9 16
样本期调为1999年
GENR
D1=1
输入虚拟变量的值
第八章虚拟变量回归new
SMPL 1 16
结果如下图所示:
第八章虚拟变量回归new
对应的t统 计量值
R2的值 调整的R2值 SE的值
我国城镇居民彩电需求函数的估计结果为:
结果表明不同收入家庭对彩电的消费需求,在 截距和斜率上都存在着明显差异。
第八章虚拟变量回归new
低收入家庭:
中高收入家庭:
此例说明了三个问题: ①如何设置和在模型中引入虚拟变量; ②如何测量定性因素(即收入层次)的影响; ③如何区分不同类型的模型(即需求函数)。
Yi=a+bxi+ α1D1i+ α2D2i + α3D3i + εi
第八章虚拟变量回归new
二、检验模型结构的稳定性
设根据两个样本估计的回归模型分别为:
样本1: Yi=a1+b1xi +εi 样本2: Yi=a2+b2xi +εi
设置虚拟变量:
样本2 样本1
估计模型:Yi=a1+b1xi+(a2-a1)Di+(b2-b1)XDi+εi 其中,XDi=xi*Di。
第八章虚拟变量回归new
年薪 α1
α2 -α1
研究生 本科 大专以下
工龄
设置虚拟变量D或增设D3行吗? 研究生
D= 其他
第八章虚拟变量回归new
(2)多个因素各两种类型 如果有m个定性因素,且每个因素各有两个不
同的属性类型,则引入 m 个虚拟变量。 例如,研究居民住房消费函数时,考虑到城乡
的差异以及不同收入层次的影响,将消费函数取成: yi=a+bxi+α1D1i+α2D2i +εi
第八章虚拟变量回归new
二、虚拟变量的设置原则
⑴ 一个因素多个类型
对于有m个不同属性的定性因素,应该设置m-1个 虚拟变量来反映该因素的影响。
例如,设公司职员的年薪与工龄和学历有关。 学历分成三种:大专以下、本科、研究生。为反映 “学历” 的影响,应该设置两个虚拟变量:
本科
研究生
其他
其他
第八章虚拟变量回归new
第八章虚拟变量回归new
从居民储蓄增量图(上页左图)可以看出,城乡居 民的储蓄行为表现出了明显的阶段特征:在 1996年和2000年有两个明显的转折点。再从城 乡居民储蓄存款增量与国民总收入之间关系的散 布图看(见上页右图),也呈现出了相同的阶段 性特征。
第八章虚拟变量回归new
为了分析居民储蓄行为在1996年前后和2000年前后三个阶段 的数量关系,引入虚拟变量 和 。
NA
1991 21662.5 9241.6
2121.8
1979 4038.2 281
70.4 1992 26651.9 11759.4 2517.8
1980 4517.8 399.5
118.5 1993 34560.5 15203.5 3444.1
1981 4860.3 532.7
124.2 1994 46670
21518.8 6315.3
1982 5301.8 675.4
151.7 1995 57494.9 29662.3 8143.5
1983 5957.4 892.5
217.1 1996 66850.5 38520.8 8858.5
数据来源:《中国统计年鉴2004》,中国统计出版社。表中“城乡居民人民币 储蓄存款年增加额”为年鉴数值,与用年底余额计算的第数八章值虚有拟变差量异回归。new
第八章虚拟变量回归new
将我国城镇居民的彩电需求函数设成:
Yi=a+bxi+αDi+βXDi+εi DATA D1
(由于D是EViews软件的保留字,所以将虚拟变量取 名为D1;另外,此时也可以用SMPL和GENR命令直 接生成D1变量)
GENR XD=X*D1
生成变量XD
LS Y C X D1 XD 估计需求函数
D=1
其中:XDi=Xi*Di, 上式等价于:
a
当Di =0时:Yi=a+bxi+εi
β
D=0
当Di =1时:Yi=a+(b+β)xi+εi
以乘法方式引入,可反映定性因素对斜率的影 响,系数β描述了定性因素的影响程度。
第八章虚拟变量回归new
(3)一般方式 同时用加法与乘法方式引入虚拟变量,然后再利
政策紧缩 政策宽松
本科以上学历 本科以下学历
变量的划分应遵循穷举与互斥原则。
第八章虚拟变量回归new
二、作用 ⑴可以描述和测量定性因素的影响。 ⑵能够正确反映经济变量之间的相互关系,提高模
型的精度。 ⑶便于处理异常数据。
即将异常数据作为一个特殊的定性因素 异常时期 正常时期
第八章虚拟变量回归new
x<x* x>x*
第八章虚拟变量回归new
四、混合回归 能否将变量的时序数据和横截面数据混合建模
【例】现有我国城镇居民1998年、1999年全年人均消 费支出和可支配收入的统计资料。试使用混合样本 数据估计我国城镇居民消费函数。 设1998年、1999年我国城镇居民消费函数分别为: 1998年:Yi=a1+b1xi +εi 1999年:Yi=a2+b2xi +εi
而将年薪模型取成(假设以加法方式引入):
Yi=a+bxi+α1D1i+α2D2i +εi 其等价于:
Yi=a+bxi+εi Yi=(a+α1)+ bxi+εi Yi=(a+α2)+ bxi+εi
大专以下(D1=D2=0) 本科(D1=1,D2=0) 研究生(D1=0,D2=1)
三类年薪函数的差异情况如下图所示:
GENR XD=X*D1
LS
Y C X D1 XD
估计结果为: 操作演示
t统计量
样本期调至1998~1999年 生成XD的值 利用混合样本估计模型
R2的值 调整的R2值
第八章虚拟变量回归new
第四节 案例分析
为了考察改革开放以来中国居民的储蓄存款与收 入的关系是否已发生变化,以城乡居民人民币储 蓄存款年底余额代表居民储蓄( ),以国民总 收入GNI代表城乡居民收入,分析居民收入对储 蓄存款影响的数量关系,并建立相应的计量经济 学模型 。
面临的问题:如何把男女生这样的非数量变量引
入方程?
第八章虚拟变量回归new
问题的一般性描述
在实际建模中,一些定性变量具有不可忽视的重要 影响。例如,研究某个企业的销售水平,产业属性 (制造业、零售业)、所有制(私营、非私营)、 地理位置(东、中、西部)、管理者的素质、不同 的收入水平等是值得考虑的重要影响因素,但这些 因素共同的特征是定性描述的。 如何对非定量因素进行回归分析? 采用“虚拟变量”对定性变量进行量化一种思路。