数据统计与分析教程7章含虚拟变量的回归模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
EViews统计分析基础教程
一、虚拟变量的定义
2.虚拟变量
定义:
定性变量描述的是变量具有的性质,要将这样的变量纳入回 归模型中,需构造人工变量,从而将定性变量进行量化处理。 在计量经济学中,将取值为“0”和“1” 的人工变量称作虚 拟变量(Dummy Variable),用字母D表示。当D取值为0 时,表示该变量不具备某种属性;当D取值为1时,表示该 变量具有某种属性。
EViews统计分析基础教程
二、含虚拟变量的模型
1.仅含一个虚拟变量
实验:
第二步,在该工作文件中建立两个序列对象,一个为 “wage”,一个为“sex”。
第三步,在“wage”序列对象中输入 “工资”的数据,在 “sex”序列对象中输入 “性别”的数据。
EViews统计分析基础教程
二、含虚拟变量的模型
Байду номын сангаас
EViews统计分析基础教程
二、含虚拟变量的模型
1.仅含一个虚拟变量
实验:
回归模型为
yt =β0 + β1Dt + μt
(t=1,2,…,n)
其中,yt表示企业员工的工资收入情况,Dt=0表示男性员工,
Dt=1表示女性员工。
EViews统计分析基础教程
二、含虚拟变量的模型
1.仅含一个虚拟变量
实验: 第一步,建立类型为“Unstructured/Undated”(未限定结构/ 未限定日期)的工作文件,在“Data range”(数据范围)中 输入观测数据的样本范围,本例中所分析的数据为24个样本, 在“Names”中为该工资文件命名,如“工资与性别关系”。 然后单击“OK”按钮即可生成工作文件。
二、含虚拟变量的模型
1.仅含一个虚拟变量
实验:
虚拟变量的回归方程结果可以表示为: Wage = 3478.869 - 595.0965 sex t= (30.06899) (-3.482241)
R2 = 0.35533 Adjusted- R2 = 0.326027 F=12.126 D.W.=2.232989
结果表明,该企业的女性员工的平均工资水平为2883.7725 (3478.869-595.0965)元人民币,该企业的男性员工的平 均工资水平为3478.869元人民币。由此可见,女性的平均工 资比男性少了595.0965元。
EViews统计分析基础教程
二、含虚拟变量的模型
2. 同时含虚拟和定量解释变量
EViews统计分析基础教程
第7章 含虚拟变量的回归模型
重点内容: • 虚拟变量的定义 • 定性变量与定量变量的划分 • 含虚拟变量模型的估计
EViews统计分析基础教程
一、虚拟变量的定义
1.定性变量与定量变量
定量变量:回归模型中有些变量是可以被度量的,如居民消 费、国内生产总值、出口总额等,这些变量被称为“定量变 量”。 定性变量:在经济现象的分析中还存在一些不能被度量的变 量,如性别、种族、婚姻状况、文化程度等,这些变量被称 为“定性变量”。
2.虚拟变量
引入虚拟变量的原则:
一般情况下,如果定性变量有m类,并且模型不含有截距项 时,应引入m个虚拟变量;如果模型含有截距项,应引入m1个虚拟变量。
EViews统计分析基础教程
二、含虚拟变量的模型
1.仅含一个虚拟变量
在回归模型中,解释变量可以仅是一个虚拟变量,这样的回 归模型被称为方差分析模型。 例如:
EViews统计分析基础教程
一、虚拟变量的定义
2.虚拟变量
虚拟变量陷阱:
所谓的“虚拟变量陷阱”是指自变量(解释变量)中包含了 过多的虚拟变量,从而导致了模型出现多重共线性。当模型 中既有整体截距又对每一组都设有一个虚拟变量时,就产生 了虚拟变量陷阱。
EViews统计分析基础教程
一、虚拟变量的定义
1.仅含一个虚拟变量
实验: 第四步,在工作文件中选择主菜单栏中的“Object”| “New Object” | “Equation”选项,或者选择“Quick”| “Estimate Equation” 选项,打开如下所示的方程对话框。
EViews统计分析基础教程
二、含虚拟变量的模型
1.仅含一个虚拟变量
EViews统计分析基础教程
二、含虚拟变量的模型
1.仅含一个虚拟变量
实验:
根据表7-1中的数据显示,建立解释变量为虚拟变量的回归 模型。表中列出了24个不同性别的企业员工的月工资收入情 况,性别一列中“1”表示女性员工,“0”表示男性员工。通 过建立含有虚拟变量的回归模型,试图分析男女平均工资是 否存有差距,如果有差距,那么差距是多少。
实验: 在“Equation specification”(方程说明)中列出模型中的被 解释变量、常数项和解释变量。在“Estimation settings”(估 计方法设定)中选择“LS”,用普通最小二乘法对回归模型 进行估计。然后单击“确定”按钮即可得到如下估计结果。
EViews统计分析基础教程
以研究人们的收入水平、受教育程度与城乡居民之间的关系。
模型如下,
yt =β0 + β1 xt+β2D2t +β3D3t + μt
(t=1,2,…,n)
其中,yt表示根据调查资料所得到的家庭所购买个人电脑情
况,xt表示家庭收入, D2 和D3为虚拟解释变量。
EViews统计分析基础教程
当方程的解释变量中既有虚拟变量又有定量变量时,同样可 以用OLS对模型进行估计。例如:
yt =β0 + β1 xt+β2Dt + μt
EViews统计分析基础教程
二、含虚拟变量的模型
2. 同时含虚拟和定量解释变量
实验:
随着科技的进步和人民生活水平的不断提高,电脑越来越普
及,许多家庭纷纷把个人电脑(PC机)搬进家中。我们可
yt =β0 + β1Dt + μt 假设被解释变量yt为员工工资收入,Dt为虚拟解释变量,取 值为0或1:
1,雇员为女性 Dt=
0,雇员为男性
EViews统计分析基础教程
二、含虚拟变量的模型
1.仅含一个虚拟变量
如果该回归模型的随机误差项满足线性回归模型的五个基本 假定条件,则
E(yt| Dt=1)= E(雇员工资收入|雇员为女性)=β0 + β1 E(yt| Dt=0)= E(雇员工资收入|雇员为男性)=β0 β0 + β1表示女性雇员的平均工资收入,β0表示男性雇员的平 均工资收入。