6 虚拟变量模型PPT课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

虚拟解释变量的应用
➢ 结构变化分析 ➢ 交互效应分析 ➢ 分段回归分析
1、结构变化分析
结构变化的实质是检验所设定的模型在样本期内 是否为同一模型。以下的平行回归、共点回归、不 同的回归三个模型均不是同一模型。 平行回归模型的假定是斜率保持不变(加法类 型); 共点回归模型的假定是截距保持不变(乘法类 型); 相异回归模型的假定是截距、斜率均为变动的 (加法、乘法类型的组合)。
虚拟变量取“0”值通常代表比较的基础类型; 虚拟变量取“1”值通常代表被比较的类型。 “0”代表比较的基础类型(参照系/基准组); “1”代表被比较的类型。
例如,比较收入时考察性别的作用。当研究男性
收入是否高于女性时,是将女性作为比较的基础
(参照物),故有男性为“1”,女性为“0”。
例1
(1)
D
=
D
1
0
异常时期 正常时期
问题:为何只选0、1,选2、3、4可以吗?
• 虚拟变量一般用0和1表示,这里的0和1不是个真 实的数值,而只是“A”和“非A”的代码。0和1仅 仅是个代码,这就是虚拟的含义。
• 可以用0和1表示,也可以用1和2、4和8表示,无 论什么数值都可以表示,只不过我们习惯于用0和1 表示而已。
对定性变量的量化可采用虚拟变量的方式实现。
▪ 一、虚拟变量的基本含义 ▪ 二、虚拟变量的设置规则 ▪ 三、自变量为定性变量 ▪ 四、因变量为定性变量(不讲)
一、虚拟变量的基本含义
定量因素:可直接测度、数值性的因素。 定性因素:属性因素,表征某种属性存在与否的
非数值性的因素。 基本思想: 在回归模型中,是否可将这些定性因素进行量化。
虚拟变量(dummy):
计量经济学中,将取值为0和1的人工变量称为虚拟 变量。虚拟变量也称:哑变量、定性变量、二值变 量等等。通常用字母D或DUM加以表示。
▪ 例如,反映文化程度的虚拟变量可取为:
1, 本科学历 D=
0, 非本科学历
二、虚拟变量的设置规则
1、“0”和“1”选取原则
虚拟变量取“1”或“0”。 从理论上讲,
• 如果自变量是血型,分A、B、O、AB型。如果直 接给他们赋值1、2、3、4,当然也可以做,但不 利于模型的分析;而且1、2、3、4所默认的情形 是这4种血型有一种等级的秩序,但实际上可能血 型之间没有什么秩序。这时最好的办法就是采用虚 拟变量。
2、三种状态时的虚拟变量的设置
虚拟变量既可以用来分析反映两种定性因素 的属性,也可以反映多种状态。
城镇居民 农村居民
1 D2i =0
农村居民 城镇居民
则模型陷入了“虚拟变量陷阱”。
“虚拟变量陷阱”的实质是:完全多重共线性。
三、自变量为定性变量
含有虚拟变量的模型称为虚拟变量模型。 ▪ 虚拟变量做为解释变量引入模型有两种基本方 式:加法方式和乘法方式。
Y i01 X i2 D ii
Y i 0 1 X i 3 D i 4 ( D iX i) i
为城镇D;1i = 0 为农村,则模型为 Y i = 0 + 1 X i + 1 D 1 + u i ( 2 )
注:模型有截距;“居民属性”定性变量只有两个相
互排斥的属性状态(m 2 ),故只设定一个虚拟变量。
若对两个相互排斥的属性 “居民属性” ,仍然 引入 m 2 个虚拟变量,则有
1 D1i =0
1 0
男 女
( 2)D=1 0
改 革 开 放 以 后 改 革 开 放 以 前
(3)D1 =0 1
天气阴 其 他(4)D2
=1 0
天气雨 其他
如:
D
1
0
D
1
0
城镇居民 农村居民 政策紧缩 政策宽松
D
1
0
1
D
0
销售旺季 销售淡季 本科以上学历 本科以下学历
虚拟变量也可用于标注两个不同的时期或者状态。
▪ 在上述模型中,若再引入第四个虚拟变量
1
D 4t
0
冬季 其他
则冷饮销售模型变量为:
Y t 0 1 X 1 t k X k 1 t D 1 t 2 D 2 t 3 D 3 t 4 D 4 t t
如果只取六个观测值,其中春季与夏季取了 两次,秋、冬各取到一次观测值,则式中的:
1 1
教育水平考虑三个层次:高中以下, 高中, 大学及其以上
这时需要引入两个虚拟变量:
1 高中 1 大学及
D 1 0 其他 D 2 0
其他
3、虚拟变量的设置原则
虚拟变量的个数须按以下原则确定:
模型中有截距项时,每一定性变量所需的虚拟变 量个数要比该定性变量的类别数少1,即如果有m个 定性变量,只在模型中引入m-1个虚拟变量。
第六章 虚拟变量模型
男女大学生消费真有差异吗?
男女生在消费上存在差异。为了了解男、 女生的消费支出结构差异,应当如何建 立模型? 面临的问题:如何把男女生这样的非数 量变量引方程?
问题的一般性描述
在实际建模中,一些定性变量具有不可忽视的重要 影响。例如,研究某个企业的销售水平,产业属性 (制造业、零售业)、所有制(私营、非私营)、 地理位置(东、中、西部)、管理者的素质、不同 的收入水平等是值得考虑的重要影响因素,但这些 因素共同的特征是定性描述的。 如何对非定量因素进行回归分析?
X 11 X 12
X k1 Xk2
1 0
0 1
0 0
0 0
0
(X,D) 1 1 11
X 13 X 14 X 15 X Fra Baidu bibliotek6
X k3 Xk4 X k5 X k6
0 0 0 1
0 0 1 0
1 0 0 0
0 1
00
β
1
k
1
α
2 3 4
显然,(X,D)中的第1列可表示成后4列的线性组 合,参数无法唯一求出。(完全多重共线性)
例。已知冷饮的销售量Y除受k种定量变量Xk的影 响外,还受春、夏、秋、冬四季变化的影响,要考察 该四季的影响,只需引入三个虚拟变量即可:
1 春季
D 1t
0
其他
1 夏季
D 2t
0
其他
1
D 3t
0
秋季 其他
则冷饮销售量的模型为:
Y t 0 1 X 1 t k X k t 1 D 1 t 2 D 2 t 3 D 3 t t
这就是所谓的“虚拟变量陷阱”,应避免。
虚拟变量陷阱 例2
研究居民住房消费支出 Y i 和居民可支配收入 X i 之 间的数量关系。回归模型的设定为:
Y i= 0 + 1 X i+ u i( 1 )
现在要考虑城镇居民和农村居民之间的差异,如 何办?为了对“城镇居民”、“农村居民”进行区 分,分析各自在住房消费支Y i 出 上的差异,D1设i = 1
相关文档
最新文档