虚拟变量模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1,高中及高中以上 D2 i 0,其他 1, 大专及大专以上 D3i 0, 其他
该方程的意义在于,在其它因素不变的条件下, 城镇居民与农村居民的收入是否具有显著性差 异。由此得到 E (Yi | Di 1) 1 2 城镇居民的年平均收入: 农村居民的年平均收入为: E (Yi | Di 0) 1
为了检验城镇居民和农村居民的差异对年平 均收入的影响是否具有显著性,可构造假设:
m i 1 i
2 二态解释变量模型
2.1 加法引入规则
2.1.1 一个定性解释变量 2.1.2 一个定量解释变量和一个定性解释变量 2.1.3 一个定量解释变量和一个定性解释变量,但 有多个属性类型 2.1.4 一个定量解释变量和两个以上定性解释变量 2.1.5 对模型中存在异常值的修正 2.1.6 对季节因素的修正
i
E (Yi ,| X i , Di 0) 1 2 X i
城镇居民年平均消费:
E (Yi X i , Di 1) (
3 )
2
xi
可以看出,城镇居民和农村居民两种收入类 型的斜率系数一样,但截距不同。说明两种 类型的居民在收入的水平上存在 2 的规模差 异。这一假定也可通过对 2 的显著性检验, t检验来判断。
2.1.3 模型中有一个定量解释变量和一个定
性解释变量,但有多个属性类型 设模型形式为
Yi 1 2 D2i 3 D3i X i ui
X i为定量变量, D2 i和 D3i为具有两个 式中, 属性特征的定量变量。
Xi 为居民年可支配收入;如果将受 设 Yi 为年医疗保健费支出; 教育程度分为三种类型:高中以下、高中、大专及大专以上, 则引入虚拟变量为如下两个
当样本资料存在异常数据时,一般有三种处理方式:一是在样 本容量较大的情况下直接剔除异常数据;二是用平均数等方式 修匀异常数据;三是设置虚拟变量(即将异常数据作为一个特 殊的定性因素)。
1.3 二态变量的设置规则
1.一个定性因素多个属性 若一个定性因素有m个不同属性或相互排斥的类型,在 模型中则只能引入m-1个虚拟变量,否则会产生完全多 重共线性。 2.多个定性因素多种不同属性 如果有m个定性因素,且每个因素各含有mi个不同的 属性类型,则引入 (m 1)个虚拟变量。 3.虚拟变量取值应从分析问题的目的出发予以界定; 通常将基础类型、否定类型取值为0,而将比较类型、 肯定类型以及我们将要研究的重点类型取值为1. 4.虚拟变量在单一方程中,可以作为解释变量,也可 以作为因变量。
2.2 乘法引入规则
2.2.1 检验模型的结构是否发生了变化 2.2.2 交互效应 2.2.3 分Baidu Nhomakorabea线性回归
2.1 加法引入规则
虚拟解释变量与别的解释变量以相加的关系出现在 模型里。加法引入虚拟变量对模型产生的结果是只 改变截距项。设模型为
Yi 1 2 X i 3Di ui
Di 为虚拟变量,它与其它解释变量是相加的关 式中, 系。如果虚拟变量按这种方式引入模型,则称虚拟 变量按加法类型引入。
1.2 二态变量的作用
引入虚拟变量的作用,在于将定性因素或属性因素 对因变量的影响数量化。 1.可以描述和测量定性(或属性)因素的影响。 2.能够正确反映经济变量之间的相互关系,提高模 型的精度;例如在分段回归中的应用。 3.便于处理异常数据。由于某些突发事件的存在, 如战争、自然灾害,使原本比较稳定的经济关系发 生一段时间的混乱,此时可以利用虚拟变量。
2.1.1 模型中只有一个定性解释变量
设模型形式为
Yi 1 2 Di ui
i 1 ,2,3,, n
其中, Di 为具有两个属性类型的定性变 量。
设 Yi为居民的年可支配收入, Di 为虚拟变量, Di =1表示城镇居民; Di =0表示农 其取值表示为: 村居民。即
1, 城镇居民 i 1, 2, 3, , n Di 0,农村居民
设变量D表示某种属性,该属性有两种类型,即当 属性存在时D取值为1;当属性不存在时D取值为0。 记为
1 D 0
具有某种属性 不具有该属性
该变量D即为二态变量。二态变量又称虚拟变量、 名义变量或哑变量,是用以反映质的属性的一个人 工变量,是量化了的质变量,通常取值为0或1, 一般“1”代表某一属性存在,“0”代表某一属性不存 在, 即“是”或“否”,“男”或“女”等。
二态变量
1.1 二态变量的概念 1.2 二态变量的作用 1.3 二态变量的设置规则
二态变量模型
2 二态解释变量模型 3 二态被解释变量模型
1.1 二态变量的概念
经济分析中接触最多的是一些数值变量,诸如 GDP,CPI等等。这些变量的共同特征是它们各自有 一个合理的值域区间,当变量变化时在值域区间内 取值。 但是人类的经济活动仅仅通过数值变量的描述还 是不够的,人的社会经济行为还与一些属性因素相 联系,譬如收入在形成过程中,不同的性别所得到 的收入是不一样的;在城乡、不同地区收入存在差 距;再比如,在我国,经济的发展水平对于不同的 区域有不同的表现,等等。既然属性因素同样影响 人的经济活动,经济问题的研究就需要属性变量。
X i 为定量变量,Di 为具有两个属性类型 式中, 的定性变量。
Di 为虚拟变量, Xi 为收入; 设 Yi 为消费支出; 即
1, 城镇居民 Di 0,农村居民
i 1, 2, 3, , n
上述表达式的意义在于,在收入不变的条件下,研 Y 究城镇居民和农村居民对消费的不同影响,即判断 城乡居民在消费上是否存在显著性差异。 农村居民年平均消费:
H 0 : 2 0; H1 : 2 0
对上述模型进行回归,利用样本统计量对假 设作出判断(t检验)。只有一个定性解释变 量往往可用于检验一个属性因素对被解释变 量的影响是否显著性存在。
2.1.2 模型中有一个定量解释变量和一
个定性解释变量
设模型形式为
Yi 1 2 X i 3 Di ui
相关文档
最新文档