计量经济学10(1)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的差距。
计量经济学10(1)
l 几个问题:
3. 虚拟变量陷阱(完全共线性)或多重共线性
l 在解释变量存在完全共线性的情形下,不可能得到 参数的惟一估计值。
l 例如前例: Yi=B1+B2D2i+B3D3i+ui 其中,D2=0,D3=1;D2=1,D3=0
l 避免“陷阱”的一般原则:如果模型有共同的截距 项,且定性变量有m种分类,则需引入m-1个虚拟 变量。
¡ 公式:10-4 or 10-5
计量经济学10(1)
l 几个问题:
1. 基准类(基础类,参照类或比较类):取值为 0的那类变量
¡ 基准类的选择根据研究目的而定 ¡ 来自于社会学、心理学等研究的需要 2. 虚拟变量D的系数称为差别截距系数
(differential intercept coefficient), ¡ 表明了取值为1的类的截距值与基准类截距值
计量经济学10(1)
四、包含一个定量变量和多个定性变量的 回归
l 例:考虑如下回归模型: l Yi=B1+B2D2i+B3D3i+B4Xi+ui l 其中:
¡ Y=小时工资(美元) ¡ X=教育(受教育年限) ¡ D2=1(女性),0(男性) ¡ D3=1(非白种人和非西班牙人),0(其他)
计量经济学10(1)
Yi=B1+B2Di+B3Xi+B4(DiXi)+ui
l 给定Di=0,并对上式两端取均值,得男性 平均食品支出函数:
E(Yi|D=0,Xi)=B1+B3Xi
l 给 平定 均D食i=品1支,出并函对数上:式两端取均值,得女性
E(Yi|D=1,Xi)=(B1+B2)+(B3+B4)Xi
l 我们称B2为差别截距系数,B4为差别斜率 系数
¡ 误差项将是异方差的; ¡ 由于Y仅取值0和1,惯用的R2没有实际意义了
计量经济学10(1)
l 对上述问题的解决:
¡ 随着样本容量的扩大,二项分布收敛于正态分 布;
¡ 异方差有其处理方法; ¡ 估计的Y可能在0~1区间之外:
l 实践中有一个简单的处理方法(在0~1区间之外的 Y值不太多时)
• Ŷ为负则取0; Ŷ大于1,则取1.
l 收入每增加1美元,获得房贷的概率大约增加0.03 l 实际中:房贷的概率随收入水平以固定增速线性增
加,与实际不符
计量经济学10(1)
l 例:借贷市场上的歧视
¡ 应变量Y为二分变量,通过贷款申请赋值为1, 否则为0;
¡ 研究目的是为了判断是否由于性别、种族和其 他一些定性因素导致了贷款市场上的歧视行为。
计量经济学10(1)
l 上述模型的含义: l 截距B1表示男性平均食品支出,斜率系数
B2表示女性平均食品支出与男性的差异, B1 + B2表示女性平均食品支出。 l 对这类模型,零假设为:H0:B2=0
¡ 表示男女平均食品支出没有差异。我们可根据t 检验判定是否统计显著。
计量经济学10(1)
l 例10-1(P213):性别差异对食品消费支出 的影响
计量经济学10(1)
l 方差分析模型(Analysis of variance models,ANOVA):仅包含定性变量或 虚拟变量的回归模型,其形式如下:
Yi=B1+B2Di+ui l 假定Y:每年食品支出(美元);Di=1表示
女性;Di=0表示男性,则: l 男性食品支出的期望:E(Yi|Di=0)=B0 l 女性食品支出的期望: E(Yi|Di=0)=B0+B1
t值 未给出 4.69* -5.74* 0.78** -1.84* -1.75* -3.52* 0.74** 0.23** -0.134
*:p值等于或低于5%;** : p值大于5% 计量经济学10(1)
总结
l 虚拟变量的作用:“数据分类器” l 应用虚拟变量应注意的地方:
¡ 如果回归模型包含了一个常数项,则虚拟变量 的个数必须比每个定性变量的分类数少一;
¡ 第二季度和第三季度存在季节效应(D2,D3的系 数显著不为0),第四季度则没有
¡ 利用该模型获得经季节调整后冰箱销售量的时 间序列:
l 用实际的Y减去从方程估计得到的Y,即回归式的残 差,再把这个残差加上Y的均值,得到的序列就是 经季节调整后的序列,该序列表现出时间序列的其 他成分(周期、趋势和随机等)
六、虚拟变量在季节分析中的应用
l 例:冰箱的销售量与季节性 l Yt=B1+B2D2t+B3D3t+B4D4t+ut l 其中,
¡ Yt: 冰箱销售量(千台) ¡ D2,D3,D4分别表示每年的第二、第三和第四季
度取值为1,第一季度值为0,即第一季度作为 基准季度。
计量经济学10(1)
l 关于公式10-30的回归模型的说明:
l 为了在模型中能够反映这些因素的影响,并提高 模型的精度,需要将它们“量化”。
计量经济学10(1)
l 定性变量通常表示为具备或不具备某种性 质,如男性或女性;黑人或白人;党员或 非党员等。
l 把定性因素“定量化”的一个方法是建立 人工变量(也称为虚拟变量,Dummy variable),并赋值0和1:
• D2=1表东北和中北部地区,D2=0为其它地区; • D3=1表南部地区,D3=0为其它地区
Ÿ 这是将西部地区看成是基准类。
计量经济学10(1)
¡ 再考虑政府机构用于每个学生的花费和地区对 教师平均年薪水的影响: AASi=B1+B2D2i+B3D3i+B4PPSi
¡ 对模型的解释:
l D2显著,而D3不显著,表明原模型存在设定误差; l PPS的系数的含义
计量经济学10(1)
l 根据差别截距系数和差别斜率系数的统计 显著性,可以辨别出女性和男性食品支出 函数是截距为同还是斜率不同,或是都不 同:
计量经济学10(1)
Y
Y
a) 一致回归
X
b) 平均回归
Xቤተ መጻሕፍቲ ባይዱ
Y
Y
c) 并发回归
X
d) 相异回归
X
计量经济学10(1)
l 模型的选择:对于模型10-1; 10-8; 10-23
X 0.0803
5.54
DX -0.065
-4.096
1970-1995 C 62.423
4.89
X 0.0376
8.89
1970-1981 C 1.016
X 0.0803
1982-1995 C 153.49(1.016+152.479)
X 0.0148(0.0803-0.0655)
计量经济学10(1)
l Logit model & Probit model
计量经济学10(1)
l 例:考虑食品支出与税后收入、性别和年 龄的关系(数据见表10-10)
Yi=B1+B2Xi+u ¡ 其中:Y=1表示申请到了房贷,否则为0; X表
示年家庭收入
¡ 估计结果:
Ŷi=-0.9456+0.0255Xi (相应的t值和R2见P232) ¡ 对模型的解释:
计量经济学10(1)
l 例10-2(P215):工会化程度与工作权利法
¡ 本例研究工作权利法(是否通过)对私营部分 的工会化程度的影响
计量经济学10(1)
二、协方差分析模型(ANCOVA)——:包 含一个定量变量和一个两分定性变量的回归 l 例:考虑可支配收入(定量变量)与性别
食品消费支出对的回归模型
计量经济学10(1)
七、应变量也是虚拟变量的情形:线性概 率模型(LPM)
l LPM: 应变量Y的取值只有两种情形,0或1.
¡ 这样的Y称为两分变量
l 这种以情形下,不宜用OLS估计方法:
¡ 虽然Y的值为1或0,但无法保证Y的估计值介于 0~1之间,实际上,Ŷ可能为负或大于1;
¡ 由于Y是一个二分变量,u也是一个二分变量, 它不再服从正态分布,而是二项概率分布;
¡ 0:不具备某种性质; ¡ 1:具备某种性质。 ¡ 虚拟变量常用变量D表示。
计量经济学10(1)
l 例如,反映文化程度的虚拟变量可取为: 1, 本科学历
D= 0, 非本科学历
计量经济学10(1)
l 一般地,在虚拟变量的设置中:
¡ 基础类型、肯定类型取值为1; ¡ 比较类型,否定类型取值为0。
l 称虚拟变量也为二元变量binary variable
¡ 回归的结果:
计量经济学10(1)
解释变量 截距 AI(收入) XMD(债务减抵押贷款支出) DF(性别) DR(种族) DS(婚否) DA(房屋年限) NNWP(领居中非的种人的比例) NMFI NA (邻居房屋的平均年限)
系数 0.501 1.489 -1.509 0.140 -0.266 -0.238 -1.426 -1.762 0.150 -0.393
l 例10-4:美国1970~1995储蓄-收入关系。 由于1982年以来的经济衰退,有两种方法 可考查衰退对储蓄的影响。
¡ 法一:分两个时期来作回归; ¡ 法二:引入虚拟变量,将两个回归模型统一成
一个。
计量经济学10(1)
模型的比较
1970-1995 C 1.016
0.05
D 152.48
4.61
¡ 回归模型如公式10-8,10-9 ¡ 对模型的解释:
l 虚拟变量的统计显著; l 常数统计显著; l 对定量变量回归统计的解释。
¡ 对比没有虚拟变量的模型
计量经济学10(1)
例:一个以性别虚拟变量考察企业职工薪 水的模型:
Yi=B1+B2Xi+B3Di+ui
其中:Yi为企业职工的薪金,Xi为工龄, Di=1,若是男性,Di=0,若是女性。
¡ B2:女性的差别效应; ¡ B3:非白种/非西班牙人的差别效应; ¡ B4:非白种/非西班牙女性的差别效应 ¡ B2+B3+B4:非白种/非西班牙女性的平均小时
工资函数。
计量经济学10(1)
l 模型的一般化:
¡ 可以将模型扩展到包括多个定量变量和多个定性变量 的情形。但对于每个定性变量,虚拟变量的个数要比 该变量的分类数少一。
¡ 虚拟变量系数的解释与基准类有关; ¡ 若模型包含多个定性变量,且每个定性变量有
多种分类,则引入模型的虚拟变量将消耗大量 的自由度,故应权衡进入模型中虚拟变量的个 数以免超过样本观察值的个数。
计量经济学10(1)
¡ 例10-3:政党对竞选活动的资助 ¡ 应变量:
l PARTY(政党对当地候选人的资助);
¡ 自变量:
l 定量变量:GAP(资助),VGAP(以往获胜次数),PU(政党 忠诚度)
l 定性变量:OPEN(公开竞争否),DEMOCRAT(民主 党),COMM(共和党)
计量经济学10(1)
回归的比较
l 对于模型:
计量经济学10(1)
2020/12/8
计量经济学10(1)
主要内容
l 虚拟变量的性质 l ANCOVA模型 l 包含一个定量变量、一个多分定性变量的
回归 l 包含一个定量变量和多个定性变量的回归 l 回归的比较 l 虚拟变量在季节分析中的应用 l 应变量也是虚拟变量的情形:LPM l 小结
计量经济学10(1)
一、虚拟变量的性质
l 许多经济变量是可以定量度量的,如:商品需求 量、价格、收入、产量等——称之为定量变量, quantitative (numerical) explanatory variables 。
l 但也有一些影响经济变量的因素无法定量度量, 如:职业、性别对收入的影响等——称之为变性 变量, qualitative explanatory variables 。
模型类型 自变量
系数
T统计量
10-1
D(性别)
503.16 329.57
10-8
D(性别)
-288.98 -2.14
X(税后收入) 0.0589 9.64
10-23 D
-67.89 -0.194
X
0.062 7.376
DX
-0.0063 -0.484
实践中,应考虑最全面的模型,再经过适当 的诊断检验后,简化成较小的模型计量。经济学10(1)
l 结果:P221
l 对模型的解释:
¡ 本例的基准类是白种或西班牙男性; ¡ 两个回归系数的含义; ¡ 不考虑性别和种族的影响,则受教育年限每增
加一年,平均小时工资提高约80美元。
计量经济学10(1)
l 交互影响:即不同虚拟变量之间存在的交 互影响
l 对于上例而言,我们可以考虑如下模型:
l Yi=B1+B2D2i+B3D3i+B4(D2iD3i)+B5Xi+ui l 其中,
计量经济学10(1)
三、包含一个定量变量、一个多分定性变 量的回归
l 例:考查学生支出和地区差异(三个地区, 分别是东北和中北部(21)、南部(17) 和西部(13))对教师薪水的影响
¡ 先考虑地区差异模型如下: AASi=B1+B2D2i+B3D3i+ui
l 其中,AAS为公立学校老师平均年薪水;Di为虚拟 变量,且
相关文档
最新文档