计量经济学10
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
这是将西部地区看成是基准类。
再考虑政府机构用于每个学生的花费和地区对 教师平均年薪水的影响: AASi=B1+B2D2i+B3D3i+B4PPSi
对模型的解释:
D2显著,而D3不显著,表明原模型存在设定误差; PPS的系数的含义
四、包含一个定量变量和多个定性变量的 回归
例:考虑如下回归模型:
但也有一些影响经济变量的因素无法定量度量, 如:职业、性别对收入的影响等——称之为变性 变量, qualitative explanatory variables 。
为了在模型中能够反映这些因素的影响,并提高 模型的精度,需要将它们“量化”。
定性变量通常表示为具备或不具备某种性 质,如男性或女性;黑人或白人;党员或 非党员等。
Yi=B1+B2D2i+B3D3i+B4Xi+ui 其中:
Y=小时工资(美元) X=教育(受教育年限) D2=1(女性),0(男性) D3=1(非白种人和非西班牙人),0(其他)
结果:P221
对模型的解释:
本例的基准类是白种或西班牙男性; 两个回归系数的含义; 不考虑性别和种族的影响,则受教育年限每增
几个问题:
3. 虚拟变量陷阱(完全共线性)或多重共线性
在解释变量存在完全共线性的情形下,不可能得到 参数的惟一估计值。
例如前例:
Yi=B1+B2D2i+B3D3i+ui 其中,D2=0,D3=1;D2=1,D3=0 避免“陷阱”的一般原则:如果模型有共同的截距 项,且定性变量有m种分类,则需引入m-1个虚拟 变量。
把定性因素“定量化”的一个方法是建立 人工变量(也称为虚拟变量,Dummy variable),并赋值0和1:
0:不具备某种性质;
1:具备某种性质。
虚拟变量常用变量D表示。
例如,反映文化程度的虚拟变量可取为: 1, 本科学历
D= 0, 非本科学历
一般地,在虚拟变量的设置中:
基础类型、肯定类型取值为1; 比较类型,否定类型取值为0。
例:考查学生支出和地区差异(三个地区, 分别是东北和中北部(21)、南部(17) 和西部(13))对教师薪水的影响
先考虑地区差异模型如下: AASi=B1+B2D2i+B3D3i+ui
其中,AAS为公立学校老师平均年薪水;Di为虚拟 变量,且
• D2=1表东北和中北部地区,D2=0为其它地区; • D3=1表南部地区,D3=0为其它地区
虚拟变量的统计显著; 常数统计显著; 对定量变量回归统计的解释。
对比没有虚拟变量的模型
例:一个以性别虚拟变量考察企业职工薪 水的模型:
Yi=B1+B2Xi+B3Di+ui
其中:Yi为企业职工的薪金,Xi为工龄, Di=1,若是男性,Di=0,若是女性。
三、包含一个定量变量、一个多分定性变 量的回归
公式:10-4 or 10-5
几个问题:
1. 基准类(基础类,参照类或比较类):取值为 0的那类变量
基准类的选择根据研究目的而定
来自于社会学、心理学等研究的需要
2. 虚拟变量D的系数称为差别截距系数 (differential intercept coefficient),
表明了取值为1的类的截距值与基准类截距值 的差距。
例10-2(P215):工会化程度与工作权利法
本例研究工作权利法(是否通过)对私营部分 的工会化程度的影响
二、协方差分析模型(ANCOVA)——:包 含一个定量变量和一个两分定性变量的回归
例:考虑可支配收入(定量变量)与性别 食品消费支出对的回归模型
回归模型如公式10-8,10-9 对模型的解释:
加一年,平均小时工资提高约80美元。
交互影响:即不同虚拟变量之间存在的交 互影响
对于上例而言,我们可以考虑如下模型:
Yi=B1+B2D2i+B3D3i+B4(D2iD3i)+B5Xi+ui 其中,
B2:女性的差别效应; B3:非白种/非西班牙人的差别效应; B4:非白种/非西班牙女性的差别效应 B2+B3+B4:非白种/非西班牙女性的平均小时
经ห้องสมุดไป่ตู้计量学
Chp 10 虚拟变量回归模型
主要内容
虚拟变量的性质 ANCOVA模型 包含一个定量变量、一个多分定性变量的
回归 包含一个定量变量和多个定性变量的回归 回归的比较 虚拟变量在季节分析中的应用 应变量也是虚拟变量的情形:LPM 小结
一、虚拟变量的性质
许多经济变量是可以定量度量的,如:商品需求 量、价格、收入、产量等——称之为定量变量, quantitative (numerical) explanatory variables 。
上述模型的含义:
截距B1表示男性平均食品支出,斜率系数 B2表示女性平均食品支出与男性的差异, B1 + B2表示女性平均食品支出。
对这类模型,零假设为:H0:B2=0
表示男女平均食品支出没有差异。我们可根据t 检验判定是否统计显著。
例10-1(P213):性别差异对食品消费支出 的影响
工资函数。
模型的一般化:
可以将模型扩展到包括多个定量变量和多个定性变量 的情形。但对于每个定性变量,虚拟变量的个数要比 该变量的分类数少一。
例10-3:政党对竞选活动的资助 应变量:
PARTY(政党对当地候选人的资助);
自变量:
定量变量:GAP(资助),VGAP(以往获胜次数),PU(政党 忠诚度)
称虚拟变量也为二元变量binary variable
方差分析模型(Analysis of variance models,ANOVA):仅包含定性变量或 虚拟变量的回归模型,其形式如下:
Yi=B1+B2Di+ui 假定Y:每年食品支出(美元);Di=1表示
女性;Di=0表示男性,则: 男性食品支出的期望:E(Yi|Di=0)=B0 女性食品支出的期望: E(Yi|Di=0)=B0+B1
定性变量:OPEN(公开竞争否),DEMOCRAT(民主 党),COMM(共和党)
回归的比较
对于模型:
Yi=B1+B2Di+B3Xi+B4(DiXi)+ui
给定Di=0,并对上式两端取均值,得男性 平均食品支出函数:
再考虑政府机构用于每个学生的花费和地区对 教师平均年薪水的影响: AASi=B1+B2D2i+B3D3i+B4PPSi
对模型的解释:
D2显著,而D3不显著,表明原模型存在设定误差; PPS的系数的含义
四、包含一个定量变量和多个定性变量的 回归
例:考虑如下回归模型:
但也有一些影响经济变量的因素无法定量度量, 如:职业、性别对收入的影响等——称之为变性 变量, qualitative explanatory variables 。
为了在模型中能够反映这些因素的影响,并提高 模型的精度,需要将它们“量化”。
定性变量通常表示为具备或不具备某种性 质,如男性或女性;黑人或白人;党员或 非党员等。
Yi=B1+B2D2i+B3D3i+B4Xi+ui 其中:
Y=小时工资(美元) X=教育(受教育年限) D2=1(女性),0(男性) D3=1(非白种人和非西班牙人),0(其他)
结果:P221
对模型的解释:
本例的基准类是白种或西班牙男性; 两个回归系数的含义; 不考虑性别和种族的影响,则受教育年限每增
几个问题:
3. 虚拟变量陷阱(完全共线性)或多重共线性
在解释变量存在完全共线性的情形下,不可能得到 参数的惟一估计值。
例如前例:
Yi=B1+B2D2i+B3D3i+ui 其中,D2=0,D3=1;D2=1,D3=0 避免“陷阱”的一般原则:如果模型有共同的截距 项,且定性变量有m种分类,则需引入m-1个虚拟 变量。
把定性因素“定量化”的一个方法是建立 人工变量(也称为虚拟变量,Dummy variable),并赋值0和1:
0:不具备某种性质;
1:具备某种性质。
虚拟变量常用变量D表示。
例如,反映文化程度的虚拟变量可取为: 1, 本科学历
D= 0, 非本科学历
一般地,在虚拟变量的设置中:
基础类型、肯定类型取值为1; 比较类型,否定类型取值为0。
例:考查学生支出和地区差异(三个地区, 分别是东北和中北部(21)、南部(17) 和西部(13))对教师薪水的影响
先考虑地区差异模型如下: AASi=B1+B2D2i+B3D3i+ui
其中,AAS为公立学校老师平均年薪水;Di为虚拟 变量,且
• D2=1表东北和中北部地区,D2=0为其它地区; • D3=1表南部地区,D3=0为其它地区
虚拟变量的统计显著; 常数统计显著; 对定量变量回归统计的解释。
对比没有虚拟变量的模型
例:一个以性别虚拟变量考察企业职工薪 水的模型:
Yi=B1+B2Xi+B3Di+ui
其中:Yi为企业职工的薪金,Xi为工龄, Di=1,若是男性,Di=0,若是女性。
三、包含一个定量变量、一个多分定性变 量的回归
公式:10-4 or 10-5
几个问题:
1. 基准类(基础类,参照类或比较类):取值为 0的那类变量
基准类的选择根据研究目的而定
来自于社会学、心理学等研究的需要
2. 虚拟变量D的系数称为差别截距系数 (differential intercept coefficient),
表明了取值为1的类的截距值与基准类截距值 的差距。
例10-2(P215):工会化程度与工作权利法
本例研究工作权利法(是否通过)对私营部分 的工会化程度的影响
二、协方差分析模型(ANCOVA)——:包 含一个定量变量和一个两分定性变量的回归
例:考虑可支配收入(定量变量)与性别 食品消费支出对的回归模型
回归模型如公式10-8,10-9 对模型的解释:
加一年,平均小时工资提高约80美元。
交互影响:即不同虚拟变量之间存在的交 互影响
对于上例而言,我们可以考虑如下模型:
Yi=B1+B2D2i+B3D3i+B4(D2iD3i)+B5Xi+ui 其中,
B2:女性的差别效应; B3:非白种/非西班牙人的差别效应; B4:非白种/非西班牙女性的差别效应 B2+B3+B4:非白种/非西班牙女性的平均小时
经ห้องสมุดไป่ตู้计量学
Chp 10 虚拟变量回归模型
主要内容
虚拟变量的性质 ANCOVA模型 包含一个定量变量、一个多分定性变量的
回归 包含一个定量变量和多个定性变量的回归 回归的比较 虚拟变量在季节分析中的应用 应变量也是虚拟变量的情形:LPM 小结
一、虚拟变量的性质
许多经济变量是可以定量度量的,如:商品需求 量、价格、收入、产量等——称之为定量变量, quantitative (numerical) explanatory variables 。
上述模型的含义:
截距B1表示男性平均食品支出,斜率系数 B2表示女性平均食品支出与男性的差异, B1 + B2表示女性平均食品支出。
对这类模型,零假设为:H0:B2=0
表示男女平均食品支出没有差异。我们可根据t 检验判定是否统计显著。
例10-1(P213):性别差异对食品消费支出 的影响
工资函数。
模型的一般化:
可以将模型扩展到包括多个定量变量和多个定性变量 的情形。但对于每个定性变量,虚拟变量的个数要比 该变量的分类数少一。
例10-3:政党对竞选活动的资助 应变量:
PARTY(政党对当地候选人的资助);
自变量:
定量变量:GAP(资助),VGAP(以往获胜次数),PU(政党 忠诚度)
称虚拟变量也为二元变量binary variable
方差分析模型(Analysis of variance models,ANOVA):仅包含定性变量或 虚拟变量的回归模型,其形式如下:
Yi=B1+B2Di+ui 假定Y:每年食品支出(美元);Di=1表示
女性;Di=0表示男性,则: 男性食品支出的期望:E(Yi|Di=0)=B0 女性食品支出的期望: E(Yi|Di=0)=B0+B1
定性变量:OPEN(公开竞争否),DEMOCRAT(民主 党),COMM(共和党)
回归的比较
对于模型:
Yi=B1+B2Di+B3Xi+B4(DiXi)+ui
给定Di=0,并对上式两端取均值,得男性 平均食品支出函数: