第九章虚拟变量与CHOW检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

如,设
1 Dt 0
正常年份 反常年份
消费模型可建立如下:
Ct 0 1 X t 2 Dt X t t
• 这里,虚拟变量D以与X相乘的方式引入了模型中 ,从而可用来考察消费倾向的变化。 • 假定E(i)= 0,上述模型所表示的函数可化为: 正常年份:
E(Ct | X t , Dt 1) 0 ( 1 2 ) X t
反常年份:
E(Ct | X t , Dt 0) 0 1 X t
书85页例4.5
• 假说:市场经济(经济制度)让农民对 价格更敏感。 • 注意:调整后的公式如下: • Y=b0+b1Pt+b2Xt+a1(PtDt) • 问: • 如果b1不显著,但 a1显著,说明了什么 ?本题假说是否正确? • 如果上述参数显著性正好相反呢?
• 大学及其以上: E(Yi | X i , D1 0, D2 1) ( 0 3 ) 1 X i 假定3>2,其几何意义:
大学教育 保健 支出 高中教育 低于中学教育
收入
• 还可将多个虚拟变量引入模型中以考察多种“定 性”因素的影响。
如在上述职工薪金的例中,再引入代表学历的虚拟 变量D2:
3、加法乘法并用
1 反常情况 D= 0 正常情况 Y=b0+b01D+b1 X+ b11D X
Y 反常 正常 b01 b0 X 截距和斜率均发生变化
反常情况: Y=(b0+b01)+(b1+b11) X 正常情况: Y = b0 + b1 X
4、临界指标的虚拟变量的引入
在经济发展的转折时期 Y 以 t* =1979 为转折期 以转折期的自变量 X 为临界值
在E(i)=0 的初始假定下,高中以下、高中、大学 及其以上教育水平下个人保健支出的函数:
• 高中以下: • 高中:
E(Yi | X i , D1 0, D2 0) 0 1 X i
E(Yi | X i , D1 1, D2 0) ( 0 2 ) 1 X i
E(Yi | X i , Di 0) 0 1 X i
企业男职工的平百度文库薪金为:
E(Yi | X i , Di 1) ( 0 2 ) 1 X i
几何意义:
• 假定2>0,则两个函数有相同的斜率,但有不同 的截距。意即,男女职工平均薪金对教龄的变化 率是一样的,但两者的平均薪金水平相差2。 • 可以通过传统的回归检验,对2的统计显著性进 行检验,以判断企业男女职工的平均薪金水平是 否有显著差异。
• 用全部数据做回归等同于加上k个约束条件,即两个方程 的所有参数都相同; • 用两组数据分别做回归则得到两套不同的截距和斜率系数 ,因而相应的自由度为T-2k,T为样本总量。
注:邹检验的自由度
• SSRR:T-K-1,在大样本条件下1可忽略 ,即T-K; • SSR1+SSR1:受约束增加一倍,即2K, 其自由度为T-2K; • SSRR-(SSR1+SSR1)自由度:T-K-(T2K)=k;
一、虚拟变量的定义
根据属性类型,构造只取“0”或“1”的人工变量, 称为虚拟变量(Dummy Variable)。通常记为 D。 1 男 D= 0 女 含有虚拟变量的模型称为虚拟变量模型。
二、虚拟变量的引入
虚拟变量在模型中可以作解释变量,也可以作被解释 变量。一般是作解释变量。虚拟变量的引入有两种基本方 式:加法方式和乘法方式。
1 D2 0
本科及以上学历
本科以下学历
职工薪金的回归模型可设计为:
Yi 0 1 X i 2 D1 3 D2 i
于是,不同性别、不同学历职工的平均薪金分别为:
•女职工本科以下学历的平均薪金:
E(Yi | X i , D1 0, D2 0) 0 1 X i
• 对于计量经济学研究工作来说,这种情况表现为模型 的参数发生改变。 • 如果在样本资料所涉及的期间内发生过这样的情况, 那么就有必要检验模型参数的稳定性。 • Chow检验考虑样本是否包括了不同质的组,即检验不 同组间的参数是否相同。
Chow检验
• 在EVIWES中,Chow检验有两种不同的 方式:
Std. Error 257.6199 4.416825 16.44906 124.4252 85.84877 149.4807 70.37880 118.0740 0.103780 2.227820
t-Statistic 5.901295 -2.157263 -8.445509 3.953801 1.572858 -1.204685 11.76444 -5.062923 -9.097896 3.440613
– 平原; – 丘陵; – 山区。
• • • • • • • • • • • •
Variable C AGE EDU HILL MOU ROAD LAND IRRI RGIN DISS
Coefficient 1520.291 -9.528255 -138.9207 491.9524 135.0279 -180.0771 827.9669 -597.7996 -0.944183 7.665067
•男职工本科以下学历的平均薪金:
E(Yi | X i , D1 1, D2 0) ( 0 2 ) 1 X i
•女职工本科以上学历的平均薪金:
E(Yi | X i , D1 0, D2 1) ( 0 3 ) 1 X i
•男职工本科以上学历的平均薪金:
年薪 Y 男职工 女职工
2
0
工龄 X
又例:在横截面数据基础上,考虑个人保健支出 对个人收入和教育水平的回归。
教育水平考虑三个层次:高中以下, 高中, 大学及其以上
这时需要引入两个虚拟变量:
1 D1 0 高中 其他 1 D2 0 大学及其以上 其他
模型可设定如下: Yi 0 1 X i 2 D1 3 D2 i
1 t t* D= 0 t < t* Y=b0+ b1X+ b2 (X X *)D 反常情况: Y=b0 b2 X *+ (b1+b2) X 正常情况: Y = b0 + b1 X
b0 X* X
两条不同时期的直线可在转折 期连起来成为一条折线
三、模型中引入虚拟变量的作用
1、分离异常因素的影响 2、检验不同的属性类别因素对因变量的影响 3、提高模型的精度
四、虚拟变量设置的原则
在模型中引入多个虚拟变量时,虚拟变量的个 数应按下列原则确定:如果有 m 种互斥的属性类型 ,在模型中引入 m-1 个虚拟变量。 如研究季节对销售量的影响 C = b0+ b1 X + a1 D1 + a2 D2 + a3 D3 + u 1 D1 = 0 1 D2 = 0 1 D3 = 0 春季 其它季节 夏季 其它季节 秋季 其它季节 当心 虚拟变量陷阱
– 转折点检验(breakpoint test): – 预测检验(forecast test)
Chow检验
• Chow转折点检验基于这样一种思路:
– 如果确实存在结构变化,那么分别对结构变化发生 前和发生后的子样本数据做回归时得到的残差平方 和要小于利用全部样本数据估计模型得到的残差平 方和。 – 这是由于前者允许两个子模型有不同的参数,而后 者则令两个时期的参数相同,因而前者通常可以得 到对样本数据的较好拟合。
1、加法方式
1 反常情况 D= 0 正常情况 Y = b0 + b1 X + b2 D + u
Y 反常 正常 b2 b0 X 增加的一个截距可认为是虚拟变量 带来的影响。
反常情况: Y = (b0 + b2 ) + b1 X + u 正常情况: Y = b0 + b1 X + u
假设职工工资主要与教龄相关,但性别会对工 资产生影响。检验男职工是否比女职工工资更高, 在该模型中, 企业女职工的平均薪金为:
• 我们将前者称作是无参数限制的模型,后者是 有参数限制的模型。 • 通过比较加上参数约束后是否使残差平方和显 著增大,我们可以检验模型是否存在结构变化 。
Chow检验
• 考虑分两个组的情况,检验过程分以下步骤:
– 依据对转折发生时间的了解,将全部样本分为两个部分; – 分别用两个组的数据做回归(即参数未受限制的情况) ,得到残 差平方和SSR1和SSR2(注意有RSSur=RSS1+RSS2); – 用全部数据做回归(即参数受限制的情况),得到残差平方和 SSR; SSR SSR1 SSR2 T 2 K – 计算F统计值 F SSR1 SSR2 K – 检验其显著性。
– 若预测与实际情况有很大偏差, RSSr会显著大于RSSu ,这意 味着两个子样本之间可能出现结构变化。
RSSu T1 k
自由度:
• SSRR=T1+T2-K-1,1忽略之后,即T1+T2K; • SSRU=T1-K-1,1忽略之后,即T1-K,因 为未受约束的样本量是预测之前的样本 量,即T1。
在 Eviews 中直接输入变量 data D1 D2 D3
季节 春季 夏季 秋季 冬季
D1 1 0 0 0
D2 0 1 0 0
D3 0 0 1 0
五、Chow检验
• 在现实生活中,有时会由于某些重大的政策和制度变 化或偶发事件,导致经济运行机制或行为改变。
– 不同的经济体制 – 不同的生产条件
E(Yi | X i , D1 1, D2 1) ( 0 2 3 ) 1 X i
书84页例4.4
• 请同学自习,然后回答下列问题: • 为何虚拟变量只设中部与西部,东部为 何不设? • 代表中西部的系数为何会是负数?
2、乘法方式
1 反常情况 D= 0 正常情况 Y=b0+b1 X+b11 DX+ u
Y 反常
正常
反常情况: Y = b0 + (b1+ b11)X + u 正常情况: Y = b0 + b1 X + u
b0 X
斜率发生了变化,可认为是虚拟变量 带来的影响。
例:根据消费理论,消费水平C主要取决于 收入水平Y,但在一个较长的时期,人们的消 费倾向会发生变化,尤其是在自然灾害、战 争等反常年份,消费倾向往往出现变化。这 种消费倾向的变化可通过在收入的系数中引 入虚拟变量来考察。
上章回顾
•自相关原因是什么? •如何检验自相关? •如何消除自相关?
第九章
虚拟变量及其设置的方法
虚拟变量
经济变量 可直接度量的变量 不可直接度量的变量 建立和应用计量经济学模型时,经常要考虑属性因素的 影响。例如,职业对个人收入的影响、战争与和平对经济发 展的影响、繁荣与萧条对就业的影响、文化程度对工资的影 响、自然灾害对农业生产的影响、季节对销售量的影响。所 以需要考虑是否在模型中引入属性因素。
Prob. 0.0000 0.0313 0.0000 0.0001 0.1162 0.2287 0.0000 0.0000 0.0000 0.0006
案例2:CHOW检验
• 数据:安徽省粮食种植面积; • 目的:预测十二五我省粮食种植面积;
散点图:
案例1:地理区位影响
• 研究安徽省粮食可挖掘生产潜力的影响 因素,假说如下: • 人口的老化与非农化导致粮食生产潜力 没有挖掘; • 基础设施的不完善导致粮食生产潜力无 法实现。 • 地理区位因为即影响基础设施又影响劳 动力转移所以是比较重要的影响因素。
数据与虚拟变量设置
• 数据:共894个农户,分布区域包括:
Chow预测检验
• Chow转折点检验方法存在一个问题,若某个子样本包 括的观察值太少,那么可能无法用其估计子模型。此 时可以考虑采用Chow预测检验。 • Chow预测检验同样需要将全部样本分为两个部分,检 验的步骤为:
– – – – 利用全部样本估计模型,得到RSSr; 利用第一个子样本(假定容量为T1)估计模型,得到RSSu ; 用估计的模型预测第二个子样本(假定容量为T2)的因变量; 计算F统计量: F RSSr RSSu T2
相关文档
最新文档