第八章虚拟变量参考答案
计量经济学庞皓第二版第八章练习题及参考答案
第八章练习题及参考解答8.1 Sen 和Srivastava (1971)在研究贫富国之间期望寿命的差异时,利用101个国家的数据,建立了如下的回归模型:2.409.39ln3.36((ln 7))i i i i Y X D X =-+--(4.37) (0.857) (2.42) R 2=0.752其中:X 是以美元计的人均收入;Y 是以年计的期望寿命;Sen 和Srivastava 认为人均收入的临界值为1097美元(ln10977=),若人均收入超过1097美元,则被认定为富国;若人均收入低于1097美元,被认定为贫穷国。
括号内的数值为对应参数估计值的t-值。
1)解释这些计算结果。
2)回归方程中引入()ln 7i i D X -的原因是什么?如何解释这个回归解释变量? 3)如何对贫穷国进行回归?又如何对富国进行回归? 4)从这个回归结果中可得到的一般结论是什么? 练习题8.1参考解答: 1. 结果解释依据给定的估计检验结果数据,对数人均收入对期望寿命在统计上并没有显著影响,截距和变量()ln 7i i D X -在统计上对期望寿命有显著影响;同时,()()2.40 3.3679.39 3.36ln ((ln 7)) 1 2.409.39ln 0 i i i i i i i X D X D Y X D ⎧-+⨯+---==⎨-+=⎩富国时穷国时 表明贫富国之间的期望寿命存在差异。
2. 回归方程中引入()ln 7i i D X -的原因是从截距和斜率两个方面考证收入因素对期望寿命的影响。
这个回归解释变量可解释为对期望寿命的影响存在截距差异和斜率差异的共同因素。
3. 对穷国进行回归时,回归模型为12ln 1097i i i i i i Y X Y X αα=+≤,其中,为美元时的寿命; 对富国进行回归时,回归模型为12ln 1097i i i i i i Y X Y X ββ=+>,其中,为美元时的寿命;4. 一般的结论为富国的期望寿命药高于穷国的期望寿命,并且随着收入的增加,在平均意义上,富国的期望寿命的增加变化趋势优于穷国,贫富国之间的期望寿命的确存在显著差异。
庞皓《计量经济学》笔记和课后习题详解(虚拟变量回归)【圣才出品】
1.用虚拟变量表示不同截距的回归——加法方式 以加法方式将虚拟变量引入模型,只会改变模型在不同情况下的截距,不会影响斜率。 按照变量的种类和数量进行分类,可以分成四种情况,具体如表 8-2 所示。
2 / 27
圣才电子书 十万种考研考证电子书、题库视频学习平台
2.用虚拟变量表示不同斜率的回归——乘法方式 以乘法形式引入虚拟解释变量,会改变模型的截距和斜率。用乘法方式引入虚拟变量的 作用是:①进行两个回归模型的比较,即结构变化检验;②进行因素间的交互影响分析;③ 使模型更加符合现实经济现象。按照不同的作用,可以将乘法方式分成三种,具体如表 8-3 所示。
表 8-3 以乘法方式引入虚拟变量的三种类型
2.虚拟变量的作用及模型的类型 (1)虚拟变量的作用 ①可以作为性别、所有制等属性因素的代表。 ②可以作为受教育程度、管理者素质等非精确计量的数量因素的代表。 ③可以作为战争、灾害、改革前后等偶然因素或政策因素的代表。 ④可以作为时间序列分析中季节(月份)的代表。 ⑤可以实现分段回归,研究斜率、截距的变动,或比较两个回归模型的结构差异等。 (2)虚拟变量模型的类型(见表 8-1)
考点三:虚拟被解释变量 ★★★★
1.线性概率模型(LPM) (1)线性概率模型含义 当被解释变量是虚拟变量,并且模型的函数形式为线性时,即 Yi=β1+β2Xi+ui,该模 型就是线性概率模型。 由于 E(Yi)=0·(1-pi)+1·pi=pi,其中 pi 表示 Yi=1 的概率,所以系数 β2 可解释 为:当其他条件不变时,X 每增加 1 单位,Y=1 的概率增加值。 (2)线性概率模型的估计 ①线性概率模型不能直接用普通最小二乘进行估计,因为存在如下问题: a.随机扰动项 ui 的非正态性。在线性概率模型中,ui 不再服从正态分布,但是对参数 的假设检验和区间估计要求随机扰动项 ui 服从正态分布。当对大样本进行估计时,OLS 估 计量的概率分布将会趋近于正态分布,估计值不会因为非正态性而产生很大的误差。
计量经济学课后习题答案第八章_答案
第八章虚拟变量模型1. 回归模型中引入虚拟变量的作用是什么?答:在模型中引入虚拟变量,主要是为了寻找某(些)定性因素对解释变量的影响。
加法方式与乘法方式是最主要的引入方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。
除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。
2. 虚拟变量有哪几种基本的引入方式?它们各适用于什么情况?答:在模型中引入虚拟变量的主要方式有加法方式与乘法方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。
除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。
3.什么是虚拟变量陷阱?答:根据虚拟变量的设置原则,一般情况下,如果定性变量有m个类别,则需在模型中引入m-1个变量。
如果引入了m个变量,就会导致模型解释变量出现完全的共线性问题,从而导致模型无法估计。
这种由于引入虚拟变量个数与类别个数相等导致的模型无法估计的问题,称为“虚拟变量陷阱”。
4.在一项对北京某大学学生月消费支出的研究中,认为学生的消费支出除受其家庭的每月收入水平外,还受在学校中是否得到奖学金,来自农村还是城市,是经济发达地区还是欠发达地区,以及性别等因素的影响。
试设定适当的模型,并导出如下情形下学生消费支出的平均水平:(1) 来自欠发达农村地区的女生,未得到奖学金;(2)来自欠发达城市地区的男生,得到奖学金;(3)来自发达地区的农村女生,得到奖学金;(4)来自发达地区的城市男生,未得到奖学金。
解答:记学生月消费支出为Y,其家庭月收入水平为X,则在不考虑其他因素的影响时,有如下基本回归模型:Y i=β0+β1X i+μi有奖学金1 来自城市无奖学金来自农村来自发达地区 1 男性0 来自欠发达地区0 女性Y i=β0+β1X i+α1D1i+α2D2i+α3D3i+α4D4i+μi由此回归模型,可得如下各种情形下学生的平均消费支出:(1)来自欠发达农村地区的女生,未得到奖学金时的月消费支出:E(Y i|=X i,D1i=D2i=D3i=D4i=0)=β0+β1X i(2)来自欠发达城市地区的男生,得到奖学金时的月消费支出:E(Y i|=X i,D1i=D4i=1,D2i=D3i=0)=(β0+α1+α4)+β1X i(3)来自发达地区的农村女生,得到奖学金时的月消费支出:E(Y i |=X i ,D 1i =D 3i =1,D 2i =D 4i =0)=(β0+α1+α3)+β1X i (4)来自发达地区的城市男生,未得到奖学金时的月消费支出: E(Y i |=X i ,D 2i =D 3i =D 4i =1,D 1i =0)=(β0+α2+α3+α4)+β1X i5. 研究进口消费品的数量Y 与国民收入X 的模型关系时,由数据散点图显示1979年前后Y 对X 的回归关系明显不同,进口消费函数发生了结构性变化:基本消费部分下降了,而边际消费倾向变大了。
计量经济学习题册第八章、第九章、第十章 答案
第八章一、名词解释1、虚拟变量:在建立模型时,有一些影响经济变量的因素无法定量描述,如职业、性别对收入的影响,教育程度,季节因素等往往需要用定性变量度量。
为了在模型中反映这类因素的影响,并提高模型的精度,需要将这类变量“量化”。
根据这类边另的属性类型,构造仅取“0”或“1”的人工变量,通常称这类变量为“虚拟变量”2、虚拟变量陷阱:一般在引入虚拟变量时要求如果有m个定性变量,字在模型中引入m-1个虚拟变量。
否则,如果引入m个虚拟变量,就会导致模型解释变量间出现完全共线性的情况。
我们一般称由于引入虚拟变量个数与定性因素个数相同出现的模型无法估计的问题,称为“虚拟变量陷阱”二、单项选择题1、B:“地区”一个,“季节”三个2、A:将D=1代入估计后的方程即可3、D:“季节”包含4个类型,只能用3个虚拟变量,用4个虚拟变量会出现完全多重共线的问题,参数将无法估计4、C:“地区”只有两个类别,引入两个虚拟变量会出现完全多重共线问题5、A:1α体现了城镇和农村截距上的差异,1β体现了城镇和农村斜率上的差异,当它们为0时,表示无差异6、A:斜率相同,仅截距不同7、D:此问题表现为1000前后斜率的变化,B表示截距的变化,不合适;C在D=0时没有解释变量,不正确;A和D相比,D更合适,A会造成曲线在临界值出断开,但D会保证曲线的连贯的。
8、A:虚拟变量表示性别、季节等时,只表示属性的不同,没有等级之分,作为质的因素;表示收入高低时,高与低是有级别的,属于有序数据,可以表示数量的因素。
9、A/B:这题比较牵强,按书上原话应该选择B;但当用加法引入虚拟变量时,会存在问题。
【当用加法形式引入虚拟变量时,用一个虚拟变量作为截距项,取值全部为1;其他m-1个表示该因素的前三个类型。
如果不引入截距项,当虚拟变量都取0时不能解释该因素第四个类型的作用。
】10、D :概念性三、多项选择题1、B C D :A 太绝对,也可以表示数量因素;E 太绝对2、ABCDE :A 加法方式;B 乘法方式;C 临界指标的虚拟变量;D 在ABC 基础上可构造分段回归3、AB :C 当虚拟变量取0或2时,过程一样,但参数的意义稍作调整;D 见书P207倒数第二段。
(完整版)第八章 虚拟变量回归 答案
第八章 虚拟变量回归一、判断题1。
虚拟变量只能作为解释变量.(F)2。
引入虚拟变量后,用普通最小二乘法得到的估计量仍是无偏的。
( T )3.引入虚拟变量的个数与模型有无截距项无关.(F )4。
虚拟变量用来表示某些具有若干属性的变量.(T)5。
引入虚拟变量的个数与样本容量大小有关。
(F )二、单项选择题1.设消费函数011t t t y a a D b x u =+++,其中虚拟变量10D ⎧=⎨⎩东中部西部,如果统计检验表明10a =成立,则东中部的消费函数与西部的消费函数是( D ).A. 相互平行的 B 。
相互垂直的 C. 相互交叉的 D 。
相互重叠的2.虚拟变量( A )A 。
主要来代表质的因素,但在有些情况下可以用来代表数量因素B 。
只能代表质的因素C 。
只能代表数量因素D.只能代表季节影响因素3。
分段线性回归模型的几何图形是( D )A 。
平行线 B. 垂直线 C 。
光滑曲线 D. 折线4.如果一个回归模型中(包含截距项),对一个具有m 个特征的质的因素要引入虚拟变量数目为( B ).A.m B 。
m-1 C 。
m —2 D.m+15.设某商品需求模型为01t t t y b b x u =++,其中Y 是商品的需求量,X 是商品的价格,为了考虑全年12个月份季节变动的影响,假设模型中引入了12个虚拟变量,则会产生的问题为( D )。
A .异方差性B .序列相关C .不完全的多重共线性D .完全的多重共线性6.设消费函数为i i i 33i 22i 11o i u bx D D D y +++++=αααα,其中y 为消费,x 为收入,虚拟变量⎩⎨⎧=⎩⎨⎧=⎩⎨⎧=其他季度第三季度,其他季度第二季度,其他季度第一季度 0 0 0 321D 1D 1D 1,该模型中包含了几个定性影响因素?( A )。
A 。
1B 。
2C 。
3D 。
47。
设消费函数为i i i o i u Dx b x b D y ++++=101αα,其中虚拟变量⎩⎨⎧=农村家庭城镇家庭 0 1D ,当统计检验表明下列哪项成立时,表示城镇家庭与农村家庭有一样的消费行为( A ).A 。
第八章虚拟解释变量回归
第八章虚拟解释变量回归第一节虚拟变量一、虚拟变量的差不多概念在前面的分析中,被说明变量要紧受到一些能够直截了当度量的变量阻碍,如收入、产出、商品需求量、价格、成本、资金、人数等。
但现实经济生活中,阻碍被说明变量变动的因素,除了这些能够直截了当获得实际观测数据的定量变量外,还包括一些本质上为定性因素(或称属性因素)的阻碍,例如性别、种族、肤色、职业、季节、文化程度、战争、自然灾难、政府经济政策的变动等因素。
在实际经济分析中,这些定性变量有时具有不可忽视的重要阻碍。
例如,研究某个企业的销售水平,产业部门(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、治理者素养的高低等是值得经常考虑的阻碍因素,这些因素有共同的特点,即差不多上表示某种属性的,不能直截了当用数据精确描述的因素。
因此,被说明变量的变动经常是定量因素和属性因素共同作用的结果。
在计量经济模型中,应当同时包含定量和属性两种因素对被说明变量的阻碍作用。
定量因素是指那些可直截了当测度的数值型因素,如GDP、M2等。
定性因素,或称为属性因素,是不能直截了当测度的、说明某种属性或状态存在与否的非数值型因素,如男性或女性、都市居民或非都市居民、气候条件正常或专门、政府经济政策不变与改革等。
在计量经济学的建模中应当将定量因素和定性因素同时纳入模型之内。
为了在模型中反映定性因素,能够将定性因素转化为虚拟变量去表现。
虚拟变量(或称为属性变量、双值变量、类型变量、定性变量、二元型变量等),是人工构造的取值为0和1的作为属性变量代表的变量,一样用字母D(或DUM,英文dummy的缩写)表示。
属性因素通常具有若干类型或水平,通常虚拟变量的取值为0和1,当虚拟变量取值为0,即D=0时,表示某种属性或状态不显现或不存在,即不是某种类型;当虚拟变量取值为1,即D=1时,表示某种属性或状态显现或存在,即是某种类型。
例如,构造政府经济政策人工变量,当经济政策不变时,虚拟变量取值为0,当经济政策改变时,虚拟变量取值为1。
第八章 虚拟变量实验报告
第八章虚拟变量实验报告一、研究目的改革开放以来, 我国经济保持了长期较快发展, 我国对外贸易规模也日益增长。
尤其是2002年中国加入WTO之后, 我国对外贸易迅速扩张。
2012年, 我国进出口总值38667.6亿美元, 与上年同期相比增长6.2%, 我国贸易总额首次超过美国, 成为世界贸易规模最大的国家。
为了考察我国对外贸贸易与国内生产总值的关系是否发生变化, 以国内生产总值代表经济整体发展水平, 以对外贸易总额代表对外贸易发展水平, 分析我国对外贸易发展受国内生产总值的影响程度。
二、模型设定为研究我国对外贸易发展规模受我国总体经济发展程度影响, 引入国内生产总值为自变量。
设定模型为:+β1X t+ U tY t=β参数说明:Yt——对外贸易总额(单位: 亿元)Xt——国内生产总值(单位: 亿元)U t——随机误差项收集到数据如下(见表2-1)1993 11271 35333.92 2007 166740.2 265810.31 1994 20381.9 48197.86 2008 179921.5 314045.43 1995 23499.9 60793.73 2009 150648.1 340902.81 1996 24133.8 71176.59 2010 201722.1 401512.8 1997 26967.2 78973.03 2011 236402 472881.56 1998 26693.823 73617.66322注: 资料来源于《中国统计年鉴》1986-2012。
为了研究1985-2011年期间我国对外贸易总额随国内生产总值的变化规律是否有显著不同, 考证对外贸易与国内生产总值随时间变化情况, 如下图所示。
图2-1 对外贸易总额(Y)与国内生产总值(X)随时间变化趋势图从图2-1中, 可以看出对外贸易总额明显表现出了阶段特征: 在2002年、2007年和2009年有明显的转折点。
虚拟变量答案
虚拟变量习题一、 单项选择题1、 若一个回归模型包含截距项,对一个具有m 个特征的质的因素需要引入的虚拟变量个数为( B )A.m-2B.m-1C.mD.m+12、 某商品需求函数为:Y i =β0+β1X i +μi ,其中Y为需求量,X 为价格,为了考虑“性别”(男性、女性)和“地区”(东部、中部、西部)两个因素的影响,考虑引入虚拟变量,则应引入虚拟变量的个数为( 3 )A. 5B. 4C. 3D. 23、 消费函数Y i =α0+α1D+β0X i +β1DX i +μi ,其中虚拟变量D=⎩⎨⎧农村家庭城镇家庭01,当统计检验表明下列哪项成立时,表示城镇家庭与农村家庭有一样的消费行为( A )A. α1=0, β1=0B. α1=0, β1≠0C. α1≠0, β1=0D. α1≠0, β1≠04、 根据样本资料建立某消费函数如下:ˆ100.5055.350.45t tC D X =++,其中C 为消费,X 为收入,虚拟变量 1 D 0 ⎧=⎨⎩城镇家庭农村家庭,所有参数均检验显著,则城镇家庭的消费函数为 ( C )A 、ˆ155.850.45t t C X =+B 、ˆ100.500.45t tC X =+ C 、ˆ100.5055.35t t C X =+D 、ˆ100.9555.35t tC X =+5、 假设某需求函数为01i i i Y X ββμ=++,为了考虑“季节”因素(春、夏、秋、冬四个不同的状态),引入4个虚拟变量形成截距变动模型,则模型的 ( D )A 、参数估计量将达到最大精度B 、参数估计量是有偏估计量C 、参数估计量是非一致估计量D 、参数将无法估计6、 对于模型01i i i Y X ββμ=++,为了考虑“地区”因素(北方、南方),引入2个虚拟变量形成截距变动模型,则会产生 ( A )A 、序列的完全相关B 、序列的不完全相关C 、完全多重共线性D 、不完全多重共线性7、 设消费函数01i i i Y D X ααβμ=+++,其中虚拟变量 1 D 0 ⎧=⎨⎩北方南方,如果统计检验表明11α=成立,则北方的消费函数与南方的消费函数是 ( A )A 、相互平行的B 、相互垂直的C 、相互交叉的D 、相互重叠的8、 假定月收入水平在1000元以内时,居民边际消费倾向维持在某一水平,当月收入水平达到或超过1000元时,边际消费倾向将明显下降,则描述消费(C )依收入(I )变动的线性关系宜采用 ( D )A 、0120, 1t t t t C I DI D αββμ⎧=+++=⎨≥⎩ I<1000元 I 1000元B 、0120, 1t t tCD I D αββμ⎧=+++=⎨≥⎩I<1000元 I 1000元 C 、**010(), 1000, 1t t t C I I D I D αβμ⎧=+-+==⎨≥⎩I<1000元元 I 1000元 D 、**0120(), 1000, 1t t t t C I I I D I D αββμ⎧=++-+==⎨≥⎩ I<1000元元 I 1000元 9、 虚拟变量 ( B )A 、可以取1或者2B 、只能代表质的因素C 、只能代表数量因素D 、只能代表季节影响因素10、 由于引入虚拟变量,回归模型的截距项和斜率都发生变换,则这种模型称为 ( D )A 、平行模型B 、重合模型C 、汇合模型D 、相异模型二、多项选择题1、关于虚拟变量,下列表述正确的有 ( BC )A 、是质的因素的数量变化B 、一般情况下取值为1和0C 、代表质的因素D 、在有些情况下可以代表数量因素E 、代表数量因素2、在线性模型中引入虚拟变量,可以反映 ( ABCD )A 、截距项变动B 、斜率变动C 、截距项和斜率同时变动D 、分段回归3、关于虚拟变量设置原则,下列表述正确的有 ( ABCD )A 、当定性因素有m 个类别时,引入m-1个虚拟变量B 、当定性因素有m 个类别时,引入m 个虚拟变量,会产生多重共线性问题C 、虚拟变量的值只能去0和1D 、在虚拟变量的设置中,基础类别一般取值为0三、判断题1、在回归模型012i i i i Y X D βββμ=+++中,如果虚拟变量i D 的取值为0或2, 而非通常情况下的0或1,那么,参数0β、1β、2β的估计值将减半。
计量经济学 第二版 第8章 虚拟变量
房地产价格受到以下因素影响:
易于量化的定量因素,如成本因素、房地产供求因素、经济
因素、人口因素; 不易量化的定性因素,如社会因素、行政因素、区位因素、 个别因素、投机因素、自然因素。在研究房地产价格中这些 定性变量具有不可忽视的重要影响。
问题的一般性描述
定量因素:可直接测度、数值性的因素。 定性因素:属性因素,表征某种属性存在与否的非数值性的 因素。
D=
2 研究生 1 本科 0 大专及以下
这样设置隐含了一个假定:研究生和本科生、 本科生与大专生之间薪酬差异程度相同
“0”和“1”选取原则
虚拟变量取“1”或“0”的原则,应从分析问题的 目的出发予以界定。 从理论上讲,虚拟变量取“0”值通常代表比较的 基础类型;而虚拟变量取“1”值通常代表被比较 的类型。 “0”代表基期(比较的基础,参照物); “1”代表报告期(被比较的效应)。
第八章 虚拟变量
一、虚拟变量及其作用 二、虚拟变量的设定 三、虚拟变量的特殊应用 四、虚拟被解释变量 练习题及参考资料 返回
教学目的及要求
了解虚拟变量的意义和作用,掌握虚拟解释变 量的引入方式与设置原则,掌握EViews软件 的相关应用。 掌握虚拟解释变量在调整季节波动、检验模型 的稳定性、分段回归和混合回归等方面的特殊 应用。 了解线性概率模型、Logit模型和Probit模型 的基本思想和估计方法。
例子:性别、国籍、城乡、政策实施、种族、学历、 季节等等
如:
1 D 0
城镇居民
农村居民 政策紧缩
1 D 0 1 D 0
销售旺季
销售淡季
本科以上学历 本科以下学历
1 D 0
政策宽松
变量的划分应遵循穷举与互斥原则。
第八章 虚拟变量回归 答案
第八章 虚拟变量回归一、判断题1.虚拟变量只能作为解释变量。
(F )2. 引入虚拟变量后,用普通最小二乘法得到的估计量仍是无偏的。
( T )3.引入虚拟变量的个数与模型有无截距项无关。
(F )4.虚拟变量用来表示某些具有若干属性的变量。
(T )5.引入虚拟变量的个数与样本容量大小有关。
(F )二、单项选择题1.设消费函数011t t t y a a D b x u =+++,其中虚拟变量10D ⎧=⎨ ⎩东中部西部,如果统计检验表明10a =成立,则东中部的消费函数与西部的消费函数是( D )。
A. 相互平行的B. 相互垂直的C. 相互交叉的D. 相互重叠的2.虚拟变量( A )A.主要来代表质的因素,但在有些情况下可以用来代表数量因素B.只能代表质的因素C.只能代表数量因素D.只能代表季节影响因素3.分段线性回归模型的几何图形是( D )A. 平行线B. 垂直线C. 光滑曲线D. 折线4.如果一个回归模型中(包含截距项),对一个具有m 个特征的质的因素要引入虚拟变量数目为( B )。
A.mB.m-1C.m-2D.m+15.设某商品需求模型为01t t t y b b x u =++,其中Y 是商品的需求量,X 是商品的价格,为了考虑全年12个月份季节变动的影响,假设模型中引入了12个虚拟变量,则会产生的问题为( D )。
A .异方差性B .序列相关C .不完全的多重共线性D .完全的多重共线性6.设消费函数为i i i 33i 22i 11o i u bx D D D y +++++=αααα,其中y 为消费,x 为收入,虚拟变量⎩⎨⎧=⎩⎨⎧=⎩⎨⎧=其他季度第三季度,其他季度第二季度,其他季度第一季度 0 0 0 321D 1D 1D 1,该模型中包含了几个定性影响因素?( A )。
A.1B. 2C. 3D. 47. 设消费函数为i i i o i u Dx b x b D y ++++=101αα,其中虚拟变量⎩⎨⎧=农村家庭城镇家庭 0 1D ,当统计检验表明下列哪项成立时,表示城镇家庭与农村家庭有一样的消费行为( A )。
第八章 虚拟变量回归作业及答案一单选题
第八章虚拟变量回归作业及答案一单选题1、设某地区消费函数中,消费支出不仅与收入x有关,而且与消费者的年龄构成有关,若将年龄构成分为小孩、青年人、成年人和老年人4个层次。
假设边际消费倾向不变,考虑上述年龄构成因素的影响时,该消费函数引入虚拟变量的个数为( C )。
A. 1个B. 2个C. 3个D. 4个2、对于含有截距项的计量经济模型,若想将含有m个互斥类型的定性因素引入到模型中,则应该引入虚拟变量个数为( B )。
A.mB.m-1C.m+1D.m-k3、对于一个不包含截距项的回归模型,若将一个具有m个特征的质的因素引入进计量经济模型,则虚拟变量数目为( A ) 。
A.mB.m-1C.m-2D.m+14、在利用月度数据构建计量经济模型时,如果一年里的1、3、5三个月表现出季节模式,则应该引入虚拟变量个数为( A )。
A.3B.12C.11D.75、设某计量经济模型为:Yi=a+b*Di+ui,其中Yi表示大学教授年薪,D为虚拟变量,D=1:男教授;D=0:女教授。
对于参数b的含义,下列解释正确的是( C )。
A. b表示大学女教授的平均年薪B. b表示大学男教授的平均年薪C. b表示大学男教授与女教授平均年薪的差异D. b表示大学男教授和女教授平均年薪6、当质的因素引进经济计量模型时,需要使用( D )。
A.外生变量B.前定变量C.内生变量D.虚拟变量7、某商品需求函数为Yi=a+b*Xi+ui,其中Y为需求量,X为价格。
为了考虑“地区”(农村、城市)和“季节”(春、夏、秋、冬)两个因素的影响,拟引入虚拟变量,则应引入虚拟变量的个数为( B )。
A.2B.4C.5D.6二多选题1、关于虚拟变量,下列表述正确的有( ABC )A.是质的因素的数量化 B.可取值为l和0C.代表质的因素 D.代表数量因素2、虚拟变量的特殊作用有( BCD )A.检验模型结构的显著性 B.检验模型结构的稳定性C.分段回归 D.混合回归3、虚拟变量的取值为0和1,分别代表某种属性的存在与否,其中( BC )A. 0表示存在某种属性B.0表示不存在某种属性C. 1表示存在某种属性D.0和1代表的内容可以随意设定4、下面关于虚拟变量的引入方式的说法,正确的有( AD )A.以加法方式引入虚拟变量,反映的是定性因素对截距的影响B.以加法方式引入虚拟变量,反映的是定性因素对斜率的影响C.以乘法方式引入虚拟变量,反映的是定性因素对截距的影响D.以乘法方式引入虚拟变量,反映的是定性因素对斜率的影响5、关于虚拟变量,下列说法正确的是( AC )。
第五章虚拟变量-第八章虚拟变量
29
第5章习题
一、单项选择题 1、如果一个回归模型中不包含截距项,对一个具
有m个特征的质的因素需要引入的虚拟变量的个 数为: A、m B、m-1 C、m-2 D、m+1
30
2、设个人消费函数Yi=c0+c1Xi+ui中,消费支出Y不仅与收 入X有关,而且与消费者的性别、年龄构成有关,年龄构 成可分为青年、中年和老年三个层次,假设边际消费倾向 不变,则考虑上述因素的影响,该函数引入虚拟变量的个 数为:
山米与白鹤
贝特西.贝尔斯
第五章虚拟变量-第八章虚拟变量
问题的提出
1、计量经济学模型,需要经常考虑属性因素 的影响。例如,职业、战争与和平、繁荣与 萧条、文化程度、灾害、季节 2、属性因素往往很难直接度量它们的大小。 只能给出它们的“Yes—D=1”或”No—D=0”、 或者它们的程度或等级。 3、为了反映属性因素和提高模型的精度, 必须将属性因素“量化”。通过构造0-1型 的人工变量来量化属性因素。
Y= b0 + b1 x +e
17
三、截距与斜率同时变动 模型
D=1 异常时期 D=0 正常时期 设定模型 Y=b0+ b1x+ b2D + b3Dx +e 异常时期模型:(截距与斜率均不同) Y= (b0 + b2) + (b1 +b3) x +e 反常时期模型:(截距与斜率均不同) Y= b0 + b1 x +e
Yt 0 1Xt t
以t* 1979年为转折期,并设1979年的国民收入为 X*t ,并引入虚拟变量:
Dt
1,t t* 0,t t*
计量经济学第八章答案(第二版_庞皓_科学出版社)
第八章答案8.1 Sen 和Srivastava (1971)在研究贫富国之间期望寿命的差异时,利用101个国家的数据,建立了如下的回归模型:2.409.39ln3.36((ln 7))i i i i Y X D X =-+--(4.37) (0.857) (2.42) R 2=0.752其中:X 是以美元计的人均收入;Y 是以年计的期望寿命;Sen 和Srivastava 认为人均收入的临界值为1097美元(ln10977=),若人均收入超过1097美元,则被认定为富国;若人均收入低于1097美元,被认定为贫穷国。
括号内的数值为对应参数估计值的t-值。
1)解释这些计算结果。
2)回归方程中引入()ln 7i i D X -的原因是什么?如何解释这个回归解释变量? 3)如何对贫穷国进行回归?又如何对富国进行回归? 4)从这个回归结果中可得到的一般结论是什么? 练习题8.1参考解答: 1. 结果解释依据给定的估计检验结果数据,对数人均收入对期望寿命在统计上并没有显著影响,截距和变量()ln 7i i D X -在统计上对期望寿命有显著影响;同时,()()2.40 3.3679.39 3.36ln ((ln 7)) 1 2.409.39ln 0 i i i i i i i X D X D Y X D ⎧-+⨯+---==⎨-+=⎩富国时穷国时 表明贫富国之间的期望寿命存在差异。
2. 回归方程中引入()ln 7i i D X -的原因是从截距和斜率两个方面考证收入因素对期望寿命的影响。
这个回归解释变量可解释为对期望寿命的影响存在截距差异和斜率差异的共同因素。
3. 对穷国进行回归时,回归模型为12ln 1097i i i i i i Y X Y X αα=+≤,其中,为美元时的寿命; 对富国进行回归时,回归模型为12ln 1097i i i i i i Y X Y X ββ=+>,其中,为美元时的寿命;4. 一般的结论为富国的期望寿命药高于穷国的期望寿命,并且随着收入的增加,在平均意义上,富国的期望寿命的增加变化趋势优于穷国,贫富国之间的期望寿命的确存在显著差异。
第八章虚拟变量参考答案
练习题8.1参考解答:(1)在其它条件不变的情况下,对数人均收入提高1%,则平均预期寿命可能提高约0.0939年。
但从统计检验结果看,对数人均收入lnX 对期望寿命Y 的影响并不显著。
方程的拟合情况良好,可进一步进行多重共线性等其他计量经济学的检验。
(2)引入()ln 7i i D X -的原因是想从截距和斜率两个方面考证将人均收入超过1097美元的国家定义为富国的话,贫国和富国的预期寿命是否存在显著的区别。
如果人均收入大于1097美元,那么虚拟变量取值为1,否则为0。
即:1 1097(l n()7)0 1097i i D X ⎧-=⎨⎩人均收入大于美元人均收入低于美元(3) 对于贫穷国,其回归方程为:2.409.39ln i X -+ 对于富国,其回归方程为:2.40(9.39-3.36)ln 3.36*721.12 6.03ln i i X X -++=+习题8.2参考答案由于有四个季度,因此引入三个季度虚拟变量1 1 1 1220 0 0 D D D ⎧⎧⎧===⎨⎨⎨⎩⎩⎩一季度二季度三季度其它其它其它(1)按照加法模型引入三个虚拟变量,模型为:(加法模型的作用是改变了设定模型的截距水平)i 0112233i i Y =D D D X ααααβμ+++++回归结果如下:123i 22ˆ=6910.449187.7317D 1169.32D 417.1182D 0.038008X t= (3.594792) (-0.28439 (1.835446) 065093256914 R =0.517642 R =0.416093 F=5.097454 DW=0.39625i Y -+-+)(-.) (.) (2)由于考虑利润对销售额的变化率发生变异,即斜率的改变,因此按照乘法模型引入三个虚拟变量,模型为:i 01i 1i 12i 23i 3i Y =X X D X D X D ββαααμ+++++回归结果如下:i i 1i 2i 322ˆ=7014.7570.037068X -0.000933X D 0.00791X D 0.002385X D t= (3.934394) (3.273896 (-0.216776) 0.0040180.58529 R =0.519733 R =0.418624 F=5.140311 DW=0.429628i Y ++--)() () (3)按照加法和乘法相结合的方式引入三个虚拟变量,模型为:i 01122331i 2i 13i 24i 3i Y =D D D X X D X D X D ααααββββμ++++++++回归结果为:i 123i i 1i 2i 322ˆY =10457.394752.26D 3764.21D 4635.46D 0.0159X 0.029X D 0.03X D 0.0266X D t= (2.566) (-0.87 (-0.6860.8320.6280824089960749 R =0.546701 R =0.348383 F=2---++++-)) () () (.) (.)(.).756686 DW=0.464982通过对三个模型对比分析可以看出,第三个模型的系数均不显著,模型一和二销售额的系数显著,其余系数也不显著。
计量经济学:第八章虚拟变量回归
计量经济学:第⼋章虚拟变量回归第⼋章虚拟变量回归第⼀节虚拟变量的概念⼀、问题的提出计量经济学模型对变量的要求——可观测、可计量。
但在现实经济问题中,存在定性影响因素,⽐如1、属性(品质)因素的表达。
在经济活动中,有的经济变量的变动要受到属性因素(或品质因素)的影响。
如收⼊在形成过程中,不同的性别所得到的收⼊是不⼀样的;在城乡、不同地区等收⼊存在差距;再⽐如,在我国,经济的发展⽔平对于不同的区域有不同的表现。
2、异常值现象。
当经济运⾏过程中,可能会受到突发事件的影响,那么,其值有可能出现异常,偏离正常轨迹很远,对这类现象需要加以修正。
3、季节因素的影响。
有的经济现象存在明显的季节特征,如啤酒的消费。
那么,在建模过程中,季节变动这⼀因素怎样考虑?4、离散选择现象的描述。
如公共交通与私⼈交通的选择、商品购买与否的决策、求职者对职业的选择等。
第1、2、3种情况属于解释变量为定性变量,第4情况为被解释变量属于定性变量。
称前⼀种情况为虚拟解释变量,后⼀种为虚拟被解释变量。
本章主要介绍虚拟解释变量的内容。
⼆、虚拟变量的定义1、定义。
设变量D 表⽰某种属性,该属性有两种类型,即当属性存在时D 取值为1;当属性不存在时D 取值为0。
记为=不具有该属性具有某种属性01D2、虚拟变量引⼊的规则。
(1)在模型⾥存在截距项的条件下,如果⼀个属性存在m 个相互排斥类型(⾮此即彼),则在模型⾥引⼊m-1个虚拟变量。
否则,会出现完全的多重共线性。
但要注意,在模型⽆截距项的情况下,如果⼀个属性存在m 个类型,即便引⼊m 个变量,不会出现多重共线性问题。
(请思考为什么?)(2)虚拟变量取值为0,意味着所对应的类型是基础类型。
⽽虚拟变量取值为1,代表与基础类型相⽐较的类型,称为⽐较类型。
例如“有学历”D 为1,“⽆学历”D 为0,则“⽆学历”就是基础类型,“有学历”为⽐较类型。
(3)当属性有m 个类型时,不能把虚拟变量的取值设成如下情况D=0,第⼀个类型;D=1,第⼆个类型;……D=m-1,第m 个类型。
《计量经济学》虚拟变量练习题及参考答案
一、选择题1、 对于一个含有截距项的计量经济模型,若某定性因素有m 个互斥的类型,为将其引入模型中,则需要引入虚拟变量个数为( B )A. mB. m-1C. m+1D. m-k 2、 在经济发展发生转折时期,可以通过引入虚拟变量方法来表示这种变化。
例如,研究中国城镇居民消费函数时。
1991年前后,城镇居民商品性实际支出Y 对实际可支配收入X 的回归关系明显不同。
现以1991年为转折时期,设虚拟变量⎩⎨⎧=年以前,年以后,1991019911t D ,数据散点图显示消费函数发生了结构性变化:基本消费部分下降了,边际消费倾向变大了。
则城镇居民线性消费函数的理论方程可以写作( D )A. t t t u X Y ++=10ββB. t t t t t u X D X Y +++=210βββC. t t t t u D X Y +++=210βββD. t t t t t t u X D D X Y ++++=3210ββββ3、设某地区消费函数中,消费支出不仅与收入x 有关,而且与消费者的年龄构成有关,若将年龄构成分为小孩、青年人、成年人和老年人4个层次。
假设边际消费倾向不变,考虑上述年龄构成因素的影响时,该消费函数引入虚拟变量的个数为 ( C )A.1个B.2个C.3个D.4个4、在利用月度数据构建计量经济模型时,如果一年里的12个月全部表现出季节模式,则应该引入虚拟变量个数为( C )A. 4B. 12C. 11D. 65、在利用月度数据构建计量经济模型时,如果一年里的1、3、5、9四个月表现出季节模式,则应该引入虚拟变量个数为( 3个 )6、个人保健支出的计量经济模型为:ii i i X D Y μβαα+++=221 ,其中iY 为保健年度支出;i X 为个人年度收入;虚拟变量⎩⎨⎧=大学以下大学及以上012i D ;i μ满足古典假定。
则大学以上群体的平均年度保健支出为 ( B )A.ii i i X D X Y E βα+==12)0,/( B.ii i i X D X Y E βαα++==212)1,/(C.21αα+D.1α7、大学教授薪金回归方程:ii i i i X D D Y μβααα++++=33221,其中iY 大学教授年薪,iX 教龄,⎩⎨⎧=其他男性012i D ⎩⎨⎧=其他白种人013i D ,则非白种人男性教授平均薪金为( A )A.i i i i i X X D D Y E βαα++===)(),0,1(2132B. ii i i i X X D D Y E βα+===132),0,0(C.i i i i i X X D D Y E βααα+++===)(),1,1(32132D. ii i i i X X D D Y E βαα++===)(),1,0(31328.设某行业职工收入(Y )主要受职工受教育年数(X )、性别和地理位置(东部、西部)的影响. 考虑到性别不同或所处地理位置不同的职工的收入可能存在一定的差异,而且不同性别在收入上的差异可能与其所在的地理位置有关,即两个定性因素之间可能存在交互效应,因此通过引入虚拟变量建立回归模型( A )比较合适,其中(A ) (B ) (C ) (D )二、判断题1.工具变量法就是用合适的工具变量替换模型中的内生解释变量,然后再用OLS 法进行估计. (错)2、虚拟变量只能作为解释变量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
练习题8.1参考解答:(1)在其它条件不变的情况下,对数人均收入提高1%,则平均预期寿命可能提高约0.0939年。
但从统计检验结果看,对数人均收入lnX 对期望寿命Y 的影响并不显著。
方程的拟合情况良好,可进一步进行多重共线性等其他计量经济学的检验。
(2)引入()ln 7i i D X -的原因是想从截距和斜率两个方面考证将人均收入超过1097美元的国家定义为富国的话,贫国和富国的预期寿命是否存在显著的区别。
如果人均收入大于1097美元,那么虚拟变量取值为1,否则为0。
即:1 1097(l n()7)0 1097i i D X ⎧-=⎨⎩人均收入大于美元人均收入低于美元(3) 对于贫穷国,其回归方程为:2.409.39ln i X -+ 对于富国,其回归方程为:2.40(9.39-3.36)ln 3.36*721.12 6.03ln i i X X -++=+习题8.2参考答案由于有四个季度,因此引入三个季度虚拟变量1 1 1 1220 0 0 D D D ⎧⎧⎧===⎨⎨⎨⎩⎩⎩一季度二季度三季度其它其它其它(1)按照加法模型引入三个虚拟变量,模型为:(加法模型的作用是改变了设定模型的截距水平)i 0112233i i Y =D D D X ααααβμ+++++回归结果如下:123i 22ˆ=6910.449187.7317D 1169.32D 417.1182D 0.038008X t= (3.594792) (-0.28439 (1.835446) 065093256914 R =0.517642 R =0.416093 F=5.097454 DW=0.39625i Y -+-+)(-.) (.) (2)由于考虑利润对销售额的变化率发生变异,即斜率的改变,因此按照乘法模型引入三个虚拟变量,模型为:i 01i 1i 12i 23i 3i Y =X X D X D X D ββαααμ+++++回归结果如下:i i 1i 2i 322ˆ=7014.7570.037068X -0.000933X D 0.00791X D 0.002385X D t= (3.934394) (3.273896 (-0.216776) 0.0040180.58529 R =0.519733 R =0.418624 F=5.140311 DW=0.429628i Y ++--)() () (3)按照加法和乘法相结合的方式引入三个虚拟变量,模型为:i 01122331i 2i 13i 24i 3i Y =D D D X X D X D X D ααααββββμ++++++++回归结果为:i 123i i 1i 2i 322ˆY =10457.394752.26D 3764.21D 4635.46D 0.0159X 0.029X D 0.03X D 0.0266X D t= (2.566) (-0.87 (-0.6860.8320.6280824089960749 R =0.546701 R =0.348383 F=2---++++-)) () () (.) (.)(.).756686 DW=0.464982通过对三个模型对比分析可以看出,第三个模型的系数均不显著,模型一和二销售额的系数显著,其余系数也不显著。
方程都显著,但拟和程度都不是很好。
习题8.3参考解答:考虑到班次有三个属性,故在有截距项的回归方程中只能引入两个虚拟变量,按加法形式引入,模型设定形式为:12132i i Y D D u βββ=+++ 其中,i Y 为产出,110D ⎧=⎨⎩早班其他,210D ⎧=⎨⎩中班其他。
则回归结果如下:Variable Coefficient Std. Error t-Statistic Prob. C 40.42857 0.555329 72.80115 0.0000 D1 -5.714286 0.785353 -7.276069 0.0000 D29.1428570.78535311.641710.0000 R-squared0.952909 Mean dependent var 41.57143 Adjusted R-squared 0.947676 S.D. dependent var 6.423172 S.E. of regression 1.469262 Akaike info criterion 3.738961 Sum squared resid 38.85714 Schwarz criterion 3.888178 Log likelihood -36.25909 F-statistic 182.1176 Durbin-Watson stat2.331933 Prob(F-statistic)0.000000表中的红字表示在方差分析中需要用到的数据。
Sum squared resid 残差平方和;S.D. dependent var 被解释变量的标准差。
221()1iY Y n σ=--∑ 所以,TSS=(n-1)2σ依据上述数据,有:()26.423172211825.1427708TSS =⨯-=, 38.85714R S S= 825.142770838.857147E S ST S S R S S =-=-=/(1)/()ESS k F RSS n k -=- , 得182.1176F =与如下表所示的结果(《统计学》表5-4,pp167(第2版))相比较,结果完全一致。
方差来源 离差平方和 自由度 方差 F 值 组间 786.286 2 393.143 182.118组内 38.857 18 2.158总和825.14320习题8.6参考答案 引入虚拟变量:1 10 D ⎧=⎨⎩股份制非股份制建立回归模型:i 011i Y =D ααμ++回归结果如下:t 122ˆY =1518.696568.2274D (12.39374) (3.377868)R =0.195343 R 0.178223 DW=1.96144 F=11.40999t +==11(0)1518.696(1)1518.696568.22742086.9234E Y D E Y D ====+=可以看出,非股份制超市的销售规模平均为1518.696,而股份制超市的销售规模平均为2086.9234。
这就表明股份制因素对销售规模起到一定的影响。
习题8.5参考解答在Eviews 中按照给定数据进行录入,点击Quick ,录入grade c gpa tuce psi ,点击method ,在下拉菜单中,选择binary : 并选择logit ,则有:Dependent Variable: GRADE Method: ML - Binary Logit (Quadratic hill climbing) Date: 06/29/05 Time: 17:44 Sample: 1 32 Included observations: 32 Convergence achieved after 5 iterations Covariance matrix computed using second derivativesVariable Coefficient Std. Error z-Statistic Prob. C -13.02135 4.931324 -2.640537 0.0083 GPA 2.826113 1.262941 2.237723 0.0252 TUCE 0.095158 0.141554 0.672235 0.5014 PSI 2.378688 1.064564 2.234424 0.0255Mean dependent var 0.343750 S.D. dependent var 0.482559 S.E. of regression 0.384716 Akaike info criterion 1.055602 Sum squared resid 4.144171 Schwarz criterion 1.238819 Log likelihood -12.88963 Hannan-Quinn criter. 1.116333 Restr. log likelihood -20.59173 Avg. log likelihood -0.402801 LR statistic (3 df) 15.40419 McFadden R-squared 0.374038 Probability(LR stat) 0.001502 Obs with Dep=0 21 Total obs 32 Obs with Dep=1 11边际效应等于()2.8260.5340.1890.0950.0182.3790.499f ⎛⎫⎛⎫⎪ ⎪=⨯= ⎪ ⎪⎪ ⎪⎝⎭⎝⎭ X ββ 其中,()()()13.02135 2.82613.11720.095221.9375 2.37870.43752213.02135 2.82613.11720.095221.9375 2.37870.437511ee f ee -+⨯+⨯+⨯-+⨯+⨯+⨯==++X βX βX β()20.33870.1889887460.18910.3387==≈+GPA TUCE PSI Mean 3.117188 21.93750 0.437500 Median 3.065000 22.50000 0.000000 Maximum 4.000000 29.00000 1.000000 Minimum 2.060000 12.00000 0.000000 Std. Dev. 0.466713 3.901509 0.504016 Skewness 0.122657 -0.525110 0.251976 Kurtosis 2.570068 3.048305 1.063492 Jarque-Bera 0.326695 1.473728 5.338708 Probability 0.849296 0.478612 0.069297 Sum99.75000 702.0000 14.00000 Sum Sq. Dev. 6.752447 471.8750 7.875000 Observations 32 32 32。