建模实例(多元线性回归模型)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
以上图为例,按当年价格计算,我国1992年的GDP 是1980年的5.9倍,而按固定价格计算,我国1992 年的GDP是80年的2.8倍。
2、依照经济理论以及对具体经济问题的深入
分析初步确定解释变量。例:关于某市的食 用油消费量,文革前常驻人口肯定是重要解 释变量。现在则不同,消费水平是重要解释 变量,因为食用油供应方式已改变。 3、当引用现成数据时,要注意数据的定义是 否与所选定的变量定义相符。例:“农业人 口”要区别是“从事农业劳动的人口”还是 相对于城市人口的“农业人口”。
t
案例2:《全国味精需求量的计量经济模型》
1.依据经济理论选择影响味精需求量变化的因素 依据经济理论初设为: 商品需求量 = f (商品价格,代用品价格,收入水 平,消费者偏好) 根据分析,针对味精需求量只考虑两个重要解释变 量,商品价格和消费者收入水平。 味精需求量 = f (商品价格,收入水平)
一建模过程中应注意的问题?1研究经济变量之间的关系要剔除物价变动因素?以上图为例按当年价格计算我国1992年的gdp是1980年的59倍而按固定价格计算我国1992年的gdp是1980年的28倍
一、建模过程中应注意的问题
1、研究经济变量之间的关系要剔除物价变动因素
30000 25000 20000 15000 10000 5000 GD P GD P(f) 0 80 81 82 83 84 85 86 87 88 89 90 91 92
4、通过散点图,相关系数,确定解释变量与
被解释变量的具体函数关系。(线性、非线 性、无关系)
5、谨慎对待离群值(outlier)。离群值可能是正常
值也可能是异常值。不能把建立模型简单化为一个纯 数学过程,目的是寻找经济规律。(欧盟对华投资和 中国从欧盟进口)
年 INV(投资) IMPORT(进口)
2.选择恰当的变量(既要考虑代表性,也要考虑可能性) 用销售量代替需求量。 用人均消费水平代替收入水平。 味精销售量 = f (销售价格,人均消费水平) 用平均价格作为销售价格的代表变量。 取不变价格的人均消费水平:消费水平都是用当年价格计 算的,应用物价指数进行修正。
味精销售量 = f (平均销售价格,不变价格的消费水平)
9、在作F与t检验时,不要把自由度和检验水平 用错(正确查临界值表)。回归系数的t检 验是双端检验,但t检验表的定义有P(t > t) = , P(t < t) =
10、
对于多元回归模型,当解释变量的量纲 不相同时,不能在估计的回归系数之间比较 大小。若要在多元回归模型中比较解释变量 的相对重要性,应该对回归系数作变换。 11、 回归模型的估计结果应与经济理论或常 识相一致。如边际消费倾向估计结果为1.5, 则模型很难被接受。(产出对劳动力的弹性 为负值!)
12、 残差项应非自相关(用DW检验,亦可判 断虚假回归)。否则说明了: ①仍有重要解释变量被遗漏在模型之外。 ②选用的模型形式不妥。 13、 通过对变量取对数消除异方差。 14、 避免多重共线性。 15、 解释变量应具有外生性,与误差项不相关。
16、 应具有高度概括性。若模型的各种检验及 预测能力大致相同,应选择解释变量较少的 一个。 17、 模型的结构稳定性要强,超样本特性要好。 18、 世界是变化的,应该随时间的推移及时修 改模型。
6、 过原点回归模型与非过原点回归模型相比有如 下不同点。以一元线性过原点模型
Y t = b1X t +ut
7、改变变量的测量单位可能会引起回归系数值的改 变,但不会影响t值。即不会影响统计检验结果。
8、 回归模型给出估计结果后,首先应进行F检验。F检 验是对模型整体回归显著性的检验。
H 0 : b1 = b 2 = ...... = b k - 1 = 0 H 1 : b j 不全为零
若F检验结果能拒绝原假设,应进一步作t检验(检验k次。
H 0 : b1 = b 2 = ...... = b k - 1 = 0 H 1 : b j 不全为零
t检验是对单个解释变量的回归显著性的检验。若回归系 数估计值未通过t检验,则相应解释变量应从模型中剔除。 剔除该解释变量后应重新回归。按经济理论选择的变量 剔出时要慎重。
二、建模案例 例1中国国债发行额模型(多元回归)
首先分析中国国债发行额序列的特征。1980年国债发行 额是43.01亿元(占GDP的1%),2001年国债发行额 是4604亿元(占GDP的4.8%)。以当年价格计算,21 年间(1980-2001)增长了106倍。平均年增长率是 24.9%。
5000 DEBT 4000
1991 1992 1993 1994 1995 1996 1997 1998
2.562000 2.429700 6.712400 15.37600 21.31000 27.37000 41.71000 39.78000
23.47000 32.29000 63.99000 78.75000 149.1300 113.8100 106.1500 112.2000
ˆ 1
yt= -65373.6 + 642.4 x2t (-10.32) (13.8) R2 = 0.95, DW = 1.5, t0.05 (9) = 2.26 问题: 1 = 6313.4,为什么检验结果是 1 b = 0? 量纲的变化对回归结果会造成影响吗?
1
其中GDPt表示年国内生产总值(百亿元),DEFt表示年财政赤字额(亿 元),REPAYt表示年还本付息额 。
DEBTt = 4.38 + 0.34GDPt +1.00DEFt + 0.88REPAY t
(0.2) (2.1) (26.6 ) (17.2) R 2 = 0.9986, DW=2.12, T =21, (1980-2000) 预测2001年的国债发行额( DEB 亿元): 2001 = 4608.71 预测误差是 DEBt = = 0.001
3. 收集样本数据(抽样调查,引用数据) 从中国统计年鉴和有关部门收集样本数据 。 (1972-1982, T = 11。 算相关系数:
ˆt y
4. 确定模型形式并估计参数 yt=-144680.9 + 6313.4 x1t + 690.4 x2t (-3.92) (2.17) (15.32) R2 = 0.97, DW = 1.8, t0.05 (8) = 2.3 回归系数6313.4无显著性(x1t与x2t应该是负相 关,回归系数估计值却为正,可见该估计值不可 信)。剔除不显著变量x1t,再次回归,
3000
2000
1000
0 80 82 84 86 88 90 92 94 96 98 00
选择3个解释变量,国内生产总值(百亿元),财政赤字额(亿元), 年还本付息额(亿元),根据散点图建立中国国债发行额(DEBTt,亿 元)模型如下:
DEBTt = b0 +b1GDPt +b2DEFt +b3REPAY t +ut