回归分析案例_国内生产总值与第一、二产业的关系
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
国内生产总值与第一、二产业的关系
国内生产总值(GDP),指按市场价格计算的一个国家(或地区)所有常住单位在一定时期内生产活动的最终成果.
第一产业是指农业、林业、畜牧业、渔业和农林牧渔服务业.
第二产业是指采矿业,制造业,电力、煤气及水的生产和供应业,建筑业.
改革开放以来,我国的经济增长方式和产业结构发生了重大变化,第一、第二产业的发展对国内生产总值增长所起的作用也发生了变化。
数据来自《中国统计年鉴2008》,选取我国1978-2007年国内生产总值与第一、二产业的数据.
根据数据绘制数据变化趋势如下.
从图中可以直观地发现,国内生产总值与第一、二产业存在着一定的相关关系.
利用国内生产总值作为因变量Y,第一产业、第二产业作为自变量X
1、X
2
,做多元线
得到的回归方程为21895.1811.0794.516X X Y ++-= 显著性P 值Sig=0.000,说明回归方程高度显著.
对回归系数作显著性检验,可以看出,X 1、X 2单独对因变量Y 有显著性影响,最大的复相关系数R=1,决定系数R 2=0.999,估计的标准差为2113.43764,小于回归平方和(1.36e+11),说明拟合效果较好.
即可以以99.9%以上的概率断言自变量X 1、X 2对因变量Y 产生显著性线性影响.通过检验.
当一个回归问题存在异方差性时,如果仍用普通最小二乘方法估计未知参数,将引起不良后果,特别是最小二乘估计量不再具有最小方差的优良性,即最小二乘估计的有效性被破坏了.
残差图是一种直观、方便的分析方法.它以残差e 为纵坐标,以其他适宜的变量为横坐标画散点图.
如果回归模型适合于样本数据,那么残差e 反映误差项所假定的性质,残差e 应该在e=0附近随机变化,并在变化幅度不大的一个范围内,因此可以根据残插图来判断回归模型是否具有某些性质.
分别画出X 1、X 2的残差图.
由上面两个图可看出,残差e值随x值的增大而增大,具有明显的规律,因而可认为模型的随机误差项的方差是非齐次的,存在异方差.
当问题存在异方差性时,线性回归模型的基本假定就被违反了,这时,就不能用普通最小二乘法进行参数估计,必须对原来的模型进行变换,使变换之后的模型满足同方差性假设,然后进行模型参数的估计,就可以得到理想的回归模型.
加权最小二乘法(weighted least square,WLS)是一种最常用的消除异方差性的方法.
从输出结果看出,残差绝对值abse与X
1的相关系数r
1e
=0.69,与X
2
的相关系数
r
=0.689,r > r,因而选取X作为权函数作用变量.
3 < 5,
保存最优权作为新的变量. 估计的标准差为0.00151,与加权前(2113.43764)相比减少了很多,说明选用加权最小二乘估计是正确的.
加权最小二乘估计的回归方程是 21914.1776.0905.567X X Y ++-=
1y r = 0.943,2y r =0.998,说明 第一产业和第二产业对国内生产总值影响较大. 回归系数1.914 > 0.776,说明从1978年,也就是改革开放以来,第二产业对国内生产总值影响比第一产业要大.
画出第一、第二产业在国内生产总值中所占比例的散点图如下.
由上图可看出,自改革开放以来,第二产业在国内生产总值中所占的比例有所上升,而第一产业所占的比例则在逐年下降.
第二产业是对第一产业和本产业提供的产品(原料)进行加工的部门,如采矿业,制造业,建筑业等等.自改革开放以来,为了满足建设“四个现代化”的装备需要,一些工业品取代农牧产品,如合成纤维等.随着人民生活水平的提高,消费者扩大了对工业品的需要,如农村市场大量买进彩电、洗衣机、电冰箱等家用电器.
由于消费的增加,引起能源的需求增加,从而促进了煤炭、炼油等能源工业的发展.
农业是国民经济的基础,但我国农业发展的现状是基础薄弱,高投入,低产出.大量农村劳动力开始转向打工一族,投入到第二产业.应该按照按照科学发展观全面协调可持续的基本要求,发展高产、优质、高效的农业,走增加质量与效益相统一,发展生产与保护环境相促进的生态环保型农业发展道路.
参考文献
[1] 何晓群刘文卿应用回归分析北京中国人民大学出版社