关于农业投入产出的回归分析模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

常数 63.628
化肥合计前系数 8.860
有效灌溉前系数 0.332
最后得出总产量对化肥合计(X2)和有效灌溉(X6)的回归系数。从而 确定回归方程:y=63.628+8.860*X2+0.332*X6
六、模型分析与检验 最后,我们得到回归方程,即:y=63.628+8.860*X2+0.332*X6 (其中 X2 代表化肥合计,X6 代表有效灌溉) 下面我们分别做 F 检验,t 检验和代入样本检验。 (1)用 F 统计量检验回归方程的显著性步骤如下: 先提出假设 H0::β1 = β2=…=βp=0 H1::β( j j=1,2,L,p)不全为 0。 根据事先给定的显著性水平 α=0.05,确定临界值 Fα=Fα(P,N- P- 1)或 者计算 F 值对应的相伴概率值 p。若 F>Fα 或 p<α,就拒绝原假设 H0, 接受 H1, 认为回归方程显著,自变量与因变量之间存在显著的线性关 系。若 F<Fα,或 p>α,则接受 H0,回归方程不显著。经过 SPSS 的计算,我 们得到我们所建立回归方程的 F 值为 66.222,P 值为 0, 小于给定的 α, 所以显著。 (2)回归系数的显著性检验(t- 检验)。 t- 检验的步骤如下: 提出假设 H0:βi=0.(i=1,2,Lp) H1::βi≠0.(i=1,2,Lp) 若假设成立说明 Xi 对 y 没有显著的影响,反之,Xi 对 y 有显著的影 响,在 H0 的条件下,由样本数据计算式(3.2.18)的回归系数的 t- 统计量 的值。 在给定的显著性水平 α=0.05,确定临界值 α,或者计算 t 值所对 应的相伴概率值 p.如果 t>t(n- p- 1),或者 p<α,就拒绝原假设 H0,接受 备择假设 H1,认为该回归系数与零有显著差异,该回归系数对应的自变 量与因变量之间存在显著的线性关系。如果或者 p>α,则接受原假设 H0,可以认为该回归系数与零无显著差异,与其对应的自变量与因变量 之间不存在显著的线性关系。经过 SPSS 的计算,我们建立的回归方程化
《经济师》2009 年第 2 期
●农村经济
关于农业投入产出的回归分析模型
●王学超
摘 要:文章运用多元统计方法,对影响农业投入产出的两组变量 分别进行了主成分分析、相关分析、聚类分析、回归分析、逐步回归分析, 建立了农业投入产出模型,分析了农业产出受主要投入因素的影响,然 后对模型进行了综合比较与评价。运用聚类分析,选择具有代表性的省 市,再根据这些省市的农产品投入产出特点,分析了我国 2005 年的农业 投入产出情况。
关键词:聚类分析 典型相关分析 主成分回归分析 回归分析 逐步回归分析
中图分类号:F320 文献标识码:A 文章编号:1004-4914(2009)02-265-02
首先运用主成分分析,确定主要农作物在总产量中的比重,以此确 定总产量,然后运用两组变量之间的典型相关分析确立了 9 个典型相关 变量,分别选出投入、产出两组变量中起主要作用的变量(自变量即农村 用电量、化肥合计、农用塑料膜、农用柴油、农药使用量、有效灌溉、旱涝 保收、机电排灌;因变量即总产量)。在此基础之上,以投入组中的变量为 自变量,总产量为因变量用 SPSS 做回归分析,然后再做逐步回归分析, 得出了最佳的回归模型,而且基本消除了多重共线性的影响。从而客观、 合理地透析了我国农业生产的现状。通过此模型,可以在一定程度上得 出我国农产品产量主要受哪几种因素影响,从而对我国农业具有一定的 指导性作用。
n
Σ yi= αjzij j=0
设由主要投入和产出因素产生的两组变量分别为 x=(x1,x2...xn)和 yi, 那么各个省市投入产出表达式如下:
n
Σ yi=β0+ βixi+εi, i=1,2,…n i=0
然后进行聚类分析,取出具有代表性的省市作为样本。再对产生的样本 进行回归分析,从而确定回归方程中的系数,从而确定全国投入产出的 回归方程的表达式如下:
绝对误差分别为:2.35%、0.84%和 1.23%误差很小,回归方程代表性好。
七、结论
从上述得到的回归方程可以很清楚地看出,因变量与两个自变量之
间的相关程度、拟合程度均达到了很高的水平。从回归方程可以看出:我
国的农产品产量主要受化肥合计和有效灌溉的影响,说明化肥的使用量
和有效灌溉已经成为制约我国农业发展的重要因素,虽然现代机械的不
n
Σ 对 yi= αjZij 中的变量 αj 进行确定,通过 SPSS 软件分析可以得 j=0
到:
粮食(Zi1) 0.906
棉花(Zi2) 0.537
油料(Zi3) 0.925
水果(Zi4) 0.894
component 1
total 2.795
%of variance 69.126
Cumulative% 69.126
对粮食、棉花、油料、水果进行主成分分析后可以得出它们的相关系 数,从表中可以看出,一个主元素的代表性已接近 70%,在经济分析中, 基本达到要求。
此时可以确定来自百度文库四种主要农副产品的权重 α1=0.906,α2=0.537, α3=0.925,α4=0.894,即:
— 265 —
●农村经济
《经济师》2009 年第 2 期
n
Σ y=β0+ βixi i=0
五、模型求解 1.主成分分析。经过对数据的观察我们发现,麻类、甘蔗、甜菜、烟 叶、蚕茧、茶叶这些农产品很具有地域特征,只在一部分省市有生产,且 它们的产量占总产量的比例非常小,所以我们选择了粮食 (Zi1)、棉花 (Zi2)、油料(Zi3)、水果(Zi4)四种农产品的产量来计算总产量,对四种农产 品进行主成分分析,确定各种农作物的权重,然后根据上面的权重系数 计算总产量。
n
Σ 该问题适合用多元线型回归模型 y=β0+ βi+xi+ε i=0
基本假设如下: 1.忽略各种自然灾害对当年农产品产量的影响。
2.对于各地区固定资产投资差异,即第一产业基本建设折旧与更新 改造,不算入农产品消耗的范围。
3.忽略各地区农产品在质量上存在的一些微小差异。 4.假设所给的数据反映实际情况。 5.假设地域间农业的技术水平处于一个相当的层次。 三、符号说明 i 代表省或直辖市编号,j 代表不同农产品的编号,xi 代表主要能源 或物质消耗的种类编号,zij 表示 i 地区 j 产品的产量,αj 表示农产品 j 在 总产出 zij 中的系数,yi 表示 i 地区的总产量,βb 表能回归模型中的常数 项,Bi 表示 xi 的回归系数,ε 表示误差项,z 表示总产量。 四、模型建立 基于上述的模型假设和符号说明,模型建立过程如下。 我们分析宏观的农业的投入产出问题,考虑我国的主要农产品产量 受哪几种主要因素的影响,而得出农产品产量与影响因素之间的回归方 程,从而为我国的农作物生产提供一定的指导作用。 首先对各种农作物进行主成分分析,确定各种重要农作物的权重, 然后根据上面的权重系数计算总产量,表达式如下:
入回归方程 y=63.628+8.860*X2+0.332*X6 进行检验。 得到总产量分别为 1086.588(万吨),1816.369(万吨),6237.237(万吨),而我
们进行主成分分析得到的总产量分别为 1061.67 (万吨),1801.20 (万吨),
6250.45(万吨),经过对比,得相对误差分别为 24.9221、15.1735、76.7828,
一、问题背景 我国是一个农业大国,稻谷、小麦、肉类、棉花、花生、油菜籽、水果的 产量现均居世界第一位,玉米、大豆的产量分别为世界第二位和第四位, 是名副其实的农业大国。因此,处理好农产品投入产出之间的关系对推 动现代农业发展、 “三农”问题的有效解决具有非常重大的意义。 在已知 2005 年全国各地区农村在乡村办水电站数、装机容量、用电 量、各种化肥用量、各种塑料薄膜用量、覆盖面积、农用柴油、农药使用量 等主要能源及物质消耗,以及全国各地区粮食、豆类、薯类、棉花、油料等 主要农产品产量统计数据的情况下,对变量进行分析筛选,建立合理的 模型,分析我国农业投入产出的关系。 投入产出分析是研究经济系统中表现为投入与产出的各个现象相 互依存关系的经济数量方法。农业投入产出则是在既定的工程技术和技 术水平条件下,农业生产部门在生产过程中通过在一定实践内消耗一定 量的商品或劳务,从而生产出一定量的农业生产总值。本文中,我们采用 多元统计分析方法,通过 SPSS 对主成分、有效因素进行确定与分析,从 而描述农业中投入与产出的关系。 结合实际我们对投入和产出的因素进行了分析,从而有针对性地选 取所需的主要影响因素并加以分析。根据国家统计局的数据,我们得到 2005 年各地区农业主要能源及物质消耗统计数据和 2005 年主要农产 品产量的数据。 农业投入因素分为:(1)农业能源消耗,主要包括农村用电量、农用 柴油等;(2)农业物质消耗,主要包括:各种化肥用量、塑料薄膜用量、农 药使用量、有效灌溉面积等。 农业产出因素为:农产品产出,主要包括粮食、棉花、油料、麻类、甘 蔗、甜菜、烟叶、蚕茧、茶叶、水果等。 二、模型假设
经济体系显得尤其重要。政府的财政投入对农业的影响作用是微乎其微
的,资金的利用效率不高.应该予以适时调整,以适应新世纪我国农业现
代化的发展趋势,即把传统农业转变成为市场化、知识化、生态化、集约
化和社会化的现代农业。
八、模型评价和推广
zi=α1xi1+α2xi2+α3xi3+α4xi4 2.相关性分析。 首先,化肥合计已经包括了氮肥、磷肥、钾肥、复合 肥,农用塑料膜已经包括了地膜用量与地膜覆盖面积,所以我们选择化 肥合计与农用塑料膜这两个大的因素,而不考虑其中包含的因素。然后 我们进行了剩下因素对总产量的相关性分析。 可以得出,乡村水电站数、装机容量、发电量与总产量的相关性不显 著,而农村用电量、化肥合计、农用塑料膜、农用柴油、农药使用量、有效 灌溉、旱涝保收、机电排灌与总产量的相关性显著。所以我们去除了乡村 水电站数、装机容量、发电量三个因素对农作物总产量的影响。所以,我 们选择了农村用电量(X1)、化肥合计(X2)、农用塑料膜(X3)、农用柴油 (X4)、农药使用量(X5)、有效灌溉(X6)、旱涝保收(X7)、机电排灌(X8)这八 个因变量。 3.聚类分析。根据各个省的投入及总产出,进行聚类分析,分为三 组,其中第二组和第三组的个数非常少。于是就保留下第一组的数据,比 较具有代表性,基本上能代表全国农作物的投入与产出情况。然后我们 对剩下的省按总产量进行排序,结合四分位数的思想,均匀地取出三个 省份(甘肃、陕西、河南)留作模型的最后检验的样本。 然后对最后剩余的省区(西藏,青海,北京,天津,上海,海南,宁夏, 福建,山西,贵州,重庆,新疆,云南,内蒙,江西,辽宁,广西,吉林,湖北, 湖南,黑龙江,安徽,四川)进行回归分析。 4.回归分析。化肥合计、有效灌溉、旱涝保收的 P 值均小于 0.05,符合 要求。而其他因素不符合要求,所以需要再进一步做逐步回归分析。 5.逐步回归分析。得出影响总产量的最重要的三个因素:化肥合计、 有效灌溉、旱涝保收。但是我们考虑到旱涝保收之前的系数为负数(- 0.992), 与实际经济含义不符,所以去除这个因素,再对化肥合计和有效灌溉两 个因素做一次回归分析。 6.回归分析。
断投入大大提高了生产力,但现阶段我国农业还是属于高耗、低效型农
业, 农田灌溉水的有效利用率只有 30%~40%(发达国家已达 50%~
70%),化肥当年利用率仅 30%,因此,发展节水、节肥的精准农业将是今
后我国农业发展的重要方向。尤其在我国农业面临着水资源短缺和用水
浪费的双重危机的情况下,发展节水型农业产业结构,建立节水型农村
●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
肥合计(X2)的 t 值为 4.879,P 值为 0,有效灌溉的 t 值为 2.228,p 值为 0.038,p 值均小于给定的 α,所以显著。
(3)最后我们把留作检验的甘肃、陕西、河南三个省的数据样本,代
相关文档
最新文档