应用回归分析电子教案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用回归分析论文
贵州民族大学
实用回归分析论文
(GuizhouMinzu University)
论文题目:影响谷物的因素分析
年级:2014级
班级:应用统计班
小组成员:
姓名:黄邦秀学号:201410100318 序号:4
姓名:王远学号:201410100314 序号:26
姓名:陈江倩学号:201410100326 序号:11
姓名:吴堂礼学号:
时间:2016.12.06
目录
摘要:在实际问题的研究中,经常需要研究某一些现象与影响它的某一最主要因素的关系,如影响谷物产量的因素非常多。本文采用多元线性回归分析方法,以1994—2014年中国谷物产量及其重要因素的时间序列数据为样本,对影响中国谷物生产的多种因素进行了分析。分析结果表明,近年来我国谷物生产主要受到单产提高缓慢、播种面积波动大、农业基础设施投入不足、自然灾害频繁等重要因素的影响。为提高谷物产量、促进谷物生产,首先应该提供一套促进谷物生产的政策措施,提高谷物种植效益,增加谷物收入是根本。在这个前提下,才有可能提高单产、稳定面积、加强基础设施建设、提高抗灾能力,增强我国谷物生产能力和生产稳定性。 (4)
关键词:谷物产量影响因素多元线性回归分析 (4)
一、问题的提出 (5)
二、多元线性回归模型的基假设 (5)
三、收集整理统计数据 (6)
3.1数据的收集 (6)
3.2确定理论回归模型的数学形式 (7)
四、模型参数的估计、模型的检验与修改 (8)
4.1 SPSS软件运用 (8)
4.2 用SPSS软件,得到相关系数矩阵表 (10)
4.3 回归方程的显著性检验 (11)
4.4利用逐步回归法进行修正 (12)
4.5 DW检验法 (13)
五、结果分析 (14)
六、建议 (14)
七、参考文献 (15)
影响谷物的因素分析
摘要:在实际问题的研究中,经常需要研究某一些现象与影响它的某一最主要因素的关系,如影响谷物产量的因素非常多。本文采用多元线性回归分析方法,以1994—2014年中国谷物产量及其重要因素的时间序列数据为样本,对影响中国谷物生产的多种因素进行了分析。分析结果表明,近年来我国谷物生产主要受到单产提高缓慢、播种面积波动大、农业基础设施投入不足、自然灾害频繁等重要因素的影响。为提高谷物产量、促进谷物生产,首先应该提供一套促进谷物生产的政策措施,提高谷物种植效益,增加谷物收入是根本。在这个前提下,才有可能提高单产、稳定面积、加强基础设施建设、提高抗灾能力,增强我国谷物生产能力和生产稳定性。
关键词:谷物产量影响因素多元线性回归分析
一、问题的提出
我国土地资源稀缺,人口多而粮食需求量大,因此粮食产量的稳定增长,直接影响着人民生活和社会的稳定与发展。粮食生产的不稳定性对国民经济的影响是不可忽略的,主要体现在:粮食生产不稳定会引发粮食供求关系的变动,尤其当国家粮食储备不足的时候,很容易导致粮价上涨,从而影响整个宏观经济。因此,对关系国计民生的这个特殊农产品,我们不得不慎重对待。因此,分析粮食产量波动的原因,并据此提出相应的对策,对保障粮食生产持续稳定发展,具有重要意义。
二、多元线性回归模型的基假设
(1)解释变量x1,x2,x3,xp 是确定性变量,不是随机变量,且要求
rank(k)=p+1 ()⎪ ⎩ ⎪⎨⎧ ⎩⎨⎧=≠====n j i j i j i n i E j i i .,2,1,,0,),cov(,,2,1,02 σεεε 这个假定常称为高斯-马尔柯夫条件。()0=i E ε,即,假设观测值没有系统误差,随机误差项i ε的平均值为零。随机误差项i ε的协方差为零,表明随机误差项在不同的样本之间是不相关的(在正态假定下即为独立的),不存在序列相关,并且有相关的精度。 (3)正态分布的假定条件为: () ⎩ ⎨ ⎧=相互独立,,,,,n 21i ,,n 21i 0~2εεεσε N 对于多元线性回归的矩阵模式εβ+=X y ,这个条件便可表示为: ()n 2,0~I N σε 由上述假定和多元正态分布的性质可知,随机向量y 服从n 维正态分布,回归模型εβ+=X y 的期望向量 ()βX E =y ()n 2y var I σ= 因此 () n 2,~y I X N σβ 三、收集整理统计数据 3.1数据的收集 选用了谷物产量y (万吨)、谷物零售价格指数x1、受灾面积x2(万公顷),化肥施用量x3(万吨),乡村农林牧渔业从业人员数x4(万人),谷物作物播种面积x5(千公顷),农用机械总动力x6(万千瓦),农村用电量x7(亿千瓦),把这7个指标的1994—2014年21年间的时间序列数据进行回归分析,来分析这些因素与谷物产量的关系。以谷物产量作为因变量,其它7个指标作为解释变量进行回归分析。 表1-1 1994-2014年度谷物产量影响因素表 注:数据来源相应年度的《中国统计年鉴》、《中国农村统计年鉴》、《中国农业发展报告》、《中华人民共和国年鉴》、《中国统计摘要》 3.2确定理论回归模型的数学形式 通过对中国谷物生产及影响因素的初步定性分析后假设,谷物产量与其它7个指标之间存在多元线性关系,即谷物零售价格指数、受灾面积,化肥施用量,乡村农林牧渔业从业人员数,谷物作物播种面积,农用机械总动力,农村用电量之间存在着线性关系,也即可以把谷物产量的线性回归模型初步设定为: 765332176543210x x x x x x x y ββββββββ+++++++= 其中,y:谷物产量, x1谷物零售价格指数、x2受灾面积,x3化肥施用量,x4乡村农林牧渔业从业人员数,x5谷物作物播种面积,x6农用机械总动力,x7农村用电量,然后利用已有的数据进行模型拟合,以便发现这些因素之间存在的数量