土地耕地需求量预测

土地耕地需求量预测
土地耕地需求量预测

《土地利用规划学》

耕地需求量预测

-----------基于回归分析法

学院:资源与环境学院

班级:2013009

姓名:x

学号:201300926

指导老师:x

目录

一、趋势外推预测法: (2)

1. 绘制时间序列散点图: (2)

2. 由最小二乘法求参数: (3)

3.进行耕地预测: (5)

二、回归预测法: (5)

(一)回归分析概述: (5)

(二)一元线性回归: (5)

1.绘制散点图: (5)

2.最小二乘法估计参数: (6)

3.回归方程及回归系数的检验: (8)

1)拟合优度检验(R2) (8)

2)相关系数显著性检验: (9)

3)回归方程的显著性检验(F 检验) (10)

4. 利用回归模型进行预测: (11)

(三)多元线性回归分析: (12)

1.建立回归模型: (12)

2.最小二乘法估计参数: (13)

3.多元线性回归模型的统计检验 (16)

(1)拟合优度检验(可决系数与调整的可决系数) (16)

(2) 方程的显著性检验(F检验) (17)

(3) 变量的显著性检验(t检验) (18)

三、总结: (20)

耕地需求量预测

根据下表进行该地2016年耕地需求量预测

方法一:仅根据耕地面积变化趋势进行分析

方法二:对耕地面积和人口做回归分析

方法三:将耕地面积与人口、粮食产量及化肥施用量做回归分析(本方法不用计算耕地需求量,只列出方程并检验即可)

以上三种方法在EXCEL或MATLAB软件中完成,要求步骤完整,排版清晰。

表1:基本资料

一、趋势外推预测法:

概念:规划区域或单位的耕地面积或建设用地面积的变化是在时间序列上展开的。随着时间的推移,可以得到一系列依赖于时间的数据Y t=f(t)。已时间为参数的数列称之为时间序列。若假定变量的过去变动趋势外延到未来,从而得到预测值期的变量数值,这就是趋势预测法。

1.绘制时间序列散点图:

由图可以看出:该地区历年耕地面积变化趋势呈递减趋势且年变化增减幅度大致相等,所以拟合方程为直线方程y=a+bx 。 2.由最小二乘法求参数:

◎由最小二乘法原理导出方程组:

y na b x

x y a x b x

i

i

i

i

i

i

∑∑∑∑∑=+=+2

◎联解上面方程可得参数a 和b

()()()b x y n

x y x

n

x a y n

b

x

n

i

i i

i

i

i

i

i

=

-

-=

-∑∑∑∑∑∑

∑1122

◎计算附表如下:

年份x

该地市耕地面

积(ha )y x2

xy

1991

284751

3964081 566939241

1992 283422 3968064 564576624 1993 282474 3972049 562970682 1994 279647 3976036 557616118 1995 278546 3980025 555699270 1996 278936 3984016 556756256 1997 275374 3988009 549921878 1998 272198 3992004 543851604 1999 260484 3996001 520707516 2000 257416 4000000 514832000 2001 256471 4004001 513198471 2002 255503 4008004 511517006 2003 255910 4012009 512587730 2004 254872 4016016 510763488 2005 253690 4020025 508648450 2006 251479 4024036 504466874 2007 252465 4028049 506697255 2008 250175 4032064 502351400 2009 244610 4036081 491421490 2010 243540 4040100 489515400 2011 241587 4044121 485831457 2012 240116 4048144 483113392

求和 44033 5753666 88132935 1.151E+10

根据公式1可得:

??

?==-2234.78

4734441

b a →x y 78.22344734441-= ◎进行耕地预测:

根据方程2016年的耕地面积为

ha)(229126201678.22344734441=?-=y

二、回归预测法: (一)回归分析概述:

回归分析是借助数学模型对客观世界所存在的事物间的不确定关系的一种数量化描写,即通过一个或几个变量的变化去解释另一变量的变化。它的目的是在于对相关随机变量进行估计、预测和控制,确定变这些量之间数量关系的可能形式,并用一个数学模型来表示。

◎回归分析的分类:

???

???

???????非线性回归线性回归按方程式特征分类多元回归简单回归按自变量个数分类回归分析 (二)一元线性回归: 1.绘制散点图:

◎由图我们可以看出:随着该地区人口的增加,耕地面积变化趋势呈递减趋势,且增加幅度大致相等,所以拟以直线方程y=a+bx 。 2.最小二乘法估计参数:

◎最小二乘法原理是要使残差平方和为最小,即:

()()Q y y

y a bx i i n

i i i n

=-=--==∑∑ 1

2

1

2

◎要使Q 最小,可由极值原理得:

()()????Q

a y a bx Q

b y a bx x i i i i i =---==---=∑∑2020

◎所以可以导出方程组:

y na b x

x y a x b x

i

i

i

i

i

i

∑∑∑∑∑=+=+2

◎两个方程联立求解可得回归方程的参数:

()()()b x y n

x y x

n

x a y n

b

x

n

i

i i

i

i

i

i

i

=

-

-=

-∑∑∑∑∑∑

∑1122

◎根据公式求出方程:

y = -460.71x + 492931

◎用excel高级分析进行回归分析可得如下几表:

表(1)回归统计表

回归统计

Multiple R

0.9740769

3

R Square

0.9488258

7

Adjusted R Square 0.9462671

6

标准误差

3460.0795

5

观测值22

表(2)方差分析表

方差分析df SS MS F

Significance

F

回归分析 1 4.44E+09 4.44E+09 370.8225 2.22E-14 残差20 2.39E+08 11972150

总计21 4.68E+09

表(3)回归参数表

回归参数表

Coefficient

s

标准误差 t Stat

P-value

Lower

95%

Upper

95%

下限

95.0%

上限

95.0%

Intercept 492931.47 12039.25 40.94371 9.19E-21 467818 518044.9 467818 518044.9 X Variable

1

-460.70827 23.92451 -19.2568 2.22E-14 -510.614 -410.803 -510.614 -410.803

3.回归方程及回归系数的检验:

1)拟合优度检验(R 2)

◎拟合优度检验是对样本回归直线与样本观测值之间拟合程度的检验。

◎度量拟合优度的指标:可决系数R 2

由图可知:

∑∑∑===-+-=-n

i i

n i i n

i i y y y y y y 1

2

1

2

1

2

)?()?()( 即: 总离差平方和 = 回归平方和 + 残差(剩余)平方和

◎如果实际观测点离样本回归线越近,则回归平方和在总平方和

i

中占的比重越大,因此拟合优度等于回归平方和/Y 的总离差:

9488.0)

?()?(2

22

=--=

=∑∑i

i

i Y Y Y Y R 总离差平方和

回归平方和

称R 2为可决系数。可决系数的取值范围:[0,1] ,

R2越接近1,说明实际观测点离样本线越近,拟合优度越高。R 2≥0.8说明拟合得很好。

8.09488.02≥=R

所以该回归方程拟合程度很好.

◎此外拟合优度测定还可用标准误差来估计

1

()?2

e ---=

∑k n y

y S i

i

S

e

表示根据所建立的回归方程,用自变量来预测因变量时,平

均预测误差的大小;

故S e 越小越好,越小说明波动性越小。 2)相关系数显著性检验: (1)提出假设

;0:0=b H

(2)根据公式计算R 的值得

9741.0)()()

)((1

2

1

21

=-?---=

∑∑∑===n

i i n

i i

n

i i i

y y x x

y y x x

R

(3)查R 表得临界值423.0)2( =-n R α

相关系数显著性检验表

(4)若

)

2(->n R R α则应该拒绝原假设,否则接受。

◎这里显然R=0.9741>0.423,所以拒绝原假设,相关系数具有很高显著性,即两者具有很强线性相关性。 3)回归方程的显著性检验(F 检验)

(1)提出假设:H 0:b=0 (2)在H 0成立时,统计量F 为:

)2,1(~)

2()?()?(1

212

,----=

∑∑==n F n y

y

y y F n

i i i n

i i

由给定的显著水平α,查F 分布表得临界值λ; ◎查表可得35.4=λ (3)根据公式计算F 的值

8225.370)

2()?()?(1

2

12

=---=

∑∑==n y

y y y

F n

i i

i n

i i

(4)比较λ与F 的值,若λ>F ,则否定H 0,即认为x 、Y 之间存在线性相关关系;若不能否定H0,则没有理由认为x 、Y 之间存在线性相关关系.

◎这里显然F=370.8225远大于λ=4.35,所以否定原假设,说明回归方程具有很高显著性,x 、Y 之间存在很强的线性相关关系。 4.利用回归模型进行预测:

1.利用趋势外推法确定2016年的人口数量

求得拟合方程为:y = 4.8312x - 9167.3

所以可得2016年的人口为:

(万人)5729167.3-20164.8312≈?=y

2.根据耕地与人口的回归方程可得: 2016年的耕地面积为:

a)229404.9(h 492931 + 572-460.71=?=y

(三)多元线性回归分析: 1.建立回归模型:

假设随机变量y 与p 个自变量之间存在着线性相关关

系,假定回归方程如下:

)

......,(21n x x x f y =

2.最小二乘法估计参数:

建立多元线性回归方程,实际上是对多元线性模型进行估计,寻求估计参数的过程。与一元线性回归分析相同,其基本思想是根据最小二乘原理,求解使全部观测值与回归值的残差平方和达到最小值。由于残差平方和

是的非负二次式,所以它的最小值一定存在。

根据极值原理,当Q取得极值时,应满足

由上式,即满足

上式称为正规方程组。它可以化为以下形式

◎利用克拉默法则进行求解:

对于n 个变量、n 个方程的线性方程组

11112211

211222221122n n n n n n nn n n

a x a x a x

b a x a x a x b a x a x a x b +++=??+++=????++

+=?

如果它的系数行列式0D ≠,则该方程组有唯一解

, 1,2,

,j j D x j n

D

=

= nm

n n

a a a a D ......

.........1111=

其中j D (1,2,,j n =)是将行列式D 中第j 列的元素换成 方程组右端的常数项所得到的n 阶行列式,即

11

1,1

1

1,1

11

,1,1

j j n

j n n j n

n j nn

a a

b a a D a a b a a -+-+=

所以: D D 00=

β D D 11=β D D 22=β D

D 33=β

根据克拉默法则可得多元回归方程为:

32100.221992.26318.30821.609781x x x y +--=

◎用excel高级分析里面的回归分析对本题进行计算可得如下几表:

回归统计

Multiple R 0.980033844

R Square 0.960466335

Adjusted R Square 0.953877391

标准误差3205.701822

观测值22

方差分析df SS MS F

Significance

F

回归分析 3 4.49E+09 1.5E+09 145.7694 8.16E-13 残差18 1.85E+08 10276524

总计21 4.68E+09

回归参数表Coefficients 标准误差t Stat P-value

Lower

95% Upper

95%

下限

95.0%

上限

95.0%

Intercept

609781.213

4

56203.33 10.84956 2.51E-09 491702.4 727860 491702.4 727860 X Variable -308.176370138.0734 -2.23197 0.038565 -598.258 -18.0949 -598.258 -18.0949

x y

βα+=?1 2

X Variable 2

-263.917459

1

134.17

-1.96704 0.064788 -545.798 17.96333 -545.798 17.96333

X Variable 3

2218.99953

8

2129.259 1.042147 0.31114

-2254.41 6692.406 -2254.41 6692.406

3.多元线性回归模型的统计检验

(1)拟合优度检验(可决系数与调整的可决系数)

◎总离差平方和的分解(同一元线性回归分析)

由图可知:

∑∑∑===-+-=-n

i i

n i i n

i i y y y y y y 1

2

1

2

1

2

)?()?()( 即: 总离差平方和 = 回归平方和 + 残差(剩余)平方和

o

y

i

y i

x y

y i -i i y

y ?-y y

i -?Y

◎可决系数:

TSS

RSS

TSS

ESS R -==

12

该统计量越接近于1,模型的拟合优度越高。 ◎调整的可决系数

在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:

)1/()

1/(12

----

=n TSS k n RSS R

其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。

◎之间存在如下关系:与22R R

11

)

1(12

2

-----=k n n R R

对于本例可求出可决系数R 2=0.96,95.02=R

由于95.02=R >0.8所以说明回归模型拟合程度比较高。 (2)方程的显著性检验(F 检验)

方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。

相关主题
相关文档
最新文档