数学建模作业
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、摘要
本文根据所给出的数据,运用excel软件并采用数据分析法,制定了一个具体可行的调整方案(其可靠性为95%)。首先,本文对题中的12组数据,进行相关性分析,求出各观测站所测的年平均降雨
γ>的观测站组合。其次,对这量间的相关系数γj i,,找出满足,0.381
i j
些组合进行一元线性回归,得到一元回归模型,并作F检验。经过检验进行优化选择,可先去掉5,9,11三个观测站。通过对一元线性回归模型分析知,观测站8的年平均降雨量可由观测站6预测得到。因此在满足足够大的信息量下,本模型可减少5,8,9,11四个观测站,而他们的信息均可由6观测站来预测,可靠性为95%。由于降雨量具有随机性,为更精确预测该地区未来十年的年平均降雨量,本文利用精简后的数据建立时间序列模型。对原数据列进行一阶差分处理,得到稳定的新时间序列。分析新时间序列的自相关函数与偏自相关函数图像,然后采用自相关函数和偏相关函数检验法对模型进行识别,确定使用ARMA(1,1)模型。借助于SPSS软件对数据进行处理,并对理论结果进行白噪声检验,结果表明ARMA(1,1)具有可靠性与实用性。
关键字:相关性分析数据分析一元线性回归时间序列自相关函数 arma(1,1)模型白噪声检验
二、问题重述
问题一:某地区内有12个气象观测站,根据27年来各观测站测得的年降雨量(见附表1),由于经费问题, 有关单位拟减少气象站数目以节约开支, 但又希望还能够尽量多地获取该地区的降水量信息。现要求设计一个方案:尽量减少观测站,而所得到的年降水量的信息量仍足够大。
问题二:为研究该地区的降雨量特点,需要对该地区未来十年的降雨量进行预测分析。
三、模型假设
1.该地区的地理特征具有一定的均匀性,而不是表现为复杂多变的地理特征。
2.不考虑其它区域及天气对本地区降雨量的影响
3.该市的气候特征较稳定,不出现较大的自然灾害,27年的统计数据能够全面地反映该市的气候特征;
4.该市的气候不会因环境的变化而发生较大的变化; 四、符号说明
γ
j
i,为任意两个观测站间的相关系数
)1(t --p n α为自由度n-p-1的t 分布双侧临界值
y
为欲预测值
p 为p 元回归数
p
x x x y s .....21为剩余标准差
X t
(,,,...
12X X X n )为平稳时间序列
X表示原始序列
Y表示一阶差分序列
白噪声序列方差
a
五、问题分析
5.1 问题一的分析
本案例实质上是个典型的预测问题,即用较少的测站来预测12个站的年降水量,本模型的基本思想是:如果某一观测站的年降水量可用其它观测站的年降水量来线性回归的话,就可删去这一观测站。
在删除的过程中必须遵循两个原则:①在线性相关的组合中,尽可能地留下可利用度大的观测站;②留下的观测站可用线性回归模型来预测减掉的观测站的年降水量。
5.2 问题二的分析
自然现象受自然界各种因素如气候、环境以及人为活动影响,其变化规律极其复杂,如水文现象中的雨量,对其用物理的方法加以分析,往往因其影响因素未全面了解而导致分析模型的复杂和效果不理想。在实际中,常用统计模型来模拟,本文即讨论了用时间序列方法某地区观测站年平均降雨量序列加以分析,并对精简后的观测站未来十年的年平均降雨量进行预测。
六、模型的建立与求解
6.1 精简模型的建立与求解
6.1.1相关性分析[1]
为研究这12个观测站之间是否存在明显的相关性,现利用附表
1中的27组数据进行分析。利用软件SPSS 17.0对这12个观测站测得的数据进行相关性分析,结果如下表所示:
表1: 12个观测站之间的相关系数表
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X1 1 X2 -0.085 1 X3 -0.160 0.075 1 X4 0.062 0.017 -0.171 1 X5 -0.154 0.002 -0.196 0.146
1
X6 0.227 0.035 0.358 -0.149 -0.429 1 X7 0.122 0.211 0.366 0.105 0.066 0.270 1 X8 0.088 -0.074 -0.025 0.264 -0.399 0.082 -0.112 1 X9 0.231 0.258 0.210 0.119 -0.062 0.408 0.315 0.330 1 X10 0.024 0.176 0.066 0.182 0.340 0.087 0.048 -0.212 -0.153 1 X11 0.105 0.090 0.177 0.033 -0.012 0.532 0.159 -0.073 0.295 0.359 1 X12
0.240
0.249
0.210
0.187
-0.128
0.285
0.285
0.185
0.373
0.275
0.340
1
根据95%的可信度,查“检验相关系数ρ=0的临界(αγ)表[1]”,可得0.05
(272)0.381
γ-=, 从表1可查得,,0.381
i j
γ>的观测站组合:
5,6
0.429
γ
=-, 5,8
0.399
γ
=-, 6,9
0.408
γ
=,
6,11
0.532
γ=.说明了这四个组
合的线性相关性是显著的。 6.1.2 一元线性回归模型
由表一知,观测站5与6,5与8,6与9,6与11之间分别具有显著的线性关系,接下来本文利用EXCEL 软件对其进行线性回归分析并进行F 检验。经回归分析,结果如下:
观测站5与6的线性回归模型为:
65()
()
415.1090.4437t t x
x =-