10全国大学生数学建模竞赛、C0701解析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
C题之一(全国二等奖)
雨量预报方法的评价
参赛学校:桂林工学院参赛学生:张莉、邹凤晖、毛细根
指导老师:邓光明
摘要:
雨量预报对农业生产和城市工作和生活有重要作用,气象部门致力于开发更准确的预报方法满足人们生活的需求。
因此,我们建立了一种评价预测方法准确性的模型。
本模型主要应用于雨量预报方法准确性的评价,属于比较模型,评价方法中用地理位置及对应的降雨量与实测站点的真实降雨量进项比较。
模型一的建立主要依据二维插值原理和统计学的离散、方差分析综合建立的。
通过二维插值的方法找出两种方法在91个站点的预测值,根据实测值,算出两种方法各自的误差,进而算出误差的方差,得到两种方法的方差矩阵。
比较两种方法的误差的方差,得出结论:方法一相对于方法二而言更加准确。
模型二在模型一的基础上加入公众感受因素,对模型一进行权重优化。
在前模型的基础上考虑公众满意的因素优化模型,建立一个比模型一更加符合实际的模型。
根据模型一中得到两种方法91 个站点的预测雨量,把两种方法91 站点41 天的预测数据和实际观察值转化为等级标量数值。
将其等级标量数值分别与实际观察值相比较,得出预测的偏差度,根据公众感受权重的特点,将这些偏差度进行权重分析,最后得出评价结论:方法二相对于方法一而言更加准确。
关键字:降雨量、二维插值、方差分析、公众感受、权重、等级标量
一、问题重述
雨量预报对农业生产和城市工作和生活有重要作用,但准确、及时地对雨量作出预报是一个十分困难的问题,广受世界各国关注。
我国某地气象台和气象研究所正在研究6小时雨量预报方法,即每天晚上20点预报从21点开始的4个时段(21点至次日3点,次日3点至9点,9点至15点,15点至21点)在某些位置的雨量,这些位置位于东经120度、北纬32度附近的53×47的等距网格点上。
同时设立91个观测站点实测这些时段的实际雨量,由于各种条件的限制,站点的设置是不均匀的。
气象部门希望建立一种科学评价预报方法好坏的数学模型与方法。
气象部门提供了41天的用两种不同方法的预报数据和相应的实测数据。
预报数据在文件夹FORECAST 中,实测数据在文件夹MEASURING中,其中的文件都可以用Windows系统的“写字板”程序打开阅读。
FORECAST中的文件lon.dat和lat.dat分别包含网格点的经纬度,其余文件名为<f 日期i>_dis1和<f日期i>_dis2,例如f6181_dis1中包含2002年6月18日晚上20点采用第一种方法预报的第一时段数据(其2491个数据为该时段各网格点的雨量),而f6183_dis2中包含2002年6月18日晚上20点采用第二种方法预报的第三时段数据。
MEASURING中包含了41个名为<日期>.SIX的文件,如020618.SIX表示2002年6月18日晚上21点开始的连续4个时段各站点的实测数据(雨量),这些文件的数据格式是:
站号纬度经度第1段第2段第3段第4段58138 32.9833 118.5167 0.0000 0.2000 10.1000 3.1000 58139 33.3000 118.8500 0.0000 0.0000 4.6000 7.4000 58141 33.6667 119.2667 0.0000 0.0000 1.1000 1.4000 58143 33.8000 119.8000 0.0000 0.0000 0.0000 1.8000 58146 33.4833 119.8167 0.0000 0.0000 1.5000 1.9000 ……
雨量用毫米做单位,小于0.1毫米视为无雨。
(1)请建立数学模型来评价两种6小时雨量预报方法的准确性;
(2)气象部门将6小时降雨量分为6等:0.1—2.5毫米为小雨,2.6—6毫米为中雨,6.1—12
毫米为大雨,12.1—25毫米为暴雨,25.1—60毫米为大暴雨,大于60.1毫米为特大暴雨。
若按此分级向公众预报,如何在评价方法中考虑公众的感受?
二、问题的背景
天气预报是根据具体区域的气候背景、天气演变特点,通过多种基于天气学理论的预报方法模型而制定出来的,天气预报的一个重要特点就是准确性问题。
天气预报大致可分为超长期预报、长期预报、中期预报、短期预报、短时预报、超短时预报这几种,准确率变化大体上与预报时效的长短成反比,即时效越长准确率越低,但这一趋势变化不是绝对的。
据了解,国内天气预报目前的总体水平略低于世界最先进水平。
以下单独说不准确的原因。
天气预报作为一门预测学科,有着与自然界打交道的所有学科(包括预测或非预测的,例如地震、天文、水文、生物、地质、物理等等)共有的一个局限之处,就是存在不确定因素。
这是因为大自然的各种变化是非线性的过程,也就是说,它在遵照某些特定的演变规律(规律也不是绝对稳定的)发展的同时,也存在着无数的不确定因子,这些因子对有序演变的干扰作用有大有小、有先后、有随机性。
一方面,这些自然学科的理论会通过建立各种复杂的数学方程(大多是非线性方程),对大自然的
各方面的变化进行数学上的表述,这就是数值模型。
数值模型建立的过程(建模)需要考虑到那些不确定因子,但会对它们进行取舍,忽略某些影响比较小的因子,使模型在准确与效率之间尽可能取得平衡。
另一方面,自然学科还会通过统计分析的手段来做预测(即‘统计预报’),通过统计某一现象在历史上特定的环境前提下出现的概率,来推测它在未来存在类似环境前提时出现的可能性。
第三方面,是人的主观判断的运用,因为理论是死的,人是活的,很多时候,不完善的理论所产生的结论若与实际可能性相差太大,还需要人工进行订正,但这一途径依赖于工作者自身经验的积累,因此存在参差不齐的特点。
三、解题过程示意图
1、问题一的示意图
比较
对最后的差值进行比较
2
四、 问题的分析
1、问题一:
根据题意,可知两种预测数据分别是连续41天的、每天的4个时段,位于东经120度、北纬32度附近的53×47的等距网格点上预测降雨量,而实测数据是在设立91个观测站点测量的实际雨量。
根据题中给出91个站点的经纬度,观察出这91个站点不一定都设立在等距网格点上,我们只有通过二维插值的方法查找两种方法的91个站点的41天中每天每个时段的预测值,将这41天中每天每个时段的预测值与实测值进行差值计算得出41个91×4的矩阵1D ,2D 。
利用计算机程序编程求误差的方差为1E 、2E 。
然后再对各个时段的值进行再一步差值比较即得出我们所需要的结果M 。
从以上分析和附表中可以进一步分析纬度和经度确定了2491个网格点,每个网格点对应一个预测的降雨量。
用二维差值法的数学思想把经纬度和降雨量简单的理解为一个二维曲面图(经度为y ,纬度为x ,预测降雨量为z ,如下图所示)
降雨量二维图
七月二十九日第四时段(第一种方法)
2、问题二:
公众感受所指的是预报的情况与实际情况的误差给人们带来的感觉,如果天气预报为小雨,实际却是暴雨,人们的感觉就很差。
我们考虑到人们思维的特点,人们总是会记住给他们造成不愉快经历的过程,而忽略带来愉悦或有所得的过程,例如:当气象台预报有雨,第二天确实下雨了或是晴天了,人们不会过多地在意,而当气象台预报没雨,最后却大雨瓢泼,很多人就会产生不满的情绪。
我们根据人们的这种偏好,分别进行加权分析,当预报是好天气,而实际是坏天气,其公众满意度加权较大,相反,当预报是
坏天气,而实际却是好天气,其公众满意度加权较小。
根据问题二所给出的降雨量等级分布范围将题一中所得到的两种方法91个站点预测降雨量分为7个等级(小于0.1毫米为无雨,0.1—2.5毫米为小雨,2.6—6毫米为中雨,6.1—12毫米为大雨,12.1—25毫米为暴雨,25.1—60毫米为大暴雨,大于60.1毫米为特大暴雨),并分别赋予数值(0,1,2,3,4,5,6)。
再根据这7个等级来预报天气,例如6月18日第一时段的预测降雨量为0.103096.0<在第一个范围内气象部门将预报为无雨。
但是由于不同方法的预测值来预报天气本身存在着一定的误差,使得天气预报有时不准确。
但是那种方法预测的误差更大呢?这个误差会给公众带来什么样的影响呢?影响程度又有多大,这里我们将用模型二来解决这一问题。
这样就得出3组91×4的新矩阵('A ,'B ,'C ),再运用题一中编写的++C 程序和
方法同样整合成整合为3个41×4的矩阵(即第一种方法'1R ,第二种方法'
2R ,实测值'3R )
其中这三个行列中的列表示的是4个时段,行表示的是41天,为了表达公众对预报准确性的感受,我们对预报准确性进行权重打分,当准确时,感受度为满分10分值,当预报好天气,而实际坏天气时,感受度下降2个值,当预报为坏天气,实际却是好天气感受度下降1个值。
五、符号说明
六、模型假设
1、假设不考虑测量的系统误差即实测值为准确值。
2、假设由经纬度所确定的2491个网格点都是连续均匀的,且由二维插值法画出的预测点的曲面图形是一个平滑的曲面,覆盖了网格内由经纬确定的所有点的值(即每一个X ,Y 都有一个相应的Z 值与它对应)
3、用二维插值法求出两种方法的91个预测值即为91个实测站点的预测值。
4、假设公众的对天气的变化感受程度大体是符合的,对预报的天气变好了的误差反应不强烈,但是对预报好天气变坏了的误差反应很强烈。
七、模型的建立
模型一:
记 491)(⨯=ij a A 491)b (B ⨯=ij 491)(⨯=ij c C
=-=A B D 11491)(⨯-ij ij b a =-=A B D 22491)(⨯-ij ij c a
求时段误差的方差
()[]
91/)(...919111j j j j bj b a b a x -++-= ()[]
91/)(...919111j j j j cj c a c a x -++-=
()91/)2]^[(2∑--=x b a s ij ij bj ()91/)2]^[(2
∑--=x b a s ij ij bj 得出41×4误差的方差矩阵1E ,2E 如下:
4411)(⨯=bj e E
4412)(⨯=cj e E
M=1E -2E
模型二:
将91个站点实测雨量矩阵i Z 转换为0-6实测数值代换的矩阵'A
将41天4个时段的矩阵21E ,E 转换为0-6方法一、二数值代换的矩阵'B 、'C ''1R A B -=
''2R A C -=
对21R ,R 各元素赋予权重得到21W ,W ,算出差值为:
21W W P -=
八、模型的求解
1、问题一的求解过程
(1) 根据假设,我们构成经纬度为53⨯47等距网格形成二维曲面,一个经度和一个纬度就对应一个预测降雨量,应用二维插值散乱节点的方法分别插入91个站点经纬度查找相应的预测降雨量。
(如图示例为查找一个站点的插值)
2)已知 53⨯47个节点
),2,1;,...,2,1(),,(n j m i z y x ij j i ==
其中j i y x ,互不相同,不妨设
b x x x a m =<<<= 21
d y y y c n =<<<= 21
构造一个二元函数),,(y x f z =通过全部已知节点,即
),1,0;,,1,0(),(n j m i z y x f ij
j i === 再用),(y x f 计算插值,即).,(i i i y x f z =
其具体求解应用matlab 编程求解
(2)根据(1)的原理找到两种方法的每天、每个时段的91个站点的预测降雨量,应用matlab 编写程序将91个的预测值进行组合,将一天四个时段的合并到一个矩阵中,形成41个91×4矩阵,这样就可以较好的与MEASURING 文件中的实际数值做差值应算(因为MEASURING 文件中的每个文档都是一天四个时段的数据),得到两种方法的41天的91×4的差值矩阵,再将这些差值进行列的方差计算,得到两种方法的41个1×4方差矩阵,又将这41个1×4方差矩阵合并为41×4方差矩阵,比较两种方法的方差,得出结论。
步骤一:
把FORECAST 文件中的每天的每个时段的预测数据,经纬度和MEASURING 文件中的实测数据导入到excel 中形成41×2个53行×47列和41个91行×4列的数据列表。
同时将excel 中的数据的科学计数法变为数值法保留四位小数。
在matlab 中应用二维插值法编程,将excel 的经纬度数据(X,Y )和对应的预测的降雨量(Z )形成53×47的网格曲面,对应91个站点的经纬度('x ,'y )查找其预测值(i z )。
程序如下:
matlab 的file 文件
clear
x=
[ 28.00 28.00 28.00 … … 27.60 27.60 27.60
28.10 28.10 28.10 … … 27.70 27.70 27.70
… … … … … … … …
… … … … … … … …
35.00 35.00 35.00 … … 34.60 34.60 34.60];
y=
[117.00 117.20 117.30 … … 123.70 123.80 124.00
117.00 117.20 117.40 … … 123.70 123.80 124.00
… … … … … … … …
… … … … … … … …
117.30 117.40 117.60 … … 124.60 124.80 124.90];
z=
[0.0059 0.0062 0.0060 … … 0.0052 0.0051 0.0052
0.0058 0.0056 0.0058 … … 0.00537 0.00539 0.0051
… … … … … … … …
… … … … … … … …
0.0255 0.0271 0.0289 … … 0.0101 0.0103 0.0102];
Mesh(x,y,z)
'x =
[32.9833 33.3000 33.6667 … … … 29.8167 29.7000 29.9667];
'y =
[118.5167 118.8500 119.2667 … … … 119.6833 120.2500 121.7500]; i z = griddata(x,y,z,'x ,'y ,'nearest')
(注:x ,y ,z 为FORECAST 文件中的预测数据,'x ,'y 为91个观测站的经纬度都为一些散点,结果中的i z 为程序运行所得的91个观测站的预测值,并把i z 排列为91×1的矩阵)
保存运行结果为:
i z =[0.0062 0.0105 0.0259 … … … 0.0001 0.0002 0.0003] 6月22日第一时段预测的降雨量示意图
由于经纬度(x ,y )的值始终不变,所以只需要换用FORECAST 文件中其他时段的预测降雨量(z ),用同样的程序可以找到每天的每个时段的91个站点的预测降雨量。
步骤二:
我们要将这些数据进行组合,将一天四个时段的合并到一个文本中,且与MEASURING 文件中的实际数值文本的格式相同,这样就可以较好的与MEASURING 文件中的实际数值做差值应算,然后将这些差值进行方差应算。
这个运算过程也是通过matlab 编程得到。
其程序如下:
Matlab 中file 文件
Clear
1k =
[0.0062 0.0105 0.0259 … … 0.0001 0.0002 0.0003]’;
2k =
[37.6270 54.8170 4.2390 … … 0.0137 0.0545 0.1038]’;
3k =
[6.8158 8.0712 0.8358 … … 0.0057 0.0120 0.0271]’;
4k =
[1.6170 0.2795 0.6363 … …
0.0189 0.0394 0.0621 ]’;
F6221-1=[1k ,2k ,3k ,4k ]
运行结果为一个91行×4列的矩阵
F6221-1=
[0.0062 37.6270 6.8158 1.6170
… … … …
… … … …
0.0003 0.1038 0.0271 0.0621]
同样的方法我们可以将两种方法都用matlab 把41天4个时段91个站点的预测值整合为91行×4列的矩阵。
再把方法一和方法二分别于实测值相减得到2组91行×4列的矩阵. 步骤三:
用计算机C++编程实现对41天中每天一个时段的方差放入一个41×4矩阵中,这样我们就可以有两个方差组成的矩阵。
其程序运行的结果为:
方法一与实测值误差的方差
1E =
0.003183 3.356372 120.062523 2.933138
15.390769 72.021111 25.169216 56.899872
1317.589233 484.617004 144.882858 0.302215
0.054183 0.000497 0.515687 0.082986
0.000363 5.506225 0.63468 5.127828
9.792936 5.508536 5.37239 1.27514
0.014185 0.145155 0.117228 0.000003
0.000034 0.001611 0.000021 0.000004
0.006277 0.000005 0.002791 16.098175 17.480919 71.362495 10.636979 0.396355
0.348258 0.355726 0.038905 0.005389
0.000828 0.001312 0.000133 0.000164
0.000255 0.000463 0.000003 0.3211
0.002565 6.231696 2.786874 66.67939
2.149754 2.306548 0.654974 0.116786
0.003635 0.119408 0.000283 0.034182
2.333038 25.164722 1.760827 2.033493
0.273955 0.001242 0.000437 0.000148
0.000024 0.002762 0.003883 0.000897
0.000353 0.003118 0.00048 0.000284
0.000109 0.000118 0.000414 0.000414
0.000427 0.000225 0.000249 0.000347
0.000275 0.000137 0.000496 0.0003
0.00006 0.000252 0.000272 2.663067
0.002672 0.379348 0.303793 0.000776
7.26492 0.00008 5.855886 11.553361 3.985283 0.000066 0.000036 56.884251 12.344399 5.058219 9.628744 10.302596 0.011016 0.512561 4.800656 0.0007
0.000284 0.002034 0.255552 4.442866
0.921989 0.079636 0.167765 2.630629
8.998254 15.723339 2.096589 0.010974
0.19473 2.455233 0.71398 0.213467
0.608069 0.000153 0.099884 3.535252
5.373516 0.035431 10.110168 5.588022 20.806263 1.283185 1.23559 4.158602
1.63545 1.270939 1.253684 1.61491 36.285465 1.28318 1.23559 13.596665 1.284478 1.232581 1.259908 1.258563
1.304914 1.228452 1.270519 1.249529
1.31182 1.22239 1.292602 1.21685
方法二与实测值误差的方差
E=
2
0.002816 5.356987 119.826355 3.172591 13.603116 83.754677 24.879099 54.049057 1317.589233 490.413727 215.189407 0.340027 0.048872 0.002778 0.02588 0.083806
0.000323 5.347342 1.195747 4.624332 10.971906 5.46581 5.929314 1.187203 20.028658 0.233315 0.122807 0.000001
0.000004 0.001757 0.000033 0.000009 0.009999 0.000005 0.005222 21.997519 25.682032 88.243645 8.968219 0.674037 0.384412 0.293855 0.044123 0.006795 0.000856 0.001638 0.000189 0.000349 0.000104 0.000496 0.000005 0.264097 0.002027 7.940603 6.291527 1.478587 1.975594 2.886812 0.916411 0.210494 0.005306 0.071625 0.000348 0.039158 2.423537 23.849794 1.931027 1.238808 0.089716 0.609217 0.057464 0.084785 0.00002 0.003352 0.00396 0.000836 0.000632 0.025091 0.000293 0.000308 0.000341 0.000301 0.000181 0.000124 0.000259 0.000171 0.000293 0.000261 0.000185 0.000331 0.000174 0.000408 0.000284 0.000166 0.000271 2.620231 0.002792 0.256055 0.20228 0.000821 0.120911 0.000084 7.331686 9.630413 5.595713 0.000092 0.000028 58.296745 14.423692 96.754982 106.787872 152.336777 0.013129 0.174547 4.734062 0.000464 0.000362 0.010345 0.180368 6.858791 0.440407 0.112219 0.252196 2.968177 9.320395 21.107344 1.689773 0.009246 29.08773 2.455233 0.548128 0.229239 0.814846 0.000226 0.084787 26.522621 4.237101 0.041135 11.815137 5.637473 23.223324 1.215616 1.345725 3.658404 1.610543 1.295563 1.222332 1.688441 1.255199 1.211669 1.240907 1.275965 1.264326 1.195983 1.233777 1.196686 1.219131 1.255554 1.28588 1.187852 1.31182 1.22239 1.292602 1.21685 方法一与方法二的差值 M=1E -2E
0.000367 -2.000615 0.236168 -0.239453 1.787653 -11.733566 0.290117 2.850815 0 -5.796723 -70.306549 -0.037812
0.005311 -0.002281 0.489807 -0.00082 0.00004 0.158883 -0.561067 0.503496 -1.17897 0.042726 -0.556924 0.087937 -20.014473 -0.08816 -0.005579 0.000002
0.00003 -0.000146 -0.000012 -0.000005
-0.003722 0 -0.002431 -5.899344
-8.201113 -16.88115 1.66876 -0.277682
-0.036154 0.061871 -0.005218 -0.001406
-0.000028 -0.000326 -0.000056 -0.000185
0.000151 -0.000033 -0.000002 0.057003
0.000538 -1.708907 -3.504653 65.200803
0.17416 -0.580264 -0.261437 -0.093708
-0.001671 0.047783 -0.000065 -0.004976
-0.090499 1.314928 -0.1702 0.794685
0.184239 -0.607975 -0.057027 -0.084637
0.000004 -0.00059 -7.7E-05 0.000061
-0.000279 -0.021973 0.000187 -0.000024
-0.000232 -0.000183 0.000233 0.00029
0.000168 0.000054 -0.000044 0.000086
0.00009 -0.000194 0.000322 -0.000108
-0.000224 0.000086 1E-06 0.042836
-0.00012 0.123293 0.101513 -0.000045
7.144009 -4E-06 -1.4758 1.922948
-1.61043 -0.000026 0.000008 -1.412494
-2.079293 -91.696763 -97.159128 -142.034181
-0.002113 0.338014 0.066594 0.000236
-0.000078 -0.008311 0.075184 -2.415925
0.481582 -0.032583 -0.084431 -0.337548
-0.322141 -5.384005 0.406816 0.001728
-28.893 0 0.165852 -0.015772
-0.206777 -0.000073 0.015097 -22.987369
1.136415 -0.005704 -1.704969 -0.049451
-2.417061 0.067569 -0.110135 0.500198
0.024907 -0.024624 0.031352 -0.073531
35.030266 0.071511 -0.005317 12.3207
0.020152 0.036598 0.026131 0.061877
0.085783 -0.027102 -0.015361 0.061677
0 0 0 0
步骤四:
通过在excel里面统计计算的出M第一、二、三、四列中分别有19、12、17、18个正数,有2、3、1、1为0,说明在每个时段方法一的预测值有20、26、23、22天准确。
矩阵四列数据的和分别为-18.9825,-134.339,-172.412,-91.5591,总和为-417.29。
通过数据表明方法一比方法二准确的天数多,程度也要高很多。
由此说明方法一比方法二更准确。
2、问题二的求解过程
在前模型的基础考虑公众满意的因素优化模型,建立一个比模型一更加符合于实际的模型。
气象部门将各时间段雨量分为7等:
x为降雨量,
设
1
当1x <0.1时 无雨 赋予数值“0”; 当5.2x 1.01<≤时 小雨 赋予数值“1”; 当 6.0x 2.51<≤时 中雨 赋予数值“2”; 当12x 6.01<≤时 大雨 赋予数值“3”; 当25x 12.11<≤时 暴雨 赋予数值“4”; 当60x 25.11<≤时 大暴雨 赋予数值“5”; 当1x 60≤时 特大暴雨 赋予数值“6”;
再根据这7个等级来预报天气,例如6月18日第一时段的预测降雨量为0.103096.0<在第一个范围内气象部门将预报为无雨,同时赋予相应的“0”值。
这样就得出3组91×4的新矩阵('A ,'B ,'C ),矩阵中的数据都将被从“0”到“6”的数值代替。
再运用编写++C 程序(见附件二)整合实现'A -'C ,'B -'C 的2组41个91×4的矩阵(即第一种方法与实测值的差值1R ,第二种方法与实测值的差值2R )其中这三个行列中的列表示的是4个时段,行表示的是91个站点。
给这些误差打分,当R=0时,f=10;当R=-1时,f=8;当R=-2时,f=6;当R=-3时,f=4;当R=-4时,f=2;当R=-5时,f=0;当R=-6时,f=-2;当R=1时,f=9;当R=2时,f=8;当R=3时,f=7;当R=4时,f=6;当R=5时,f=5;当R=6时,f=4。
将每天每个时段的分值f 进行对比,统计出两种方法的附加分值,统计附加分值高的方法满意度高,方法较佳。
用EXCEL 统计得出附加分值的总和分别为:方法一(138965),方法二(139087),从中可以看出如果考虑到公众满意度因素方法二比方法一更优。
再通过在excel 里面统计得出1R - 2R 的差值,负数总个数为463个,正数的总个数为415个(负数个数比正数个数多),这说明了方法一中的总的满意度比方法二低。
这种方法再一次证明了如果考虑到公众满意度因素方法二比方法一优。
结果分析,假设检验
用excel 的方法对问题一中C++程序运行的结果进行抽查比较分析
1、几个值的求法:
(1)用matlab 编程得出两种方法的预测值与实测值相对应的雨量
(2)预测雨量与实测雨量的差值
(3)误差的方差及91个站点的方差和 2、计算过程:
(1)预测值与实测值相对应的雨量已在matlab中编出,以6月18号四个时段为例得对应雨量表,用公式:各预测点每时段的预测值-实测值=差值,得表如下(4时段*91站点矩阵):
预测值:实测值:预测值-实测值
0 0.38 1.11 2.14 0 0 0 2 0 0.38 1.11 0.14
0 0.14 0.39 0.16 0 0 0 0 0 0.14 0.39 0.16
0 0.22 0.56 0.23 0 0 0 0 0 0.22 0.56 0.23
0 0.25 0.76 0.31 0 0 0 0 0 0.25 0.76 0.31
0 0.26 0.57 0.29 0 0 0 0 0 0.26 0.57 0.29
0 0.24 0.76 0.28 0 0 0 0 0 0.24 0.76 0.28
0 0.06 0.17 0.09 0 0 0 0 0 0.06 0.17 0.09
0 0.13 0.42 0.13 0 0 0 0 0 0.13 0.42 0.13
0 0.14 0.39 0.16 0 0 0 0 0 0.14 0.39 0.16
0 0.42 1.01 0.48 0 0 0 0 0 0.42 1.01 0.48
0 4.1 7.66 1.25 0 4 7.6 1.1 0 0.1 0.06 0.15
0 1.08 3.59 0.86 0 1.1 3.5 0.9 0 0.02 0.09 0.04
0 0.04 0.3 0.73 0 0 0 0 0 0.04 0.3 0.73
0 0.04 0.37 0.99 0 0 0.2 1 0 0.04 0.17 0.01
0 0.32 0.7 0.55 0 0 0 0.4 0 0.32 0.7 0.15
0 0.58 0.31 0.18 0 0.4 0 0 0 0.18 0.31 0.18
0 0.99 2.04 0.7 0 0.9 2 0.6 0 0.09 0.04 0.1
0 4.81 3.36 1.18 0 0.3 0.1 0.8 0 4.51 3.26 0.38
0 1.12 2.11 0.93 0 4.5 2.3 0 0 3.38 0.19 0.93
0 4.29 7.08 2.83 0 0 0 0 0 4.29 7.08 2.83
0 0.99 2.04 0.7 0 3.3 5.2 0.4 0 2.31 3.16 0.3
0 1.36 1.61 1.54 0 1 0.7 1.3 0 0.36 0.91 0.24
0 0.98 0.98 2.79 0 0.8 0.3 3.2 0 0.18 0.68 0.41
0 2.93 1.74 0.62 0 2.8 1.6 0.4 0 0.13 0.14 0.22
0 0.87 2.26 1.19 0 0 0 0 0 0.87 2.26 1.19
0 3.95 6.95 3.69 0 5.1 8.1 4 0 1.15 1.15 0.31
0 0.04 0.3 0.73 0 3.7 94.5 8.1 0 3.66 94.2 7.37
0 0.27 29 7.94 0 0.1 28.9 7.7 0 0.17 0.1 0.24 0.06 1.84 41.88 13.04 0 0.6 57.7 17.3 0.06 1.24 15.82 4.26 0.12 2.95 38.84 10.78 0.2 3.1 48.8 12.6 0.08 0.15 9.96 1.82
0 2.58 10.45 1.69 0 2.7 9.9 1.2 0 0.12 0.55 0.49
0 30.34 15.28 6.51 0 39.8 14.9 2.3 0 9.46 0.38 4.21
0 17.38 26.86 13.69 0 17.4 35.8 21.2 0 0.02 8.94 7.51
0 11.55 13.04 3.11 0 12 13.2 3.1 0 0.45 0.16 0.01
0 11.71 18.19 6.69 0 17.5 13.1 7.1 0 5.79 5.09 0.41
0 15.45 16.5 11.72 0 16.9 16.2 13.1 0 1.45 0.3 1.38
0 7.46 16.69 12.35 0 8.5 20 14.8 0 1.04 3.31 2.45
0 0.98 14.68 8.24 0 0.7 15.4 9.1 0 0.28 0.72 0.86
0 13.08 19.6 1.2 0 16.7 23.1 0.4 0 3.62 3.5 0.8
0 1.62 14.08 2.47 0 1.5 14.8 1.3 0 0.12 0.72 1.17
0 1.3 11.08 3.79 0 5.6 31.9 8.5 0 4.3 20.83 4.71
0 3.76 17.87 8.63 0 0.7 14 5.6 0 3.06 3.87 3.03 0 1.66 12.49 11.31 0 1 15.7 12.6 0 0.66 3.21 1.29 0 2.35 11.88 8.67 0 2.7 11.9 9.1 0 0.35 0.02 0.43 0 2.35 6.1 3.94 0 2.2 5.9 4.2 0 0.15 0.2 0.26 0 0.05 13.98 7.18 0 0 9.5 8.8 0 0.05 4.48 1.62 0 0.32 9.37 9.2 0 0 9.3 10.5 0 0.32 0.07 1.3 0 0.28 11.4 6.66 0 0 14.9 7.4 0 0.28 3.5 0.74 0 1.7 6.98 2.12 0 1.7 7 0.6 0 0 0.02 1.52 0 0.05 13.98 7.18 0 0 16.4 6.8 0 0.05 2.42 0.38 0 0.24 6.11 6.7 0 0 4.3 8.2 0 0.24 1.81 1.5 0 0.4 9.12 7.5 0 0 10.8 8.2 0 0.4 1.68 0.7 0 0.23 9.16 1.87 0 0 9 1.4 0 0.23 0.16 0.47 0.04 3.31 16.44 8.21 0 2.5 19.3 7.8 0.04 0.81 2.87 0.41 0.01 1.03 11.92 5.67 0 0.3 9.6 5.5 0.01 0.73 2.32 0.17 0.03 0.99 10.98 9.96 0 0 9 9.7 0.03 0.99 1.98 0.26 0.01 0.38 4.71 5.9 0 0 3.2 4.9 0.01 0.38 1.51 1 0.43 2.15 21.26 13.19 0.9 0.4 25.8 17.3 0.47 1.75 4.54 4.11 0 0.1 10.42 21.63 0 0 10.8 21.6 0 0.1 0.38 0.03 0.23 14.58 15.65 8.14 0 19.4 9.1 8 0.23 4.82 6.55 0.14 0 0.9 13.3 7.35 0 0 13.7 4.1 0 0.9 0.4 3.25 0 2.21 13.14 9.58 0 0.1 10.1 9.6 0 2.11 3.04 0.02 0 1.21 7.72 12.66 0 0.4 3.8 13.8 0 0.81 3.92 1.14 0 0.62 9.6 15.4 0 0 9.6 14.5 0 0.62 0 0.9 0 0.57 5.76 7.98 0 0 5.9 10.2 0 0.57 0.14 2.22 0 0.43 4.08 2.45 0 0 3 1.7 0 0.43 1.08 0.75 0 0.34 5.55 8.15 0 0.1 5.2 8.2 0 0.24 0.35 0.05 0 0.24 7.67 4.73 0 0 5.7 4.4 0 0.24 1.97 0.33 0 0.27 5.18 6.15 0 0 2.7 6.4 0 0.27 2.48 0.25 0 0.37 2.04 2.75 0 0 0.5 1.8 0 0.37 1.54 0.95 0 0.46 7.47 8.13 0 0 7.2 7.4 0 0.46 0.27 0.73 0 6.21 4.66 7.59 0 6.2 4.9 8 0 0.01 0.24 0.41 0 1.09 5.15 7.82 0 0.5 3.9 9.9 0 0.59 1.25 2.08 0 0.37 4.26 5.01 0 0 3.6 4.4 0 0.37 0.66 0.61 0 0.68 3.77 5.31 0 0.1 2.7 6.8 0 0.58 1.07 1.49 0 0.06 7.13 4.49 0 0 8.8 3.4 0 0.06 1.67 1.09 0 0.27 21.09 7 0 0 26 6.8 0 0.27 4.91 0.2 0 0.09 6.84 8.24 0 0 5 8 0 0.09 1.84 0.24 0 0.18 8.92 4.76 0 0 9.3 3.8 0 0.18 0.38 0.96 0 0.02 4.62 9 0 0 4.2 9.6 0 0.02 0.42 0.6 0 0.85 1.76 10.9 0 1 0.1 10.9 0 0.15 1.66 0 0 0.28 7.13 13.81 0 0 9.6 14.5 0 0.28 2.47 0.69 0 0.11 1.2 0.81 0 0 0.6 0.3 0 0.11 0.6 0.51 0 1.01 0.29 6.73 0 1 0.1 6.6 0 0.01 0.19 0.13 0 0.32 1.83 4.28 0 0 1.6 3.3 0 0.32 0.23 0.98
0.15 28.02 65.28 5.88 0.2 32.8 95.3 4.7 0.05 4.78 30.02 1.18
0.1 38.81 8.05 6.77 0.1 36.9 0.4 7.8 0 1.91 7.65 1.03 0.21 19.9 7.27 8.64 0.2 20.9 0 9 0.01 1 7.27 0.36 0 3.18 8.28 0.16 0 3.3 9.3 0 0 0.12 1.02 0.16 0 0.18 4.11 0.36 0 0 4.1 0 0 0.18 0.01 0.36 0 0.19 0.95 2.32 0 0 0.2 1.4 0 0.19 0.75 0.92
注:红字为其相反数,以下意义一样。
(2)对预测值-实测值表计算每时段平均值,计算函数:A VERAGE ,得
平均值:
(3)在EXCEL 中计算4*91的矩阵的方差,公式:91/)2)
X X ((
2^911
i ^
_
∑=-=S
每时段方差得:
用C++程序运行出来的结果:
0.003183 3.356372 120.062523 2.933138
取两位小数可以看出是完全吻合。
(4)用同样的方法求出其它天数的方差
为准确起见,这里再列出6月21日各时段的方差为(保留2位小数):
用C++程序运行出来的结果:
0.054183 0.000497 0.515687 0.082986 取两位小数可以看出也是完全吻合的。
经过验证,用c++编程与EXCEL 所算的结果吻合,确定了模型的准确性。
八、模型评价
优点:
1、选用预测误差的方差作为衡量预测的精确度的指标,操作容易,代表性强。
2、很好的运用了数学方法中的二维插值法解决实际中的问题,灵活的运用matlab 软件进行编程解题而去除了大量手工运算的复杂与繁琐性,同时用matlab 画出图形使给整个模型更加直观。
3、用C++程序语言进行循环运算,将题目附件所给出的大量的表格最终加以整理为我们需要的两个41×4的两种方法预测值与实测值之间的差值方差矩阵。
减少了人肉眼观察和手工循环整合的误差,使整个模型更加科学,评价的结果更加可信。
4、对0,1规划模型进行扩展使用,将预测和实测的值按气象部门划分的等级分类赋值,把复杂的问题合理的简单化。
5、该模型同样适用于评价其他方法准确性的问题,例如评价预测某地区海拔高度的问题等。
缺点:
(0.00) (0.12) (1.46) (0.17)
0.00 3.36 120.06 2.93
0.05 0.00 0.52 0.08
1、该模型只实用于几种预测模型的比较检测,如果单独检测一个预测模型的准确性,本模型较欠缺。
2、问题二的模型是建立在一般的假设情况下,只考虑公众一般性感受权重,忽略了其他因数。
参考文献:
1、葛新全《统计学》机械工业出版社 2002年
2、贾俊平《统计学》清华大学出版社 2004年
3、精锐创作组《Matlab6.0科学运算完整解决方案》人民邮电出版社 2001年
4、赵静但琦《数学建模与数学实验》(第二版)高等教育出版社 2000年
5、徐国祥等《统计预测和决策》上海财经大学出版社 1998年6月
评委简评
该论文的优点:1、本文把握住建模的关键点,即插值的方法,题目所给条件中,91个观测点与2491个实没点之间并不存在某种对应关系,必须用插值的方法去建立它们之间的联系。
而他们在插值中使用了二维插值,这是论文的新颖点。
2、对建模及求解过程及计算结果表述清楚,条理性较好。
该论文存在的问题是:1、摘要较简单,如果说该论文的摘要能够按规范要求写得好一些,其名次有可能再进一步。
2、建模的假设表述得不够明确,从论文中可看出一些假设,但写得较零乱(这在C题论文中是普遍的现象)。
建议在今后的竞赛中,参赛者应单独写一段假设条件,并说明这些条件与你所建模型的关系。
(曾方红)。