关于调整气象观测站问题的数学模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《数学建模与计算》
问题关于调整气象观测站问题的数学模型
摘要
本文讨论了关于调整气象观测站问题。若用主成份与逐步剔除法解决此问题,似可根据“损失信息量”的概念来确定减少测站个数。通过计算分析,在不损失信息量的条件下,可以去掉两个测站;在损失信息量为 0.852%的条件下,可以去掉3个测站。这种算法,使节约设站开资,减少测站数量更具科学性。
关键词气象观测站主成份逐步剔除损失信息量
一、问题简介
某地区有12个气象观测站,10年来各测站的年降水量已知(见表1),由于经费问题,有关单位拟减少气象站数目以节约开支,但又希望还能够尽量多地获取该地区的降水量信息。
我们从分析观测站数据入手,从中找出去掉某个或某几个气象站的方案。
表 1 年降水量(mm )
二、问题假设
1、一般来说,单个气象站测得的降水量数据具有随机性,但是各个气象站测出的降水量的分布应该符合一定的规律;
2、当初所设的气象站的位置足够控制该地区降水量的分布;
3、该地区所提供的12个气象站10年来的降水量数据是比较精确的。
三、符号说明
四、主成份与逐步剔除法
主成份分析是多元统计分析[1]中的一种方法,它是把多个指标约化为少数几个综合指标的一种统计分析方法,有现成的软件可用。逐步剔除法[2]是筛选变量的重要方法之一。主成份与逐步剔除法的方法步骤是:
1、求相关系数矩阵R
为消除量纲,对原始资料矩阵p n X ⨯作标准化变换,并求相关系数矩阵p p R ⨯,其中n 为样本个数,p 为气象观测站数。
2、求相关矩阵R 的特征值j λ及与其对应的标准正交化特征向量j v ,p j ,,2,1 =。
3、剔除第k 个气象观测站
当第i 个特征值0≈j λ时,表示与其对应的主成份对总体的贡献很小, 若j λ所对应的特征向量j v 中第k 个分量所占的权重最大,则说明在贡献很小的主成份中起主要作用的是第k 个测站,因此可把第k 个测站剔除掉,剔除它所损失的信息量就是这个主成份的贡献率。
4 、对剩下的1
p个测站的n年观测数据再按上述方法进行计算,看是否需要再剔
-
除另一个测站;依此进行有限次计算,直到没有特征值近似为0时为止。
在上述过程中,如果剔除了m个测站,剩下的m
p-个测站就基本上保留了原来p个测站的信息,这样就达到了节省开支,优化测站的目的。
五、模型的建立
用12个气象观测站10年来各测站测得的年降水量数据,运用上述方法得相关矩阵的特征值、特征向量和特征值的贡献率(见表2)。
表 2 特征值及其特征向量
由表2可见,第一次计算结果0121110===λλλ.00000,与它们相对应的特征向量
10v ,11v ,12v 中, 只有12v 中的第3个分量的绝对值0 .57744最大,这时在不损失信息量的情况下剔除测站3x 。由于各测站之间存在相关关系,所以每次只可剔除一个测站。 再将余下的11个测站10年来的数据按上述方法计算剔除测站11x 。 第三次将余下的10 个测站10年来的观测数据再进行计算,其最小的特征值00000003.010≈λ,在损失信息量0.852% 的条件下可以剔除测站9x 。第四次把余下的9个测站10年来的数据重新计算,得最小的特征值06194.09≈λ,故不可再继续剔除,到此计算结束。
六、模型分析
1、该方法简单方便,它不仅考虑了测站之间的相关性,而且每剔除一个测站既要求最小的特征值必须近似为0还知道剔除测站所损失的信息量。 由该法得的结果是: 在不损失信息量的条件下,可剔除二个测站3x 和11x ;在损失信息量0.852% 的条件下, 可剔除三个测站3x 、11x 和9x 。
2、实际上,任何一个气象观测站的建立与否,除了能单独地提供降水量的信息外, 还应考虑各测站的合理布设、各测站的控制作用、各测站的代表性以及周围环境的优劣等因素。因以上因素在此问题中皆没有明确给出,故该模型仅能单独进行数据处理。
3、在水文系列中,作为一个样本10年数据略嫌不足,理应提供更充足的数据,才能在节约经费开支的同时也保证信息的精度。
参考文献
[1]张尧庭、方开泰.多元统计分析引论.科学出版社,1982.
[2]茆诗松、丁元等.回归分析及其试验设计.华东师范大学出版社,1986.