2014B 北师大建模
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
������
������ =
������ =1
百度文库
������������ (������������ ) , 其中������������ ������������ =
|4������������ − 2| + ������������ , ������1 , … , ������5 = 0,1,4.5,9,99 ,X i ∈ [0,1] 1 + ������������
在运算模型时, 我们必须在每个物理过程模块中寻找一个合适的参数化方案, 然后把所选择 的参数化方案链接起来、 形成一个完整的参数化方案组合, 来对整个大气物理过程进行模拟 预报。问题是针对不同的应用区域,不同的参数化方案组合得到的预报效果是不一样的,因
此我们有必要把最佳的参数化方案组合找出来。这是一个多因子混合水平的试验设计问题, 如果要进行全因子试验, 需要做 14×6×6×7×5×10×7=1,234,800 次试验。 由于 WRF 模型运算很 耗机时, 例如预报北京地区未来 5 天天气情况, 即使用最先进的超级计算机也需要数小时的 时间来完成,要做全因子试验的时间会超过几个月,这即不现实、也无意义。因此我们必须 想办法用较少的试验次数来找到最优组合。 在统计学中有一个重要分支--统计试验设计,专门研究实验方案的选择,确定哪些因子 最重要和选择哪些因子水平组合最佳。 在没有先验知识的情况下, 均匀试验设计是一个最有 效的方法。 它是考虑到试验点在试验范围内均匀分散的一种实验设计方法。 以一种常用的均 匀试验设计方法--正交试验设计为例,图 1 展示了 s=3 个因子 p=3 水平的全因子试验设计和 试验次数 n=9 的正交试验设计方案, 图中的 27 个点 (即立方体的每个顶点、 每条边的中点、 每个面的中心,还有立方体的中心)代表全部可能的试验,而图中的黑色圆点却表示相应的 正交试验点,表 2 列出正交试验方案的具体安排,例如:试验 1 的因子 A、B、C 都采纳选 择水平 1,试验 2 的因子 A、B、C 分别采纳选择水平 1、2、2,等等。除了正交试验设计, 还有很多种均匀试验设计方法可供选择, 例如蒙特卡洛法、 拟蒙特卡洛法、 拉丁超立方设计、 中心复合设计、和我国科学家研发的好网格点(Good Lattice Point)设计等等。一旦试验设 计方案确定后, 我们可以选择合适的敏感性分析方法来计算不同因子的敏感性指标和用优化 方法寻找最优方案。
的函数值,可以得到 n=50 个样本 (X1 , … , X 5 , Y) 数据。利用这些数据对 Sobol’ g 函数进行敏 感性分析,即分析各个因子X j 对Y的影响程度是否显著,影响大的因子即为敏感因子。你们 可以选择合适的敏感性分析方法和敏感性指标,判断各个因子X j 对Y的敏感性,确定敏感因 子(不可忽视的主要因素)和不敏感因子(可以忽略的次要因素) 。敏感性分析是选择最优 参数化方案组合的重要一步,它可以降低问题的维数,便于优化问题的求解。注意本题关注 的是全局敏感性,即每个因子X j 对Y的整体上的影响。请完全使用 50 个样本数据,不要使用 Sobol’ g 函数的导数做敏感性分析。 4) 为 WRF 模型(见表 1)设计一个试验次数 n 不超过 500 的混合水平的均匀试验设计方案, 用在问题 1)中给出的均匀性指标评价该方案的均匀性, 并将该方案用于 Sobol’ g 函数, 取 s=7, ������������ = 0, 1, 2.5, 4.5, 9, 99, 99 ,7 个因子的水平数分别为 14、6、6、7、5、10、7. 利用得到的 n 个样本(X1 , … , X 7 , Y)数据,计算出Y对������������ 的敏感性指标,判断哪些因子敏感,哪些因子不敏 感。 5) 请利用问题 4)提供的均匀试验设计方案,给出一个寻找 WRF 模型最优参数化方案组合的 算法,并用 Sobol’ g 函数代替 WRF 模型,利用问题 4)得到的 n 个样本数据,按你提供的算 法求 Sobol’ g 函数的最小值点。要注意,这里尽管我们用连续函数 Sobol’ g 函数来代替 WRF 最优参数化方案组合优化问题, 我们设计优化算法时, 我们不能把 Sobol’ g 函数中的变量X j 当 成一个连续变量或者是一个整数变量,我们可以想象 Xi 的取值代表的是不同的符号。例如 因子 A 有 14 个选择,任何一个选择只代表一个符号,而不是一个整数,即选择 1 代表的是 第 1 个方案,选择 14 代表的是第 14 个方案,选择 14 不是选择 1 的 14 倍。 参考文献 [1] 方开泰, 均匀试验设计的理论、方法和应用—历史回顾,数理统计与管理, 2004(03), P.11-26 [2] 方开泰, 马长兴, 正交与均匀试验设计. 2001, 北京: 科学出版社. [3] Saltelli, A., et al., Global sensitivity Analysis: the Primer. 2008, Chichester, UK: Wiley-Interscience.
2014 年北京师范大学数学建模竞赛题目
(请先阅读“全国大学生数学建模竞赛论文格式规范” )
B 题:复杂天气系统模型最优参数化方案组合的试验设计
科学研究中常常要做试验,有利用比例模型或者实物开展的物理模型试验,例如风洞试 验、导弹发射试验;也有用电子计算机开展的数值模拟试验,例如用数值天气模型做天气预 报试验。 不论是物理模型试验还是数值模型试验都有相应的成本, 我们希望用最小的成本 (即 尽量少的试验次数)来完成试验和达到试验目的。 当实际问题比较简单时, 我们可以把所有的可能试验都尝试一遍, 这样的试验方案称为 全因子试验 (Full Factorial Design) 。 例如假设某农作物产量跟 3 个因子相关 (即 A:土壤类别、 B:灌溉次数、C:施肥量) ,每个因子有三种可能选择(也称为水平,分别用 1、2、3 代表, 对于连续变量,如施肥量,就在变量的取值区间内均匀选取 3 个点作为 3 个水平) ,所有可 能的组合一共有33 = 27个,我们通过全因子试验就能找到最佳组合。当因子增加到 7 个, 每个因子的可能选择是 10 个时,那么所有可能组合就达到 107,这时我们要做全因子试验 就可能不实际了。 以天气系统模型为例,WRF 模型(Weather Research & Forecasting Model)是目前全球应 用最广泛的天气预报数值模型。WRF 包括 7 个物理过程模块,每个模块有多个参数化方案 可供选择,如表 1 所示:
表 2:三因子三水平正交试验设计表 试验序号 1 2 3 4 5 6 7 8
图 1:三因子三水平全面试验与正交试验
A 1 1 1 2 2 2 3 3 3
B 1 2 3 1 2 3 1 2 3
C 1 2 3 2 3 1 3 1 2
9
请选择你们认为最合适的均匀设计方法,解决以下几个问题。 1) 给出 “均匀性”的定义和计算“均匀性”指标的公式。 2) 设因子数 s=5,水平数 q=10,试验次数 n=50,给出一个均匀设计试验设计方案(或若干个 随机重复) ;用问题 1)给出的均匀性指标公式计算该方案的均匀性,并与完全随机抽样方 案 (即蒙特卡洛方法) 的均匀性进行对比, 以验证该方案相对蒙特卡洛方法是否具有优越性。 3) 按照 2)提出的均匀试验方案计算 Sobol’ g 函数
表 1:WRF 的物理过程模块及其参数化方案 物理过程 A B C D E F G 微物理(Microphysics) 长波辐射(Long-wave radiation) 短波辐射(Short-wave radiation) 表层过程(Surface layer) 陆面过程(Land surface) 星型边界层过程(Planet Boundary Layer) 积云过程(Cumulus) 参数化方案数 14 6 6 7 5 10 7