三种统计预报模型在江苏省道路低温预警中的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

三种统计预报模型在江苏省道路低温预警中的应用
董天翔;包云轩;袁成松;周林义;焦圣明
【摘要】为了更好地开展道路交通低温灾害的预警,减轻道路结冰给车辆行驶造成的危害,本文利用2012-2016年江苏省高速公路网AWMS系统交通气象观测数据,在对路面低温发生规律进行分析的基础上,结合多元线性回归、朴素贝叶斯以及支持向量机3种统计预报方法,开展了路面低温预警的统计建模与预报试验.结果表明:①江苏全省高速公路网路面温度出现0℃以下、-2℃以下、-5℃以下的低温频率均呈“北高南低”分布.②全省高速公路网路面温度出现0℃以下的低温时次大多在15:00到次日06:00之间.③在对京沪高速M9308站的单站建模与预报试验中发现,路面低温预报因子组合中以13:00气温、13:00-18:00气温变温、13:00路面温度、13:00-18:00路面变温、13:00路基温度、13:00-18:00路基变温、18:00相对湿度和18:00风速U分量为自变量组合的预报方程效果最好,3种方法中以朴素贝叶斯模型的预报准确率最高;④就全省高速公路网而言,3种统计预报模型的路面低温预报准确率均超过75%,通过对全路网路面低温预报的试验结果对比发现,多元线性回归方法对江苏省北部路网的预报效果最好,预报准确率大多在85%以上;而支持向量机模型对江苏省南部路网的预报效果最好,大部分站点的低温预报准确率达95%以上.
【期刊名称】《气象科技》
【年(卷),期】2018(046)004
【总页数】12页(P773-784)
【关键词】路面低温;统计预报;多元线性回归;朴素贝叶斯;支持向量机模型
【作者】董天翔;包云轩;袁成松;周林义;焦圣明
【作者单位】南京信息工程大学气象灾害预报预警与评估协同创新中心,南京210044;中国气象局交通气象重点开放实验室,南京210009;南京信息工程大学气象灾害预报预警与评估协同创新中心,南京210044;中国气象局交通气象重点开放实验室,南京210009;中国气象局交通气象重点开放实验室,南京210009;江苏省气象科学研究所,南京210009;中国气象局交通气象重点开放实验室,南京210009;江苏省气象科学研究所,南京210009;中国气象局交通气象重点开放实验室,南京210009;江苏省气象信息中心,南京210009
【正文语种】中文
【中图分类】P49
引言
在社会和经济快速发展的今天,高速公路作为交通重要组成部分对人民生活、经济发展和文化交流等起着日益重要的作用。

在诸多交通气象灾害中,发生在冬季的道路低温结冰易引发重大交通事故,给交通安全带来严重的威胁。

2016年冬季发生的世纪寒潮,导致我国春运高峰期间受道路结冰灾害影响,发生了多起严重的交通事故,其中江苏省多条高速公路因道路结冰限速限行甚至关闭,对春运返乡交通造成了严重影响。

因此,北欧国家、美国、加拿大的中高纬地区高速公路气象预报系统,均以满足冬季低温积冰、积雪天气状况下如何进行道路维护与优化管理决策为核心目标[1]。

导致路面结冰的成因有:雨后降温结冰、低温降雪被碾压成冰、积雪融化后结冰(日化夜冻)、冻雨等[2]。

其中路面低温是道路结冰的先决必要条件,是道面结冰的最大风险,所以通常道路结冰的预警研究是从路面低温的预警展开讨
论的[3]。

道面低温结冰的研究从20世纪80年代开始,欧美和日本等国家和地区率先对此
开展了一系列的研究,建立了各种路面低温的预报模型,并且取得了一些阶段性成果。

1996年,Shao等[4]运用高速公路沿线自动监测站的路温、气温、风速等资料,建立了冬季短期路面结冰自动预报模式。

2001年,加拿大学者Crevier等[5]研制了一种道路环境温度模型(METRO),该模型可提供路面温度及路面状况的预报。

2002年,Samodurova[6]发现对应不同类型路面结冰,结冰条件也不尽相同。

2013年,等[7] 指出传统气象站的数据不如交通气象站的数据对道路状况作出的预报准确,其选用3个不同环境下的交通气象站数据建立的线性回归统计模
型与物理模型对比,得出统计模型对路温的预报优于物理模型,并且随着新数据的收集统计模型可不断改进。

一些日本学者[8-9]在考虑交通要素后也提出了不同的
单站路面温度预报模型。

国内对道路低温结冰的研究起步较晚,朱承瑛等[10]利用地表能量平衡方程,综合考虑太阳短波辐射、大气和地面长波辐射、感热和潜热等物理参量,提出一种高速公路路面温度极值预报的数值模型。

牛生杰[11]等利用地表热量平衡方程,建立了3种下垫面的温度预报物理模型。

吕晶晶等[12]通过下垫面能量平衡模型,分析了冬季夜间晴空和阴天时桥、路面辐射能量收支变化情况,揭示了夜间桥面和路面温度变化差异的原因,对桥面比路面更易结冰的现象给出了理论解释。

史达伟等[13]基于C4.5决策树建立了单站路面低温结冰的预报模型。

秦健等[14]利用几个地区观测的路面温度数据与其他气象要素数据进行回归分析,开发了一个预报路面温度的模型。

综上,冬季路面低温的时空分析和预报已经受到很大的关注,但现有的道路低温结冰研究建立的预报模型,大
多是通过物理模型或者统计模型对个别站点或不同类型路面单点路表温度的预报,没有多站点连续的整条道路或整个路网的路面温度发生规律及其预报的研究,因此,存在着空间上的局限性。

针对上述问题,本文利用江苏省高速公路AWMS系统交通气象观测资料,系统分析江苏省高速公路网低温发生的时空变化特征,深入研究气象条件与道路低温结冰发生的潜在关系,运用朴素贝叶斯(Naive Bayes)、支持向量机(Support Vector Machine, SVM)和多元线性回归方法,构建江苏全省高速公路网165个交通气象
监测站的3种预报模型,并比较不同模型的预报效果,目的是研发精细化的路网
道路低温结冰预报模型,更好地开展交通气象预警预报服务,以减少道路结冰的灾害,确保交通安全和道路畅通,保障民众的正常出行和社会经济的和谐发展。

1 资料与方法
1.1 研究区概况
本文研究区为江苏省高速公路网,其研究区地理环境和监测站点分布及主要高速公路路段分布见图1(彩页),主干高速概况见表1。

表1 江苏省高速公路概况高速公路名称起点起始站点经纬度终点终止站点经纬度
全长/km沪宁高速上海真如121.12°E,31.29°N南京马群119.03°E,32.06°N274
宿淮盐高速宿迁市118.25°E,33.84°N盐城市120.03°E,33.31°N214沿海高速连
云港119.24°E,35.09°N苏州太仓120.97°E,31.73°N403京沪高速宁宿徐高速黄
墩河北黄花塘118.38°E,34.42°N118.73°E, 32.87°N昆山花桥北沟枢纽
120.33°E,31.67°N118.42°E, 34.30°N480248
1.2 数据来源和质量控制
本文采用江苏省气象局布设在全省高速公路网的AWMS系统165个交通气象监
测站的逐分钟监测数据,截取2012年12月1日00:00至2016年2月29日23:00的4a冬季各交通气象站相关气象要素观测数据,将上年12月首至次年2月底作为该年的冬季,例如2013年冬季分别由2012年12月,2013年1月和2013年2月的3个月组成,以此类推,共获得4年冬季数据。

数据要素包括每分钟监测一次的气温、00 cm路面温度、-10 cm路基温度、相对湿度、风向、风速、
降水量、能见度等。

鉴于高速公路沿线环境复杂,交通气象站的观测环境受到很多外界因素的影响,可能造成一些观测资料出现偏差,所以本文对监测数据做了质量控制,包括对异常、缺漏数据进行必要的剔除、更替、补插、时空一致性和要素物理规律性检查与订正等。

由于缺乏全省高速公路是否结冰的实时观测验证数据,且中国南方地区若降雪通常为“湿雪”,一般是0~4 ℃的混合态水,落地成冰水浆糊状,只要当地冬季最低温度低于0 ℃,就会出现道路结冰现象[15]。

因此,道路结冰的先决必要条件是路面温度低于0 ℃,不考虑各种水源的结冰如降雨、降雪、露、霜、洒水、运输漏水等。

1.3 3种预报方法简介
多元线性回归是统计学中最常用也是最易实现的一种统计预报方法[16-17],其主要是根据最小二乘原理,由历史数据得到多个自变量与因变量之间线性的经验关系算式。

因此可将每天预报时段之前的多个气象变量作为自变量来建立以预报时段的路面最低温度数值为因变量的统计预报模型。

路面低温预警实质上最终要预报的只是预报时段“出现低温”或“不出现低温”,因此利用机器学习和数据挖掘技术中常用的朴素贝叶斯和支持向量机等指导学习分类的方法对“是否出现某一阈值的低温”进行预报。

其中朴素贝叶斯方法[18]主要是根据历史数据计算两类事件出现的条件概率公式,并根据贝叶斯原理比较两类事件发生概率的相对大小进而做出预报。

而支持向量机方法[19]则是利用核函数将自变量投射到高维空间,并利用二次规划解出可以分隔两类事件样本点的超平面,即求解支持向量,进而根据自变量在样本在高维空间相对超平面的位置来判断分类。

朴素贝叶斯方法和支持向量机方法虽然不像多元线性回归一样可以直接给出显式的温度经验预报公式,但其建模中包含着非线性机制,某种程度上可以反应比简单的线性回归更为复杂的统计关系。

本文3种方法分别由MATLAB语言中的regress、NaÏveBayes.fit、svmtrain 3
个工具模块来完成建模。

2 结果与分析
2.1 路面低温的时空变化特征
在统计路面低温出现频率时,对某一AWMS站而言,以前一时次的第31 min到本时次的第 29 min 确定为本时次,如00:31—01:29记为01:00。

根据观测的逐
分钟路面温度,当一天中任一时次的小时内路面最低温度小于0 ℃时,就确定为
这一天出现了路面低温,记为1;这一天中多个时次的路面最低温度均小于0 ℃时,也记该日路面低温出现频次为1;全天没有出现过小时路面最低温度小于0 ℃的,频次记为0;依此类推,确定出整个冬季该站每天各时次的低温出现频次,将整个冬季的路面低温总频次数除以这一年冬季总日数,则得到该站这一年冬季路面最低温度小于0 ℃的频率,对4a频率求平均后,即得到研究期内该站路面最低温度小于0 ℃的平均频率。

运用同样的方法求出路面最低温度小于-2 ℃和小于-5 ℃的频率。

从江苏全省的4a冬季路面低温出现平均频率(图2,彩页)来看,路面低温(包括小
于0 ℃、小于-2 ℃和小于-5 ℃)出现频率的纬向分布特征比较明显,均呈典型的“南低北高”分布,这显然与纬度不同所导致的路面温度高低分布不同密切相关,其根本原因是随着纬度的升高,到达地表的净太阳辐射和地表净长短波辐射收入是减少的。

图2a显示江苏省北部路面温度低于0 ℃出现的频率可达70%以上,即
在冬季中有70%以上的日期会发生路面低温。

而在江苏省南部,路面低温的出现
频率递减至约20%。

但对高速公路交通来说,20%的出现频率仍然不算低,意味
着冬季平均每5 d就有1 d出现路面低温(低于0 ℃),而理论上路面温度低于
0 ℃,若再考虑水源的情况,就会产生道路结冰,因此,江苏全省高速公路网各路段不论南北都有进行道路低温预警的必要。

图2b显示江苏省北部小于-2 ℃的频
率通常在40%以上,个别站点达60%以上,苏中向苏南这一频率由30%递减至10%以下。

图2c显示路面温度低于-5 ℃的空间分布,显示出只有江苏北部地区的路段会出现10%以上的频率,意味着一年冬季北部地区高速公路可能会出现9 d
以上的路面强低温。

从各高速路段来看,除了沪宁高速路面低温的出现频率低外,京沪高速、沿海高速、宁宿徐高速、宿淮盐高速等都有较大的路面低温出现频率,其中宁宿徐高速的徐宿段、京沪高速的北段和沿海高速北段是路面低温的高发路段。

在统计建模过程中,为了科学的选择模型的自变量与因变量,有必要先对每个站的路面温度及低温发生的时间变化特征进行讨论。

在计算和统计全省高速公路网
165个AWMS站路面低温的日变化特征量时,我们利用各站逐分钟气温、路面温度和-10 cm路基温度观测数据,进行了下列计算:①挑选出各站每日各时次小时最低气温、小时路面最低温度和小时-10 cm路基最低温度;②针对各时次,求出全省165个站的平均最低气温、平均路面最低温度和平均-10 cm路基最低温度;
③分别求出每年冬季和四个冬季一天24 h的平均最低气温、平均路面最低温度和平均-10 cm路基最低温度;④将计算结果绘制成图3a。

从图3a中可以看出165个站点平均的最低气温、路面最低温度和-10 cm 路基
图1 江苏省高速公路网地理环境、全路网165个AWMS站点分布(a)及高速公路
分布(b)
图2 2013—2016年冬季江苏省高速公路网不同强度低温频率分布:(a)小于0 ℃,(b)小于-2 ℃,(c)小于-5 ℃
(图中空心圆圈表示发生频率为0)
最低温度的日变化,从平均日变化特征来看,路面最低温度在夜间和最低气温是比较相近的,而在白天08:00起,受太阳短波辐射增强的影响[20],路面的增温明显快于大气的增温,路面最低温度在13:00达到峰值,平均比最低气温高约7 ℃,
而后在14:00最低气温才到达峰值。

而从路面最低温度和 -10 cm 路基最低温度
的对比来看,白天09:00到16:00以前路面最低温度高于路基最低温度,而其他
时段路基最低温度高于路面最低温度,路基最低温度平均在15:00达到峰值,并
且日变化相对最低气温和路面最低温度都要平缓一些。

可见,最低气温、路面最低温度和路基最低温度虽然都是温度变量,但它们的变化特点并非完全一致,在统计建模时,可在一定程度上将它们视为独立的自变量参与建模以包含更多信息。

本文还根据各站4个冬季361天中各时次路面最低温度统计值确定了各时次路面
最低温度低于0 ℃的出现频率及各时次路面最低温度为一天中最低温度的频率,
从路面最低温度变化以及低温发生频率的特征(图3)来看,路面最低温度集中出现
在06:00与07:00,冬季这一时段没有太阳辐射,因而路面还未升温,这与图3a
所描述的平均特征一致。

但更需要关注的是低温开始出现的时次,从图中来看,路面最低温度降到0 ℃以下的时次比较分散,降温有很多因素,譬如单纯的冷平流
或者寒潮或者其他陆面过程导致路面散热快、降温迅速,而这种事情发生的时间并不固定,结合3种最低温度本身的日变化曲线,降到0 ℃以下的时刻分布就会比
较分散。

从下午18:00到早上05:00均有5%以上的出现频率,从18:00开
始频率才开始明显变大,因为冬季太阳落山都在18:00之前,日落作为昼夜交替的临界点之一,很多陆面过程会发生质的改变,因而对陆面温度变化产生重大影响。

从预警的实用角度考虑,一方面我们希望预警的提前时效越长越好,另一方面夜间发生的路面低温所带来的道路结冰潜在风险更大,因此结合路面低温出现的特征,应考虑利用13:00—18:00的气象变量,对18:00至次日12:00是否发生路面
低温进行预报。

图3 2013—2016年江苏省高速公路AWMS系统165个站点路面低温(a)和出现
频率(b)日变化
2.2 路面低温与气象要素的相关性
在选择统计模型的自变量时,既要保证自变量与预报量在物理机制方面具备一定的理论关系,又要保证二者的数据在统计学层面存在一定的关联性。

就路面温度的变化而言,一方面,陆面以下和陆气交界面的热通量及其变化速率与路面温度热力状况存在直接且相互影响的关系,这部分信息可以通过路基温度、路面温度和气温数据反映,另一方面,陆气间的潜热输送与辐射平衡也与大气活动的状态密切相关[21],常规的风、温、湿等气象要素也可以在一定程度上反映这些陆面过程的背景条件,因此在建模前应先考察这些变量与路面低温的实际相关程度。

以江苏省中部低温出现频率适中(50.6%)的京沪高速扬州境内的M9308站为例,首先列出18:00至次日12:00路面最低温度与13:00—18:00间10个陆面热力与气象环境变量的相关系数(表2)。

夜间路面最低温度与18:00的相对湿度有很好的相关性,
这表明入夜时近地层大气中的水汽含量大小对近地层空气的热容量、导热率、热流量、传热速度影响作用明显,通常相对湿度大时,近地层空气中水汽含量多,热容量大,导热率大,热流量大,传热速度快,地表和大气升降温幅度小;反之,升降温幅度大。

需要指出的是,本文所涉及的气象观测风的变量为风向和风速,但注意到风向因方位角度量制,并不是一个适合直接参与建模计算的变量,譬如359°和1°实质都是明显的偏北风,所表达的气象信息非常接近,但它们在数值上却相差很远,因此有必要将风向、风速换算出纬向风(U分量)和经向风(V分量)以表征不同
风向和低温发生的关联性。

通过路面低温与风速变量的相关系数计算发现,18:
00全风速的大小与夜间低温并没有显著的相关性,而U、V分量都与夜间路面最
低温度呈负相关,表明西风、北风越强时,夜间路面最低温度越低,出现低温的概率越高;反之,东风、南风越强时,夜间路面最低温度越高,出现低温的概率越小,这与气流来源的冷热属性和干湿属性有关。

但U分量与夜间最低温度的相关性更高,表示西风作用更明显,对江苏而言,西风来自相对干燥的内陆,水汽含量少,热容量小,降温速度快,更容易出现低温。

直观来看,白天温度的数值和变温对夜
间降温程度的影响是必须考虑的,通常,晴朗、静稳天气条件下,白天地表热量收支平衡和最高温度出现的时刻均为13:00左右,气温和-10 cm路基温度受路面
温度和路面向上层空气及路面向下层路基传热速度的影响也会出现高温,但出现时刻约滞后1 h(因为太阳短波辐射是白天地表加热的主要来源,而太阳辐射先加热
地表,再由地表加热近地层空气)。

因此,13:00路面温度是影响后续路温、气温、路基温度变化的主导因子。

但通过因子筛选的相关性分析,13:00气温和13:
00路基温度都与夜间路面低温有着极其显著的相关性,表明虽然这一时刻早于各
自出现最高值的时刻,但白天地表热量向上和向下传输作用对气温和路基温度的影响是十分重要的,同时这一时刻气温和路基温度的高低也近似反映了白天近地层大气和路表至-10 cm路基层蕴含热能的最大值。

入夜后,没有了太阳辐射对地表的加热,地表冷却开始明显加快,这种加快的速度与上层空气和下层路基蕴含热能的最大值及当前时刻蕴含热能的多少有关。

而13:00—18:00路面变温和同一时
段内的气温变温和路基变温分别反映了路面温度、气温和路基温度下降的程度,是最终实现路面低温难易程度的度量,因此它们对入夜后路面低温有至关重要的影响,当这3种变温数值大时,意味着降温幅度大,路面低温容易出现;反之,不易出现。

综上,选取通过显著性检验的18:00相对湿度、18:00风场U分量、13:00 气温、13:00路面温度、13:00 路基温度和 13:00—18:00 后三者的变
温作为路面低温预报的因子。

根据路面低温与气象环境要素的相关性讨论可以发现,相关系数本身仅反映两个变量针对自身均值起伏变化的一致程度,鉴于本文除了多元线性回归预报方法还使用到其他两种统计分类预报方法,因此还需要讨论根据“夜间低温发生与否”所区分的两组自变量是否有显著的差异,因为只有当两组自变量存在差异时,才有可能反过来对“低温发生与否”进行预报。

鉴于T检验的T值并不直观,表2中直接给
出了两组样本均值T检验的P值以表征两组样本差异的显著性,并且选取4个变
量的两组概率密度(图4)对比进行举例说明。

由相应结果可见,大部分与夜间最低
温度相关性很好的变量如13:00路面温度、13:00—18:00路面变温以及18:00 U分量在分组T检验中两组样本存在显著的差异,即通过这些变量可以对夜间
是否发生低温进行一定程度的区分。

而相关系数略低的V分量虽然相关显著性水
平P<0.05,但其分组T检验的显著性P>0.1表现为不显著,即其并不能显著区分夜间低温是否发生。

在建立模型时,应综合上述相关检验和差异检验的结果来选择自变量。

表2 京沪高速江苏段M9308站18:00至次日12:00路面低温与10个陆面热力与气象要素的相关系数自变量相关系数显著性水平(α)T检验P值18:00相对湿度
0.41**0.00000.000018:00全风速0.07 0.22180.517318:00 U分量-
0.28**0.00000.000018:00 V分量-0.130.19500.166613:00气温
0.68**0.00000.000013:00路面温度0.33**0.00000.000413:00路基温度
0.45**0.00000.000013:00—18:00空气变温0.20**0.00030.000013:00—18:00
路面变温0.23**0.00000.000013:00—18:00路基变温0.16*0.03800.0368
注:“**”表示通过α<0.01的显著性检验和P<0.01的分组显著性检验。

“*”
表示通过α<0.05的显著性检验和P<0.05的分组显著性检验。

2.3 单站路面低温预警的建模与预报试验
2.3.1 试验设计
以京沪高速M9308站为例,开展统计建模与预报试验。

虽然初步分析了10个气
象要素自变量与夜间路面低温的相关性,但不同变量组合对预报效果的影响仍需要进一步试验,因此设计5种不同的自变量组合(表3)。

其中组合A仅包含路面温度自身及其变温,组合B仅包含3种温度变量白天的温度数值而不包含变温,组合
C包含3种温度变量与变温,组合D包含除V分量和全风速外的其他8个变量,组合E包含全部10个变量,这样既可以对比出非温度类变量、变温等因素对预报
效果的影响,也可以讨论自变量与因变量的相关性对预报效果的影响。

在确定了自变量试验组合的基础上,对于多元线性回归模型可使用18:00至次日12:00的最低路面温度作为因变量,对于朴素贝叶斯分类模型和支持向量机分类模型使用夜间“是”或“否”出现0 ℃以下的路面温度作为因变量类别。

在M9308站2013—2016年冬季数据中筛选出的295组有效样本中,以2013—2014年共126组自变量和因变量样本用于建模,以2015—2016年共169组自变量和因变量样本用于测试模型的预报效果,并对3种统计预报模型的建模和预报结果进行对比分析。

图4 京沪高速江苏段M9308站部分变量按夜间出现路面低温与否分组的概率密度及T检验:(a)13:00路面温度,(b)13:00—18:00路面变温,(c)18:00 U 分量,(d)18:00 V分量
表3 自变量组合方案自变量组合组合方案A路面13:00温度、路面13:00—18:00变温B13:00气温、13:00路面温度、13:00路基温度C13:00气温、13:00路面温度、13:00路基温度及13:00—18:00变温D13:00气温、13:00路面温度、13:00路基温度、13:00—18:00气温变温、13:00—18:00路面变温、13:00—18:00路基变温、18:00相对湿度、18:00风速U分量E全部10个变量
2.3.2 建模预报结果对比
鉴于朴素贝叶斯和支持向量机预报的是分类而非温度数值,且为隐性模型,仅针对M9308站D组变量的多元线性回归模型的建模进行简单讨论。

由建模组样本所建立的夜间最低温度Tforecast预报方程为:
Tforecast= 0.033Rh-3.46U+0.035Ta+0.785Ts+
0.076Tb-0.028Da+0.958Ds-
0.110Db-4.911。

相关文档
最新文档