基于SVM多变量时间序列回归预测工程造价指数_杨玉胜
基于支持向量机回归算法的气象预测的应用研究
支持 向量机简称 S V M,是 V a p n i k 等人 在统计 学 习理论基 础给 出的 种新 的信息算法 ,也其 中是最实用的部分。支持向量机是从线性 可分 情况 下的最优分类发展而来 ,其基本思主要是通过把数据映射到一 个高 维 ( 甚至 无穷维 )特征空间 ,再在高维特征空间进 行线性 回归 ,从而取 得在原空间非线性 回归 的效果 。其 问题可 以表达如下 : 给出某个集合 T={( . ) , i=1 … n ) , E R ,在特征空间 F上
一
、
问题就可 以采用五个参数作为输入 。
由于各个参数单位和量纲的不 同 ,为了计算方 面,对 选取样本 中的 参数采用式 ( 3— 1 )进行处理 。
y :
m 4x 一
问题 ,体现 出良好 的预测 能力。但是 通 过对不 同气 象站 的数 据分 析发 现 ,对于降水预报 ,由于时效性和局域性要求 比较高 ,由于本 人气象知 识 的局 限性 ,固参数选择样 本因子 不是最优 ,不同站 点存 在一定 差误 , 有待于进一步研究和提高 。( 作者单位 :宿州学院信息工程学院) 基金项 目:安徽省大 学生创新训练项 目:基 于支持 向量机 回归技 术 的气 象预测算 法研 究 ,项 目编号 :2 0 1 3 1 0 3 7 9 0 8 0 宿州学院一般 科研项 目:基 于物联 网技术农业 多传 感器的安全信 任 机制的应用研 究,项 目编 号:2 0 1 3 y y b 0 3
一
利用 m a t l a b 软件进行软件 ,此算法在 WI N D O W S X P微软视窗操作系 统运行界面显示如下图所示 :
Ⅲ №
i O 癣 囊 童 A 一/{ 廖p 0
基于SV模型的VaR Monte Carlo模拟
基于SV模型的VaR Monte Carlo模拟马跃;李金玉【摘要】文章以上证综合指数为研究对象讨论了Monte Carlo模拟法计算VaR ,分别利用SV‐VaR模型和Monte Carlo‐SV‐VaR模型计算VaR值,并比较了这2个模型的精确度,从而为上证综合指数的风险度量提供一个参照。
%In thispaper ,taking the Shanghai composite index as the object of study ,the calculation of value at risk(VaR) by Monte Carlo simulation isdiscussed .The SV‐VaR model and Monte Carlo‐SV‐VaR model are used to calculate VaR respectively and the accuracy of the two models is compared in order to provide a reference for the risk measurement of the Shanghai composite index .【期刊名称】《合肥工业大学学报(自然科学版)》【年(卷),期】2015(000)002【总页数】4页(P285-288)【关键词】VaR值;Monte Carlo模拟;Monte Carlo-SV-VaR模型【作者】马跃;李金玉【作者单位】中国矿业大学理学院,江苏徐州 221116;中国矿业大学理学院,江苏徐州 221116【正文语种】中文【中图分类】F8300 引言VaR(Value at Risk)即风险价值,目前作为很多金融机构从事风险管理的重要指标。
金融资产往往具有波动聚集性,SV模型能很好地描述金融资产这一特征。
近年来,很多学者对SV模型进行了研究,文献[1]将SV模型用于VaR的计算并与GARCH 模型相比较;文献[2]采用GARCH模型和SV模型对深圳股市进行了比较。
基于GS-SVM的边坡稳定性预测模型
水利水电技术第51卷2020年第11期张云雁.基于GS-SVM的边坡稳定性预测模型[J].水利水电技术,2020,51(11):205-209.ZHANG Yunyan.GS-SVM-based prediction model for slope stability[J].Water Resources and Hydropower Engineering,2020,51(11): 205-209.基于GS-SVM的边坡稳定性预测模型张云雁(云南省玉溪市水利电力勘测设计院,云南玉溪653100)摘要:针对影响边坡稳定多个相关因素的复杂性和不确定性,以及数据样本的不平衡,现有的方法无法提供精确的边坡稳定性结果等原因,需要迫切开发复杂的数据处理算法。
本文通过详细调查获取了1994—2011年221个圆弧形滑坡案例中边坡高度、倾角和边坡坡体容重、黏聚力、内摩擦角、孔隙水压系数等特征参数及其相对应的稳定性状态(稳定、失稳)组成了模型样本库。
然后,提出了一种基于支持向量机(Support Vector Machine,SVM)的方法进行边坡稳定性的预测分析,并采用精准率、ALC值和F1-Score评估模型预测性能。
通过具体工程实例表明:SVM模型分类精确率、ALC以及Ce分别为0.970、0.898和0.925,明显优于GB、RF、KNN等模型,其预测结果具有很高的可信度。
关键词:边坡稳定性;支持向量机;预测分析;边坡设计doi:10.13928/ki.wrahe.2020.11.025开放科学(资源服务)标识码(OSID):中图分类号:TU43文献标识码:A文章编号:1000-0860(2020)11-0205-05GS-SVM-based prediction model for slope stabilityZHANG Yunyan(Yuxi Water Conservancy and Electric Power Survey and Design1nstitute of Yunnan Province,Yuxi653100,Yunnan,China)Abstract:Aiming at the complexities and uncertainties of several relevant factors affecting slope stability and the imbalance of the related data samples as well as the cause of that the accurate slope stability result cannot be provided by the existing methods concerned,an algorithm for processing the complicated data is necessary to be urgently developed.Through the detailed investigation,the characteristic parameters of the height,dip angle,cohesion,internal friction angle,pore pressure coefficient,etc.of the slopes in the cases of221circular landslides occurred in the period of1994—2011as well as the corresponding stability statuses(stabilized or destabilized)are obtained and then a model sample database is made up herein.Afterwards,a SVM(Support Vector Machine)-based method is put forward to carry out the prediction analysis of the slope stability,while the prediction performance of the prediction model is evaluated by means of accuracy,ALC value and F1-Score.Through the specific engineering cases,it is indicated that the classification accuracy rate,ALC and F1-Score of the SVM model are0.970,0.898and0.925respectively,which are obviously better than those from the models of GB、RF、KNN,etc.,thus its predicting result has a very high reliability.Keywords:slope stability;support vector machine;prediction analysis;slope design收稿日期:2019-11-18基金项目:国家重点研发计划项目(2018YFC0407102)作者简介:张云雁(1967—),男,高级工程师,学士,主要研究方向为水利电力工程勘测设计、评审、咨询等。
多项式与SVM预测模型的理论分析及应用比较
n
1 2
T
+ C ( i+
i= 1
* i
)
-
n
∀i ( + i - y i + T x i + b) -
i= 1
n
∀i * ( +
* i
+
y-
T x i - b) -
i= 1
n
( !i i + !i *
* i
)
( 6)
i= 1
其中, 参数 ∀i , ∀i * &0 被称 为 L agarang e 乘 子;
建模时, 样本数有限, 甚至很少, 导致回归误差大。
# 即使 当样 本 趋 于 无 穷 多 时, 也无 法 保 证 使 Remp ( ) 最小的 emp 与使 R( ) 最小的 ∃是同一个
点, 也不能保证 R ( emp ) 能够趋近 R( ∃) 。
一元多项式模型在解决回归问题时, 常见的
问题就是过学习, 即虽然训练误差最小却不能保 证好的预测效果, 有时训练误差过小反而导致推
抽取的 n 个独立同 分布( independent ident ically dist ribut ed) 得到, 即
( x 1, y 1) , ( x 2, y2 ) , , ( x n, y n)
( 2)
最优函数 f ( ) 的选取标准就是使得预测的 期望风险( 或称风险泛函) 最小, 即
! minR( ) = m in ( y - f ( ) ) dF( x , y ) ( 3)
SVM 回归模型能较好地解决小样本、过学习及欠 学习等一元多项式回归所出现的问题。用于函数
拟合的支持向量机可以表示为
基于SVM的多变量股市时间序列预测研究
基于SVM的多变量股市时间序列预测研究金桃;岳敏;穆进超;宋伟国;何艳珊;陈毅【摘要】目前在股市时间序列预测中,大多数采用单变量时间序列预测算法,导致预测准确度不够高.提出采用基于支持向量机SVM(Support Vector Machines)的多变量股市时间序列预测算法,来提高预测准确度.SVM训练算法中,合适的参数可以使训练模型具有更好泛化能力.交叉验证具有指导参数选择的能力,然而考虑到交叉验证算法效率不高的问题,将其并行化,既达到了参数优选的目的,又避免了传统交叉验证效率低的问题.然后,根据较优参数建立多变量SVM时间序列回归预测模型,进行预测.实验证明,预测平均绝对百分比误差控制在10%以内,并且较之单变量的SVM回归预测有更好的泛化能力.【期刊名称】《计算机应用与软件》【年(卷),期】2010(027)006【总页数】5页(P191-194,209)【关键词】支持向量机;回归;多变量;交叉验证;并行【作者】金桃;岳敏;穆进超;宋伟国;何艳珊;陈毅【作者单位】吉林广播电视大学教学处理工系,吉林,长春,130022;兰州大学计算机科学与工程学院,甘肃,兰州,730000;兰州大学计算机科学与工程学院,甘肃,兰州,730000;兰州大学计算机科学与工程学院,甘肃,兰州,730000;兰州大学计算机科学与工程学院,甘肃,兰州,730000;兰州大学计算机科学与工程学院,甘肃,兰州,730000【正文语种】中文0 引言随着股票市场的发展,股票时间序列预测开始成为人们研究的热点。
目前对于时间序列预测采用的预测方法主要有自回归模型,滑动平均模型,灰色预测法,神经网络预测法,支持向量机。
支持向量机基于结构风险最小化原则,从理论上保证算法的全局最优;而且,支持向量机用核函数思想,能够解决维数灾难问题,使得计算大大简化。
支持向量机SVM由Vapnik及其研究小组于 1995年提出[1],通过非线性变换将非线性数据转化为某个高维空间中的线性问题,被广泛用于分类、预测和回归,应用于时间序列预测研究有很好的效果。
基于SVM和LS-SVM的住宅工程造价预测研究
基于SVM和LS-SVM的住宅工程造价预测研究秦中伏;雷小龙;翟东;金灵志【摘要】To forecast the costs of a residential construction rapidly and accurately at the initial stage of construction that lacks relevant information ,in view of the strengths and weaknesses of previous approaches ,we choose support vector machine (SVM ) and principal component analysis (PCA) .Firstly ,a residential project cost forecasting index set is selected ;The data of the input index is then analyzed and the correlation is eliminated by PCA ;Thirdly ,the processed data are imported into the standard support vector machine and trained by the least squares support vector machine model .The prediction results are compared and analyzed ,and then a more reasonable prediction model isadopted ;Finally ,the prediction result of the model is optimized by model parameter optimization .Experiments show that the relative error of the prediction model is controlled within ± 7% ,and the result is stable .%为在方案设计初期与工程造价相关信息很少的条件下,准确快速地预测住宅工程造价,在分析既往相关理论和方法优劣的基础上,选取支持向量机构建住宅工程造价预测模型,并通过主成分分析对原始数据进行降噪处理。
基于PSO-SVM的水工隧洞施工成本预测
基于PSO-SVM的水工隧洞施工成本预测作者:刘英杰聂章琴王博许亚辉来源:《人民黄河》2021年第09期摘要:为了对水工隧洞工程施工成本进行精确预测,从工程、环境、市场以及管理4个方面分析了水工隧洞施工成本影响因素,构建了水工隧洞施工成本影响因素量化方法。
采用粒子群算法(PSO)优化支持向量机(SVM)模型中的惩罚因子C和核函数参数g,建立基于PSO-SVM的水工隧洞施工成本预测模型。
对比SVM模型的预测结果发现,PSO-SVM模型的平均绝对百分比误差和均方根误差更小,训练速度更快,预测效果更好。
关键词:成本预测;支持向量机;粒子群算法;水工隧洞中图分类号:TV554文献标识码:Adoi:10.3969/j.issn.1000-1379.2021.09.031引用格式:刘英杰,聂章琴,王博,等.基于PSO-SVM的水工隧洞施工成本预测[J].人民黄河,2021,43(9):160-164.Construction Cost Prediction of Hydraulic Tunnel Based on PSO-SVMLIU Yingjie1,2,3, NIE Zhangqin1, WANG Bo1,2,3, XU Yahui1(1.School of Water Conservancy, North China University of Water Resources and Electric Power, Zhengzhou 450046, China;2.Collaborative Innovation Center of Water Resources Efficient Utilization and Support Engineering, Zhengzhou 450046, China;3.Henan Key Laboratory of Water Environment Simulation and Treatment, Zhengzhou 450046, China)Abstract: In order to accurately predict the construction cost of hydraulic tunnel engineering,this paper analyzed the influencing factors of hydraulic tunnel construction cost from four aspects of engineering, environment, market and management, and established a quantitative system of influencing factors of hydraulic tunnel construction cost. Particle Swarm Optimization (PSO) was used to optimize the penalty factor C and kernel function parameter G in the support vector machine (SVM) model, and the construction cost prediction model of hydraulic tunnel based on PSO-SVM was established. Compared with the prediction results of SVM model, the average absolute error percentage and root mean square error of PSO-SVM model are lower, the training speed is faster and the prediction effect is better.Key words: cost forecast; support vector machine; particle swarm optimization; hydraulic tunnel水工隧洞工程具有施工条件复杂、工期长、技术难度高、投资规模大等特点。
svm 回归 评价指标 -回复
svm 回归评价指标-回复SVM回归评价指标SVM回归是一种广泛应用于回归分析领域的机器学习方法,其以寻找一个最佳的超平面来对数据进行拟合和预测。
在应用SVM回归时,评价指标的选择非常重要,它能够帮助我们判断模型的效果,并对其性能进行量化分析。
本文将一步一步回答有关SVM回归评价指标的问题。
第一步:SVM回归的基本原理为了更好地理解SVM回归评价指标,首先需要了解SVM回归的基本原理。
SVM回归旨在通过在超平面两侧创建一个间隔带来预测目标变量的连续值。
它使用支持向量机的最大间隔分类器,但在预测连续变量时,它将目标变量值限制在一个给定的范围内,而不是进行离散分类。
SVM回归的关键思想是找到一个线性超平面,使大部分数据点都位于超平面的间隔带内。
第二步:SVM回归的评价指标在使用SVM回归进行建模和预测之后,我们需要一些评价指标来评估模型的性能和准确性。
以下是一些常用的SVM回归评价指标:1. 均方误差(Mean Square Error,MSE):均方误差是最常用的回归评价指标之一。
它表示实际值与预测值之间的平均差异的平方。
MSE的计算公式为:MSE = 1/n * Σ(yi - ŷi)^2其中,yi是实际值,ŷi是预测值,n是数据点的个数。
MSE越小,说明模型的预测结果与真实值越接近。
2. 平均绝对误差(Mean Absolute Error,MAE):平均绝对误差是另一种常用的回归评价指标。
它表示实际值与预测值之间的平均差异的绝对值。
MAE的计算公式为:MAE = 1/n * Σyi - ŷi其中,yi是实际值,ŷi是预测值,n是数据点的个数。
MAE越小,说明模型的预测结果与真实值越接近。
3. 决定系数(Coefficient of Determination,R^2):决定系数是一种常用的回归评价指标,用于评估模型对因变量变异性的解释能力。
决定系数的取值范围为0到1,越接近1表示模型对因变量的解释能力越强。
基于SVM_算法的电力物资采购价格预测研究
随着我国城网建设不断发展,集中招标采购规模不断扩大,预测电力物资采购价格是电力企业提高采购管理水平和提高概预算编制准确率的必要条件[1]。
因此,如何建立电力物资采购价格预测的模型,为电力工程建设规划提供比较合理的价格预测区间,是当前电力公司亟待解决的问题。
业内专家与学者们对商品购买价格评估方面,目前采用的方法大多是通过对历史数据进行预测,张昊等[2]利用随机森林和XGBoost模型判断各特征数据对模型的贡献程度。
叶倩怡[3]以零售业销售数据作为数据挖掘对象,对比XGBoost、随机森林和Time Series Linear模型在销售额预测上的效果,得到XGBoost模型比其他模型预测效果更好。
陈宇韶等[4]利用XGBoost模型预测股价走势。
靳占新等[5]则使用构建线性回归法与随机时间序列两个的模型预测物品价格。
该文用统计方法对已有的历史物资价格信息进行收集,分析影响物资定价的主要原因,并利用支持向量机与神经网络算法模型对预测电力物资定价进行对比,结果表明支持向量机的算法模型预测的结果更具有准确性。
1 电力物资价格的影响因素分析电力建设的成本大部分取决于电力物资价格的高低,而电力物资的价格由多种因素综合决定。
因此,为预测电力物资价格,需要对电力物资价格的影响因素进行分析。
通过收集榕能集团2020年1月—2022年6月电力物资采购信息,选取电力物资采购价格的核心影响因素。
历史采购数据的质量直接影响电力物资价格预测的精度,数据的完整性和准确性是影响数据质量的关键因素。
因此,为得到可信度较高的电力物资价格的影响因素,需要对数据进行预处理。
因此,需要清理缺失值和噪声数据,再标准化表示数据。
从电力物资采购数据表中可知,采购的物资种类共计35种,对每件产品的数据进行标准化处理后,利用MATLAB编程求解多元线性回归的系数。
自变量依次为采购方式,购买时间,型号,截面,阻燃特性,铠装形式,中标数量,芯数。
以电力电缆为例,得到自变量影响系数,见表1。
基于混沌SVM与ARIMA的工程造价组合预测
基于混沌SVM与ARIMA的工程造价组合预测
倪洁;谈飞
【期刊名称】《工程管理学报》
【年(卷),期】2013(000)006
【摘要】为了解决工程造价预测的时效性问题,针对传统线性时间序列预测模型
可靠性不高的缺点,引入混沌相空间重构和支持向量机技术,并将两者耦合组成一种非线性预测模型,再利用ARIMA在整体线性趋势预测方面的优越性,对非线性模型进行修正。
混沌SVM和ARIMA预测构成组合模型的两个子过程,将两个子过程的预测结果综合平均即可得到最终预测结果。
经实例计算,组合模型比最大Lyapunov指数、ARIMA和只将相空间重构与SVM进行耦合的方法拟合效果好,预测精度高,证明其的确具有线性趋势拟合和非线性波动拟合的双优势。
【总页数】5页(P25-29)
【作者】倪洁;谈飞
【作者单位】河海大学商学院,江苏南京 211100;河海大学商学院,江苏南京211100
【正文语种】中文
【中图分类】TU723.3
【相关文献】
1.基于混沌SVM与ARIMA的工程造价组合预测 [J], 倪洁;谈飞;
2.基于SARIMA-GRNN-SVM的短期商业电力负荷组合预测方法 [J], 徐晶; 迟福
建; 葛磊蛟; 李娟; 张梁; 羡一鸣
3.基于小波包分解的LS-SVM-ARIMA组合降水预测 [J], 徐冬梅;张一多;王文川
4.基于小波包分解的LS-SVM-ARIMA组合降水预测 [J], 徐冬梅;张一多;王文川
5.基于SSA-ARIMA-HPSO-SVM组合模型的汇率预测 [J], 王相宁;杨杰
因版权原因,仅展示原文概要,查看原文内容请购买。
基于LSSVM-SVIP的工程造价动态软测量策略
基于LSSVM-SVIP的工程造价动态软测量策略
黄文涛;周萍;程锦翔
【期刊名称】《工程管理学报》
【年(卷),期】2015(029)005
【摘要】为了解决工程造价中关键影响因素难以选择以及模型估计精度不高的问题,提出了一种基于 LSSVM-SVIP 的工程造价动态软测量方法.该方法通过对样本数据的重构,获得具有动态性能的工程造价初始软测量模型.同时利用改进的变量投影性指标法对工程造价初始软测量模型中多个影响因素进行筛选,得到优化模型.并以最小二乘支持向量机作为非线性逼近器,建立工程造价的软测量模型.将该方法应用于工程造价案例中,结果表明:经SVIP方法优化后的模型结构简单,估计精度高,泛化能力强,能满足实际工程要求.
【总页数】5页(P35-39)
【作者】黄文涛;周萍;程锦翔
【作者单位】东南大学电气工程学院,江苏南京 210096;建业恒安工程管理股份有限公司,江苏江阴 214400;南京航空航天大学机电学院,江苏南京 210016
【正文语种】中文
【中图分类】TU723.3
【相关文献】
1.基于LSSVM-SVIP的工程造价动态软测量策略 [J], 黄文涛;周萍;程锦翔;
2.动态流量软测量系统中神经网络训练策略的研究 [J], 唐勇; 王益群; 姜万录
3.基于动态管理模式下的建筑工程造价控制策略探究 [J], 徐佳慧
4.基于RLS在线学习算法的DeepESN动态软测量建模方法及应用 [J], 岳文琦
5.基于建筑工程造价的动态管理与控制策略分析 [J], 蔡洁彬
因版权原因,仅展示原文概要,查看原文内容请购买。
基于小波分析的SVM和ARMA预测模型的实证研究——以居民消费价格指数CPI为例
基于小波分析的SVM和ARMA预测模型的实证研究——以
居民消费价格指数CPI为例
范敬雅;邹玉梅;吴承东
【期刊名称】《科技与经济》
【年(卷),期】2016(029)005
【摘要】居民消费物价指数作为宏观经济决策以及国民经济核算的重要指标,其走势研究具有重大的现实意义.研究基于2010年12月到2016年3月份的CPI值,利用小波分解为近似序列和细节序列,并对近似序列建立了支持向量机预测模型,对细节序列建立ARMA预测模型,最终通过小波重构技术得到CPI预测值.实证研究表明:预测效果良好,均方误差仅为0.002 3.
【总页数】4页(P6-9)
【作者】范敬雅;邹玉梅;吴承东
【作者单位】山东科技大学数学与系统科学学院,山东青岛266590;山东科技大学数学与系统科学学院,山东青岛266590;山东科技大学数学与系统科学学院,山东青岛266590
【正文语种】中文
【相关文献】
1.大坝变形的小波分析与ARMA预测模型 [J], 罗德河;郑东健
2.基于ARMA模型我国居民消费价格指数实证分析及预测 [J], 郭玉;李明星;邸彦彪;李晓梅
3.我国居民消费价格指数(CPI)的时间序列建模--基于ARIMA模型 [J], 谭鹏
4.基于ARMA平稳时间序列的机票价格预测模型r——以山海关机场为例 [J], 林鑫;解沐萱;陈巍立;孟楠;王雪莹;梁晨旭
5.基于ARMA模型的我国居民消费价格指数预测 [J], 张禾
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
y i R , x 〉+ b, 回归方程 f( x ) =〈w , 输入数据 x i R , x R n, 〈w · x 〉 b Rn 为 偏 其中 w R n , 为 内 积 运 算, 置。总而言之, 针对时间序列线性回归问题可以转 化为如下最优化问题: 1 min w 2 2 RT : 〈w ·x〉+ b - y i ≤, i = 1, 2, 3, …, l 对于上式二次回归问题, 不方便求解, 通常求解 它的 lagrange 对 偶 问 题, 最终得到线性回归方 程 f( x) = xj ) + b , 其中 ∑ ( - ai ) K ( xi , ( a* i - a i ) 为不等于零对应的样本数据就是支持向 K ( xi , x j ) 为核函数, 量, 理论上, 常用的核函数有多
l i =1
n
n
a* i
Sigmoid 函数、 径向基核函数。 针对非线性回 项式、 ) 将样本的输入 x i 归, 首先使用一个非线性映射 φ (· 由输入空间 X 映射到一个高维特征空间 H, 并且在 H , 高维度特 征 空 间 构造出线性支持向量回归机 ( SVM) , 考虑到可能存在的误差, 本文引入两个松 * 即 ξi , ξi , 因此其最优化问题为: 弛变量, min 1 2 ω
+ ,i = 1 , 2, 3, …, l y i -〈w ·x〉+ b≤ξ * i 2, 3, …, l ξi , ξ* ≥1 , i 通过上述分析, 从而得到原问题的 lagrange 对 偶问题为:
ai , a l
min*
i
1 2
∑
l i =1
∑ ( ai
j =1
l
- a* i
xj ) ) K ( xi ,
2
+ C∑ i = 1 ( ξ i + ξ * i
l
)
RT : 〈w ·x〉+ b - y i ≤ξ i + , i = 1, 2, 3, …, l
4期
杨玉胜, 等: 基于 SVM 多变量时间序列回归预测工程造价指数
59
2
2. 1
预测模型
喉管、 人工综合工资( 土木工程 ) 、 人工综合工资 ( 建 筑) 价格指数作为造 价 指 数 回 归 预 测 模 型 的 输 入 其中碎石、 沥青、 混凝土、 柴油、 玻璃、 瓷砖、 硬木、 量, 钢筋、 柚木、 木模板、 聚氯乙烯、 铅水喉管、 人工综合 人工综合工资( 建筑 ) 价格指数数 工资( 土木工程) 、 据来源香港特别行政区政府统计处网站, 收集区间 为 2003 年 4 月 至 2014 年 9 月, 每 月 发 布, 共 138 ; 组 造价指数数据来源于香港特别行政区土木工程 收集区间为 2003 年 4 月至 2014 拓展署官方网站, 年 9 月, 每月发布, 共 138 组, 数据来源可靠, 可以科 学客观的反映造价指数与因变量之间的联系 。 3. 2 ADF 单位根检验 为了研究碎石、 沥青、 混凝土、 柴油、 玻璃、 瓷砖、 硬木、 钢筋、 柚木、 木模板、 聚氯乙烯、 铅水喉管、 人工 综合工资( 土木工程) 、 人工综合工资 ( 建筑 ) 价格指 数以及造价指数时间序列是否稳定, 以及是否存在 协整关系, 需要对各指数时间序列进行 ADF 单位根 检验。ADF 单位根检验结果如表 1 。
0
引言
长期以来, 我国传统工程造价管理模式僵化 , 造 “价值工程 ” 价管理工具“限额设计” 只注重理论方 缺乏与工程实践相结合的能力。 随着我国 面研究, 工程建设项目迅速发展, 亟需更加科学合理、 应用型 — —造价指数用于工程 极强的造价管理工具或手段— 建设项目实践的过程中, 以指导企业编制更为科学 , 合理的概预算 从而可以有效的避免资源的浪费 , 获 得最低的造价成本和最高的经济效益回报 。同时也 以便造价管理部门遵循经济规律, 采取必要的行政 手段, 引导建设市场健康发展。 如何结合各地的经济发展水平与造价管理手段 情况, 收集、 处理基础原始数据, 规范造价指数编制 的流程与方法, 有效指导相关造价咨询和管理机构 及时、 科学、 便捷地编制概预算、 准确预测工程造价 , 指数等 已经成为了当前政府行政造价主管部门亟 需要解决的问题。此外, 随着近些年来, 人们对工程 项目造价提出了节约的提倡, 如何在有限的资源环 境下, 准确无误的预测工程造价指数, 用于后续项目 的决策, 将具有十分重要的意义。 因此针对上述问 笔者基于造价指数预测的角度, 有针对性的在人 题, 物力、 财力有限的条件下, 提出基于 SVM 多变量 力、 时间序列回归预测工程造价指数的方法, 以保证造 , 价指数预测精确 从而为项目决策提供理论上的支
1 1 2 2
a* 2, 3, …, l 0 ≤ ai , ≤ C, i = 1 , i ADF 单位根检定是一种用来测定在 一般而言, 自我回归模型中, 时间序列输入数据是否稳定的一 种方法。利用单根( unit root) 是否存在, 可以确认时 间序列是否达到定态, 同时也可以判断是否可以做 多变量协整关系检验。ADF 检验公式如下:
-
∑ yi ( ai
i =1 l
- a* i
)
+ ε∑ ( a i + a * i
i =1
l
)
1
1. 1
相关理论
1. 2
RT: ∑ i = 1 ( a i - a * 量机 理论上, 支持向量机 ( SVM ) 是一种基于统计学 , 习的理论 可以说支持向量机 ( SVM ) 是实现结构化 SVM 首先由 Vapnik 提出, 风险最小的近似表现, 像 多层感知器网络和径向基函数网络一样, 可用于模 式分类和非线性回归预测, 主要思路是建立一个分 类超平面作为决策曲面。 支持向量机 ( SVM ) 具有 可将线性数据进行拟合回归, 此 线性拟合的能力, 外, 通过支持向量机可以建立核函数 ( k ) , 从而可 以将低维非线性映射为高维线性 。对于具体样本数 据= y ), (x , y ), …, ( xl , yl ) ) , 其中, 第i个 (( x ,
收稿日期: 2015-09-28 作者简介: 杨玉胜( 1970-) , 男, 副教授, 研究方向: 工程造价。
58
湖 南 交 通 科 技
41 卷
若纳入多变量集合会引起不必要的误差, 因此在选 择多变量时需要对多变量与造价指数之间的关系进 行鉴定, 防止出现不必要的变量引起误差 , 本文秉行 材料价格指数对造价指数影响最大 人工价格指数、 的原则下, 选择与造价指数关系密切的碎石、 沥青、 混凝土、 柴油、 玻璃、 瓷砖、 硬木、 钢筋、 柚木、 木模板、 聚氯乙烯、 铅水喉管、 人工综合工资 ( 土木工程 ) 、 人 工综合工资 ( 建筑 ) 价格指数作为多变量时间序列 研究对象。
杨玉胜,刘 骏
( 长沙理工大学,湖南 长沙 410114 )
要: 为了解决工程造价指数难以精确预测的难题, 针对传统时间序列预测模型缺少 内在固有信息而使得最终预测结果难以成功的缺点 , 从因变量的角度引入多变量时间序列的 摘 概念, 并在 ADF 单位根检验和 Johansen 共整合基础上, 证明多变量时间序列与工程造价指数 存在协整关系, 最后, 结合支持向量机( SVM) 预测算法, 提出基于支持向量机 ( SVM ) 多变量时 间序列回归预测算法, 通过实验, 结果表明, 多变量时间序列可为造价指数预测提供更多的信 息, 预测算法的准确率较高且可行有效 , 具有实际利用价值, 可为后续造价指数的预测和造价 管理提供可靠的参考价值。 关键词: SVM; 时间序列; 造价指数; 预测 中图分类号: U 41 文献标识码: A 持。 Trefor 因此, 本文为了精确预测工程造价指数, [1 ] P. Williams ( 1994 ) 首次提出基于经济因素 ( 基本 放款利率等 ) 多变量的角度预测工程造价指数, 在 Trefor P. Williams 基于上述因素并有效结合 文中, BP 神经网络预测模型, 对造价指数进行预测运算, 最终结果仿真表明, 在造价指数预测方面, 基于 BP , 神经网络多变量时间序列的预测模型 存在误差过 大 的 情 况, 不 宜 用 于 造 价 指 数 的 预 测; Baabak [2 ] ASHURI1 ( 2012 ) 提出基于经济因素 ( 联邦基金利 率等) 和能源相关变量( 原油价格 ) 以及建设市场环 境( 房建开工率等 ) 多变量的角度进行造价指数预 [3 ] 测; S. M. ASCE ( 2013 ) 提出基于居民消费价格指 数、 工程领域就业率、 建设许可等多变量的角度进行 S. M. ASCE 认为多变量时间序列可以为造价 预测, 指数的预测, 提供更多的信息, 从而使得预测精度得 以提高, 并 且 仿 真 结 果 显 示 其 正 确 性; Min - Yuan [4 ] Cheng ( 2013 ) 提出基于经济( 批发价格指数等 ) 和 股市指数因素( 股票指数 ) 以及能源因素 ( 国际原油 价格指数) 多变量, 并在 Li - SVM 预测模型的基础 上, 进行数据预处理, 模型输入、 模型输出、 实验仿真 结果表明, 基于多变量时间序列预测模型的最小绝 对百分比误差( MAPE ) 小于 1% 。 然而, 时间序列并不是变量越多越好, 数据多, ; , 收集难度大 同时 与造价指数存在不相关的变量,
第 41 卷第 4 期 2015 年 12 月
湖 南 交 通 科 技
HUNAN COMMUNICATION SCIENCE AND TECHNOLOGY
Vol. 41 No. 4 Dec. 2015
文章编号: 1008-844X( 2015 ) 04-0057-06
基于 SVM 多变量时间序列回归预测工程造价指数
表1
类别 碎石 沥青 混凝土
模型思路 回归预测模型的基本设计思路如图 1 所示, 思 路总的来说, 以多变量时间序列为切入点, 证明多变 这将为 SVM 量在造价指数变化过程存在协整关系, 多变量回归预测因变量的选择提供了理论上的支 持, 本文选择与造价指数关系密切的碎石、 沥青、 混 柴油、 玻璃、 瓷砖、 硬木、 钢筋、 柚木、 木模板、 聚 凝土、 氯乙烯、 铅水喉管、 人工综合工资 ( 土木工程 ) 、 人工 综合工资 ( 建筑 ) 价格指数作为研究对象。 然后在 此基础上, 将多变量数据输入 SVM 模型以寻找最优