基于SVM多变量时间序列回归预测工程造价指数_杨玉胜
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
+ ,i = 1 , 2, 3, …, l y i -〈w ·x〉+ b≤ξ * i 2, 3, …, l ξi , ξ* ≥1 , i 通过上述分析, 从而得到原问题的 lagrange 对 偶问题为:
ai , a l
min*
i
1 2
∑
l i =1
∑ ( ai
j =1
l
- a* i
xj ) ) K ( xi ,
0
引言
长期以来, 我国传统工程造价管理模式僵化 , 造 “价值工程 ” 价管理工具“限额设计” 只注重理论方 缺乏与工程实践相结合的能力。 随着我国 面研究, 工程建设项目迅速发展, 亟需更加科学合理、 应用型 — —造价指数用于工程 极强的造价管理工具或手段— 建设项目实践的过程中, 以指导企业编制更为科学 , 合理的概预算 从而可以有效的避免资源的浪费 , 获 得最低的造价成本和最高的经济效益回报 。同时也 以便造价管理部门遵循经济规律, 采取必要的行政 手段, 引导建设市场健康发展。 如何结合各地的经济发展水平与造价管理手段 情况, 收集、 处理基础原始数据, 规范造价指数编制 的流程与方法, 有效指导相关造价咨询和管理机构 及时、 科学、 便捷地编制概预算、 准确预测工程造价 , 指数等 已经成为了当前政府行政造价主管部门亟 需要解决的问题。此外, 随着近些年来, 人们对工程 项目造价提出了节约的提倡, 如何在有限的资源环 境下, 准确无误的预测工程造价指数, 用于后续项目 的决策, 将具有十分重要的意义。 因此针对上述问 笔者基于造价指数预测的角度, 有针对性的在人 题, 物力、 财力有限的条件下, 提出基于 SVM 多变量 力、 时间序列回归预测工程造价指数的方法, 以保证造 , 价指数预测精确 从而为项目决策提供理论上的支
2
+ C∑ i = 1 ( ξ i + ξ * i
l
)
RT : 〈w ·x〉+ b - y i ≤ξ i + , i = 1, 2, 3, …, l
4期
杨玉胜, 等: 基于 SVM 多变量时间序列回归预测工程造价指数
59
2
2. 1
预测模型
喉管、 人工综合工资( 土木工程 ) 、 人工综合工资 ( 建 筑) 价格指数作为造 价 指 数 回 归 预 测 模 型 的 输 入 其中碎石、 沥青、 混凝土、 柴油、 玻璃、 瓷砖、 硬木、 量, 钢筋、 柚木、 木模板、 聚氯乙烯、 铅水喉管、 人工综合 人工综合工资( 建筑 ) 价格指数数 工资( 土木工程) 、 据来源香港特别行政区政府统计处网站, 收集区间 为 2003 年 4 月 至 2014 年 9 月, 每 月 发 布, 共 138 ; 组 造价指数数据来源于香港特别行政区土木工程 收集区间为 2003 年 4 月至 2014 拓展署官方网站, 年 9 月, 每月发布, 共 138 组, 数据来源可靠, 可以科 学客观的反映造价指数与因变量之间的联系 。 3. 2 ADF 单位根检验 为了研究碎石、 沥青、 混凝土、 柴油、 玻璃、 瓷砖、 硬木、 钢筋、 柚木、 木模板、 聚氯乙烯、 铅水喉管、 人工 综合工资( 土木工程) 、 人工综合工资 ( 建筑 ) 价格指 数以及造价指数时间序列是否稳定, 以及是否存在 协整关系, 需要对各指数时间序列进行 ADF 单位根 检验。ADF 单位根检验结果如表 1 。
收稿日期: 2015-09-28 作者简介: 杨玉胜( 1970-) , 男, 副教授, 研究方向: 工程造价。
58
湖 南 交 通 科 技
41 卷
若纳入多变量集合会引起不必要的误差, 因此在选 择多变量时需要对多变量与造价指数之间的关系进 行鉴定, 防止出现不必要的变量引起误差 , 本文秉行 材料价格指数对造价指数影响最大 人工价格指数、 的原则下, 选择与造价指数关系密切的碎石、 沥青、 混凝土、 柴油、 玻璃、 瓷砖、 硬木、 钢筋、 柚木、 木模板、 聚氯乙烯、 铅水喉管、 人工综合工资 ( 土木工程 ) 、 人 工综合工资 ( 建筑 ) 价格指数作为多变量时间序列 研究对象。
-
∑ yi ( ai
i =1 l
- a* i
)
+ ε∑ ( a i + a * i
i =1
l
)
1
1. 1
相关理论
1. 2
RT: ∑ i = 1 ( a i - a * i ADF 单位根检验
)
= 0
支持向量机 理论上, 支持向量机 ( SVM ) 是一种基于统计学 , 习的理论 可以说支持向量机 ( SVM ) 是实现结构化 SVM 首先由 Vapnik 提出, 风险最小的近似表现, 像 多层感知器网络和径向基函数网络一样, 可用于模 式分类和非线性回归预测, 主要思路是建立一个分 类超平面作为决策曲面。 支持向量机 ( SVM ) 具有 可将线性数据进行拟合回归, 此 线性拟合的能力, 外, 通过支持向量机可以建立核函数 ( k ) , 从而可 以将低维非线性映射为高维线性 。对于具体样本数 据= y ), (x , y ), …, ( xl , yl ) ) , 其中, 第i个 (( x ,
第 41 卷第 4 期 2015 年 12 月
湖 南 交 通 科 技
HUNAN COMMUNICATION SCIENCE AND TECHNOLOGY
Vol. 41 No. 4 Dec. 2015
文章编号: 1008-844X( 2015 ) 04-0057-06
基于 SVM 多变量时间序列回归预测工程造价指数
y i R , x 〉+ b, 回归方程 f( x ) =〈w , 输入数据 x i R , x R n, 〈w · x 〉 b Rn 为 偏 其中 w R n , 为 内 积 运 算, 置。总而言之, 针对时间序列线性回归问题可以转 化为如下最优化问题: 1 min w 2 2 RT : 〈w ·x〉+ b - y i ≤, i = 1, 2, 3, …, l 对于上式二次回归问题, 不方便求解, 通常求解 它的 lagrange 对 偶 问 题, 最终得到线性回归方 程 f( x) = xj ) + b , 其中 ∑ ( - ai ) K ( xi , ( a* i - a i ) 为不等于零对应的样本数据就是支持向 K ( xi , x j ) 为核函数, 量, 理论上, 常用的核函数有多
表1
类别 碎石 沥青 混凝土
模型思路 回归预测模型的基本设计思路如图 1 所示, 思 路总的来说, 以多变量时间序列为切入点, 证明多变 这将为 SVM 量在造价指数变化过程存在协整关系, 多变量回归预测因变量的选择提供了理论上的支 持, 本文选择与造价指数关系密切的碎石、 沥青、 混 柴油、 玻璃、 瓷砖、 硬木、 钢筋、 柚木、 木模板、 聚 凝土、 氯乙烯、 铅水喉管、 人工综合工资 ( 土木工程 ) 、 人工 综合工资 ( 建筑 ) 价格指数作为研究对象。 然后在 此基础上, 将多变量数据输入 SVM 模型以寻找最优
l i =1
n
n
Fra Baidu bibliotek
a* i
Sigmoid 函数、 径向基核函数。 针对非线性回 项式、 ) 将样本的输入 x i 归, 首先使用一个非线性映射 φ (· 由输入空间 X 映射到一个高维特征空间 H, 并且在 H , 高维度特 征 空 间 构造出线性支持向量回归机 ( SVM) , 考虑到可能存在的误差, 本文引入两个松 * 即 ξi , ξi , 因此其最优化问题为: 弛变量, min 1 2 ω
p
Δy t = a0 + δ t + γ y t -1 +
β i Δy t -i ∑ i =1
+ ut
式中: Δy t 为一阶差分; t 为时间变量; a0 、 δ、 γ 为待估 计的常量; β i 为趋势量; u t 为残差项; p 为最优滞后阶 数。 1. 3 Johansen 协整检验 Johansen 协整检验是一种基于 VAR 模型的检 验方法, 但是 Johansen 协整也可以直接运用于多变 量间的协整检验, 即验证各变量之间是否存在长期 均衡关系, 若各变量长期存在均衡关系, 即可作为工 程造价指数预测的因变量。 Jonhansen 协整理论上 假设存在 m 维时间序列 y t = y2 t , y3 t , y4 t , …, ( y1 t , y mt ) , 研究 m 维时间序列是否存在协整关系, 因此 协整的定义如下: 1 ) 在单位根检验的前提下, y t 的每个分量 y it ~ I( d) ; 2 ) 若存在协整向量 β, 使得 βy t ~ I ( d ) , 则 yt 协 整。 对于 m 维向量 y t 最多可能存在 m - 1 个线性无 关的协整向量, 为了研究方便, 本文先考虑简单的二 假设 y t = 维情形, y2 t ) ( t = 1 , 2, 3, …, n) , 其中 ( y1 t , y1 t , y2 t 都是 ( d ) 时间序列。 如果存在一个向量 C1 , 使得 y1 t - Cy2 t ~ I( 0 ) , 则可以认为 y1 t 与 y2 t 协整, 协 - C1 ) 。一般认为, 由 y t 的协整向量 整向量 β = ( 1 , 组成的矩阵为 B , 矩阵 B 的秩为 r = r ( B ) , 那么 0 ≤ r ( B ) ≤n - 1 。
杨玉胜,刘 骏
( 长沙理工大学,湖南 长沙 410114 )
要: 为了解决工程造价指数难以精确预测的难题, 针对传统时间序列预测模型缺少 内在固有信息而使得最终预测结果难以成功的缺点 , 从因变量的角度引入多变量时间序列的 摘 概念, 并在 ADF 单位根检验和 Johansen 共整合基础上, 证明多变量时间序列与工程造价指数 存在协整关系, 最后, 结合支持向量机( SVM) 预测算法, 提出基于支持向量机 ( SVM ) 多变量时 间序列回归预测算法, 通过实验, 结果表明, 多变量时间序列可为造价指数预测提供更多的信 息, 预测算法的准确率较高且可行有效 , 具有实际利用价值, 可为后续造价指数的预测和造价 管理提供可靠的参考价值。 关键词: SVM; 时间序列; 造价指数; 预测 中图分类号: U 41 文献标识码: A 持。 Trefor 因此, 本文为了精确预测工程造价指数, [1 ] P. Williams ( 1994 ) 首次提出基于经济因素 ( 基本 放款利率等 ) 多变量的角度预测工程造价指数, 在 Trefor P. Williams 基于上述因素并有效结合 文中, BP 神经网络预测模型, 对造价指数进行预测运算, 最终结果仿真表明, 在造价指数预测方面, 基于 BP , 神经网络多变量时间序列的预测模型 存在误差过 大 的 情 况, 不 宜 用 于 造 价 指 数 的 预 测; Baabak [2 ] ASHURI1 ( 2012 ) 提出基于经济因素 ( 联邦基金利 率等) 和能源相关变量( 原油价格 ) 以及建设市场环 境( 房建开工率等 ) 多变量的角度进行造价指数预 [3 ] 测; S. M. ASCE ( 2013 ) 提出基于居民消费价格指 数、 工程领域就业率、 建设许可等多变量的角度进行 S. M. ASCE 认为多变量时间序列可以为造价 预测, 指数的预测, 提供更多的信息, 从而使得预测精度得 以提高, 并 且 仿 真 结 果 显 示 其 正 确 性; Min - Yuan [4 ] Cheng ( 2013 ) 提出基于经济( 批发价格指数等 ) 和 股市指数因素( 股票指数 ) 以及能源因素 ( 国际原油 价格指数) 多变量, 并在 Li - SVM 预测模型的基础 上, 进行数据预处理, 模型输入、 模型输出、 实验仿真 结果表明, 基于多变量时间序列预测模型的最小绝 对百分比误差( MAPE ) 小于 1% 。 然而, 时间序列并不是变量越多越好, 数据多, ; , 收集难度大 同时 与造价指数存在不相关的变量,
1 1 2 2
a* 2, 3, …, l 0 ≤ ai , ≤ C, i = 1 , i ADF 单位根检定是一种用来测定在 一般而言, 自我回归模型中, 时间序列输入数据是否稳定的一 种方法。利用单根( unit root) 是否存在, 可以确认时 间序列是否达到定态, 同时也可以判断是否可以做 多变量协整关系检验。ADF 检验公式如下: