基于SVM分块回归分析的话务量预测模型
基于支持向量机的电信话务量预测
Table 2 Sample data of GSM net 2002 2003 900465 900003 757783 807501 832037 809786 729362 594212 872679 906576 884235 848686 874490 908827 757782 791038 798755 819426 730811 593034 892611 889142 885993 848686
A Prediction of Speech Volume Based on Support Vector Machine
Han Huimin
Automation School, Beijing University of Posts and Telecommunications, Beijing (100876)
T = {( x1 , y1 ),..., ( xl , yl )} ∈ ( X × Y )l ,
where xi ∈ X = ℜ , yi ∈ Y = ℜ , i = 1,..., l ;
n
(2) (3)
α ∈ℜ
Choose the proper positive number ε and C ; choose the proper kernel Construct the optimization function and resolve the optimization problem
l l 1 l * * * α − α α − α K x y + ε α + α − yi (α i* − α i ) , ( )( ) ( , ) ( ) ∑ i i j j i j ∑ ∑ i i 2 i , j =1 i =1 i =1
一种新的基于GCS-SVM的网络流量预测模型
一种新的基于GCS-SVM的网络流量预测模型赖锦辉;梁松【摘要】针对网络流量预测模型存在预测稳定性不好、精度较低等问题,提出一种改进布谷鸟搜索算法优化支持向量机的网络流量预测模型(GCS-SVM)。
将网络流量时间序列进行重构,采用改进布谷鸟搜索算法优化支持向量机参数,使用这组最优参数建立网络流量预测模型。
仿真结果表明,GCS-SVM模型对网络流量预测是有效可行的。
%There are some problems, such as low precision, on existing network traffic forecast model. In accordance with these problems, this paper proposes the network traffic forecast model of Support Vector Machine(SVM)optimized by improved Cuckoo Search algorithm(GCS). It will transform the time series of the network traffic, and then use cuckoo search optimization algorithm to optimize the parameters of Support Vector Machine. The optimum parameters can be used to establish the model of network traffic prediction, which would make the forecast more accurate. The simulation shows that, the GCS-SVM model is a suitable and effective method for forecasting Internet traffic.【期刊名称】《计算机工程与应用》【年(卷),期】2013(000)021【总页数】4页(P75-78)【关键词】网络流量预测;高斯变异;支持向量机;布谷鸟搜索算法【作者】赖锦辉;梁松【作者单位】广东石油化工学院实验教学部计算机中心,广东茂名 525000;广东石油化工学院计算机与电子信息学院,广东茂名 525000【正文语种】中文【中图分类】TP393网络流量特性反映了数据传输过程中的相互作用和影响,通过对流量数据的分析,有助于人们了解网络内部运行机制并建立全面刻画流量过程的数学模型。
构建支持向量机算法的预测模型
构建支持向量机算法的预测模型在现代的数据分析领域中,预测模型被广泛应用于各个领域。
构建一个有效的预测模型需要精准的数据预处理和特征工程,但是最重要的是使用合适的算法。
其中,支持向量机(Support Vector Machine,简称SVM)被认为是各种预测模型中最具有实用价值的算法之一。
本文将讨论如何构建支持向量机算法的预测模型,以预测未来的事件和情况。
一、什么是支持向量机?支持向量机是一种非常流行的机器学习算法,可用于分类和回归分析问题。
它的主要思想是通过在数据点之间构建一个最佳的分割线(超平面)来对数据进行分类或回归分析。
在支持向量机算法中,我们选择两个不同的数据集类别,并尝试使它们在最终解决方案中达到最大分离。
这可以通过选择具有最大间隔的超平面来实现。
例如,在两个类别的数据集中,我们可以选择一个超平面,使得两个数据集类别之间的距离最大。
该超平面成为:最大间隔超平面。
使用支持向量机进行分类时,我们必须将新数据点映射到距离最近的类别。
SVM算法的主要优点在于它们不受异常数据的影响,并在低维数据集中提供出色的结果。
然而,SVM算法在高维数据集中需要进行更多的计算和分析,才能获得较好的结果。
二、构建支持向量机的预测模型构建支持向量机算法的预测模型需要考虑以下步骤:1. 数据预处理作为数学模型,支持向量机算法对于输入数据有特殊的要求。
首先,我们需要确保数据被准确地标记和归类。
其次,我们需要使用合适的特征转换技术,将数据集的特征转换为支持向量机算法可以理解的形式。
在数据预处理阶段中,我们应该:(1) 验证数据的质量和数量,排除掉可能对算法产生负面影响的异常值和无效数据。
(2) 标记和归类数据,以使其适用于算法的需求。
(3) 选择合适的特征转换技术,将数据转换为支持向量机算法可以处理的形式。
2. 特征工程在特征工程阶段,我们应该选择最具预测性的特征作为算法输入。
在这个过程中,我们可以使用一些特定的技术来解决高维度和维度灾难(curse of dimensionality)的问题。
SVM的信息粒化时序回归预测城市用水量
SVM的信息粒化时序回归预测城市用水量张清周;黄源;赵明【摘要】利用基于信息粒化的支持向量机预测模型对某市11个月的时用水量数据进行模拟训练,对下一个月的每日最高时用水量进行预测.首先提取每日的最高时用水量,再将每7个数据变换为一个三角型模糊粒子,该模糊粒子中的三个参数Low、R和Up分别代表一周内最高时用水量变化的最小值、平均值和最大值,然后利用SVM对最高时用水量及Low、R和Up进行预测.针对SVM在预测时调整自身相关参数困难的问题,提出了运用网格法对模型中的参数进行优化选择.实例分析结果表明,该模型建模速度快,预测精度高,且实用性强.【期刊名称】《供水技术》【年(卷),期】2012(006)004【总页数】4页(P43-46)【关键词】信息粒化;支持向量机;网格算法;用水量预测;相对误差【作者】张清周;黄源;赵明【作者单位】哈尔滨工业大学市政环境工程学院,黑龙江哈尔滨150090;哈尔滨工业大学市政环境工程学院,黑龙江哈尔滨150090;哈尔滨工业大学市政环境工程学院,黑龙江哈尔滨150090【正文语种】中文【中图分类】TU991.31城市用水量预测的精度直接影响管网系统优化运行的实用性。
从模型的理论基础来看,可以将城市用水量预测模型划分为两个主要类别:一类是以统计学原理为基础的预测模型,如季节指数平滑法预测模型和ARIMA模型;另一类是以混沌理论、神经网络、支持向量机等理论为基础的预测模型,如最大Lyapunov指数预测模型、模糊神经网络预测模型和支持向量回归机模型[1-5]。
上述预测方法只能得到用水量的点预测,但在管网优化调度和运行管理中,还需要掌握一段时期内用水量的变化范围。
因此,笔者先将原始数据进行信息粒化,在此基础上构建支持向量机的预测模型,采用该模型预测日最高时用水量及其一段时期内的变化范围。
1 基于信息粒化的支持向量机预测方法1.1 信息粒化信息粒化就是把大量复杂的信息按各自的特征划分成若干较简单的块,每个块作为一个信息粒,这种处理信息的过程称为信息粒化。
基于SVM分块回归分析的话务量预测模型
基于SVM分块回归分析的话务量预测模型
陈蓉;宋俊德
【期刊名称】《计算机应用》
【年(卷),期】2008(28)9
【摘要】针对话务量的特性,提出了一种基于支持向量机分块回归分析的话务量预测模型,将话务量按日期分为工作日话务量、周末话务量进行建模,采用不同的模型预测相应的话务量.实验结果证明了该模型的有效性,相比传统的ARMA模型获得了更好的预测效果.
【总页数】4页(P2230-2232,2235)
【作者】陈蓉;宋俊德
【作者单位】电子科技大学中山学院,电子工程系,广东,中山,528400;北京邮电大学,电子工程学院,北京,100876;北京邮电大学,电子工程学院,北京,100876
【正文语种】中文
【中图分类】TP393.07
【相关文献】
1.基于小波变换和ARMA-LSSVM的忙时话务量预测 [J], 何玮珊;覃锡忠;贾振红;常春;曹传玲
2.基于决策树的呼叫中心分时段话务量预测模型 [J], 王三军;杨厚新;王向英
3.基于时间序列模型的异常话务量分块建模和预测 [J], 范晨;邢竟;王文静;庞朝曦;陈伟杰
4.基于决策树的呼叫中心分时段话务量预测模型 [J], 王三军;杨厚新;王向英
5.基于改进的小波变换和LS-SVM模型的忙时话务量预测算法 [J], 李江豹;贾振红;覃锡忠;盛磊;陈丽
因版权原因,仅展示原文概要,查看原文内容请购买。
svm 回归 评价指标
svm 回归评价指标SVM回归评价指标SVM回归是一种广泛应用于回归分析领域的机器学习方法,其以寻找一个最佳的超平面来对数据进行拟合和预测。
在应用SVM回归时,评价指标的选择非常重要,它能够帮助我们判断模型的效果,并对其性能进行量化分析。
本文将一步一步回答有关SVM回归评价指标的问题。
第一步:SVM回归的基本原理为了更好地理解SVM回归评价指标,首先需要了解SVM回归的基本原理。
SVM回归旨在通过在超平面两侧创建一个间隔带来预测目标变量的连续值。
它使用支持向量机的最大间隔分类器,但在预测连续变量时,它将目标变量值限制在一个给定的范围内,而不是进行离散分类。
SVM回归的关键思想是找到一个线性超平面,使大部分数据点都位于超平面的间隔带内。
第二步:SVM回归的评价指标在使用SVM回归进行建模和预测之后,我们需要一些评价指标来评估模型的性能和准确性。
以下是一些常用的SVM回归评价指标:1. 均方误差(Mean Square Error,MSE):均方误差是最常用的回归评价指标之一。
它表示实际值与预测值之间的平均差异的平方。
MSE的计算公式为:MSE = 1/n * Σ(yi - ŷi)^2其中,yi是实际值,ŷi是预测值,n是数据点的个数。
MSE越小,说明模型的预测结果与真实值越接近。
2. 平均绝对误差(Mean Absolute Error,MAE):平均绝对误差是另一种常用的回归评价指标。
它表示实际值与预测值之间的平均差异的绝对值。
MAE的计算公式为:MAE = 1/n * Σyi - ŷi其中,yi是实际值,ŷi是预测值,n是数据点的个数。
MAE越小,说明模型的预测结果与真实值越接近。
3. 决定系数(Coefficient of Determination,R^2):决定系数是一种常用的回归评价指标,用于评估模型对因变量变异性的解释能力。
决定系数的取值范围为0到1,越接近1表示模型对因变量的解释能力越强。
基于ARIMA-SVM组合模型的移动通信用户数预测
・ 1 3 ・
K ( x , , y j ) : e × p ( _
o
, i =
. . n
( 5 )
果, 较 好地解 决了小 样本 、 非线性 、 过 拟合 、 维数 灾和局 部小等
其 中, 盯为核密度 。
( 3 ) AR I MA— S V M 组合 预 测模 型
测 的特性 , 其数 据具有 线性和 非线性规律 , 并隐含 大量 的动态
的深入研究开拓 了新的空间 。然而在 实际应用 中 , 神经 网络存
收 稿 日期 : 2 0 1 4 6 1 9
基 金项 目 : 国 家 自然 科 学 基 金 青 年 基 金 项 目( 6 1 3 0 0 1 3 0 ) 作者简 介 : 王佳敏( 1 9 9 2 一 ) , 女, 河北省廊坊人 , 本科生 , 主 要 研 究 方 向: 移动通信 。
基于改进PSO算法优化LS-SVR的话务量预测
基于改进PSO算法优化LS-SVR的话务量预测
张杰;贾振红;覃锡忠;陈丽
【期刊名称】《激光杂志》
【年(卷),期】2013(34)2
【摘要】为了更准确的预测话务量,提出了一种以粒子群优化算法为基础的,通过多样性度量指标控制种群特征的改进粒子群优化算法(MPSO),用于最小二乘支持向量回归机(LS-SVR)超参数的寻优,分析影响话务量的相关因素,选取合适的样本,利用优化后的LS-SVR模型对移动话务量进行预测。
与标准LS-SVR预测算法和PSO优化后的LS-SVM算法进行比较,实验结果表明,本文的预测方法具有更好的收敛性和更高的预测精度。
【总页数】2页(P35-36)
【关键词】粒子群优化算法;最小二乘支持向量回归机;话务量预测;超参数;预测精度【作者】张杰;贾振红;覃锡忠;陈丽
【作者单位】新疆大学信息科学与工程学院;中国移动通信集团新疆有限公司【正文语种】中文
【中图分类】TP181
【相关文献】
1.基于蚁群算法优化支持向量机的移动话务量预测 [J], 宋秀秀;贾振红;覃锡忠
2.基于改进的PSO算法优化灰色神经网络的话务量预测 [J], 俞秀婷;覃锡忠;贾振红;傅云瑾;曹传玲;常春
3.基于改进PSO算法优化GRNN的煤与瓦斯突出预测 [J], 胡业林; 占晨阳; 郑晓亮; 宋晓
4.改进PSO算法优化LSSVM的柴油机排气预测 [J], 张扬; 朱志宇
5.基于SAPSO算法优化Elman神经网络的话务量预测 [J], 俞秀婷;覃锡忠;贾振红;傅云瑾;曹传玲;常春
因版权原因,仅展示原文概要,查看原文内容请购买。
基于svm的先分类再回归方法及其在产量预测中的应用
基于svm的先分类再回归方法及其在产量预测中的应用SVM(Support Vector Machine)是一种常用的分类和回归算法,它具有分类效果好、泛化性能强等特点。
先分类再回归(Two-Stage Regression,TSR)方法是一种将分类和回归两个任务相结合的预测方法,它可以有效地处理数据中的非线性关系。
基于SVM的TSR方法在许多领域都得到了广泛的应用,例如图像处理、生物信息学等。
其中,在产量预测中的应用也越来越受到关注。
基于SVM的TSR方法主要分为两个阶段。
首先,在第一阶段中,SVM分类
器用于将输入数据分成多个类别,例如高产、中产和低产。
然后,在第二阶段中,对于每个类别,分别使用SVM回归器对对应的数据进行回归预测。
最后,将不同
类别的预测结果进行合并,得到最终的预测结果。
在产量预测中,基于SVM的TSR方法可以对作物产量进行准确预测。
例如,
在水稻产量预测中,可以将数据分成几个类别,例如高产、中产和低产。
然后,分别使用SVM回归器对每个类别的数据进行回归预测。
最后,将不同类别的预测结
果进行合并,得到最终的水稻产量预测结果。
这种方法可以有效地提高产量预测的准确性和稳定性,有利于农业生产的规划和决策。
总之,基于SVM的TSR方法是一种有效的分类和回归相结合的预测方法,可
以在许多领域得到应用。
在产量预测中的应用,可以提高预测的准确性和稳定性,有助于农业生产的规划和决策。
使用支持向量机进行分类预测方法介绍
使用支持向量机进行分类预测方法介绍支持向量机(Support Vector Machine,SVM)是一种常用的机器学习算法,广泛应用于分类和回归问题。
它的主要思想是通过在样本空间中找到一个最优的超平面,将不同类别的样本分隔开来。
本文将介绍SVM的基本原理、核函数的应用以及参数调优等内容。
一、SVM的基本原理SVM的基本原理是通过在特征空间中找到一个超平面,将不同类别的样本分隔开来。
超平面的选择是通过最大化间隔来实现的,即找到一个能够使样本点到超平面的距离最大的超平面。
这样做的好处是可以提高分类器的泛化能力,降低过拟合的风险。
在SVM中,支持向量是指离超平面最近的样本点,它们决定了超平面的位置和方向。
SVM的目标是使支持向量到超平面的距离最大化,这个距离被称为间隔。
通过求解一个优化问题,可以得到最优的超平面参数,从而实现对新样本的分类预测。
二、核函数的应用在实际应用中,样本可能存在非线性的分布情况,此时线性的超平面无法很好地分隔不同类别的样本。
为了解决这个问题,SVM引入了核函数的概念。
核函数可以将样本从原始的特征空间映射到一个更高维度的特征空间,使得样本在这个新的空间中线性可分。
常用的核函数有线性核、多项式核和高斯核等。
通过选择合适的核函数,可以提高SVM的分类性能。
三、参数调优SVM中有一些重要的参数需要调优,以达到更好的分类效果。
其中最重要的参数是惩罚因子C和核函数的参数γ。
惩罚因子C控制了分类错误的惩罚程度,较小的C会使得分类器更加容忍错误的分类,而较大的C会使得分类器更加严格。
在实际应用中,C的取值需要根据具体问题进行调整,以平衡分类的准确性和泛化能力。
核函数的参数γ控制了核函数的宽度,较小的γ会使得决策边界更加平滑,而较大的γ会使得决策边界更加复杂。
选择合适的γ值需要根据数据集的特点进行调整,以避免过拟合或欠拟合的问题。
除了C和γ,SVM还有其他一些参数,如核函数的类型、正则化项的类型等,都需要根据具体情况进行调优。
基于GSM和SVM的区域年用水量回归预测模型研究
J u n l o h n a g Agiut rlUnv ri , 0 — 4, 22 : 3 — 4 o r a f S e y n rc l a iest 2 1 0 4 ()2 8 2 0 u y 1
基 于 GS 和 S M 的区域年用水量 回归预测模型研究 M V
徐 纬 芳 大 学 a工 学 院 ,. 息科 学技 术 学 院 , 州 7 07 ) 甘 . b信 兰 3 0 0 摘 要 : 域年 用 水 量 受 众 多 因素 影 响 , 有 非 线性 特点 , 且还 存 在 记 录 时 间短 、 史 数 据 少 等 问题 。基 于支 持 向量 机(V ) 样 本 、 区 具 而 历 S M小 非 线 性 和 泛化 能 力 强 的 特 性 , 立 了年 用 水 量 回归 预测 模 型 , 用 网 格 搜 索法 (S ) 化 参 数 , 建 利 G M优 并进 行 精 度 的 检 验 。将 模 型 应 用 于 民 勤 县 年 用 水量 预测 , 果 表 明 : 预 测 模 型 的绝 对 误 差 和 相 对误 差 较 小 , 度 较 高 , 于该 县 的年 用 水量 预测 是 行 之 有效 的 。 结 该 精 用 关键 词 : 域 年 用 水 量 ; 持 向量 机 ; 区 支 网格 搜 索 法 ; 归模 型 ; 测 回 预
s o tr r c r ig t ,ls it r a aa p o lms h re e o d n i me e s h so c l d t rb e .we u l a r g e so d l f r fr c si g n u l a e — o s me q a t y i b i e r s in mo e o o e a t a n a w tr c n u d u n i t n t b s d n h s l a l , n n i e r n g n r l ai n b l y h r ce it s f u p r e tr a e o t e ma l mp e s o l a a d e e ai t a i t c a a t r i o s p o v co ma hn , n a r s a c n z o i sc t c i e a d g d e r h i
使用支持向量机进行数据预测和模型优化的步骤
使用支持向量机进行数据预测和模型优化的步骤使用支持向量机(Support Vector Machine,SVM)进行数据预测和模型优化是一种常见的机器学习方法。
SVM是一种监督学习算法,被广泛应用于分类和回归问题。
在实际应用中,我们需要经过一系列的步骤来完成数据预测和模型优化的过程。
首先,我们需要准备数据集。
数据集是进行数据预测和模型优化的基础,包含了我们所需要的输入特征和对应的输出标签。
在准备数据集时,我们需要确保数据的质量和完整性,排除掉异常值和缺失值,并进行数据的归一化处理,以便提高模型的性能。
接下来,我们需要将数据集划分为训练集和测试集。
训练集用于训练模型,测试集用于评估模型的性能。
通常,我们会将数据集按照一定的比例划分,例如将数据集的70%作为训练集,30%作为测试集。
这样可以确保模型在训练和测试时都能够得到充分的数据支持。
在数据集准备好之后,我们需要选择适当的核函数和超参数来构建SVM模型。
核函数是SVM的核心,它可以将低维的数据映射到高维空间中,从而更好地进行分类或回归。
常用的核函数包括线性核函数、多项式核函数和高斯核函数等。
超参数则是用于调整模型性能的参数,例如正则化参数C、核函数参数gamma等。
选择适当的核函数和超参数可以提高模型的准确性和泛化能力。
在构建SVM模型之后,我们需要对模型进行训练和优化。
训练模型的过程就是通过最小化损失函数来调整模型的参数,使得模型能够更好地拟合训练数据。
常用的优化算法包括梯度下降法、牛顿法等。
通过不断迭代优化模型,我们可以得到最佳的模型参数。
完成模型训练之后,我们需要使用测试集来评估模型的性能。
评估模型的性能可以通过计算准确率、精确率、召回率、F1值等指标来完成。
这些指标可以帮助我们了解模型的分类或回归能力,从而判断模型是否满足我们的需求。
如果模型的性能不够理想,我们可以通过调整模型的参数或选择其他的核函数来进一步优化模型。
除了以上步骤,还有一些常用的技巧和方法可以用于优化SVM模型。
基于小波变换和优化的SVM的网络流量预测模型
基于小波变换和优化的SVM的网络流量预测模型周晓蕾;王万良;陈伟杰【期刊名称】《计算机应用与软件》【年(卷),期】2011(028)002【摘要】提出一种基于小波变换和优化的SVM的网络流量预测模型(WaOSVM),首先对网络流量进行无抽取小波分解得到小波系数和尺度系数,然后选取适当核函数的SVM分别进行预测,其中SVM的参数用自适应量子粒子群算法(AQPSO)进行优化,最后将各预测结果进行小波重构得到最终预测结果.实验结果表明:优化过的SVM具有较好的泛化能力,该模型适合作长期预测,预测精度明显优于单一的SVM 和小波神经网络模型.%A new network traffic prediction model based on wavelet transform and optimised support vector machine (WsOSVM) is proposed.First, the network traffic is decomposed by non-decimated wavelet transform to acquire the scaling coefficients and wavelet coefficients,and then they are sent individually to different SVM with suitable kernel function for prediction.The parameters of SVM are optimised by adaptive quantum particle swarm optimisation (AQPSO).At last the predictions are combined into the final result by wavelet reconstruction.Experimental results show that the optimised SVM has better generalization performance.The proposed model is suitable for long-term pared with the single SVM and the wavelet neural networks model,it has much better prediction precision.【总页数】4页(P34-36,59)【作者】周晓蕾;王万良;陈伟杰【作者单位】浙江工业大学信息工程学院,浙江,杭州,310023;浙江工业大学信息工程学院,浙江,杭州,310023;浙江工业大学信息工程学院,浙江,杭州,310023【正文语种】中文【相关文献】1.一种基于小波变换和PSR-LSSVM的P2P网络流量预测模型 [J], 杨袆;周亚建2.基于FCM-LSSVM网络流量预测模型 [J], 殷荣网3.改进ABC算法优化LSSVM的网络流量预测模型 [J], 许爱军4.改进布谷鸟搜索算法优化SVM的网络流量预测模型 [J], 路璐;程良伦5.基于ABC+AFS-LSSVM的网络流量预测模型 [J], 孙群;袁宏俊因版权原因,仅展示原文概要,查看原文内容请购买。
基于SVM回归方法的风速预测研究
基于SVM回归方法的风速预测研究【摘要】根据气象评价和大量的实地调查,以及风速对于风力发电的决定性作用,在简要介绍SVM回归方法的基础上,对RBF核函数的参数C和g进行参数寻优,建立预测模型,以误差百分比(APE)、平均百分比误差(MAPE)和平均绝对误差(MAE)来评价,其中平均百分比误差(MAPE)为 1.705%,平均绝对误差(MAE)为0.1705较为理性,可以为风电场风速预测提供较好的参考。
【关键词】风速预测;SVM回归;误差百分比;平均百分比误差;平均绝对误差1.引言风电场机组一直受无规律的变向、变负荷的风力作用,这会使发电机的发电量波动很大,对电网造成较大的威胁,因此对风电场风速预测的理论和实际的研究具有重要意义。
支持向量机(SVM)在国外已经应用在话者识别[1]、生物医学[2]、噪音处理[3]等方面,在国内虽然也在模式识别、机械故障诊断、电力预测方面有应用,但是在风电场风速预测上应用较少[4]。
风速受气压、温度、纬度、海拔等的影响,风速的随机性很强,本文利用SVM预测风速,百分比误差精度在5%以内,可以为风电场风速预测提供较好的参考。
2.支持向量机回归原理1963年,Vapnik提出一种非常有潜力的分类方法支持向量机(Support Vector Machine,SVM),它是一种基于统计学习理论的模式识别方法[5]。
SVM以训练误差作为优化问题的约束条件,以置信范围值最小化作为优化目标,成功的解决了小样本、非线性及高维模式识别问题,并能够推广应用到函数拟合等其他机器学习问题中。
支持向量机回归的主要思想是通过一个非线性映射Φ,将数据x映射到高位特征空间F,并在这个空间进行线性回归[6]。
本文在风速预测中采用的核函数为径向基RBF核函数(高斯核函数)。
3.SVM参数选择和优化由于选择的是RBF核函数,所以在核函数参数的选择上有惩罚项常数C和RBF的参数g。
目前参数寻优方法有网格寻优,GA寻优,PSO寻优等,其中最简单最有效的方法是网格寻优。
基于分块回归的SVM逼近方法
基于分块回归的SVM逼近方法
王勇;吕显瑞;严然;苏立明
【期刊名称】《长春工业大学学报(自然科学版)》
【年(卷),期】2008(029)006
【摘要】通过将海量的样本集合合理地分为数目比较小的几个子集,并在每个子集上分别作回归或逼近,使得训练SVM所需二次规划问题的维数大大降低.这样大大降低了训练SVM的运算量,同时提高了局部逼近和预测的能力,为SVM在回归或预测中的实时应用创造了条件.
【总页数】6页(P601-606)
【作者】王勇;吕显瑞;严然;苏立明
【作者单位】长春工业大学,基础科学学院,吉林,长春,130012;吉林大学,数学研究所,吉林,长春,130012;中国人民解放军91039部队,北京,102401;长春工业大学,基础科学学院,吉林,长春,130012
【正文语种】中文
【中图分类】O24
【相关文献】
1.基于最佳逼近点的不变性常识与SVM的融合方法 [J], 王平;王文剑
2.基于SVM分块回归分析的话务量预测模型 [J], 陈蓉;宋俊德
3.基于SVM的回归模型路口车辆计数方法 [J], 孙耀航;刘萍
4.基于回归LS-SVM的房地产估价方法 [J], 潘巍; 晋松
5.基于CSI与SVM回归的室内定位方法 [J], 党小超;汝春瑞;郝占军
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
收稿日期:2008-03-24;修回日期:2008-06-10。
作者简介:陈蓉(1982-),女,山东济宁人,硕士研究生,主要研究方向:未来无线移动通信与信息系统、计算机网络; 宋俊德(1938-),男,河北沧州人,教授,博士生导师,主要研究方向:移动通信理论、无线接入、未来通信系统(4G )与软件无线电技术。
文章编号:1001-9081(2008)09-2230-03基于S V M 分块回归分析的话务量预测模型陈 蓉1,2,宋俊德2(1.电子科技大学中山学院电子工程系,广东中山528400; 2.北京邮电大学电子工程学院,北京100876)(c h e n r o n g m i s s @g m a i l .c o m )摘 要:针对话务量的特性,提出了一种基于支持向量机分块回归分析的话务量预测模型,将话务量按日期分为工作日话务量、周末话务量进行建模,采用不同的模型预测相应的话务量。
实验结果证明了该模型的有效性,相比传统的A R M A 模型获得了更好的预测效果。
关键词:话务量分析;预测模型;支持向量机模型;A R M A 模型中图分类号:T P 393.07 文献标志码:AC o m m u n i c a t i o nt r a f f i c f o r e c a s t i n g m o d e lb a s e do n m u l t i p l e S V M r e g r e s s i o n f u nc t i o n sC H E NR o n g 1,2,S O N GJ u n -d e2(1.D e p a r t m e n t o f E l e c t r o n i c E n g i n e e r i n g ,U n i v e r s i t yo f E l e c t r o n i c S c i e n c e a n dT e c h n o l o g y o f C h i n aZ h o n g s h a nI n s t i t u t e ,Z h o n g s h a nG u a n g d o n g ,528400,C h i n a ;2.S c h o o l o f E l e c t r o n i c E n g i n e e r i n g ,B e i j i n gU n i v e r s i t yo f P o s t s a n d T e l e c o m m u n i c a t i o n s ,B e i j i n g 100876,C h i n a )A b s t r a c t :A c c o r d i n g t o t h e c h a r a c t e r i s t i c s o f c o m m u n i c a t i o n t r a f f i c ,a t r a f f i c f o r e c a s t i n g m o d e l b a s e d o n m u l t i p l e S u p p o r t V e c t o r M a c h i n e s (S V M )r e g r e s s i o n f u n c t i o n s w a s p r o p o s e d .I nt h i s m o d e l ,t h e t r a f f i c d a t a w i l l b e d i v i d e di n t o t w o g r o u p s b yt h ed a t e ,w h i c h a r e t h e w o r k i n g -d a y t r a f f i c d a t a a n d t h e w e e k e n d t r a f f i c d a t a .T h e n t w o d i f f e r e n t S V Mm o d e l s a r e t r a i n e d u s i n g t h o s e d a t a .T h ee x p e r i m e n t a l r e s u l t ss h o w t h a t t h i sm o d e l i sv e r ye f f e c t i v e .M o r e o v e r ,t h ep e r f o r m a n c eo f t h i sm o d e l o u t p e r f o r m s t h a t o f t r a d i t i o n a l A R M Am o d e l .K e yw o r d s :c o m m u n i c a t i o n t r a f f i c a n a l y s i s ;f o r e c a s t i n gm o d e l ;S u p p o r t V e c t o r M a c h i n e s (S V M )m o d e l ;A R M Am o d e l0 引言随着通信网应用和规模的不断增加,网络管理变得越来越重要,新一代的网管系统对业务量的预测也提出了新的需求,通信话务量的预测分析已经成为其中非常重要的一部分,准确的话务量预测对网络管理、规划和设计具有重要意义。
话务量预测,是指通过分析通信网话务量的历史数据统计规律或相关因素,对未来网络可能出现的话务量进行估计和预期。
预测结果的准确与否直接关系到企业未来的发展,因此对话务量需求的预测日益受到移动运营商的关注[1-4]。
大部分移动公司目前采用的预测技术,仅限于简单函数的拟合预测,如惯性预测[5-6]、K a l m a n 滤波[7]等,这些模型相对简单,难于满足现阶段话务量的复杂变化方式。
话务量作为一种典型的时间序列,常用的时间序列分析预测方法———A R M A 模型[8]被应用于话务量预测,并能较好地描述话务量序列,但是其前提是话务量序列是平稳的,且很难针对话务特点进行分块描述不同变化的话务量。
话务量是一种动态的、随机的时间序列,随着每天的不同时间段而变化,而且易受节假日、旅游等其他因素的影响,工作日话务量大而使其话务量高于周末,白天流量又明显高于夜间。
随着话务量的变化方式趋于复杂,而话务量预测工具缺乏和准确率不高,因此对话务量预测模型进行研究和引入新的预测模型,将具有重大意义。
鉴于以上模型的不足,本文针对话务量自身特点,即周末话务量与工作日话务量具有不同特性,提出了一种基于支持向量机(S u p p o r tV e c t o rM a c h i n e s ,S V M )[9-10]分块回归分析的预测模型,将话务量按日期分为工作日话务量、周末话务量进行建模,然后采用不同的模型预测相应的话务量,获得了更好的预测效果。
1 预测模型设计1.1 预测模型框架图本文设计了一个基于S V M 分块回归分析的话务量预测模型,该模型包括两个阶段:训练阶段和预测阶段,其结构如图1所示。
训练阶段过程如下:首先读入数据,对数据进行预处理,然后根据日期将训练数据分为工作日话务量数据和周末话务量数据,分别用于训练两个不同的S V M 模型———即工作日模型和周末模型,保存训练好的模型用于预测阶段使用。
在预测阶段,导入训练好的模型,根据测试数据的日期(属于工作日或者周末)对数据分类,将预处理后的数据分别输入到相应的预测模型(即工作日话务量模型和周末话务量模型),然后进行预测得到预测结果,最后将预测结果整合到一起,输出预测数据。
1.2 预处理读入数据之后,先通过预处理对原始数据进行归一化处理,归一化过程如下:P i =(X i -X)/σ(1)其中X i 为原始数据,X 为数据均值,σ为数据方差,原始数据经过预处理后变换为均值为零的数据P i,在预测阶段可根据第28卷第9期2008年9月计算机应用C o m p u t e r A p p l i c a t i o n sV o l .28N o .9S e p .2008样本均值和方差还原输出预测值。
图1 基于S V M 分块回归分析的话务量预测模型框图1.3 S V M 回归分析S V M [9,11-12]由于在模式识别[13]等人工智能领域的成功应用而受到广泛关注。
其基本思想是:基于M e r c e r 核展开定理[12],可以通过非线性映射,把样本空间映射到一个高维乃至于无穷维的特征空间,使在特征空间中可以应用线性学习机的方法解决样本空间中的高度非线性分类和回归等问题。
要用S V M 来解决回归问题,首先考虑用线性回归函数拟合数据的问题。
给定训练样本集(x i ,y i ),i =1,2,…,n ,x ∈R d ,y 为期望输出y ∈R ,其中n 为样本数,d 为样本的空间维数,通过训练学习寻找一个反映样本数据的最优线性回归函数f (x )=w Tx +b ,所得函数对样本数据集拟合得“最好”,也就是累计误差最小。
根据S V M 的理论求解最优的回归函数转化为一个求解二次优化问题,需要优化的目标函数为:m i n12w T w+C (∑ni =1(ξi +ξ*i ))(2)约束条件为:y i -w ·x i -b ≤ε+ξi w ·x i +b-y i ≤ε+ξ*i(3)其中ε为精度误差,i =1,2,…,n ,两个非负的松弛因子ξi≥0和ξ*i ≥0,常数C>0控制对超出误差ε的惩罚程度。
利用优化方法将上述问题转化求解为:a ,a * =a r g m i na ,a*12∑n i =1∑nj =1(αi -α*i )(αj -α*j )〈x i ,x j〉-∑ni =1y i(αi-α*i)+ε∑ni =1(αi+α*i)(4)约束条件为:∑ni =1(αi-α*i)=00≤αi ,α*i ≤C ; i =1,2,…,n (5)相应的回归函数为:f (x )=w Tx+b=∑ni =1(αi-α*i)〈x i·x 〉+b *(6)这里α和α*i 将只有小部分不为零,它们对应的样本就是支持向量,一般是在函数变化比较剧烈的位置上的样本。
要实现非线性回归函数的拟合,只要用核函数K (x i ,x j )=〈φ(x i ),φ(x j )〉替代上面式(4)、(6)中的〈x i ,x j 〉即可。
支持向量机中常用的核函数有多项式核函数、径向基(R a d i a l B a s i s F u n c t i o n ,R B F )核函数、多层感知器核函数等,选用不同的核函数可以构造不同的支持向量机,详请见[9-10,12]。