基于LS-SVM的概率集成学习锂离子电池剩余寿命预测方法[发明专利]

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(10)申请公布号 (43)申请公布日 2014.11.19
C N 104156791
A (21)申请号 201410437025.8
(22)申请日 2014.08.29
G06Q 10/04(2012.01)
G06K 9/66(2006.01)
(71)申请人哈尔滨工业大学
地址150001 黑龙江省哈尔滨市南岗区西大
直街92号
(72)发明人刘大同 王少军 卢斯远 彭宇
彭喜元
(74)专利代理机构哈尔滨市松花江专利商标事
务所 23109
代理人
杨立超
(54)发明名称
基于LS-SVM 的概率集成学习锂离子电池剩
余寿命预测方法
(57)摘要
基于LS-SVM 的概率集成学习锂离子电池剩
余寿命预测方法,涉及一种电池剩余寿命预测方
法。

本发明为了解决传统的预测模型的预测精
度有限的问题和稳定性不好的问题。

本发明构建
LS-SVM 预测模型,构造输入向量并选择合适的输
入向量维数及超参数范围,在一定范围内随机选
择多组参数构成多个LS-SVM 集成学习模型的子
模型,并将子模型结果进行集成输出,极大程度上
减小了精确确定参数的难度,并大幅度提高了预
测准确性及稳定程度。

本发明适用于电池剩余寿
命预测。

(51)Int.Cl.
权利要求书3页 说明书11页 附图3页
(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书3页 说明书11页 附图3页(10)申请公布号CN 104156791 A
1.基于LS-SVM的概率集成学习锂离子电池剩余寿命预测方法,其特征在于它包括下
述步骤:
步骤一:获得电池容量数据,并对提取的数据进行预处理:
获得锂离子电池充放电循环实验中的电池容量数据,根据数组的类型,提取电池放电过程中的容量数据集;剔除错误的数据,得到锂离子电池容量数据F;选取数据个数占电池容量数据F的ρ%时作为预测起始点后,将起始点之前的数据划分为总训练集,起始点之后的数据划分为总测试集;
步骤二:构造输入向量,根据预测模型确定模型超参数范围,包括以下步骤:
步骤2.1:构造输入向量:
锂离子电池容量数据F是一组一维的原始数据,将总训练集中每N+1个连续的数据构造成一个维数为N+1的训练向量,L1个连续的输入数据构成L1-N个N+1维的训练向量,构成原始训练向量集J
,并设向量个数l等于L1-N;每个训练向量的前N个数构成输入向量,形成一个维数为N的输入向量x,L1-N个输入向量x构成输入向量集X;每个训练向量的最后一个数所在的时刻作为预测时间点,此数据作为该预测时间点的真实输出数值,即预测
真值y,L1-N个预测真值y构成预测真值矩阵Y;假设N的值为N

步骤2.2:设定模型超参数:
LS-SVM模型用公式表达;其中,q为一个已知向量,f(q)为已知
向量q经过LS-SVM模型计算得到的预测值,r
d
为已知输入向量,c为已知输入向量的个数,
c个r
d 构成已知输入向量集R;α
d
为矩阵形式的Lagrange乘子α中的一个元素,b为偏
移值,α和b的公式如下:
其中,维数为c,γ为正则化参数,Ω为核矩阵,Ω的第u 行、第v列的元素为:
Ω
u,v =K(r
u
,r
v
),u,v=1,……,c (2)
其中,r
u ,r
v
表示R中的某个元素,核函数K为:
K(r
u ,r
v
)=exp(-||r
u
-r
v
||2/σ2) (3)
其中,σ为核参数;
将输入向量x作为已知向量q,输入向量集X作为已知输入向量集R,即已知输入向量r的个数c等于输入向量x向量个数l;选取耦合模拟退火算法,在[exp(-10),exp(10)]的范围内搜寻参数寻优的初值;搜寻得到的参数初值后,使用基于遍历寻优的网格搜索方法,通过在γ和σ构成的二维平面上进行网格划分,在每一个网格交点上,测试该点所训练的LS-SVM模型的预测误差E,并选择E最小的点所对应的超参数值γ和σ,作为此次寻优过程中的最优参数;
步骤2.3:求取模型系数:
完成步骤2.1、步骤2.2后,即构建了所用的已知输入向量r和已知向量q并且得到了确定的模型超参数,利用两个输入向量计算出如式(3)所示的一个核函数,将每个核函数都作为核矩阵的一个元素,按照式(2)构建核矩阵Ω;进一步按照公式(1)求出Lagrange 乘子α和偏移值b;
步骤2.4:不断更新已知输入向量集R和已知向量q,进行单步预测:
步骤(I):首先将原始训练向量集J
中的最后一个向量的后N个数据作为已知向量q,已知输入向量集R与步骤2.3中相同;
步骤(II):向公式所示的LS-SVM模型中输入已知向量q,并将α和b代入,即可得到一点预测值f(q),实现单步预测;利用此点已知向量q的后N-1个数和此点单步预测值构造下一点输入的已知向量,并将此点的已知向量q加入到当前已知输入向量集R中,即R中元素的个数加1,作为下一点的已知输入向量集R;
步骤2.5:重复步骤2.4(II)完成多步预测,得到容量数据预测值,绘制容量数据预测值曲线;
步骤2.6:选择输入向量维数及超参数范围:
重复三次执行步骤2.2—步骤2.5,若得到的容量数据预测值曲线皆不呈下降趋势或
在一定范围内与已知的失效阈值线无交点,则此刻的维数N
0不满足条件,将N
加上或者减
去10后重新记为N
,返回步骤2.1直至满足上述要求,即至少有一条容量数据预测值曲线呈下降趋势或者在一定范围内与已知的失效阈值线有交点;
将一条曲线呈下降趋势且在一定范围内与已知的失效阈值线有交点的情况记为条件
一;若至少一条曲线满足条件一,将N
0加上或减去1~5后重新记为N
,找到容量数据预
测值曲线存在加速下降情况且发生条件一概率最大的N
值作为最优输入向量维数;确定输
入向量维数N后,执行步骤2.2—步骤2.5,选择满足条件一的超参数为可用超参数;重复p 次,p∈[10,100],执行步骤2.2—步骤2.5,得到i组超参数范围作为LS-SVM集成学习模型的超参数选择范围;
步骤三:LS-SVM集成学习模型构建及预测,包括以下步骤:
步骤3.1:构建LS-SVM集成学习模型:
在每组超参数范围内随机选择j组参数,j∈[1,13],在i组参数范围内共选择i*j 组参数,分别按照步骤二中的步骤2.3—步骤2.5进行i*j个LS-SVM模型的构建,将每个LS-SVM模型被称为LS-SVM集成学习模型的子模型,所有的LS-SVM集成学习模型的子模型共同组成LS-SVM集成学习模型,并得到i*j个LS-SVM集成学习模型的子模型的趋势预测
结果f
k
,k=1,2,…,i*j;
步骤3.2:LS-SVM集成学习模型的预测输出:
将i*j个LS-SVM集成学习模型的子模型的输出结果进行如式(4)的平均处理即可得到预测结果;根据趋势退化的预测结果,绘制出退化曲线并根据已知失效阈值计算RUL预测值;
步骤四:根据RUL
p
的区间估计,输出预测结果:
LS-SVM 集成学习模型得到的容量数据预测值曲线与失效阈值线的交点记为EOP ,其对应时刻记为t EOP ;预测起始点记为SOP ,其对应时刻记为t SOP ;RUL 为锂离子电池的预测剩余寿命,则锂离子电池的预测剩余寿命RUL p 表示为:
RUL p =t EOP -t SOP (5)
重复步骤二、三,得到多组集成学习RUL p 预测结果后,检测预测结果是否满足正态分布的形式:
其中,RUL array 为RUL p 的数值构成的一个数据组,μ为数据组RUL array 的平均值,δ为数据组RUL array 的方差;
检验多个RUL 值满足正态分布后,利用极大似然原理计算正态分布公式中包含的参数μ、δ,并根据μ、δ的数值绘制出RUL p 的概率密度曲线,并计算RUL p 的概率置信区间,将得到的RUL p 的概率密度曲线和置信区间作为概率分布信息和区间估计的最终预测输出结果。

2.根据权利要求1所述的基于LS-SVM 的概率集成学习锂离子电池剩余寿命预测方法,其特征在于,步骤一中的ρ%在60%-70%选取。

3.根据权利要求1或2所述的基于LS-SVM 的概率集成学习锂离子电池剩余寿命预测方法,其特征在于,步骤2.2中最优参数的寻优过程是按照以下步骤实现的:
将原始训练向量集J 0进行k 折交叉验证k <l ,对模型的误差进行估计和分析,其步骤下:
步骤(a):将原始训练向量集J 0中的l 个向量等间隔k 取出l/k 个向量组成向量组t z ,z ∈[1,k],若l/k 不是整数,则取l/k 结果的整数部分;将t 1作为测试集,除t 1以外的t z 作为训练集;
步骤(b):用训练集训练每个网格交点的超参数所构建的LS-SVM 模型,利用测试集来验证LS-SVM 模型的准确性,计算容量相对误差平均值E:
其中,e z 为每个LS-SVM 模型的容量相对误差,z =1,...,k ;这样就完成了一次交叉检验;
步骤(c):依次选取t 2—t z 作为测试集,
除选取的测试集以外的t z 作为训练集,重复步骤(b);
步骤(d):取步骤(b)、步骤(c)中获得最小E 值时的超参数作为此次寻优过程中的最优超参数。

4.根据权利要求1或2所述的基于LS-SVM 的概率集成学习锂离子电池剩余寿命预测
方法,其特征在于,步骤四中计算RUL p 的概率置信区间是分别在68%、
95%、99%概率下的置信区间。

基于LS-SVM的概率集成学习锂离子电池剩余寿命预测方

技术领域
[0001] 本发明涉及一种电池剩余寿命预测方法。

背景技术
[0002] 目前,我国极大部分长寿命卫星(8~15年)电源是由太阳电池阵-蓄电池组组成的联合电源,在卫星光照期,太阳能电池将光能直接转换为电能,向卫星供电并给蓄电池组充电;在阴影期,蓄电池向卫星供电。

蓄电池主要由镍镉蓄电池或氢镍蓄电池组成。

为满足各种高效益应用卫星对电源系统的需求,空间电源逐步向大功率、长寿命、轻质量、小体积和低成本方向发展。

锂离子电池和传统镍镉或氢镍蓄电池相比,具有工作电压高、体积小,重量轻,比能量高、寿命长和自放电率小等优点,成为可以替代传统电池的第三代卫星用储能电源。

如果航天器中的储能电源采用锂离子蓄电池,那么将使得储能电源在电源分系统所占重量从30%~40%降低至10%~15%,降低了航天器的发射成本,提高了有效载荷。

[0003] 由于蓄电池组是卫星在阴影期的唯一能源,而蓄电池组的性能退化至无法满足卫星的正常供电需求或者蓄电池组失效,卫星将无法正常工作。

而锂离子电池由于自身存在充放电管理、性能衰退等问题,因此在锂离子电池使用过程中必须充分考虑存储、使用和维护的可靠性和安全性。

调查显示,电源系统故障是导致航天器任务失败的主要原因。

例如,1999年美国的太空试验AFRL由于电池内部阻抗异常导致试验的失败,2006年美国Mars Global Surveyor飞行器失效是由于电池系统直面太阳照射导致过热造成安全系统失效所引发的任务失败。

对于航空航天应用而言,锂离子电池的可靠工作显得尤为重要。

因此,针对锂离子电池的剩余寿命(Remaining Useful Life,RUL)估计,开展研究工作具有重大的意义。

[0004] LS-SVM模型中的参数选择会对预测结果造成重大影响,如利用传统的十倍交叉验证的方法确定优化参数,多次训练确定的参数相差极大,导致模型的预测结果差异性很大,甚至有预测曲线与真实情况及其不相符的情况发生。

发明内容
[0005] 本发明为了解决传统的预测模型的预测精度有限的问题和稳定性不好的问题,进而提出了基于LS-SVM的概率集成学习锂离子电池剩余寿命预测方法。

[0006] 基于LS-SVM的概率集成学习锂离子电池剩余寿命预测方法的实现过程为:[0007] 步骤一:获得电池容量数据,并对提取的数据进行预处理:
[0008] 获得锂离子电池充放电循环实验中的电池容量数据,根据数组的类型,提取电池放电过程中的容量数据集;为了防止错误的数据造成的滤波发散及参数估计不准确,剔除离群点数据,即剔除错误的数据,得到锂离子电池容量数据F;选取数据个数占电池容量数据F的ρ%时作为预测起始点后,将起始点之前的数据划分为总训练集,起始点之后的数据划分为总测试集;
[0009] 步骤二:构造输入向量,根据预测模型确定模型超参数范围,包括以下步骤:
[0010] 步骤2.1:构造输入向量:
[0011] 锂离子电池容量数据F是一组一维的原始数据,将总训练集中每N+1个连续的数据构造成一个维数为N+1的训练向量,L1个连续的输入数据构成L1-N个N+1维的训练向量,构成原始训练向量集J
,并设向量个数l等于L1-N;每个训练向量的前N个数构成输入向量,形成一个维数为N的输入向量x,L1-N个输入向量x构成输入向量集X;每个训练向量的最后一个数所在的时刻作为预测时间点,此数据作为该预测时间点的真实输出数值,
即预测真值y,L1-N个预测真值y构成预测真值矩阵Y;假设N的值为N

[0012] 步骤2.2:设定模型超参数:
[0013] LS-SVM模型用公式表达;其中,q为一个已知向量,f(q)为
已知向量q经过LS-SVM模型计算得到的预测值,r
d
为已知输入向量,c为已知输入向量的
个数,c个r
d 构成已知输入向量集R;α
d
为矩阵形式的Lagrange乘子α中的一个元素,b
为偏移值,α和b的公式如下:
[0014]
[0015] 其中,维数为c,γ为正则化参数,Ω为核矩阵,Ω的第u行、第v列的元素为:
[0016] Ωu,v=K(r u,r v),u,v=1,……,c (2)
[0017] 其中,r u,r v表示R中的某个元素,核函数K为:
[0018] K(r u,r v)=exp(-||r u-r v||2/σ2) (3)
[0019] 其中,σ为核参数;
[0020] 根据以上分析可知,LS-SVM的模型性质仅由两个参数决定,即LS-SVM模型的两个超参数为正则化参数γ以及核参数σ,建立LS-SVM模型的过程即为确定两个参数的过程;将输入向量x作为已知向量q,输入向量集X作为已知输入向量集R,即已知输入向量r的个数c等于输入向量x向量个数l;选取耦合模拟退火算法,即Coupled Simulated Annealing 简写CSA,在[exp(-10),exp(10)]的范围内搜寻参数寻优的初值;搜寻得到的参数初值后,使用基于遍历寻优的网格搜索方法,通过在γ和σ构成的二维平面上进行网格划分,在每一个网格交点上,测试该点所训练的LS-SVM模型的预测误差E,并选择E最小的点所对应的超参数值γ和σ,作为此次寻优过程中的最优参数;
[0021] 步骤2.3:求取模型系数:
[0022] 完成步骤2.1、步骤2.2后,即构建了所用的已知输入向量r和已知向量q并且得到了确定的模型超参数,利用两个输入向量计算出如式(3)所示的一个核函数,将每个核函数都作为核矩阵的一个元素,按照式(2)构建核矩阵Ω;进一步按照公式(1)求出Lagrange乘子α和偏移值b;
[0023] 步骤2.4:不断更新已知输入向量集R和已知向量q,进行单步预测:
[0024] 步骤(I):首先将原始训练向量集J0中的最后一个向量的后N个数据作为已知向量q,已知输入向量集R与步骤2.3中相同;
[0025] 步骤(II):向公式所示的LS-SVM模型中输入已知向量q,
并将α和b代入,即可得到一点预测值f(q),实现单步预测;利用此点已知向量q的后N-1个数和此点单步预测值构造下一点输入的已知向量,并将此点的已知向量q加入到当前已知输入向量集R中,即R中元素的个数加1,作为下一点的已知输入向量集R;
[0026] 步骤2.5:重复步骤2.4(II)完成多步预测,得到容量数据预测值,绘制容量数据预测值曲线;
[0027] 步骤2.6:选择输入向量维数及超参数范围:
[0028] 重复三次执行步骤2.2—步骤2.5,若得到的容量数据预测值曲线皆不呈下降趋
势或在一定范围内与已知的失效阈值线无交点,则此刻的维数N
0不满足条件,将N
加上或
者减去10后重新记为N
,返回步骤2.1直至满足上述要求,即至少有一条容量数据预测值曲线呈下降趋势或者在一定范围内与已知的失效阈值线有交点;
[0029] 将一条曲线呈下降趋势且在一定范围内与已知的失效阈值线有交点的情况记为
条件一;若至少一条曲线满足条件一,将N
0加上或减去1~5后重新记为N
,找到容量数据
预测值曲线存在加速下降情况且发生条件一概率最大的N
值作为最优输入向量维数;确定
输入向量维数N后,执行步骤2.2—步骤2.5,选择满足条件一的超参数为可用超参数;重复p次,p∈[10,100],执行步骤2.2—步骤2.5,得到i组超参数范围作为LS-SVM集成学习模型的超参数选择范围;
[0030] 步骤三:LS-SVM集成学习模型构建及预测,包括以下步骤:
[0031] 步骤3.1:构建LS-SVM集成学习模型:
[0032] 在每组超参数范围内随机选择j组参数,j∈[1,13],在i组参数范围内共选择i*j组参数,分别按照步骤二中的步骤2.3—步骤2.5进行i*j个LS-SVM模型的构建,将每个LS-SVM模型被称为LS-SVM集成学习模型的子模型,所有的LS-SVM集成学习模型的子模型共同组成LS-SVM集成学习模型,并得到i*j个LS-SVM集成学习模型的子模型的趋势预
测结果f
k
,k=1,2,…,i*j;
[0033] 步骤3.2:LS-SVM集成学习模型的预测输出:
[0034] 将i*j个LS-SVM集成学习模型的子模型的输出结果进行如式(4)的平均处理即可得到预测结果;根据趋势退化的预测结果,绘制出退化曲线并根据已知失效阈值计算RUL预测值;
[0035]
[0036] 步骤四:根据RUL p的区间估计,输出预测结果:
[0037] LS-SVM集成学习模型得到的容量数据预测值曲线与失效阈值线的交点记为EOP,
其对应时刻记为t
EOP ;预测起始点记为SOP,其对应时刻记为t
SOP
;RUL为锂离子电池的预测
剩余寿命,则锂离子电池的预测剩余寿命RUL
p
表示为:
[0038] RUL p=t EOP-t SOP (5)
[0039] 为了提供集成学习结果的不确定性信息而进行不确定性管理,重复步骤二、三,得
到多组集成学习RULp预测结果后,检测预测结果是否满足正态分布的形式:
[0040]
[0041] 其中,RULarray为RULp的数值构成的一个数据组,μ为数据组RULarray的平均值,δ为数据组RULarray的方差;
[0042] 检验多个RUL值满足正态分布后,利用极大似然原理计算正态分布公式中包含的参数μ、δ,并根据μ、δ的数值绘制出RULp的概率密度曲线,并计算RULp的概率置信区间,将得到的RULp的概率密度曲线和置信区间作为概率分布信息和区间估计的最终预测输出结果。

[0043] 步骤五:RUL预测算法评价:
[0044] 利用公式(8)至(11)对预测结果进行精度评价,分析趋势预测以及RUL预测结果偏离实际值的情况,进而对预测算法精度进行评价。

[0045] 利用总测试集数据绘制成容量数据真实值曲线,将容量数据真实值曲线与失效阈
值线的交点记为EOL,其对应时刻记为t
EOL 。

预测起始点记为SOP,其对应时刻记为t
SOP。


锂离子电池的真实剩余寿命RUL
l
表示为:
[0046] RUL l=t EOL-t SOP (7)
[0047] 容量预测平均绝对误差:
[0048]
[0049] 容量预测均方根误差:
[0050]
[0051] 寿命预测绝对误差:
[0052] error=RUL p-RUL l (10)
[0053] 寿命预测相对误差:
[0054] RUL_err=(RUL p-RUL l)/RUL l (11)
[0055] 式中,S总测试集中的数据个数。

Y_real(h)为h时刻的真实容量值,即总测试集
中的数据。

f
F
(h)为h时刻的预测容量值,即LS-SVM集成学习模型的预测容量结果中的数据。

[0056] 为了说明算法的稳定程度,利用RUL array的标准差σ来进行量化比较,σ数值越
小,预测得到的RUL
p
变化范围越小,说明算法越稳定。

[0057] 步骤一中的ρ%可以在60%-70%选取。

[0058] 步骤2.2中最优参数的寻优过程是按照以下步骤实现的:
[0059] 将原始训练向量集J0进行k折交叉验证k<l,对模型的误差进行估计和分析,其步骤下:
[0060] 步骤(a):将原始训练向量集J0中的l个向量等间隔k取出l/k个向量组成向量
组t
z ,z∈[1,k],若l/k不是整数,则取l/k结果的整数部分;将t
1
作为测试集,除t
1
以外
的t
z
作为训练集;
[0061] 步骤(b):用训练集训练每个网格交点的超参数所构建的LS-SVM模型,利用测试集来验证LS-SVM模型的准确性,计算容量相对误差平均值E:
[0062]
[0063] 其中,e z为每个LS-SVM模型的容量相对误差,z=1,...,k;
[0064] 这样就完成了一次交叉检验;
[0065] 步骤(c):依次选取t2—t z作为测试集,除选取的测试集以外的t z作为训练集,重复步骤(b);
[0066] 步骤(d):取步骤(b)、步骤(c)中获得最小E值时的超参数作为此次寻优过程中的最优超参数。

[0067] 步骤四中计算RUL p的概率置信区间是分别在68%、95%、99%概率下的置信区间。

[0068] 本发明构建LS-SVM预测模型,并选择合适的输入向量维数及超参数范围,在一定范围内随机选择多组参数构成多个LS-SVM集成学习模型的子模型,并将子模型结果进行集成输出,极大程度上减小了精确确定参数的难度,并大幅度提高了预测准确性及稳定程度。

本方法.和传统交叉验证法寻参建模的方法相比,集成学习算法的预测精度有了明显提高,由原来甚至经常出现不能计算出RUL预测结果的情况,提升到锂离子电池的RUL预测精度可以控制在3%的范围内;集成学习模型的预测稳定性有了明显的提升,对于锂离子电池的RUL预测结果稳定在7个放电循环以内。

附图说明
[0069] 图1基于LS-SVM的概率集成学习模型预测框架;
[0070] 图2验证实验中使用电池的容量曲线;
[0071] 图3CS2-36号电池经过一次集成学习训练后的预测曲线;
[0072] 图4CS2-37号电池集成学习训练后的概率分布密度曲线。

具体实施方式
[0073] 具体实施方式一:结合图1说明本实施方式,基于LS-SVM的概率集成学习锂离子电池剩余寿命预测方法,包括下述步骤:
[0074] 步骤一:获得电池容量数据,并对提取的数据进行预处理:
[0075] 获得锂离子电池充放电循环实验中的电池容量数据,根据数组的类型,提取电池放电过程中的容量数据集;为了防止错误的数据造成的滤波发散及参数估计不准确,剔除离群点数据,即剔除错误的数据,得到锂离子电池容量数据F;选取数据个数占电池容量数据F的ρ%时作为预测起始点后,将起始点之前的数据划分为总训练集,起始点之后的数据划分为总测试集;
[0076] 步骤二:构造输入向量,根据预测模型确定模型超参数范围,包括以下步骤:[0077] 步骤2.1:构造输入向量:
[0078] 锂离子电池容量数据F是一组一维的原始数据,将总训练集中每N+1个连续的数据构造成一个维数为N+1的训练向量,L1个连续的输入数据构成L1-N个N+1维的训练向
量,构成原始训练向量集J
,并设向量个数l等于L1-N;每个训练向量的前N个数构成输入向量,形成一个维数为N的输入向量x,L1-N个输入向量x构成输入向量集X;每个训练向量的最后一个数所在的时刻作为预测时间点,此数据作为该预测时间点的真实输出数值,
即预测真值y,L1-N个预测真值y构成预测真值矩阵Y;假设N的值为N

[0079] 步骤2.2:设定模型超参数:
[0080] LS-SVM模型用公式表达;其中,q为一个已知向量,f(q)为
已知向量q经过LS-SVM模型计算得到的预测值,r
d
为已知输入向量,c为已知输入向量的
个数,c个r
d 构成已知输入向量集R;α
d
为矩阵形式的Lagrange乘子α中的一个元素,b
为偏移值,α和b的公式如下:
[0081]
[0082] 其中,维数为c,γ为正则化参数,Ω为核矩阵,Ω的第u行、第v列的元素为:
[0083] Ωu,v=K(r u,r v),u,v=1,……,c (2)
[0084] 其中,r u,r v表示R中的某个元素,核函数K为:
[0085] K(r u,r v)=exp(-||r u-r v||2/σ2) (3)
[0086] 其中,σ为核参数;
[0087] 根据以上分析可知,LS-SVM的模型性质仅由两个参数决定,即LS-SVM模型的两个超参数为正则化参数γ以及核参数σ,建立LS-SVM模型的过程即为确定两个参数的过程;将输入向量x作为已知向量q,输入向量集X作为已知输入向量集R,即已知输入向量r的个数c等于输入向量x向量个数l;选取耦合模拟退火算法,即Coupled Simulated Annealing 简写CSA,在[exp(-10),exp(10)]的范围内搜寻参数寻优的初值;搜寻得到的参数初值后,使用基于遍历寻优的网格搜索方法,通过在γ和σ构成的二维平面上进行网格划分,在每一个网格交点上,测试该点所训练的LS-SVM模型的预测误差E,并选择E最小的点所对应的超参数值γ和σ,作为此次寻优过程中的最优参数;
[0088] 步骤2.3:求取模型系数:
[0089] 完成步骤2.1、步骤2.2后,即构建了所用的已知输入向量r和已知向量q并且得到了确定的模型超参数,利用两个输入向量计算出如式(3)所示的一个核函数,将每个核函数都作为核矩阵的一个元素,按照式(2)构建核矩阵Ω;进一步按照公式(1)求出Lagrange乘子α和偏移值b;
[0090] 步骤2.4:不断更新已知输入向量集R和已知向量q,进行单步预测:
[0091] 步骤(I):首先将原始训练向量集J0中的最后一个向量的后N个数据作为已知向量q,已知输入向量集R与步骤2.3中相同;。

相关文档
最新文档