基于支持向量机的人口增长预测模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

于是 , 线性回归问题就化为下面的优化问题 :
2 m in 1 +w ( x i ) + 2
s . . t | a w (x i ) + b - y i | [ E , i = 1, ,, l
T
( 1. 2 ) 另外 , 考虑到可能存 在一定误差 , 因此引入两 个松 弛变量 F , ,, l, 以加速优化问题 ( 1 . 2) 的 i, F i , i= 1
t iv e tool w ith better genera lizat ion ab ility , and it effective ly so lu te the few er sam ples , non lin ear , h ig h di m ension and local m ini ma . T his paper predict popu la tio n grow th by support vector m ach in e . The si m u lation results show that it has h igher accuracy o f pred iction . [ K ey words] popu lation grow th suppo rt vector m ach in e structure risk m in i m iza tio n forecast confidence
*
其中核函数为 Gaussian 径向基函数 , 即 K ( x, y ) = e
+ x - y+ 2 2R 2

2 仿真实验
2 . 1 实验数据
表 1 1997- 2006 年我国各年度人口总量数据
年份 1997 1998 1999 2000 2001 人口总量 ( 亿 ) 12. 362 7 12. 476 1 12. 786 12. 674 3 12. 205 59 年份 2002 2003 2004 2005 2006 人口总量 ( 亿 ) 12 . 589 51 12 . 604 98 12 . 530 65 13. 075 5 13. 144 8
[ Ab stract]
H ow th e applicat io n o f fair va lu e in fluence the listed com pan ie s is anlyzed and the relat ionsh ip be -
tw een 2007 average stock return and fa ir va lu e ad ju stm ent is researched. T he result is consistent w ith assum ptio n , w hich is the average stock return is posit iv e re lated w ith EPS , changes of EPS and fair value ad ju stm ent per share . Further , som e sub - sam ples are researched , such as com pan ies ho ld ing in vestm ent rea l estate ; com panies ho ldin g he ld - to -m aturity f in anc ial asset and com panies ho ldin g trading financ ia l asse. t [ Key word s] new accounting princ ip le fair value fin ancial asset
2008 年 7月 22 日收到 作者简介 : 陈 涛 ( 1979) ) 男 , 硕士 , 讲师. 研究方向 : 支持 向量机和
y i - f (x i ) [ F , i = 1, ,, l i + E F , i= 1 , ,, l i, F i \ 0
*
( 1. 3 )
其对偶问题是 1 * * m ax ( Ai - Ai ) ( A j - A j ) ( U( x i ) # U( x j ) ) + 2 iE = 1
f (x) =
i= 1
E
( Ai - Ai ) ( U(x i ) # U(x j ) ) + b (1 . 5)
*
2000 2001 2002 2003 2004 2005
12 . 692 4 12 . 205 3 12 . 589 4 12 . 609 2 12 . 536 1 13 . 079 2
基于支持向量机的人口增长预测模型
陈 涛
( 陕西理工学院数学系, 汉中 , 723000 )


支持向量机 是基于结构风险最小化原理的一种学习技术 , 是一种 具有很好泛化 能力的预 测工具 , 它有效地解 决小样
本、 非线性 、 高维数 、 局部极小等问题 。 利用支持向量机 对我国 未来人 口数量 进行预测 。 仿真试 验表明 预测结 果有较 高的预 测精度 。 关键词 支持向量机 结构风险最小化 预测信任度 A 人口增长 中图法分类号 文献标 志码
6171
01 时 , 预测信任度却迅速下降至 35 % , 这说明该模 型不适宜预测较长时间 内我国人口总 量变化。而 且支持向量回归机预测模型要通过实验 , 调整并获 得最好的参数, 以达到预测的良好效果。

1 闫
3 王 晶 . 面 向多 输入 输出 系统 的支 持向 量机 回归 . 清 华大 学学 报 . 2007 . s2 : 67) 69 4 曲文龙 , 樊广佺 , 杨 炳儒 . 基 于支持向 量机的复 杂时间序 列预测 研究. 计算机工程 . 2005. 23 : 45) 48 5 WA NG X iao-hua, W ANG X iao -guang. I m proved A pproach B ased on SVM for Licen se Plate C haracter R ecogn it ion. Jou rnal of Beijing Insti
高维特征空间上的内积运算可 定义核函数: K ( x, y ) = U( x ) # U( y ), 只需对变量在原低维空间进 行核函数运算即可得到其在高维空间上的内积 , 解 凸二次规划问题得预测函数为 : f (x) =
i= 1
E
l
( Ai - Ai )K ( x i, x j ) + b ( 1 . 6)
*
向量就可以算出其值, 也可采用平均值方法。 最后回归预测函数为
智能信息处理。 E-m ai: l ct79h z @ 126 . com。
6170

l






8卷
2009 2010 2011 2012 2013 2014 13. 442 1 13. 562 3 13. 641 1 13. 722 4 13. 894 3 13. 961 2 2018 2019 2020 2021 2022 14 . 252 2 14 . 291 3 14 . 341 4 14 . 353 1 14 . 394 4
2
E I{ | y
B = 其中
i= 1
l
i
- f ( x i ) | [ E} l
I (A ) =
1 若 A 为真 0 若 A 为假
取 E= 0 . 001 , 此时有 B = 94 % , 其预测信任度较高 , 其预测结果是可靠的。
0039 , 模 型 对 应 的 交 叉 验 证 均 方 误 差 MSE = 0. 67% 。预测结果见表 2 。
表 2 未来 15 年我国人口总量预测结果
年份 1997 1998 1999 预测值 12. 372 1 12. 473 1 12. 475 2 年份 2006 2007 2008 预测值 13 . 146 2 13 . 121 5 13 . 342 1 年份 2015 2016 2017 预测值 14. 098 1 14. 182 1 14. 211 3
*
求解。另外, 这样做也可以避免原优化 问题 ( 1. 2 ) 的不可行性。于是 , 问题 ( 1 . 2) 可以修正为 1 2 * m in +w + + C E ( F i + F i ) 2 i s . . t f (x i ) - y i [ F , i= 1 , ,, l i + E
* l
3 结论
我们建立 SVM 的时间序列人口增长预测模型 , 较好的满足了我国人口增长的特点 , 其模型是科学 的, 预测结果是可靠的 , 并从仿真结果来看, 该模型 与原始数据拟合得相当吻合。但是 , 当 E< = 0 . 000
22 期

涛 : 基于支持向 量机的人口增长预测模型
报 . 2007 . 7: 32) 37
( D epartm ent ofM ath emat ics , Shaanxi U n ivers ity of Techno logy , H anzhong 723000, P. R. Ch ina)
[ Ab stract]
Suppo rt VectorM ach in e is a learn ing techno lo gy based on structure risk m in i m ization and a pred ic -
( 上接第 6168 页 )
E ffect of F air Value on the P erformance of L isted Companies
L IU Y ing
( A ntai Col lege of Econom ics &M anagem ent , Shangh ai J iao Tong U n iversity, Shanghai 200030, P1R1C hina)
物理学报 . 2007 ; 9 : 45) 50 2 胡寿松 . 基于 神经 网络 的非 线性 时间 序列 故障 预 报 . 自 动化 学
Prediction M odel of Population G row th Based on Support Vector M achine
CH EN T ao
l
E
i
l
Ai (y i - E) *
E
i
l
A i (y i + E)
* l i
s . .t
EA
i i *
l
=
E
A i
*
yi - f ( xi ) [ E , i= 1 , 2 ,.. ., l 解得 , w =
0[ A i [ C 0[ A i [ C
i= 1
( 1. 4 )
E
l
(A i - A i ) U( x i ), b 用任意一个支持
TB114; C924. 2;
中国是一个人口大国 , 人口问题始终是制约我 国发展的关键因素之一。准确预测中 国人口增长 对社会发展和国家进步 有着重要的意 义。人口增 长是个受多因素影响的非线性动态系统 , 具有小样 本等特点。支持向量 机是在统计学习 理论基础上 发展起来的新型通用分类和回归工具, 较好地解决 了小样本、 非线 性、 高维 数、 局部 极小点 等实 际问 题。本文建立支持向量机预测模型, 对我国未来人 口增长进行预测。
2 . 1 我国总人口的支持 向量机回归预测
2 . 3 预测信任分析 设总的训练集为 { x i, y i }, i = 1 , 2 , , l, l 表示训 练数据的个数 , x i 是输入数据, y i 是输出数据。我们 利用下面的函数来定义预测信任度
2 . 2 实验结果 利用台 湾大 学 Chih-Jen L in 等人开 发的 软件 L IBSVM 作为工具来进行仿真实验。我们通过对原 始数据标准化处 理、 交叉验 证参数搜索、 样本训练 和样本检验等步骤, 最终得到符合精度要求的预测 模型, 并以此对未来我国人口数量进行预测。 通过对训练样本进行训练 , 经过 252次迭代 , 最 终确定 模 型 最优 参 数 C = 32 , D= 0 . 125 , E = 0.
ຫໍສະໝຸດ Baidu
1 支持向量机预测模型
统计学习理论 ( Stat is tica l L earning Theory SLT ) 是一种专门研究小样本情况下机器学 习规律的理 论。基于统计学习理论的支持向量机 ( Suppo rt Vec to rM ach in e , 简称 SVM ) , 该方法是建立在 VC 维理 论和结构风险最小化原理基础上的, 根据有限的样 本信息建立的模型可以获得最好的推广能力。 设假设训练样本集 (x i, y i ), i= 1 , 2 , ..., l (1 . 1) 具有 E近似性 , 即



华 . 基于 B ern ste in多项式的自适应混沌 时间序列预测 算法 .
tu te of Technology. 2007 . 11 : 131) 139 6 孙浚清 . 基于 GA-SVM 的装备需求 时间序列 预测 . 电子测 量与仪 器学报 . 2007 . 15: 56) 58
第 8 卷 第 22 期 2008 年 11月 1671- 1819( 2008) 22 - 6169- 03







Science T echno logy and Eng ineering
Vol 1 8 N o1 22 N ov . 2008 Z 2008 Sci 1 T ech1 Engng 1
相关文档
最新文档