我国城镇登记失业率的数学模型与预测
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
收稿日期: 2010-05-21
增就业 900 万人以上, 城镇登记失业率控制在 4.6%
结合国家统计局的数据, 从宏观层面、 中观层 面以及中央宏观调控政策做定性与简单定量分析, 对各项经济指标进行归纳、 汇总. 采用冗余变量检 验法, 最终确定了 22 个作为影响就业的主要指标:
第4期
杨帅国等: 我国城镇登记失业率的数学模型与预测
Component Analysis and Kernel Weighted Support Vector Machine method to build the mathematical model.We found 22 key indicators which affect the employment (unemployment). Taking into account of the correlation among these indi⁃ cators, we used the Kernel Principal Component method analysis and Weighted Support Vector Machine method to build ban unemployment rate during 1995-2009 to fit the predicted results and obtain high accuracy. the model and give the algorithm on how to construct a non-linear prediction function, and also we used the registered ur⁃
β∙i
数 :K ( x i, y i) = e 型: min 1 ∑ 2 i=1
l i=1 l
æ x x ç- i - j ç 2σ 2 ç è
ö÷÷
÷ ÷ ø
2
, 由下面非线性优化模
∑(αi - α∗i )(αj - α∗j ) K ( xi, x j) i=1 l i=1
l
÷÷
÷ ÷ ø
表 1 核主成份计算结果 Tab.1 Kernel principal component results λ 贡献率 累积率 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 λ 0.0001 0.0002 0.0003 0.0026 0.0219 14.3943 0.0512 贡献率 0 0 0 0.0002 0.0015 0.0035 0.9947 累积率 0 0 0 0.0002 0.0017 0.0053 1
YANG Shuaiguo, HU Xiaohua, ZHU Donghe
Key words: unemployment; Kernel Principal Component; Support Vector Machine 失业、 经济增长和通货膨胀为宏观经济中特别 重要的三个指标, 按照已有的研究, 就业可以定义 为三个月内有稳定的收入或与用人单位有劳动聘 用关系. 失业的统计方法各国差异较大, 我国采用 业人数与城镇登记失业人数之和的比. 其中, 城镇 龄内 (16 岁以上及男 50 岁以下、 女 45 岁以下) , 有 一定的差异, 有些历史数据也较难获得. 城镇登记失业率, 是指城镇登记失业人数同城镇从 登记失业人员是指有非农业户口, 在一定的劳动年 劳动能力, 无业而要求就业, 并在当地就业服务机 构进行求职登记的人员. 由于统计口径不同, 存在 以内[1].
{( x , y ),…( x , y )}
1 1 l l
9) 构造函数预测函数 l - x x f ( x) = ∑ α i - α∗ i K ( i, ) + b ,
i=1
(
)
其中 x k ∈ χ = {x1,⋯x l} = R N ,x k ∈ R, k = 1,⋯, l . (1) 的样本计算 l × l 的矩阵 K ij . 2) 选择一个核函数 K = (1 + x i ∙x j)3 , 利用选择
k = 1,⋯, l ) 征提取后的维数, . C 0 = 100, ε 0 = 0.01, β = 0.01, γ = 7) 取初值:
0.01, 由公式:
C i = C 0 ∙e l , i = 1,⋯, l (2) ∙l ε i = ε 0 ∙e γ , i = 1,⋯, l (3) i 8) 选择新的核函数, 这里选用 Guass 径向基函
2ö
∑(αi - α∗i ) yi + ∑ (αi - α∗i ) εi ∑(αi - α∗i ) = 0
i=1 l
s.t
K ( x i, y i) = e
.
下面介绍核主成分分析加权支持向量的预测 方法与步骤. 算法 1: 1) 已知样本集 T =
0 α i, α∗ i C i, i = 1,⋯, l 得到最优解 α i,α∗ i, i = 1,⋯, l .
上的投影 (此时要用 K C ij 代替 K ) , 然后带入 l - x x f ( x) = ∑ α i - α∗ i K ( i, ) + b
i=1
用 Matlab 编程, 核主成份分析法选用的核函数 [4] x x 为三次多项 k( i, j) = (1 + x i ∙x j)3 , 经过计算的特 征值、 贡献率见表 1. 由表 1 可知最后四个贡献率大, 故在此取最后
373
即国内生产总值、 居民消费支出、 政府购买、 城镇社 会固定资产投资、 第一产业国内生产总值、 第二产 业国内生产总值、 第三产业国内生产总值、 工业总 产值、 建筑增加值、 客运量、 邮件业务量、 各级各类 学校数、 税收、 国内旅游、 人民币汇率、 外汇储备、 货 币供应量、 货物进出口总额、 国家财政收入、 国家财 政支出、 对外经济合作、 城镇居民人均收入. 基本假设: 1) 不考虑农民工问题. 2) 假设历年 的数据真实可靠, 并从 1995 年数据开始使用. 3) 中 央扶持政策执行度良好, 资金最大限度使用. 4) 假 设 2010 年上半年经济形势不会发生突变, 运行平 稳. 5) 由于前面均以年数据考虑, 故先预测 2010 年 整年的失业率, 并假设上半年的失业率不会发生太 大变化. 本文符号说明:x (第 i 年的指标集) ;y (第 i i i x 年的失业率) ;K ( i, y i)(核函数) ;K ij(核函数对 应的矩阵) ; 在经济模型中, 常用的计量模型在预测失业率 时对数据的假设有着很强的依赖性, 这可能导致模 型设定的偏差. 核主成分分析与加权支持向量机方 法作为一种新型的研究方法, 一定程度上可以克服 上述模型中的不足, 在很多方面表现出了优于常用 的计量模型的功能. 核主成分分析方法是一种非线性特征提取方 法, 是主成份分析方法的一种非线性推广. 该方法 通过一个非线性映射将数据从输入空间映射到高 维空间, 然后在高维空间进行通常的主成份分析, 其中的内积运算采用一个核函数来代替. 本文采用 Guass 径向基函数. 即: Guass 径向基函数[2]:
( (
) )
i=1
374
当 0 αi Cj ;
海南师范大学学报 (自然科学版)
2010 年
10) 对于一个新样本 TC = {t1,⋯t m} 定义两个 矩阵 KC 和 K C , 其中 KC ij = (1 + t i ∙x j)3 K C ij = K - 1 l' K - K1 l + 1 l' K1 l 其 中 ,1 l' 为 m × l 矩 阵 ,(1 l' ) ij = 1/l . 利 用 式 l ∑α'ik K ( xi, x), k = 1,⋯, p 计算在选出的特征向量
杨帅国, 胡晓华, 朱冬和
The Mathematical Model and Prediction in China's Urban Registered Unemployment Rate
(College of Mathematics and Statistics, Hainan Normal University, Haikou 571158, China) Abstract: In this paper, combining with the date of China's National Bureau of Statistics, we used the Kernel Principal
æ x x ç- i - j ç 2σ 2 ç è
Ll LK l , 其中 Ll 是一个 l × l 的常数矩阵, . ( Ll )ij = 1 l 4) 计算 K 的特征值 λ 与特征向量 α , 其中特 k 征值 λk 对应的特征向量 α . 并对特征向量进行规 范化处理, 设规范化以后的特征向量为 α ′ , 计算公 α α′ = 式为: . λ 5) 根据实际需要, 选取部分贡献值比较大的特
第 23 卷第 4 期 2010 年 12 月
Journal of Hainan Normal University (Natural Science)
海南师范大学学报 (自然科学版)
Vol.23No.4 Dec.2010
我国城镇登记失业率的数学模型与预测
(海南师范大学 数学与统计学院, 海南 海口 571158) 摘 要: 结合中国国家统计局的数据, 使用基于核主成分分析与加权支持向量机的方法建立 模型, 找出了影响就业 (失业) 的 22 个主要指标. 考虑到这些指标相互之间的相关性, 使用核主成 分分析与加权支持向量机的方法建模, 给出了算法的步骤, 构造了非线性预测函数, 并对 1995-2009 年的城镇登记失业率进行拟合预测, 得到的结果具有较高的精度. 关键词: 失业率; 核主成分; 支持向量机 中图分类号: O 29 文献标识码: A 文章编号: 1674-4942 (2010) 04-0372-03
征值及其对应的特征向量构成新的空间作为低维 投影空间 (达到降维的目的) . l 6) 利用公式 ∑ α 'ik K ( x i, x), k = 1,⋯, p, p 计算
i=1
所有样本在选出的特征向量上的投影, 从而对所有 样本进行了非线性特征提取. 为了方便, 特征提取 n 后的数据仍用向量 x 表示, 即 x k ∈ R ( n p 为特
ˉ = K - Ll K - KLl + 3) 根据矩阵 K ij 由公式 K
其中 b 按下式计算: l - x x b = y j - ∑ α i - α∗ i K ( i, j) - ε i , i=1 当 0 αi Cj ; l - x x b = y j - ∑ α i - α∗ i K ( i, j) + ε i ,
资计划, 确定了十大产业振兴计划, 采取扩大国内 消费需求的措施, 提高对外开放水平以增加出口. 同时, 中央财政拟投入 420 亿元资金实施积极的就
中央从 2008 年 10 月开始实施了 4 万亿元的投
1 分析问题并建立模型
2010 年上半年的我国就业前景进行预测.
业政策. 2009 年我国在就业方面的目标是城镇新
四个主成份进行后面的加权支持向量机, 加权支持 向量基中选用的核函数为高斯径向基函数核
k( x i, x j) = exp - x i - x j /σ 2 ,
wk.baidu.com
所用参数: 测试结果见表 2.
(
)
由上表可以看出, 基于核主成份与加权支持向
得到需要的预测值.
i=1
(
)
量机的预测方法拟合及预测都取得了很好的效果, 最小的相对误差 0.07% (1997 年) , 最大相对误差 4.13% (2001) .
本文利用近年来我国有关的统计数据并结合
一年多来我国国民经济的运行数据就城镇登记失 业率做了如下研究. 主要因素或指标. 1) 对有关统计数据进行分析, 寻找影响就业的 2) 建立城镇登记失业率与上述主要因素或指 3) 利用所建立的关于城镇登记失业率的数学
标之间联系的数学模型.
模型, 根据国家的有关决策和规划对 2009 年及
增就业 900 万人以上, 城镇登记失业率控制在 4.6%
结合国家统计局的数据, 从宏观层面、 中观层 面以及中央宏观调控政策做定性与简单定量分析, 对各项经济指标进行归纳、 汇总. 采用冗余变量检 验法, 最终确定了 22 个作为影响就业的主要指标:
第4期
杨帅国等: 我国城镇登记失业率的数学模型与预测
Component Analysis and Kernel Weighted Support Vector Machine method to build the mathematical model.We found 22 key indicators which affect the employment (unemployment). Taking into account of the correlation among these indi⁃ cators, we used the Kernel Principal Component method analysis and Weighted Support Vector Machine method to build ban unemployment rate during 1995-2009 to fit the predicted results and obtain high accuracy. the model and give the algorithm on how to construct a non-linear prediction function, and also we used the registered ur⁃
β∙i
数 :K ( x i, y i) = e 型: min 1 ∑ 2 i=1
l i=1 l
æ x x ç- i - j ç 2σ 2 ç è
ö÷÷
÷ ÷ ø
2
, 由下面非线性优化模
∑(αi - α∗i )(αj - α∗j ) K ( xi, x j) i=1 l i=1
l
÷÷
÷ ÷ ø
表 1 核主成份计算结果 Tab.1 Kernel principal component results λ 贡献率 累积率 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 λ 0.0001 0.0002 0.0003 0.0026 0.0219 14.3943 0.0512 贡献率 0 0 0 0.0002 0.0015 0.0035 0.9947 累积率 0 0 0 0.0002 0.0017 0.0053 1
YANG Shuaiguo, HU Xiaohua, ZHU Donghe
Key words: unemployment; Kernel Principal Component; Support Vector Machine 失业、 经济增长和通货膨胀为宏观经济中特别 重要的三个指标, 按照已有的研究, 就业可以定义 为三个月内有稳定的收入或与用人单位有劳动聘 用关系. 失业的统计方法各国差异较大, 我国采用 业人数与城镇登记失业人数之和的比. 其中, 城镇 龄内 (16 岁以上及男 50 岁以下、 女 45 岁以下) , 有 一定的差异, 有些历史数据也较难获得. 城镇登记失业率, 是指城镇登记失业人数同城镇从 登记失业人员是指有非农业户口, 在一定的劳动年 劳动能力, 无业而要求就业, 并在当地就业服务机 构进行求职登记的人员. 由于统计口径不同, 存在 以内[1].
{( x , y ),…( x , y )}
1 1 l l
9) 构造函数预测函数 l - x x f ( x) = ∑ α i - α∗ i K ( i, ) + b ,
i=1
(
)
其中 x k ∈ χ = {x1,⋯x l} = R N ,x k ∈ R, k = 1,⋯, l . (1) 的样本计算 l × l 的矩阵 K ij . 2) 选择一个核函数 K = (1 + x i ∙x j)3 , 利用选择
k = 1,⋯, l ) 征提取后的维数, . C 0 = 100, ε 0 = 0.01, β = 0.01, γ = 7) 取初值:
0.01, 由公式:
C i = C 0 ∙e l , i = 1,⋯, l (2) ∙l ε i = ε 0 ∙e γ , i = 1,⋯, l (3) i 8) 选择新的核函数, 这里选用 Guass 径向基函
2ö
∑(αi - α∗i ) yi + ∑ (αi - α∗i ) εi ∑(αi - α∗i ) = 0
i=1 l
s.t
K ( x i, y i) = e
.
下面介绍核主成分分析加权支持向量的预测 方法与步骤. 算法 1: 1) 已知样本集 T =
0 α i, α∗ i C i, i = 1,⋯, l 得到最优解 α i,α∗ i, i = 1,⋯, l .
上的投影 (此时要用 K C ij 代替 K ) , 然后带入 l - x x f ( x) = ∑ α i - α∗ i K ( i, ) + b
i=1
用 Matlab 编程, 核主成份分析法选用的核函数 [4] x x 为三次多项 k( i, j) = (1 + x i ∙x j)3 , 经过计算的特 征值、 贡献率见表 1. 由表 1 可知最后四个贡献率大, 故在此取最后
373
即国内生产总值、 居民消费支出、 政府购买、 城镇社 会固定资产投资、 第一产业国内生产总值、 第二产 业国内生产总值、 第三产业国内生产总值、 工业总 产值、 建筑增加值、 客运量、 邮件业务量、 各级各类 学校数、 税收、 国内旅游、 人民币汇率、 外汇储备、 货 币供应量、 货物进出口总额、 国家财政收入、 国家财 政支出、 对外经济合作、 城镇居民人均收入. 基本假设: 1) 不考虑农民工问题. 2) 假设历年 的数据真实可靠, 并从 1995 年数据开始使用. 3) 中 央扶持政策执行度良好, 资金最大限度使用. 4) 假 设 2010 年上半年经济形势不会发生突变, 运行平 稳. 5) 由于前面均以年数据考虑, 故先预测 2010 年 整年的失业率, 并假设上半年的失业率不会发生太 大变化. 本文符号说明:x (第 i 年的指标集) ;y (第 i i i x 年的失业率) ;K ( i, y i)(核函数) ;K ij(核函数对 应的矩阵) ; 在经济模型中, 常用的计量模型在预测失业率 时对数据的假设有着很强的依赖性, 这可能导致模 型设定的偏差. 核主成分分析与加权支持向量机方 法作为一种新型的研究方法, 一定程度上可以克服 上述模型中的不足, 在很多方面表现出了优于常用 的计量模型的功能. 核主成分分析方法是一种非线性特征提取方 法, 是主成份分析方法的一种非线性推广. 该方法 通过一个非线性映射将数据从输入空间映射到高 维空间, 然后在高维空间进行通常的主成份分析, 其中的内积运算采用一个核函数来代替. 本文采用 Guass 径向基函数. 即: Guass 径向基函数[2]:
( (
) )
i=1
374
当 0 αi Cj ;
海南师范大学学报 (自然科学版)
2010 年
10) 对于一个新样本 TC = {t1,⋯t m} 定义两个 矩阵 KC 和 K C , 其中 KC ij = (1 + t i ∙x j)3 K C ij = K - 1 l' K - K1 l + 1 l' K1 l 其 中 ,1 l' 为 m × l 矩 阵 ,(1 l' ) ij = 1/l . 利 用 式 l ∑α'ik K ( xi, x), k = 1,⋯, p 计算在选出的特征向量
杨帅国, 胡晓华, 朱冬和
The Mathematical Model and Prediction in China's Urban Registered Unemployment Rate
(College of Mathematics and Statistics, Hainan Normal University, Haikou 571158, China) Abstract: In this paper, combining with the date of China's National Bureau of Statistics, we used the Kernel Principal
æ x x ç- i - j ç 2σ 2 ç è
Ll LK l , 其中 Ll 是一个 l × l 的常数矩阵, . ( Ll )ij = 1 l 4) 计算 K 的特征值 λ 与特征向量 α , 其中特 k 征值 λk 对应的特征向量 α . 并对特征向量进行规 范化处理, 设规范化以后的特征向量为 α ′ , 计算公 α α′ = 式为: . λ 5) 根据实际需要, 选取部分贡献值比较大的特
第 23 卷第 4 期 2010 年 12 月
Journal of Hainan Normal University (Natural Science)
海南师范大学学报 (自然科学版)
Vol.23No.4 Dec.2010
我国城镇登记失业率的数学模型与预测
(海南师范大学 数学与统计学院, 海南 海口 571158) 摘 要: 结合中国国家统计局的数据, 使用基于核主成分分析与加权支持向量机的方法建立 模型, 找出了影响就业 (失业) 的 22 个主要指标. 考虑到这些指标相互之间的相关性, 使用核主成 分分析与加权支持向量机的方法建模, 给出了算法的步骤, 构造了非线性预测函数, 并对 1995-2009 年的城镇登记失业率进行拟合预测, 得到的结果具有较高的精度. 关键词: 失业率; 核主成分; 支持向量机 中图分类号: O 29 文献标识码: A 文章编号: 1674-4942 (2010) 04-0372-03
征值及其对应的特征向量构成新的空间作为低维 投影空间 (达到降维的目的) . l 6) 利用公式 ∑ α 'ik K ( x i, x), k = 1,⋯, p, p 计算
i=1
所有样本在选出的特征向量上的投影, 从而对所有 样本进行了非线性特征提取. 为了方便, 特征提取 n 后的数据仍用向量 x 表示, 即 x k ∈ R ( n p 为特
ˉ = K - Ll K - KLl + 3) 根据矩阵 K ij 由公式 K
其中 b 按下式计算: l - x x b = y j - ∑ α i - α∗ i K ( i, j) - ε i , i=1 当 0 αi Cj ; l - x x b = y j - ∑ α i - α∗ i K ( i, j) + ε i ,
资计划, 确定了十大产业振兴计划, 采取扩大国内 消费需求的措施, 提高对外开放水平以增加出口. 同时, 中央财政拟投入 420 亿元资金实施积极的就
中央从 2008 年 10 月开始实施了 4 万亿元的投
1 分析问题并建立模型
2010 年上半年的我国就业前景进行预测.
业政策. 2009 年我国在就业方面的目标是城镇新
四个主成份进行后面的加权支持向量机, 加权支持 向量基中选用的核函数为高斯径向基函数核
k( x i, x j) = exp - x i - x j /σ 2 ,
wk.baidu.com
所用参数: 测试结果见表 2.
(
)
由上表可以看出, 基于核主成份与加权支持向
得到需要的预测值.
i=1
(
)
量机的预测方法拟合及预测都取得了很好的效果, 最小的相对误差 0.07% (1997 年) , 最大相对误差 4.13% (2001) .
本文利用近年来我国有关的统计数据并结合
一年多来我国国民经济的运行数据就城镇登记失 业率做了如下研究. 主要因素或指标. 1) 对有关统计数据进行分析, 寻找影响就业的 2) 建立城镇登记失业率与上述主要因素或指 3) 利用所建立的关于城镇登记失业率的数学
标之间联系的数学模型.
模型, 根据国家的有关决策和规划对 2009 年及