我国就业人数或城镇登记失业率的数学建模

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

全国第六届研究生数学建模竞赛
题目我国就业人数或城镇登记失业率的数学建模
摘要:
影响城镇登记失业率的因素是错综复杂的,我们选取了多个经济与社会指标,进行因子分析,提取了三个主因子,并将其解释为国内经济增长潜力、通货膨胀的水平、人民币对美元的年平均汇率。

并根据因子得分进行了多元线性回归分析,回归方程显著,据此建立了关于全国城镇登记失业率与三大因素之间的数学模型。

从地区角度考虑,选择天津市为代表城市,按照上述思路,初步建立了城镇登记失业率的数学模型。

利用前面建立的全国城镇登记失业率的数学模型,可以进行未来失业率的预测。

但是由于缺乏2009年及2010年失业率的相关指标的数据,所以需要先对各指标进行预测。

我们首先做出17个相关指标的时间模型,经过SPSS的散点图观察到,除CPI、PPI及人民币对美元年平均汇率曲线比较特殊外,其他曲线几乎都可以用指数函数拟合,拟合度R2都达到了0.96以上。

利用SPSS的预测功能对除CPI、PPI及人民币对美元年平均汇率之外的14指标进行了2009年及2010年的数据预测。

但是CPI、PPI和汇率没有找到好的拟合曲线,所以我们搜索了政府的相关政策及新闻报道,进行了一下粗糙预测。

将预测的数据代入已建好的模型中即可进行较准确的预测。

关键字:城镇登记失业率因子分析时间模型
参赛队号10069001
队员姓名董佳康滑艳君刘小娟参赛密码
(由组委会填写)
1 问题重述
失业作为宏观经济关注的一个主要问题,失业率作为监测宏观经济运行的一个主要指标,其重要性正在与日俱增。

无论一个国家经济增长率有多高,物价多么稳定,国际收支状况多好,只要失业率居高不下,就不能说该国宏观经济运行状况多么健康和良好,这是国际公认的判断标准。

失业是当前比较严峻的社会问题。

这一问题不仅直接关系到国计民生和社会稳定,而且还影响到我国各项改革的进程。

虽然近年来一些相关政策的出台已部分地缓解了就业压力,但劳动力市场中的就业矛盾依然存在,依然需要我们深入探析影响我国就业问题的深层次原因,找出制约劳动力就业的瓶颈,以采取针对性的措施妥善解决就业问题。

从经济学的角度,影响就业(或者失业)的因素很多。

从宏观层面可以分为:消费、投资、政府购买和进出口等几个方面;不同地区、不同产业也会从中观层面表现出不同的特征;中央政府调整宏观经济政策(包括财政政策和货币政策),以及对不同地区和不同产业实行不同的扶持政策都会对就业产生巨大的影响。

由于近年来世界遭遇了罕见的国际金融危机,再加上我国国内的一些严峻形势,使得2009年我国就业面临更大的挑战。

因此,如何利用现有的科技手段与数理统计方法,对我国的已有的失业数据进行科学的统计,找出其中的相关的重要影响因素,并对我国以后的失业情况进行科学的预测与防御,已经成为一项刻不容缓的工作。

2 问题的分析与求解
2.1 寻找影响就业的主要因素或指标
2.1.1 问题的分析
我国失业的主要特征是总量过剩型失业,即造成失业的主要原因是劳动力供给大于需求,劳动力总量大大超过就业岗位的数量。

与失业相关的主要因素有很多方面。

从劳动力供给方面看,我国是一个人口大国,人口基数大,人口增长速度快,教育水平偏低,所以人口与教育水平会对就业产生一定得影响。

从劳动力需求方面,经济发展和科技水平的提高所带来的技术进步和革新提高了生产的机械化水平,资本有机构成的提高使得劳动力的社会需求减少,这是造成失业的又一大原因。

这里我们选择国民经济核算、价格指数、财政税收、金融风险、政府支出和科技水平来代表经济发展水平。

2.1.2城镇登记失业率模型的建立
我们利用国家统计局的相关统计数据,对这八个层次的17个的经济和社会指标的18年(1990~2007年)的相关数据进行数据分析(如表1所示)。

首先,运用spss11.5对各指标之间进行相关性分析,观察其相关性系数如何。

若指标之间相关性系数较高,即显著相关,则运用因子分析法,把17个指标用少数几个公因子来解释具有错综复杂关系的原始变量。

2.1.3结果与分析
图1:碎石图
E i g e n v a l u e
表2 Total Variance Explained
经过SPSS进行因子分析之后,提取三个主因子,可保留原信息的98.106%。

Extraction Method: Principal Component Analysis.
a 3 components extracted.
由此可以写出因子模型( 指标数据未标准化)为: AF X =
表4 Rotated Component Matrix(a)
⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡----------=017.0009.0941.0209.0213.0946.0023.0008.0984.0013.0050.0998.0288.0158.0932.0040.0007.0997.0861.0129.0487.0038.0042.0998.0111.0105.0984.0086.0069.0992.0123.0111.0982.0030.0900.0369.0292.0851.0405.0114.0177.0975.0101.0157.0977.0124.0044.0989.0016.0043.0997..0A ⎪⎪⎪⎪⎪⎪⎪⎪⎪
⎪⎪⎪⎩⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎧+-=-+=+-=-+=+-=++=+-=-+=-+=-+=-+=++-=++-=-+=-+=+-=++=32181
3
2172321713
21623
216132151
3
2142321413
21333
213232131
3
212232121
3
21143
211332112
3
2111017.0009.0941.0209.0213.0946.0023.0008.0984.0013.0050.0998.0288.0158.0932.0040.0007.0997.0861.0129.0487.0038.0042.0998.0111.0105.0984.0086.0069.0992.0123.0111.0982.0030.0900.0369.0292.0851.0405.0114.0177.0975.0101.0157.0977.0124.0044.0989.0016.0043.0997.0f f f x f f f x f
f f x f f f x f f f x f f f x f f f x f
f f x f f f x f f f x f
f f x f f f x f
f f x f f f x f f f x f
f f x f f f x ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥
⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡=8172716261514241333231222114131211x x x x x x x x x x x x x x x x x X
Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.
a Rotation converged in 4 iterations.
由最大方差旋转法(Varimax)旋转后的载荷可以看出,第一个主因子:国内经济增长潜力,主要代表国内生产总值、消费(居民消费水平)、投资(固定资产投资)、对外经济贸易(进出口额)、财政收入、财政支出、税收、广义货币、政府消费、人口总数、职工平均工资、教育投资、在校生人数、国家科研支出14个指标;第二个主因子:通货膨胀的水平,主要代表CPI和PPI;第三个主因子代表人民币对美元的年平均汇率。

Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. Component Scores.
由此得出的因子得分模型为:*
=X B F T T f f f F ][32
1
= 为因子得分矩阵。

*x 为将各个指标所有的原数据(1990年—2007年)进行标准化后的数据[2]
从方差分析表(表6)可以看出F=30.499,对应的p 值=0.000<0.05,所以回归方
程显著。

从回归系数表(表7)可知回归系数:
289.30^
=β,538.01^
=β,171.02^
=β,171.02^
=β,309.03^

它们对应的t 统计量的p 值分别为0.000,0.000,0.024,0.000都小于0.05,所以这四个回归系数都显著。

⎥⎥⎥
⎥⎥⎥
⎥⎥

⎥⎥

⎥⎥
⎥⎥⎥
⎥⎥⎥
⎥⎥⎥
⎥⎥⎦
⎤⎢⎢⎢⎢⎢
⎢⎢⎢
⎢⎢⎢
⎢⎢
⎢⎢⎢
⎢⎢⎢
⎢⎢⎢
⎢⎢
⎢⎣⎡---------------------=058.0017
.0034.0141.0062.0194.0060.0016.0040.0078.0009.0002.0022.0046.0297.0060.0004.0055.0167.0089.0816.0082.0000.0020.0106.0021.0093
.0096.0006.0067.0109.0022.0105.0109.0513.0054.0044.0537.0192.0117.0060.0102.0111.0052.0089.0034.0016.0137.0070.0011.0030.0B ⎥
⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥
⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤
⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡=8172716261514241333231222114131211x x x x x x x x x x x x x x x x x X ⎥⎥

⎥⎥⎥

⎥⎥
⎥⎥
⎥⎥
⎥⎥
⎥⎥

⎥⎥⎥

⎥⎥⎥


⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡=******************
8172716261514241333231222114131211x x x x x x x x x x x x x x x x x X
a Predictors: (Constant), REGR factor score 1 for analysis 4
b Predictors: (Constant), REGR factor score1 for analysis 4 , REGR factor score 2 for analysis 4
c Predictors: (Constant), REGR factor score1 for analysis 4 , REGR factor score 2 for analysis 4 , REGR factor score 3 for analysis 4
d Dependent Variable: 失业率
表7 Coefficients(a)
a
对因子得分进行多元线性回归(逐步回归),得到城镇登记失业率与提取的三个主因子之间的数学模型为:
E F C Y 289.3^
^+=
城镇登记失业率=Y
]309.0171.0538.0[^
=C T f f f F ][32
1
=
⎥⎥
⎥⎦

⎢⎢⎢⎣⎡=111E 根据以上结果,影响就业的三个主要因素为国内经济增长潜力、通货膨胀的水平、
人民币对美元的年平均汇率。

城镇登记失业率与上述主要因素或指标之间联系的数学模型为:
289.3309.0171.0538.0321^
+++=f f f Y
2.2 以天津市为研究对象建立城镇登记失业率与各因素之间的数学模型 2.2.1 问题的分析
根据天津市的经济社会状况,运用现有的数据建立城镇登记失业率与各因素之间的关系。

各因素的选取参照上一章的方法。

主要选取的指标(2000—2006年)为:
1,职工平均工资(元) 2,总人口(万人)
3,城镇居民家庭平均每人全年消费性支出(元) 4,全市财政收入(亿元) 5,全市财政支出(亿元)
6,失业保险参保职工人数(万人) 7,财政性教育经费(万元) 8,保险金额(万元) 9,保费(万元)
10,中资金融机构人民币存款合计(亿元) 11,商业贷款(亿元) 12,工业生产总值(亿元) 13,建筑企业个数(个)
14,建筑业从业人员平均人数(万人) 15,对外贸易进出口商品总值(万美元) 16,高等学校毕业生数(万人) 17,地区生产总值(亿元)
18,领取失业保险金人数(万人)
分析以上这18个指标与城镇登记失业率之间的关系并建模。

2.2.2 结果与分析
经过SPSS 进行因子分析之后,提取三个主因子,可保留原信息的97.658%。

由最大方差旋转法(Varimax )旋转后的载荷可以看出,第一个主因子:天津市的经济发展水平,主要代表职工平均工资、总人口、城镇居民家庭平均每人全年消费性支出、全市财政收入、全市财政支出、财政性教育经费、保险金额、保费、中资金融机构人民币存款合计、工业生产总值、对外贸易进出口商品总值、高等学校毕业生数、地区生产总值、领取失业保险金人数14个指标;第二个主因子:失业保险参保职工人数和建筑业职工数;第三个主因子代表商业贷款。

从方差分析表(附表1)可以看出方F=2.408,对应的p 值=0.245>0.05,所以回归方程不显著。

从回归系数表(附表2)可知回归系数为:
657.30^=β,018.01^=β,189.02^=β,034.03^

它们对应的t 统计量的p 值分别为0.000,0.819,0.078,0.665,后三个都大于0.05,所以这四个回归系数中的后三个都不显著。

得到的回归方程为657.3034.0189.0018.0321^
+++=f f f Y
很显然,对以上所选的三个因子来对城镇登记失业率进行回归效果并不好,可能的原因是最初选取的指标之间存在着很高的相关性。

2.3 2009年及2010年上半年的我国就业前景仿真 2.
3.1 问题的分析
若要利用所建立的关于城镇就业人数或城镇登记失业率的数学模型,对2009年及2010年上半年的我国就业前景进行仿真预测,需要有这两年的相关的指标数据,但由于大部分数据还未公布,只能对各个指标数据进行预测。

2.3.2 结果与分析
根据第二部分做出的关于全国城镇登记失业率与三大因素之间的数学模型,来预测2009年及2010年的失业率。

首先,做出17个指标的时间模型,即各个指标与时间的关系。

经过SPSS 的散点图观察到,除CPI 、PPI 及人民币对美元年平均汇率曲线比较特殊外,其他曲线几乎都可以用指数函数拟合,拟合度R 2都达到了0.96以上。

我们利用SPSS 的预测功能对除CPI 、PPI 及人民币对美元年平均汇率之外的14指标进行了2009年及2010年的数据预测。

但是CPI 、PPI 和汇率没有找到好的拟合曲线,所以我们搜索了相关的政策及新闻报道,进行了一下粗糙预测。

对预测的数据用SPSS11.5进行标准化处理,之后带入公式。

得到三个主因子的得分为:
2009年:224169.21=f ,33745.02-=f ,91063.03-=f 失业率5%1.4^
1=Y
2010年:966458.21=f , 1.058472-=f , 1.391473-=f 失业率27%.4^2=Y
2.4 关于减少城镇登记失业率的建议
失业率不仅是宏观经济的敏感而重要的指标,而且一旦超过某个值将成为影响社会稳定的重要因素。

2008年爆发了世界经济危机,对各国的经济都产生了或多或少的影响,
我国虽然经受住了历史罕见的考验,可是失业率还是有所偏高,因此,政府和地区都在寻找降低失业率的有效途径。

根据我们建立的城镇失业率的数学模型,提出一下几点减少失业率的方法。

寻找新的贸易出口,使对外贸易平稳发展。

美国的次贷危机影响到世界的经济格局,2008年以来人民币对美元的汇率累计升高,2009年呈前跌后升之势,说明我们国家在出口贸易方面的努力得到了肯定,在我们第二问建立的城镇人口失业率的模型中也得到了代表人民币对美元年平均汇率的第三主因子对失业率的影响比较显著(因子得分系数为0.816)。

降低通货膨胀率,稳定物价房价。

最近几年大量的资金是流向了楼市和股市这两个市场,而真正流向实体经济的资金并没有那么多,CPI和PPI呈小幅攀升,农产品的物价水平有所提高,为了扩大内需,政府从2008年已经陆续通过有计划的调整存款利息和贷款利率以及今年的家电下乡政策,已经初步起到了明显的作用,政府要充分应用好经济的宏观调控手段和市场杠杆继续降低失业率;
增加大学生以及失业人员的就业机会,鼓励和支持学生创业。

大学毕业生将近占到社会失业人数的30%,是亟待解决的一类新成长失业青年,给大学生提供创业支持不失为一个很好的方法和榜样。

重点解决地区失业率不平衡,力求公平公正公开就业。

希望有关政法部门制定相关的法律法规,约束和规范就业秩序,并能保证失业者的基本生活需求。

参考文献
[1] 熊祖猿. 中国失业治理研究.博士学文论文
[2] 于义良. 应用数理统计.清华大学出版社
[3] 费宇. 应用数理统计—基本概念与方法.科学出版社
[4] http://www. shumo. com
[5] /tjsj/ndsj/
[6]张志涌. 精通MA TLATB6. 5版[M ], 北京: 北京航空航天大学出版社, 2003.
ANOVA(d)
a Predictors: (Constant), REGR factor score 1 for analysis 1
b Predictors: (Constant), REGR factor score 1 for analysis 1 , REGR factor score 2 for analysis 1
c Predictors: (Constant), REGR factor score 1 for analysis 1 , REGR factor score 2 for analysis 1 , REGR factor score 3 for analysis 1
d Dependent Variable: 城镇登记失业率(%)
Coefficients(a)
a。

相关文档
最新文档