我国各省市就业影响因素分析主
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
我国各省市的就业影响因素分析
[摘要]:就业问题是一个影响国家民生的重要问题,就业问题牵涉广泛,影响深远。近年来,我国高校毕业生数量逐年增多,大学生面临严峻的就业形势,加之09年全球金融危机的影响,就业形势至今仍处于紧张的状况。面对即将就业的大学生,选择一个好的城市就业发展比较关键。因此必须对就业问题进行全面深入分析。本文研究我国各省市就业影响因素,通过对就业相关因素进行分析建立模型,分析我国各个省市的就业情况,并向当前大学生提出就业意见,从而提高我国的就业率。
[关键词]:就业形势经济发展主成分分析因子分析就业城市选择
引言
我国的经济一直在飞速发展,可是在经济发展的背后却存在着许多重大的问题,就业问题就是其中一个不容忽视的问题,其已成为各国面临和关注的一个焦点。对于就业压力日益严峻的中国市场来说,积极扩大就业,降低社会失业率,是近年来我国政府宏观调控的主要目标之一。作为一个特殊的群体,大学生的就业将遭遇多方面的挑战和挤压,在整群环境担忧的情况下,应届毕业生在就业过程中或许将不得不面对残酷的现实。
大学生就业难已不是一个新问题,每年全国都会有几百万的大学生毕业,但是仍然会有百分之十几的应届大学生找不到工作。从目前高校对大学生的就业状况统计看,大学生就业前途仍旧不容乐观。受2009年金融危机的影响,带来的工作岗位的减少,大量员工失业。目前形势虽然有所缓和,但是对于没有社会经验的应届毕业生来说,就业形势紧张的现状似乎仍然无法避免。根据现状调查了解很多大学生比较喜欢到北京、上海、广东这些一线城市就业发展,然而对于就业最好的城市的选择是不是真是如此呢?这就需要我们根据表格中的数据,分析各省市的就业形势,建立数学模型对大学生就业给出指导性建议。
我们知道就业的影响因素是多方面的,有国民收入、工业总产值、农业总产值、总人口数、固定资产投资、财政收入、就业人口数、失业人口数、城镇单位就业人员平均工资等。利用《2011年统计年鉴》查找最新相关数据,利用SPSS软件分别对各个因素进行了主成分分析和因子分析,进而从数据分析中了解各个省市的就业发展现状。
一、主成分分析
在数据处理中,经常会遇到高维数据组,由于数据维数过高,则变量
较多,而且变量间往往存在相关关系,因此很难直接抓住他们的主要信息,这就需要有一种简化数据的方法,是高维数据降维,来获得主要的信息,而且在低维空间将信息分解为互不相关的部分以获得更有意义的解释。主成分分析就是这样一种处理高维数据的方法,它通过投影的方法,将高维数据尽可能少的信息损失为原则进行综合化为少数几个不相关变量。本文研究的是更省市的就业问题,其中包含了九个影响就业的因素变量,通过主成分分析得出几个主要影响就业的因素,从而对其进行分析解释。
⑴利用因子分析结果进行主成分分析,得出特征根与方差贡献率为:
Total Variance Explained
说明了这两个因子能够充分体现就业的主要影响因素。
利用因子分析结果进行主成分分析,得出两个公因子的载荷矩阵为:
Component Matrix
⑵计算特征向量矩阵:令a1为第一个公因子的因子载荷,a2为第二个公因子的因子载荷,运用公式Z i=a i/SQRT(λi)得出特征向量矩阵:
Y1=0.38x1+0.36x2+0.34x3+0.38x4+0.38x5+0.33x6+0.37x7-0.27x8-0.05x9
Y2=0.21x1+0.28x2-0.31x3-0.16x4-0.23x5+0.43x6-0.16x7+0.20x8+0.71x9
(3)计算主成分:
(49952.18)、江苏(48324.45)、山东(45139.96)、浙江(30562.07)、河南(27863.87),虽然在综合得分排名上看上海排第七名,北京排第十一名。但是,从第二主成分得分情况看,上海得分为56242.78,北京得分为51364.49,不亚于综合得分排名第一的广东(49508.05),其中天津也可以算得上名列前茅。无可置疑,贵州、甘肃、西藏、宁夏、青海、海南相对来说是就业情况最差的几个城市。
二、因子分析
因子分析同主成分分析一样,也是一种简化和分析数据的方法。这种方法又不同于主成分分析,他把每个变量分解为两部分因素,一部分是由这些变量内含的共同因素所构成的,即所谓公共因素部分,另一部分是每个变量各自独有的因素,即所谓独特部分或单一因素部分。因子分析关注的是找出这些公共的因子,利用少数的公共因子的线性函数与独特因素之和来解释原来的观测变量,并对这些公共因子的实际意义进行解释,而不是按分解的方差贡献率来决定因子,这是和主成分分析的一个很大的差别。(1)根据因子分析结果,得出原始变量的共同度:
Communalities
变量的共同度反应每个变量对提取出的所有公共因子的依赖程度。从上图表可以看出,几乎所有的变量共同度都在80%甚至90%以上,说明提取的因子已经包含了原始变量的大部分信息,因子提取的效果比较理想。
上图是因子的碎石图。图中横轴为因子的序号,纵轴为相应的特征根的值。从图中可以看到,前2个因子的特征根普遍较高,连接成了陡峭的折现,而第3个因子之后的特征根普遍较低,连接成了平缓的折线,这进一步说明提取2个因子是比较适当的。
(2)旋转后的因子载荷:
Rotated Component Matrix
根据该表可以写出每个原始变量的因子表达式:
x1=0.586F1+0.795F2 x2=0.485F1+0.835F2 x3=0.911F1-0.186F2
x4=0.883F1+0.407F2x5=0.773F1+0.551F2x6=0.302F1+0.933F2
x7=0.865F1+0.390F2x8=-0.680F1-0.196F2 x9=-0.656F1+0.673F2(3)因子得分系数矩阵:
Component Score Coefficient Matrix
F1=0.107x1+0.086x2+0.184x3+0.17x4+0.148x5+0.044x6+0.168x7+0.15 3x8-0.138x9
F2=0.19x1+0.24x2-0.213x3-0.091x4+0.014x5+0.356x6-0.094x7-0.067x 8+0.529x9
(4)主成分得分计算: