数学建模毕业生就业问题

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

数学建模毕业生就业问题

摘要

本文讨论了在新的就业形势下大学生的就业问题。

首先，通过对影响就业的因素的分析，建立线性回归模型，利用逐步回归分析求解模型，我们得出了影响大学生就业的主要因素是专业前景和政治面貌。其中，专业前景占的比重要大一些。

通过对不同专业就业情况的讨论，在进一步假设的基础上选取样本数据，分别计算各专业的就业率、初始薪金均值及目前薪金均值，在作图比较的分析下给出客观评价。

问题三：给出某一专业毕业生的就业策略。我们选定“计算机”专业毕业生作为研究对象，再次利用逐步回归模型，探究在该专业毕业生就业情况中起主要作用的因素，以此为依据就初始学历、专业是否对口等方面提出针对性策略建议。

问题四：结合实际探讨毕业生就业情况与地区经济发展水平间的关系。在明确研究背景的基础上，我们选取了八个不同城市作为研究对象，分别计算该地大学毕业生就业率，得出地区经济发展现状与就业率呈正相关的结论。

问题五：对我校毕业生就业提出指导性建议。在本题研究成果的基础上，结合我校实际，分析了就业压力、自身期望、企业需求等方面的现存问题，从就业观、薪金要求、专业对口等几个方面给出就业指导建议。

关键词：虚拟变量；回归分析；逐步回归模型；相关性系数

一、问题提出

随着我国大学教育逐步向大众化方向转变，招生数量连年增多，导致大学毕业生就业情况逐步严峻。2007年全国普通高校毕业生将达到495万，比2006年增加82万。大学毕业生的就业率高低，既有社会整体大环境的因素，也有专业结构、培养方向、教学方式、学生学习态度等多方面的原因。附件给出了一个七千多名毕业生的调查数据，请你根据这些数据，建立相应的数学模型，研究以下问题：

（1）影响毕业生就业的主要因素是什么，并对相关因素进行排序；

（2）评价不同专业的毕业生就业情况；

（3）给出某一专业的毕业生的就业策略；

（4）请你结合其他信息对毕业生就业与区域经济发展水平之间的关系作出评价；

（5）结合中央民族大学本科教育现状，写一篇对在校生今后就业具有实际指导意义的短文。

21世纪是知识的时代，人才是国家发展的先决条件。大学毕业生的就业情况关乎社会发展状况与人才利用效率，通过数学模型的建立对影响就业率的各项因素进行深入分析研究，具有重大的实际意义。

二、基本假设

在本次研究中做出以下假设：

1．假设毕业生就业情况只受性别、专业、政治面貌、毕业生条件、学历、专业前景、专业是否对口、课程是否适合社会、毕业时间等因素的影响。

2．假设具有上述同等条件的毕业生间就业机会相同。

3．假设附件中的数据信息均合理。

三、建立模型及其检验、求解、评价

（一）问题1：确定影响大学生就业的主要因素

1.1 问题分析与建模思想

此题要在众多的就业率影响因素中选取主要因素，并对其进行排序。

首先需要研究变量间的相关关系，多元线性回归分析模型可解决这一问题；但进一步的，我们希望从所有的影响因素中挑选出对就业率影响显著的项目，并且从应用的角度讲，变量个数尽可能少，而逐步回归模型则可有效实现这一目标。

逐步回归的基本思想是：

根据各个自变量重要性的大小，每次选一个重要自变量进入回归方程。先是在所有可供选择的自变量中选择一个，条件是由其所参与的一元回归方程有最大的回归平方和。然后在未选的自变量中再选择一个，条件是由这两个已选的自变量所组成的二元回归方程有更大的回归平方和。如此继续下去。一般地说，第t步是在未选的自变量中，选一个自变量与其他已经选择的自变量一起所组成t元回归方程，并使该方程有更大的回归平方和。为保证每一个选入回归方程的自变量是真正重要的，应该对每一个进入回归方程的自变量进行显著性检验。

不仅要按自变量的贡献大小逐一选出重要自变量，而且还要考虑较早选入回归方程的某些自变量，有可能随着其后另外一些自变量的选入而失去原有的重要性。这样的自变量应及时地从回归方程中剔除，使最终的回归方程只保留重要的自变量。

上述思想是“有进有出”的。直到回归方程中的自变量都不能剔除，而又没有新的自变量引入回归方程为止。

在逐步回归的计算中，不重要的自变量始终不会进入回归方程，无需解一个可能具有较大阶数的正规方程，计算效率的提高是显然的。更重要的是，当某个自变量与已经选入回归方程的自变量存在线性相关或近似线性相关时，其作用可以由与其相关或近似相关的自变量所代替，这时就不可能引入回归方程，由此可以防止逐步回归计算过程中出现不稳定。

1.2 符号说明

●Xi：影响因素虚拟变量（i=1,2,3 (20)

●Yi：就业情况虚拟变量(i=1,2,3 (20)

●Coefficients：相关性系数

●R2 ：判定系数

●F：显著性检验

●P-value：F统计量对应的概率值

● RMSE ：剩余标准差

1.3 建立模型

➢ 第一步：抽取样本

考虑到数据总量庞大，从中抽取部分数据作为样本。为了使模型能够反映出就业与未就业情况之间的对比，我们从已经就业的学生中选取了20位，再从未就业的学生中选取了10位，用他们的数据来建立回归方程。

➢ 第二步：引入虚拟变量

在回归分析模型中，解释变量均为定性变量的模型称为方差分析模型（analysis-of-variance models ）(ANOVA)，本题即为此状。现建立人工变量，将定性变量“定量化”，具体赋值情况如下：

X 1：性别虚拟变量，设⎩

⎨⎧=，女性，男性011X X 2：专业虚拟变量，⎩⎨⎧=，其他

，工科类012X X 3：政治面貌虚拟变量，设 X 4：毕业生条件虚拟变量，设

X 5：学历虚拟变量，设⎩⎨⎧=，本科学历以下

，本科及本科学历以上015X X 6：专业前景虚拟变量，设⎩⎨⎧=，很无前途及较无前途

，很有前途及较有前途016X X 7：专业是否对口虚拟变量，设⎩

⎨⎧=对口，基本不对口或完全不，基本对口或完全对口017X X 8：课程是否适合社会虚拟变量，设⎩⎨⎧=，不适合或很不适合

，适合或很适合018X X 9：毕业时间虚拟变量，设⎩⎨⎧=年以后

，毕业时间在年以前年及，毕业时间在200402004200419X Y ：就业状况，设⎩⎨⎧=，未就业

，已就业01Y 经过上述量化过程，样本数据排列为下面的矩阵形式：

1 0 0 0 0 1 1 0 1 1

1 0 0 0 1 1 1 1 0 1

1 0 0 1 1 1 1 1 1 1

0 0 0 1 0 1 1 0 1 1

1 1 1 1 1 1 1 1 1 1

0 1 0 1 0 1 1 1 0 1

0 0 0 0 0 0 0 0 0 0

0 1 1 0 1 1 0 0 0 1

0 1 0 1 1 1 1 1 1 1

⎩⎨⎧=，其他

，党员013X ⎩⎨⎧=，其他能力，综合能力01X 4