高校毕业生就业率统计与分析模型的研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

应使

$ Q( a, b) = ρ( xj ) [ f( xj - beaxj ) ] 2 j=0
最小, 对(5)式两边取对数:
lny( x) =lnb+ax(6)
通过(6)式就可间接的求出 a, b 的值, 近而拟合出曲线方程。
2.2.1 JSP 算法实现
主要体现该模型的算法复杂度的主要 JSP 程序段为:
%7lnb+21a=- 0.708
21lnb+91a=- 2.809
所以拟合的指数方程为: y=0.97e-0.02x, 根据拟合方程可以估计出每
年的就业率, 分析情况如表 3 所示:
表 3 指数模型回归误差分析
Ta b.3 The inde x re gre s s ion mode l a na lys is of e rror
科技信息
○高校讲台○
SCIENCE & TECHNOLOGY INFORMATION
2007 年 第 29 期
高校毕业生就业率统计与分析模型的研究
张 稳 恰汗·合孜尔 苗 刚 ( 新疆农业大学数理学院 新疆 乌鲁木齐 830052)
【摘 要】本研究采用 JSP 技术, 对多项式回归、指数曲线拟合及正交多项式曲线拟合三种数学模型的算法复杂度、绝对平均误差、误差方 差进行研究分析, 从而探索一种适合于高校毕业生就业率统计与分析的数学模型。
j=0
j=0
系数矩阵为非奇异矩阵, 能解出唯一一组解, 其解就是所要拟合函数的
系数。
2.1.1 JSP 算法实现
由(2)式可知, 要求出模型函数的系数, 就必须求出系数矩阵的值。
决定算法复杂度的主要 JSP 程序段为:
double xx[][]; //存储(2)式中矩阵的系数
double yy[][]; //存储(2)式中矩阵的系数
$ ak+1 =
( xpk , pk ) ( pk , pk )
=j
ρ( xj ) xj pk ( xj )
实际就业率 0.960 0.950 0.948 0.943 0.848 0.801 0.889
估计就业率 0.976 0.949 0.924 0.902 0.881 0.882 0.845
误差绝对值 0.016 0.001 0.024 0.041 0.033 0.081 0.044
根据(3)式和(4)式分别得绝对平均误差和误差方差为: ei=0.036, σ2= 0.00194
p1 =( x- a1 ) p0 ( x)
(8)
pk+1 =( x- ak+1 ) pk ( x) - βk pk- 1 ( x)
Al 为常数, ρ( x) 为权函数, pk 是 ρ( xj) ( j=0, 1, …m) 的正交递推公式,
pk ( x) 是最高项系数为 1 的 k 次多项式。其中



n- 2
( Yi - Y* i ) 2
i=1
(4)
其中Y* i , 是通过模型拟合出来的函数曲线。 2.1.3 实例检验
采用二次多项式进行模型检验, 使用二次多项式拟合时 Φ=span
{1, x, x2}, 自变量 x 代表年份, 因变量 f 代表每年的就业率, 用矩阵表示

&-( 1, 1)
( 1, x)
数, Φ为线性无关的函数类集合, s∈Φ要使得(1)式达到极小值用矩阵
表示为:
&’( φ0 , φ0 )
( φ0 , φ1 )

( φ0 , φn )
a ),
*- 0
) *
&-( f, φ0 )
) *

*- * -
*
’’( φ1 , φ0 )

( φ1 , φ1 )

( φ1 , φn )
a *-
*- 1 *-
s4+=x[i]*s3; }
根据算法可以很明显的得到时间复杂度为 O( m) ,空间复杂度为 O
( m) 。
2.2.2 实例检验
有线性化可知 Φ=span{1, x}, x 代表年份, 用矩阵表示为
! " ( 1, 1) ( 1, x)
( x, 1) ( x, x)
根据表 1 提供的数据, 经过 JSP 程序处理后可得出方程组:
2.2 指数模型
鉴于往年就业率变化趋势,我们采用指数模型进行曲线拟合。对于
给定的 n 年就业数据(x1,y1),(x2,y2),∧,(xn,yn) , 采用指数模型进行曲线拟合, 模型为:
ym(x)=beaxm , ( m<n)
(5)
a, b 为待求函数系数, 对于给定的数据, 采用最小二乘法来确定 a, b
*
**=
--(
-
f,
φ1 )
* * *
(2)
’ ’


M M M *- * -
*
*- * -
*
’’(
(
φn ,
φ0 )
( φn , φ1 )

( φn , φn )
a **--
+( n
** +
--(
(
f,
φn )
** +


! ! 其中, ( φi, φk) = ρ( xj ) φi( xj ) φk( xj ) , ( f, φk) = ρ( xj ) f( xj ) φk( xj ) , 若
0.引言
目前, 国内各高校虽然都拥有毕业生就业管理系统, 但不足之处都 是以网站的形式存在的。由于毕业生就业率的高低受诸多不定因素的 影响, 进行统计和分析有较大的难度, 所以目前各高校的毕业生就业管 理系统都没有涉及到对就业信息进行统计与分析。基于这一现状, 本研 究基于计算机技术与数学相结合的思想, 对数学模型进行分析验证, 从 而探索一种适合毕业生就业率整体统计分析的数学模型。
表 1 毕业生就业数据 Ta b.1 Gra dua te s e mployme nt da ta
序号

年份 2000
就业率 0.960
2 2001 0.950
3 2002 0.948
4 2003 0.943
5 2004 0.848
6 2005 0.808
7 2006 0.889
以表 1 提供的就业数据为依据, 以下将从多项式回归、指数曲线拟 合、正交多项式曲线拟合三个数学模型对就业数据进行统计和分析。

( 1, x )
-
-
-(
x,
1)
( x, x)

( x, x )
./. 0 a )
*0
( 1, f)
*
a *
*1

( x, f)
-
*

--((



1)

( x , x)
22
(x ,x )
** +
a2
( x , f)
为了便于计算把自变量变为 x- 2000, 由 JSP 程序处理后得系数矩
阵为:
532
序列号


3ห้องสมุดไป่ตู้




年份
2000 2001 2002 2003 2004 2005 2006
实际就业率 0.960 0.950 0.948 0.943 0.848 0.801 0.889
$ % m
0, l≠k


ρ( xj ) pl ( xj ) pk ( xj ) =

Al >0, l=k
(7)
p0 =1
【关键词】数学模型; 算法复杂度; 绝对平均误差; 误差方差; 就业率 Employment Rate of College Gr aduates Statistics and Analysis Model of Resear ch
Zhang Wen, Qihan·Hezier , Miao Gang
(College of Computer and Infor mation Engineer ing, Xinjiang Agr icultur al Univer sity) 【Abstr act 】This study uses JSP technology , to the polynomial regression, exponential curve fitting and orthogonal polynomial curve fitting three mathematical model of complexity of the algorithm , the average absolute error and the error variance to study and analysis, so as to explore a mathematical model suitable for employment rate of college graduates overall statistics and analysis. 【Key wor ds】mathematical model; the complexity of the algorithm; the average absolute error; error variance; employment rate
double x[]; //存储年份
double y[]; //存储往年的就业率
for(int i=0;i<m;i++) //m 表示循环次数
{ s1*=x[i]; //求出线性化方程(8)式中 前面的两个系数 s1,s2
s2*=x[i]*x[i];
s3+=Math.log(y[i]); //计算(8)式中函数左边的两个函数值 s3,s4
1.设计思想
回归分析及曲线拟合方法是用数理统计的方法确定变量之间相关
关系的,通过对数据进行直线或曲线拟合找出变量间的回归方程的一种 方法。在误差允许的条件下, 利用计算机进行曲线拟合和回归分析,将使 数据的处理和分析变得迅速而容易。即采用曲线拟合的方法来确定哪 种曲线能够最恰当地描述所采集的观测数据,并利用计算机对各种可能 的曲线方程进行计算,求出各曲线的回归系数,从而选取最佳曲线模型[1- 3]。
for(int i=0;i<n;i++) //n 表示循环次数
{ for(int j=0;j<n;j++)
for(int k=0;k<n;k++)
s[i][j]+=(xx[i][k])*(yy[k][j]); } //s[i][j]存储矩阵的积
for(int k=0;k<n;k++)
{ double fMax=0.0; //存储最大值
科技信息
○高校讲台○
SCIENCE & TECHNOLOGY INFORMATION
2007 年 第 29 期
! "!"! " 7 21
21 91
91 a0 6.339 441 a1 = 18.406
91 441 2275 a2 78.826
可 得 年 份 与 就 业 率 函 数 关 系 式 为 : y =0.976095 - 0.027893x +
for(int i=k;i<n;i++)
{ for(int j=k;j<n;j++)
{ double f=Math.abs(s[i][j]); //f 存储矩阵中绝对值最大的
元素的绝对值
if (f>fMax)
{ fMax=f;
is[k]=i; //存储绝对值最大元素的行下标
js[k]=j; } } } } //存储绝对值最大元素的列下标
2.1 多项式回归模型


! ! *


模型表达式为: ρ( xj ) [ f( xj ) - s ( xj ) ] =min ρ( xj ) [ f( xj ) - s( xj ) ]
j=0
s∈Φ j = 0
(1)

其中 ρ( x) 为 权 函 数 , 并 且 ρ( x) ≡1, s ( x) 为 最 小 二 乘 曲 线 拟 合 函
根据算法程序可知, 该算法的时间复杂度为 0( n3) ,空间复杂度为 0
( n2) 。
2.1.2 误差分析
为了便于对数学模型的误差进行分析, 本研究采用绝对平均误差
和误差方差, 来对模型进行准确度的分析。绝对平均误差与误差方差如
下所示:

! ei=(
Y* i - Yi ) n
(3)
i=1

! 2
σ=
2.数学模型
评价一个数学模型的优劣, 不仅与拟合出的曲线是否与实际数据 的变化趋势相符合有关系, 而且还与实现该模型算法的效率有关系, 在 计算机技术上, 是采用时间复杂度和空间复杂度, 这两个指标来对其算 法效率的高低进行衡量的。以下将从算法复杂度和模型准确程度对多 项式回归、指数曲线拟合、正交多项式曲线拟合进行分析研究, 对模型 算法复杂度的分析利用目前最为流行的 JSP 技术[4-6], 而对于模型准确 程度的评定, 则采用绝对平均误差和误差方差来衡量。新疆农业大学近 几年的就业数据如表 1 所示:
0.001012x2, 根据方程可以得到每年的估计就业率, 分析情况如表 2 所
示:
表 2 二次多项式回归误差分析
Ta b.2 S e cond polynomia l re gre s s ion a na lys is of e rror
序列号







年份
2000 2001 2002 2003 2004 2005 2006
相关文档
最新文档