数学建模论文:高考志愿填报建议
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
20X X高教社杯全国大学生数学建模竞赛
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮
件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公
开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引
用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞
赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): X 我们的参赛报名号为(如果赛区设置报名号的话): xxxxxxxx 所属学校(请填写完整的全名):集美大学
参赛队员 (打印并签名) : 1.
2. 刘伟权数学0912 55
3.
指导教师或指导教师组负责人 (打印并签名):
日期: 2011 年 7 月 31 日赛区评阅编号(由赛区组委会评阅前进行编号):
20XX高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
全国评阅编号(由全国组委会评阅前进行编号):
2011年福建高考志愿填报建议
摘要:
在每一年的高考志愿填报中涉及到很多随机因素和策略,考生往往不知道如何科学的填报志愿,本文在提取大量数据的基础上,主要解决的是计算出考生对应分数填报其感兴趣的高校被录取的概率。
在综合考虑每年的各高校的录取分数线及平均分,运用概率统计和模糊数学的方法,将学校往年的录取分和考生的原始分转化为标准分,以排除每年考试的难易程度带来分数波动的影响。
另外,运用层次分析法将各种因素纳入考虑算出权重。
最后计算被录取的概率。
最后,根据我们的研究分析,对考生填报志愿给出建议。
关键词:高考志愿概率统计模糊数学层次分析标准分权重
目录
一、问题重述
二、问题分析
三、模型假设
四、模型建立
五、模型应用
六、给考生的建议
七、模型推广与评价
八、参考文献
一、问题重述
在每年的高考结束后,考生和家长就投入到了紧张的志愿填报之中。
福建省是知分填报志愿的,也就是考生是在知道了自己的成绩、排名以及本一、本二线后才填报志愿的。
考生和家长往往通过多种渠道去了解当年招生政策及高校的招生信息,特别是往年招生院校的招生数量、报考人数、录取的最高成绩、平均成绩、最低成绩及录取情况,找到与自己分数相差较小的高校,作为自己填报志愿的重要参考。
最后再通过学校的声誉、地理位置、专业好坏及难度、就业等情况最后确定报考志愿。
根据最近5年各个高校的录取情况,给2011年考生提出一个合理的填报志愿(以福建省为例),分别根据文理科情形从500分至650分,分10分给出建议。
二、问题分析
每年都会有考生因为错估自己进入某高校的概率而落榜,所以我们要通过建立关于高考志愿填报的数学模型,来帮助考生计算自己进入心仪的学校的概率。
在志愿的填报过程中,往年的信息是最重要的参考,我们需要根据往年的数据来得出今年自己考上想要报考的学校的概率大小。
数据来源和初步处理
这个数学模型的构造的特点是数据量分散,而且数据量大,所以我们建立该模型时最先考虑的问题是数据的查找和筛选。
我们选取了23个省、直辖市的47所高校,对其2006-2010年5年的文理科方面在福建省的招生人数、最高分、最低分、平均分进行分析。
我们选取的高校见以下分布图:
数及分数较为稳定,我们没将他们列入讨论范围;另外,由于我们所建立的模型是针对福建考生的,所以我们选取的高校中,福建省的高校占有率相比于其它省份会高出一点;再次,我们尽量选取了沿海与内陆的大学等同比例。
这样就可以使我们选择的高校更具有代表性。
由于,考生的考试成绩是基本符合正态分布的,所以我们选取了各个高校的最高分、最低分、平均分以及福建省当年的重点线和当年的最高分,用来对正态当年福建省的考生的成绩分布作个大概的估计。
从而建立数学模型,从而估计某一学生进入某高校的概率。
三、模型假设
1.这5年来各高校的相对录取分数没有受到录取比例、招生政策的影响;
2.这5年来各校对考生的吸引力没有发生变化;
3.考生通过网络获取各高校的信息是全面和权威的;
4.考试根据各高校的信息做出的主管数据可以真实的反映考生的意愿。
四、模型建立
(一)基于概率统计的估计录取概率模型:
通过分段人数统计图,我们可以看出图像较符合正态分布的概率密度图像。
进行标准正态化 2)进行标准化
由标准化公式: 知道进行标准化最重要的是两个参数,即期望μ和标准差σ。
对于进行数据分析,比较容易得到的数据是省重点线key x 和省最高分max x 。
由于划重点线对应的是重点院校的招生比例,大体上比较稳定。
以福建为例,基本上是总人数的14%,大体上比μ高出σ,而根据3σ法则,状元的分数比
μ高3σ,实际上由于有最高分数的约束,不会达到,所以设置为σ。
于是, 5.1max '
key
x x -=
σ
所以得到粗略的标准化公式:
由于我们所关心的仅仅是不同x 标准化后的大小,所以略去常数,并且为观察方便我们将区间平移并放大到以500为中心的区域,即修改标准化公式为:
设置的参数max key
x x ησ
-=
,表示该省上重点线的难度。
考查几组得到分数分布的考生情况,验证了标准化公式的正确性,我们可以估计福建省的η值,η=。
进行标准化的最大好处是去处了某省某年由于考题难易造成的分数线的波动,从而可以进行某校在某地区各年录取情况的横向比较。
1.分布假设检验
由于排除难易程度造成的波动,标准化后的成绩大体上符合正态分布。
使用Jarque-Bera检验可以看出,百分之九十五以上的数据均符合正态分布。
2.均值方差分析
对于填报学校最重要的指标就是分数线的均值和标准差了,特别是标准差表明了该学校录取成绩的随机变化程度,显得更加重要。
对大量数据进行处理,发现不同学校在不同省市的标准差与该校的招生人数、以及均值有一些规
(1)平均分比录取线有更好的稳定性。
这一方面是正态分布固有的特点,同时也说明每个学校每年的整体生源情况并不像录取分数线所显示的那样大。
所以对于追求该校好的专业的同学更应该关注平均分数的变化。
(2)分数越高分数波动越大,分数较低时招生人数多少不太影响分数的波动。
这是由于低分数的学校由于有录取分数线的限制,其波动有一个下限。
(二)基于模糊判决的院校选择:
对于院校的选择,我们用模糊层次分析法:
图2 高考志愿模型层次图
说明:
决策层A :通过对个人因素的分析,考虑到各方面的社会因素,再广泛地征询
家长、教师、朋友同学等最后作出填报或不填报某一学校(或专业)的决策。
因素层B :B1 个人因素(包括子因素层:C1、C2);B2:他人因素(包括自因
素层C3、C4);B3 社会因素(包括子因素层C5、C6、C7)。
子因素层C :C1:个人兴趣、爱好;C2:该(院校)专业容易学;C3:家长的影
响;C4:老师的影响;C5:学校的声誉(办学条件、知名度);C6:专业对口、工作岗位收入高、社会地位高、工作舒适;C7:该学校处于大中城市,校园环境幽雅。
模糊多级综合评判的数学描述
我们利用模糊综合评判法对选报高考志愿进行二级综合评判。
所谓模糊综合评判是指运用模糊数学中模糊统计的方法,通过影响某事物各个因素的综合考虑,对其做出科学的评判。
图3 模糊推理示意图
确定因素集
设评判对象具有n 种属性,把影响评判对象的每一属性称为一个因素, n 个因素组成集合称为因素集。
令总目标的因素集为A ,即A = ( B1 ,B2 , ……, Bn) (此模型中n = 3) , Bi ∩Bj =φ( i ≠j) ;各一级指标的因素集为Bk ,即Bk = ( Ck1 , Ck2 , ……,Ckmk) ( mk 为第k 个一级指标的二级指标数) ( k =1 ,2 , ?, n) 。
确定评语集
模糊综合评价结果一般是用一个模糊集V 表示,各评价结果组成的分明集称为评语集,文中
指方案层组成集合, 记V = ( V1 , V2 , ……, Vi , ……Vm) , Vi 表示第i 个方案。
指标体系权重的确立
为确立各因素的权重,可采用直接评分法、功能评分法、二项系数法、AHP 法或DELPHI 等方法。
设A = ( B1 , B2 , ……Bi , ……, Bn) 的权重为W =( W1 , W2 , ……, Wi , ……, Wn) ( Wi 为因素Xi 在X 中的比重) ,0 ≤Wi ≤1 ,
1
1n
i
i W
==∑ , Bk = ( Ck1 , Ck2 , ……,Cki , ……, Ckmk) , 相应权重为Wk = ( Wk1 ,
Wk2 , ……, Wki , ……, Wkmk) ( Wki 为指标Cki 在Bk 中的比重),
101,1k
m ki ki i W W =≤≤=∑,k = 1 ,2 ,……, n 。
隶属度及模糊评判矩阵的确定
定出Xk 的每个因素Ckj 对于m 个评判集的隶属度( kj1r , kj2r , ?, kjm r ) , mk 个因素的隶属度可用mk ×m 阶模糊评判矩阵k R 表示。
确定kji r :由s 个专家组成评判组, 其权向量W = ( W1 , W2 , ?,Wi , ?, Ws) , 11s
i Wi ==∑, 每人针对评判
集给Bk 的每个因素Ckj 一个评定值()[0,1](1,2,,)t ji r t s ∈=K ,对所有专家的评定值进行如下加权处理:()1s
t ji ji k i r Wi r ==⨯∑,由此可得到Bk 的模糊评判矩阵Rk
模糊评判 一级评判
先由最低层指标开始,以Bk 的二级指标的权重向量Wk 与其模糊评判矩阵Rk 进行模糊矩阵合成运算,可得出对Bk 的二级指标集的判断向量
这里*代表模糊合并运算算子,可根据实际情况选择主因素决定型、主因素突出型、加权平均型等。
二级评判
由一级评判得到的判断向量Pk 构造新的评判矩阵P:
利用一级指标的权重向量W 与P 进行模糊矩阵合并运算,得到A 对评判集的隶属向量Q: 综合评判
结果对Q 作归一化处理, 得到'(1',2',,')Q q q qm =L ,运用最大隶属度原则确定评判结果, 'max(1',2',,')qi q q qm =L ,则评判结果为第i 个方案。
五、模型应用
录取可能性分析: A.理科同学:
(一)例如:650~640分数段的分析如下:
F (640)=825.14 F(650)= σ=[F(650)-F(640)]/4=; 在这个分数段内,如果一个学生的考分为645,分析如下: F(645)=
报考厦门大学μ=F-Q= 化为标准正态分布为:
x z
μσ-
=所以
同理对于重庆大学:
μ=F-Q= 化为标准正态分布为:对于复旦大学:
μ=F-Q=
化为标准正态分布为:
对于福州大学:
μ=F-Q=
化为标准正态分布为:
(二)当例如:640~630分数段的分析如下
F(640)=825.14 F(630)= σ=[F(640)-F(630)]/4=; 在这个分数段内,如果一个学生的考分为635,分析如下:
报考天津大学μ=F-Q= 化为标准正态分布为:
x z
μσ-
=所以
同理对于河海大学:
μ=F-Q= 化为标准正态分布为:对于上海大学:
μ=F-Q=
化为标准正态分布为:
(三)当例如:610~620分数段的分析如下
F(610)=667.83 F(620)= σ=[F(620)-F(610)]/4=; 在这个分数段内,如果一个学生的考分为645,分析如下:
报考福州大学μ=F-Q= 化为标准正态分布为:
x z
μσ-
=所以
同理对于天津财经大学:
μ=F-Q= 化为标准正态分布为:
对于中国石油大学:
μ=F-Q=
化为标准正态分布为:
(四)当例如:570~580分数段的分析如下
F(580)=510.48 F(570)= σ=[F(580)-F(570)]/4=; 在这个分数段内,如果一个学生的考分为575,分析如下:
报考广州工业大学μ=F-Q= 化为标准正态分布为:
x z
μσ-
=所以
同理对于北京电子科技大学:
μ=F-Q= 化为标准正态分布为:对于宁波大学:
μ=F-Q=
化为标准正态分布为:
化为标准正态分布为:
(五)当例如:530~540分数段的分析如下
F(530)=248.25 F(540)= σ=[F(540)-F(530)]/4=; 在这个分数段内,如果一个学生的考分为535,分析如下:
报考渤海大学μ=F-Q= 化为标准正态分布为:
x z
μσ-
=所以
同理对于井冈山大学:
μ=F-Q= 化为标准正态分布为:对于闽江大学:
μ=F-Q=
化为标准正态分布为:
B.文科同学:
(一)例如:650~640分数段的分析如下
F(640)=1048.1 F(650)= σ=[F(650)-F(640)]/4=
在这个分数段内,如果一个学生的考分为645,分析如下:F(645)=
假设这个学生想报考厦门大学,
报考厦门大学μ=F-Q= 化为标准正态分布为:
x z
μσ-
=所以
同理对于中国政法大学:
μ=F-Q= 化为标准正态分布为:对于复旦大学:
μ=F-Q=
化为标准正态分布为:
对于南京审计学院:
μ=F-Q=
化为标准正态分布为:
(二)当例如:560~570分数段的分析如下
F(560)=471.1 F(570)= σ=[F(570)-F(560)]/4=;
在这个分数段内,如果一个学生的考分为565,分析如下:
报考渤海大学μ=F-Q= 化为标准正态分布为:
x z
μσ-
=所以
同理对于山东大学:
μ=F-Q= 化为标准正态分布为:
对于重庆大学:
μ=F-Q=
化为标准正态分布为:
具体应用分析:
我们对理科生的640-650填报模型进行分析:
该考生的分数为645,通过计算及查表可得,其被厦门大学录取的概率为%,被重庆大学录取的概率为%,被复旦大学录取的概率为%,被福州大学录取的概率为100%。
我们知道,复旦大学和厦门大学相比,上海的地域优势更为明显,所以被复旦大学录取的概率也就相对较低;而厦门大学与重庆大学相比,沿海的地域优势明显强于内陆,所以被厦门大学录取的概率就会相对较低;当厦门大学与福州大学相比时,由于厦门大学的优势明显强于福州大学,所以被厦门大学录取的概率就相对较低。
综上,我们建议,如果该考生想留在沿海城市就读的话,那么他报福州大学的概率是最大的,而其如果报厦门大学,其被厦门大学录取有一定的风险,如果报复旦大学的话,则极有可能落榜;如果该考生想找一所与厦门大学综合排名差不多的学校就读的话,我们建议其报考重庆大学;若该考生想留在省内高校就读,我们建议其报考福州大学;同时,我们建议该考生尽量不要冒险去报考复旦大学,因为落榜的几率相对来说,算比较大的。
六、给考生的建议:
通过模型的建立以及对实例的分析我们可以看出,在高考填报志愿的过程中,学生对其感兴趣的高校和高校的历年招生信息十分的关键。
所以考生应该花大力气认真查找其感兴趣学校的往年招生信息,它可以使得我们较准确的把今年考生可能被某高校的录取的概率算出来,然后通过概率给出考生报考的建议。
这之后基本完全决定了考生志愿的填报。
而人为的主观倾向反而容易误导考生,冒进和保守都不利于达到最优的选择。
要认真分析各种情况,作出理性的选择。
七、模型的评价与推广
1.本模型同时使用了基于大量统计数据的概率分析模型和基于模糊判决的层次分析法,两个方法并行使用,分别得出录取的概率,然后进行综合分析。
2.概率分析部分通过标准化,略去了考题难易程度的影响,并经过严格的数学推导得出了录取概率的计算方法,对于普通考生只需要提供自己的高考成绩,即可给出他被某校录取的概率。
同时在概率分析部分学生可以选择使用录取分数线或录取平均分进行判决。
3.基于模糊判决的层次分析法,在层次分析法的基础上引入模糊判决机制,很好地符合人的思维过程,有效地综合各种性,有很强的稳健性。
4.在得出最后的结果的时候,考生可以通过选择不同的比例系数,采取不同的策略。
5.误差分析:由于数据不完全,在标准化时采用的是粗略的方法,并且在判别时由于对本次考试的情况无法准确得知,造成了误差。
6.此模型进行改进和推广时,应得到福建省各年录取分段人数统计数据,从而实现精确的标准化。
同时建立一个包含大量大学录取信息的数据库。
而在真正用于大规模预测时,可以得到大量学生的高考成绩,相信能取得较好的预测效果。
7.通过大量的数据模拟,我们推算出,当我们的的模型计算出来的概率为93%以上时,则该考生被对应高校录取的概率是非常大的;如过算出来的概率小于90%,就有极大的可能落榜。
九、参考文献
[1] 同济大学应用数学系,工程数学概率统计简明教程,高等教育出版社,
2003
年7月
[2] 周义仓、赫孝良,数学建模试验,西安:西安交通大学出版社,2002年7
月
[3] 新浪网,新浪院校库,。