数学建模成绩的评定分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数学建模竞赛成绩的评定
摘要
本文为解决题中所求问题,运用了统计规律及建立了相适应的模型,结合了matlab,excel等软件工具进行分析,补充了题中缺失的数据以及对每个参赛队的成绩进行了分析和排序。

文中还对模型进行了适当的评价。

对于问题一,本文先忽略缺失的分数,运用matlab软件对甲,乙,丙三位老师所评的100个分数进行正态性分布检验,再计算出均值,运用均值填补法,并对其进行置信区间检验,证明正确,得到缺失的数据分别为77,80,80。

针对问题二,本文运用了数理及统计知识进行分析,采用均值作为第一指标,方差作为第二指标进行排序,得出了排名表,但由于评阅老师可能会存在主观原因,为了公平起见,本文算出各阅卷老师的权重并相应计算出每个参赛队的加权平均分进行排序。

针对问题三,本文采用绘图的方法得出各阅卷老师评分的大概范围以及方差比较法得出甲老师打分方差最大,即打分较严格,丙老师打分方差最小,即打分较宽松。

对于问题四,由于题中未给出复评的名额,所以文中假设选出15名,本文先运用excel软件找出平均值在80分以上的参赛队共22名,然后再对这22 名参赛队的加权平均分和方差进行排名,再取前15名,即39,51,47,66,87,91,64,69,100,86,82,77,97,101,98这十五个队。

关键词: 加权平均分权重方差比较法第一指标第二指标
一、问题重述
某校一年一度的大学生数学建模竞赛,成绩评定的主要标准为:建模的合理性、结果的正确性、书写的规范性和文字表述的清晰程度;成绩评定的流程为:5位评阅老师分别独立地为每份论文打分,最终依据某种方式对各参赛队进行排序、确定所获的奖项。

由于评定标准具有一定的模糊性,加之打分习惯不同,因而各位老师给每个参赛队的分数存在一定的差异。

由于某种原因而造成了三位同学的成绩缺失,因此我们需要建立合适的数学模型,以解决以下几个问题:
(1)从表中可以发现队序号为9,25,58的三组队员分别缺失甲,乙,丙三位老师所评定的分数,因此需要将表中缺失的数据补齐,并给出补缺的方法及理由。

(2)对这101个参赛队进行排名。

(3)建立模型对5位老师进行分类,评价5位老师中哪位老师打分比较严格,哪位老师打分比较宽松。

(4)由于还会对一部分平均分在80分以上的参赛队进行复评,则需要找出符合进行复评要求的队列。

二、问题假设
1. 假设每位老师完全以公平公正的标准为应聘者打分,不存在徇私。

2. 假设需要选出15名参赛队进行复评。

3. 假设参赛队是否参加复试只与老师对其所打的分有关,和其他因素无关。

三、符号说明
四、模型的建立和求解
4.1问题一

此问题我们需要建立适当的数学模型将队序号为9,25,58的三组队员分别缺失的甲,乙,丙三位老师所评定的分数补齐。

我们可以先忽略缺失的数据,那么甲乙丙每位老师都打出了100项分数,数据样本足够大。

所以可以应用统计规律采用区间估计的思想对本问题求解。

4.1.1问题的分析
首先以甲、乙、丙三个老师各自所打的分数作为各自的样本,例如甲老师评出了100项分数,以这100项数值作为样本甲的观测值,运用matlab软件计算专家甲对剩余100名参赛者的评分的平均值。

我们先不考虑第九组缺失甲老师的分数,则甲老师评出了100项分数,运用matlab 软件可计算出其平均值x¯1为76.55。

同理,不考虑乙老师对25组成绩的缺失,运用matlab软件可求出其剩余评分的平均值
x¯2为79.86.在不考虑丙老师对58组成绩的缺失,可求出其剩余评分的平均值x¯3。

4.1.2问题的求解
用matlab对甲,乙,丙老师的所评分数进行正态分布检验。

如下图示:
figure1 甲老师所评分数的正态分布图
figure2 乙老师所评分数的正态分布图
figure3 丙老师所评分数的正态分布图
图形显示出直线性形态,则可知甲,乙,丙老师的所评分数都近似服从正态分布。

然后再 需计算出甲老师所评分数的置信区间,则在matlab 中执行以下命令
[h, sig, ci ] = ttest (x, 76.55)
可求出其置信区间为(74.0028,79.0972),h=0,sig=1. 再计算出乙老师所评分数的置信区间,
则在matlab 中执行以下命令
[h, sig, ci ] = ttest (y, 79.86)
可求出其置信区间为(77.5812,82.1388),h=0,sig=1. 再计算出乙老师所评分数的置信区间,
则在matlab 中执行以下命令
[h, sig, ci ] = ttest (z, 80.09)
可求出其置信区间为(77.9457,82.2343),h=0,sig=1。

4.13模模型型型的的的求求求解解
由h=0,sig=1,可知均值是合理的。

因此可得甲,乙,丙三位老师缺失的分数分别 为77,80,80.
4.2问题二 4.2.1问题分析
通常情况下,录取顺序是按平均值进行排序得到的,本文方案就是采用平均值方法排序 法,第二标准即是行方差。

4.2.2方案:运用数理及统计知识
(1)对101个参赛队的成绩进行统计及建立Excel 表格,求出各队成绩的平均值(见附录1)(即 把五位老师给的分数加起来求以5,数学表达式:
ςj = 1 ∑5
βij (j=1,2,3...101)
5
i =1
用excel 对表格中平均值这列进行降序排列,取第一排序指标为平均值,如果某些参赛者平均 值相同就以方差(按升序排列)为第二排序指标,因为如果均值相同,五位专家的评分波动很 大的话,就说明该应聘者录用与否有很大争议,所以应取方差较小的应聘者。

依照此标准,可 以确定录用的顺序(见附录2)。

(2)根据上述排列好的excel 表格,观察并确定参赛者所获得的奖项。

如果出现两队或两队以 上的参赛者的平均值相等(含近似相等,小数点后忽略,不做统计参考),比较他们的方差,取 方差小的参赛者,排在前面,最后再重新排列参赛者顺序。

方差公式:δ2 = 1 ∑5
(βij − ξj )2 j
5
i =1
(3) 老师可能会因为有些客观原因导致一些高分和低分,为了公平起见,去掉参赛人员的最高 分和最低分,再求其平均值。

又因为评委的评分标准不同,我们需要根据数据算出各评委的评 分权重,再将参赛者的成绩加权平均后再进行排序,从而确定参赛者的奖项。

∑5 j 5
∑5
4.2.3模型的建立
设分别为五位评阅老师给的平均值,数学表达式为:
a i = 1
∑101
101
j =1 βij (i=1,2,3…5;j=1,2,3…101)(式
4-2-3-1)
设为各位阅卷老师的打分的权重,数学表达式为:
b =
a j
(k=1,2,3…5;j=1,2,3…5) (式4-2-3-2)
k =1 a k
参赛者的加权平均分为:
c i =
k =1
βij b j
(i=1,2,3…101;j=1,2,3…5) (式4-2-3-3)
参赛者的成绩顺序根据参赛者的加权平均分进行排序,从而确定参赛者所获得的奖项。

4.2.4模型求解
1. 用excel 表格进行求各位评阅老师的评分的平均值(附录1)
2. 用matlab 软件进行编程求出各位老师的权重(见附录2)
3. 将上述数据带入(式4-2-3-3)中得到各参赛队的加权平均分并进行排序(如下表格所 示)
4.3问题三
4.3.1问题分析
该问题要求我们对五位老师给各个组的所有评分进行分析比较,给出哪位老师的打分比较严格,哪位专家打分比较宽松。

易知,对于不同的组,打分严格的老师对优劣比较分明,于是打出的分数也会波动比较大;反之,打分宽松的专家则给予每个组的分数波动较小。

而波动程度大小的比较可以通过分别统计高、低分段的人数来观察出,高、低分段人数都多的则打分严格,只有高分段或低分段人数多或者高、低分段人数都较少的则打分宽松。

但考虑到这样做的误差可能比较大。

所以又采取计算其样本方差,通过其值比较大小来验证上面所得结论(方差越大,波动程度越大)。

4.3.2模型建立
(1) 由于所有的评分都处于[50,100]之内,所以,我们可以取[50,60]为低分段,[90,100]为高
分段。

(2) 设X是一个随机变量,若E[(X −EX)2]存在,则称E[(X −EX)2]为X的方差,记为
DX或V ar(X)。

即DX = E[(X −EX)2]称为方差,即用来衡量一组数据的离散程度的统计量。

方差刻画了随机变量的取值对于其数学期望的离散程度。

(方差越大,离散程度越大;反之则越小).若X 的取值比较集中,则方差DX较小;若X的取值比较分散,则方差DX较大。

因此,DX 是刻画X 取值分散程度的一个量,它是衡量取值分散程度的一个尺度。

换而言之,方差就是和中心偏离的程度。

用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差,记作DX。

在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定。

方差的值的计算公式:
D X j=1∑
(x ij−x¯j)(i=1,2,...101;j=1,2,...5;N=101)
N i 其中:
4.3.3模型求解解
x¯j=

i
x ij
N
, N = 101
figure4 甲老师给各组的分数的分布图
figure5 乙老师给各组的分数的分布图
figure6 丙老师给各组的分数的分布图
figure7 丁老师给各组的分数的分布图
figure8 戊老师给各组的分数的分布图
根据上面的图4-3-3-1图4-3-3-5得出各老师给出的评分的高、低分段的分布表如下表:
表4-3-3-1
由表4-3-3-1得出打分最严格的是甲老师,最宽松的是丙老师,乙老师、丁老师、戊老师打分方式相对甲老师、丙老师而言较为居中。

但是在理论上这样的结论说服力不够,所以再将数据代入方差的值和均值的计算方程,得出结果如下表:
表4-3-3-2
由表4-3-3-2中数据看出,甲老师给出的评分的方差最大,丙老师给出的评分的方差最小,而乙老师、丁老师和戊老师给出的评分的方差则居前两者之间。

所以得出结论如下:甲老师打分比较严格,丙老师打分比较宽松。

4.4问题四的分析与求解
由于还会对一部分平均分在80分以上的参赛队进行复评,运用excel对所有参赛队的平均分进行排名,详见附表一可以发现平均分在80分以上的参赛队有22队,但是名额只有15个。

由于每位老师的打分习惯不同所以如果只是按平均分排名取前15名参赛队的话就不太公正,所以对平均分在80 分以上的参赛队的加权平均分和方差进行排名取其前15名,运用excel对其排名(如下表所示)
这可知有复评资格的参赛队为39,51,47,66,87,91,64,69,100,86,82,77,97,101,98这十五个队。

五、模型的建立和求解
5.1优点
1. 在问题一中,利用统计学的方法对甲,乙,丙三位老师所评分数进行正态性分布检验,
并检验了均值的置信区域,增加了结果的可靠性。

2. 在问题二中,由于考虑到每位老师的打分习惯不同,则给每个参赛队的分数存在一定的
差异。

所以没有采用平均值排名的方法,而是采用加权平均的方法进行排名,使得结果更公正公平。

3. 在问题四中,在加权平均的基础上还增加了行方差的排名,考虑到更多的因素。

5.2缺点:
1. 在问题一中采用均值的方法,只是考虑到了该老师的整体打分情况,而没有针对该缺失
分数的参赛队的实际情况,使得结果比较保守。

2. 在问题三中只是考虑到了方差的比较,没有考虑到其他的一些因素。

3. 对于一些存在误差的结果没有给出误差分析。

参考文献
[1] 戴朝寿编著,《数理统计简明教程》.北京:高等教育出版社,2009.
[2] 姜启源谢金星叶俊编著,《数学模型》.[M]第四版. 北京:高等教育出版社,2011
[3] 司守奎孙玺菁编著,《数学建模算法与应用》.[M]. 北京:国防工业出版社,2011.
附录一
附录二
21 文章题目:数学建模竞赛成绩的评定
附录三
a1=76.55446 ;a2=79.86139; a3=80.08911;a4= 79.26733 ;a5=79.9802; s=a1+a2+a3+a4+a5 s =
395.752
5
>>b1=a1/s
b1 =
0.1934
>> b2=a2/s
b2 =
0.2018
>>b3=a3/s
b3 =
0.2024
>> b4=a4/s
b4 =
0.2003
>> b5=a5/s
b5 =
0.2021
22。

相关文档
最新文档