正态分布在成绩分析中的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

正态分布在成绩分析中的应用
【标题】正态分布在成绩分析中的应用【作者】胡明月【关键词】正态分布,定义及性质,成绩分析,设计与实现【指导老师】林昌盛【专业】数学与应用数学
【正文】
1.引言?
在自然现象和社会现象中,大量的随机变量都服从或近似服从正态分布规律,即人们通常所讲的“中间粗两头细”.正态分布又称高斯分布,它在现实生活中用途极为广泛.正态分布是生活中一种常见的连续分布,它是以均值为中心,左右对称的钟形分布.在各种概率分布中,正态分布有着重要地位.物理学中测量同一物体的测量误差,生物学中同一种生物机体的某一量度(如:身高、体重)都近似地呈正态分布.正态分布在统计理论及应用中居中心地位,在实际生活中有些随机现象需要涉及无穷多个随机变量,这些都要用到正态分布中心极限定理以及danker不变原理的理论发展过程等方面知识.其次,在很多实际问题中都要用到正态分布的知识.在教育实践中,反映出人的能力、智力同样服从正态分布,如考试分数这种随机变量也符合正态分布.由于考试仍是目前检查教学的主要手段,因而考试成绩及其分布也就成为评价教学的重要尺度,本文就正态分布在成
绩分析中的应用作初步探讨.
2.?正态分布的定义及性质
2.1正态分布的定义
设连续型随机变量有分布密度函数
为常数,(*)
其中?,?是参数,分别表示总体的平均数与标准差,这种分布叫正态分布,记
作?.(*)
的图象被称为正态曲线.在函数(*)中,当?=0,?=1,正态总体称为标准正态总体,相应的正态曲线称为标准正态曲线.
2.2?正态曲线的性质
标准正态分布的概率密度曲线如图2-1.
图 2―1
从正态分布密度函数式(*)可见,正态曲线具有如下性质:①曲线在?轴的上方,与?轴不相交;②曲线关于直线?=?对称;③曲线在?=?时位于最高点;④当? ?时,曲线上升;当? ?时,曲线下降.并且当曲线向左、右两边无限延伸时,以?轴为渐近线,向它无限靠近;⑤当?一定时,无论?怎样变化,曲线的形状是确定的.对于不同的?,两条曲线可通过左右平移,使之重合的正态曲线称为标准正态曲线;⑥当?一定时,曲线的形状由?确定.?越大,曲线就越“矮胖”,表示总体的分布越分散;?越小,曲线越“瘦高”,表示总体的分布越集中.
3.正态分布在成绩分析中的应用
3.1由考试成绩分析教学效果的一种定量方法
考试的基本目的有两个:一是衡量考生掌握基本知识的程度;二是区分考生的不同水平和层次.要达到这两个目的,先决条件是考题出得恰当,考题太偏、太难或太易都不能得到正确的评估.如果考题适当,如何从分数的统计情况提炼出反
映教学效果的信息,从中得出进一步改进教学的措施意见,这是教育主管部门以及任课教师都很关注的课题.本文以概率统计为基础,利用数据拟合的方法从考分统计中提炼出几个数字特征,去评估教学效果(假定出题符合标准),或评价考题标准(假定学生学习情况正常).这对深化教学改革和教学管理定量化有十分积
极的意义.

一份考卷中的题目究竟怎样才能达到考试的目的,我们把这称为出题问题.根据教学大纲的要求及通用的百分制标准,大体可将考题分为四类:第一类是最基本要求的题,占分数的60%,优秀生完成所需时间约占考试时间的40%;第二类是基本要求范围的题,但需一定的灵活性,占分数的15%,优秀生时间的15%;第三类是在教学大纲范围内,但要求有一定技巧的难题,占分数的15%,优秀生时间的20%;第四类是在教学大纲范围边缘或涉及知识面较多的难题,占分数的10%,优秀生时间的25%.对上述分类标准当然还可以进一步研究.
态下考生成绩分布规律
我们假定出题基本满足上述要求,并认为考生中的多数能达到教学基本要求.通过考试将考生分出层次,分出优秀者和少数不合格者.由于考试过程是一个受到多因素干扰的随机过程,假定它是平稳的,从统计的意义上看,分布应基本上满
足正态分布规律,即
(1)
其中?表示分数,A表示的数学期望,近似地就是平均值,B是方差,是衡量考生能否拉开距离的一个数学指标,?表示考分为?的考生个数,数学上称为概率密度.分数从?到?这个分数段上考生个数的概率可由公式
(2)
计算得到.
根据教学的基本要求及上面所定的出题标准,数学期望值A应略高于75分,分布要能拉开档次,不及格率在5%以下,90分以上的优秀生在10%以内.所谓理想状态,有三个基本要求:①考题符合基本要求;②教师教学符合要求;③学生
情况正常.
在理想状态下,我们取
A=A'=77,B=B'=10 (3)根据公式(2)计算各分数段所占比例为
理想状态下考生成绩分布
这个分布基本符合我们多年教学统计的结果和多数教师的期望.考生成绩分布的
理想概率密度公式应为
(4)
考试成绩拟合出A与B
如何从考生成绩的统计中求出实际的数学期望A与方差B,在数学上称为拟合问题.设共有考生N个,?,?,.., n分别表示各考生的成绩,则实际期望值A可由
公式
? (5)近似得到.从0到100分每个分数上的人数记为
q(0),q(1),…, q(100)(6)?
显然有
(7)
方差B的最好拟合值应能使得等式
(8)
对所有的?=0,1,2,...,100都能成立.但实际上这个B存在的可能性极小,因此

(9)
(10)
最佳拟合也就是选取B0,使得函数
(11)
在B0处达到最小.一般说来难以用分析表示式求B0,由于B的取值在[0,100]之间,用优化法(如0. 618法、最速下降法等)即可找到B0.
若粗糙些,按精度为0.5的要求直接计算
J(1),J (1.5),J (2),J(2.5),…,J(100)(12)?
从中选出最小值所对应的B值即为B0.?
用所得A0与B0分析教学中的问题
将所得A0,B0同(3)式中理想的A',B'进行比较就可判断教学或学生或考题
的状况.
首先应从整体上分清是判断考题还是判断教学情况.例如若在全国统考中,各校的A0,B0值普遍不理想,则表明考题有问题;反之,若多数学校正常,某些学校特殊,则应分析特殊学校的教学原因.类似地在同一学校中也可对各班情况
进行比较.
一般地说,A0 A* =77时表明出题偏难或教学效果较差;反之则表明考题偏易或教学效果良好.如果B太小,表明考题内容太集中,学生不能拉开档次;B太大则表明学习中两极分化或出题没抓住重心.是否大体上按下述标准判定教
学效果或出题水准:
|A.一A*?|? 3,?|B.一B*| 1(13)认为是优秀.
3 |A.一A*|<6,1 |B.一B*|? 3(14)
认为基本符合要求.超出上述范围,则认为考题不当或教学效果特异,需要研究.
3.2正态分布的应用举例
正态分布在实际生活中应用
问题1 某城市从南郊某地乘公共汽车前往北区火车站有两条路线可走,第一条路线穿过市区,路线较短,但交通拥挤,所需时间(单位:分)服从正态分布N(50,102);第二条路线沿环城公路走,但交通阻塞少,所需时间服从正态分布N(60,42).(1)若只有70分钟可用,问应走哪条路线?(2)若只有65分钟可用,又应走
哪条路线?
设走第一条路线及时赶到所用时间为ξ分钟,走第二条路线及时赶到所用时间为η分钟.在70分钟内走第一条和第二条路线赶到火车站的概率分别为 P(ξ≤
70)?=φ(70-5010)?=φ(2)?=0.9772,P(ξ≤70)?=φ(70-604)?=φ
(2.5)?=0.9938,所以应走第二条路线.在65分钟内走第一条和第二条路线赶到火车站的概率分别为P(ξ≤65)?=φ(65-5010)?=φ(1.5)?=0.9332,P(η≤
65)?=φ(65-604)?=φ(1.25)?=0.8944.
所以应走第一条路线.每天都在乘车,可很少有同学留心就在这平凡的生活中竟然有这么多的数学知识,说明了数学与生活是紧密联系的,同时也告诉我们在教与学中要把知识同日常生活与实践结合起来,要让同学们养成用数学知识的良好
习惯.
正态分布在成绩分析中的应用
问题2 某中学入学考试后,语文成绩X1=65分,S1=6分;数学成绩X2=82分,S2=10分.学生A语文得71分,数学得92分,学生B语文得77分,数学得84分.若两科合在一起排名次,哪个学生应排在前边?
对于这种问题,人们一般都用两科总分来排队.那么学生A的总分163,学生B 的总分161,因而学生A应排在学生B前面.如果该校录取分数的下限为162分,则学生A被录取,而学生B没被录取.这种判断不够科学96集宁师专学报2003年也不甚合理,因而是一种错误的判断.原因是各科之间它们的原始分数的参照点与单位不同,不能直接相加求和与比较,应当先将原始分数转化为标准分数后,再合成和排队.合理的解决方法是学生A:Z1=1,Z2=1,ZA=Z1+Z2=2,学生B:Z1=2,Z2=0.2,ZB= Z1+Z2==2.2.因为ZB ZA,所以学生B排在前面,应录取学
生B,恰与原始分数的比较结果相反.
标准分数的意义在于:第一,各科标准分数之间单位相同,零点相同,因此可以将每个学生各科标准分相加求和,比较其总分的优劣.第二,标准分的大小和正负,可以反映其考分在全体考分中的位置,故又称之为相对分数.标准分数一般算到小数点后两位,且有负分,这与平常的评分形式不相一致,如使用时感到不便,还可经某种线性变换变为其它形式的标准分数.由上可知,有了标准分数,
就能正确评估学生的学习成绩了.
3.3考试系统中成绩正态分布检验的设计与实现?
随着网络教育的迅速发展,网络考试也成为研究热点,但在现有的网络考试系统中,鲜有对考试成绩、试题参数做详细分析、统计的,对成绩做正态分布检验的就更少.在网络考试系统中,因计算机强大的计算能力,可以作比较复杂的统计、
分析.
绩正态分布检验的意义
考试质量评价指标包括对试卷进行一般描述和判断的指标(如知识点覆盖率、项目构成结构合理性分析等等);对考试整体进行量化分析的指标(如成绩分布的正态性检验、考试信度指标测试、考试效度指标的测试等);对考试题目的质量分析指标(如试题难度分析、试题区分度分析等),利用这些指标,可以全面评价某一次考试,利于今后改进考试,提高考试质量.本考试系统对这些参数都进行了详细的统计、分析,这里只讨论成绩分布的正态性检验.
考试系统对考试成绩进行正态分布检验的意义主要有两点.一是系统中部分其他统计方法是建立在正态分布的基础上,二是用于对考试成绩的解释.
在考试成绩及试题参数的统计过程中,有些统计方法只适用于正态分布或近似正态分布资料,如用均数和标准差描述成绩的集中或离散情况,用正态分布法确定正常考试成绩的范围等,因此在使用这些方法前,需进行正态性检验.同时,在对考生考试成绩进行解释时,不同。

相关文档
最新文档