可修改数理统计课程论文.doc
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大学生考试成绩的量化分析
摘要:本文以某某大学化学化工学院2009级高等代数成绩为样本,结合概率论理论基础及统计学原理,探讨学生成绩的整理、成绩分布曲线的描绘以及怎样研究分布曲线所包含的“教”与“学”两方面的信息的方法。
关键词:正态分布频数直方图数字特征值优度检验偏度
一、引言
目前,考试仍然是高校教学过程中不可或缺的组成部分,对教与学双方而言,考试均起着检查工作成果进而评价绩效、查漏补缺的重要作用。考试是反馈教学信息,检测和评价教学质量,调控教学过程的重要手段。大学生在校期间的考试成绩可从多个层面折射出学生学习努力的程度、教师教学的效果、试卷的质量和学校教学管理水平等。
正态分布是连续随机变量概率分布的一种,对于一门课程的考核从掌握参照的角度来说,如果命题设计的合理,学生分数一般服从或近似服从正态分布。当然并不是所有考试都要求其分布为正态分布,这要根据考试的目的和性质等因素来决定。
对于大学成绩,已经不再是诸如各种竞赛性测验和择优录取的升学测验等选拔性的测验,而是一种成就测验,即合格水平测验。从而,目的在于考核学生是否达到了预定的教学目标和要求,反映了学生的学习功效。此时,不要求学生成绩呈现正态分布,反而希望学生成绩的分布能呈现负偏态分布。从学校的教育目的的角度来看,合格水平测验具有普遍意义、更重要的测验。因此,学生成绩测验呈现负偏态分布时,说明教学恰恰是成功的教学。
本文对某某大学化学化工学院2009级高等代数成绩加以统计,运用英国统计学家K.Pearson提出的2 检验方法进行了实证分析,得到合理的结论。
二、学生成绩分布直方图、成绩分布曲线
在刚得到数据时,各种数据信息是杂乱无章的,本文通过对数据进行由低到高分组分类得到各组的频数,求出各组的比例,然后编制出频数直方图,并求出数字特征。
某某大学化学化工学院2009级高等代数成绩表(百分制)
2.1数据整理
本文将所得数据采用百分制方法,按将从小到大分成了5组。利用excel软件编制累积次数表如下:
2.2 绘制频数直方图
建立以分数为横坐标,频数为纵坐标的直角坐标系,分别以组距为宽,频数为高作矩形构成分数频数直方图如下:
2.3
成绩散点图及频数趋势
用横坐标表示第几个分组,纵坐标表示该组内的频数,绘制成绩散点图级频数趋势,如下图:
2.4 数字特征
随机变量完全有它的概率分布(函数)描述,而确定其分布函数一般来说是相当麻烦的。在实际问题中,有时只需知道随机变量的某些数字特征就够了。以下是本文根据搜集的数据,利用数理统计的知识,结合计算机,分析算出的数字特征:
三、 分布拟合优度检验
3.1 正态性检验
本文将成绩总体分成5类,由上述数据整理可以得出每类情况出现的频率。记i A 为对该总体进行的分类,()j P A 为各种情况出现的频率,i P 为各种情况出现的概率。
原假设0H :()j P A =i P ,i =1,2,3,4,5 其中i P ≥0,且i P 之和等于1. 被择假设1H :()j P A =i P 等式不完全成立
2χ=()
2
1
k
i i i i
n np np =-∑
若在0H 成立时对充分大的n ,检验统计量2χ近似服从自由度为1k -的2χ分布。由于统计量2χ度量的是观测频数i n 与理论频数i np 的偏离程度,2χ值大,表示偏离的程度大,偏离的程度越大越倾向于拒绝原假设0H 。对给定的显著水平α(0<α<1),该检验的拒绝域为:
W ={2χ≥21αχ-(1)k -}
本文用搜集的108个数据作为容量为108的样本的一个样本值,设:
0H :2009级高等代数成绩服从N ( 65.97335.36),
1H :2009级高等代数成绩不服从N ( 65.97335.36),
由2χ-拟合优度检验法的要求,将实数轴分成5个不相交的区间: [)0,20,
[)20,40,[)40,60 ,[)60,80 ,[]80,100
如前面数据整理所述。用()F x 表示N ( 65.97,335.36)的分布函数,P 表示在
0H 为真的条件下数据落入个区间的理论概率,即公式中的i p :
1P =F ()20=Φ()2.5103-≈0.006
2P =F ()40-F ()20=Φ()1.4181--Φ()2.5103-≈0.0718 3P =F ()60-F ()40=Φ()0.3260--Φ()1.4181-≈0.2929 4P =F ()80-F ()60=Φ()0.7661-Φ()0.3260-≈0.4087 5P =F ()100-F ()80=Φ()1.8583-Φ()0.7661≈0.1892
本文取置信水平α=0.05,用Pearson 检验方法验证本文所收集的某某大学化学化工学院2009级高等代数成绩是否服从正态分布。将上述数据代入公式得:
()
2
5
21
i i i i
n np np χ=-=≈∑
11.54
由于区间数m 5=,未知参数2l =,故自由度为12m l --=。 经过查表,
可以得出20.95χ2()=5.9915。由于2χ>20.95χ2()
,在拒绝域内,故应该拒绝原假设,即某某大学化学化工学院2009级高等代数成绩不服从正态分布。
3.2 检验的p 值
假设检验的结论通常是简单的,在给定的显著水平下,不拒绝原假设就是保留原假设。然而有时也会出现这样的情况:在一个较大的显著水平(比如
α=0.05)下得到拒绝原假设的结论,而在一个较小的显著水平(比如α=0.01)
下却回到相反的结论。
因此引进检验的p 值得概念有明显的好处。第一、它比较客观,避免了事先确定的显著水平;其次,有检验的p 值与人们心目中的显著性水平α进行比较可以很容易做出检验的结论:
如果α≥p ,则在显著水平α下拒绝原假设0H ; 如果α
这个p 值反映了数据与假设的分布拟合程度的高度,p 值越大,拟合越好。 本文中,以T 记服从()22χ的随机变量,则使用统计软件可以算出:
{}11.540.178717309p P T =>=
由上述结果可以看出,p 值相对于α较大,故拟合得较好。
四、 结论
1、运用正态分布科学地分析学生的成绩是一项重要意义的工作,是高校教学过程控制的一个重要环节,是衡量教学效果、保证教学质量的重要手段。成绩