数据挖掘在学生成绩管理中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据挖掘在学生成绩管理中的应用
作者:史凤波
来源:《数字技术与应用》2017年第10期
摘要:在数据挖掘中,应用关联规则可以挖掘一个事物和其它事物之间存在的相关性。本文使用“基于布尔矩阵的Apriori算法”来分析课程之间的相互关联,进而为教务管理者提供准确的决策支持。
关键词:数据挖掘;关联规则;Apriori algorithm
中图分类号:TP311.13 文献标识码:A 文章编号:1007-9416(2017)10-0099-02
2 使用关联规则对学生成绩进行分析
2.1 确定挖掘对象和目标
本应用的目标是根据学生的期末考试成绩,分析这些课程之间的相关性,发现类似“高等数学成绩优秀进而C语言成绩优秀”这样的关系。从而指导教务管理者安排教学计划[3]。
2.2 数据准备
(1)数据选择。是根据所确定的挖掘对象和目标,选择相关的数据,形成目标数据。(2)数据预处理。取自不同系统的目标数据在类型、度量等很多方面可能存在差异。其主要工作是对噪声数据、不完整数据、不一致数据进行再处理。(3)数据变换。是为课程的不同等级设置相应的代码,这里用x1、x2、x3、x4、x5分别表示Photoshop平面设计的成绩优秀、良好、中等、及格、不及格。同样y1、y2、y3、y4、y5表示网页制作的成绩等级,z1、z2、z3、z4表示多媒体课件制作的成绩等级。应用相应代码将数据转为事务数据库。
首先将连续的数值型数据转换为布尔型数据,以适合数据挖掘的需要。用相应代码将连续型数据转换成布尔型数据。转换后部分数据描述如图1所示。
2.3 数据挖掘
这里用改进的、基于布尔矩阵的Apriori算法进行挖掘。
(1)产生频繁项集。设最小支持度为0.06,通过对处理后的布尔矩阵数据进行计算,得到结果如图2所示。
(2)生成关联规则。在第一步找出频繁项集的基础上就可以产生关联规则了。
如果设最小置信度为0.06,则可输出以下的关联规则,如表1所示。
2.4 结果评估与知识整合
从产生的关联规则可以看到,三门课程之间存在着一定的联系:规则1:《网页制作》、《Photoshop 平面设计》两门成绩都在90分以上的同学,《多媒体课件制作》成绩为90分的可能性是63%。规则2:《网页制作》成绩在80到90分之间,《Photoshop 平面设计》成绩在90分以上的同学,《多媒体课件制作》成绩在80分到90分之间的的可能性是79.5%。规则3:《网页制作》成绩在70到80分之间,《Photoshop 平面设计》成绩在90分以上的同学,《多媒体课件制作》成绩在80分到90分之间的的可能性是76.5%。
通过以上规则可以看到,《网页制作》、《Photoshop 平面设计》这两门课程对《多媒体课件制作》课程是有一定的影响的。所以,应先开设《网页制作》、《Photoshop 平面设计》课程,再开设《多媒体课件制作》课程。
3 结语
学习是个循序渐进的过程,课程之间存在着一定的关联与前后顺序关系,课程开设的前后顺序影响着学生对知识的掌握。如果教务管理者了解课程之间的这种关系,那么,他们所做出的决策也就有了客观依据,所制定的教学计划势必能够更好地指导教学工作,进而达到提高教学质量和学生对知识的掌握效果的目的。
参考文献
[1]范明.数据挖掘导论[M].北京:人民邮电出版社,2007.
[2]陈文伟,赵新翌.数据挖掘技术[M].北京:北京工业出版社,2007.
[3]陈晓玲,李宏,张争.关联规则在学分制成绩管理中的应用[J].湖南科技学院学报,2008,(8):106-108.