基于大数据的学生个人图谱设计概论
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于大数据的学生个人图谱设计概论
摘要随着社会经济的飞速发展,高校智慧化管理越来越受到重视;大学生个人图谱是一款服务于学生管理、教学指导与领导决策的大数据系统。该系统利用大数据技术,以学生在校期间的各类学习生活数据为基础,围绕学生日常生活、学习成绩和就业等具体问题,刻画学生多维度画像,帮助管理人员全面认识每一个学生,精确定位关注的学生群体,进行精细化管理。本文主要是将大学在校生的各方面数据整理融合后画出大学生个人图谱,然后再将数据进行关联分析[1],可分析出迟到或缺课、挂科预警、贫困生判断、疑似不在校、学生关系图等多个模型以提高学校对学生的管理和帮助。
关键词个人图谱;大数据技术;精细化管理;关联分析;挂科预警;贫困生判定
前言
教育一直是国家和社会最关注的领域,尤其希望高校培养出优秀的人才为国家做贡献,这就需要高校对学生的精细化管理。学习上,教务处需要进行学生成绩统计,比如学生动态的成绩分析,包括学生平均成绩,所在专业,年级,班级的绝对名次,以及相对名次,(统一学生前后期成绩关系?),成绩预警报警等。针对不同的课程可按年级、专业分类的每门课程平均分,如2017级XX专业高等数学课程的平均分,并可根据条件进行横比(各个专业高等数学课程平均分相比较)与纵比(同专业不同年级比较);不同类别学院对同一公共课程的修读情况分析,并进行连续几年的线性分析;部分前期基础课程与后期专业课程成绩分析,如前期的甲课程分数高低对后期的乙课程成绩的影响。生活上,一卡通的消费分析,运用灵活的走势图来展示学生的消费数据统计走势。
1 现状
我国对大数据的应用研究有很多,例如网易云音乐可根据用户的听歌习惯与喜好推送给他们想要的歌曲,淘宝也是记录了消费者的购物行为数据,通过大数据技术推送给不同的用户所感兴趣的商品。但在教育教学方面,大数据的应用研究还不够,尤其是研究的人员相对来说很少,采集的数据很少且分散于学校各个部门,各部门数据并没有彼此分享,这样就无法全面并且客观地分析学生的个人画像。因此,利用大数据技术去构建学生的个人图谱,通过该技术对收集的数据进行深度挖掘分析,使得对学生教育方面更加科学有效化。
北京交通大学的曾志宏等人提出了基于大数据的高校个性化画像教学模型构建研究[2],利用大数据分析原理,从用4个步骤进行高校个性化画像教学模型构建,即个性化画像信息标签收集、大数据分析建模、画像构建及教学应用等。最近几年,英国和美国等国家的高等教育,已经有相关研究人员通过学生在线阅读文章、在线浏览视频、访问图书馆等记录利用大数据技术进行学习提前预警机制和及时的干预指导,进而完善教学方式、提高学习效率,比如美国哈佛大学等
推出的大数据学习分析EDX平台[3]。构建基于大数据的学生个人图谱是高校实现学生管理、教学指导与领导决策的一种极具希望的方法。
2 个人图谱的基本实现原理
2.1 大数据平台分析构建
我们对学生成绩、校园卡等数据源的大量数据进行采集、整合与存储、建模,将分析得到的结果用于指导学生管理、领导决策和教学指导。平台构建首先第一步是数据采集,从学校的网络中心和教务系统获取各个学生校园卡的使用信息以及学生的学习成绩;然后将获取的信息进行清洗与整合,构建实时分布式数据库,以excel表的形式导入数据库[4];最后对数据进行关联分析,构建数据分析模型,将校园数据可视化展示。
2.2 数据分析模型构建
大数据平台[5]包含学生成绩信息、学生校园餐饮消费、图书馆借阅记录和宿舍门禁记录等,通过这些数据,结合学生基本信息和学校管理信息(即奖惩助贷等数据信息),构建数据分析模型,进而形成个人生活数字图像[6]。具体构建步骤如下:
(1)数据输入。输入学生信息、消费行为、图书馆行为等。
(2)事實标签。将输入的数据进行清洗、结构化和统计建模,得到学生信息,消费情况和借书情况等。
(3)模型预测。通过机器学习建模,可以得出学生贫困生属性、消费能力和借书属性等。
(4)业务应用。把前面得到的学生各个方面属性通过业务规则[7]建模,即通过计算机的0或1判断它是否符合此业务,判断是1的为符合,0是不符合;这里的业务包括不在校预警、挂科预警、精准扶贫等。
2.3 部分个人图谱展示
该图展示了学生甲在校的整体情况;从专业成绩分布图可看出,该生专业成绩基本上都在专业平均成绩以下,可得出他的学习成绩并不是很好;从一卡通使用图可看出,该生每月的消费都很高,基本上都在平均线以上,可看出他并不是贫困生,但第八学期却非常低,可分析出他不在校或者出去实习了等。
3 结束语
高校教育信息包含从学生的生活起居到课堂学习的各个方面,所以业务系统很多;但各部门之间又因为其业务的独立性,彼此并未过多的关联在一起,这样
就无法发挥数据的综合优势。从我校的信息系统建设和数据堆积实际状况出发,构建了基于大学在校生成绩数据、图书借阅数据、校园卡数据的大数据分析平台,整合了校内各相关业务系分析出迟到或缺课、知识储备、贫困生判断、疑似不在校、学生关系图等多个模型以提高学校对学生的管理和帮统,解决信息孤岛问题,实现数据共享。目前学校信息系统中数据依然存在“脏数据”问题,有很多无用的数据大量存在,需要再次进行清洗。更多数据的汇集为满足数据分析和挖掘的要求,对各系统数据源要进行仔细的质量监督,并进一步完善数据标准。
今后还将逐步收集更多维度的数据来增加数据的完整性,起到更好的分析、预测作用,大学生个人图谱也能给用人单位提供全面客观地学生信息。
参考文献
[1] 刘钰.河北北方学院学生成绩关联分析及预测[D].天津:天津大学,2012.
[2] 曾志宏,陈振武,黄婷.居于大数据的高校个性化画像教学模型构建研究[J].赤峰学院学报(自然科学报),2016,32(20):233-235.
[3] Anthony G.Picciano.The Evolution of Big Data and Learning Analytics in American Higher Education [J].Journal of Asynchronous Learning Networks,2012,16(3):9-20.
[4] 吴嵘.基于PowerDesigner的数据库设计与建模[J].电脑知识与技术,2009,5(29):8113-8115.
[5] 费仕忆.Hadoop大数据平台与传统数据仓库的协作研究[D].上海:东华大学,2014.
[6] 高志鹏,牛琨,刘杰.面向大数据的分析技术[J].北京邮电大学学报,2015,38(3):1-12.
[7] 吴中伟.基于业务规则的流程建模方法研究[D].昆明:云南大学,2011.