教育大数据的实际应用及部分数据处理过程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
教育大数据的实际应用及部分数据处理过程(1)MOOC的蓬勃发展。MOOC是Massive(大规模的)、Open(开放的)、Online(在线的)、Course(课程)四个英文单词的首字缩写,意为大规模网络开放课程。2006年,萨尔曼·可汗(SalmanKhan)创办了利用在线视频进行免费授课的可汗学院,现有关于数学、历史、金融、物理、化学、生物、天文学等科目的3400多段视频,注册用户超过了1000万人。2011年,斯坦福大学的一门人工智能网上课程吸引了190多个国家的16万名学生参加学习,该课程的讲授者塞巴斯蒂安·特伦(Sebastian Thrun)教授创办了在线教育网站Udacity。2012年,盈利性在线大学教育平台Coursera上线,和普林斯顿大学、斯坦福大学、密歇根大学和宾夕法尼亚大学等83所大学协同提供课程,目前在全球拥有380万的注册用户。同年,哈佛大学与麻省理工学院宣布结成非营利性合作伙伴关系,联合发起了名为“edX”的网上课程系统,联手提供免费的在线课程,搭建共同教育平台,包括清华大学、北京大学在内的其他26所全球名校也相继加入了这一平台。互联网技术的发展带动了教育的网络化和国际化,MOOC更将传统的远程教育推向了新的高度和广度,催动了网络学习时代的到来。在教育活动中,相对于通过师生面对面的接触获取教育数据的途径而言,基于大型网络课程平台进行数据挖掘的方式显然有效得多:学习行为的数据将自动留存,更易于后期的学习行为评价和评估;教师只需通过分析整合学习行为就能得到学习过程中的规律;利用数据挖掘的关联分析和演变分析等功能,在学生管理数据库中挖掘有价值的数据,分析学生的日常行为,可得知各种行为活动之间的内在联系,并提出相应的对策。
(2)个性化课程分析。佛罗里达州立大学利用eAdvisor程序为学生推荐课程和跟踪其课业表现。奥斯汀佩伊州立大学的“学位罗盘(Degree Compass)”系统在学生注册课程前,通过机器人顾问评估个人情况,并向其推荐他们可能取得优秀学业表现的课程。系统首先获取某个学生以前(高中或大学)的学业表现,然后从已毕业学生的成绩库中找到与之成绩相似的学生,分析以前的成绩和待选课程表现之间的相关性、结合某专业的要求和学生能够完成的课程进行分析、利用这些信息预测学生未来在课程中可能取得的成绩,最后综合考量预测的学生成绩和各门课程的重要性,为学生推荐一个专业课程的清单。
(3)辍学行为的预测。美国西部州际高等教育委员会(Western Interstate Commission for Higher Education,简称WICHE)以凤凰城大学和里奥萨拉多学院等6所学校的64万名学生为对象,建立了一个教育数据库。该数据库可以记录3百万条课程信息,进行33个针对在线课程的变量分析。当一些与辍学行为有关的关键因素(如旷课、纪律问题、课堂表现)发生变化时,系统会向校方发出预警。里奥萨拉多学院有43000名接受在线学习的学生,学院的预警系统允许教师看到代表学生行为的红、黄、绿色指示灯,并根据学生的在线互动行为评估其表现,如阅读教科书和回应教师要求的频率。
(4)助学需求的预测。华东师范大学的“家庭经济困难学生预警系统”通过收集校园卡的记录进行分析测算,向可能存在经济困难的学生发送询问短信。系统具体的做法是:跟踪学生的校园卡,对全校本科生周一到周四的中、晚餐消费值进行统计,分别计算出男女同学的平均消费值,乘以0.6的系数,得出预警消费线。如经系统筛选发现就餐消费明显偏低,学校勤工助学中心在对比分析学生入学时填写的资料后,会主动向学生发出短信以征询情况,同时也会通过院系教师做进一步了解,以判定学生是否真的面临家庭困难,需要帮助。
(5)学术研究趋势的把握。斯坦福大学的文学实验室正在进行一项研究,尝试以通过谷歌图书计划放置在互联网上的海量书籍为平台,进行数据挖掘和分析,把握和预测文学作品和学术研究的发展趋势。斯坦福的英语教授马修·L·乔卡斯(Matthew L. Jockers)在一堂课上布置了内容涵盖1200篇小说的作业。学生要完成的并不是逐篇阅读,而是通过计算机程序来研究文学风格、观点、语言和文化的演变。人文学科,无论是历史、文学还是语言研究,只要是聚焦于书本的,都可以用这个思维来进行研究。
(6)其他实践。美国的房产网站TRULIA将房产信息、税收信息、犯罪信息、学区信息、学校政府评价、社会评论集成在一起,美国几乎任何一个学校和学区的情况都可以在这一数据基础上通过可视化技术直观地展现在人们眼前;有研究指出,[9]教育大数据还可以用于分析合作学习小组中的强、弱方,促进学习任务的合理分配;教育机构还能从大数据中看到是否将教育款项恰当地拨到了需要的地方。
(7)教育数据挖掘。早期的教育数据挖掘主要是网站日志数据的挖掘,现在新的计算机技术支持的交互式学习方法和工具(智能辅导系统、仿真、游戏),为量化和收集学生行为数据带来了新的机会。特别是更加集成、更加模块化和更加复杂化的在线学习系统提供了更多类型的数据,其中包含了数据挖掘算法需要的许多变量。教育数据挖掘能发现这些数据中的模式和规律,探索建立预测模型,让我们重新发现和预测学生如何学习。例如,过去对在线课程的评价主要通过课程结束时的学生问卷来评价,Hung, J. L.等(2012)开发了一种在线课程评价方法,通过分析一个学生K-12在线课程的学生学习日志,一共有7539名学生在883门注册课程中23854527 份学习日志,结合学生人口特征数据、课程结束时对学生开展的课程评价问卷调查,对学生进行分类,发现高危学生和高表现的特征,预测学生的成绩,并研究学生表现和对课程满意度的关系。
(8)学习分析主要涉及学业分析、行为分析和预测分析的研究和应用。《简介》采纳了Johnson et al(2011)对学习分析的定义,指的是对学生学习过程中产生的大量数据进行解释,目的是评估学业进步、预测未来表现、发现潜在问题。数据来自学生的显性行为,如完成作业和参加考试;还有学生的隐性行为,如在线社交,课外活动,论坛发帖,以及其他一些不直接作为学生教育进步评价的活动。学习分析模型处理和显示的数据帮助教师和学校更好地理解教与学。学习分析的目标是使教师和学校创造适合每个学生需要和能力的教育机会。学习分析技术对于学生、教师、管理人员、研究人员以及技术开发人员均具有重要价值。对于学生而言,可以从学习者行为角度了解学习过程的发生机制,并用来优化学习,以基于学习行为数据的分析为学习者推荐学习轨迹,开展适应性学习、自我导向学习。对于教师和管理人员而言,可以用来评估课程和机构,以改善现有的学校考核方式,并提供更为深入的教学分析,以便教师在数据分析基础上为学生提供更有针对性的教学干预。对于研究人员而言,可以作为研究学生个性化学习的工具和研究网络学习过程和效用的工具。对于技术开发人员而言,可以优化学习管理系统。
(9)数字校园。数字校园的建设大大推动了学校管理的数字化和网络化,办公自动化系统、资产管理系统、教务管理系统、科研管理系统等各种应用系统为教育管理数据的实时采集和深度挖掘提供了条件。目前,国内已有一些高校率