教育大数据应用中存在的问题、原因及对策

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

教育大数据应用中存在的问题、原因及对策作者:卢文青秦志永

来源:《中国教育技术装备》2017年第17期

摘要目前在教育大数据应用过程中仍存在数据共享障碍、数据体系混杂、数据挖掘难度大、数据安全与隐私缺乏监管以及数据结论存在缺陷等问题,针对问题进行深入分析,并在数据共享、数据挖掘、数据标准体系构建、数据服务、数据管理等方面提出对策建议。

关键词教育大数据;教育信息化;数据挖掘;数据管理

中图分类号:G630 文献标识码:B

文章编号:1671-489X(2017)17-0078-03

1 前言

教育大数据是整个教育活动过程中所产生的以及根据教育需要采集到的一切用于教育发展并可创造巨大潜在价值的数据集合[1]。借助于教育大数据分析,可有效促进教育教学发展,在个性化教学环境定制、提升教学水平、优化教学质量等方面具有积极意义。但亦应指出的是,大数据虽然带来思维方式的巨大变革,但是也可能成为一种过度膨胀的力量,使教育管理者寄希望于大数据能够解决教育领域的诸多问题。教育是培养人的过程,具有复杂性、公益性的特征。这一方面要求大数据的质量不断提高,另一方面在认识上应明确大数据不能代替丰富、动态、变化的教育教学实践活动,它仅是一种实践的指导,使实践更具理性化的特征。因此,如何基于实践的观点认识大数据,如何正确认识大数据,提升数据质量,如何利用教育大数据更好地服务于教育,是摆在教育工作者面前亟待解决的问题。

2 教育大数据应用过程中面临的主要问题及原因

数据共享存在障碍大数据相信全量数据,通过分析几乎全样本的数据来思考和分析问题。从抽样中得到的结论总是有水分的,而全部样本中得到的结论水分就很少,数据量越大,真实性也就越大。然而各地学校之间教育信息化基础设施环境的建设往往各具特色,互不兼容,限制了数据的共享,使得“数据孤岛”成为制约教育大数据发展的瓶颈。

数据体系混杂出于计量的需要,总是习惯于把教育分解,然而分解后的数据指标体系所描述的属性特征并不保证是教育的真实再现。由于缺乏标准的数据体系,各学校对数据指标的性质差异以及数值差异所表示的实际意义存在认识上的分歧,各学校都倾向于强化本校数值较高的指标在综合分析中的作用,相对削弱数值水平较低的指标的作用,导致在数据收集和分析时存在指标各异、标准不同、口径不一的情况。

教育大数据既包括常规的结构化数据(如成绩、学籍、就业率、出勤记录等),也包括海量难以分析的非结构化数据(如图片、视频、教学软件、学习游戏等)。不仅结构复杂,而且在收集数据的过程中因为操作系统以及版本的不同,数据收集的结果可能会存在多份的情况,造成不必要的数据冗余。另外,由于数据的真实性无法全部保证,数据中还可能存在许多的“伪数据”。

由此可知,数据体系的混杂不仅增加了数据收集的难度,而且削弱了数据整合的价值。

数据挖掘难度大教育大数据的价值就在于数据挖掘,没经过挖掘的大数据只是没有开采出来的原油,不具有实用价值,而数据挖掘就是通过算法模型搜索隐藏于其中的信息的过程。教育大数据中的非结构化数据将越来越占据主导地位,但是要把视频和图片等转换成有用的数据信息,则必须首先定义视频或图片等的价值。大数据时代信息分析的难点就在于对海量的非结构化数据的分析,而在此领域的研究尚不成熟。

在海量、复杂、多维的数据中去挖掘数据之间的相关性,使用的数据越多,分析的难度越大,则讨论、分析、争议的时间、人力、财力等成本也会相应提高。而采用的数据过少,则又不能充分认识教育过程的本质。因此,数据挖掘的算法模型很重要,但是创建模型的人经常不清楚建模依据的历史数据在未来是否稳定,而使用模型的人也不知道整个数据模型的加工过程;创建模型的人可能不知道此种模型效果好不好,而使用模型的人也不知道该怎么去反馈使用的结果[2]。这样一来,信息不对称现象严重,影响了算法模型的质量优化。

数据挖掘的本质就是还原。虽然好的数据模型是一种有益的提炼,但有时候也会因为缺少场景数据的支持,在某种程度上造成信息的歪曲。事实表明,一些不易收集的量更直接影响人的行为,如健康、情绪、性格、兴趣、习惯等。缺少了这些背景数据的支持,数据分析的结果可能会失真,甚至与事实大相径庭。

数据安全与隐私亟待有效监管教育大数据收集了各种来源、各种类型的数据,其中也包含很多和用户隐私相关的信息。由于国家在教育大数据方面并没有出台相应的法律法规,保护不当可能会带来严重的安全风险。在大数据时代,个体面临的威胁并不仅限于个人的隐私泄露,还在于基于大数据对人们状态和行为的预测,而这种隐性的数据暴露往往是个人无法预知和控制的。如通过分析学生关于阅读的历史纪录,得到学生的爱好、兴趣倾向等信息。

教育是塑造人的过程,而这种重塑是建立在社会的遗忘机制之上的。因为有了随时间模糊的遗忘机制,个体才能够不停地在记忆中构建和重构自己的过去,进而接受不断发展的自我与别人,才有能力从过去的经历中吸取教训,并调整自身的行为以融入未来的社会[3]。由于数字化记忆缺少人类记忆中自主遗忘的功能,因此,完善的数字化记忆带来的寒蝉效应(指用户害怕自己的言行遭到指责或者惩罚,不敢发表言论,如同蝉在寒冷天气中噤声一般)可能会改变或约束学生的行为,进而影响学生的健康成长。

数据结论存在缺陷虽然在教育实践中运用数据指标来评价教育并不一定是最好的方式,但也是必然要选择的方式,因为无计量则无管理。由于教育中人的性格、美感、道德、价值观等方面难以量化的现实,造成对教育指标体系的“简单化”处理。换言之,在实践中利用某些数据(如成绩)指标,并不是因为最有价值,而是最易计量。

数据分析的结论具有导向作用,由于数据体系的不完整以及算法模型的不完美,管理者的决策空间就会相应地受到挤压。虽然数据结论有一定的片面性,但是数据结论赋予管理策略合理性,加剧了学校对成绩的关注而忽略了人文精神的培养。简单的教育培养了简单的学生:专制、占有欲强、缺乏审美情趣和道德感、自制力缺乏、攀比心太强……凡此种种,都是“简单人格”的写照,而在教育的轮回中,又在不断复制并加剧这种“简单化”。由此可见,数据结论的缺陷不仅反映了计量的必要性与科学性之间产生了矛盾,也体现了教育目标的长远性与计量的短视性之间的矛盾。

在数据结论的表达方面,许多的数据结论虽然是正确的,但相对于非统计专业的学校管理者来讲,要么晦涩难懂,要么枯燥乏味,缺乏高效的数据表达方式,降低了信息传递和沟通的质量。

3 教育大数据应用过程中的对策

针对教育大数据应用过程中存在的问题,提出以下对策。

互联互通是基础统筹建设信息化基础设施和应用环境,达到高速可用、安全可靠、可信共享、泛在开放的水平,推动各级各类学校逐步优化教育信息化基础应用环境,完善信息化设施配备,提升网络保障能力。以可持续发展的教育信息化应用环境为基础,构建省市级教育大数据平台,促进各级各类学校数据共享,实现数据的统一开放、实时分析,破除“数据孤岛”,推动教育大数据建设。

标准的数据指标体系是根本国家正在推行学生的“终身一人一号”统一学籍信息管理制度,各项数据都有了身份标签,为持续性记录每个学生的学业表现与全面发展情况提供制度保障。在数据指标体系方面,需要加强基础设计,制定与国家教育信息化标准相衔接的统一的标准与规范,涉及数据的收集、分析与管理等方面,涵盖基础标准、数据处理标准、数据安全标准、数据质量标准、数据服务标准等。只有确保标准的一致性和权威性,才能在统一的大数据平台内统筹梳理数据来源和流向,集中管理各类基础数据,确保数据完整、可用、可整合,实现教育大数据的快速抽取、统一共享、及时挖掘。

人才与技术是关键大数据时代课堂变得无处不在,如翻转课堂的引入、数字校园的流行、云课堂的设想……课堂将不再是单一和被动的模式化、固态化的传统课堂。课堂既可以是校内的,也可以是校外的;既可以是现场的,也可以是网络的,课堂空间被无限拓宽,课堂形式变得自由多元[4]。在动态变换的场景下面向多版本、多操作系统收集教育数据,定义非结

相关文档
最新文档