大数据时代区域教育信息化面临的挑战
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据时代区域教育信息化面临的挑战
近年来,以云计算、数据挖掘、移动互联网等为基础的大数据技术的出现,为教育研究带来了数据获取、存储、分析和决策等支持,技术与教育的深度融合推动了教育的变革与创新。
虽然大数据日益升温,但大数据的基本概念、特点及其要解决的核心问题,目前尚无统一认识。大数据的获取、存储、处理、分析等方面仍存在一定争议,大数据概念有过度炒作的嫌疑。本文对上述问题进行了辨析,并描述了大数据时代基础教育信息化面临的问题与挑战,最后提出了区级基础教育信息化建设的应对策略,希望为各区级教育信息化建设单位提供参考。
大数据的概念及特点
目前,大数据没有一个公认的定义,不同的定义基本都是从大数据的特征出发给出的。比如国际数据公司认为大数据应当具有价值性,大数据的价值往往呈现稀疏性的特点。IBM认为,大数据必然具有真实性。维基百科对大数据的定义为:大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集。大数据具有“4V”特点,即数据量大(Volume )、数据类型多样性(Variety)、数据处
理速度快(Velocity)和数据价值密度低(Value)。
1. 数据量大
数据规模超大,这是大数据的基本属性。数量级别从TB (1TB=1024GB)级别,跃升到PB (1PB=1024TB)、EB (1EB =1024PB)乃至ZB (1ZB =1024 EB)级别。导致数据规模激增的原因有很多,首先,随着互联网的广泛应用,使用网络的人、企业、机构增多,数据获取、分享变得相对容易。其次,各种传感器数据获取能力的大幅提升,使得人们获取的数据越来越接近原始事物本身,描述同一事物的数据量激增。再次,数据量大还体现在人们处理数据的方法和理念发生了根本的改变。在某些特定的应用领域,采样数据远不能描述整个事物,可能丢掉大量重要细节,甚至会得到完全相反的结论。因此,直接处理所有数据而不是只考虑采样数据,可以带来更高的精确性,从更多的细节来解释事物属性,同时必然使得要处理的数据量显著增多。
2. 数据类型多样
数据类型繁多、复杂多变是大数据的重要特性。在数据激增的同时,新的数据类型层出不穷,已经很难用一种或几种规定的模式来表征日趋复杂、多样的数据形式。这样的数据己经不能用传统的数据库表格来整齐地排列与表示,大数据正是在这样的背景下产生的。大数据与传统数据处理最大的不同就是,重点关注非结构化信息,大数据关注包含大量
细节信息的非结构化数据,强调小众化、体验化的特性使得传统的数据处理方式面临巨大的挑战。
3. 要求更快的数据处理速度
要求数据的快速处理,是大数据区别于传统海量数据处理的重要特性之一。包含大量或实时数据分析处理的时间要求非常短,符合1秒定律。在许多应用中要求能够实时处理新增的大量数据,大数据以数据流的形式产生、快速流动、迅速消失,且数据流量通常不是平稳的,会在某些特定的时段突然激增,数据的涌现特征明显。对于大数据应用而言,很多情况下都必须在1秒钟内形成结果,否则结果就会过时和无效。在这种情况下,要求计算机快速、持续地实时处理大数据。对不断激增的海量数据的实时处理要求,是大数据与传统海量数据处理技术的关键差别之一。
4. 数据价值密度低
数据价值密度低是大数据关注的非结构化数据的重要
属性。以视频为例,连续不间断的监控过程中,可能有用的数据仅有一两秒钟。尽管数据价值密度低,但商业价值高。
传统的数据库与大数据也有明显的区别,两者在数据来源、数据处理方式和数据思维等方面都有很大的变化。正像孟小峰所言,两者的区别就是“池塘捕鱼”和“大海捕鱼”的区别,前者代表着数据库时代的数据管理方式,后者则对应着大数据时代的数据管理方式,其在数据规模、数据类型、
数据模式、数据对象、处理工具上都有巨大的差异。
大数据要解决的核心问题
与传统海量数据的处理流程相类似,大数据的处理也包括获取与特定的应用相关的有用数据,并将数据聚合成便于存储、分析、查询的形式;分析数据的相关性,得出相关属性;采用合适的方式将数据分析的结果展示出来等过程。大数据要解决的核心问题与相应的这些步骤相关。
1. 获取有用数据
规模巨大、种类繁多、包含大量信息的数据是大数据的基础。数据本身的优劣对分析结果有很大的影响。对于实际应用来说,并不是数据越多越好。获取大量数据的目的是,尽可能正确、详尽地描述事物的属性。对于特定的应用数据,必须包含有用的信息。拥有包含足够信息的有效数据,才是大数据的关键。
2. 数据分析
数据分析是大数据处理的关键。大量的数据本身并没有实际意义,只有针对特定的应用来分析这些数据,使之转化成有用的结果,海量的数据才能发挥作用。大数据的一类重要应用是利用海量的数据,通过运算分析事物的相关性,进而预测事物的发展。现在,随着数据的不断积累,通过简单的统计学方法就可能找到数据的相关性,找到事物发展的规律,指导人们的决策。
3. 数据显示
数据显示是将数据经过分析得到的结果以可见或可读
形式输出,以方便用户获取相关信息。利用计算机图形学和图像处理的可视计算技术是大数据显示的重要手段之一。数据显示以准确、方便地向用户传递有效信息为目标,显示方法可以根据具体应用的需要来选择。
4. 实时处理数据的能力
大数据需要充分、及时地从大量复杂的数据中获取有意义的相关性,找出规律。数据处理的实时性要求是大数据区别于传统数据处理技术的重要特征之一。一般而言,传统的数据处理应用对时间的要求并不高。运行1~2天获得结果依然是可以接受的。而大数据领域相当大的一部分应用需要在1秒钟内或瞬间得到结果。
大数据时代,区级基础教育信息化面临的问题与挑战
基础教育阶段的中小学校是数据生产大户。在学校里上学的学生,从招生、学籍、成绩、考勤、选课到活动等都会产生大量的数据;教师的上课音视频、课件、实验数据等也会有庞大的数据;校务系统运行、图书馆、微博、博客等都会产生很大的数据。尤为重要的是管理和教学数据,它们是基础教育两大核心功能的重要数据来源。只有用好这些数据,才能更好地帮助教学、管理,做好招生推广、学生管理等工作。用好这些数据,无疑也将大大提高中小学校的信息化水平。