大学云架构与大数据处理建模研究.doc

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大学云架构与大数据处理建模研究-

摘要:本文简要介绍了大学云架构与大数据处理的目的与意义。以山西师大园区云为例,概要介绍了大学云架构的方法,提出了一种支持大数据处理的校园云模型。重点讨论校园大数据处理建模,大数据分析在学生成长、教师发展,以及提升学校服务能力等方面的作用。

关键词:云计算;大数据;学生成长;教师发展;智慧校园

一、引言

大学云(Universities Cloud)是一种采用云计算技术,对教学、科研、行政、后勤等各种业务流程办理和职能服务的园区云,也是学校各级部门可靠的基础信息化服务平台。大学云服务将产生大量的各种数据,云计算目前是大数据处理的基础技术[1],采用云计算处理海量数据,提高管理与决策水平,是大学云架构的重点工作。

显然,云计算、大数据等技术已成为高校生存与发展的基础。大学云架构采用统一标准[2],不仅利于各种业务网络与应用系统互连互通,避免产生“信息孤岛”,也利于避免计算、存储及网络资源重复建设[3],节约资金及提高收益,还利于大数据处理,改善办学绩效及增强高校创新能力。

因此,大学云架构的关键问题是全面整合资源,优化云计算模型。也就是构建一种支持资源集约、信息共享、应用协同,以及大数据存储管理及检索使用的大学云。最优架构的大学云,是云计算、大数据与教育信息化的融合。这种融合,一方面规定了智慧校园高层划分及各部分间的交互[4],另一方面决定了智慧校园应用系统的实施能力和发展空间。本文以山西师大园区云建

设为背景,重点讨论大学云架构与大数据处理建模等问题的解决方法。

二、大学云计算体系结构与功能

大学云是智慧校园建设的核心部分,是一个复杂的系统工程。该工程侧重六个方面:第一,优化整合学校各种管理信息系统和协同办公系统,建立统一基础数据库、数据交换系统、统一信息门户及统一身份认证等[5],消除信息孤岛。第二,完善高校决策支持系统的模型库、数据库和知识库建设,通过大数据分析,实现学校发展的智能决策。第三,优化整合网络课程、精品资源共享课和视频公开课及微课等资源,构建网上网下有机协同的智慧学习环境。第四,优化整合饭卡、洗浴卡、水卡、门禁卡、借阅证、上机卡等校园各类卡片,实现校园一卡通。第五,完善图书馆资源数字化管理,支持师生泛在数字化阅读与在线讨论。第六,优化整合多媒体视听教学与微格教学设施,支持MOOC的开发与应用。按照以上要求,大学云计算体系结构与功能,如图1所示。

从图1可以看出,大学云主要由基础设施、资源平台、应用平台和服务门户构成。基础设施包括了各种服务器、存储器、网络设备(交换、路由、安全等)和操作系统及工具软件等设施。采用虚拟化软件(如VMware vSphere 5.5),对云基础设施进行集群架构与管理[6];按照业务所需资源量,将虚拟服务器与虚拟存储器弹性适配与调度[7],由此形成大学云资源平台。在资源平台部署校园应用软件,包括教务管理系统、学生管理系统、科研管理系统、教工管理系统、资产设备管理系统、财务管理系统、后勤服务管理系统、图书文献管理系统、教学信息化与网络学习系统、协同办公系统、平安校园监管系统、校园一卡通系统、统

一身份认证系统、上网行为管理系统、网络运维支持系统等。这些校园应用系统,构成了大学云应用平台。

大学云应用平台,通过数据交换系统(多个虚拟主机)接口,将各种数据库与各种应用系统适配连接,实现了资源集约、信息共享及应用协同。云应用,一方面通过面向师生信息服务接口,建立了一站式校园信息服务门户。师生可通过该门户,依据本人权限进行各种功能操作。另一方面,通过面向大数据分析与智能决策服务接口,建立了一站式校园决策支持门户。学校各级领导(或相关责任人),依据本人权限进行各种大数据分析操作。通过大数据分析,实施教学、科研与后勤服务等事务处理的决策支持。

三、校园大数据特征与处理方法

随着大学云建设与应用,大量数据来源于管理信息系统数据库与日志库、图书文献库与日志库、校园一卡通数据库与日志库、网络行为与管理日志库、平安校园视频库与日志库、多媒体及微格教学视频库与日志库、网络学习资源库与日志库、办学决策知识库和模型库及决策支持日志库等。数据类型繁多,主要有文本、数值、图形、图像、标签等。数据处理速度快,如管理信息系统数据库、一卡通数据库等,数据处理均有较高时效性。很多数据表现出低价值密度,如各种视频库、日志库等。这些数据完全符合大数据的4V(V olume,Variety,Velocity和Value)特征[8]。

校园大数据可分为结构化数据与非结构化数据两类。结构化数据主要包括各种管理信息系统数据库(关系数据模型)、能够变换为关系数据表单的各种日志库。非结构化数据主要包括图形图像、音视频(微格教学视频、精品资源共享视频课、微课程

视频、校园监控视频等)、Web文档(HTML与XML网页)、课件文档(浏览器可打开的Word、PPT、PDF等)、工作文档(如年度计划、工作总结、项目研究、成果报告等电子文档)。结构化数据处理,常用数理统计模型与算法(如回归分析,最小显著差数法、最小显著极差法等)。非结构数据处理,常用文档语义表示与索引、文本处理与分析[9]、内容摘要等工具。校园大数据处理建模,直接影响着学校发展决策的水平。

四、支持学生成长的大数据分析

在校园云的环境中,如数字化迎新、数字化学习(网上选课、学籍管理、网络学习、在线讨论等)、数字化生活(校园刷卡吃饭、洗浴、用水、进门、借书、上机、体育运动,以及社团与学术活动等)的每一个过程中,均有大量的数据记录了学生成长。如图2所示。对这些数据进行深入分析,对学生成长及改善学校决策绩效[10],具有以下作用。(1)学生入学与学习数据分析。整合学生入学情况和在校学习情况等数据,深入分析与了解不同生源地、不同单科成绩、不同专业、不同个性特征的学生在校期间学习表现,为招生部门优化招生措施提供决策支持。

(2)学生专业学习数据分析。整合能够反映学生在校的学习、研究和参加活动(如课程学习、校园学术活动等)等多种数据,持续、系统地分析每个学生的专业学习行为、课程测验与作业完成、课程考试成绩、项目申请与结题、学习兴趣与意见等数据,深入了解学生专业学习中的问题,为学习绩效改善提供个性化服务,为优化人才培养方案提供决策支持。

(3)学生在线学习与图书借阅数据分析。完善“在线学习管理系统”的学习轨迹记忆功能,能够跟踪学生的学习轨迹。深入分析学生在观看课程视频、网络课程学习、网络资源浏览、在

相关文档
最新文档