高职院校数据治理体系构建与实践研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高职院校数据治理体系构建与实践研究
作者:刘晓天顾大明
来源:《电脑知识与技术》2024年第02期
关键词:数据治理;数据中台;数据服务;数据标准化;高职院校
0 引言
随着人工智能、大数据、云计算、物联网等现代信息技术的快速发展与广泛应用,我国高校信息化建设进入新阶段。2018年4月,教育部发布了《教育信息化2.0行动计划》,强调促进智慧校园建设全面普及,全面推进各级各类学校的智慧校园建设与应用。2021年3月,教育部发布《关于加强新时代教育管理信息化工作的通知》,明确要求加强教育数据规范管理、促进教育数据共享和强化教育数据质量保障。2023年6月,教育部教育管理信息中心下发《關于印发<全国教育智慧大脑院校中台(高职/中职)数据标准及接口规范(试行)><全国职业院校大数据中心建设指南>的通知》,为高职院校数据中心建设指明方向,对高职数据治理和数据服务提出更高要求。
高校作为数据产生、拥有和使用的主体,数据积累量和内部复杂度不断提升,数据整合困扰普遍存在。为此,本文开展了面向高职院校的数据治理应用研究,从数据治理角度对智慧校园建设进行统筹和设计,提出了契合高职质量和规模需求的、基于数据中台的数据治理体系架构,以某高职院校正在实施的数据治理项目实践为例,充分论证所提框架的正确性和有效性,实践证明:所提框架,能够有效解决数据的准确性、一致性和标准性等问题,有效促进高职院校的智慧校园建设。
1 高职院校数据治理困境
当前,高职院校数据中心建设和数据治理实施正逐渐成为数字智慧化转型的基础和关键,但由于传统信息化建设“重应用、轻数据、缺标准”等历史遗留问题和技术、经费、人员等因素
限制,部分高职院校存在建设短板,如缺乏清晰的数据治理整体顶层梳理、缺乏数据呈现可视化模型等,数据治理的整体建设愿景实现得并不理想。
1.1 数据治理现状分析
顺应教育信息化2.0背景下的智慧校园建设的新要求和新变化,高职信息化建设总体呈现碎片化、服务化、移动化、可视化等显著特点,即应用的碎片化,流程重构和数据互通的服务化,终端设备的移动化,数据分析和呈现的可视化。长久以来,高职信息化建设解决了大量的业务需求,但随着系统规模增大、业务功能增加和数据持续堆积,逐渐出现一些问题:数据缺乏统一规范,没有形成统一数据标准,存在数据重复录入、不一致等问题,导致数据无法发挥应有价值;数据孤岛依然存在,无法实现数据实时或高频共享,仍存在双向互通不全面、信息不对称等问题,集成和共享覆盖面不足,导致数据流通和共享率不高;业务系统建设缺乏顶层设计;数据价值体现不足,数据融合分析和智能化服务能力不足,统计分析的维度、广度、精准度和可视度等有待加强,导致领导对校情数据掌控有限,数据的使用和查询诉求难以有效满足。
数据的整合、管理与使用成了目前制约高职院校智慧校园一体化建设的一个重要因素。因历史原因,分散分期建设的业务系统内沉积了太多纷繁杂乱的数据,数据标准不统一,难以关联、挖掘、统计和分析,无法形成整体视图,数据共享难度大,数据价值无法充分开发,重要决策得不到综合数据支撑,智慧校园整体建设效果大打折扣。因此,数据治理作为高职院校从“数字校园”迈向“智慧校园”的重要枢纽工程,是信息化建设当务之急。
1.2 数据治理主要难点
高职院校的数据治理在向深度治理推进的过程中,在数据采集、数据维度、数据标准、数据质量等方面存在着“数据不可知、数据不可取、数据不可控”等问题,难以支撑准确的大数据分析与应用。
主要难点[1]有:1)数据中心黑盒运行,难以管理。数据中心黑盒运行,好处是使用者无需理解底层技术,即可实现实际应用的数据流转,坏处是一旦数据流转出了问题,要想准确定位排障,难度非常大。同时,数据中心的数据管理技术要求高、数据接口标准不一、数据标准缺乏全局统一、输出不准确、共享集成门槛高等职能,缺乏统一的全域解决方案。2)数据维度缺失,难堪大任。业务系统功能缺失、重叠,数据重复、缺失、不完整,数据采集只有主数据和结果数据等,使治理后的大数据应用画像不完整、不准确,数据价值得不到充分利用。3)数据标准不统一,难以共享。不同业务系统中对相同对象的不同建模、相同数据的不同描述,使数据的一致性不高,数据共享时更是似是而非,摸不着头脑。4)数据质量缺乏保障,难以采信。部分数据缺失、错误、不完整,数据结构不全面,难以支撑数据统计、数据上报、数字画像等复杂应用场景的数据需求,数据的更新不及时、共享度不够、完整度不高等问题,
使为跨部门信息化管理和领导辅助决策提供可信数据支撑的难度提升。为解决这些问题,高职院校需要重点思考基于数据中台的数据治理策略和方法,为信息化赋能。
为进一步加快高职院校业务系统的数据共享应用,盘活数据资产,支撑领导科学决策,构建全业务域、全数据域、全时间域和全质量管控域的全域数据中台,以此为基础,开展覆盖数据全生命周期的数据治理,以应用为抓手,以业务为驱动,推进大数据应用,增强师生的信息获得感,非常必要。
2 数据治理架构
数据中台是规范数据标准、提升数据质量、整合现有资源,以此达到系统间数据无缝对接的一整套综合管理平台[2]。数据中台是实现高职院校数字化转型的关键基础平台,通过整合、分析和挖掘各类数据,为学校提供高效、可靠的数据支持和解决方案,助力教学质量提高、资源配置优化、科研创新提升等。
数据中台兼有数据集成、数据模型、元数据管理、数据标准、数据质量管理、数据开放、数据监控等功能,对数据实施从采集到开放的全生命周期的开发和管理。数据中台最终要实现的目标:以“数据资产化、数据标准化、数据共享化”为导向开展数据治理,基于一体化数据开发平台,打通数据生命周期的各个环节,减少冗余,增加复用,以API接口服务方式实现数据共享与监控,快速响应用户和业务系统的数据需求,以数据驱动业务和管理的创新。以数据中台为基础,构建全域数据中心,打通现有业务系统,杜绝“数据孤岛”,全面实施数据治理、数据资产化运营和深度数据挖掘,最终实现学校全域数据的共享开放,为智慧校园建设提供强有力的数据支撑基座。
根据教育部教育管理信息中心下发的数据中心建设指南要求,结合高职院校基本校情,以“存管服用”为建设原则,基于数据全生命周期管理理念,基于“获取-处理-使用-服务-反馈-评估”的过程监管和“发现-监督-控制-沟通-整合-协同”的服务模式,以数据标准为起点,服务应用为终点,数据闭环治理为保障,构建数据治理和服务治理相结合的基于数据中台的数据治理体系框架[3-4],如图1所示。
体系框架主要由“后台的数据实体空间”“中台的数据能力空间”和“前台的数据应用空间”三个模块组成。数据实体空间主要实现利用批流一体集成工具将业务数据、离线数据、机器数据等全量抽取“进湖入仓”的功能。数据湖仓由贴源层、标准层和应用层等组成。贴源层主要实现数据“1:1”抽取进入数据湖,标准层主要实现按照数据标准要求进行初步数据治理,并将初步治理的数据拉进数据仓库,实现数据标准化,应用层主要实现对数据资产进行深度治理,并根据需要推送到相关主题库。数据能力空间主要实现数据管理、标准管理、数据编目、集成管理、数据监控、主题管理等与数据相关的从入库到开放的全生命周期的所有管理功能。数据应用空间主要实现业务服务中心(业务中台)和数据服务中心的所有功能,两个中心的所有应用