强化数据赋能,稳步提升运维智能化水平——长沙银行运维数据中台建设实践
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
74
FINANCIAL COMPUTER OF CHINA
IT PRACTICE
近年来,随着各种新技术、新概念在金融领域的深化应用,银行信息系统的功能、规模和架构均发生了巨大变化,并对数据中心运维工作提出了新的挑战。
银行业机构纷纷探索建设综合性的运维数据中台,深化挖掘运维数据对提高运维效率的乘数作用,以进一步提高运维数字化、智能化水平。
顺应上述趋势,长沙银行在持续推动运维数据治理和应用的基础上,建立集多源数据一体汇聚、异构数据关联治理、全域数据资产管理、场景数据应用服务于一体的运维数据中台体系,实现了统一数据接入、统一数据管控、统一数据治理、统一数据服务等运维目标。
一、运维数据中台体系总体建设思路
为更好释放运维数据价值,推动运维效率提升,长沙银行在全面整合各系统运行与管理过程数据的基础上,统筹制定了运维数据中台体系的建设目标与实施路径。
长沙银行运维数据中台体系总体架构如图1所示。
1.坚持规划先行
规划先行的战略意义在于提前达成建设共识,进而
强化数据赋能,
稳步提升运维智能化水平
摘 要:数字化转型背景下,长沙银行积极探索释放数据要素价值、提升生产效能的最佳实践路径,创新搭建运维数据中台体系,以运维数据驱动业务连续性水平稳步提升。
本文从总体规划、实施要点、典型场景等方面,详细介绍了长沙银行运维数据中台体系建设实践,以期为金融同业提供有价值的借鉴和参考。
关键词:数据资产;数据治理;场景赋能;智能运维
长沙银行数据中心 刘志 李铭路 付强
统一思路、统一资源、统一动作,即实际建设开始前,在顶层设计层面认真讨论组织推动、资源投入、能力建设、场景应用、机制配套等重点问题,同时从标准、设计、采集、清洗、应用等不同维度,制定全数据生命周期治理策略,并综合考虑前期方案制定、中期实施难点、后期复盘优化等三大环节。
2.着力夯实基础
运维数据中台作为一种技术能力,其核心功能是以数据赋能运维场景,并同步构建“四个统一”的基础能力:
在统一数据接入方面,通过建立标准化、模块化的多源异构数据接入体系,把海量、零散、有价值的多源数据一体汇聚,并支持对指标、日志数据进行实时读写,以及对资产配置数据进行非实时批量同步。
在统一数据管控方面,通过对运维工具、资源、流程、管理、服务等数据进行整合梳理,从运营和技术视角梳理运维对象关联关系,从静态、动态两个维度进行关联映射,实现对数据资产的全方位管控,确保运维数据来源的准确性和及时性。
在统一数据治理方面,通过对运维全域数据进行归
——长沙银行运维数据中台建设实践
75
2023 . 11 中国金融电脑
IT 实践
IT Practice
持从元数据和数据模型两个维度分别管理。
其中,元数据管理包括对元数据进行增、删、改、查,以及开展版本记录、统计分析和元模型管理等工作;数据模型管理旨在对数据源之间的映射关系进行关联分析,宏观展示调用链路,并结合数据标准化建设,确保数据的完整性、一致性、有效性。
在统一数据服务方面,通过打造标签数据体系和开展数据可视化建设,对外提供统一的数据接入、数据查询、数据分析服务,同时建立运维数据运营服务体系,让高价值运维数据共享流通,进而实现数据“越用越丰富、越用越标准、越用越智能”的发展目标。
3.深化场景赋能
围绕赋能实际场景这一最终目标,运维数据中台深度融合“以用户为核心”的建设理念,在项目开始即结合运维实践明确具体场景,如故障诊断、故障预测、运维资产查询、运维资产可视化、网络链路调用等,坚持“以场景为导向”,逐步开展运维数据中台建设、运维数据
数据中心的运维质效与业务连续性保障水平。
4.持续健全机制
运维数据中台建设是一个长期的系统性工程,需根据数据应用趋势、新技术迭代等不断更新,且无论是平台能力建设还是运营体系建设,都需要逐年逐步完善。
鉴于此,数据中心同步建立了整套的建设和运营机制,以确保运维数据中台可持续高效赋能业务发展。
同时,通过案例交流、平台宣讲,帮助运维人员更好地认识数据、使用数据,不断沉淀知识资产,持续打造“工具驱动高效运维、数据驱动科学决策”的意识和氛围。
二、运维数据中台实施要点与典型场景
1.实施要点
一是同时抓好平台建设与运营。
在运维数据中台建设初期,一个常见误区是侧重平台能力、新技术集成应用,而忽略对传统现有工具的融合与运营,从而导致应用效果大打折扣。
为避免此类问题发生,长沙银行在实
管理分析加工对象体系告警控制视图分享维
数据中台
IT PRACTICE
际建设过程中始终坚持“两手抓”,既注重新运维中台与旧有平台工具的融合应用,在平台工具侧形成合力;也高度注重产品运营,即通过在平台建设前期与使用者达成共识,在建设过程中形成用户依赖,并在平台建成后听取用户意见进行督办改进等,着力推动运维数据中台实现良性发展。
二是攻克运维数据孤岛难题。
目前,长沙银行已建成多云多芯全栈云原生平台底座,并建立了传统架构与云化架构融合的立体多维度监控体系。
然而,由于海量运维数据在格式、存储介质、来源等方面各有不同,不仅导致数据无法直接使用,也难以界定数据之间的关联关系,更是无法支撑运维业务决策。
对此,长沙银行选择建立覆盖采集、接入、存储、治理、计算、分析和应用的全流程数据管理体系,通过在原始数据采集和运维资产应用之间建立联系,力求做到数据“越用越多、越用越活”。
2.典型场景
近年来,长沙银行扎实推进运维数据中台建设,以数据驱动智能运维转型升级,并从实际需求出发,面向价值创造,营造了全流程数据运维生态;同时,通过不断夯实基础能力,建立了统一的数据采集、存储、分析和展示平台,实现对应用与资源之间依赖关系的动态发现和高效管理,着力打造对多维度数据的关联分析能力,支持开展场景化的全链路应用分析,并由此形成了集观测、分析、处置于一体的全流程智能运维能力。
一是实现应用系统全视角展示。
运维数据中台可展示应用健康度、运行状况、资产关联等运维全领域场景,提供系统运行质量、效率和安全的全流程评估量化指标,帮助运维人员全面了解应用情况。
二是实现运维故障智能分析。
运维数据中台以业务系统为核心,全面整合了业务层、应用层、系统层、网络层的关联告警状态,并基于各类运维资产对象的告警、指标和日志数据,实现了故障的发现、诊断、定位等。
三是实现资源容量分析。
运维数据中台通过纳管云上、云下基础软硬件资源和应用系统运行状态指标,通过提供“以应用为视角”的容量数据报表,可结合机器学习技术提前预测容量变化趋势,进而辅助运维人员及时做好预防性扩缩容,提升资源利用效率。
四是实现运维资产精细盘点。
运维数据中台基于CMDB建立全局静态运维数据资产视图,连通了机房、物理设备、网络、虚拟机、应用等全链路资产,方便运维人员对运维资产快速查询与核对。
三、后续工作展望
运维数据中台建设不是简单地开展数据采集与存储,而是要对运维数据的全生命周期进行管理与运营。
后续,长沙银行将继续结合具体业务场景,稳步用好用准智能模型算法,不断提升运维智能化水平,并重点加强以下几个方面的能力建设:一是持续完善高质量的数据采集、清洗、校验和整合机制,提升运维数据的准确性和可信度;二是深化运维数据中台“上云用数赋智”能力建设,引入容器技术,进一步提升弹性和峰值处理能力;三是基于统一、标准化的接口协议和数据格式,有效降低集成和调试工作量;四是实现上下游系统之间的异步通信和增量更新,逐步提高运维数据消费场景的灵活性和可扩展性。
未来,长沙银行将以运维数据中台建设为新的起点,逐步完善新一代“以业务和数据为核心”的智能运维体系,在稳步推动业务连续性水平迈入新阶段的大前提下,不断锤炼以数据服务业务的能力,为智能运维与业务运营结合探索出更多的新方向、新方法。
参考文献:
[1] 周湉.分布式架构下智能运维的探索和实践[J].
金融电子化,2023(6).
76FINANCIAL COMPUTER OF CHINA。