中国铁路信息化建设之运维服务管理新概念
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中国铁路信息化建设之运维服务管理新概念
王辉
(北京京天威科技发展有限公司客车机车事业部,北京100085)
摘要:为适应当前中国铁路信息化发展的需要,结合我公司参与中国铁路信息化建设积累的大量经验,特在新时期、新背景下提出针对中国铁路信息化建设量身定制的运维服务管理新概念。通过对京天威运维服务管理系统的分析评估,相信必将对中国铁路信息化建设建立统一的、规范的、体系化的、层次化的运维服务管理体系发挥重要的作用。
关键词:运维服务管理,京天威运维服务监控系统,JTV BSMS,ITIL
1引言
伴随中国铁路跨越式的大发展,信息数据在中国铁路信息化建设中的安全性、可靠性、及时性等凸显日益重要。信息是建立在高性能的硬件服务器和畅通发达的网络基础之上,数据是存储在运行SQL Server、Oracle等大型数据库的硬件服务器上,一旦硬件服务器、网络和地理环境等任何一个节点出现问题,必将对信息数据的及时性和完整性产生较大的影响,甚至造成严重的后果。
纵观当前中国铁路IT系统发展的现状:
●随着中国铁路IT系统不断发展,各种不同的应用和业务系统在网络上运行越来越多,对网络的依赖越来越大,要求对系统集成技术管理的内容日趋增多,包括网络管理、性能管理、应用管理、使用管理、安全系统等内容。
●伴随中国铁路业务服务规模的不断增大,规划、维护、安全、管理等分工更加细致,迫切要求管理者需对业务服务管理和维护建立统一的、规范的、体系化的、层次化的运维服务管理模式。
●当前各路局普遍存在多设备、多系统的运行信息、告警信息的多样化。需要对这些信息进行集中化的管理,进行智能化的分析、统计,得出有利于网络管理和维护的数据,更有效、更快捷的解决问题。
●伴随中国铁路信息化跨越式发展,直接导致管理人员不断增多,管理流程日益复杂,管理成本不断上升,技术管理体系亟待需要完善。
2运维服务管理新概念
2.1 运维服务管理的主要思想
通过对当前中国铁路IT系统环境和管理现状的分析调研,急需建设一套统一的网络和
业务系统监控平台,这个平台主要应包括以下几个方面的思想:
⑴、基于统一、集中的管理体系。统一的数据处理和展现,统一的告警平台。目的是消除各个监控工具之间各自为政、系统管理员在各个界面间频繁切换的情况,将旧的监控工具的数据和事件统一融入到新的监控平台中来,并通过统一的展现界面进行展现、统一的告警平台,将所有告警纳入监控管理监控平台,通过短信、邮件和桌面客户端统一告警。
⑵、从业务的角度将传统的技术设备管理整合到基于业务的管理平台上来,不仅能完成对设备监控的需求同时能满足根据业务的组成定位问题根源,定位性能瓶颈,预测业务发展趋势和稳定性。
⑶、利用现有主机系统的少量资源,实现对各种服务器(Linux、AIX、Windows2003、Windows2008等)监控管理。包括主机硬件、操作系统、文件系统、进程和应用等。主机监控的重点是对操作系统关键指标,如CPU、内存、进程、文件系统等进行全面的监控管理,要求不仅能够在状态改变或性能指标超越门限时生成告警,同时还应该提供实时和历史的性能数据展现,并能够保存历史性能数据,以形成统计分析报表。
⑷、各种数据库(Oracle,Sqlserver等)监控管理,包括数据库的重要配置参数以及运行状况的监控。主要关注数据库的关键指标,如SGA使用率、表空间占用情况、锁竞争和使用情况、缓冲区命中率等。
⑸、其它应用的监控管理。比如IIS、Tomcat、Weblogic监控,重点保证服务的可用性和性能。
⑹、统一的报告和报表,多台设备性能比较,其它格式导出,柱图、XY坐标、饼图、折线图,定期的运维报告等等。
⑺、实现对某种业务的服务水平管理。通过业务服务管理,可以对某种业务在过去一段时间内的运行状况有一个总体的评价和衡量。
⑻、采用技术成熟、先进,并具有较强的集成性和可扩充性的管理平台。易于使用和维护。统一的中文界面、浏览器管理方式,可以多人同时通过浏览器进行访问和操作。
⑼、解放人力资源,依靠智能化技术化的管理手段,降低故障发生率,降低维护成本,并同时提高维护效率。
2.2 运维服务管理的终极目标
通过此运维服务管理系统监控平台的建设,我们最终将会实现以下管理目标:
★建设全面的监控管理平台,消除监控死角:
当前中国铁路的5T系统、客车系统、货车系统等多个信息系统采用了多个厂家的网络设备、服务器、中间件、数据库、存储设备、应用系统。因此本监控首先要解决的问题是通过建设全面的监控管理平台将目前各个业务系统中的各种设备、软件、业务应用整合到监控平台中,消除管理对象之间的差别、消除数据采集手段的差别、消除管理软件的差别,对各
种不同数据来源数据统一处理、统一展现、统一用户登录、统一权限控制。
★建设开放、具有良好扩展性的IT管理平台:
运维服务管理系统监控平台应具有很好的开放性和扩展性,不仅可以满足现阶段中国铁路信息化发展建设的需要,未来随着中国铁路信息化发展业务的不断扩展,运维服务管理系统监控平台必须具有良好的扩展性,为满足日益增长的业务需求和信息化建设提供优越的监控环境。
3 运维服务管理技术方案
3.1体系结构
京天威运维服务监控系统(JTV Business Service Management System,以下简称JTV BSMS)提出全方位运维管理的运维服务理念,基于ITSM标准规范,整合基础设备管理,应用管理,端到端应用流分析,业务服务管理等几大部分,消除客户IT运维断点,使各模块之间信息互通,以业务的视角实现整体IT运维管理。
这几大部分组成了JTV BSMS软件的精髓,各个模块之间信息互通迅速高效,以业务的视角实现整体的IT运维管理。
图1 JTV BSMS首页图
图2 JTV BSMS监控页面图
3.2系统建设
3.2.1系统平台构成
基于JTV BSMS的IT系统管理解决方案是在基础架构管理、应用管理、响应时间管理、业务服务管理的基础上,通过IT流程管理,帮助各路局建立以ITIL(Information Technology Infrastructure Library,信息技术基础架构库)流程为框架的IT网络管理系统,实现流程化、自动化和规范化管理。JTV BSMS中的功能模块主要由以下几方面构成:
●主机监控
●网络监控
●应用系统监控
●业务服务管理
●报告报表管理
●日志管理
●统一报警(邮件、手机短信)
JTV BSMS基于B/S架构,通过Portal的统一展现,对基础架构和应用系统进行全面监控,提供面向服务的端到端响应时间管理,不断改善用户体验;遵循ITIL流程框架,将运维工作纳入IT管理流程,最终建立业务服务管理;通过有效的报告报表分析,使用户能够动态可视的了解到IT 基础架构与业务服务之间的变化关系,最终进行帮助各路局实现IT