业务服务监控平台产品技术白皮书
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
业务服务监控平台技术白皮书
(V2.0)
联想中望系统服务有限公司
2008年7月
1背景及现状
随着企业IT技术的广泛应用,企业IT资源的拥有量越来越多,结构越来越复杂。如何保障IT系统的正常运行,从而保障公司的核心业务,已经日益成为CIO(首席信息执行官)需要仔细思考的问题。
此外,由于各种法规(如SOX法案)对企业诚信经营以及企业自身内控管理的要求,IT治理已开始越来越为各企业重视,作为IT治理框架的关键环节,IT系统的监控也已成为各企业的当务之急。
1.1 被动监控、分散管理
图1描述了支撑企业业务运营的典型IT资源结构图,其中包括硬件(主机、路由、存储等)、软件(系统软件、应用软件、数据库等)等多种IT资源。
图1 典型企业IT资源结构示意图
日益复杂的IT环境给运营环境保障人员带来如下问题:
1、监控劳动强度大,事故不易及时主动发现。
缺乏统一集中的监控手段,不能对所管理的IT资产进行及时有效的监控管理。随着IT设施的不断扩大,整个IT环境的日趋复杂,系统监控人员巡视设备(IT资源)的间隔越来越短,花费大量的时间,来发现与解决问题。
2、监控数据没有集中存储,无法为系统运行情况提供量化的科学依据。
缺乏一整套集中的数据中心来记录、配置信息和历史记录,使在日常的监控管理工作中,不能及时获取相关的信息,严重影响排查故障的效率。
没有建立一个统一的监控平台,难于适应业务系统扩展时的监控需求扩展业务系统在不断地扩展,相应地监控需求也在不断地扩展。缺少一个统一,高可扩展性的监控平台,使得新的监控需求难以被满足。
1.2 “自下而上”的模式不能有效保障业务可用性
企业的基础IT环境为业务系统提供支撑。传统的IT运维建设思路是“自下而上”的,即:从基础架构监控开始,到应用系统的监控,再到业务系统的监控。
自下而上的建设思路不能适用于高速增长下的中国企业。一方面,基础IT 环境的高可用性不能代表业务系统的高可用性;另一方面,业务的快速增长,需要更加快速、直接、高效的监控手段,以保障业务的有效运行。
下图描述了支撑企业业务运营的IT资源可用性对核心业务系统可用性的影响。
图2 基础IT资源可用性对业务可用性影响示意图上图描述的是:即便基础IT环境的可用性很高,仍然不能保证业务系统也有很高的可用性。
这种情况下,需要一种更直接、更高效、更快速的手段来为业务系统提供监测与保障。
这就是本产品所强调的:以业务为导向、自上而下的服务监控与保障手段。
1.3 不能满足合规性要求
由于各种法规(如SOX法案)对企业诚信经营以及企业自身内控管理的要求,IT治理已开始越来越为各企业重视,作为IT治理框架的关键环节,IT系统的监控也已成为各企业的当务之急。
2系统概述
unionmon就是在这一背景下,由联想中望公司于2002年自主设计和开发的,它是在调研国内许多企业,主要是电信、金融等行业的企业业务服务支撑模型(如图3所示)的基础上,通过引入IT资源结构树、IT资源相关有向图等概念,结合ITIL理念与COBIT标准而研制的关于企业IT资源可用性监控的软件系统。它的主要功能包括管理被监控资源、及时发现被监控资源的可用性变化(事件管理)、以及管理被监控资源的性能趋势数据,目标在于为企业IT管理部门提供有关IT资源的实时健康性巡检服务,保证企业IT资源的故障不至于影响企业业务运营、可用性评估服务以及能力评估服务,为企业IT资源优化配置提供决策依据。
图3:企业业务服务支撑模型
2.1 产品定位
该产品目前的市场定位是:
具有较复杂的业务系统,需要进行业务服务监控、保障的企业。
具有一定规模的IT资源环境,需要进行应用系统监控、基础IT环境监控的企业。
具有较复杂的IT资源环境,需要进行基础IT环境监控的企业。
2.2 产品目标
2.2.1建立集中、可扩展的监控平台
unionmon的基础目标之一是:建立一个集中、可扩展的监控平台,对企业基础IT环境、应用系统、业务系统进行集中监控。
通过建立集中的监控平台,可以实现各个分散的、针对特定方面的监控系统的功能,从而节省投资、降低运行维护成本。
2.2.2以业务为中心,建立业务保障体系
unionmon是以业务为中心的服务监控平台。通过界面化操作,用户可以快速建立业务系统与基础IT资源之间的模型关系。
在这个模型基础上,unionmon可以从业务出发,进行事件根源分析、事件关联分析、业务变更影响分析;
在这个模型基础上,unionmon可以从业务出发,进行业务可用性分析。2.2.3建立对业务可用性的趋势预测体系
unionmon存储了业务的各项指标。
通过对业务各项指标的历史数据分析,可以对业务可用性的将来走势进行一定的预测。
2.2.4建立IT环境投资效益分析的评测体系
IT环境建设的目标是为了更好地支撑业务系统。是否需要加大对IT环境建设的投入、目前IT环境的利用情况如何、目前IT环境能否支撑快速发展的业务需要,这些问题都涉及到对IT环境的投资效益分析。
IT环境的投资收益分析,需要对各项重要指标进行量化。unionmon系统中监控了业务系统各项关键KPI指标,以及支撑业务系统的IT基础资源的各项关键指标。这些指标成为分析的数据基础。
IT环境的投资收益分析,需要在业务系统与基础IT资源之间建立关系。unionmon系统将实际监控环境映射为统一的CMDB模型,建立了CI(配置项)及CI之间的关系。这个CMDB模型成为分析的模型基础。
2.3 产品组成
2.3.1资源管理模块
unionmon系统通过统一的CMDB,实现了对被监控对象的统一管理。
资源管理模块管理对此CMDB的维护管理
2.3.2事件管理模块
事件管理包括事件检测与标准化、事件压制与合并、事件关联、事件信息存储与展现功能,其主要目的是为了及时发现IT系统存在的故障。
2.3.3可用性分析模块
可用性分析是指对资源或者业务服务的可用性进行统计,汇总,进而使用图表进行趋势分析、对比分析以及分布分析的功能。
2.3.4动作管理模块
当发生事件时,可以通过动作管理功能,执行用户预定义的动作。例如:当一个重要进程down的时候,可以通过预定义的动作,启动备用进程;从而保证业务系统的可用性。