机房动力环境系统设计方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录
1.1需求分析 (3)
1.1.1 硬件架构设计 (4)
1.1.2 软件架构设计 (6)
1.2系统实现 (7)
1.2.1 UPS监测 (7)
1.2.2 普通空调监控 (10)
1.2.3 温湿度监测 (11)
1.2.4 漏水监测 (13)
1.3一体化监控系统基础功能 (14)
1.3.1 联网管理功能 (14)
1.3.2 界面管理 (14)
1.3.3 客户端管理 (22)
1.3.4 人员机制管理 (22)
1.3.5 报警管理 (23)
1.3.6 告警事件管理功能 (23)
1.3.7 故障管理 (26)
1.3.8 联动管理 (27)
1.3.9 安全时段功能 (27)
1.3.10 双机冗余管理 (28)
1.4系统特色功能 (29)
1.4.1 智能报表功能 (29)
1.4.2 能效管理功能 (33)
1.4.3 手机APP功能 (35)
1.4.4 系统扩容 (37)
1.1需求分析
根据银行各支行数据中心机房分散、设备较多,各地机房管理工作繁杂等现状,需为其建立一套机房联网监控系统对其进行全面集中监控,以满足集中管理、快速响应、快速排障的要求;同时还须对整个系统的扩展性进行充分考虑,并在设计时预留相应接口,以方便将来的升级和扩容。
西安中心机房及下属支行机房建立起机房动力环境监控系统,实现各个支行机房动力环境系统的独立监控;并将机房的动力环境监控数据和相关信息发送到分行统一监控管理,实现机房动力环境联网,统一监控管理。
各个营业网点数量较多,营业网点机房需要增加动力环境监控系统,并将系统接入到机房动力环境监控平台集中监控时,整个系统构架将做升级和调整,具体设计按照需求更新和调整。
本次各网点机房主要监控对象包括:UPS、普通空调、温湿度、漏水等,接入已建设的动环监控系统,实现7×24的监控和管理,保障机房环境及设备安全运行,以实现最高的机房可用率,不断提高运营管理水平。
具体监控内容如下,可根据实际需求对监控内容进行筛选。
(1)动力监控部分
UPS:监测UPS的工作状态和运行参数。
(2)环境监控部分
普通空调:监测普通空调的运行状态,并可实现远程开关机启停控制;
温湿度:监测机房内重要区域的温度、湿度数值及变化情况;
漏水:监测机房内空调四周漏水情况,漏水监测可精确到米;
(3)平台告警方式
实现界面报警、短信报警、电话报警、邮件报警、声光报警等报警方式。
4
1.1.1 硬件架构设计
恒丰银行联网机房监控系统图
如上监控系统结构图所示,整个系统主要由以下四部分组成:数据采集层、分行监控层、中心管理层、统一展示层。
各部分的主要作用如下:
数据采集层:部署在各网点机房或区域本地机房,由各种I/O采控模块、传感器及采集服务器组成,直接连接各种被监控设备,采集如空调、温湿度、漏水等的现场信号,将采集的现场信号上传到串口服务器,由串口服务器将数据转换成TPC/IP的信号上传至本区域地市分行监控系统。
分行监控层:部署在分行,由区域监控服务器组成,具有本地存储、实时处理、分析和输出的能力,用于将本机房及下属网点集中管理,处理所有的报警信息,记录报警事件,并负责将控制命令发往前端设备,实现对现场设备的远程控制。
中心管理层:部署在分行,由集中管理服务器(主、备机)组成,用于对下属所有网点进行集中监控和管理,服务器具有独立数据处理及数据存储能力,用于将设备采集层传输来的的各种信息进行存储、实时处理、分析和输出,处理所有的报警信息,记录报警事件,数据统计分析等管理功能。
统一展示层:用于进行远程的WEB浏览,便于管理人员随时随地了解机房的工作状况,可直接观看到与监控服务器一致的监控画面,在具有相应权限下还可对设备实现远程控制,如空调的开关机等。
系统采用C/S+B/S结构,软硬件的安装与维护集中于监控服务器端,易于实施和维护。
数据处理放在监控服务器端,当监控需求增加时,只需对监控服务器进行升级或扩展成多个监控服务器即可,大大地加强系统的伸缩性。
1.1.2软件架构设计
1.2系统实现
1.2.1UPS监测
监控内容
设计对机房内UPS电源的各部件工作状态、运行参数等进行实时监测,一旦发生故障及报警通过监控平台发出对外报警。
实现方式
通过UPS设备提供的RS232智能接口及通讯协议,采用总线的方式将UPS的监控信号经通讯转换模块将RS232转换成RS485信号后接入监控服务器的串口,由监控平台软件进行UPS的实时监测。
实现功能(只监不控)
◆实时监视UPS整流器、逆变器、电池(电池健康检测,含电压电流等数值)、
旁路、负载等各部分的运行状态与参数(能监测到的具体内容由厂家的协
议决定,不同品牌、型号的UPS所监控到的内容不同)。
系统可对监测到的各项参数设定越限阀值(包括上下限、恢复上下限),一旦UPS发生越限报警或故障,系统将自动切换到相应的监控界面,且发生报警的该项状态或参数会变红色并闪烁显示,同时产生报警事件进行记录存储并有相应的处理提示,并第一时间对外报警。
提供曲线记录,直观显示实时及历史曲线,可查询一年内相应参数的历史曲线及具体时间的参数值(包括最大值、最小值),并可将历史曲线导出为EXCEL格式,方便管理员全面了解UPS的运行状况。
1.2.2普通空调监控
监控内容
机房温度出现异常时,将导致机房其他设备运行所需的环境失去保障,因此设计对机房内普通空调的运行状态进行实时监测,同时可对普通空调实现远程的开关机控制。
实现方式
由于普通空调不具有智能接口,给每台普通空调加装1个学习型遥控器,通过学习型遥控器自带的RS485智能接口采用总线的方式将信号接入采集服务器的串口;另外通过空调状态开关量变送器检测普通空调电源线的电流信号,转换成开关量信号后接入采集服务器的串口,由监控平台软件进行普通空调开关机控制和运行状态的实时监测。
实现功能
实时监测普通空调的开关机运行状态,并可通过监控平台软件实现远程的开关机控
制及对制冷温度数值的调节,同时支持与其它子系统的联动控制,如当温度过高时自动启动空调进行制冷。
1.2.3温湿度监测
监控内容
对于机房内娇贵的电子设备,其正常运行对环境温湿度有较高的要求。
因此设计在机房的各个重要部位,安装温湿度传感器(带液晶显示),一旦发现异常立即启动报警。
实现方式
通过在机房重要部位安装带液晶显示的温湿度传感器对环境温湿度实现监测,既可在温湿度传感器表面实时看到当前的温度和湿度数值,亦可通过温湿度传感器的RS485智能接口和通讯协议采用总线的方式将信号接入采集服务器,由监控平台软件进行温湿度的实时监测。
实现功能
⏹实时监测机房区域内的温度和湿度值,同时支持与其它子系统的联动控
制,如当温度过高时自动联动启动空调进行制冷。
⏹系统可对温度和湿度参数设定越限阀值(包括上下限、恢复上下限),一
旦温湿度发生越限报警,系统将自动切换到相应的监控界面,且发生报警的参数会变红色并闪烁显示,同时产生报警事件进行记录存储并有相应的处理提示,并第一时间对外报警。
⏹提供曲线记录,直观显示实时及历史曲线,可查询一年内相应参数的历史
曲线及具体时间的参数值(包括最大值、最小值),并可将历史曲线导出为EXCEL格式,方便管理员全面了解机房内的温湿度状况。
1.2.4漏水监测
实现方式
设计在机房有空调的地方安装区域式漏水检测设备,保证机房设备的稳定运行。
通过在有水泄露地方的四周敷设漏水感应绳,当发生漏水时感应绳将报警信号传给区域式漏水控制模块,通过8路隔离数字量输入模块实时采集区域式漏水控制模块的干接点报警信号后,再经8路隔离数字量输入模块提供的RS485接口及通讯协议,采用总线的方式将漏水报警信号直接接入采集服务器,由采集服务器将数据上传至监控服务器,由监控平台软件进行漏水的实时监测。
监测内容
实时监测机房的漏水情况,发生漏水时系统自动切换到漏水监控界面,,同时产生报警事件进行记录存储及有相应的处理提示,并第一时间发出对外报警。
1.3一体化监控系统基础功能
1.3.1联网管理功能
各个地市建立一套机房动力环境监控平台,对地市分行机房动环数据进行监控,同时将各地市分行的数据和信息上传至银行省分行的集中管理监控平台,由集中管理监控平台统一监控管理各地市银行分行及省分行机房的动力环境监控系统数据和相关信息,实现银行机房动力环境监控系统全省联网、集中监控功能。
1.3.2界面管理
界面显示为全中文界面,采用图形化设计,支持电子地图功能,支持仿三维形式模拟现场各个设备的实际位置及布局结构,能够实时查看各种设备或子系统的所有运行参数及运行状态。
界面的结构、层次清晰明了,页面风格可以按照数据中心的需
求进行定制,能够实时直观地显示设备的运行数据和运行状态,场景仿真。
主界面为包含所有子系统内监控设备的电子地图,在该界面上可直接点击子系统内的任意监控设备进入其运行状态界面。
有报警状态的区域及设备在界面上以色变或闪烁的形式显示。
同时,在本子系统的主界面上为各功能模组设置访问按钮,通过点击进入各功能模组界面(电子地图),以便对分组的监控设备进行更清晰、更有
针对性的监控。
当操作者点击主界面或功能模组界面上某一子系统后,画面会自动切换到该子系统的运行状态图或者弹出对相关的操作界面,以便管理人员查看和管理该子系统。
在有报警或异常状态的情况下,有问题的监控设备界面可以自动弹出。
生成对中低压配电系统的架构图,对数据中心的配电结构进行直观的展示,形成从上至下的系统化、层次化的完整的配电监控,直观的展示设备的运行状态、属性和设备之间的关系,对设备故障造成的影响进行分析。
界面轮询:系统允许管理人员针对系统中不同设备、环境的重要程度,自行定义监控画面按照预先设计好的顺序、时间间隔,在各功能模组之间进行轮询。
当无人操作时,系统显示界面可按照设定的顺序(可随意更改编辑)自动显示。
当进行手动操作或发生报警时,界面轮询功能应自动停止,直到手工再次启动轮询。
系统提供集成开发环境,利用各种界面元素(例如按钮、圆、矩形、直线、图片、实时曲线、历史曲线等)及编辑工具,使管理人员可以根据自己的需求设计个性化界面。
例如对界面的框架结构进行调整、对监控单元的位置进行调整等。
在使用过程中,对界面的修改应能在线进行,修改效果即时生效。
通过软件界面应可直观的展示出机房内的情况,包括整体结构、空调、服务器机柜的摆放位置都要在图中体现出来。
支持关键设备集中展示功能,可以在一个页面上组合若干重要设备的参数,如在同一界面上展示所有楼层的空调参数。
本地监控系统支持设置设备模板库,提供多套不同设备模板,维护时升级迅速,可一步完成监控标准升级。
本地监控系统支持模板页面,同类设备可共用相同页面,自动绑定测点信息,提供标准蓝底页面模板,支持多套风格页面模板扩展,高效率组态,节省系统资源。
集中监控系统平台提供告警专用页面,对监控范围内发生的告警事件进行集中页面监控,告警展示可根据物理位置、任意设备或任意设备测点自定义。
系统中集成有最新开发的列表工具,该工具可以将所有需要监控的设备或者测点进行自动绑定或自定义定制,快速汇聚关注点,例如,可将一个设备的所有测点汇聚到一张页面,也可将多个设备的所有测点汇聚到一个列表图元中,无需重新组态页面,即可将所有当前报警的设备直接显示在一张页面中,报警信息一目了然。
同时,当设备在该报警页面中报警时,可以双击该设备即可直接跳转到该设备的组态页面中进行具体查看和定位报警设备和测点的信息。
本地监控系统平台提供单个独立子系统的动态页面,显示当前子系统存在告警的测点和数据,如精密空调子系统发生告警时,系统具有独立页面显示精密空调定义范围内的告警。
本地监控系统平台支持多种页面风格的自由切换,管理员或领导可根据自身喜好或心情自由切换页面风格,使系统管理更具人性化。
集中监控系统平台支持与下级平台保持同步的功能,在本地监控平台上修改其工程和页面时,无需在集中监控系统平台中修改相应内容,只需要一键便可保其工程和页面的同步。
集中监控系统平台根据维护人员的工作内容不同自定义其个性化管理界面,将用户关心的设备和页面集中管理,屏蔽不需要关系的其他设备或页面,方便管理,提高工作效率。
1.3.3客户端管理
系统采用B/S分布模式的模块化结构,软硬件的安装与维护集中于监控服务器端,易于实施和维护。
同时采用B/S结构,客户端只负责用户界面显示,数据处理放在监控层,当监控需求增加时,只需对监控平台进行升级或扩展多个监控模块即可,大大地加强系统的伸缩性。
支持关键设备集中展示功能,可以在一个页面上组合若干重要设备的参数,如在同一界面上展示所有楼层的空调参数;
系统界面与用户权限绑定,不同权限的用户,其所看到的界面不同。
1.3.4人员机制管理
用户权限可按照区域、部门、职能、时间等模式进行任意组合,首先可以设定不同的权限组,然后在不同的权限组内可设定不同的权限用户,不仅可按操作进行授权之外,还可按资源(功能、设备、页面等)进行授权,实现按需管理,系统具有远程进行权限集中管理的功能,系统可为每个账号设定一个自己的主页,每次登陆时先显示各自设定的主页,大大地提高了整个系统的可操作性。
系统在进行操作时,须先输入用户名和密码,经系统验证后,根据不同的权限定义,
显示不同的操作界面和可管理工作范围。
登录前系统处于锁定状态,但报警界面的自动弹出不受限制,管理人员退出操作状态后,系统自动锁定。
在可操作深度范围内(系统未锁定),当管理员忘记注销账号时,超时(时间可进行自定义设置)后可自动锁定,使系统继续受到保护。
系统操作记录:系统对所有操作者所进行的系统操作均作详细的操作记录,包括操作人、所操作的对象、操作内容、操作时间及权限用户登录、退出的系统的时间等,操作记录可以以列表的形式进行打印,以供查询之用。
1.3.5报警管理
数据中心机房管理员可根据国家标准和现场实际环境情况对机房内的各类被监控设备设置其预警和报警阀值(出厂我方将会默认推荐值),所设定的值将保存在系统数据库内。
机房监控管理系统将前端被监控设备的数据采集后将与数据库内所设定的数据值进行比对,当数据有出入且超过设定范围时,系统将产生报警事件。
同时用户也可根据管理需要,将产生报警事件的设备安装重要性和危害性进行报警分级或做进一步处理。
1.3.6告警事件管理功能
集中监控管理系统可以根据报警事件的报警级别提供不同的报警方式:界面报警、短信报警、电话报警、邮件报警、多媒体语音报警、声光报警等告警模式,同时提供灵活多变的告警管理功能。
报警方式:灵活多样,同时告警信息可以限次播放,而且在两次告警间的停顿时间可以设置。
报警屏蔽:可以屏蔽掉不重要的报警信息,增强系统的灵活性、提高对数据的可信度。
报警级别:报警信息可分级管理,用户可以根据实际发生的报警情况的紧急程度,选择不同的报警级别,对不同的报警级别,系统会以不同的报警方式对外报警。
报警对象的准确定位:对报警的设备、事件、内容等进行准确定位,例如:“XX 机房的当前温度为27.5度,温度过高,请立即查看”“XX机房UPS组电压偏低,请立即检查”。
报警跟踪:系统提供对于任意一条报警信息的状态进行跟踪统计,包括报警时间,报警内容,确认时间,处理时间,处理日志以及处理人等情况的统计。
并可对各项报警信息进行及时度统计。
未恢复报警事件列表:提供设备报警状态的显示列表,可查看哪些设备有报警,是否报警恢复。
预警管理:设备告警支持预警功能。
用户可为关键的数据点设定预警阀值,系统通过趋势判断,在设备产生真正的告警之前先产生预警,提醒用户及时处理,避免真正告警的产生。
报警机制:系统对报警事件按优先级的高低进行处理,并具备过滤机制。
定时信息发送:系统可通过短信等方式定时或按指定时间段发送机房相关信息,如:每天8点至24点期间逢整点发送指定测点温度、定时(每天中午12点及晚上8点)发送机房整体运营状况等。
按管理范围、值班情况报警:可以根据排班情况进行报警,报警只发给值班人员,休假时可以免除收到报警,避免形成“骚扰”;并可根据管理员管理范围划分进行报警,设置好后只会收到管辖范围内的报警,避免引起管理混乱。
智能报警发送:根据预先设置的规则自动调整值班班次,实现自动短信通知值班人员进行上班提醒、值班情况考勤管理等功能。
可与报警系统进行关联,还可以针对
值班顺序作相应的报警发送,避免发生报警骚扰。
报警升级:当一条报警信息在规定时间内没有得到确认,变会以升级的方式向上一层用户报警。
主要有人员升级与设备升级两种方式。
人员升级是指第一级报警接收人员在规定时间内没有确定报警信息,报警信息便发送给系统中设定好的上一级用户,以使报警信息能够得到及时处理。
设备升级是指当使用第一种报警方式发出的报警信息在规定时间内没有得到确认,系统便自动使用设定好的新一级报警方式发送报警信息,以使报警信息能够得到及时处理。
报警过滤机制:例如当某台UPS市电供入出现故障,可能会产生一系列的故障事件,如组电压偏低、单相参数为零、逆变器参数骤变等等,报警过滤机制则通过智能化的分析手段,对故障告警进行过滤,可准确定位故障为“UPS市电供入断开”,而不会发出一系列无关的告警事件,防止短信骚扰管理人员。
告警发送记录与查询
传统的监控管理平台在发生告警后都可以向用户发送告警,但发送的状态和结果确无从知晓。
如果因网络或设备故障,导致告警未发送成功,用户往往并不知道情况,导致重要告警存在漏报的可能性。
我们的告警平台支持对所有告警发送任务的跟踪和记录,并提供方便的查询界面,便于用户对历史的发送情况进行管理。
1.3.7故障管理
整个系统由于涉及软件、硬件,具有设备数量多、类型杂、系统结构复杂等特点,在运行过程中,时刻会受到来自外界的各种干扰,影响系统的稳定运行。
例如来自电磁场和电源的干扰、设备自身故障、通信链路的干扰等等。
为此,整个系统提供了完善的故障管理机制,以应对异常情况的发生,并尽可能的减少故障所带来的影响。
故障管理的作用体现在以下几个方面:
(1)智能监测,尽早发现问题。
(2)智能恢复,尽早解决问题。
(3)智能屏蔽,尽可能的缩小故障影响范围。
(4)智能分析,帮助维护人员尽快定位问题,尽早彻底解决问题。
故障管理的范围包括以下三个方面:
(1)应用层:对系统平台核心进程和线程的监控管理。
(2)系统层:对操作系统的核心服务、系统资源进行监控和管理。
(3)硬件层:对主机硬件资源进行监控管理。
故障管理的具体实现是由软件看门狗和硬件看门狗两部分构成,软硬件看门狗相互配合,实现对硬件、操作系统、应用的三级监控管理。
1.3.8联动管理
机房监控管理系统通过对采集到的设备或环境数据与数据库内相关设定数值进行对比,当采集数据与设定值不符时,便可触发相关系统动作,从而实现联动功能。
另外,系统提供图形化动态逻辑组态功能,以图形化界面方式实现逻辑定义,从而更方便的实现联动功能。
通过设定联动逻辑,可以方便的将不同监控设备或不同子系统进行联动,即可以设定一些事件触发条件,当满足这些条件的时候,系统会自动执行某个功能或者启动另外一个设备工作等。
例如:当火警发生时,监控系统自动对空调进行远程停机处理,同时联动门禁系统,开启所有通道及门禁(后期对门禁系统后才可实现)。
系统的联动功能具有足够的灵活性,当联动逻辑需要改变时,系统提供方便的组态工具,快速修改联动逻辑,实现对系统或设备的灵活、有效的控制。
联动逻辑的修改不需重新编程,系统的高级管理人员均可通过基础培训,掌握自行修改联动逻辑的方法。
举例:
1.3.9安全时段功能
整个系统在长期运行过程中,会遇到需要检修或演练的时段,如果任由系统进行报警会有大量的无关警报发送给运维人员。
安全时段功能指在一个时间段内,报警事件将被屏蔽,不显示在事件栏,也不对外报警。
在使用过程中,系统已经默认提供了11个时
间段,还可添加、修改和删除时间段;在设备树中,可针对工程、所有设备、单个设备、单个测点和所有策略选择屏蔽的时间段,实现安全时段功能。
安全时段结束后或者手动恢复正常时,报警功能将恢复正常。
1.3.10双机冗余管理
监控系统支持双机冗余热备管理,利用“双监控系统+双数据库”模式系统架设二台服务器,分为数据中心统一监控管理主服务器、备份服务器(主备服务器内均含数据库)。
当主服务器出现故障时,可以由备份服务器快速自动接替主服务器任务,从而在不需人工干预的情况下,自动保证系统能持续提供服务,最大程度上保障了系统的稳定性;
主机和备机通过心跳监测机制,监测各自运行状态,备机平时不对设备进行控制,只对数据进行备份,当监测到主机出现故障时,备机自动接替主机的工作,实现数据分析、处理、报警等所有功能,当主机恢复后,备机自动释放主动权,并对这段时间所产生的数据与主机进行同步。