机房环境动力监控系统规划方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
机房环境动力监控系统
规划方案
一、为什么要用动力环境监控
在信息化建设中,机房运行处于信息交换管理的核心位置。机房内所有设备必须时时刻刻正常运转,否则一旦某台设备出现故障,对数据传输、存储及系统运行构成威胁,就会影响到全局系统的运行。如果不能及时处理,更有可能损坏硬件设备,耽误业务系统运转,造成的经济损失是不可估量的。
二、机房环境动力监控介绍
随着网络信息化和机房房建设发展迅猛,作为机房正常、稳定运行基本保证的空调、电源等设备的运行状况以及机房环境的安全状况也日渐凸显出其重要性。由于许多重要机房是24h不间断运行,而管理人员很难保证时时刻刻对机房情况进行监控,因此通过技术手段实现24h不间断监控显得非常必要。机房环境动力监控系统通过通信和软件的集成,可以实现对机房环境和UPS、机房空调、发电机等设备的集中监视,并实时采集报警信息发送给相关的管理人员。
机房环境动力监控的监控对象是机房的辅助设备,目前一般没有将服务器、网络等的运行纳入监控范围(有专业的软件可以实现服务器和网络的监控)。
机房环境动力监控与楼宇自控系统相比较,其特殊性表现在:
(1)机房规模虽小,但被监控设备类别多、品牌杂、型号多。
(2)被监控设备应用面窄,大多仅限于机房使用,与楼宇自控的控制对象往往不同。
(3)机房设备由于安全性要求很高,因此主要以监视为主,控制需求较少,以避免误操作带来的风险。
三、环境动力监控系统的结构组成
机房环境动力监控系统由现场传感器和检测设备、通信设备、上位机和软件组成。其中上位机和软件处于核心地位。整个系统主体上是基于PC的(PG-Based)控制结构。机房环境动力监控的特点是以监视为主,采集的数据需要进行处理如报表、各种报警、打印、数据记录等。因此监控软件的核心功能之一就是采集数据。它和采集数据的硬件设备的通信方式主要可归纳为三种。
(1)标准通信协议。常用的标准协议有:ARCNET,CANBus,DevjceNet,LonWorks,Modbus,Profibus。
(2)标准的资料交换接口。常用的有:DDE(dynamicdataexchange)、
OPC(OLEforProcesscontrol)。使用标准的资料交换接口。
(3)绑定驱动(nativedriver)。绑定驱动程序是针对特定硬件和目标设计的驱动。
四、机房动力环境监控系统实现的功能
监控系统需要实现的主要功能和楼宇自控项目基本相同,概括起来有以下几个主要方面。
(一)集中实时监视功能
传统的机房管理采用的是每天定时巡视的制度,比如早晚各一次检查,并且将设备的一些核心运行参数进行人工笔录后存档。这样取得的数据只限于特定时段,工作单调而且耗费人力。而集中实时监控功能可解决此问题。
比如对于UPS电源的运行,用户一般比较关心负载功率、总体负载率、三相是否平衡等参数。
如果没有集中监控,用户需要分别到机房内的配电室,现场查看UPS的相关运行参数。而实时监控系统通过通信采集设备将当前被监视设备的运行参数采集上来,实时显示在监控电脑屏幕上,免去了用户到不同的设备跟前查看数据的麻烦,如果有必要,随时都可以在办公室内查看。
(二)报警和事件功能
报警指机房运行中出现异常情况,比如停电事故、漏水事故等。报警的发生意味着机房的运行受到影响,其严重程度可用"优先级"的概念来定义。一般监控系统均可设置几十到上千个优先级以区别报警的严重程度。机房内的报警优先级一般划分为10级即可。
事件指机房运行中发生的一些正常的状态改变或人为操作。事件不是异常情况,因此不需要像报警一样立即通知用户进行处理。但是往往需要进行记录,以便日后检查。比如修改精密空调的设置温度,这就是一个正常的操作事件,但对修改时间、修改人的这些信息进行记录是有必要的。
报警功能是机房动力环境监控系统最重要的一项功能,原因在于机房内设备和系统运行的安全性要求很高。报警发生后,系统应对报警事件进行记录,并迅速通知值班人员或管理人员进行处理。报警发生后,一般按以下步骤来进行处理:
(1)通知。首要的是将报警信息告知给相关人员。
(2)确认。表明已经知道报警的发生,正在处理。但此时报警仍然存在,没有消失。
(3)消除。经过处理,故障消失,设备恢复正常,报警也随之消失。报警的通知主要采用以下几种模式来实现。
1.屏幕显示报警
这是最基本的方法,但也往往是报警信息最详尽的模式。通过在监控电脑屏幕上显示醒目的图案和文字来告知用户。报警文字是关键的信息,一般至少需要明确指出每次报警的几个关键参数:报警时间、报警设备、故障内容、优先级、紧急解决办法等。其中紧急解决办法是一个很有必要的功能,因
为机房内的辅助设备种类多,最基本的紧急解决办法就由专业人员尽速响应和处理,因为报警涉及配电、UPS电源、空调、消防等几个系统,现场值班人员并不能对每种设备都精通,因此能在第一时间给出紧急处理办法是非常必要的,甚至一个故障设备厂家的维护电话号码都能解决大问题。
屏幕报警的缺点在于,如果监控电脑旁没有人,或者没有人注意,则报警可能被延误。
这种模式的报警通知面比较小,不能及时传播给专人。这种报警模式如果结合网络传输,会提高效率,后面章节将会予以介绍。
2.本地语音报警
当报警发生时,监控系统自动通过扬声器播放报警语音,将报警消息传递给现场人员。其传递消息面比屏幕显示报警要广,但也限于一个房间内。其优点是非常人性化,缺点是传播面仍然不广,而且不能定人传播。
3.电话拨号报警
当报警发生时,监控系统自动通过电话网,拨通系统预设的号码,对方接听后,自动播放报警语音,通过电话将报警消息传递给相关人员。
这种模式的优点是能够实现定人播报。如果和管理责任人结合起来,会有比较好的效果。比如管理UPS和电源系统的人员是A,管理空调系统的人员是B,还有其他几个人C、D、E也帮助进行辅助管理。则当发生UPS故障后,系统直接拨打A的电话,减少了中间环节。但是实现此项功能,监控系统必须具备以下几个能力,否则效果会大打折扣。
(1)具有线路是否通畅的判断能力。当拨打的电话号码占线,系统自动停止这个号码的拨号。
(2)具有接听者是否接听的判断能力。当接听者接听后,系统开始播报报警语音。
(3)具有确认机制。当接听者接听后,需要按下某个预先定义的按键进行确认操作,表明他已明确知道这个报警的内容。
(4)具有连续重拨的功能。例如,当系统拨打A的手提电话,如果占线或不在服务区,则自动按