数据中心UPS维护及典型案例分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
运行维护管理
UPS维护及典型案例分析
张雨默,金婷,孔庆楠
(中国移动通信集团吉林公司网管中心,吉林
随着大数据、人工智能、云计算等新兴信息技术的不断发展,作为新技术重要载体的数据中心重要性作为数据中心的重要后备电源设备,系统并机总容量不断扩大。
高频电子元器件
的维护带来的新的问题与挑战。
文中结合数据中心大容量UPS
数据中心;不间断电源;实际案例
UPS Maintenance and Typical Case Analysis of Data Center
ZHANG Yu-mo,JIN Ting,KONG Qing-nan
China Mobile Communications Group Jilin Co.,Ltd.,
development of big data、artificial
emerging information technologies, the importance of data center as an important carrier of new technologies is becoming more and more prominent,As an important backup power supply equipment in the data center, the total capacity of
典型案例——某数据中心塔式UPS功率模块
UPS系统组网
某公司数据中心电源系统采用UPS供电,UPS 为高频塔式机,系统组网为1+1并机供电方式,即两通过系统并机为后端负载供电,当1台故障时,另一台设备在不超载前提下可独立为系统供电,如图
数据中心维护人员在对动力机房新入网UPS进行巡检过程中发现一台UPS上报“整流器去饱和故障”,“快速去饱和”,“整流器故障”告警,经过对UPS 设备运行状态检查,确认设备处于电池逆变状态并且
小时。
3 故障处理过程及原因分析
故障处理过程
维护人员迅速采取处理应急措施,通过厂家提供的系统调测软件进行现场调试,从故障UPS导出运行模拟量、历史记录、节点数据信息等。
由于系统并机供电并且后端业务量较小,出于保护UPS 的目的,将发生故障的UPS进行完全下电。
根据设备故障记录,判断出故障发生在C相功率模块;检内外器件及连接,未见异常,对故障UPS预
出现“整流器去饱故障”和“降压升压器过流”,通过以上操作,确认C相功率模块,存在硬件故障,经过下电检查,发现整流信号板上电阻烧坏;判断出故障发生在C相功率模块。
本着优先恢复供电原则,更换新的功率模块,由于功率模块体积较大、重量较重导致更换时间较长,
个小时完成全部更换工作,更换后重,系统恢复正常运行,经检测无异常后重新并机投入系统使用。
3.2 故障原因分析
维护人员到达现场后,通过主机面板确认当前告警信息为“UPS快速去饱和”、“整流器故障”
流器去饱和故障”。
通过故障代码查询
义确认为C相整流模块过流故障导致。
信息及故障代码如图2所示。
图2 UPS故障报警信息及故障代码
通过上述主机告警信息及故障代码基本确定故障点为C相整流模块。
导致UPS整流模块报过饱和告警通常情况下有如下几种可能:
(1)功率模块整流侧IGBT短路;
(2)功率模块整流侧IGBT接口板故障;
(3)功率模块整流侧IGBT驱动板故障;
(4)IGBT驱动板与信号接口板间驱动电缆连接异常。
基于上述可能故障原因依次对
动电缆连接情况、IGBT驱动板、接口板外观进行初步排查。
由于IGBT模块为于接口板和驱动板下方,在不对模块进行拆解的情况下无法目视确认并做进一步检测,故最后进行确认。
对功率模块进行检查时发现整流侧的IGBT接口板上的R2电阻存在明显过流烧蚀痕迹。
通过查阅接口板电路图得知
的G极驱动电路通过R2电阻与IGBT
由于与IGBT模块串联的R2电阻已经过流失效,推断对应的IGBT模块失效的可能性很高。
故现场完成功率模块更换维修后,将C相功率模块做进一步拆解分析,如图3所示。
经对故障模块进行进一步拆分解析后,并对IGBT模块进行测量,确定C相功率模块中有一个市电电源
整流器1整流器2
电池组1电池组2逆变器1
交流旁路静态开关1
逆变器
静态开关1
交流旁路
静态开关2
逆变器
静态开关2
配电柜
负载
逆变器2 1+1
并机板
1+1
并机板
UPS-1UPS-1
维修旁路1
维
修
旁
路
2图1 1+1并机供电系统图
2020年9月第37卷增刊1
Telecom Power Technology
Sep. 2020,Vol. 37 No. S1 张雨默,等:数据中心UPS维护及
典型案例分析
IGBT模块失效。
对失效IGBT模块外观进行检查,无明显损坏痕迹。
失效IGBT电测试结果为上桥臂GCE 极短路,下桥臂特性正常。
进一步对失效IGBT模块进行拆解检查发现IGBT内部结构正常,上桥臂并联的4只IGBT芯片中,有2只损坏,如图4所示。
图3 IGBT接口板上R2电阻及在电路中位置
图4 故障IGBT模块内部失效情况
除去IGBT模块内部的硅凝胶后观察:损坏的芯片中间有一个严重烧毁点,该点芯片融化形成熔坑,熔坑附近的门极总线上有明显的击穿点,周围芯片碎裂分层。
通过对失效IGBT模块进行拆解分析可知,失效样品外观完好,结构正常,电特性表现为上桥臂GCE极间短路。
从芯片烧毁情况看,属于芯片局部瞬间发热,造成的芯片膨胀碎裂,可以排除过电流失效的可能,从门极(G极)总线上的击穿点看,门极过压可能性较大,门极过压后,导致芯片内部元胞击穿,芯片短路后进一步烧毁。
4 IGBT保护电路分析
故障初步定位为门极过电压,由此引发IGBT的保护问题。
IGBT是一种新型电力电子器件,具有电压高、电流大、频率高、导通电阻小等特点,但是它的耐过流与耐过压能力较差,在设计中需要时刻注意对IGBT进行电路保护。
主要从过流保护与过压保护两方面进行分析
4.1 过电流保护
IGBT的过电流保护主要分为过载保护与短路保护两种:(1)过载保护,过载电流较小,为1.2~1.5倍额定电流;(2)短路电流为8~10倍额定电流。
过电流保护基本原则为通过电流检测装置,一旦检测到电流超过设定值后,封锁逆变装置中所有驱动器驱动信号,区别为短路保护响应时间远远短于过载保护。
过电流两种情况对比分析如表2所示。
表2 过电流两种情况对比
过流电流检测响应时间
过载保护过载电流为1.2~1.5倍额定电流较块
短路保护过载电流为8~110倍额定电流非常快
4.2 过电压保护
IGBT在由导通状态转换至关断时,电流突然变小,由于电路中存在杂散电感与负载电感,IGBT的集电极(C)、发射极(E)两端产生很高的浪涌尖峰电压u=L d i/d t,加之IGBT的耐过压能力较差,这样就会使IGBT击穿。
过电压保护主要可从以下几方面入手:
(1)尽量减少系统中杂质电感。
(2)采用吸收回路,吸收IGBT关断时释放的能量,降低关断电压。
(3)适当增加栅极电阻。
目前在工程上主要通过在门极(G)和发射极之间增加稳压管或者瞬态抑制管(TVS)来吸收尖峰电压,上述故障中故障电阻即为门极电阻。
5 维护措施及建议
IGBT本身的不稳定性及在高频UPS中的大规模应用,此类故障将还会发生。
因为数据中心业务的重要性这对维护人员提出了新的要求。
(1)快速地故障定位能力,当故障发生时能够通过告警快速分析故障原因,进行故障定位。
(2)娴熟的设备更换操作,上述故障中,由于故障模块重量与体积均较大,具有丰富维护经验人员尚需更换3个小时,一旦经验技术不足,将严重影响故障恢复时间。
(3)严格的设备入网测试流程,对新入网设备开展严格、详细的入网测试,带载测试、功能测试、出厂报告检查等全面进行,保证入网设备的性能完好性。
(4)通过已发生故障与厂家积极沟通协调,将现场问题及时反馈给设备商,尽早解决。
6 结 论
本文介绍了UPS发展现状及趋势,同时结合实际案例分析了数据中心UPS故障原因并进行总结,为数据中心UPS维护提供了相关经验。
信息技术的大发展,数据中心承载业务必将越来越多,UPS作为重要电源设备,其维护任务重要性不严而喻,维护人员应充分总结维护经验并不断探索新方法,确保数据中心电力供应的稳定性与可靠性。