数据中心Uptime Institute国际认证工作创新
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
link
严世清
甘肃紫金云大数据开发有限责任公司
严世清(1985-)男,甘肃武威,西安电子科技大学计算机科学与技术,主要从事数据中心建设管理,数据中心IT运维工作及网络安全管理方面的工作;刘炜(1982-)男,甘肃张掖,中共党员,电子科技大学工程硕士。主要从事数据中心规划、项目建设管理、招投标合同管理,从事数据中心
中国科技信息2020年第15期·CHINA SCIENCE AND TECHNOLOGY INFORMATION Aug.2020科技工作
电失压脱扣模块;消防负荷与普通负荷(如照明)不同时使用,普通负荷用电量大于消防负荷,因此消防负荷未计入负荷计算中。
(3)辅助电源
每台柴油发电机机组均要有对应的辅助用电,如电加热、电池充电、控制电源等,辅助用电设施单独配置ATS进行末端互投,当其中一台发电机组配套ATS检修时,不影响其他N台发电机组的输出能力,同时辅助电源只是在机组待机状态下,为机组提供加热电源与充电电源等,机组运行时对其维护不影响机组正常运行。
(4)控制系统
油路控制柜为两套独立PLC控制柜,两套设备独立物理分隔,分别布置在两个机柜内,一主一备相互独立运行,现场电气设备及仪表设备信号一分为二,分别接入两套PLC 控制系统中。主控制柜运行时持续给备用控制柜一个DO电信号,此时备用控制柜组态程序不工作。当主控制柜故障或遇检修,此时主控制柜运行电信号中断,备用控制柜接收不到此电信号的同时开始运行本柜组态程序,保证油路控制安全可靠。两套系统也可通过手动进行切换,满足维护检修需要。
主控制柜与备用控制柜之间的DO信号传输由一用一备两组通道实现,主备两组通道之间通过控制电缆连接。工作时,DO信号通过一组通道及电缆传输,当要维护或拆除时,可通过操作面板设置,将此DO信号转至另一通道及电缆工作,此时此无信号传输的电缆不带电拔掉对应通道的保险,可直接拆除,不影响整个系统工作。即使主控制柜与备用控制柜之间的主备两通道和联络电缆都失效,也仅会出现主控制柜与备用控制柜同时工作的情况,整个油路控制系统不会失效。
(5)启动及并机控制
柴油发电机系统并联控制系统处于自启动状态,当两路市电故障后,机组接到启动信号,所有发电机同时启动,首先达到90%的额定电压和频率的主机通过断路器连接到应急母线,待所有机组都满足要求后,向10KV母线输出负荷,全部机组并联启动并满足带载条件的时间,应该小于UPS 持续供电时间,同时当小于机组额定功率的80%时应自动解除并机至关机状态,当额定功率再次高于80%时自动启动机组投入并联供电,避免负荷动态变化时,发电机启动滞后引起的超负荷运行风险。
(6)进气及排气系统
发电机房的新风、排烟系统需要根据发电机组自身的空气需求量、废气排放量、热量散发要求设计,不会出现堵塞、和送风短路,同时进排风百叶与油机电气联动,油机启动时电动百叶也随之启动,电动百叶还应该设置手动装置,满足在故障情况下手动开启,电动百叶系统供电应采用UPS系统供电,当发电机运行时,如果电动百叶窗无法开启,对应发动机组应该发出报警,此时人为启动电动百叶窗,油机再启动,不会影响其他油机的运行。
(7)耗油量、供油量计算及回油控制
柴油发电机系统耗油量应按照机组满载耗油量计算,室内、外配置油箱,同时考虑供油泵流量及供油管管径大小、极限温度对油品的影响(如本项目设置N台油泵,按照目前容量计算,N-1台油泵运行即可满足供油量要求,油泵具备启动、手动切换两种模式,其中一台油泵停止工作不会影响柴油发电机系统整体供油量,另外供油泵的电源也满足可在线维护需要,同时供油管路也是2N设置),现场温度变化会导致柴油体积及流速发生变化,设置了余量以满足要求。
供油控制系统与消防系统联动,当供油控制系统接收到消防控制室消防报警信号时,控制系统自动打开油箱供油主管上紧急切断阀,并且关闭所有供油泵,自动开启通向地下油罐的紧急泄油阀,回油管路采用环路系统,消防控制系统控制信号在正常维护拆除时不会对相应的其他系统造成影响。
市电接入
(1)高压系统直流电源
数据中心市电采用不同变电站双路由接入,每套高压系统的直流电源单独物理隔离,任何一套直流电源退出运行,都不会影响整个系统的供电安全,每套直流电源前端交流电引自两路独立的电源。
(2)高、低压系统ATS切换
高、低压部分ATS设备在检修时,不影响其他设备正常运行,同时控制器电源满足在线维护需要,涉及的设备控制器集成在ATS内部,电源取自本配电室直流电源。
空调系统
(1)设备选型
数据中心空调设备选型时除了注重PUE能耗指标外,我们还考虑了耗水量,空气清洁程度对空调主机的影响。
(2)负荷
数据中心总制冷负荷包括IT机房、UPS室、运营商接入室、设备本身、蓄冷罐热损、管道热损、走廊热损等,并扣除机械公差,同时满足近20年的极端最高干球温度和极端最高湿球温度。空调主机及管道在极端最低温度下正常运行,配置了保温防冻措施及管道电伴热系统,同时应该满足可在线维护需要。
(3)控制系统
空调群控控制器及其控制链路满足可在线维护需要,控制器、控制电源,还有相应控制接线必须满足可以在维护时进行隔离或拆除,每一台风冷冷机及蒸发冷冷机设置一套DDC,采用N+1形式;水泵控制采用2N设置两套DDC 互为备份;分集水器采用2N设置两套DDC互为备份,控制箱内电源及信号标准电压均不超过24V,为安全电压,线缆拆除不会影响人身安全。
(4)补水、新风系统
补水量包括了蒸发补水及加湿补水,补水池容积通过详细计算且留有余量,修建两个补水池互为备份,补水泵的数量及其配套电源满足可在线维护需要,同时考虑了新风系统的送风量及温度对数据中心的热负荷影响程度。
消防系统
消防报警联动系统对数据中心的IT负荷没有联动控制,
CHINA SCIENCE AND TECHNOLOGY INFORMATION Aug.2020·中国科技信息2020年第15期
科技工作
即在火灾发生时,消防报警联动系统不会把数据中心的IT负荷自动切除(如果火灾蔓延到一定程度,需要切除相应电源以进行灭火操作时,可以在数据中心配电房或动力中心配电房人工切除相应电源)。消防报警联动系统对制冷系统有联动控制,某一区域的发生火灾,消防报警联动系统对该区域的每个空调末端配电箱(柜)发出单独一对一的信号,通过脱扣联动切除该区域内的空调末端电源,屋顶空调水泵房如果发生火灾,消防报警联动系统对每个冷冻水泵及屋面上的风冷空调设备和蒸发冷却空调设备配电柜发出单独一对一的信号,通过脱扣联动切除该区域内冷冻水泵及屋面上的风冷空调设备和蒸发冷却空调设备电源。
以上是作者总结涉及认证的关键技术要点,其实T3的可在线维护可以通俗的理解为“数据中心所在地的极端气候和海拔条件下,所有基础设施和系统都能够经得起不停机检修和单个设备的停机运行”,要达到以上条件前期是对设计人员的考量,后期是对建设和承建单位专业技术人员的考量,同时设计认证工作难度还表现在设计认证开展时、开展中部分设备已经采购,在提交已经采购设备参数的同时,需要不断对数据中心配电、空调制冷、智能化等系统的架构、计算书进行调整,以满足 T3可在线维护级别要求,因此紫金云数据中心在开展设计认证工作的同时,也做了部分建造认证前的准备工作,同时在设计认证中还包括后期开展运维必要开展的措施。
数据中心在设计过程中设计人员和咨询单位积极与认证方沟通协调,在2017年12月到2018年6月之间,对图纸及不同系统的相应计算书审核,包含综合设计院图纸,系统计算书方案等,汇总提出整改意见共76项,设计图纸调整近百条。这期间设计人员、咨询方、承建单位、紫金云公司各专业技术人员通过电话会议、电话沟通、邮件往复形式,多次进行技术细节确认,讨论解决缺陷问题352项,其中柴油发电机机组120个、电源系统90个、暖通空调系统110个、智能化系统32个,整理审核设备厂商图纸总计289份、技术文档手册总计32份,完成审查电气图纸37张、电源图纸49张、暖通图纸22张、空调补水图纸8张、中低压配电图纸50张,同时精准审核变压器负荷、IT机柜负荷、精密空调负荷、制冷系统负荷、建筑负荷、油机选型负荷等,通过这次认证无论是设计院、咨询方以及建设单位的专业技术人员对整个数据中心的各个系统有了根本性认识,给后期运维工作打下了坚实的基础。
管理方面通过进度、质量、安全、干系人、变更、人力资源、资料版本等项目管理方法、切实有效的对认证过程中囊括的一切问题进行管理,从而有效保障认证工作最终审核完成,其中沟通管理尤为重要,涉及的设备数量多,项目干系人也随之较多,如:风冷空调、间接蒸发空调、水泵、土建施工单位、机电安装单位、柴油发电机主机、柴油发电机安装单位、变压器、高低压配电柜、UPS、空调群控、消防系统等,每项设备都对应有1~2名技术支撑人员,因此在认证工作开展之初就充分分析各自的沟通需求,对认证涉及的干系人进行分类,公司成立UI认证工作小组,咨询方、设计院根据专业划分成立项目小组,同时编制干系人通讯录,并定期更新。审核结果反馈的是英文审核报告,翻译后的解释存在很多歧义,充分理解审核顾问提出的问题非常关键,沟通采用多样化的方式,组织电话会议、视频会议,现场工作研讨会形式,并且根据会议讨论情况及时形成统一意见,将未采购的设备参数及需求和需要落实的变更,通过合理化流程及时的反馈给公司采购部门及机电安装单位,通过及时通讯工具及时分发更新信息,在本次项目出现过几次更新版本未及时分发给相关干系人,认证资料不统一情况发生,后期认证过程中及时采取编号等方法统一相关认证资料,并且在提交前使用云盘存储,由设计院、咨询方、各厂家下载后反复确认资料版本。
暖通空调、电气、智能化、消防等基础设施的一个严谨的综合体,在设计与建造过程中任何微小的失误都将为数据中心基础设施的安全可靠运行造成不可估量的损失。在本次认证中,通过初审、提交、UI顾问审核提出修正意见,反复多次,共计消除隐患352项,组织会议共计17次,各方参加人员42人,历时13个月,认证小组中抽调的专业技术人员也对数据中心有了系统性、全面性的认识,对专业内的增强可靠性从反复探讨到最终确定,有了深层次的体验和感受,锻炼了基础设施安全可靠的思维意识,提升了专业工程师从细微之处系统性的思考问题,为数据中心基础设施可靠运行,打下了良好的基础,是确保关键设备和装置能安全、稳定和可靠运行而设计配置的基础工程,为数据中心的系统设备运营管理和数据信息安全提供保障环境,提升云计算、大数据、人工智能等业务的稳定运行。
Uptime认证一方面是验证设计目标的符合度,另一方面也是对数据中心安全可靠运行的深度补充,近几年高标准的数据中心已经成为行业发展趋势,云计算及传统IDC产业正在逐步走向红海市场,高标准的数据中心也会成为未来市场竞争的基础门槛。