华为公司双机容灾解决方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关于因机房温度过高导致HP小型机
宕机的说明和建议
中国惠普有限公司
1.H P小型机的降温和感温工作机制
1.1工作原理
惠普Superdome、rp8400、N、L系列小型机降温部件是大功率风扇,其中Superdome有六个风扇,rp8400前后共有21个风扇,N、L系列主机本身都有8 个风扇,前后各两个,侧面有四个。另外,机器的每个电源都各自带有一个风扇。Superdome、rp8400、N、L 系列的感温和控温原理是相同的,所以我们以N系列为例来阐述其工作机制。
惠普N系列小型机感温部件及风扇控制部件都是一块叫做“Platform Monitor board”的监控卡。图1 是这块卡的实物照片,它还负责监控和记录系统各部件的运行状况,包括系统电源,处理器,内存等等。
图 1 Platform Monitor board 实物图
图2 是它的电路连接图,可以看到Platform Monitor board是
图2 Platform Monitor board 电路连接图
块功能强大的卡。其中它的U15就是一个温度感应器,专门感应环境温度(机房温度)。通过这个温度感应器,Platform Monitor board可以通过改变机器自带8 个风扇的转速,来调整机器的温度。电源的风扇转速不被其控制,但一旦电源风扇出问题,Platform Monitor board 可以及时监控到,并作出相应的动作。
图3是N系列主机的俯视图,图中红色的部分是Platform Monitor boar。
图3 N系列主机的俯视图
1.2 HP小型机的数据保护功能
当室温在31摄氏度以下,感应器认为机房温度处于Normal(正常)状态。当室温超过31摄氏度,Platform Monitor board就会通过提高风扇转速来提高机器散热能力保持机器正常运行。同时它会发出一个OVERTEMP_CRIT的信号给系统板的“Ralf”芯片,“Ralf”就会将“Dillon”芯片的错误寄存器中的一位置位。“Dillon”会发一个中断行给一个叫“Elroy”的IO 芯片。最后“Elroy”会发一
个中断请求给操作系统。当操作系统受到这个中断请求(或者每隔10秒它会去检查“Dillon”寄存器的状态),它会通过PDC(processor dependency code)去访问“Dillon”寄存器并得到错误状态。然后操作系统会把这个出错消息发给一个叫做“envd”的守护进程。(“envd”这个守护进程主要监控室温和机器的风扇运行状况,通过改变它的配置文件“/etc/envd.conf”,可以对其进行一定的控制)再由“envd”做出相应的动作。当发出OVERTEMP_CRIT信号(超过31摄氏度)时,“envd”的缺省反应是不做动作,
但可以通过改变“/etc/envd.conf”来执行用户所需用的动作。
当室温超过35摄氏度,Platform Monitor board 会发出一个OVERTEMP_EMERG 的信号,通过以上相似的过程最后发给“envd”。这时
“envd”的缺省反应是执行“/usr/sbin/reboot –qh”来关闭机器。我们也可以通过
改变“/etc/envd.conf”来执行用户所需用的动作。
当室温超过40摄氏度,Platform Monitor 就会直接关闭系统的电源。同
时发出log给系统的错误寄存器。
综上所述,HP这样设计的目的在于万一因意外事故导致机房温
度过高,小型机能够保护用户的数据不至于丢失,保证数据安全性,而且具有用户参与控制的灵活性。实际上,不仅仅HP,业界其他
UNIX 服务器生产商也遵循这一设计思想。在具体实施过程中,用
户可以通过改变“envd”的配置文件“/etc/envd.conf”,来控制系
统超过31摄氏度和35摄氏度的动作。
2.HP小型机同类产品的比较
惠普小型机秉着惠普公司一向所追求高标准,高要求的宗旨,在出厂前全都经过严格测试,在性能指标的各个方面达到或者超过业界标准。在业界受到一致好评,在电信、金融、制造业等等各个重要行业得到了广泛应用。借此,惠普公司保持了其在小型机市场上的优势。
SuperDome,Rp8400, N,L 系列小型机在温度方面的性能如表一:
表1 SD,rp8400,N,L 系列小型机温度指标
和业界其他的著名厂家的同类产品比较处于同类标准,表2 是业界同类产品的温度指标比较:
运行温度(摄氏度)非运行温度(摄
氏度)
温度最大变化率
HP 公司
SD,rp8400,N
系列
5 --- 35-40 --- 7020 摄氏度/每小时
从上表可以看出,各UNIX服务器主要厂家的主流产品的指标没有显著差
别,所以惠普公司小型机在温度指标方面是完全符合业界公认标准的。
详细的各厂商性能参数请查阅下列网址:
HP rp8400:
/prodserv/server/unix/rp8400/guige.htm
Sun 10000:
/servers/highend/10000/spec.html
IBM RS6000M80:
/cgi-
bin/master?request=salesmanual&parms=SMS&xh=HOwifi5J6H1wci1USenG
nN9332&xhi=salesmanual%5E&type=HARDWARE&search=M80&title=T&
product=
3.对机房环境的建议
机房通风设计的最佳方案是采用机房专用空调,地板下送风,天棚上抽风,
形成空气循环。由于HP 小型机均是从前面吸入冷空气,从后部排风散热的方式,所以最好在每排机柜前开设送风口。且前后排设备之间必须拉开足够距离。切忌两排设备间距过小导致后排设备吸如前排设备排出的热空气。请参阅后图: