Radware AD 巡检手册 V1.0
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Radware负载均衡设备
巡检文档
1.1负载均衡检查(Radware AD)
1.1.1数据备份
检查项目:Radware AD数据备份
检查目的:及时备份数据,确保设备故障时能及时恢复
检查步骤:
登陆,即AD的物理接口ip登录到AD,执行以下操作:File
→Configuration→Receive from Device;
点Set,保存;将配置文件进行存档。
如下图所示:
检查标准:数据正常备份。
异常处理:如果无法备份,需要尽快定位问题。
1.1.2软件版本检查
检查项目:软件版本检查
检查目的:确保Radware AD版本合乎要求,并且主备AD版本一致
检查方法:登陆,即AD的物理接口ip登录到AD,执行以下操作:Device
→Device Information;(也可以输入命令system dev-info)
检查标准:
在现网的设备只允许使用AD build89 或者AD Build106版
本,且主备两台AD的版本必须一致
1.1.3运行服务器状态检查
检查项目:服务器的运行状态
检查目的:确保服务器各节点状态正常
检查步骤:
登陆,即AD的ip登录到AD ,点击Device→Device Information
观察各Virtual Server的状态。
如下图所示:
检查标准:各Virtual Server的状态均正常(绿色打钩图标)。
异常处理:
如果有节点down掉了(红色叉图标),先确认是不是AD把它
给shutdown掉了,如果不是在去查节点的问题,然后进行处
理。
1.1.4主备状态检查
检查项目:AD的主备状态
检查目的:确保两台AD处于正常主备状态
检查步骤:登陆,即AD的ip登录到AD ,点击AppDirector→Redundancy
→VRRP→Virtual router观察各接口VRRP的状态。
,观察AD显
示的状态为一个master,一个standby(也可以在命令行输入
redundancy vrrp virtual-routers)。
如下图所示:
检查标准:
从图形界面登录到AD,观察两台AD的主备状态一个为master,
一个为backup
异常处理:
如果是双active,需要检查各接口Priority,主设备为priority为
200,备设备为100。
如下图所示:
1.1.5Fatal log日志检查
检查项目:AD的Log
检查目的:确保系统正常运行。
检查步骤:
从图形界面分别登录到两台AD,观察两台的Service->Event log
如下图所示。
其中System记录了一些重要的日志:
检查标准:没有异常的异常的资源告警日志或者Crash日子等。
异常处理:根据异常的记录,分析异常发生的原因,相应处理。
1.1.6Syslog log日志检查
检查项目:AD的Log
检查目的:确保系统正常运行。
检查步骤:
查看syslog 服务器上的系统日志,(在build 106的版本上可
以记录系统日志在本地,使用manage trap-logging view-log命
令进行查看)
检查标准:没有异常的操作记录、健康检查记录等。
异常处理:根据异常的记录,分析异常发生的原因,相应处理。
备注:如果没有使用日志服务器的,在Radware AD服务器上设置日志服务器地址。
如果没有syslog服务器,可以配置本地日志。
建议本地日志仅在分析故障时使用。
这个功能仅在1.07.11DL build 102版本后可以使用。
进入Services -> Trap Logging
Trap Logging: 本地日志状态
Minimum Severity for Trap Logging: 本地日志的保存级别,info表示info 级别以上的信息全部记录,包括端口up/down,服务器up/down等信息。
Traps Log File Size :本地日志保存的条目数,默认为1000条,满了自动删除以前日志
命令行配置如下:
AD-Master# manage trap-logging status set 1// 开启日志记录
AD-Master# manage trap-logging file-size set set 1000
AD-Master# manage trap-logging view-log // 用来查看日志
AD-Master# manage trap-logging clear-log// 没出现问题时,经常清空一下,方便查看
1.1.7CPU利用率检查
检查项目:cpu利用率
检查目的:确保系统的cpu使用情况
检查步骤:
登陆,即AD的ip登录到AD ,点击Performance→Element
statistics→Resource观察Resource Utilization:值。
(或者使用命
令system os cpu命令)
检查标准:看cpu的利用率是否超过80%。
异常处理:
如果cpu的利用率出现过高的情况,就要根据情况进行相应的
处理
1.1.8链路端口传输质量检查
检查项目:传输质量检查
检查目的:确认所有物理端口是否有丢包和错包
检查步骤:
登陆到AD的命令行界面,使用命令sys nf-stats,查看有没有
丢包和错包的记录。
检查标准:没有异常的丢包和错包的记录
处理:如果端口有丢包或者错误,观察数据是否增长,一旦发现增长,需要检查交换机端口和radware设备端口的双工、速率是否正常
判断该互联链路是否正常
1.1.9NHR质量检查
检查项目:默认路由下一跳可达检测
检查目的:确认路由下一跳正常
检查步骤:登陆,即AD的ip登录到AD ,点击Router→NHR
Table观察Oper status:值。
检查标准:Oper Status 正常情况下Active的,如果是其它状态,检查下
一跳设备是否正常。
1.1.10硬件状态灯检查
检查项目:硬件状态灯检查
检查目的:确保硬件没有显示异常现象
检查标准:
查看电源指示灯、风扇指示等、系统指示灯。
硬件
平台
ODS1/ODS2/ODS3AS2/AS3AS4/AS5
PWR 1)指示灯绿色:表示正常
2)指示灯红色:表示一个电源
有故障(双电源的情况)
1)指示灯亮,表示设备加
电
1)指示灯亮,表示设备加电
FAN
1)指示灯绿色:表示正常
2)指示灯红色:表示一个或者
多个风扇有问题
1)指示灯灭:正常;
2)指示灯亮:表示风扇有
问题,不工作;
1)指示灯灭:正常;
2)指示灯亮:表示风扇有问题,不
工作;
SYS
1)指示灯:绿色表示正常
2)指示灯:红色表示正在启动
或者有告警(如温度过高)
1)指示灯亮:设备运行正
常;
2)指示灯灭:表示设备有
问题
1)指示灯亮:设备运行正常;
2)指示灯灭:表示设备有问题或者
有问题;双电源时,其中一个电
源有故障,led灯闪烁
异常处理:
如果发现有指示灯闪烁或者异常,对现场电源进行检查,如果
处理不了,及时和厂家联系。