HP-UX MCSG日常维护手册
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
HP MC/SG日常管理操作
太极计算机股份有限公司
2008/02
目录
1.管理Cluster和Package (3)
2.日常操作系统备份 (4)
1.基本管理Cluster和Package
管理Cluster和节点
1)启动Cluster
# cmruncl -v
# cmruncl -v -n node1 -n node2
2)在已运行的Cluster中增加一个节点运行
# cmrunnode -v node2
3)在已运行的Cluster中停止一个节点运行
# cmhaltnode -f -v node2
4)停止整个Cluster
# cmhaltcl -f -v
5)对Cluster进行重新配置
停止整个Cluster
如果要改变CLUSTER LOCK VG,则 # vgchange -c n vg01
# vgchange -a y vg01
重新进行配置工作
cmapplyconf
cmruncl
管理Package和Service
1)启动Package
# cmrunpkg -n node1 pkg1
# cmmodpkg -e node1 pkg1 //把切换属性置为yes.故障发生后//可以自动
切换。
//要注意
2)停止Package,不切换
# cmhaltpkg pkg1
3)移动Package
# cmhaltpkg pkg1 -n node1
# cmrunpkg -n node2 pkg1
# cmmodpkg -e pkg1 //让package可以切换
4)对Package进行重新配置
停止整个Cluster
修改配置文件
修改control.sh文件(注意保证所有节点一致)
cmapplyconf
cmruncl
4)查看运行情况
# cmviewcl -v
2.日常操作系统备份
make_tape_recovery可以创建一个能自启的磁带镜像,包括在root卷集中有选择的关键的文件和目录。
如果root卷集中的任何磁盘坏了,可以用磁带恢复到一个最小的系统,从磁带启动将会完成下面几项:
1,在root盘重建启动区
2,在vg00里的磁盘上重建逻辑卷和文件系统
3,恢复已选择的关键文件和目录到root盘
前提条件
1,确保安装了Ignite-UX
make_tape_recovery是Ignite-UX的一个部分,在HP-UX的标准安装中没有捆绑,需要用户自定义安装。
安装完毕之后,可以通过命令“swlist”查看是否存在:
2,确保磁带机和主机连接且状态良好
通过命令“# ioscan -fnCtape”查看磁带机状态:
# ioscan -fnCtape
Class I H/W Path Driver S/W State H/W Type Description
=====================================================================
tape 0 X/Y/Z/A.B.C stape CLAIMED DEVICE HP C5683A
/dev/rmt/0m /dev/rmt/c0t0d0BESTn
/dev/rmt/0mb /dev/rmt/c0t0d0BESTnb
/dev/rmt/0mn /dev/rmt/c0t0d0DDS
/dev/rmt/0mnb /dev/rmt/c0t0d0DDSb
/dev/rmt/c0t0d0BEST /dev/rmt/c0t0d0DDSn
/dev/rmt/c0t0d0BESTb /dev/rmt/c0t0d0DDSnb
注意:1.如果这里看不到上面的/dev/rmt/0m,/dev/rmt/0mn等,需要用insf –e 重新生成特殊设备文件。
2.如果可以看到上面的设备文件,但还是无法使用,可以通过:
l通过rmsf –H X/Y/Z/A.B.C(X/Y/Z/A.B.C按实际的命令输出填写),之后再用insf –e。
l或用清洗带清新一下磁带机,如果长时间磁带机没有使用,有时也会出现无法使用磁带的情况,之后重复用ioscan –fnCtape查看是否可以有设备文件,以及insf –e重新生成
特殊设备文件。
3,当用ioscan –fnCtape看到上面显示的正常输出后,放入磁带,通过“tar”命令测试磁带机是否可用
# tar -cvf /dev/rmt/0m myfile
执行命令make_tape_recovery –Av测试是否能对系统进行备份,以下是整个备份过程:
# /opt/ignite/bin/make_tape_recovery –Av
注:
集群相关命令和配置的位置
标准命令:/usr/sbin
_Configuration(维护时不需要使用):
cmquerycl cmcheckconf
cmapplyconf cmmakepkg
_Cluster Operation(启停集群时所需要的)
cmruncl cmhaltcl
cmrunnode cmhaltnode
_Package Operation(起停应用/包时所需要的):
cmrunpkg cmhaltpkg cmmodpkg Cluster 和Package 配置文件的默认目录
_/etc/cmcluster
_/etc/cmcluster/<Package_Name>
启动集群
如果所有节点down
启动所有节点: #cmruncl -v
启动部分节点: #cmruncl -v -n node2 -n node3
停止整个集群
停止正运行的集群:
_#cmhaltcl -v
_为强制停止正运行包的集群使用-f 选项
_#cmhaltcl -v -f
_该命令可在任何运行的节点上发出
检查集群和包状态
检查集群状态: #cmviewcl -v
_Cluster States: Up Down Reforming _Node States: Initializing Failed
Cluster Reforming Running Halted Unknown _Package 状态:
_status: Up Down Unknown
_state: Starting Running Halting No Owned _Package Switching:Package Switching
Switching Enable for a Node
_Service 状态: Up Down Unknown 增加节点到已运行的集群中
增加节点:#cmrunnode -v node1
节点必须是cluster 配置中的一员
删除节点从运行的集群中
从运行的集群中临时删除节点:
#cmhaltnode -f -v node1
已运行的包会被切换到备用节点
永久删除需要修改cluster 配置文件并重新分发
Cluster 自动启动
In /etc/rc.config.d/cmcluster: AUTOSTART_CMCLD=1
In /etc/cmcluster/cmclconf.ascii: AUTO_START_TIMEOUT=600000000
节点在启动后会自动加入cluster(不建议) Package 管理
Package 文件
1.Package 配置文件
Package 配置步骤
#cd /etc/cmcluster/<pkg_name>/
#cmmakepkg -p pkg_name.conf
#cmmakepkg -s pkg_tl
修改pkg_name.conf 和pkg_tl
#cmcheckconf -v -C /etc/cmcluster/cmclconf.ascii –P
/etc/cmcluster/<pkg_name>/pkg_name.conf
停止cluster
#cmapplyconf -v -C /etc/cmcluster/cmclconf.ascii -P
/etc/cmcluster/<pkg_name>/pkg_name.conf
运行cluster
Package 参数
在package 配置文件/etc/cmcluster/pkg1/pkg1.conf
_PACKAGE_NAME pkg1.accounting
_NODE_NAME original_node
_NODE_NAME adoptive_node (…)
_RUN_SCRIPT 1 /etc/cmcluster/pkg1/tl
_RUN_SCRIPT_TIMEOUT NO_TIMEOUT
_HALT_SCRIPT /etc/cmcluster/pkg1/tl
_HALT_SCRIPT_TIMEOUT NO_TIMEOUT
_SERVICE_NAME app1mon
_SERVICE_FAIL_FAST_ENABLED NO
_SERVICE_HALT_TIMEOUT 300
_SUBNET .dd (…)
_PKG_SWITCHING_ENABLE YES
_NET_SWITCHING_ENABLE YES
_NODE_FAIL_FAST_ENABLE NO
2.Package 控制文件
run script
halt script
位置: /etc/cmcluster/<package_name>/
在package 控制文件/etc/cmcluster/pkg1/pkg1.ctrl
_VGCHANGE="vgchange -a e”
_VG[0]=vg01 (…)
_LV[0]=/dev/vg01/lvol1; FS[0]=/home (…)
_IP[0]=.dd (…)
_SUBNET[0]=.0 (…)
_SERVICE_NAME[0]=clearing
_SERVICE_CMD[0]=/etc/cmcluster/pkg1/stat
_SERVICE_RESTART[0]=“”(…)
PACKAGE NAME package 名字
NODE_NAME 主节点和备用节点主机名;主节
点在前,后面为备用节点
RUN_SCRIPT package 运行脚本的全路径名;
建议与Halt_Script同名
RUN_SCRIPT_TIMEOUT Run_Script执行允许的最大时间。
如超时执行以下操作
package脚本被停止
package被禁止切换
节点将不运行运行该package HALT_SCRIPT package停止脚本的全路径名;
建议与Run_Script同名HALT_SCRIPT_TIMEOUT Halt_Script执行允许的最大时间。
如超时执行以下操作
package脚本被停止
package被禁止切换
节点将不运行运行该package SERVICE_NAME package依赖的Service名
SERVICE_FAIL_FAST_ENABLED Service失败时节点是否Panic.
SERVICE_HALT_TIMEOUT Service停止运行时间
SUBNET Package依赖的IP子网。
如果
MC/ServiceGuard发现无法访问该
子网,将产生节点失败PKG_SWITCHING_ENABLED 当出现失败时,决定package是否运行被切换
NET_SWITCHING_ENABLED 决定当网卡失败时,package的IP地址是否运行切换到备用网卡
NODE_FAIL_FAST_ENABLED 决定当节点失败时是否需要对该节点TOC panic
启动 Package
在指定节点上启动package: #cmrunpkg -n node1 pkg1
激活切换属性: #cmmodpkg -e -n node1 pkg1
停止 Package
停止package: #cmhaltpkg pkg1
_Package 的切换被置为disabled.
_Package 必须在其他节点上被手工重启并置switching 为enabled.
检查 Package 状态
#cmviewcl -v
PACKAGE STATUS STATE PKG_SWITCH NODE clearing up running enabled node_1 Script_Parameters:
ITEM STATUS NAME MAX_RESTARTS RESTARTS Service up clearing 0 0
Subnet up 20.203.28.0
Node_Switching_Parameters:
NODE_TYPE STATUS SWITCHING NAME
Primary up enabled node_1 (current)
Alternate up enabled node_2
Package包切换
这需要停止并重启动package: #cmhaltpkg pkg1 #cmrunpkg1 -n node2 pkg1 #cmmodpkg -e pkg1
或: 使用SAM
为使package 能运行在被disabled 的节点上: #cmmodpkg -n node2 -e pkg1
重新配置 Package
在package 配置中作永久改变:
_修改Package 配置文件或使用SAM.
_停cluster .
_使用cmapplyconf 或SAM 生成新的cmclconfig 二进制cluster 文件并自动分发到所有节点.
_修改Package 控制文件或使用SAM
_使用ftp, rcp 或SAM 拷贝修改后的文件到所有节点(如果所有节点的文件需一致否则分别手工修改)
_使用cmruncl 或SAM 重启动cluster.
检查 LAN 配置
有用的network 命令: netstat -in IP & NIC map - Include relocatable IP Address lanscan
arp -a IP & MAC Address map
landiag
linkloop
/usr/contrib/bin/cmgetconfig -f
cmviewcl -v
主要问题
Package 配置和管理
不正确的LVM volume group 配置(see vgchange -c)
丢失脚本文件或脚本中命令所需的文件
缺少脚本或服务的环境变量
脚本自身存在错误
问题排除
1.在集群中同步卷组信息
何时需要同步:
PV 改变
LV 改变
同步步骤:
将主机上的卷组信息输出VGEXPORT
将输出信息传送到备机
先删除备机上的卷组信息
再使用主机上的卷组信息在备机上输入新的卷组配置
2.检查系统 Log 文件
默认位置: /var/adm/syslog/syslog.log
syslog 包含以下信息:
_执行的命令及其输出
主要的cluster 事件, 错误
_Cluster 的状态信息
_硬件的信息
3.系统管理时发生错误
一些错误只有当失败发生时才能看到:
_Volume groups 在备用节点上没有定义,如在主节点上增加VG,未同步到备节点上,导致在主节点上发生切换时,备节点接管失败
_Mount point 在备用节点上不存在
_Network 在备用节点上配置错误
_用户信息在备用节点上不正确
相关文件:
_/etc/cmcluster/cmclconf.ascii
_/var/adm/syslog/syslog.log
_/etc/cmcluster/<Package_Name>/<Package_Name>.conf _/etc/cmcluster/<Package_Name>/<Package_Name>.cntl.log。