HACMP日常操作手册
HACMP配置文档
1 HA&冷备安装配置和验证1.1 HACMP配置1.1.1 HACMP安装1.检查每台机器上是否都找到了所有硬盘(包括内置硬盘)。
lspvlsdev –Cc disk如果某台机器没有找到共享硬盘,可用cfgmgr命令。
cfgmgr2.给系统添加TTY。
如果安装了8port卡,一共应该有sa0 ~ sa4共5个tty,依次(0 ~ 4)安装。
Æ Add a TTY Æ rs232 Æ saX Æ Port Number: 0ttysmitty3.检测连8port卡的TTY。
在两台机器上同时运行:</dev/ttyXsttyX应该为4(使用8port卡时)或3(使用串口4时),这时应该有信息显示。
4.安装HACMP/ES软件5.4.1,及补丁放入HACMP/ES光盘:安装HA文件集。
安装文件包括:除了cluster.haview、cluster.hativoli和所有msg语言文件集外,其他文件集都要安装。
安装5.4.1的补丁SP06/eserver/support/fixes/fixcentral/psearch?searchstring=latest+ha+R54+fi xes&searchtype=apar&release=53中选择IZ57986下载并安装,安装后重启系统验证补丁安装lslpp -l |grep cluster 看文件版本号是否已经升上去1.1.2 HACMP配置1.配置IP以下是一个范例。
A机(生产机)IP IP_label1.1.1.1 A_svc1.1.1.2 A_boot1.1.2.1 A_stdby1.1.1.3 B_svc1.1.1.4 B_boot1.1.2.2 B_stdbyB机(备份机)IP IP_label1.1.1.1 A_svc1.1.1.2 A_boot1.1.2.1 A_stdby1.1.1.3 B_svc1.1.1.4 B_boot1.1.2.2 B_stdby开机未启HA时,boot和standby地址生效;启动HA后,service地址覆盖boot生效,service地址对应网卡失效后,由standby所在网卡接管。
HACMP(高可用集群软件)的安装和使用
高可用集群软件(HACMP)的安装和使用HACMP软件的安装:命令:smit屏幕显示系统管理菜单:System ManagementSoftware Installation and MaintenanceSoftware License ManagementDevicesSystem Storage Management (Physical & Logical Storage) Security & UsersCommunications Applications and ServicesPrint SpoolingProblem DeterminationPerformance & Resource SchedulingSystem EnvironmentsProcesses & SubsystemsRemote Customer Support and ServicesApplicationsUsing SMIT (information only)选择:Software Installation and Maintenance屏幕显示软件安装和维护菜单:选择:Install and Update Software屏幕显示软件安装和更新菜单:选择:Install and Update from LASEST Available Software屏幕显示软件安装和更新(从最后有效软件中)菜单:Install and Update from LASEST Available SoftwareType or select a value for the entry fieldpress Enter AFTER making all desired changes.[Entry Fields]* INPUT device / directory for software [/dev/cd0]显示软件安装和更新(从最后有效软件中)参数屏幕:Install and Update from LASEST Available SoftwareType or select a value for the entry fieldpress Enter AFTER making all desired changes.[Entry Fields]* INPUT device / directory for software /dev/cd0* SOFTWARE to install [_all_latest]PREVIEW only noCOMMIT software updates? yesSAVE replaced files noAUTOMATION install requisite software? yesEXPEND file systems if space needed ? yesOVERWRITE same or newer versions? noVERIFY install and check file sizes? noInclude corresponding LANGUAGE filesets? yesDELETE output? no按ENTER键,即可安装HACMP软件光盘上的全部软件。
HACMP配置与维护手册
POWER HA5.5配置与维护手册2010年9月2日目录第一章一体化系统HACMP配置 (3)§1.1系统结构图 (3)§1.2拓扑规划 (3)§1.3磁盘资源规划 (4)§1.4应用规划 (5)§1.5操作系统要求 (6)第二章HACMP日常维护 (8)§2.1HACMP服务正常启停 (8)§2.1.1HACMP启动 (8)§2.1.2停止HA (9)§2.2查看HACMP集群服务状态 (10)§2.2.1查看HACMP服务状态 (10)§2.2.2查看资源组的状态 (10)§2.2.3查看HACMP集群状态 (11)第三章系统切换方案 (12)§3.1rlw1机器应用出现故障,HACMP资源切换 (12)§3.1.1切换rlw1_apprg资源组 (12)§3.1.2恢复rlw1_apprg资源组 (13)§3.2hg2机器应用出现故障,HACMP资源切换 (15)§3.2.1切换rlw2_orarg资源组 (15)§3.2.2恢复rlw2_orarg资源组 (17)第四章HACMP切换测试 (19)§4.1网卡故障模拟测试 (19)§4.2rlw1 系统单机故障模拟测试 (20)§4.3rlw2 系统单机故障模拟测试 (22)§4.4rlw1系统HA 手工切换测试 (24)§4.5rlw2系统HA 手工切换测试 (26)第一章一体化系统HACMP 配置§1.1 系统结构图§1.2 拓扑规划P780(1)主机(LPAR rlw1)共享磁盘阵列(HDS USPV 存储系统)心跳线(tty0)ent2ent0 P780(2) 主机(LPAR rlw2)ent2ent0Service NetworkPersistent Networkrlw1机器boot1地址配置在第一块外置网卡上(en0),将boot2地址配置在第二块外置网卡(en2),persistent ip地址绑在第二块外置网卡上(en2);rlw2机器boot1地址配置在第一块外置网卡上(en0),将boo2地址配置在第二块外置网卡(en2),persistent ip地址绑在第二块外置网卡上(en2)。
HACMP 5.2 的安装、配置、测试完全手册
HACMP 5.2 的安装、配置、测试完全手册摘要:IBM HACMP 自从出了5.2 版本后,到了5.205比较稳定,并已经过充分的测试(见测试篇)和实践证明(已有多个系统成功自动切换)。
这里我整理了一下,以比较复杂的双机互备情况为例,其他类似设置可适当简化。
样例为AIX5304+HACMP5205.第一章规划篇第二章安装篇1、安装前提1) 操作系统版本要求:AIX5.203以上2) 环境要求用户确认HA要求所有切换需要用到的用户必须一一对应,userid完全相同。
如tlg1d0上oracle用户为orarun,tlg1a0上的orarun必须为切换保留,sid均为209平时用的oracle用户就改为oraclt[tlg1a0][root][/]lsuser -a id ALLroot id=0daemon id=1bin id=2sys id=3adm id=4uucp id=5nobody id=-2lpd id=9lp id=11invscout id=6snapp id=200ipsec id=201nuucp id=7radiusd id=202ldap id=203oradev id=204tuxrun id=205oraclt id=208orarun id=209sshd id=211bsx1 id=210[tlg1d0][root][/]>lsuser -a id ALLroot id=0daemon id=1bin id=2sys id=3adm id=4uucp id=5nobody id=-2lpd id=9lp id=11invscout id=6snapp id=200ipsec id=201nuucp id=7radiusd id=202ldap id=203oradev id=204orarun id=209tuxrun id=205oraclt id=208bsx1 id=210Ø 文件系统确认HA要求切换相关的文件系统不能重名,如tlg1d0上oracle软件目录为/ora10msrun,tlg1a0上的/ora10msrun必须为切换保留,改为/ora10msclt[tlg1d0][root][/]>df -kFilesystem 1024-blocks Free %Used Iused %Iused Mounted on/dev/hd4 524288 487820 7% 3276 3% //dev/hd2 7077888 1868516 74% 91290 18% /usr/dev/hd9var 524288 458364 13% 991 1% /var/dev/hd3 917504 826700 10% 120 1% /tmp/dev/hd1 655360 524856 20% 291 1% /home/proc - - - - - /proc/dev/hd10opt 1179648 589072 51% 11370 8% /opt/dev/lv00 131072 126912 4% 18 1% /var/adm/csd/dev/fslv01 131072 130724 1% 4 1% /tftpboot/dev/fslv00 6684672 3719036 45% 6 1% /export/eznim/dev/ora10msrunlvbak 8912896 5165508 43% 24814 3% /ora10msrunbak /dev/msrundatalvbak 13107200 2895980 78% 32 1% /msrundatabak/dev/msrunloglvbak 5242880 3094480 41% 8185 2% /msrunlogbak/dev/mksysblv 13107200 6238868 53% 5 1% /mksysb/dev/tlg1d0_baklv 26214400 17495848 34% 1111 1% /tlg1d0_bak/dev/msrundatalv 13107200 2896000 78% 31 1% /msrundata/dev/msrunloglv 5242880 3112216 41% 7996 2% /msrunlog/dev/ora10msrunlv 8912896 5173252 42% 23406 2% /ora10msrun[tlg1a0][root][/]>df -kFilesystem 1024-blocks Free %Used Iused %Iused Mounted on/dev/hd4 655360 93968 86% 3450 14% //dev/hd2 8650752 3779000 57% 90347 10% /usr/dev/hd9var 1179648 1001248 16% 1164 1% /var/dev/hd3 1179648 1136192 4% 143 1% /tmp/dev/hd1 655360 587592 11% 489 1% /home/proc - - - - - /proc/dev/hd10opt 1835008 1244528 33% 11374 4% /opt/dev/lv00 131072 126912 4% 18 1% /var/adm/csd/dev/fslv01 131072 118800 10% 7 1% /tftpboot/dev/fslv00 7733248 960696 88% 27298 12% /export/eznim/dev/fslv02 15335424 1143804 93% 4525 2% /soft_ins/dev/tlg1a0_baklv 26214400 20751500 21% 16 1% /tlg1a0_bak/dev/ora10mscltlvbak 13107200 9386904 29% 16852 1% /ora10mscltbak /dev/tux81msrunlvbak 655360 407932 38% 2685 3% /tux81msrunbak /dev/meslvbak 8912896 4815640 46% 6349 1% /BSMesWare/BSX1bak /dev/xcomlvbak 5242880 5186260 2% 4178 1% /xcombak/dev/ora10mscltlv 13107200 9386748 29% 16852 1% /ora10msclt/dev/tux81msrunlv 786432 538952 32% 2685 3% /tux81msrun/dev/meslv 14155776 10057876 29% 6343 1% /BSMesWare/BSX1/dev/xcomlv 5242880 5186280 2% 4178 1% /xcom3) 安装包要求:RSCT 2.3.6.0 或更高版本。
HACMP简单配置手册
H A C M P High Availability Cluster Multi – Processing一、Cluster 系统规划1:资源规划HACMP 给客户端提供高可用性的资源环境,当HACMP集群中的节点失效或按正常程序退出群集时,群集管理器将重新在剩余的节点中分配资源。
在HACMP中定义了以下资源类型:z卷组z磁盘z文件系统z要”Mount”到“网络文件系统”上的文件系统z要”Export”到“网络文件系统”上的文件系统z Service IP地址z应用程序(1)资源组群集中的每个资源被定义为资源组的一部分,这样做可以将有关联的资源聚集在一起,以提供特殊服务;同时,资源组还包括能够获得资源及提供这些资源到客户端的节点列表。
有三种类型的资源组:z Cascadingz Rotatingz Concurrent每种类型的资源组描述了节点在群集中的不同关系类型,及节点进入或离开群集的不同表现。
Cascading资源组中的节点设置优先等级,优先级最高的节点是活动节点,控制着整个资源组。
当优先级最高的节点失效时,次高优先级的节点控制资源组;当优先级最高的节点重新加入群集时,它将重新获得对资源组的控制权。
Rotating资源组涉及的不是某一个特定的节点,而是多个节点都有能力采用的共享的IP地址相联系,当定义了共享适配卡的第一个节点加入群集时,它将获得和共享IP地址相关联的Rotating资源组。
当控制Rotating资源组的节点离开群集时,下一个存在的节点获得该Rotating资源组;当该节点重新加入群集时,它将处于待机状态,而不重新获得该Rotating资源组的控制权。
Concurrent资源组能被多个节点同时共享,当一个节点失效时,没有任何接管工作发生;当失效节点重新加入群集时,它将和其它节点同时访问Concurrent资源组。
对于上述三种资源组分别可用一句话来进行概述:Cascading --- 活动节点使用最高优先l,…lk:,级控制资源组。
HACMP日常维护和配置
HACMP日常系统管理1:日常日志:日常日志主要是记录平时事件的启动,从中可以了解HACMP的动作,例如主机standby网卡故障,有fail_standby事件发生,系统管理员可从日志中得知何时出的故障,及有没有解决。
主要日志文件有:/tmp/hacmp.out:记录HACMP启动或有动作时执行的各事件。
此文件一天刷新一次,保留七天,文件保存为/tmp/hacmp.out.1-7;/usr/adm/cluster.log:记录HACMP的错误信息及各事件,另记录事件发生的时间;/tmp/cm.log:保存HACMP中clstrmgr进程产生信息的时间;/usr/sbin/cluster/history/cluster.mmdd:HACMP的历史记录文件。
2:启动和关闭HACMP:每次机器启动后,由系统管理员手工启动HACMP,机器shutdown前,手工关闭HACMP。
启动命令:# smit clstart 选项按缺省,启动顺序为先启主机,待主机的/tmp/hacmp.out文件中node_up_local_complete执行完后,再启动备机的HACMP;关闭命令:# smit clstop shutdown mode选项要确认为graceful。
当出现以下情况时须按指定步骤操作:主、备机在关电后,再次启动时,备机正常,主机不能启动。
指定步骤:在备机上执行# smit hacmp 选择cluster configuration进入,选择Cluster Resources进入,选择Chage/show Resources for a Resource Group进入,将Inactive Takeover Activated 改为true执行。
退出到命令行,启动HACMP,这时备机接管主机的资源。
3:查看HACMP状态:在HACMP中,它启动一个进程来监控各节点。
用# ps –ef|grep clinfo 命令查看clinfo 进程是否启动。
HACMP操作及注意事项
HACMP操作及注意事项
一.启动HACMP:
主机启动后先在一台主机,如S85上执行smitty clstart ,启动完后再在另一台机,如M80上执行smitty clstart ,HACMP启动db2也自动启动。
二.关闭及切换HACMP:
由于安装的HACMP为cascading方式,S85为主节点,M80为次节点。
在S85主机上上执行smitty clstop,有三个选项graceful、takeover、forced,如选graceful,S85上的HACMP正常停止,S85上的资源如datavg、s85_svc、datavg上的文件系统、应用系统不切换给M80;如选takeover,S85上S85上的HACMP 正常停止,S85上的资源如datavg、s85_svc、datavg上的文件系统、应用系统切换给M80;如选forced S85上的HACMP强行停止,S85上的资源如datavg、s85_svc、datavg上的文件系统、应用系统不切换给M80;
若S85出现故障而宕机或用takove切换,S85重新正常启动HACMP后,S85上的资源如datavg、s85_svc、datavg上的文件系统、应用系统又切换回S85。
三.HACMP注意事项:
在一台主机如S85上增加文件系统、改变文件系统大小、增
加逻辑卷时,需在另一台主机如M80上进行exportvg 和importvg操作。
HACMP常用命令
Journaled file systems
Add a journaled file system
Add a standard journaled file system
选择共享VG
指定FS的大小,Mount point
2)、# smitty clstop
停止HACMP的运行
– /usr/es/sbin/cluster/events/utils/cl_scdiskreset /dev/hdisk1
LV的更改最好在集群启动后进行,系统会自动在节点间同步
检查心跳线是否已经配置好:
1、在两台上分别输入如下命令:
S85_1# cat /etc/hosts >/dev/tty0
键入Snapshot文件名(Cluster Snapshot Name)
恢复cluster的配置:
# smitty hacmp
选择:Cluster Configuration→Cluster Snapshots→Apply a Cluster Snapshot
键入Snapshot文件名(Cluster Snapshot Name)
now:手工启动HACMP
restart、both:在系统启动时自动启动HACMP
3、停止HACMP:
# smitty clstop
注:有三种停止方式:
graceful:只停止本节点上HACMP的运行,并释放由本节点管理的资源,但
允许其它节点接管。
graceful with takeover:停止本节点上HACMP的运行,释放资源,让其他节
Start s cript
Stop s cript
【Selected】经典PowerHA-HACMP之完全手册.doc
PowerHA完全手册(一)前言自2008年4月02日笔者在IBMDevelopWorA网站首次发表《HACMP5.X 完全手册》以来,加上各网站的转载,应该已过了10万的阅读量,在此非常感谢大家的认可和支持。
转眼已经5年过去了,期间非常感谢不少同仁指出了该文的各种不足,并且HACMP已经改名为HACMP了,由于软件版本的更新和本人当时的技术水准有限,同时也存储不少同仁的希望,在原文基础上进行了补充和修订完善,也就有了本文。
正是由于AIX专家俱乐部的兴起,对AIX和HACMP的技术感兴趣的技术人员又更多了。
因此选择本杂志作为原创发表,就是希望能对更多的同仁日常工作有所帮助。
此外,虽然本文号称“完全手册”,一是为了吸引眼球,二也只是相对于其他只谈安装配置的文档而言。
由于HACMP现在已相当复杂,本文范围也主要关注于最常用的双节点,还望大家谅解。
即便如此,本文篇幅可能仍然较长,虽然也建议大家先通读一下,但实际使用使用时可根据具体目的按章节直接查阅操作。
这是因为一方面本文所述操作笔者都加以验证过;一方面也是全中文,省得大家去查一大堆原版资料。
希望能帮助大家在集成和运维HACMP的过程中节省精力、降低实施风险,这也是本文编写的初衷。
同时还望那些被部分摘抄文章的同仁也能理解,你们都是笔者的老师,这里也一一谢过。
虽笔者端正态度,尽力认真编写,但由于能力有限,恐仍有错漏之处,还望众多同仁多多指正海涵,在此先行谢过。
1.为什么需要PowerHA/HACMP随着业务需求日益增加,IT的系统架构中核心应用必须一直可用,系统必须对故障必须有容忍能力,已经是现代IT高可用系统架构的基本要求。
10年前各厂商现有的UNIX服务器就已拥有很高的可靠性,在这一点上IBM的Power系列服务器表现尤为突出。
但所有UNIX服务器均无法达到如原来IBM 大型主机S/390那样的可靠性级别,这是开放平台服务器的体系结构和应用环境所决定的,这一点,即使科技发展到云计算的今天仍然如此。
HACMP简要使用手册
HACMP 简要¾# smit hacmpCluster Configuration配置高可靠热备集群HACMPCluster Topology -> Synchronize Cluster Topology同步拓扑:Node, Adapter(Boot, Service, Standby, tty).Cluster Resources -> Synchronize Cluster Resources同步资源:IP, VG, FS, App.Cluster Resources -> Define Application Servers-> Change/Show an Application Server起停脚本路径:Start, Stop scriptsCluster Verification -> Verify Cluster验证集群的逻辑同步。
¾# smit clstart起动高可靠热备集群HACMP。
Start now, on system restart or both:[Now] [Restart] [Both] 建议选[Now],集群进程clstrmgr & clsmuxpd将会起来 BROADCAST message at startup?:[No] [Yes]是否在登录窗口弹出HACMP起动提醒信息。
Startup Cluster Lock Services?:[No] [Yes]并发(concurrent)配置选[Yes],集群进程cllockd将会起来。
Startup Cluster Information Daemon?:[Yes] [No]集群进程clinfo将会起来。
可用来监视集群状态信息。
¾# smit clstop停止高可靠热备集群HACMP。
Stop now, on system restart or both:[Now] [Restart] [Both] 集群进程clstrmgr , clsmuxpd & clinfo ... 将会停止 BROADCAST cluster shutdown?:[No] [Yes]是否在登录窗口弹出HACMP停止提醒信息。
HACMP 5.x 完全手册,第 1 部分:设计和安装解析
本系列文章的作者通过自己长期的实际项目工作经历,总结出了他对于HACMP 设计实施的经验。
本系列会分为 4 部分,会向您详细地介绍实施 HACMP 过程中会经历的各个过程,如设计,配置,安装,测试等。
本文为第 1 部分,会向您介绍HAMCP 实施的设计和安装过程。
前言为什么需要 HACMP各厂商现有的 UNIX 服务器一般都拥有很高的可靠性,在这一点上 IBM 的 P 系列服务器表现尤为突出。
但所有 UNIX 服务器均无法达到如 IBM 大型主机 S/390 那样的可靠性级别, 这是开放平台服务器的体系结构和应用环境所决定的。
使用IBM 高可用性集群软件 --HACMP ,可以更好的保护关键业务应用不受故障影响。
HACMP 工作原理HACMP 是 High Availability Cluster Multi-Processing 的缩写。
HACMP 是 IBM 公司在 P 系列 AIX 操作系统上的高可靠集群软件,配置冗余,消除单点故障,保证整个系统连续可用性和安全可靠性。
HACMP 是利用网络来侦测主机及网卡的状况, 搭配 AIX 所提供的硬盘镜像等功能,在主机、网卡、硬盘控制卡、硬盘或网络发生故障时,自动切换到另一套备用元件上重新工作 ; 若是主机故障还切换至备份机上继续应用系统的运行。
作为双机系统的两台服务器同时运行 HACMP 软件:∙两台服务器的备份方式有二种 :o 一台服务器运行应用,另外一台服务器做为备份o 两台服务器除正常运行本机的应用外,同时又作为对方的备份主机; ∙两台主机系统在整个运行过程中, 通过 " 心跳线 " 相互监测对方的运行情况 ( 包括系统的软硬件运行、网络通讯和应用运行情况等 ;∙一旦发现对方主机的运行不正常 ( 出故障时,故障机上的应用就会立即停止运行,本机 ( 故障机的备份机就会立即在自己的机器上启动故障机上的应用,把故障机的应用及其资源 ( 包括用到的 IP 地址和磁盘空间等接管过来,使故障机上的应用在本机继续运行 ;∙应用和资源的接管过程由 HACMP 软件自动完成,无需人工干预 ;∙当两台主机正常工作时,也可以根据需要将其中一台机上的应用人为切换到另一台机 ( 备份机上运行。
HACMP 5.X安装设置手册
HACMP v5.x安装设置手册版本 v1.0二零零八年五月神州数码(中国)技有限公司文档控制更改记录版本创建/修改时间编制/修改者文件/修改内容审批人v1.0 2008-5-29 贾志锋创建文档审阅姓名职位发布姓名职位目录目录 (3)HACMP v5.x安装配置 (4)1.1、了解HACMP的基本概念 (4)1.2、 HACMP规划 (4)1.3、安装HACMP软件 (6)1.3.1、操作系统版本 (6)1.3.2、安装依赖的软件包 (6)1.3.3、安装HACMP v5.4 (8)1.4、 HACMP配置规划 (10)1.4.1、 HACMP规划表格 (10)1.4.2、配置IP和网络 (11)1.4.3、编辑/etc/hosts文件 (12)1.4.4、编写应用服务器启动停止脚本 (12)1.4.5、创建共享卷组和文件系统 (13)1.4.6、配置非TCP/IP网络 (16)1.5、 HACMP Standard配置 (17)1.5.1、添加 cluster和节点 (18)1.5.2、配置cluster资源 (18)1.5.3、创建并配置资源组 (20)1.5.4、同步HACMP的配置 (21)1.6、 HACMP Extended配置 (21)1.6.1、配置串口心跳 (22)1.6.2、配置永久IP (24)1.6.3、同步HACMP的配置 (25)1.7、 HACMP启动和测试 (25)1.7.1、启动HACMP (25)1.7.2、 HACMP切换测试 (26)HACMP v5.x安装配置1.1、了解HACMP的基本概念对于从事IBM售后技术支持工作的人员,深刻理解IBM各项技术的基本概念是做技术支持工作的基本要求,只有掌握了基础的东西,才能使自己的知识更加的巩固,才能灵活的运用技术,解决工作中遇到的各种故障;同时,是知识扩展能力更强,能举一反三,更好的理解客户的真正的需求,能够给客户提供更成熟、更适合客户的解决方案。
中间业务平台HACMP安装配置指南
一、HACMP 双机系统配置打算在配置中间业务平台HACMP环境之前首先要制定配置打算。
在IBM HACMP 的配置指南中推举了一种配置打算表的方式〔Planning Worksheet 〕,在进展配置考虑的时候将这些表格填完即可。
通常分行中间业务平台的HACMP环境大体都有相像的拓扑环境,两个Public 类型的网络,一个用于供给中间业务效劳〔使用IP alias方式〕,另一用于连接AS/400的SNA 〔必需使用IP replacement方式〕Cluster WorksheetCluster Name:xxibp_clusterNode Name:xxMID_PRD,xxMID_BAK在主节点上配置拓扑构造然后同步到其他节点,网络拓扑如下:(1)Network概览Network Name Network Type Network Attribute Network Mask Node Namesnet_ibp Ether public 255.255.255.0 xxMID_PRD,xxMID_BAK net_sna Ether public 255.255.255.0 xxMID_PRD,xxMID_BAK net_rs232_01 RS-232 serial N/AxxMID_PRD,xxMID_BAK (2)Network内部构造Network net_ibpService地址:ibp_svc 10.1.7.33Boot地址:ibp_boot2 172.16.101.1ibp_boot1 172.16.100.1Network sna_netService地址:sna_svc 172.16.120.3Boot地址:sna_boot 172.16.120.1Standby地址:sna_stb 172.16.121.1SNA的网络配置IP〔可以使用私有地址,如172网段的任何地址,但两块网卡要在同一网段〕,只是为了能够相互切换,寻常的IP地址不用。
AIX HACMP 日常维护
AIX HACMP 日常维护------- 启动、关闭AIX HACMP和查看HACMP运行状态的方法(提示:一般先要先关闭双机软件,再执行shutdown –h命令关闭AIX操作系统)1, 启动的方法,以root在控制台上执行smitty clstart (参数都用如下的缺省值,不要改动)启动时先启动主机上的双机软件,再启动备机上的双机软件。
(主机上双机启动时自动把数据库启动成on-line状态,另外主机上的service_ip (就是对外服务的IP)就替换了原来的boot_ip(固定配置在主网卡en0上的IP), 所以建立在控制台上启动)#smitty clstartStart Cluster ServicesType or select values in entry fields.Press Enter AFTER making all desired changes.[Entry Fields]* Start now, on system restart or both nowBROADCAST message at startup? trueStartup Cluster Lock Services? falseStartup Cluster Information Daemon? falseCluster to re-acquire resources falseafter forced down?2, 关双机软件的方法, 先关闭备机上的双机软件,再关闭主机上的双机软件(不需要严格顺序,但是建议这样做)(主机上双机关闭时自动把数据库也关闭成off-line状态,另外主机上的service_ip (就是对外服务的IP)就被释放掉,原来的boot_ip(固定配置在主网卡en0上的IP)又恢复起来了, 所以建立在控制台上启动)以root用户在控制台上执行smitty clstopStop Cluster ServicesType or select values in entry fields.Press Enter AFTER making all desired changes.[Entry Fields]* Stop now, on system restart or both nowBROADCAST cluster shutdown? true* Shutdown mode graceful(graceful or graceful with takeover, forced)3, 查看双机软件是否运行的方法以普通用户执行下面的命令 (两个subsystem的状态都是active就表示正常) $ lssrc -g clusterSubsystem Group PID StatusclstrmgrES cluster 868436 activeclsmuxpdES cluster 720992 active。
HACMP配置指导手册(IBM原厂)
HACMP配臵指导手册目录第一章HACMP配臵前硬件准备 (3)第二章HACMP软件安装 (4)2.1 操作系统补丁及指定包的安装 (4)2.2 安装HACMP软件包 (5)2.3升级HACMP的补丁到最新 (5)2.4 重启系统 (5)第三章HACMP的配臵 (5)3.1 主备模式下HACMP 配臵 (5)3.1.1 IP 地址规划 (6)3.1.2 设臵BOOT 地址 (6)3.1.3 配臵通信串口 (7)3.1.4 创建Cluster并添加HA节点 (14)3.1.5 添加service label (17)3.1.6 添加应用程序服务器 (20)3.1.7 创建资源组 (23)3.1.8 修改资源组属性 (25)3.1.9 配臵串型网络 (27)3.1.10 添加串行设备 (31)3.1.11 添加永久地址 (35)3.1.12 HA相关参数调整 (38)3.1.13 第三方存储去Reservation脚本配臵 (40)3.1.14 同步校验 (41)3.1.15 启动HA (42)3.1.16 停止HA (43)3.2 互备模式下HACMP 配臵 (45)3.2.1 IP 地址规划 (45)3.2.2 HA 配臵 (46)3.3 Concurrent模式下HACMP 配臵 (47)3.3.1 Concurrent模式下资源组配臵 (47)第一章HACMP配臵前硬件准备在安装HA 软件之前,首先连接好系统硬件设备,包括心跳线连接,存储设备连接等。
并将需要加到资源组中的卷组在分别导入到群集中的每个节点上。
第二章HACMP软件安装2.1 操作系统补丁及指定包的安装AIX系统需要如下软件包,并且AIX补丁版本达到最新。
bos.clvm.enhbos.datarsct.basic(rsct.basic.hacmp,rsct.basic.rte,rsct.basic.sp)pt.basic(pat.basic.hacmp,pat.basic.rte,pat.basic.sp)pat.clients(pat.clients.hacmp,pat.clients.rte,pat.clients.sp)bos.perf.toolsperfagent.toolsbos.adt.syscallsbos.adt.libm如果您要安装并行的资源组,还要安装下面的包:bos.rte.lvmbos.clvm.enh2.2 安装HACMP软件包将HACMP 5.3 光盘加载到SERVER, 由SMITTY进行安装。
Hacmp 6.1 的配置方法
汉德Hacmp 6.1 的配置手册一,Hacmp 的软件安装。
1.安装前提如果您的操作系统是AIX6.1,那么您要安装维护补丁包ML03以上,目前最高的补丁版本是ML05.以下的包也是必须要安装的:2.开始安装一般基本上除了haview ,netwiew ( Tivoli),的包以外,所有的hacmp的包都要安装。
3.重启机器。
如果共享磁盘是SCSI磁盘或SCSI磁盘阵列,必须修改SCSI卡的SCSI ID。
将节点1上连接共享磁盘的SCSI卡的ID改为6,输入命令smit chgscsi,选择要修改的SCSI卡,然后按下图修改。
图22用同样方法将节点2上连接共享磁盘的SCSI卡的ID改为5。
注意上图中的Apply change to DATABASE only一项一定设为yes。
重启动后修改才能生效。
用lsdev –Cc disk命令查看物理卷,每个节点上都应有hdisk1和hdisk2两块共享磁盘。
3.1.4 定义LVM组件现在我们定义共享卷组和文件系统。
我们的配置中有一个共享卷组havg ,卷组中包含两个物理卷hdisk1和hdisk2,hdisk1和hdisk2之间互为镜像。
通常,我们在一个节点上定义LVM 的所有组件,然后在其它节点上导入配置,这样能够保证整个群集内各个节点的共享组件的ODM 定义一致。
下面是定义LVM 组件的顺序:在节点1上建立共享卷组在节点1上,以root 身份输入smit mkvg ,然后按下图的值配置。
图23我们给新建卷组命名havg ,包括的物理卷为hdisk1, hdisk2。
注意,一定要将Activate volume group AUTOMATICALLY at system restart? 一项设置为no。
共享卷组的激活是由HACMP软件完成的。
物理分区的大小应根据硬盘容量调整。
卷组建立完成后,用varyonvg havg命令激活卷组。
建立镜像的jfslog逻辑卷在建立文件系统之前,一定要首先建立jfslog逻辑卷。
IBM磁盘阵列HACMP日常维护操作
IBM磁盘阵列HACMP日常维护操作
IBM磁盘阵列HACMP日常维护操作
登录主服务器(telnet ***.***.*.*)
启动、停止cluster服务:
登录服务器后:smitty hacmp
选择:System Management (C-SPOC)
选择:Manage HACMP Services
进入后即可启动、停止、查看hacmp的cluster
或者:
启动cluster服务:smitty clstart
停止cluster服务: smitty clstop
查询hacmp的cluster状态
登录服务器后:lssrc -g cluster
显示:Subsystem Group PID Status
clsmuxpdES(节点间通信协调) cluster 295090 active
clstrmgrES(hacmp管理) cluster 426212 active
clinfoES (进行编程时使用) cluster 418036 active
查询hacmp的cluster状态(由于是图形界面,只能在本机运行)登录服务器后:cd usr/sbin/cluster
然后:./clstat(查)
查询hacmp的cluster状态
登录服务器后:netstat -i
(其中“en2 1500 *.*.** **_svc”表示当前机器为正常状态,
如果显示“en2 1500 *.**.*** ***_boot”则表示当前机器为备份状态)。
HACMP日常操作手册
HACMP操作手册强制方式停掉HACMP:HACMP 的停止分为3 种,graceful(正常),takeover(手工切换),force(强制).下面的维护工作,很多时候需要强制停掉HACMP 来进行,此时资源组不会释放,这样做的好处是,由于IP 地址、文件系统等等没有任何影响,只是停掉HACMP 本身,所以应用服务可以继续提供,实现了在线检查和变更HACMP 的目的。
一般所有节点都要进行这样操作.强制停掉后的HACMP 启动:在修改HACMP 的配置后,大多数情况下需要重新申请资源启动,这样才能使HACMP 的配置重新生效。
日常检查及处理为了更好地维护HACMP,平时的检查和处理是必不可少的。
下面提供的检查和处理方法除非特别说明,均是不用停机,而只需停止应用即可进行,不影响用户使用。
不过具体实施前需要仔细检查状态,再予以实施。
clverify 检查这个检查可以对包括LVM 的绝大多数HACMP 的配置同步状态,是HACMP 检查是否同步的主要方式. smitty clverify->Verify HACMP Configuration回车即可经过检查,结果应是OK。
如果发现不一致,需要区别对待。
对于非LVM 的报错,大多数情况下不用停止应用,可以用以下步骤解决:1.先利用强制方式停止HACMP 服务。
同样停止host2 的HACMP 服务.1.只检查出的问题进行修正和同步:smitty hacmp ->Extended Configuration-〉Extended Verification and Synchronization这时由于已停止HACMP 服务,可以包括”自动修正和强制同步“。
对于LVM 的报错,一般是由于未使用HACMP 的C—SPOC 功能,单边修改文件系统、lv、VG 造成的,会造成VG 的timestamp 不一致。
这种情况即使手工在另一边修正(通常由于应用在使用,也不能这样做),如何选取自动修正的同步,也仍然会报failed.此时只能停掉应用,通过整理VG 来解决.cldump 检查:cldump 的监测为将当前HACMP 的状态快照,确认显示为UP,STABLE。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
HACMP日常操作手
册
HACMP操作手册
强制方式停掉 HACMP:
HACMP 的停止分为 3 种,graceful(正常),takeover(手工切换),force(强制)。
下面的维护工作,很多时候需要强制停掉 HACMP 来进行,此时资源组不会释放,这样做的好处是,由于 IP 地址、文件系统等等没有任何影响,只是停掉 HACMP 本身,因此应用服务能够继续提供,实现了在线检查和变更 HACMP 的目的。
一般所有节点都要进行这样操作。
强制停掉后的 HACMP 启动 :
在修改 HACMP 的配置后,大多数情况下需要重新申请资源启动,这样才能使 HACMP 的配置重新生效。
日常检查及处理
为了更好地维护 HACMP,平时的检查和处理是必不可少的。
下面提供的检查和处理方法除非特别说明,均是不用停机,而只需停止应用即可进行,不影响用户使用。
不过具体实施前需要仔细检查状态,再予以实施。
clverify 检查
这个检查能够对包括 LVM 的绝大多数 HACMP 的配置同步状态,是 HACMP 检查是否同步的主要方式。
smitty clverify->Verify HACMP Configuration
回车即可
经过检查,结果应是 OK。
如果发现不一致,需要区别对待。
对于非 LVM 的报错,大多数情况下不用停止应用,能够用以下步骤解决:
1.先利用强制方式停止 HACMP 服务。
同样停止 host2 的 HACMP 服务。
1.只检查出的问题进行修正和同步:
smitty hacmp ->Extended Configuration->Extended Verification and Synchronization
这时由于已停止 HACMP 服务,能够包括”自动修正和强制同步“。
对于 LVM 的报错,一般是由于未使用 HACMP 的 C-SPOC 功能,单边修改文件系统、lv、VG 造成的,会造成 VG 的 timestamp 不一致。
这种情况即使手工在另一边修正(一般由于应用在使用,也不能这样做),如何选取自动修正的同步,也依然会报 failed。
此时只能停掉应用,经过整理 VG 来解决。
cldump 检查:
cldump 的监测为将当前 HACMP 的状态快照,确认显示为 UP,STABLE。
Node Name: host1 State: UP
Network Name: net_ether_01 State: UP
Address: 10.2.100.1 Label: host1_l1_svc1 State: UP
Address: 10.2.101.1 Label: host1_l1_svc2 State: UP
Address: 10.2.1.1 Label: host1_l1_boot1 State: UP
Address: 10.2.11.1 Label: host1_l1_boot2 State: UP
Network Name: net_ether_02 State: UP
Address: 10.2.200.1 Label: host1_l2_svc State: UP
Address: 10.2.2.1 Label: host1_l2_boot1 State: UP
Address: 10.2.12.1 Label: host1_l2_boot2 State: UP
Node Name: host2 State: UP
Network Name: net_ether_01 State: UP
Address: 10.2.100.2 Label: host2_l1_svc1 State: UP
Address: 10.2.101.2 Label: host2_l1_svc2 State: UP
Address: 10.2.1.2 Label: host2_l1_boot1 State: UP
Address: 10.2.11.2 Label: host2_l1_boot2 State: UP
Network Name: net_ether_02 State: UP
Address: 10.2.200.2 Label: host2_l2_svc State: UP
Address: 10.2.2.2 Label: host2_l2_boot1 State: UP
Address: 10.2.12.2 Label: host2_l2_boot2 State: UP
Cluster Name: test_cluster
Resource Group Name: host1_RG
Startup Policy: Online On Home Node Only
Fallover Policy: Fallover To Next Priority Node In The List
Fallback Policy: Fallback To Higher Priority Node In The List
Site Policy: ignore
Node State
--------------- ---------------
host1 ONLINE
host2 OFFLINE
Resource Group Name: host2_RG
Startup Policy: Online On Home Node Only
Fallover Policy: Fallover To Next Priority Node In The List
Fallback Policy: Fallback To Higher Priority Node In The List
Site Policy: ignore
Node State
--------------- ---------------
host2 ONLINE
host1 OFFLINE
clstat 检查
clstat 能够实时监控 HACMP 的状态,及时确认显示为 UP,STABLE。