AIX HACMP 双机原理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Error Notification
系统错误和应用错误的处理
Cluster Events
Cluster Topology OS AIX
Sub System
被监控的用户应用子系统
IBM 双机拓扑图
MSCP1
appspy
mscp1_tty
MSCP2
串口心跳线
mscp2_tty
产品应用 Database Server On-Line Share_IP
如果对端可用,则停止cluster在本机上的运行 如果对端不可用,则退出本程序
Cluster Events 群集事件配置
/usr/sbin/cluster/events/custom/node_up.post
当有节点加入群集时的处理操作:
向OAM发送告警提示 记录每步操作的日志到 /tmp/appspy.log 如果是对端节点加入群集,则退出本程序 Ping浮动IP是否已经存在
AIX HACMP双机系统
综合业务产品课程开发室
学习目标
学习完本课程,您应该能够:
掌握双机的基本概念
掌握IBM 双机的知识
熟悉双机的维护方法
课程内容
第一章 双机概述 第二章 IBM HDR双机
第三章 双机系统的维护
第一章 双机概述
双机的基本概念(群集、节点、包、HDR、双机) HDR与共享磁盘方式双机的对照
Ethernet
mscp2_stb mscp2_svc (192.9.1.61)
(192.9.3.61)
MSCP1
MSCP2Байду номын сангаас
M80
7133 SSA Disk Array Unit mscp1_tty
M80
RS232
mscp2_tty
问题
双机结构的种类有哪些?
课程内容
第一章 双机概述 第二章 IBM 双机
机系统的主网段,主要连接的是双机系统中各节点的主网卡,同
时各节点也通过主网段来检查当前对方节点主网卡的有效性;另 一个逻辑网段为双机系统主网段的备份网段,用来连接各节点的 备用网卡,同时也被各节点用来检测对方备用网卡的当前有效性。
引导 IP
在HACMP系统中,IP地址分为两种大的类型:引导IP(Boot IP Address)和业务IP(Service IP Address)。
所有的备用网卡必须在同一个逻辑网段中; 主网网卡网段和备用网卡网段必须分处在不同的逻辑网段中。
业务 IP
引导IP是通过AIX系统管理命令对各个物理网络接口配置TCP/IP时
指定的,而在群集软件中还有一个IP地址需要配置,这个IP地址叫
做业务IP(Service IP),是双机系统提供给用户的IP接口。当 HACMP在双机节点上启动以后,业务IP将被增加到当前主节点的
相关概念
High Availability
高可用性(系统)
Cluster
群集:将多个计算机组合成一个集群,共同构成高可用性系统。当其中 一些节点工作时,另一些节点冗余备用。当主用的节点故障时,备用节 点能够接管工作。
Node
节点:在群集中的每个单点,一般每个计算机都是一个节点。
Package
当发生主备用网卡切换时的处理操作:
向OAM发送告警提示 记录每步操作的日志到 /tmp/appspy.log 如果本机有浮动IP
把浮动IP从主用网卡卸下 把浮动IP加到备用网卡上
fail_standby
/usr/sbin/cluster/events/custom/fail_standby.post
Cluster Events 群集事件配置
/usr/sbin/cluster/events/custom/network_up.post
当网络变为可用时的处理操作:
向OAM发送告警提示 记录每步操作的日志到 /tmp/appspy.log
HACMP是一个可提供高可用性(High Availability)应用的群集软 件。在HACMP中,两台以上的IBM机器用多种类型的网络组织起 来构成一个群集(cluster),每台机器都称为群集的一个节点 (node),在TELLIN-SCP的群集系统中,包含两台IBM RS6000
系列的6M1或6H1小型机,组成一个双机备份系统。在该双机系统
心跳信号
IBM HACMP双机软件的节点间心跳信号是通过RS-232串口线
来传递的,在连接各节点的RS-232串口线上传输心跳信号的并 不是TCP/IP协议,而是HACMP自己定义的一种心跳协议,这
样做的目的是为了防止当TCP/IP协议栈出现故障时,出现节点
间的所有联系都被切断的情况。
同时建议心跳信号必须能够同时在至少两种不同协议的网络上
Ethernet
mscp2_stb (192.9.3.61) 7133 SSA Disk Array Unit mscp2_svc (192.9.1.61)
MSCP1
DataVG
MSCP2
6H1
mscp1_tty
6H1 RS232
mscp2_tty
IBM HDR方式双机
share_ip (192.9.1.63) mscp1_svc (192.9.1.60) mscp1_stb (192.9.3.60)
如果存在则退出本程序
如果不存在
– 把浮动IP加到主用网卡上 – 调用/usr/sbin/cluster/utilities/tellin/start_mscp.sh
Cluster Events 群集事件配置
/usr/sbin/cluster/events/custom/node_down.post
无论是主用网卡还是备用网卡,节点上的每个网卡都必须有一个唯 一的引导IP,在系统引导起来后这个IP就被配置到各网卡接口上, 在双机软件没有启动以前,系统中使用的都是引导IP。引导IP的配 置必须满足以下几条原则:
所有的引导IP必须在同一个物理网段中;
所有的主用网卡必须在同一个逻辑网段中;
中两个节点分别命名为mscp1和mscp2。
点击此处查看IBM双机逻辑图
HACMP系统配置
HACMP双机系统的配置项目:
Cluster Topology
双机拓扑结构
应用/服务/资源
Sub System HACMP Error Notification
Cluster Events
群组资源及对应的事件
包:在群集的基础上运行的定制应用程序。一般在主用节点上运行,当 主用节点故障时,能够自动将相关资源转移到备用节点上继续运行。一 个cluster可以配置多个package。
相关概念
双机
将两台服务器中的数据库,应用软件及相关硬件等由群集软件统 一管理起来组成的最简单的高可用性系统的简称。
群集软件
Nodes
Adapters
mscp1_stb mscp1_tty mscp2_svc mscp2_stb mscp2_tty
节点一的备用IP 节点一的心跳串口 节点二的引导IP 节点二的备用IP 节点二的心跳串口
Cluster Events 群集事件配置
network_up
mscp1_stb mscp1_svc
数据库空间
数据库空间
磁盘阵列
mscp1_svc mscp1_stb
网段A 主用子网 网段B
备用子网
双机的网络配置
双机各节点一般都配置有冗余的网卡,而且双机系统中节点间 至少要求有两种不同类型的网络协议能够进行数据通信,一般 是在系统配有TCP/IP on Ethernet的同时还定义串行专用通信 协议(RS232) ,在节点的串口间进行通信。另外TCP/IP网络
现网SMP一般采用此种方式。
HDR方式
两个节点构成的群集,主备用节点有各自的磁盘阵列,数据库是HDR 模式,主备用节点上都有应用程序运行。
现网SCP一般采用此种方式,后面以此种方式为例讲解SCP双机。
IBM 共享磁盘方式双机
share_ip (192.9.1.63) mscp1_svc (192.9.1.60) mscp1_stb (192.9.3.60)
如果是对端节点退出群集,则
如果本机有浮动IP则退出本程序 如果本机没有浮动IP – 把浮动IP加到主用网卡上 – 调用/usr/sbin/cluster/utilities/tellin/start_mscp.sh
Cluster Events 群集事件配置
/usr/sbin/cluster/events/custom/swap_adapter.pre
当有节点退出群集时的处理操作:
向OAM发送告警提示 记录每步操作的日志到 /tmp/appspy.log 如果是本机退出群集,则
如果本机有浮动IP
– 用后台方式调用/usr/sbin/cluster/utilities/tellin/stop_mscp.sh – 卸下浮动IP 如果本机没有浮动IP则退出本程序
/usr/sbin/cluster/events/custom/network_down.post
当网络变为不可用时的处理操作:
向OAM发送告警提示 记录每步操作的日志到 /tmp/appspy.log
如果是对端网络故障则退出本程序
如果本机cluster已经停止则退出本程序 侦查对端节点状态
第三章 双机系统的维护
第二章 IBM 双机
HACMP的工作原理 IBM 双机的拓扑结构 IBM 双机的网络配置 群集拓扑配置的内容和功能 群集事件配置的内容和功能 群集错误通知配置的内容和功能 群集子系统的功能
IBM HACMP 双机概述
采用的是IBM公司的RS6000系列的小型机(本胶片以6M1或6H1 机型为例),群集软件采用IBM公司的HACMP(High Availability Cluster Multi-Processing)。
还要求至少配置有两个逻辑网段。
网卡与网段
1. 网卡
通常一个节点需要两块以太网卡,一块网卡是主用网卡,用于传 输应用数据;另一网卡是备用网卡,用于备份。当主用网卡发生 故障后,备用网卡则变为主用,对主用网卡上的通信业务进行接
管,以防止正常的业务通信中断。
2. 网段
对TCP/IP协议至少要有两个不同的逻辑网段,一个逻辑网段为双
进行传输,即可以在TCP/IP的以太网络和非TCP/IP的RS-232
串行网络上同时传递心跳信号。
Cluster Topology 群集拓扑配置
Cluster
Cluster ID Cluster Name mscp1 mscp2 mscp1_svc
群集的ID 群集的名字 第一个节点的名字 第二个节点的名字 节点一的引导IP
主用网卡上,而且该业务IP能够在主用网卡出现故障时切换到备用
网卡上,在主节点出现故障时能够切换到接管主节点业务的备用节 点上。
业务IP定义在HACMP双机软件中,并不是在AIX操作系统中定义 的。业务IP也可以称为浮动IP或共享IP(Share_IP)。同时须注意 的是业务IP和主网卡的Boot IP必须在同一个逻辑网段中,即定义 在主网段中。
MC/SG
HP MC/ServiceGuard
HACMP
IBM High Availability Cluster Multi-Processing
SC
SUN Cluster
双机方式
共享磁盘方式
两个节点构成的群集,主备用节点共同使用一个磁盘阵列,数据库是
标准(standard)模式,应用程序只在主用节点上运行。切换时主机 将应用和数据库关闭,释放浮动IP,磁盘卷组等资源。备机接管相关 资源,然后重新启动数据库和应用。
/usr/sbin/cluster/events/custom/network_up.post
network_down
/usr/sbin/cluster/events/custom/network_down.post
node_up
/usr/sbin/cluster/events/custom/node_up.post
node_down
/usr/sbin/cluster/events/custom/node_down.post
swap_adapter
/usr/sbin/cluster/events/custom/swap_adapter.pre
join_standby
/usr/sbin/cluster/events/custom/join_standby.post