AIX上搭建OracleRAC,多节点磁盘心跳
Oracle RAC心跳机制介绍
Oracle 12.2体系架构图系列课程!1)RAC 简介!2)RAC 在版本演讲中的变化 !3)RAC 与单实例例DB 的区别 !4)RAC 常⻅见的问题!5)RAC 的⼼心跳机制(集群⼼心跳&实例例⼼心跳) !6)内存融合机制!7)12.2RAC的新特性(串串⾏行行到并⾏行行)1、架构图整体内容组成及模块划分2、ADG3、IN-MEMORY4、Instance&File System5、多租户6、RAC 系列7、单实例数据库的并⾏优化8、RAC One Node ,Flex ASM ,Flex Cluster ,Sharding ,Global Data Service必要性:维持集群的⼀一致性RAC⼼心跳机制–集群⼼心跳基本机制:1、确定节点和节点间的连通性,达到彼此了了解2、⽤用共享的位置保持节点的连通信息,及时记录和更更新3、本地节点的⾃自我监控⽹网络⼼心跳!介绍:⽹网络⼼心跳主要是确保集群节点间的连通性,以便便节点之间能够了了解彼此的状态。
!原理理:ocssd.bin 进程每秒向其他节点发送⽹网络⼼心跳,通过⼼心跳情况确认节点的连通性,以及当⽹网络⼼心跳出现问题时做出处理理。
!相关进程:这个功能主要是由守护进程 ocssd.bin 完成的。
ocssd.bin 守护进程包含以下线程:发送线程(clssnmSending Thread ):每秒向集群中其他节点发送⽹网络⼼心跳信息分析线程(clssnmPolling Thread):分析收到的⽹网络⼼心跳信息并进⾏行行处理理,如果发现某⼀一些节点持续丢失⽹网络⼼心跳,就会通知集群进⾏行行重新配置。
集群重新配置线程(clssnmRcfgMgrThread):当接收到分析线程的重新配置的通知时,该进程进⾏行行重新配置。
派遣线程(clssnmClusterListener):负责接收从远程传递过来的消息,之后,根据信息的种类发给相关的线程进⾏行行处理理。
Aix+ha+oracle rac安装详述
Aix+ha+oracle rac安装一,安装操作系统。
服务器上电,等待液晶面板上出现ok后,按白色按钮,开机,并放入操作系统安装盘第一张,等待系统屏幕出现提示:1 sms 5 defualt boot list6 storage boot list 8 open firmware prompt时在键盘上按5键,系统会有两声蜂鸣,必须在这两声蜂鸣之间按下5键。
为保证按上,可多按几次。
操作系统会从光盘引导,出现提示:按F1和回车将该显示器作为console,按照提示按F1并回车。
提示:按1和回车用英语做为安装语言,按照提示按1并回车。
提示:1、以默认设置安装2、改变/显示安装设置并安装3、进入维护模式选2。
接下来选1,改变安装模式选1,全新的完全的安装出现可用的硬盘列表,在hdisk0前边会有“》》》”的提示符,选0,使用这个硬盘。
出现提示:1、system setting2、主语言环境设置3、more options选3,接下来会出现一些选项,其中:4、enable 64-bit kernel5、create jfs2文件系统这两项是no,可以用4键或5键改变其为yes。
当然也可保持原样,和ha与rac没有太大关系。
然后回车,系统开始安装操作系统。
等待换盘。
最后系统安装完成,会自动重启,操作系统就安装完成。
二、操作系统的调整。
第一次引导后操作系统会自动启动一个配置助手,可以不用它设置任何东西,直接退出。
我们将用smitty来配置系统。
退出时该软件会提示退出并且系统重启不启动这个助手,默认值就是不启动,保持不变,直接退出。
在dtterm中,用命令lsdev -Cc adapter,查看网卡,可以看到用户有两个千兆网卡,smitty tcpip配置网卡:选mini config:填入网卡的IP地址:图中填入的是boot地址:完成后可以用ifconfig -a来查看:en2上的地址为:177.212.92.171这是standby地址en1上的地址为:20.212.92.171这是boot地址。
aix6下的oraclerac搭建方法新
AIX-oracle数据库集群安装文档目录1预安装检查与规划 (3)1.1硬件环境 (3)1.2下载软件 (3)1.3系统硬件环境检查 (3)1.4网络规划 (4)1.4.1 IP地址要求 (4)1.4.2 NTP服务器 (4)1.5存储规划 (5)1.5.1 grid、ASM安装目录 (5)1.5.2 oracle安装目录 (5)1.5.3 OCR、VOTE存储规划 (5)1.5.4 数据库存储规划 (6)2安装准备 (6)2.1配置IP地址 (6)2.2修改hosts文件 (7)2.3安装操作系统软件包 (7)2.3.1 安装FILESET S (7)2.4创建用户和用户组 (7)2.4.1 grid用户 (8)2.4.2 oracle用户 (8)2.4.3 root用户 (9)2.4.3修改安装目录权限 (9)2.4.4 修改.profile文件 (9)2.5 调试AIX操作系统参数 (11)2.5.1 确认打开异步IO (11)2.5.2调整虚拟内存管理 (11)2.5.3增加系统块尺寸分配 (12)2.5.4 调整SHELL限制 (12)2.5.5调整用户允计每户最大进程参数 (12)2.5.6确认网络配置参数 (12)2.6配置双机信任关系 (13)2.7配置NTP保持双机时间同步 (13)2.8文件系统大小的修改 (14)2.9 磁盘属性的调整 (14)3 安装集群软件 (15)3.1安装前检查与执行rootpre.sh (15)3.2开始grid安装 (16)4 安装数据库软件 (23)4.1执行rootpre.sh (23)4.2开始数据库安装 (23)5 创建ASM磁盘组 (27)6创建数据库 (28)7.GI 的deinstall (32)1预安装检查与规划1.1硬件环境两台IBM P740/64GB小机,一台IBM磁盘阵列(15T)。
1.2下载软件本次安装的集群与数据库版本为11.2.0.4数据库包:p1*******_112040_AIX64-5L_1of7.zip、p1*******_112040_AIX64-5L_2of7.zip集群安装包p1*******_112040_AIX64-5L_3of7.zip安装包存放位置:/opt/soft每个安装包的大表都在2G左右,aix 默认情况下无法上传大文件,因此在上传这个大文件之前,需要先修改aix参数限制,否则将无法正常上传文件。
oracle 10g RAC for aix6安装步骤
Oracle 10g RAC for AIX6.1硬件环境:2台IBM P520 服务器,2台光纤交换机,1台IBM DS4700磁盘阵列(1.2TB)软件环境: Oracle 10g R2 (需升级到10.2.0.4), AIX6.11.IP规划:racdb1 公网:172.16.28.31VIP:172.16.28.33心跳: 192.168.100.1racdb2 公网: 172.16.28.32VIP: 172.16.28.34心跳:192.168.100.22.需要的软件包:bos.adt.libbos.adt.libmbos.perf.libperfstatbos.perf.perfstatbos.perf.proctoolsxlC.aix61.rte:9.0.0.1xlC.rte:9.0.0.1通过lslpp -l bos.adt.base 查看软件包是否已安装# lslpp -l bos.adt.baseFileset Level State Description---------------------------------------------------------------------------- Path: /usr/lib/objreposbos.adt.base 6.1.3.0 COMMITTED Base Application Development Toolkit需要的补丁:由于此次项目的系统是最新的AIX6.1,无法在网上确切查询到所需要的正确补丁,所以在安装过程中遇到很多问题,最终安装了p6613550_10203_AIX64-5L、p8705958_10204_AIX5L(CRS PSU补丁,解决升级后VIP起不来BUG)3.通过命令“# chfs -a size=30G /”调整文件系统,结果如下:# df -gFilesystem GB blocks Free %Used Iused %Iused Mounted on/dev/hd4 30.00 29.79 1% 13717 1% //dev/hd2 10.00 8.03 20% 45904 3% /usr/dev/hd9var 10.00 9.76 3% 7296 1% /var/dev/hd3 8.00 7.67 5% 608 1% /tmp/dev/fwdump 5.00 5.00 1% 4 1% /var/adm/ras/platform /dev/hd1 30.00 11.28 63% 53931 2% /home/dev/hd11admin 2.00 2.00 1% 5 1% /admin/proc - - - - - /proc/dev/hd10opt 10.00 9.54 5% 9610 1% /opt/dev/livedump 5.00 5.00 1% 4 1% /var/adm/ras/livedump /dev/lv00 0.25 0.24 4% 18 1% /var/adm/csd/dev/fslv00 0.25 0.25 1% 8 1% /audit4.在2个节点上分别建立oinstall、dba、hagsuser组,Oracle用户,并保持组ID和用户ID相同# smitty group# smitty user:Primary GROUP 为“oinstall”,Group SET 为“dba”和“hagsuser”改为“-1”(无限制)5.编辑/etc/hosts文件,添加以下内容:172.16.28.31 racdb1192.168.100.1 racdb1-priv172.16.28.33 racdb1-vip172.16.28.32 racdb2192.168.100.2 racdb2-priv172.16.28.34 racdb2-vip6.配置系统参数,配置每用户的最大进程数,调整water mark# smitty chgsys7.存储划分asm 400G hdisk4vote 2G hdisk5ocr 2G hdisk6arch 200G hdisk7# lspvhdisk0 00cbc154bde9ce42 rootvg active hdisk1 00cbc1a4cb987b44 rootvg active hdisk2 none Nonehdisk3 none Nonehdisk4 none Nonehdisk5 none Nonehdisk6 none Nonehdisk7 none None# cd /dev# chown root:oinstall hdisk6# chown oracle:oinstall hdisk4 hdisk5# chmod 664 hdisk4 hdisk5 hdisk6# chown root:oinstall rhdisk6# chown oracle:oinstall rhdisk4 rhdisk5# chmod 664 rhdisk4 rhdisk5 rhdisk68.配置.rhosts文件,用于节点间的通信认证和加密# cd /home/oracle# mkdir .rhosts# vi .rhostsracdb1 oracleracdb2 oracleracdb1-priv oracleracdb2-priv oracleracdb1-vip oracleracdb2-vip oracle9.配置NTP服务,用于2个节点的时间同步用date命令调整时间至1000秒以内,如果2个节点时间相差多于1000秒,NTP服务会失败如date 0508013030 表示 5月8日1点30分30秒racdb1# vi /etc/ntp.confbroadcastclientserver 127.127.1.0 (添加)driftfile /etc/ntp.drifttracefile /etc/ntp.trace# startsrc -s xntpdracdb2# vi/etc/ntp.confbroadcastclientserver 172.16.28.31 (添加)driftfile /etc/ntp.drifttracefile /etc/ntp.trace# startsrc -s xntpd10.配置环境变量# cd /home/oracle# vi .profileORACLE_BASE=/home/oracleexport ORACLE_BASEORACLE_HOME=$ORACLE_BASE/product/10.2.0.1/racdbexport ORACLE_HOMEORACLE_CRS_HOME=$ORACLE_BASE/product/10.2.0.1/crsexport ORACLE_CRS_HOMEORACLE_SID=rac1export ORACLE_SIDORACLE_TERM=xtermexport ORACLE_TERMNLS_LANG=AMERICAN_AMERICA.ZHS16GBKexport NLS_LANGLD_LIBRARY_PATH=$ORACLE_CRS_HOME/lib:$ORACLE_HOME/lib:/lib:/usr/lib:/usr/local/l ibexport LD_LIBRARY_PATHPATH=$PATH:$ORACLE_HOME/bin:$ORACLE_CRS_HOME/bin:/usr/bin:/etc:/usr/sbin:/usr/uc b:$HOME/bin:/usr/bin/X11:/sbin:.export PATH11.打补丁p6718715_10203_AIX64-5L.zip,然后以root用户执行补丁6718715里面的rootpre.sh文件;再用oracle用户执行CRS安装程序./runInstaller点击Next点击Next选择CRS安装的目录/home/oracle/product/10.2.0.1/crs,点击Nextoracle进行系统参数检查无问题,点击Next添加Cluster中两个节点及相关的公网、私网、VIP网络名称,点击Next选择ocr文件的位置为/dev/hdisk6,点击Next选择voting disk的位置为/dev/hdisk5,点击Next执行安装至完成。
aix6安装oracle 10g rac问题
# cd $CRS_HOME/bin
# cp racgvip racgvip.old
# vi racgvip
将221,231,371这三行中的 $5 修改为 $6
# cp racgvip racgvip.10204.old
# vi racgvip
将263,275这两行中的 $5 修改为 $6
原因同样是AIX6.1与AIX5.3的netstat -in 执行结果不一样
然后重新启动crs
Байду номын сангаас
# $CRS_HOME/bin/crsctl stop crs
在aix6(或aix6.1)上安装oracle10g rac过程中会出现很多问题,下面是各个问题的解决办法:
一、安装之前,运行如下命令修改oracle用户的属性
这一步骤不止aix6,aix5上也要执行,不知为何在官方文档上没有看到
chuser capabilities=CAP_PROPAGATE,CAP_BYPASS_RAC_VMM,CAP_NUMA_ATTACH oracle
# $CRS_HOME/bin/crsctl start crs
四、升级rdbms到10.2.0.4过程中,会弹出一个窗口报告java进程在运行,不允许升级,这又是一个bug,修改方法如下:
# mv /usr/sbin/fuser /usr/sbin/fuser.old
# touch /usr/sbin/fuser
时区修改文件
vi /etc/ environment
Oracle RAC对AIX版本的支持
Oracle RAC对AIX版本的支持
Oracle RAC支持AIX平台的版本如下:
∙10gR2 64-bit
∙10g 64-bit
∙9.2 64-bit
操作系统信息
∙Oracle认证支持AIX 5L操作系统,硬件架构包括pSeries和iSeries服务器,对AIX 5L的硬件支持信息参考以下网址:
/servers/eserver/iseries/aix/
∙AIX 5L版本认证的具体版本包括AIX 5L版本5.1, 5.2和5.3。
Oracle 10g只在AIX 5L 5.2和5.3两个版本认证
∙Customers should review MetaLink Note 282036.1
∙运行64位的RAC需要64位硬件架构支持
∙支持AIX 5L32位和64位核心
RAC信息
Oracle RAC对AIX平台集群软件的支持或者限制如下:
1)存储
●使用SSA硬盘,节点数最多为8个
●如使用VSD,节点最多为128个
2)网络互连
●如使用SP交换机,需要PSSP的支持
●9i RAC和10g CRS不支持使用交叉线互连
3)共享存储软件
●如使用CLVM,最多支持16个节点
●使用Veritas存储软件,实施RAC,使用10gR1版本测试到4节点。
AIX下ORACLERAC数据库系统日常维护常用命令
AIX下ORACLE RAC数据库系统日常维护常用命令AIX下ORACLE RAC数据库系统日常维护常用命令一、ORACLE数据库系统状态查看1. 以oracle用户登录数据库服务器,密码为oracle2. 在操作系统命令行下执行命令“cd $ORA_CRS_HOME/bin”3. 在操作系统命令行下执行命令“./crs_stat -t”4. 命令输出结果为一表格,共13个结果行,如下图所示:正常情况下所有结果行的‘Target’列和‘Status’列均为‘ONLINE’,Name 列中所有带'1'的结果行所对应的‘Host’列的值为‘rac1’,所有带'2' 的结果行所对应的‘Host’列的值为‘rac2’。
如果命令输出结果不符合上述描述,则ORACLE数据库系统可能存在问题,请将情况反馈给相关人员进行判断。
注:在数据库服务器A机与B机查看到的结果是一致的,只需在一台服务器上执行即可。
二、ORACLE数据库开机操作ORACLE数据库系统已配置为开机自启动,无需人工干预。
在系统启动完成后请执行第一章节描述的操作确认ORACLE数据库系统正常运行。
ORACLE数据库系统启动需要一定耗时,尚未完全启动成功时,输出结果可能与第一章节描述结果不符。
三、ORACLE数据库关机操作ORACLE数据库系统关机步骤如下:1. 以oracle用户登录数据库服务器A机,密码为oracle2. 在操作系统命令行下执行命令“sqlplus /nolog”进入ORACLE命令行状态3. 执行ORACLE命令“connect / as sysdba”4. 执行ORACLE命令“shutdown immediate”5. 执行ORACLE命令“quit”退出ORACLE命令行状态6. 在B机上重复执行上述步骤1-47. 在A机操作系统命令行下执行命令“cd $ORA_CRS_HOME/bin” 8. 在A机操作系统命令行下执行命令“./crs_stop -all”9. crs_stop命令返回后,ORACLE系统在后台进行关闭操作,需要一定耗时,请在A机上执行第一章节描述的操作进行确认,当所有结果行的‘Status’列为‘OFFLINE’值时,关闭完成。
AIX HACMP安装ORACLE 10G RAC完全参考手册
ORACLE 10G RAC参考手册 部署与基本管理部分目录前言 (1)安装部署部分 (1)一、Oracle RAC规划 (1)1.1 RAC的基本组成 (1)1.2主机系统配置及软件规划 (2)1.3 IP规划 (3)1.4 NTP服务 (3)二、安装Oracle RAC前的准备 (3)2.1 配置AIX (3)2.1.1、调整aix文件系统 (3)2.1.2编辑hosts文件(两个节点) (4)2.1.3 创建rootvg的镜像 (5)2.1.4 调整page size(swap) (5)2.1.5配置系统配置参数,配置每用户的最大进程数、调整water mark (6)2.1.6配置网络可调参数 (6)2.1.7修改异步I/O (6)2.1.8调整syncd频率 (7)2.1.9创建串口设备 (7)2.1.10 转换AIX 64bit内核 (7)2.2 Oracle相关的配置 (7)2.2.1创建用户在db01和db02上,创建oinstall、dba、hagsuser组 (7)2.2.2在db01和db02上,创建oracle用户: (8)2.2.3安装oracle、hacmp支持包 (8)2.2.4安装磁盘阵列,创建共享卷 (9)2.2.5配置SSH的对等性 (11)2.2.6安装fix包所需补丁(到IBM网站上下载补丁) (13)2.2.7打完补丁,包括调整完异步IO等,建议重启一次机器 (13)2.2.8配置HACMP (13)三、安装Oracle RAC (18)3.1安装oracle RAC的准备工作及安装Oracle ClusterWare (18)3.2安装oracle RAC的数据库软件10.2.0.1 (31)3.3创建数据库 (40)3.4 客户端的配置配置客户端 (53)四、Oracle RAC测试 (54)4.1测试failover (55)4.2测试load balance (56)五、安装后的情况处理 (56)5.1安装失败后,如何彻底删除除oracle软件及CRS (56)5.2在AIX环境下,RAC启动的方法 (59)5.3刚安装完以后,自动启动CRS服务速度慢。
Oracle10gRAC在IBM-AIX5.3上的安装手册
Oracle10gRAC在IBM-AIX5.3上的安装手册一、安装概述Oracle10gRAC的软件版本号为10.2.0.1,补丁版本号为10.2.0.2。
AIX操作系统版本号为5300-05。
Oracle10g的安装介质为三个tar文件:crsinstall.tar、oracle10g.tar和p10202_AIX64-5L.tar。
请联系工程部陈晓静获取安装介质。
全部安装,包括安装crs软件,安装oracle软件,安装10202补丁和创建数据库,大约需要3个小时左右。
在安装过程中,操作系统和硬件的厂方工程师最好在场,如果出现问题,大家一起解决会比较容易。
二、硬件需求1、机器需求CPU数目不低于2个,内存不低于2G,硬盘空间不小于20G。
这些要求目前的工程机器一般都能满足。
需要注意的是以下几点:●SWAP虚拟内存对换区不低于物理内存的两倍,如果物理内存大于8G,则虚拟内存可以配置成和物理内存相同大小。
●临时空间目录/tmp不低于500M,建议为1G以上●需要为Oracle软件建立单独的分区/users/oracle,大小建议为20G。
最少应为10G。
●机器名称不能超过8位,最好不要包含“-”号。
上面的要求在两台库服务器上都需要满足,如果有不满足的,请让厂方工程师协助解决。
2、网络需求两个光纤网口,用于连光纤交换机和阵列连接。
至少三个,最好四个千兆网口(电口、光口均可),用于外网连接和心跳连接。
建议将机器主板上的内置网卡用于心跳连接,将PCI插槽上的外接网卡用于外网连接。
为了满足OracleRAC中vip的需求,需要将连接外网的两个网口使用etherchannel技术虚拟成一个虚网口,vip的地址需要和这个虚网口配置在同一个网段。
如果有四个网口,建议将剩余的两个网口也使用etherchannel技术虚拟成一个虚网口,用于心跳连接。
Oracle建议心跳使用单独的交换机连接,或者使用交换机上一个单独的vlan连接,避免使用交叉线直接连接。
AIX5.3_HACMP+oracle双机安装配置(IP心跳)
AIX5.3 HACMP和oracle双机安装过程1引言1.1HACMP 工作原理HACMP 是High Availability Cluster Multi-Processing 的缩写。
HACMP 是IBM 公司在P 系列AIX 操作系统上的高可靠集群软件,配置冗余,消除单点故障,保证整个系统连续可用性和安全可靠性。
HACMP 是利用网络来侦测主机及网卡的状况,搭配AIX 所提供的硬盘镜像等功能,在主机、网卡、硬盘控制卡、硬盘或网络发生故障时,自动切换到另一套备用元件上重新工作; 若是主机故障还切换至备份机上继续应用系统的运行。
作为双机系统的两台服务器同时运行HACMP 软件。
两台服务器的备份方式有二种:●一台服务器运行应用,另外一台服务器做为备份●两台服务器除正常运行本机的应用外,同时又作为对方的备份主机;●两台主机系统在整个运行过程中,通过" 心跳线" 相互监测对方的运行情况( 包括系统的软硬件运行、网络通讯和应用运行情况等);●一旦发现对方主机的运行不正常( 出故障) 时,故障机上的应用就会立即停止运行,本机( 故障机的备份机) 就会立即在自己的机器上启动故障机上的应用,把故障机的应用及其资源( 包括用到的IP 地址和磁盘空间等) 接管过来,使故障机上的应用在本机继续运行;●应用和资源的接管过程由HACMP 软件自动完成,无需人工干预;●当两台主机正常工作时,也可以根据需要将其中一台机上的应用人为切换到另一台机( 备份机) 上运行。
1.2心跳设计配置HACMP 的过程中,除了TCP/IP 网络之外,您也可以在其它形式的网络上,如串行网络和磁盘总线上配置心跳网络。
●TCP/IP 网络优点:要求低,不需要任何额外硬件或软件,即可实现。
缺点:占用IP 地址,不能避免由于TCP/IP 的软件问题导致HACMP 崩溃,系统不可用。
●串口网络优点:真正实现高可用性,不占用IP 地址。
ORACLERAC方案介绍
ORACLERAC方案介绍Oracle RAC(Real Application Clusters)是一种Oracle数据库的架构,它允许多个服务器节点共享同一个数据库实例。
RAC是Oracle提供的一种高可用性和容错性解决方案,它提供了对数据库的负载均衡和故障恢复能力。
RAC的架构基于共享存储和共享数据库实例的概念。
多个服务器节点可以通过高速网络连接到同一个存储设备,所有节点都能够同时访问共享的数据库实例。
每个节点上都有一个Oracle实例运行,这些实例之间通过Cache Fusion技术共享数据缓存,可以实现高性能的并发访问。
RAC的设计目标之一是提供高可用性。
如果一个节点发生故障,其他节点可以接管该节点的工作,并继续提供服务,不会中断用户的访问。
这是通过Oracle Clusterware实现的,它是一种集群管理软件,负责监控节点的状态,自动检测和恢复故障。
当一个节点发生故障时,Clusterware会自动将故障节点上的资源(如数据库实例、网络地址等)迁移到其他正常节点上,确保服务的连续性。
RAC还提供了负载均衡的功能。
当用户发出一个查询请求时,RAC可以将该请求分发到集群中的一些节点上执行,从而实现对数据库的并行处理。
通过负载均衡,RAC可以提高系统的吞吐量和响应时间,同时减轻单个节点的负载压力。
除了高可用性和负载均衡,RAC还提供了扩展性和可伸缩性。
在RAC集群中,可以很方便地添加新的服务器节点,以满足不断增长的业务需求。
当有新的节点加入集群时,数据库实例会自动重新分配,以平衡各个节点的负载。
这种动态伸缩的能力使得RAC成为处理大规模数据量和高并发访问的理想选择。
在实际的部署中,RAC通常会采用一些辅助技术来进一步提升性能和可用性。
例如,可以使用Oracle Data Guard来实现RAC集群之间的异地容灾备份,确保数据的安全性。
另外,可以使用Automatic Storage Management(ASM)来管理共享存储,提供高效的数据存储和管理功能。
Oracle-RAC集群心跳
Oracle-RAC集群⼼跳⼼跳线物理布线注意事项不建议直连⽹线,建议采⽤交换机连接⽅式⼼跳线与业务⽹络分开单独接线若公⽤⼀个交换机时,使⽤VLAN隔离Oracle不⽀持使⽤交叉线(cross-cabling)作为Clusterware的内部连接导致集群不稳定限制了两个节点RAC扩展建议⼼跳交换机使⽤两个交换机做主备,冗余RAC中⼼跳线作⽤承担了⼼跳作⽤(检测集群节点间的⽹络健康状态)缓存同步刷新全局资源维护当出现gc(grid control)的时候,⽤于传输数据块[因内联数据通信量⽐较⼤,建议使⽤千兆或万兆⽹]⼼跳⽹络⾼可⽤实现操作系统层⾯使⽤双⽹⼝绑定的技术实现⾼可⽤双⽹⼝绑定常见有负载均衡和主备模式ORACLE 通过HAIP特性(11.2.0.2)实现⾼可⽤⼼跳⽹络优化建议开启巨帧(Jumbo frame)巨型帧的影响在压⼒较⼤的系统上使⽤帧的Jumbo的好处,这样的系统将使⽤较少的CPU,并减少⽹络开销。
对于RAC互连流量,正确配置为巨型帧的设备可通过减少将⼤型邮件拆分为标准以太⽹的较⼩帧时发⽣的TCP,UDP和以太⽹开销来提⾼性能。
由于可以发送⼀个较⼤的数据包,因此消除了各个较⼩数据包之间的数据包间延迟。
在要求⾼吞吐量和带宽以及系统受CPU约束的情况下,性能的提⾼最为明显。
使⽤巨型帧时,需要较少的缓冲区传输,这是减少IP堆栈中的碎⽚和重组的⼀部分,因此对减少Oracle块传输的延迟有影响。
任何不正确的设置都可能会阻⽌实例启动或对性能产⽣⾮常不利的影响。
Linux环境开启ifconfig eth0 mtu 9000ifconfig -a eth0检测验证ping# a packet size (-s), prohibiting fragmentation (-M do):禁⽌零散数据包ping -c 2 -M do -s 8972 node2-privping -c 2 -M do -s 8973 node2-priv# For Solaris platform, the similar ping command is:ping -c 2 -s node2-priv 8972不是所有的⽹卡都可以开启到9000,如果上⾯ping测试不通的话,可以逐渐的减少。
最近在aix6.1上安装了一套rac
最近在AIX 上安装了一套RAC,实施得不多,遇到不少问题,记录一下:OS版本:HOST_NAM_1:/#oslevel -s6100-04-02-1007HA版本:HOST_NAM_1:/#lslpp -l cluster.*Fileset Level State Description----------------------------------------------------------------------------Path: /usr/lib/objrepos5.5.0.0 COMMITTED ES Client Include Files5.5.0.0 COMMITTED ES Client CLINFO Samples5.5.0.1 COMMITTED ES Client Clstat Samples### RSH 报错#rsh HOST_NAM_2 datershd: 0826-813 Permission is denied.相关文件配置:#cat .rhostsHOST_NAM_1 rootHOST_NAM_2 rootHOST_NAM_1 oracleHOST_NAM_2 oracle#cat /etc/HOST_NAM_1 rootHOST_NAM_2 rootHOST_NAM_1 oracleHOST_NAM_2 oracle其中HOST_NAM_1、HOST_NAM_2是HOSTNAME。
这里主要是/etc/hosts文件中,HOSTNAME不能当作别名,或者,”.rhosts”、””里不要配别名,应该是跟解析有关。
原HOSTS配置:HOST_NAM_1_boot1 HOST_NAM_1HOST_NAM_2_boot1 HOST_NAM_2HOST_NAM_1_boot2HOST_NAM_2_boot2HOST_NAM_2_vipHOST_NAM_1_vip改为:HOST_NAM_1_boot1HOST_NAM_2_boot1HOST_NAM_1 HOST_NAM_1_boot2HOST_NAM_2 HOST_NAM_2_boot2HOST_NAM_2_vipHOST_NAM_1_vip### 报错这个安装前在文档中有到看到,作为注意事项记录一下:The Oracle 10gR2 OUI and configuration assistant programs do not recognize AIX 6 as a supported release.执行时会报:Configuring Asynchronous I/O....Asynchronous I/O is not installed on this system.You will need to install it, and either configure it yourself using'smit aio' or rerun the Oracle root installation procedure.Configuring POSIX Asynchronous I/O....Posix Asynchronous I/O is not installed on this system.You will need to install it, and either configure it yourself using'smit aio' or rerun the Oracle root installation procedure.解决方法:下载6718715补丁,执行里面的### VIPCA 报错VIPCA时,VIP起不来,日志报错信息:Interface en4 checked failed (host=HOST_NAM_1)Invalid parameters, or failed to bring up VIP (host=HOST_NAM_1)原因:VIP绑定的是小机集成的网卡Logical Host Ethernet Port (lp-hea)The entstat output for LHEA is different from a regular adapter解决方法:修改racgvip脚本,找到$ENTSTAT -d $_IF 这行,修改为:$ENTSTAT -d $_IF | $GREP -iEq'.*lan.*state.*:.*operational.*|.*link.*status.*:.*up.*|.*port.*operational.*state.*:.*up.*|.*driver.*flags.*:.*up.*'参考文档:### ONS 起不来日志报错信息:Failed to get IP for localhost (0)Failed to get IP for localhost (0)Failed to get IP for localhost (0)onsctl: ons failed to start原hosts文件中找不到localhost:loopback改为:loopback localhost### CRS 升级10.2.0.4报错升级完成后执行,报:# ./Error : Please change the CRS_ORACLE_USER id oracleto have the following OS capabilities :< CAP_PROPAGATE CAP_BYPASS_RAC_VMM CAP_NUMA_ATTACH >解决方法:#chuser capabilities=CAP_BYPASS_RAC_VMM,CAP_PROPAGATE,CAP_NUMA_ATTACH oracle #lsuser -f oracle | grep capabilitiescapabilities=CAP_BYPASS_RAC_VMM,CAP_PROPAGATE,CAP_NUMA_ATTACH这个报错之前遇到过,升级的文档中,也有提到。
Oracle RAC心跳机制介绍
Oracle 12.2体系架构图系列课程!1)RAC 简介!2)RAC 在版本演讲中的变化 !3)RAC 与单实例例DB 的区别 !4)RAC 常⻅见的问题!5)RAC 的⼼心跳机制(集群⼼心跳&实例例⼼心跳) !6)内存融合机制!7)12.2RAC的新特性(串串⾏行行到并⾏行行)1、架构图整体内容组成及模块划分2、ADG3、IN-MEMORY4、Instance&File System5、多租户6、RAC 系列7、单实例数据库的并⾏优化8、RAC One Node ,Flex ASM ,Flex Cluster ,Sharding ,Global Data Service必要性:维持集群的⼀一致性RAC⼼心跳机制–集群⼼心跳基本机制:1、确定节点和节点间的连通性,达到彼此了了解2、⽤用共享的位置保持节点的连通信息,及时记录和更更新3、本地节点的⾃自我监控⽹网络⼼心跳!介绍:⽹网络⼼心跳主要是确保集群节点间的连通性,以便便节点之间能够了了解彼此的状态。
!原理理:ocssd.bin 进程每秒向其他节点发送⽹网络⼼心跳,通过⼼心跳情况确认节点的连通性,以及当⽹网络⼼心跳出现问题时做出处理理。
!相关进程:这个功能主要是由守护进程 ocssd.bin 完成的。
ocssd.bin 守护进程包含以下线程:发送线程(clssnmSending Thread ):每秒向集群中其他节点发送⽹网络⼼心跳信息分析线程(clssnmPolling Thread):分析收到的⽹网络⼼心跳信息并进⾏行行处理理,如果发现某⼀一些节点持续丢失⽹网络⼼心跳,就会通知集群进⾏行行重新配置。
集群重新配置线程(clssnmRcfgMgrThread):当接收到分析线程的重新配置的通知时,该进程进⾏行行重新配置。
派遣线程(clssnmClusterListener):负责接收从远程传递过来的消息,之后,根据信息的种类发给相关的线程进⾏行行处理理。
IBM AIX集群系统下的ORACLE RAC故障处理方法
IBM AIX集群系统下的ORACLE RAC故障处理方法1、引言随着现代计算机技术的迅速发展,采用计算机存储数据被广泛运用在国民经济的各个行业及部门。
在电力、通信、气象、能源、金融、航天航空、生物技术等企业,采用计算机来实现关键数据的存储极大地提高了工作效率和自动化。
特别是对数据库技术的应用,标志着信息存储时代的到来。
然而如果数据库本身出现故障,或者计算机系统出现故障,也会给企业生产带来巨大损失,特别是在上述行业,灾难是无法估量的。
如何做到未雨绸缪,如何采用有效的手段解决上述问题,是目前众多企业面临的关键问题。
IBM AIX集群系统下的ORACLE RAC (Oracle Real Application Cluster)双机热备份有效地保障了企业重要的核心数据。
但如果服务器在出现误操作意外断电时,会导致双机无法正常工作,这也将严重影响到企业核心数据的存储。
2、故障分析本示例中出现的故障是由于数据库主服务器1号机出现硬件故障,由2号机接管一切服务的情况下,出现误操作使备机意外断电,致使两台数据库服务器全部瘫痪。
经过缜密的检查,发现2号主机OCR文件严重损坏。
OCR文件记录节点成员的配置信息,如database、ASM、instance、listener、VIP等CRS资源的配置信息,可存储于裸设备或者群集文件系统。
OCR文件的损坏直接导致ORACLE CRS 的启动。
CRS一般用来搭建Oracle的并行数据库,即RAC,但除了与RAC的接口之外,CRS还提供了一组高可用性的应用程序接口(API),用来搭建一般应用程序的高可用集群,即一般我们常说的双机热备,比如使用CRS实现Oracle的双机热备。
3、处理过程针对以上的故障分析,我们立即采取如下对策:备份数据库排除主机硬件故障恢复OCR文件1号主机:该机硬件连续几天出现错误,并无规律宕机,IBM硬件工程师多次在现场进行数据搜集以及问题定位,最终确定为连接外接扩展单元的RIO卡存在可能的接触性问题。
AIX、HACMP(含RAC)安装实施(含oracle参数).
AIX 安装规范 (AIX 5L、 AIX 6L2014.051AIX 系统安装设置 (3)1.1准备工作 (3)1.2BOS 安装 . (3)1.3AIX 操作系统配置 (8)2HACMP 安装设置 (20)2.1安装 HACMP 软件 ................................................................................................................. 20 2.2HACMP 配置规划(在两个节点上分别部署 (23)2.3HACMP 配置(在一个节点上部署 ..................................................................................30 2.4HACMP 启停和测试 (41)3HACMP-RAC 安装设置 . (43)3.1安装 HACMP 软件 (43)3.2HACMP-RAC 配置规划(在两个节点上分别部署 . .......................................................... 46 3.3HACMP-RAC 配置(在一个节点上部署 (52)4部署 ORACLE 所需 AIX 的参数设置 . (61)4.1ORACLE 10GRAC . (61)4.2ORACLE 11GRAC . (77)1 AIX 系统安装设置1.1 准备工作为了保证操作系统安装工作的正常进行,在安装之前需要做以下准备工作: 1. 检查随系统部件附带的文档、软件是否齐全。
2. 确保硬件、包括所有的外接设备的安装都已完成,如:图形终端、键盘、鼠标、光驱、硬盘、磁带机等硬件设备。
3. 检测所有硬件的电源是否符合要求 (包括图形终端、主机 ,并连接正确。
在做完安装前必要的准备工作之后, 正式开始安装操作系统, 首先通过操作系统安装光盘启动系统。
AIX5.3 安装oracle10gr2 rac(自留)
AIX5.3安装Oracle10g R2RAC第1部分安装AIX5.31、安装AIX5.32、中配置本地主机名:RAC1和RAC2。
3、配置IP地址。
一个用于专门网络,一个用于公共网络。
分别是:RAC1:公共网192.168.1.160专门网10.10.10.1RAC2:公共网192.168.1.162专门网10.10.10.24、AIX5.3下安装的需求1)版本需求:AIX5L5.3Maintenance Level02or later2)需要安装的文件集:bos.adt.basebos.adt.libbos.adt.libmbos.perf.libperfstatbos.perf.perfstatbos.perf.proctoolsrsct.basic.rtepat.clients.rtexlC.aix50.rte7.0.0.4xlC.rte7.0.0.13)需要安装的操作系统补丁APAR通信地址:北京市海淀区紫竹院路98号北京化工大学科技园611室CUUG邮编:100089IY68989;IY65361;IY65362;IY60759;IY61034;IY61770;IY62191IY58350Patch for SDK1.3.1.16(32-bit)IY63533Patch for SDK1.4.2.1(64-bit)IY65305Patch for SDK1.4.2.2(32-bit)Inutoc.5、配置hacmp5.3操作系统卷组名:rootvg磁盘阵列卷组名:oravgHACMP只配置共享磁盘和心跳,其他不用配置第2部分为Oracle配置AIX1、创建Oracle组和用户帐户用户帐户名是‘Oracle’,组是‘oinstall’和‘dba’。
(两台主机同时创建)#/usr/sbin/groupadd-g1000oinstall#/usr/sbin/groupadd-g1001dba#/usr/sbin/useradd-m-u1000-g oinstall-G dba oracle#id oracleuid=1000(oracle)gid=1000(oinstall)groups=1000(oinstall),1001(dba)设置Oracle帐户的口令:#passwd oracle2、设置ORACLE_BASE和ORACLE_HOME环境变量:.profileORACLE_BASE=/u01/app/oracle;export ORACLE_BASEORACLE_HOME=/u01/app/oracle/product/10.2.0/db_1;export ORACLE_HOME ORA_CRS_HOME=/u01/app/oracle/product/10.2.0/crs;export ORA_CRS_HOME 通信地址:北京市海淀区紫竹院路98号北京化工大学科技园611室CUUG邮编:100089PATH=$PATH:$ORACLE_HOME/bin;export PATHORACLE_SID=cpsmzb1;export ORACLE_SID(RAC2为cpsmzb2)umask0223、创建挂载点以root用户身份执行以下命令:#mkdir-p/u01/app/oracle#mkdir/u01/app/oracle/product/10.2.0/db_1#mkdir/u01/app/oracle/product/10.2.0/crs#chown-R oracle:oinstall/u01/app/oracle#chmod-R775/u01/app/oracle4、配置Shell限制,系统需求,网络参数。
文档:AIX5.3安装ORACLE9I-RAC安装
AIX5.3 + HACMP5.3 install oracle9i1、安装AIX5.3 ,打PATCH到5304或53052、配置AIX网络,HOSTS文件如下:-----------------------------------------------------------------------127.0.0.1 loopback localhost # loopback (lo0) name/address192.168.6.121 orasvra192.168.6.122 orasvrb10.1.1.1 orasvra-priv10.1.1.2 orasvrb-priv-----------------------------------------------------------------------3、安装HACMP注意,安装HACMP的时候,建议不要安装VSD用的pssp rsct.basic.sp &pat.basic.sp和所有的VSD安装包4、配置HACMP,如下:-----------------------------------------------------------------------Cluster Name: ora_clusterCluster Connection Authentication Mode: StandardCluster Message Authentication Mode: NoneCluster Message Encryption: NoneUse Persistent Labels for Communication: NoThere are 2 node(s) and 2 network(s) definedNODE orasvra:Network net_diskhb_01orasvra_hb /dev/hdisk3Network net_ether_01orasvra 192.168.6.121orasvra-priv 10.1.1.1NODE orasvrb:Network net_diskhb_01orasvrb_hb /dev/hdisk3Network net_ether_01orasvrb-priv 10.1.1.2orasvrb 192.168.6.122Resource Group ora_resStartup Policy Online On All Available NodesFallover Policy Bring Offline (On Error Node Only)Fallback Policy Never FallbackParticipating Nodes orasvrb orasvra-----------------------------------------------------------------------个人观点:⏹上面网络配置中,心跳采用硬盘心跳,心跳测试:/usr/sbin/rsct/bin/dhb_read -p hdisk3 -r/usr/sbin/rsct/bin/dhb_read -p hdisk3 -t⏹ORACLE9i RAC不用配置服务IP⏹检查网络情况:/usr/es/sbin/cluster/utilities/cllsif -S5、用户管理:a)通过HACMP创建用户ORACLE、用户组DBA/hagsuserb)修改用户资源的限制,特别是文件的限制,把文件限制改为-16、配置ORACLE环境变量,如下:-----------------------------------------------------------------------export ORACLE_BASE=/oracleexport ORACLE_HOME=$ORACLE_BASE/product/9.2.0exportLD_LIBRARY_PATH=$ORACLE_HOME/lib:$ORACLE_HOME/lib32:$ORA_CRS_HOME/lib:$ORA_CRS_ HOME/lib32export ORACLE_SID=RACDB1export NLS_LANG=AMERICAN_AMERICA.ZHS16GBKexportPATH=$ORACLE_HOME/bin:$ORA_CRS_HOME/bin:/usr/bin:/etc:/usr/lbin:/usr/bin/X11:/u sr/local/binexport DBCA_RAW_CONFIG=dbca_raw_configexport PGSD_SUBSYS=grpsvcsexport AIXTHREAD_SCOPE=Sumask 022-----------------------------------------------------------------------注意:上面的环境变量COPY到AIX下的时候,必须注意转行符号,到COPY到写字板再到AIX下面。