oracle rac集群介绍

合集下载

RAC简介

RAC简介

Oracle Data Guard
• 确保企业数据高可用性、数据保护和灾难恢复的一种方案 确保企业数据高可用性、 • 通过以下技术简化备用数据库的建议、维护和管理: 通过以下技术简化备用数据库的建议、维护和管理: – 日志传送服务 – 日志应用服务 – 角色转换服务 • 通过 通过Oracle Net进行互联 进行互联 – 主数据库
逻辑备用数据库
• 具有与产品数据库相同的逻辑信息 • 物理结构与主数据库可以不同 • 在归档日志传送到逻辑备用服务器后,将其转换为相应的 在归档日志传送到逻辑备用服务器后 将其转换为相应的 SQL语句,应用在逻辑备用服务器上 语句, 语句 • 只会维护主数据库的部分方案,并且于对象和数据类型有 只会维护主数据库的部分方案, 一些限制
X
Server A 数据库 进程A Server B Server A 数据库 进程A Server B 数据库 进程B
X
Data Data
Real Application Cluster 并行服务器方式优点
• 各服务器共享一个数据库,在正常运行时可以进行负载分 各服务器共享一个数据库, 担,无需考虑应用数据的人为分割 • 对应用完全透明,在应用程序设计和开发的过程中也不需 对应用完全透明, 要进行特殊编程, 要进行特殊编程,简化了开发的复杂程度 • 不需要重新启动数据库核心进程,缩短了故障造成的停机 不需要重新启动数据库核心进程, 时间
归档日志
应用 归档日志 物理备用 数据库
主数据库
Oracle Net
物理备份数据库优点
• 提供了健壮、有效的空难恢复和高可用性解决方案 提供了健壮、 • 通过Data Gurard的最大保护模式,可以提供了高级别的 的最大保护模式, 通过 的最大保护模式 数据保护和安全措施 • 可以将数据统计、数据报表和查询等操作转移到物理备用 可以将数据统计、 服务器上,降低主数据库的工作负载. 服务器上,降低主数据库的工作负载

oracle rac和备份方案

oracle rac和备份方案

ORACLE RAC及备份方案ORACLE RAC简介:ORACLE RAC集群是实现多机共享数据库,以保证应用的高可用性。

同时可以自动实现并行处理及均分负载,还能实现数据库在故障时的容错和无断点恢复。

集群内部的所有服务器共享存储,所有服务器都接入公共网络,通过集群唯一的别名对外形成逻辑上单一的数据库提供服务,对内实现集群数据库的高可用性、节点间的负载均衡和Failover(失败切换)。

逻辑结构:集群纵向看是由存储、数据库集群、应用集群三部分组成,横向来看,是由多台应用服务器、数据库服务器和存储设备组成。

物理结构:RAC物理结构图。

优势:高可用性:RAC 为数据中心的高可用性奠定了基础。

它也是 Oracle 最高可用性架构不可或缺的一部分,为实现数据中心的最高可用性提供了最佳实践。

RAC 还为高可用性数据管理提供了以下至关重要的关键特性:可靠性:Oracle 数据库以其可靠性而著称。

RAC Clusters 消除了数据库服务器单点故障问题,从而使可靠性更上一层楼。

如果一个实例发生故障,服务器池中的其余实例仍将保持运行状态。

Oracle Clusterware 可监视所有 Oracle 进程,并能立即重启任何生故障的组件。

恢复能力:Oracle 数据库包含的许多特性有助于数据库轻松地从各类故障中恢复。

如果Oracle RAC 数据库中的一个实例出现故障,服务器池中的另外一个实例将察觉到这一故障,随后自动进行故障恢复。

利用快速应用程序通知 (FAN)、快速连接故障切换 (FCF) 和透明应用程序故障切换 (TAF) 这三个功能,应用程序可以轻松地掩藏组件故障,使用户无法察觉。

错误检测:Oracle Clusterware 可自动监视 Oracle RAC 数据库和其他 Oracle 进程(ASM、监听器等),并快速诊断环境中的问题。

它还经常能在用户察觉之前自动完成故障恢复。

利用快速应用程序通知 (FAN),应用程序即可在集群组件出现故障时立即得到通知,以便在故障显现之前重新发布事务。

Oracle RAC集群

Oracle RAC集群

平台的结构化数据采用业内广泛使用的Oracle 数据库管理系统进行存储和管理。

实时视频存储区部署一套RAC 集群,来承载业务处理中心相关业务。

车牌图片和事件存储区部署另一套Oracle RAC 集群来承载计费相关业务,同时为了进一步加强数据容灾,保障数据的安全性,方案通过Oracle Dataguard 工具将该部分数据传送至福建的异地灾备中心。

方案采用了Oracle Rac支持本地业务,是因为Oracle RAC具有很多数据库的高可用性优势所决定的。

1、双机并行。

RAC是一种并行模式,并不是传统的主备模式。

也就是说,RAC集群的所有成员都可以同时接收客户端的请求。

2、高可用性。

RAC是Oracle数据库产品高可用性的解决方案,能够保证在集群中只要有一个节点存活,就能正常对外提供服务。

3、易伸缩性。

RAC可以非常容易地添加、删除节点,以满足系统自身的调整。

4、低成本。

能使用较低廉的服务器来实现高可用性、高吞吐量的集群环境,这要比通过对某台高端服务器增加硬件实现高可用性、高吞吐量花费的成本低很多。

5、高吞吐量。

随着节点数的增加,整个RAC 的吞吐量也在不断增长。

一、双机并行RAC是一种充分利用服务器资源的高可用性实现方案,RAC 的并行模式实现方式与传统的双机热备实现方式截然不同。

如下图所示,两个节点在传统的双机热备环境中,始终有一台机器作为备用机,只有当主节点出现问题的时候才会切换到备用机上;如果主机一直没有出现问题,那么备用机始终处于空闲状态,这在资源的利用上以及成本方面都是巨大的浪费。

但RAC是一种并行模式的架构,也就是说,两个节点的集群节点间是一种并行运行的关系,当一台机器出现问题,请求会自动转发到另一台机器,没有任何一台机器作为备用机一直不被使用,这样就充分利用了服务器资源。

同时,传统的双机热备构架在出现问题时,常常需要数分钟的切换时间,而RAC在出现问题时,针对存在的会话只需要数十秒的时间就可以完成失败切换过程,对新会话的创建不会产生影响,在切换时间上也有比较大的优势。

Oracle RAC数据库集群

Oracle  RAC数据库集群

Hardware
Time
100% of task
Cluster system scaleup扩展性
Cluster system speedup加速
Hardware
Hardware
Hardware
Time Time Time
up to 200% of task
up to 300% of task
Hardware Time
– Transparent Application Failover
I-10
Oracle RAC集群数据库技术硬件结构
Centralized Management Console
High Speed Switch or Interconnect
Clustered Database Instances
Storage Area Network Drive and Exploit Industry Advances in Clustering
Cluster 硬件结构
• 节点 ( Node ) • 内部连接 ( Interconnect ) • 共享磁盘 ( Shared disk )
I-12
节点 ( Nodes )
Instance 中,并可以动态的 remaster
I-23
Cache FusionTM 体系结构
在节点A对数据进行了修改并提交,在节点B对同 一数据块进行读操作,可通过高速链路访问
多版本数据缓存支持节点A继续对数据块进行修改
Node A
数据传输
Database buffers
Node B
Database buffers
operating system

Oracle RAC 集群 官方文档

Oracle RAC 集群 官方文档

/technology/global/cn/pub/articles/hunter_rac11gr1_iscsi.html在Oracle Enterprise Linux 和iSCSI 上构建您自己的Oracle RAC 集群2007 年11 月发表目录Oracle Enterprise Linux 5.0OracleOpenfiler 2.2 (respin 2)ASMLib 2.0 Library - (2.0.3-1)支持文件1. 简介熟悉Oracle 真正应用集群(RAC) 11g技术的最有效方法之一是访问一个实际的Oracle RAC 11g集群。

没有什么方法比直接体验它们能够更好地理解其优势了,包括容错、安全性、负载均衡和可伸缩性。

遗憾的是,对于很多商家而言,典型的生产级RAC 配置所需的硬件投入使它们无法实现这一目标。

一个小型的两节点集群可能需要10,000 美元到20,000 美元以上。

该价格还不包括生产级RAC 环境的核心(通常是一个存储区域网),其起价为10,000 美元。

对于那些没有大笔现金但希望熟悉Oracle RAC 11g的人而言,本指南提供了一种低成本的替代方法来配置Oracle RAC 11g第1 版系统,它使用现成的商用组件和可下载的软件,估计成本在2,200 美元到2,600 美元之间。

该系统包括一个双节点集群(每个节点有一个处理器),这两个节点均运行Oracle 的Enterprise Linux(5.0 版)、Oracle RAC 11g第1 版、OCFS2 和ASMLib 2.0。

Oracle RAC 的所有共享磁盘存储将基于使用网络存储服务器(即Openfiler 2.2 版)的 iSCSI。

本文应与Red Hat Enterprise Linux 一同使用。

如果Red Hat Enterprise Linux 不稳定,Oracle 的Enterprise Linux (免费提供)可以实现这一目标,它包括OCFS2 和ASMLib 软件包(不包括ASMLib 用户空间库,它需要单独下载)。

ORACLE RAC方案介绍

ORACLE RAC方案介绍
• 多个instance 共同访问同一个 数据库。 • 每一个节点运行一个DB实例。 • 每一个节点运行相同的OS。 • 由软件控制数据的访问。
Oracle RAC硬件架构拓扑图
• 该拓扑图是一个典型的两节点RAC系统 • 两台光纤交换机, • 四台网络交换机等等构成 • 其中,两台光纤交换机,两台心跳交换机,两台公用IP交换机都做 了集群冗余,集群中的设备,无论哪台出了问题,都不会影响整个 系统的正常运行 • 服务器的配置应该相同,cpu,内存等,还有,每台服务器上至少两 块物理网卡,分别用于主机间私有通信和对外公用通信,也可以有 多快网卡,进行网卡绑定,实现网卡的冗余 • 每台服务器至少一块HBA卡,用于共享存储的连接。可以用光纤线 直连存储,也可以通过光纤交换机,我们建议使用光纤交换机 • 共享存储是整个RAC架构中的核心 • RAC是一个典型的“多实例,单数据库”架构,被所有节点共享, 并行访问。并保证可以被所有节点同时访问。IO性能要求比较高, 一般用光纤线连接,运行scsi协
ORACLE RAC 的优点和缺点
• • • • • • • • • • • • • • - 优点 一、多机并行 oracle rac 支持多台服务器共同对外提供完全相同的数据库服务。 二、高可用性 集群最大的优势在于它的高可用性,通过使用oracle RAC可以在一定程度上避免因为硬件或软件故障引起的数据丢失和非计划停机,并在一定程度上减 少或排除计划停机时间。 三、易伸缩性 oracle rac 可以通过添加 服务器和存储设备来提升处理能力和存储空间。 四、低成本 oracle rac 使用较廉价的x86 服务器取代小型机取得相同的性能 五、高吞吐量 oracle rac使用多台服务器对外提供服务,可以提供更大的吞吐量。 - 缺点 安装配置复杂,需要专业的存储设备配置和网络配置。 oracle rac 不是oracle 数据库的高性能解决方案

oracle rac介绍

oracle rac介绍
Oracle 11g RAC 介绍
什么是 Oracle RAC 集群?
• Oracle Real Application Server,真正应用集群 ,简称Oracle RAC ,是Oracle的并行集群,位 于不同服务器系统的Oracle实例同时访问同一个 Oracle数据库,节点之间通过私有网络进行通信 ,所有的控制文件、联机日志和数据文件存放在 共享的设备上,能够被集群中的所有节点同时读 写。
• RAC的优点主要在于高可用性和负载均衡,一台 机器当机不影响应用访问数据库
了解体系结构
节点 1
数据库实例 1
ASM 实例 1 CRS
操作系统
公用网络
节点 2
节点 3
集群互联
数据库实例 2
集群互联
数据库实例 3
...
ASM 实例 2
ASM 实例 3
CRS
CRS
操作系统
操作系统
共享存储
重做日志所有实例 数据库和控制文件 OCR 和 voting 磁盘 (oracle_home)
(1)voting disk(表决磁盘):用于记录集群节点的信息。RAC 用它来确 定哪些实例是集群实例。当网络发生故障时,还要用它存储的信息进行健 康检查(例如检查成员服务器是否可用)和仲裁。表决磁盘必须存放在共 享磁盘上。
(2)Oracle Cluster Registry(OCR,集群注册),用于记录集群配置信 息。集群注册也必须存放在共享磁盘上。
,因此磁盘和文件是多对多的关系。
ASM存储的概念
grid用户的ASM实例
• 可以看下grid的oracle进程ora_查看Oracle进程
• 登陆grid的asm实例
• [grid@node1 ~]$ sqlplus "/as sysasm"

Oracle11gR2 RAC实时应用集群(2)在Windows2003 x86_64下的集群(ASM篇)

Oracle11gR2 RAC实时应用集群(2)在Windows2003 x86_64下的集群(ASM篇)

Oracle11gR2 RAC实时应用集群(2)在Windows2003x86_64下的集群(ASM篇)(Oracle11gR2 + Grid + Windows2003 x86_64 + ASM) RAC(Real Application Clusters,实时应用集群),是多台主机组成的集群计算环境,是Oracle数据库支持网格计算环境的核心技术。

普通Oracle数据库,只能在一台主机上运行,数据库的实例和数据库文件都在一台主机上,是单实例单数据库。

RAC实时应用集群,可以在多台主机上运行,每台节点主机上运行一个数据库实例,通过共享存储磁盘访问相同的数据库文件,是多实例单数据库,单一节点故障不影响数据库的使用,负载能力也会随节点主机的增加而加强。

Oracle 11g引入Grid infrastructure,Oracle集成了自动存储管理功能,数据库基础设施就完全不再需要任何第三方的文件系统卷管理器.RAC集群的关键点:1.共享存储2.节点间需要内部通讯,以协调集群正常运行,所以每个节点需要提供外部网络与内部网络.3.CRS集群软件: 需要集群软件(Clusterware)协调各节点.4.集群注册文件(OCR): 需要注册集群,保存在共享磁盘上.5.仲裁磁盘(Voting Disk): 需要协调各节点决定控制权,做为表决器,保存在共享磁盘上.6.虚拟IP(Virturl IP): 提供客户端连接,IP由集群软件接管,当集群就绪时,虚拟IP可以连接.7.SCAN IP: 11gR2有增加的新特性,用于客户端连接,不需要再在客户端tnsname.ora 中添加各节点状态,SCAN IP可以调节负载平衡.共享存储访问方式(存储系统):1.集群文件系统(CFS:Cluster File System)2.自动存储管理(ASM:Automatic Storage Management)3.网络文件系统(NFS)单机文件系统FAT32,NTFS,ext3不能作为共享存储Oracle 11gR2不再支持使用裸设备作为共享存储特点集群名称SCAN名称(Single Client Access Name)GNS(网格命名服务)由于自动存储管理Oracle只支持Linux平台,所以在Windows下选择以下储存方案来建立集群系统:项目存储系统存储位置Clusterware软件NTFS 本地磁盘voting disk ASM 共享磁盘OCR ASM 共享磁盘数据库软件NTFS 共享磁盘数据库ASM 共享磁盘下面说说Oracle RAC在Windows2003 x64下的安装过程。

Oracle RAC集群的简单介绍

Oracle RAC集群的简单介绍

Oracle RAC集群的简单介绍一、 Oracle集群体系结构Oracle RAC,全称是 Oracle Real Application Cluster,即真正的应用集群,是Oracle 提供的一个并行集群系统,整个集群系统由 Oracle Clusterware (集群就绪软件)和 Real Application Clusters(RAC)两大部分组成。

oracle RAC的实质是位于不同操作系统的Oracle实例节点同时访问同一个Oracle数据库,每个节点间通过私有网络进行通信,互相监控节点的运行状态,oracle 数据库所有的数据文件、联机日志文件、控制文件等均放在集群的共享存储设备上,而共享存储设备可以是 RAW、ASM、OCFS2 等,所有集群节点可以同时读写共享存储。

Oracle RAC 的基本拓扑结构如下所示:由拓扑结构可知:一个 Oracle Rac 数据库有多个服务器节点组成,每个服务器节点上都有自己独立的 OS、ClusterWare、oracle Rac 数据库程序等,并且每个节点都有自己的网络监听器。

ClusterWare 是一个集群软件,主要用于集群系统管理,oracle Rac 数据库程序用于提供 oracle 实例进程,以供客户端访问集群系统,监听服务主要用于监控自己的网络端口信息,所有的服务和程序通过操作系统都去访问一个共享存储,最终完成数据的读写。

共享存储的实现方式有很多种,可以通过使用自动存储管理(ASM)、Oracle 集群文件系统(OCFS)、裸设备(Raw)、网络区域存储(NAS)等来保证整个集群系统数据的一致性。

从 Oracle10g 起,Oracle 提供了自己的集群软件,即 Oracle clusterware,它通过 CRS(即 Cluster Ready Services)来实现,这个软件是安装 oracle rac 的前提,也是 RAC 环境稳定运行的基础,在 oracle10g 之前的版本,安装 RAC 时必须借助与第三方的集群软件,而在 oracle10g 以后,安装 oracle rac 时,可以用 oracle 自带的集群软件,也可以使用经过 RAC 认证的第三方集群软件来代替。

RAC技术详解

RAC技术详解

目前中国大陆使用sap的公司,主流架构是一台DB,多台APP,这样主要压力都在DB的机器上,所以DB必须采用比较强的小型机;我们的方案是采用比较便宜的基于x86架构的机器,DB和APP都分布式部署,在DB和APP上都做负载均衡和容灾处理;由于使用oracle database,所以最好的solution当然是RAC,而对于应用服务器,sap本身已经可以做到分布式计算,所以现在整个方案最难的地方就是要在rac上部署sap,在国内,这种架构还很少见,(至少我还没听说哪个公司有用),SAP主推的HA架构,但为了以后扩展和升级的成本考虑,采用rac是必要的。

Oracle RAC是Oracle Real Application Cluster的简写,官方中文文档一般翻译为“真正应用集群”,它一般有两台或者两台以上同构计算机及共享存储设备构成,可提供强大的数据库处理能力,现在是Oracle 10g Grid应用的重要组成部分2.1 基本介绍RAC的结构图Oracle RAC是Oracle Real Application Cluster的简写,官方中文文档一般翻译为“真正应用集群”,是Oracle9i新版数据库中采用的一项新技术,也是Oracle数据库支持网格计算环境的核心技术。

它的出现解决了传统数据库应用中面临的一个重要问题:高性能、高可伸缩性与低价格之间的矛盾!它一般有两台或者两台以上同构计算机及共享存储设备构成,可提供强大的数据库处理能力,现在是Oracle 10g Grid应用的重要组成部分。

Oracle RAC主要支持Oracle9i、10g、11g版本,可以支持24 x 7 有效的数据库应用系统,在低成本服务器上构建高可用性数据库系统,并且自由部署应用,无需修改代码。

在Oracle RAC环境下,Oracle集成提供了集群软件和存储管理软件,为用户降低了应用成本。

当应用规模需要扩充时,用户可以按需扩展系统,以保证系统的性能。

oracle_rac_12c核心技术原理__概述说明以及解释

oracle_rac_12c核心技术原理__概述说明以及解释

oracle rac 12c核心技术原理概述说明以及解释1. 引言1.1 概述Oracle RAC(Real Application Clusters)是一种数据库集群技术,它允许多个数据库实例在同一个集群中运行,共享相同的物理存储。

相比于传统的单实例数据库,在RAC架构下,数据库的可扩展性、可用性和性能都得到了显著提升。

Oracle RAC 12c作为Oracle公司最新推出的版本,带来了更多的创新和改进,为企业提供了更强大的核心技术支持。

本文将对Oracle RAC 12c的核心技术原理进行概述说明和解释。

首先,我们会介绍RAC的基本概念和架构,包括多实例共享存储技术。

接着,我们将详细阐述RAC的部署和配置过程,涵盖安装Oracle Grid Infrastructure、创建RAC 数据库实例以及配置RAC集群环境。

随后,我们将重点关注Oracle RAC 12c 的故障恢复和高可用性机制,包括故障检测和恢复机制、数据保护和冗余机制以及高可用性管理和故障转移技术。

1.2 文章结构本文按照如下结构组织:首先是引言部分,简要介绍了文章的主题和结构;然后是Oracle RAC 12c核心技术原理部分,详细阐述了RAC的概念、架构和多实例共享存储技术;接着是Oracle RAC 12c的部署和配置部分,指导读者如何安装Grid Infrastructure、创建RAC数据库实例和配置集群环境;之后是故障恢复和高可用性机制部分,探讨了故障检测和恢复、数据保护和冗余以及高可用性管理和故障转移等关键内容;最后是结论部分,对文章内容进行总结,并展望Oracle RAC 12c的未来发展,并提出进一步研究的建议。

1.3 目的本文旨在传达对Oracle RAC 12c核心技术原理的深入理解,并提供一份完整的指南,帮助读者了解RAC的概念和架构,并掌握RAC的部署、配置以及故障恢复与高可用性机制。

通过本文的阅读与学习,读者将能够更好地利用Oracle RAC 12c来满足企业对于数据库可靠性、可扩展性以及高性能的需求。

RAC集群简介

RAC集群简介

对于RAC来说,最重要的还是要理解内部原理和体系结构。

安装不是非常难的事情。

排错和维护都离不开体系结构以及内部原理。

集群分类1、高性能计算计算任务分配到不同计算机节点来提高整体计算能力,主要应用在科学计算领域。

主要利用的是并行计算。

2、负载均衡集群(LB)把业务的负载流量尽可能的平均合理的分配到集群的各个节点上,每个节点都可以处理一部分负载,并且可以根据负载情况进行动态的平衡。

负载均衡算法不是简单的平均,而是根据每个节点的可用资源或网络的特殊情况来进行优化分配。

因此分配+合理才是负载均衡的核心。

3、高可用性(HA)侧重于提高系统的可用性,集成硬件和软件的容错性来实现整体服务的高可用性。

如果某个节点发生故障,另外的节点代替他。

集群环境的特殊问题1、并发控制集群环境中,存在共享存储的问题。

集群中各个节点对共享存储是对等的,所有节点对数据有相同的访问权限,因此需要某种机制来控制节点对数据的访问。

在RAC中,采用的是DLM(Distribute Lock Management)机制来进行实例间的并发控制。

2、健忘症(Amnesia)如果集群环境的配置文件不是集中存放,每个节点都有一个本地副本,集群正常运行的时候,用户可以在任何节点修改集群的配置,并且这些更改都会自动同步到其他节点。

如果节点1因为正常的维护需要关机,节点2修改了配置,然后关闭节点2.启动节点1,因为之前节点2做的配置修改没有同步到节点1,所以将节点1启动以后,他仍然使用旧的配置文件,造成配置丢失。

3、脑裂(split brain)集群中,节点之间需要通过某种机制(心跳)了解彼此的健康情况,以确保各个节点协调工作。

假设只是心跳出现故障,各个节点还在正常的工作,每个节点都认为其他节点宕机,自己是整个集群的唯一健在者,因此需要获得整个集群的“控制权”。

存储是共享的,这就意味着灾难,这种情况就是“脑裂”。

投票算法可以解决这个问题通过表决磁盘判定,获得表决磁盘多得节点将强制另外一个节点重启。

ORACLE-RAC之名词解释

ORACLE-RAC之名词解释

什么是OMF
Oracle Manage File 的简写,一般在创建数据库-指定数据文件路径时你会见到它的身影。一旦你选择了该种路径方式,在创建表空间,控制文件,日志文件时就不需要指定位置和文件名了,Oracle会根据一些初始化参数的设置自动分配和命名,其通常与ASM搭配使用。
什么是OCR
什么是OUI
说起OUI大家应该都不会陌生,其全称是Oracle Universal Installer,就是图形化的安装助手,这个就不多说什么了。
什么是ASM
做为oracle当前主推的一种存储特性,在oracle官方文档中处处都能看到Oracle recommends using ASM之类的字眼,其实这并不奇怪,就像刚生完孩子的母亲抱着孩子出门遛弯,逢人就想跟人说:看看我家孩子多漂亮的心理是一样的,毕竟是人家自己的东西,如果它自己都不推广还能靠谁去推广呢,与何况这里头还有着更重要的经济利益和长远战略,oracle不仅建议你存储用asm,它还有n多别的建议,比如管理用em,存储用asm,表空间管理用local,undo管理用auto等等。扯远了,回到主题,啥是ASM呢,其全称是:Automatic Storage Management。可以把它理解成oracle自己设计的,用软件实现的,用于存储的黑匣子。
RAC不仅仅是个组件,就我理解,它更应该被称之为一种体系,因为它不是单单由某项特性组成,而是一堆特性应用的集合。该体系实现了多个实例同时访问和管理同一数据库,多个实例可以存在于不同节点,也可以在相同的节点上(从提升性能的角度来看,并不推荐这样),彼此通过内网连接交换数据,并且能够自动平衡负载,如果其中某个节点发生故障,RAC能够通过后台的监控进程将连接自动切换到另外一个或多个节点上,从而实现应用的无缝切换,对实例的高可用提供保护。

Oracle10g_10_RAC介绍

Oracle10g_10_RAC介绍
RAC的特点
ORACLE10g中RAC的新特性
All Rights Reserved Copyright(C) Fujitsu (China) Holdings Co., Ltd. 2007
为什么用 RAC?
高可用性:
它能从节点和实例失败中恢复. 可伸缩性: 你可以随后增加更多节点. 当你成长时支付: 今天只支付你需要的. 关键网格计算特性:
HP TPC-C 基准测试
SMP
1,200,000
1,000,000 1,008,144
RAC
1,184,893
Big SMP 结果的 118%
800,000
tpmC 600,000
400,000
200,000 0 1X64 16X4 节点数 X 每节点 CPU 数量
RAC = $5.52 / tpmC SMP = $8.33 / tpmC

实例n
归档 日志文件 局部存储 撤销表空间 文件为 实例n 在线重做 日志文件 为实例n
在线重做 日志文件 为实例1
All Rights Reserved Copyright(C) Fujitsu (China) Holdings Co., Ltd. 2007
RAC 软件原则
节点1 实例1 Cache …
ASM
RAC Linux Windows
OCFS
RAC Linux Windows
RAW
RAC AIX, HP-UX, Solaris
ASM RAW CFS OS CVM
数据库共享存储
All Rights Reserved Copyright(C) Fujitsu (China) Holdings Co., Ltd. 2007

ORACLERAC集群概念介绍

ORACLERAC集群概念介绍

ORACLERAC集群概念介绍集群术语须知服务硬件:指提供计算服务的硬件,比如 PC 机、PC 服务器。

服务实体:服务实体通常指服务软体和服务硬体。

节点(node):运行 Heartbeat 进程的一个独立主机称为节点,节点是HA 的核心组成部分,每个节点上运行着操作系统和Heartbeat 软件服务。

资源(resource):资源是一个节点可以控制的实体,当节点发生故障时,这些资源能够被其他节点接管。

如:磁盘分区、文件系统、IP 地址、应用程序服务、共享存储事件(event):事件也就是集群中可能发生的事情,例如节点系统故障、网络连通故障、网卡故障和应用程序故障等。

这些事件都会导致节点的资源发生转移,HA 的测试也是基于这些事件进行的。

什么是集群集群(cluster)就是一组计算机,它们作为一个整体向用户提供一组网络资源,这些单个的计算机系统就是集群的节点(node)。

集群提供了以下关键的特性。

(一) 可扩展性。

集群的性能不限于单一的服务实体,新的服务实体可以动态的加入到集群,从而增强集群的性能。

(二) 高可用性。

集群通过服务实体冗余使客户端免于轻易遭遇到“out of service”警告。

当一台节点服务器发生故障的时候,这台服务器上所运行的应用程序将在另一节点服务器上被自动接管。

消除单点故障对于增强数据可用性、可达性和可靠性是非常重要的。

(三) 负载均衡。

负载均衡能把任务比较均匀的分布到集群环境下的计算和网络资源,以便提高数据吞吐量。

(四) 错误恢复。

如果集群中的某一台服务器由于故障或者维护需要而无法使用,资源和应用程序将转移到可用的集群节点上。

这种由于某个节点中的资源不能工作,另一个可用节点中的资源能够透明的接管并继续完成任务的过程叫做错误恢复。

分布式与集群的联系与区别如下:(一) 分布式是指将不同的业务分布在不同的地方。

(二) 而集群指的是将几台服务器集中在一起,实现同一业务。

(三) 分布式的每一个节点,都可以做集群,而集群并不一定就是分布式的。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

节点 3
数据库实例 3
...
ASM 实例 3 CRS
操作系统
了解体系结构
客户端首先访问某个实例,让后再通过集群管理软件访问到 数据库的数据;节点之间使用内部连接进行通讯。
了解体系结构
• 集群术语 • 基本功能
– 通过消除作为单点故障 (SPOF) 的节点和 Oracle,实现了高可用 性 – 通过增加额外的处理容量,实现了可伸缩性
共享的 SQL
日志 缓冲区
共享的 SQL
日志 缓冲区
. . .. .
.
共享的 SQL
日志 缓冲区
共享的 SQL
日志 缓冲区
共享磁盘数据库
了解体系结构
公用网络
节点 1
数据库实例 1 ASM 实例 1 CRS 操作系统
集群互联
节点 2
数据库实例 2 ASM 实例 2 CRS 操作系统
共享存储 重做日志所有实例 数据库和控制文件 OCR 和 voting 磁盘 (oracle_home) 集群互联
了解体系结构
集中 管理控制台 高速交换机和
网络
用户
互联
集群的 数据库服务器 集线器或 交换机结构 镜像磁盘 子系统
低延迟互联
无单点故障
存储区域网
了解体系结构
共享数据模型
GES&GCS
共享内存/全局区域
GES&GCS
共享内存/全局区域
GES&GCS
共享内存/全局区域
GES&GCS
共享内存/全局区域
RAC 进程
• RAC 使用两个进程来保证每个实例都包含一个查询或事务所需要 的数据: Global Cache Service (GCS) 和 the Global Enqueue Service (GES)。 • GCS 和 GES 使用 Global Resource Directory (GRD)来维护和 记录每个数据文件的状态。GRD(全局资源目录)的内容分布在 所有活动的实例上,RAC 的特定进程与 GRD 结合,使得 RAC 可以使用缓存融合,下面是 RAC 的几个进程:
• 光纤通道、SCSI 或 NAS 存储连接
规划体系结构
• 集群互联冗余
– RH 3.0 NIC Bonding
/pub/linux/kernel/people/marcelo/linux2.4/Documentation/networking/bonding.txt
• 本地 ORACLE_HOME
使用Oracle Clusterware 将多个装有相同操作系统的服务器捆绑到一起, 当对这些集群的服务器进行访问时,就像访问一台服务器一样。
Oracle Clusterware 要求两个集群组件:
(1)voting disk(表决磁盘):用于记录集群节点的信息。RAC 用它来确 定哪些实例是集群实例。当网络发生故障时,还要用它存储的信息进行健 康检查(例如检查成员服务器是否可用)和仲裁。表决磁盘必须存放在共 享磁盘上。 (2)Oracle Cluster Registry(OCR,集群注册),用于记录集群配置信息 。集群注册也必须存放在共享磁盘上。
Oracle 集群存储选项
• 需要存储的基本软件和数据
Oracle 集群存储选项
• 各部分支持的存储系统
规划体系结构
• 消除单点故障 • 工作负载分布(负载均衡)策略
– Net 服务 (SQL*Net) – Oracle10g 服务
• 使用网格控件监控和管理并达成服务级别协议 • 处理节点 – 足够的CPU 以适应故障 • 可伸缩 I/O 子系统
– 使用 ASM 和 S.A.M.E.
规划体系结构
• 无单点故障 • 集群互联
– FastEthernet、千兆以太网
• 公用网络
– 以太网、FastEthernet、千兆以太网
• 推荐的服务器配置
– 每台服务器最少 2 个 CPU – 2 个和 4 个 CPU 服务器的成本通常最经济 – 每个 CPU 1-2 GB 内存
Oracle 10g RAC 培训
什么是 Oracle RAC 集群?
• Oracle Real Application Server,真正应用集群 ,简称Oracle RAC ,是Oracle的并行集群,位于 不同服务器系统的Oracle实例同时访问同一个 Oracle数据库,节点之间通过私有网络进行通信 ,所有的控制文件、联机日志和数据文件存放在 共享的设备上,能够被集群中的所有节点同时读 写。
Crs Troubleshooting 日志分析文件
– OCFS V2 支持共享的 ORACLE_HOME
• 裸设备上的 OCR 和 Voting 磁盘
Oracle RAC 安装
• • • • • • 操作系统环境准备(程序包、内核参数、用户等) 安装CRS 安装oracle 软件 打补丁 创建数据库 Oracle RAC 功能测试(failover、loadbalance)
Oracle RAC日常基本维护命令
集群资源状态查询 crs_storacle@agxt1:/home/oracle> crs_stat -t 名称 类型 目标 状态 主机
-----------------------------------------------------------ora....SM1.asm application ONLINE ONLINE agxt1 ora....T1.lsnr application OFFLINE OFFLINE ora.agxt1.gsd application OFFLINE OFFLINE ora.agxt1.ons application OFFLINE OFFLINE ora.agxt1.vip application OFFLINE OFFLINE ora....SM2.asm application ONLINE ONLINE agxt2 ora....T2.lsnr application OFFLINE OFFLINE ora.agxt2.gsd application OFFLINE OFFLINE ora.agxt2.ons application OFFLINE OFFLINE ora.agxt2.vip application OFFLINE OFFLINE ora.szshare.db application OFFLINE OFFLINE ora...FFLINE ora....e2.inst application OFFLINE OFFLINE
详细安装步骤可参看在各操作系统相关的安装文档
Oracle RAC 负载均衡功能参数配置
tnsnames.ora 参数配置
ZHUMORCL = (DESCRIPTION = (ADDRESS = (PROTOCOL = TCP)(HOST = vip1)(PORT = 1521)) (ADDRESS = (PROTOCOL = TCP)(HOST = vip2)(PORT = 1521)) (LOAD_BALANCE = yes) (CONNECT_DATA = (SERVER = DEDICATED) (SERVICE_NAME = ZHUMORCL) (failover_mode = (type=session) (method=basic) (delay=5) ) ) ) 在sql 下运行以下语句: • • SQL>ALTER SYSTEM SET local_listener = '(ADDRESS = (PROTOCOL = TCP)(HOST = 19.48.25.11)(PORT = 1521))' SCOPE=both SID='ZHUMORCL1'; SQL>ALTER SYSTEM SET local_listener = '(ADDRESS = (PROTOCOL = TCP)(HOST = 19.48.25.12)(PORT = 1521))' SCOPE=both SID='ZHUMORCL2';
Oracle Clusterware 组件进程
Oracle Clusterware 进程
• crsd: 负责管理集群的高可用操作。管理的crs资源包括数据库、实例、监听 、虚拟IP,ons,gds或者其他,操作包括启动、关闭、监控及故障切换。改 进程由root用户管理和启动。crsd如果有故障会导致系统重启。 cssd,管理各节点的关系,用于节点间通信,节点在加入或离开集群时通知 集群。该进程由oracle用户运行管理。发生故障时cssd也会自动重启系统。 oprocd – 集群进程管理 —Process monitor for the cluster. 用于保护共享数据 IO fencing(IO隔离 )。io fencing用来防止脑裂 (split brain)的。在心跳网卡 全部中断通讯的时候,各个节点由于失去了联系,会抢夺资源,这时候谁最 先fencing disk霸占住,谁就是主用,抢不到的还是备用。
Oracle RAC日常基本维护命令
• 集群资源启动/停止
crs_start –all
crs_stop –all
Oracle RAC日常基本维护命令
• 特定节点上节点应用程序的状态 • $ srvctl status nodeapps -n linux1 VIP is running on node: linux1 GSD is running on node: linux1 Listener is running on node: linux1 ONS daemon is running on node: linux1 • ASM 实例的状态 $ srvctl status asm -n linux1 ASM instance +ASM1 is running on node linux1.
相关文档
最新文档