常用容错及冗余机制
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4 常用容错及冗余机制
4.3.3 SAN的优点 1. 管理上的方便性,集中式管理软件允许远程配置、监管 和无人值守运行; 2. 可扩展性,容量可扩展以符合网络需求,在不影响LAN性 能的情况下充分发挥存储硬件的功能; 3. 高容错能力、高可靠性和高可获性,SAN就绪的磁带库具 备可热插拔的冗余磁带机、介质、电源和冷却系统以确 保可靠性; 4. 配置的灵活性,具备长达20公里距离的远程功能及灵活 的网络部件,基于光纤通道的SAN可以根据要求进行配置; (可实现物理上分离的、不在机房的存储) 5. 支持异构服务器,UNIX、NT和NetWare服务器可同时连; 6. 能够有效地减少总体拥有成本(TCO)。
4 常用容错及冗余机制
4.2.2 双机热备份的硬件系统结构 双机系统是由两台服务器和共享存储子系统组成的。其 中: 每台主机都有自己的系统盘,安装操作系统和应用程序。 每台主机至少安装两块网卡,一块对外工作,另一块相互 侦测对方的工作状况。 每台主机都连接在共享磁盘子系统上,共享磁盘子系统通 常均为有容错的磁盘阵列。各种应用所需的数据均储存在 磁盘阵列子系统上。 下图是双机容错系统的硬件示意图
4 常用容错及冗余机制
2、RAID 1: 两组相同的磁盘系统互作镜像,速度没有提高,但 是允许单个磁盘错,可靠性最高。RAID 1就是镜像。其原 理为在主硬盘上存放数据的同时也在镜像硬盘上写一样 的数据。当主硬盘(物理)损坏时,镜像硬盘则代替主 硬盘的工作。因为有镜像硬盘做数据备份,所以RAID 1的 数据安全性在所有的RAID级别上来说是最好的。但是其 磁盘的利用率却只有50%,是所有RAID上磁盘利用率最低 的一个级别。
4 常用容错及冗余机制
4 常用容错及冗余机制
4.2.3双机容错的工作模式 双机容错有两种工作模式:一种是热守候,另一种是双工 模式。 1、热守候模式 在热守候模式下,双机容错系统对外只有一个服务(如数 据库服务)在运行。其中一台服务器对外服务另一台处在 守候状态,并不启动服务。当工作的服务器出现问题时, 如数据库服务器出现操作系统挂起、死机、网卡坏、硬盘 控制器坏等等,热守候服务器接管工作主机的任务。
4 常用容错及冗余机制
RAID 0 over RAID 1 假设我们有四台磁盘驱动器,每两台磁盘驱动器先做 成RAID 1,再把两个RAID 1做成RAID 0,这就是RAID 0 over RAID 1: (RAID 1) A = Drive A1 + Drive A2 (Mirrored) (RAID 1) B = Drive B1 + Drive B2 (Mirrored) RAID 0 = (RAID 1) A + (RAID 1) B (Striped) RAID 1 over RAID 0 假设我们有四台磁盘驱动器,每两台磁盘驱动器先做 成RAIቤተ መጻሕፍቲ ባይዱ 0,再把两个RAID 0做成RAID 1,这就是 RAID 1 over RAID 0: (RAID 0) A = Drive A1 + Drive A2 (Striped) (RAID 0) B = Drive B1 + Drive B2 (Striped) RAID 1 = (RAID 1) A + (RAID 1) B (Mirrored)
4 常用容错及冗余机制
4.1冗余磁盘阵列(RAID) 4.1.1 RAID的概念 RAID,为Redundant Arrays of Independent Disks的简 称,中文为廉价冗余磁盘阵列。 4.1.2 RAID的级别 1、RAID 0: 将多个较小的磁盘合并成一个大的磁盘,不具有冗 余,并行I/O,速度最快。RAID 0亦称为带区集。它是将 多个磁盘并列起来,成为一个大硬盘。在存放数据时, 其将数据按磁盘的个数来进行分段,然后同时将这些数 据写进这些盘中。所以,在所有的级别中,RAID 0的速 度是最快的。但是RAID 0没有冗余功能的,如果一个磁 盘(物理)损坏,则所有的数据都无法使用。
4.3 SAN存储 4.3.1 SAN的概念 SAN ( Storage Area Network ) :存储区域网络,是随 着光纤通道技术的出现而产生的新一代磁盘共享系统,是 一种类似于普通局域网的高速存储网络。 4.3.2 SAN的构成 SAN 由 硬 件 和 软 件 构 成 , 硬 件 主 要 包 括 FC ( Fibre Channel)卡、FC HUB、FC 交换机、存储设备;软件主要 包括FC卡对各种操作系统的驱动程序及存储/监控管理软件。 SAN通过光纤通道连接到一群计算机上。在该网络中提供了 多主机连接,但并非通过标准的网络拓扑。
4 常用容错及冗余机制
4、RAID 5: 向阵列中的磁盘写数据,奇偶校验数据存放在阵列 中的各个盘上,允许单个磁盘出错。RAID 5也是以数据的 校验位来保证数据的安全,但它不是以单独硬盘来存放 数据的校验位,而是将数据段的校验位交互存放于各个 硬盘上。这样,任何一个硬盘损坏,都可以根据其它硬 盘上的校验位来重建损坏的数据。硬盘的利用率为n-1。 基本上来说,多人多任务的环境,存取频繁,数据量不 是很大的应用,都适合选用RAID 5 架构,例如企业档案 服务器、WEB 服务器、在线交易系统、电子商务等应用, 都是数据量小,存取频繁的应用。
4 常用容错及冗余机制
在RAID 1 over RAID 0架构之下,如果 (RAID 0) A有 一台磁盘驱动器故障,(RAID 0) A就算毁了,当然RAID 1 仍然可以正常工作;如果这时 (RAID 0) B也有一台磁盘驱 动器故障,(RAID 0) B也就算毁了,此时RAID 1的两磁盘 驱动器都算故障,整个RAID 1资料就毁了。 因此,RAID 0 OVER RAID 1应该比RAID 1 OVER RAID 0 具 备 比 较 高 的 可 靠 度 。 所 以 我 们 建 议 , 当 采 用 RAID 0+1/RAID 10架构时,要先作RAID 1,再把数个RAID 1做成 RAID 0
4 常用容错及冗余机制
下图为双机工作示意图:
双机软件应支持WINDOWS NT 和主流的UNIX操作系统。 支持主流 的 数 据 库 , 如 SQLSERVER 、 ORACLE 、 SYBASE 、 INFORMIX 等 。 支 持 TCP/IP通讯协议。 支持现在市场上的主流服务器产品。
4 常用容错及冗余机制
4 常用容错及冗余机制
3、RAID 3: RAID 3 存 放 数 据 的 原 理 和 RAID0 、 RAID1 不 同 。 RAID 3是以一个硬盘来存放数据的奇偶校验位,数据则 分段存储于其余硬盘中。它象RAID 0一样以并行的方式 来存放数,但速度没有RAID 0快。如果数据盘(物理) 损 坏 , 只 要 将 坏 硬 盘 换 掉 , RAID 控制系统则会根据校验盘的数据校验位在新盘中重建坏 盘上的数据。不过,如果校验盘(物理)损坏的话,则 全部数据都无法使用。利用单独的校验盘来保护数据虽 然没有镜像的安全性高,但是硬盘利用率得到了很大的 提高,为n-1。RAID 3 以其优越的写入性能,特别适合用 在大型、连续性档案写入为主的应用,例如绘图、影像、 视讯编辑、多媒体、数据仓储、高速数据撷取等等。
4 常用容错及冗余机制
5、RAID 0-1: 同时具有RAID 0和RAID 1的优点。适合用在速度需求高, 又要完全容错,当然经费也很多的应用。 RAID 0+1到底应该是RAID 0 over RAID 1,还是RAID 1 over RAID 0,也就是说,是把多个RAID 1 做成RAID 0, 还是把多个RAID 0 做成RAID 1?
4 常用容错及冗余机制
4.2.4双机容错软件 在双机容错系统的工作中,双机软件是必不可少的。一切 故障的诊断,服务的切换,硬件的控制都由双机软件来控制 实现。同时为了使双机系统对外象一个单主机系统一样,双 机软件还可以为双机系统生成系统虚拟IP对外工作,客户机 通过虚拟IP访问双机系统。这样就避免了服务切换后主机IP 地址改变导致客户机无法连通的问题。并且双机软件还可以 控制两台服务器对共享磁盘子系统的访问同一时刻只能有一 台主机可以对其访问,避免了同时访问可能造成的数据破坏。 双机软件通过侦测网卡或两台服务器之间互连的串口线进行 两台主机的状态诊断,一旦工作的主机出现问题,如数据库 服务器出现操作系统挂起、死机、网卡坏、硬盘控制器坏等 等,双机软件控制备份机接管系统的虚拟IP和共享磁盘子系 统的控制权并启动备份机上的服务对外工作,保证系统的实 时性和可靠性。
4 常用容错及冗余机制
2、双工模式 在双工模式下双机系统对外提供两个服务(例如:应 用服务和数据库服务)。两台服务器都安装了应用服务和 数据库服务软件,数据库的数据存在共享盘中。在正常情况 下,一台服务器只起应用服务,未起数据库服务,对客户端的 应用请求进行处理;另一台服务器只起数据库服务,不起应 用服务,对共享盘拥有控制权并对共享盘中的数据进行存取, 提供数据库服务.当其中任何一台服务器出现问题,如数据 库服务器出现操作系统挂起、死机、网卡坏、硬盘控制器 坏等等。这时,另一台服务器将出问题的服务器上的任务 接管,此时,这台服务器同时提供应用服务和数据库服务, 客户端就可继续进行对服务器的业务请求,保证业务的继 续进行。在出问题的服务器恢复正常后,又可选择适当时 间切换到正常操作状态,以保证整体性能。
4 常用容错及冗余机制
4 常用容错及冗余机制
FC卡用于主机和FC设备之间的连接,一般为64 PCI总线。 存储/监控管理软件的主要功能是自动发现网络拓扑及映 射,当存储网络发生变化时可自动发现并更新。另一个重要 的功能是作传输的监视,报告及预测网络的交通情况,管理 人员可根据这些情况作最佳化的设计以平衡负载。 由于采用光纤接口,一般使用FC存储设备,如光纤硬盘, 当然也可以采用SCSI硬盘,但要使用Fiber to SCSI转接设 备。
4 常用容错及冗余机制
4.3.4传统存储与SAN的区别
服务器存储方式的显著特点是局域网用户通过访问专用服务器及与 专用服务器相连的SCSI存储设备而实现对信息的存取访问。工作在这 种模式下的数据传输的瓶颈主要集中在服务器上,当多个Client访问 存取同一个服务器的时候,一旦超出该服务器的处理能力的情况,无 论服务器与存储设备之间是通过SCSI设备连接,还是通过高速的Fibre Channel(光纤通道)设备连接,都将不可避免地导致存取速度的下降, 从而影响整个系统性能。 SAN实际上是一种存储设备池,即一个由盘阵、磁带以及光纤设备 构成的子网,这一子网上的存储空间可由以太网主网上的每一系统所 共享。它是企业存储数据的场所,在被服务器调用之前,所有的数据 都驻留在SAN上,仅当服务器调用它们时,SAN才会转化为客户机网络。 它使存储系统和主机从物理连接和功能上都独立出来,分别组成自己 的网络,实现了主机和盘阵间的Point-to-Point存取到Many-to-Many 存取的飞跃。它采用了高速光纤通道连接(FC-AL),有效地提高多个 服务器集群Cluster时的系统性能。
4 常用容错及冗余机制
4 常用容错及冗余机制
4.1.3 RAID级别的优、缺点
4 常用容错及冗余机制
4.2双机热备份(容错) 4.2.1 双机热备份的概念 所 谓 双 机 热 备 份 就 是 一 台 主 机 为 工 作 机 〔primary Server〕,另一台主机为备份机〔Standby Server〕,在系 统正常情况下,工作机对信息系统提供支持,备份机监视 工作机运行情况〔工作机同时监视备份机是否正常,有时 备份机因某种原因出现异常,工作机可尽早通知系统管理 工作人员解决,确保下一次切换的可靠性〕。当工作机出 现异常,不能支持信息系统运营时,备份机主动接管 〔Take Over〕工作机的工作,继续支持信息的运营,从而 保证信息系统能够不间断地运行〔Non-Stop〕。当工作机 经过维修恢复正常后,系统管理人员通过管理命令或经由 以人工或自动的方式将备份机的工作切换回工作机,而原 来的工作机就成了备份机。