vmware 高可用性(集群HA)

合集下载

vmware 面试题

vmware 面试题VMware是一家全球领先的虚拟化和云计算软件公司，其产品和解决方案广泛应用于企业的IT基础设施中。

如果你正在为VMware的面试做准备，下面我将为你提供一些常见的VMware面试题，帮助你更好地应对面试挑战。

1. 什么是虚拟化技术？虚拟化技术是一种将计算机资源进行抽象和隔离，以便多个虚拟实例可以共享这些资源的方法。

它通过在物理硬件上创建虚拟的计算环境，使得能够同时运行多个操作系统和应用程序。

2. VMware的产品中最常用的是什么？VMware的最常用产品是VMware vSphere。

vSphere是一种虚拟化平台，可以为企业提供灵活的IT基础设施，并简化管理和优化资源。

3. 请解释一下VMware中的vMotion是什么？vMotion是VMware vSphere中一项重要的功能，它允许在物理主机之间实时迁移虚拟机。

通过vMotion，虚拟机可以在不中断服务的情况下从一个物理主机迁移到另一个物理主机，以实现负载均衡和高可用性。

4. 什么是VMware HA高可用性？VMware HA（High Availability）是vSphere的一个功能，用于自动监测物理主机故障，并在发生故障时自动将虚拟机迁移到其他正常运行的主机上，从而实现虚拟机的高可用性。

5. 请解释一下VMware DRS负载均衡是什么？VMware DRS（Distributed Resource Scheduler）是vSphere中的一个特性，用于根据虚拟机的资源需求和当前主机的资源利用率，在集群中自动分配和均衡虚拟机的工作负载，从而实现资源的最优化和负载均衡。

6. 请简要说明VMware NSX的作用是什么？VMware NSX是一种虚拟化网络和安全平台，它可以将网络和安全策略与虚拟机和容器一起管理，实现虚拟网络的隔离、安全性和可扩展性。

7. 请解释一下VMware vSAN的概念。

VMware vSAN是一种软件定义的存储解决方案，它可以在虚拟化环境中利用物理主机上的本地存储设备（如硬盘和固态硬盘）创建高性能和高可用性的共享存储池。

VMware+高可用性配置(HA)(DRS)(FT)

右键“新建主机”，将 ESX Server 和 vCenter Server 添加到 DNS 服务器，依靠此 DNS 服务器进行名称解析。
22，
配置 vCenter Server 所在的计算机名称，我的电脑属性计算机名，选择“更改”。
23，
点击“其它”按钮。
24，
为计算机添加 NDS 后缀，配置完成后重新启动计算机。
1，
配置 DNS 服务器，开始程序管理工具配置服务器向导，点击“下一步”。
2，
配置服务器预备介面，点击“下一步”。
3，
选择“DNS 服务器”，然后点击“下一步”。
4，
确定即将开始的配置信息，安装时需要插入系统安装光盘，然后点击“下一步”。
5，
进入欢迎向导界面，点击“下一步”。
6，
选择配置类型，点击“下一步”。
VMware 高可用性(HA/DRS/FT)的配置
VMware HA(故障转移)可以将虚拟机及其所驻留的主机集中在群集内，从而为虚拟机提供高可用性，群集中的主机均会受到监控，如果发生故障，故障主机上的虚拟机将在备用主机上重新启动；虚拟机中运行的应用程序提供快速中断恢复，故障及时转移，减少停机的时间，确保了业务的可连接性。
36，
勾选功能栏下的“打开 VMware HA”和“打开 VMware DRS”。
37，
配置 VMware HA 功能，根据主机数目配置可容许故障主机的数目，其它选项使用
默认即可。
38，
配置虚拟机选项，根据环境情况配置，通常情况使用默认配置即可。
39，
配置虚拟机监控，根据情况进行配置，通常选择默认。
44，
配置完成之后，在群集里的每个主机上点击右键，选择重新配置 VMware HA，使

VMware vCenter 高可用性 HA 详解

VMware vCenter 高可用性 HA 详解时间: 2011-07-01 分类: VMware标签: DRS, HA, vCenter, VM, vMotion / 1,455 次浏览0 评论VM ware HA简介HA的全称是High Availability(高可用性)。

VM ware HA群集一般具有一个包括两个或者两个以上ESX 主机的逻辑队列。

在一个HA群集中，每一台VM ware ESX服务器配有一个HA代理，持续不断地检测群集中其他主的心跳信号。

假如某台ESX主机在连续三个时间间隔后都还没有发出心跳信号，那么该主机就被默认为发生了故障或者与网络的连接出现了问题。

在这种情况下，原本在该主机上运行的虚拟机就会自动被转移到群集中的其他主机上。

反之，如果一台主机无法接收到来自群集的其他主机的心跳信号，那么该主机便会启动一个内部进程来检测自己跟群集中其他主机的连接是否出现了问题。

如果真的出现了问题，那么就会中断在这台主机上所有正在运行的虚拟机，并启动预先设定好的备用主机。

此外，VMware HA的另一个显著的特点是能够对一个群集中的多台ESX服务器(多达四台)上进行故障转移。

对于一次VMware HA故障转移，客户端操作系统认为只是一次因硬件的崩溃而进行的重启，并不会觉察到是一次有序的关机。

因此，这样的修复并不会改变操作系统的状态。

此外，虚拟机中任何正在进行的业务也不会丢失。

即使备用ESX服务器主机的硬件设备跟原ESX服务器主机的硬件设备有所不同，客户端操作系统也不会检测到这种不同。

所以，VMware HA的故障转移对于客户来说可以算是完全透明的，几乎不会出现任何停机的危险。

1. VMware HA 提供快速中断恢复VMware HA 利用配置为群集的多台 ESX/ESXi 主机，为虚拟机中运行的应用程序提供快速中断恢复和具有成本效益的高可用性。

VMware HA 通过以下两种方式保护应用程序可用性：∙通过在群集内的其他主机上自动重新启动虚拟机，防止服务器故障。

VMware vSphere ESXI【ESX】中的HA工作原理介绍

【资料】VMware vSphere ESXI/ESX 中的HA工作原理介绍HA全称High Availability。

它是VMware的企业应用环境中用来保障企业级应用的不间断运行需求所产生的一个组件。

HA允许一个集群中在资源许可的情况下，将出现故障的ESX主机上面的VM在其他的主机上启动起来，其间的业务时间间断为：VM系统启动时间+应用启动时间+15秒左右的心跳检测时间。

通常这个时间都能够保持在3分钟内。

HA不受DRS和VMotion的影响，也就是说它并不依赖于后两者存在，它的心跳检测信号可以通过在ESX 主机之间发生。

HA甚至都不依赖于VC服务器，不过鉴于HA的配置需要一来VC，所以我们一般认为HA 还是需要依赖于VC服务器的，但是我们必须清楚的认识：VC于HA的作用仅限于配置时需要它，配置完成之后，只要我们设定了心跳检测的隔离地址，则我们可以丢弃VC服务器了（前提是我们不需要用到DRS 和VMotion等功能）。

设定HA集群过程中，我们可以看到如下几个选项，他们分别的含义是：1、接入控制。

用于设定集群中可以恢复或确保故障切换的最大主机故障数（VI3中集群最大允许故障主机数目为4台）、确定违反可用性限制的VM是否可以被启动。

2、默认群集设置。

默认会应用于群集中的所有满足HA条件的VM。

其中“虚拟机重新启动优先级”选项指定发生主机故障时重启VM的相对优先级，优先级较高的VM将优先启动，依此类推，优先级从高到低次第启动；“主机隔离响应”选项则用于执行已与集群失去连接的ESX主机应对正在运行的VM执行的操作。

默认情况下，住过主机被隔离，则每台VM会保持启动状态，也就意味着被隔离ESX主机无法于集群中的其他主机取得联系，但是其中的VM还继续保持运行；“关闭虚拟机”和“虚拟机关闭”则会将VM交付于其他ESX主机，等同于切断VM的电源，可能导致应用数据丢失。

其中前者相当于拔电源，后者则是温和的自动启动关机命令。

VMware Vmotion、HA、DRS的介绍

VMware Vmotion、HA、DRS的介绍VmotionVmware Vmotion可以使运行中的虚拟机从一台物理服务器实时迁移到另一台物理服务器，它实现了零停机时间和连续可用的服务，并能全面保证事务的完整性。

Vmotion是一种用户创建动态、自动化、自我优化的数据中心的关键促成技术优势：不间断地自动分配资源池中的虚拟机可执行维护时不需要中断业务操作，从而提高了可用性。

工作原理使用Vmotion将虚拟机从一台物理服务器实时迁移到另外一台物理服务器的过程是通过三项基础技术实现的（1）首先，虚拟机的整个状态由存储在共享存储器（如光纤通道或iSCSI存储区域网络（SAN），或网络连接存储（NAS））上的一组文件封装起来。

VMWare群集Virtual Machine File System（VMFS）允许安装多个ESX Server，以并行访问同一组虚拟机文件（2）第二，虚拟机的活动内存及精确的执行状态通过高速网络快速传输，因而允许虚拟机立即从在源ESX Server上运行切换到在目标ESX Server上运行。

Vmotion通过在位图中连续跟踪内存事务来确保用户觉察不到此传输期。

一旦整个内存和系统状态已拷贝到目标ESX Server，Vmotion将中止源虚拟机的运行，将位图拷贝到目标ESX Server，并在目标ESX Server上恢复虚拟机的运行。

整个过程在以太网上需要不到两秒钟的时间（3）第三，虚拟机使用的网络也被底层ESX Server虚拟化，确保即使在迁移之后，虚拟机的网络身份和网络连接也能保留下来。

Vmotion在此过程中管理虚拟MAC地址。

一旦目标机被激活，Vmotion就会ping网络路由器，以确保它知道虚拟MAC地址的新物理位置。

因为用Vmotion进行虚拟机迁移可保持精确的执行状态、网络身份和活动网络连接，其结果是实现了零停机时间而且不中断用户操作。

前提条件（1）VM必须放置在共享存储里（2）esx的cpu类型需要要一样，简单说，就是不能一个是intel，一个是amd的，都是intel，不同型号，没有问题。

如何应用VMware高可用性

如何应用VMware高可用性VMware在VI3版本中引入了高可用性特性，以防在物理主机发生故障时保护上层的虚拟机。

在一个VMware高可用性集群中，当物理主机发生故障，虚拟机会在该集群中的其它主机上自动重新启动。

这是一项非常重要的特性，一台物理主机的故障会影响其上层的大量虚拟机。

VMware高可用性很好地解决了虚拟化所带来的“将所有的鸡蛋放在一个篮子中”所引起的风险。

在本篇VMware高可用性指南中，您可以了解到VMware高可用性的工作原理，VMware高可用性的系统要求，如何激活“许可控制策略”以及其它的VMware高可用性部署技巧。

VMware高可用性工作原理VMware高可用性在集群系统中的每台主机上安装一个脚本程序，该脚本负责维持集群系统所和其它主机的“心跳”。

当心跳丢失时，该主机上的所有受影响的虚拟机会开始在其它主机上启动。

同样，vCenterServer也不会是单点故障，高可用性特性会在vCenterServer无法访问时继续工作。

高可用性集群中最初上电的5台主机会被指定为主服务器，而其余的主机会被默认为二级服务器。

主服务器的功能在于复制和维持集群状态，并促发故障切换操作。

当一台主服务器发生故障后，系统会随机从二级服务器中选取一台作为新的主服务器。

高可用性采用定期间隔的故障检测方式，其默认值为15秒；当某台主机发生故障并被检测到后，高可用性服务器会发出一个心跳指令给集群内的其它主机。

该心跳检测每秒进行一次；当主机在15秒内没有回复时，该主机被默认为已发生故障。

15秒的设置实际是比较紧的，各类网络丢失都可能会使你收到这类故障警告。

物理主机没有返回心跳的原因可能有网络故障导致的主机隔离，系统崩溃或硬件故障所导致完全的系统宕机。

一旦被检测出上述故障，集群内的其它主机就会接替该主机的工作，并将该主机从网络隔离。

主机故障发生后的响应机制根据默认设置，被隔离的主机上的虚拟机仍保持上电状态，不过对于这些虚拟机的隔离响应机制可以基于预虚拟机的方式进行重新配置。

Vmwareesxi5.0高可用介绍之一HA

出差半月了，终于项目要测试上线了，心里无比激动。

在项目中遇到了不少困难，当然学到了不少东西。

经历了一个项目，很多幸酸和痛苦，当然也有一定的成就感。

Vmware esxi 5.0集群高可用不得不说的2个高可用功能ha和drs。

这两个功能确保了vmware虚拟机的正常运行，而不至于一台主机down机而业务中断。

而且资源能够动态平衡，功耗节约方面做的很好。

vmware成为当今虚拟化老大还是有一定的技术含量的，不是轻而易举能够被取代的。

我们在安装集群的时候选择ha和drs两个选项，如图：一、HA功能介绍在我看来ha功能就是减少中断业务，和停机时间。

在发生故障时他能够快速的迁移到其他主机，这个功能不得不说对于业务的重要性。

当然我们在之前要考虑很多东西，比如单点故障，pdu冗余，交换机冗余，网卡绑定冗余，存储光端机冗余等等。

只有严谨的架构设计才能保证真正的高可用。

当然官方有官方的说法，差不多一样。

下面是官方的说法，与传统的故障切换解决方案相比，vSphere HA 具有多个优势：最小化设置设置 vSphere HA 群集之后，群集内的所有虚拟机无需额外配置即可获得故障切换支持。

减少了硬件成本和设置虚拟机可充当应用程序的移动容器，可在主机之间移动。

管理员会避免在多台计算机上进行重复配置。

使用 vSphere HA 时，必须拥有足够的资源来对要通过vSphere HA 保护的主机数进行故障切换。

但是，vCenter Server 系统会自动管理资源并配置群集。

提高了应用程序的可用性虚拟机内运行的任何应用程序的可用性变得更高。

虚拟机可以从硬件故障中恢复，提高了在引导周期内启动的所有应用程序的可用性，而且没有额外的计算需求，即使该应用程序本身不是群集应用程序也一样。

通过监控和响应VMwareTools 检测信号并重新启动未响应的虚拟机，可防止客户机操作系统崩溃。

DRS 和 vMotion 集成如果主机发生了故障，并且在其他主机上重新启动了虚拟机，则DRS 会提出迁移建议或迁移虚拟机以平衡资源分配。

2.5.使用HA实现虚拟机高可用性

使用vCenter Server搭建高可用VMware虚拟化平台五、使用HA实现虚拟机高可用性拓扑规划拓扑说明：在“使用vCenter Server搭建高可用VMware虚拟化平台”项目中，需要多台计算机协同完成实验。

假设使用内存为4GB的计算机，则需要4台计算机协同工作。

因此在本项目中需要进行分组，根据实验计算机配置情况，每组可安排2-4人，每台计算机在虚拟机中安装一台服务器，使用VMware Workstation的桥接网络实现互联。

在本拓扑中，实验室网络的网段为192.168.0.0/24，在实验过程中，可以根据实际网络情况修改IP配置。

第一台计算机：在虚拟机中安装Windows Server 2008 R2，配置为iSCSI Target（DC），在本机安装vSphere Client。

第二台计算机：在虚拟机中安装Windows Server 2008 R2，安装配置vCenter服务器（VC）。

第三台计算机：在虚拟机中安装VMware ESXi 5.1，主机名为ESXi-1。

第四台计算机：在虚拟机中安装VMware ESXi 5.1，主机名为ESXi-2。

任务目标启用vSphere HA，使用HA实现虚拟机高可用性。

项目实施1、启用vSphere HA（1）打开vSphere Client，在群集Network Center的右键菜单中选择编辑设置。

在群集功能处勾选“打开vSphere HA”，点击确定。

（2）开始进行群集选举。

（3）等待一段时间，群集选举完成，ESXi主机192.168.0.11成为Master。

（4）ESXi主机192.168.0.12成为Slave。

（5）vSphere要求ESXi所连接的共享存储至少应为2个，而目前只有1个iSCSI共享存储，所以出现了警告信息。

该警告不影响vSphere HA的正常工作，在这里为两台ESXi主机添加第二个共享存储，然后在群集设置中选择数据存储检测信号，选择“选择其中任何群集数据存储”。

VMware_HA 安装配置介绍_含视频链接

7. 根据需要为集群配置 vSphere HA 设置。
8. 单击“确定”关闭集群的“设置”对话框。
9
9
vSphere HA安装与配置
vSphere HA Demo演示： VMware HA 安装与配置视频文件下载： /share/link?shareid=2942807502&uk=1412802 149
8
8
vSphere HA安装与配置
vSphere HA 配置步骤：
1. 右键单击清单树中的数据中心，然后单击新建集群。
2. 完成新建集群向导，此时不要启动 vSphere HA(或DRS)。 3. 单击完成，关闭向导并创建集群 – 此时创建了一个空集群。
4. 将主机添加到集群。
5. 右键单击集群，选择编辑设置。 6. 在“集群功能”页上，选择打开 vSphere HA。
3
传统HA(高可用性)集群
高可用性群集，一般有两个或两个以上的节点，且分为活动节点及备用节点。通常把正在执行业务的称为活动节点，而作为活动节点的一个备份的则称为备用节点。当活动节点出现问题，导致正在运行的业务（任务）不能正常运行时，备用节点此时就会侦测到，并立即接续活动节点来执行业务。从而实现业务的不中断或短暂中断（对客户端来说，基本上感觉不到故障的存在）。高可用性群集的实现是基于资源切换来进行的。这些资源包括节点的IP地址、主机名（NetBios名称）、磁盘卷、应用程序等。而资源的监控和接续，是依靠HA软件来实现的如MSCS等，这些软件用来通过"心跳信号"监控群集中对方节点的运行状态，一旦发现对方存在了故障，就会强制将所有的资源据为已有并继续对外提供服务。
10
10
vSphere HA 资料

vmware ha原理

总之高可用性，从而提高了整个虚拟化环境的可靠性和可用性。
vmware ha原理
VMware HA（High Availability）是VMware vSphere的一项高可用性功能，其主要原理是在整个集群中自动监视和管理虚拟机的状态。当主机宕机或出现其他故障时，HA将在其他可用主机上重新启动受影响的虚拟机，从而使应用程序和服务不会中断。
具体来说，VMware HA通过以下步骤来实现高可用性：
1.在集群中启用VMware HA，并将一组主机指定为HA主机。
2.监视集群中的每个主机的状态，以确保它们处于活动状态。
3.检测主机宕机或失效，通过监控网络连接和心跳信号来实现。
4.在出现主机故障时，HA会自动将受影响的虚拟机迁移到其他可用主机上，以确保虚拟机的高可用性和持续性。
5.当故障主机恢复时，HA将重新启动其中的虚拟机，并将它们迁移到原来的主机上，以恢复正常状态。

(完整版)VMware HA介绍

VMware vCenter 高可用性 HA 详解VMware HA 简介HA的全称是High Availability(高可用性）。

VMware HA群集一般具有一个包括两个或者两个以上ESX主机的逻辑队列。

在一个HA群集中,每一台VMware ESX服务器配有一个HA代理，持续不断地检测群集中其他主的心跳信号。

假如某台ESX主机在连续三个时间间隔后都还没有发出心跳信号，那么该主机就被默认为发生了故障或者与网络的连接出现了问题.在这种情况下，原本在该主机上运行的虚拟机就会自动被转移到群集中的其他主机上。

反之，如果一台主机无法接收到来自群集的其他主机的心跳信号,那么该主机便会启动一个内部进程来检测自己跟群集中其他主机的连接是否出现了问题。

如果真的出现了问题，那么就会中断在这台主机上所有正在运行的虚拟机，并启动预先设定好的备用主机。

此外，VMware HA的另一个显著的特点是能够对一个群集中的多台ESX服务器（多达四台)上进行故障转移。

对于一次VMware HA故障转移,客户端操作系统认为只是一次因硬件的崩溃而进行的重启，并不会觉察到是一次有序的关机。

因此，这样的修复并不会改变操作系统的状态。

此外，虚拟机中任何正在进行的业务也不会丢失。

即使备用ESX服务器主机的硬件设备跟原ESX服务器主机的硬件设备有所不同，客户端操作系统也不会检测到这种不同。

所以，VMware HA的故障转移对于客户来说可以算是完全透明的,几乎不会出现任何停机的危险。

1. VMware HA 提供快速中断恢复VMware HA 利用配置为群集的多台 ESX/ESXi 主机，为虚拟机中运行的应用程序提供快速中断恢复和具有成本效益的高可用性。

VMware HA 通过以下两种方式保护应用程序可用性：•通过在群集内的其他主机上自动重新启动虚拟机，防止服务器故障.•通过持续监控虚拟机并在检测到故障时对其进行重新设置，防止应用程序故障.与其他群集解决方案不同，VMware HA 提供基础架构并使用该基础架构保护所有工作负载：•不需要在应用程序或虚拟机内安装任何特殊软件。

VMwareHA

VMware HA 高可用性手册VMware HA 高可用性手册什么是高可用性？它与灾难恢复有什么区别？在虚拟环境里达到高可用性的方法有哪些？VMware HA有哪些作用？如何在虚拟环境里配置VMware HA故障转移级别？HA出现故障时应该如何解决？本指南将一一为您解答。

高可用性定义与测量网络基础架构设备需要通过建设高可用性（HA）架构。

那么什么是高可用性（HA）？测量HA的公式的什么？VMware HA（高可用性）与灾难恢复的区别在哪？™如何在虚拟环境里达到高可用性？（上）™如何在虚拟环境里达到高可用性？（下）™VMware HA和灾难恢复的区别VMware HA 配置与管理VMware HA工具是一款有用的工具，可以监控虚拟机并重新设置出现故障的虚拟服务器。

那么应该如何配置VMware HA呢？VMware HA可能出现故障时应该怎么办？™如何为虚拟服务器安装与配置VMware HA？™如何在虚拟环境配置VMware HA故障转移级别？™解决HA代理出现故障的方法实用技巧TT 服务器技术专题之“主标题”Page 2 of 29五大服务器虚拟化解决方案的HA存在哪些差异？VMware HA能迁移VirtualCenter服务器到一台新的ESX主机吗？VMware作为集群产品与Microsoft Cluster或Veritas相比有哪些优势？™五大服务器虚拟化解决方案管理与HA比较™VMware HA能迁移VirtualCenter服务器吗？™使用VMware HA作为集群产品如何在虚拟环境里达到高可用性？（上）网络基础架构设备需要通过建设高可用性（HA）架构，并且部署一个混合的商业成品（COTS）硬件以及商业和开源的软件组件达到更高的可靠性。

曾经高度依赖自定义和私有平台的位于网络核心和边缘的系统如今建立在基于标准运输等级的操作系统、服务可用性论坛API 和AdvancedTCA 之上，并能达到第五或第六级别的高可用性。

高可用性 HA 系统架构设计与应用研究

高可用性 HA 系统架构设计与应用研究高可用性（High Availability，HA）系统架构设计与应用是现今企业信息化建设的重点，也是IT行业中的热门话题。

随着数字经济的不断发展，计算机系统已经成为企业生产力和效益提升的重要手段，而一个稳定、高效、可用的计算机系统架构，对企业运营效率的提升有着不可低估的作用。

一、HA系统构成HA系统是一种特殊的计算机系统，在设计 HA 系统架构时，需要考虑以下几个方面：1. 网络拓扑结构企业信息网络是构建 HA 系统的基础，需要稳定、安全、冗余的网络拓扑结构来实现系统高可用性。

网络拓扑结构包括核心交换机、分布式交换机、服务器等。

2. 存储存储系统是企业信息化建设的核心组成部分，本身需要具备高可靠性、高可用性、高稳定性等特点。

在 HA 系统中，存储设备也需要具备冗余、备份、数据恢复等特性。

3. 服务器集群服务器集群是 HA 系统的核心，通常将应用系统、数据库、网关、消息队列等业务服务进行集中管理，以便在其中任一节点在发生故障或异常时，系统能自动切换到另一节点上保证业务的连续性。

4. 负载均衡负载均衡系统实现了 HA 系统的自动切换，同时能充分利用系统资源进行负载均衡，优化系统性能，提高企业运营效率。

二、HA系统架构设计在 HA 系统的架构设计中，需要考虑到系统的可扩展性、灵活性、低成本等，具体需求如下：1. 冗余设计在 HA 系统的设计中，需要采用冗余设计，例如冗余服务器、冗余磁盘、冗余电源、冗余网络设备等，保证系统稳定、可靠、可用。

2. 应用服务规划在HA 系统架构设计中，需要根据企业业务规模，确定应用服务的规划、部署、运维模式。

例如，需要根据应用服务的特点，将系统中的各个业务服务进行分类、集中管理，实现业务模块的切分，从而实现系统的可扩展性。

3. 异地容灾在企业信息化建设中，异地容灾是保障系统可用性的核心手段之一。

因此，在HA 系统的架构设计中，需要考虑到异地容灾备份设施的规划、设计、建设、测试等环节。

VMware vSphere 5.1 高可用性 ---- 群集、HA、DRS、FT

VMware vSphere 5.1 高可用性在本节中主要讲的是集群的一些功能和配置，相比5.0的设置，没有太大的变化。

VMware vSphere为虚拟机提供虚拟化的基础架构，将现有的物理资源转化成虚拟资源，将物理资源分成若干资源，为每个虚拟机提供包括CPU、内存等虚拟资源。

要想很好地分配这些资源，就必须要使用资源池。

资源池是灵活管理资源的逻辑抽象。

资源池可以分组为层次结构，用于对可用的CPU 和内存资源按层次结构进行分区。

群集中的资源池比单个ESXi主机上的还要重要，因为在群集中创建资源之后，整个资源池管理的就是所有的ESXi主机资源了。

所管理的资源是所有ESXi主机上的CPU和内存的资源总和。

高可用性和双机热备是VMware vSphere 5.1最重要的一部分，高可用并不是vSphere独有的，企业使用高可用就是为了服务的连续性和数据的安全性，HA是以一群ESXi服务器为主的群集功能，主要是目的是当虚拟机运行的主机发生故障时能及时转移主机，避免长时间的停机。

而FT双机热备则是保证虚拟机最长时间不停机，将虚拟机以双机热备的方式同时在两台主机运行，大大增强了业务的可连续性。

本节中主要讲的是讲的一下内容：一、建立群集二、设置HA高可用性三、测试HA高可用性四、设置DRS五、建立FT双机热备无论是计划停机时间还是非计划停机时间，都会带来相当大的成本。

但是，用于确保更高级别可用性的传统解决方案都需要较大开销，并且难以实施和管理。

VMware 软件可为重要应用程序提供更高级别的可用性，并且操作更简单，成本更低。

使用vSphere，组织可以轻松提高为所有应用程序提供的基准级别，并且以更低成本和更简单的操作来实现更高级别的可用性。

使用vSphere，可以独立于硬件、操作系统和应用程序提供更高可用性，减少常见维护操作的计划停机时间，在出现故障时提供自动恢复。

vSphere 可以减少计划的停机时间，防止出现非计划停机，并迅速从断电中恢复。

高可用性集群系统的实现

高可用性集群系统的实现高可用性（High Availability，HA）是指系统能够在遇到故障或异常情况下仍然正常运行的能力。

在实践中，高可用性集群系统是一种常见的解决方案，用于保障关键业务的连续可用性。

下面是一个高可用性集群系统的实现方式的详细介绍。

1. 负载均衡（Load Balancing）负载均衡是高可用性集群系统的核心组件之一、它通过将请求分发到多个服务器节点上，以达到负载的均衡。

当其中一服务器节点发生故障时，负载均衡器可以自动将请求重新分配到其他可用的节点上，实现对服务的无感知切换和故障恢复。

常见的负载均衡算法包括轮询、加权轮询、最少连接数等。

负载均衡器可以是硬件设备，如F5等，也可以是软件实现，如Nginx、HAProxy等。

2.多节点架构多节点架构可以采用主从模式或活动-备用模式。

在主从模式下，一个节点作为主节点提供服务，其他节点作为从节点，负责备份和故障恢复。

在活动-备用模式下，一个节点处于活动状态，提供服务，其他节点保持备用状态，等待发生故障时切换到活动状态。

3.数据同步和复制为了保证数据的一致性和可用性，高可用性集群系统需要进行数据的同步和复制。

数据同步可以通过主从复制、主主复制或镜像复制等方式来实现。

主从复制是指将主节点上的数据同步到从节点上，从节点可以作为备份用于故障恢复；主主复制是指多个节点之间相互同步数据，实现互为备份和故障切换；镜像复制是指将数据复制到多个节点上，每个节点都可独立提供服务。

数据同步和复制可以通过数据库复制、文件复制、分布式文件系统等方式来实现。

同时，为了保证数据的一致性，可以使用分布式事务、两阶段提交等机制。

4.心跳检测和故障恢复为了实时监测节点的状态和及时发现故障，高可用性集群系统需要进行心跳检测。

心跳检测是指多个节点之间周期性地相互发送心跳消息，一旦发现节点无响应或超时，就将其判定为故障节点。

当出现故障时，高可用性集群系统需要进行故障恢复。

故障恢复可以采用自动切换、人工干预或自动修复等方式。

关于vmware HA,DRS

1、 HA（高可用性）群集高可用性（HA）集群是群集的一种，平日较常见的为MSCS（微软群集服务），如SQL的故障转移群集。

高可用性群集，一般有两个或两个以上的节点，且分为活动节点及备用节点。

通常把正在执行业务的称为活动节点，而作为活动节点的一个备份的则称为备用节点。

当活动节点出现问题，导致正在运行的业务（任务）不能正常运行时，备用节点此时就会侦测到，并立即接续活动节点来执行业务。

从而实现业务的不中断或短暂中断（对客户端来说，基本上感觉不到故障的存在）。

高可用性群集的实现是基于资源切换来进行的。

这些资源包括节点的IP地址、主机名（NetBios名称）、磁盘卷、应用程序等。

而资源的监控和接续，是依靠HA软件来实现的如MSCS等，这些软件用来通过"心跳信号"监控群集中对方节点的运行状态，一旦发现对方存在了故障，就会强制将所有的资源据为已有并继续对外提供服务。

而VMwareHA也是高可用性的一种应用。

VMwareHA与传统的群集和高可用性解决方案都支持主机发生故障时的自动恢复。

它们是互为补充的，但是在软硬件要求、恢复时间及应用程序和操作系统的识别程度等方面有所不同。

2、 VMwareHA与VMware Infrastructure 3谈起VMwareHA，就不得不说说VMware Infrastructure 3，VMware Infrastructure3是一个功能丰富的套件，它提供创建响应性数据中心所需的经过生产验证的效率、可用性和动态管理：VMware ESX Server。

用于虚拟化服务器、存储和网络的平台。

VMware VMFS。

用于存储虚拟化的高性能群集文件系统。

VMware Virtual SMP。

为虚拟机提供多处理器支持。

VMware VirtualCenter。

为 IT 基础架构提供集中化管理、操作自动化和优化。

VMware High Availability (HA)。

VMwarevCenterServer测试高可用群集HA功能

VMwarevCenterServer测试⾼可⽤群集HA功能
标注：使⽤⾼可⽤群集HA功能需要满⾜以下条件：
(1)、群集HA01必须启动HA功能、DRS功能、EVC功能（主机服务器CPU型号相同可以不启⽤）
(2)、主机(VMware EXSI) VMkernel适配器启⽤vMotion功能，建议把主机同⼀个vlan的⽹卡⽹络标签设置统⼀名称
(3)、每台虚拟机系统必须安装VMware Tools⼯具
1、查看两台测试虚拟机情况
2、两台测试虚拟机设置IP地址
3、两台虚拟机相互ping ，把主机10.98.94.252服务器直接强制关机，主机10.98.94.252
服务器⾥的虚拟机win 7_test02会⾃动重启系统漂移到主机10.98.94.251
4、现在把关机的主机10.98.94.251⼿动开机，win 7_test02主机漂移回到原来的主机10.98.94.252标注：要实现这个⾃动漂移到原来主机，需要把DRS功能开启并设置全⾃动。

5、虚拟机win 7_test02已经漂移到主机10.98.94.252。

VMware虚拟化平台高可用设计方案

VMware 虚拟化平台高可用设计方案越来越多的企业考虑通过虚拟化来提高 IT 资源和应用程序的效率和减少运营成本。

而在传统的服务器维护中，如果一台服务器宕机，那么最多就是这台服务器上的应用无法正常提供服务，可以通过集群高可用等方法解决；但是在虚拟化环境中，如果一台虚拟主机端服务器宕机，那么运行在上面的虚拟机就都会无法正常运行。

虽然虚拟化将所有的资源都集中管理，但是出现故障时影响的面也广了，所以在虚拟化中集群高可用的功能就显得尤为重要。

保护物理服务器是不够的，还要保护包含重要商业数据和信息虚拟服务器。

虚拟服务器提供了灵活性，但是，与此同时，如果一台包含多个虚拟服务器的物理服务器出现故障，那将造成巨大的数据损失。

本文主要介绍如何优化现有的VMware虚拟化环境，利用架构改造将环境调整为高可用架构。

无论是网络资源层、计算资源层、还是存储资源层均实现双链路高可用。

在做任何架构的改动之前，一定要对现有环境有足够的认知和了解，掌握其变动对业务的影响。

•在调整架构之前，一定要先了解和熟悉现有架构缺点。

••在调整架构之前，解决现有环境的故障问题。

••了解现有架构与业务的匹配性。

••预评估现有架构改造的工作量和依赖条件。

•下面将详细介绍如何将现有VMware架构调整为高可用性双链路架构。

高可用方案背景VMwarevSphere是VMware公司推出的一套服务器虚拟化解决方案，vSphere本身是个软件套件，组件主要包括用于主机虚拟化的ESXi，用于虚拟化管理的vCenter，用于升级的Update Manager，以及自动化部署Auto deploy等。

在之前的架构中，集团已有的虚拟化架构已经存在2年了，整体运行良好，但是每次出现问题的时候，都会影响业务的运行，无论是网络设备故障还是SAN交换机、甚至计算节点。

整体方案采用千兆的网络交换机进行虚拟机的管理与迁移，群集之间未开启HA，SAN的划分层次不明确，名称没有规范。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

VMware高可用性（集群HA）1 应用层高可用性：如实现mysql、oracle数据库应用程序的储群集，主要是判断mysql、oracle 应用程序是否停止运行。

2 操作系统高可用性：如windows的故障转移群集（windows failover clustering WFC）。

3 虚拟化层的高可用性：如vsphere high availability(HA)和vsphere fault tolerance(FT)。

4 物理层的高可用性：如：多网络适配器、SAN等。

vSphere HA 和 Fault Tolerance（FT）功能分别通过提供中断快速恢复和连续可用性来最小化或消除非计划停机时间。

使用 vSphere，企业可以轻松提高为所有应用程序提供的基准级别，并且以更低成本和更简单的操作来实现更高级别的可用性。

使用vSphere，你可以：a 独立于硬件、操作系统和应用程序提供更高可用性。

b 减少常见维护操作的计划停机时间。

c 在出现故障时提供自动恢复。

一、vSphere HA 提供快速中断恢复vSphere HA 利用配置为群集的多台 ESXi 主机，为虚拟机中运行的应用程序提供快速中断恢复和具有成本效益的高可用性。

vSphere HA 通过以下方式保护应用程序可用性：1 通过在群集内的其他主机上重新启动虚拟机，防止服务器故障。

2 通过持续监控虚拟机(通过vmware tools实现主机向虚拟机发送检测信号）并在检测到故障时对其进行重新设置，防止应用程序故障。

与其他群集解决方案不同，vSphere HA 提供基础架构并使用该基础架构保护所有工作负载：a 无需在应用程序或虚拟机内安装特殊软件。

所有工作负载均受 vSphere HA 保护。

配置 vSphere HA 之后，不需要执行操作即可保护新虚拟机。

它们会自动受到保护。

（需在开机状态下才受保护）b 可以将 vSphere HA 与 vSphere Distributed Resource Scheduler (DRS即负载均衡) 结合使用以防止出现故障，以及在群集内的主机之间提供负载平衡。

与传统的故障切换解决方案相比，vSphere HA 具有多个优势：最小化设置设置 vSphere HA 群集之后，群集内的所有虚拟机无需额外配置即可获得故障切换支持。

减少了硬件成本和设置虚拟机可充当应用程序的移动容器，可在主机之间移动。

管理员会避免在多台计算机上进行重复配置。

使用 vSphere HA 时，必须拥有足够的资源来对要通过 vSphere HA 保护的主机数进行故障切换。

但是，vCenter Server 系统会自动管理资源并配置群集。

提高了应用程序的可用性虚拟机内运行的任何应用程序的可用性变得更高。

虚拟机可以从硬件故障中恢复，通过监控和响应 VMwareTools 检测信号并重新启动未响应的虚拟机，可防止客户机操作系统崩溃。

DRS和vMotion 集成如果主机发生了故障，并且在其他主机上重新启动了虚拟机，则 DRS 会提出迁移建议或迁移虚拟机以平衡资源分配。

vSphere HA 群集允许 ESXi 主机集合作为一个组协同工作，这些主机为虚拟机提供的可用性级别比 ESXi 主机单独提供的级别要高。

群集中的主机均会受到监控，如果发生故障，故障主机上的虚拟机将在备用主机上重新启动。

创建 vSphere HA 群集时，你可以选择使用单个主机作为首选主机（master)以与 vCenter Server 通信并监控其他主机、从属主机(slave)及其虚拟机的状况。

如果为群集启用了 vSphere HA，则所有活动主机（未处于待机或维护模式的主机或未断开连接的主机）都将参与选举以选择群集的首选主机。

挂载最多数量的数据存储的主机在选举中具有优势。

每个群集只存在一台首选主机，其他所有主机都是从属主机。

如果首选主机出现故障、关机或从群集中移除，则会进行新的选举。

群集中的首选主机具有很多职责：1 ）监控从属主机的状况。

如果从属主机发生故障或无法访问，首选主机将确定需要重新启动的虚拟机。

（监视的ESXi从主机宕机后，首选主机将决定将其身上运行的虚拟己重新运行在其他从主机上）2 ）监控所有受保护虚拟机的电源状况。

如果有一台虚拟机出现故障，首选主机可确保重新启动该虚拟机。

使用本地放置引擎，首选主机还可确定执行重新启动的位置。

3 ）首选主机管理群集主机和受保护的虚拟机列表并对添加或删除cluster内部的主机进行管理即首选主机维护着群集内的清单。

4 ）首选主机管理被保护的虚拟机清单，在用户每次发起开关机操作时，更新这个清单。

vcenter server会要求保护或不保护某些虚拟机。

即当虚拟机打开电源，则该虚拟机要受保护，一旦主机出现故障就会在其他主机上重新启动虚拟机。

当虚拟机关闭电源，就没有必要再保护它了。

5 ）首选主机缓存cluster的配置，master主机通知和提醒slave主机，cluster配置的修改。

6 ）master主机发送心跳信息给slave主机，让slave主机知道master的存在。

如果slave主机接收不到心跳信息，则重新选举出新的首选主机。

7 ）master报告状态信息给vcenter,vcenter正常情况只与master主机通信。

首选主机执行的功能之一是虚拟机保护。

虚拟机受保护时，vSphere HA 可保证在其出现故障后尝试重新打开电源。

首选主机在观察到虚拟机的电源状况由关闭电源变为打开电源时，会致力于保护虚拟机。

如果发生故障切换，首选主机必须重新启动所负责的受保护的虚拟机。

该职责已分配给在包含虚拟机配置文件的数据存储上以独占方式锁定系统定义文件的首选主机。

群集中从主机的职责：1 ）slave主机监视本地运行的虚拟机的状态，把这些虚拟机运行状态的显著变化发给master 主机。

2 ）slave主机监视master主机的健康状态，如果master主机出现故障，slave主机参与master 的选举。

3 ）slave运用vSphere HA 接入控制vSphere HA特性，这些特性不需要master的协调。

这些特性包括VM Health Monitoring。

查看master和slave的状态：主机故障类型和检测：vSphere HA 群集的首选主机负责检测从属主机的故障。

根据检测到的故障类型，在主机上运行的虚拟机可能需要进行故障切换。

在 vSphere HA 群集中，检测三种类型的主机故障：1 ）主机停止运行（即发生故障）。

2 ）主机与网络隔离。

3 ）主机失去与首选主机的网络连接。

vSphere HA使用管理网络和存储设备来联系。

当master通过管理网络联系不到slave时，master 就会使用存储网络（heartbeat datastores）来检查slave是否存活。

首选主机监控群集中从属主机是通过交换网络检测信号来完成，此通信通过管理网络来完成。

当首选主机不能通过管理网络（如首选主机或从属主机的网络接口出故障）从从属主机接收这些检测信号时，它会在声明该主机出现故障之前检查主机活跃度。

首选主机执行的活跃度检查是要确定从属主机是否在与数据存储（即存储网络）交换检测信号。

如果此从属主机与数据存储交换检测信号，则首选主机会假定它处于某个网络分区或网络隔离中，因此会继续监控该主机及其虚拟机。

网络分区：一个或多个slave通过管理网络联系不到master，即使它们的网络连接没有问题，这种情况下，vSphere HA能够了使用存储网络来检测分离的主机（上面的slaves)是否存活以及否要保护它们里面的虚拟机。

网络隔离：一个或多个slave丢失了所有的管理网络连接，这样的slave既不能联系到master 也不能联系到其他ESXi hosts。

这种情况下，slave主机通过存储网络来通知master，它已经是隔离状态。

注意：如果你确保网络基础结构具有足够的冗余度且至少有一个网络路径始终可用，则主机网络隔离应该在极少数情况下才出现。

在 vSphere HA 群集发生管理网络故障时，该群集中的部分主机可能无法通过管理网络与其他主机进行通信。

一个群集中可能会出现多个分区。

已分区的群集会导致虚拟机保护和群集管理功能降级1 ）虚拟机保护。

vCenter Server 允许虚拟机打开电源，但仅当虚拟机与负责它的首选主机在相同的分区中运行时，才会对其进行保护。

2 ）群集管理。

vCenter Server 只能与群集中的部分主机进行通信，且只能连接到一台首选主机。

因此，只有在解决分区之后，配置中影响 vSphere HA 的更改才能生效。

此故障可能会导致其中一个分区在旧配置下操作，而另一个分区使用新的设置总结：当 vSphere HA 群集中的首选主机无法通过管理网络与从属主机通信时，首选主机将使用数据存储检测信号来确定从属主机是否出现故障，是否位于网络分区中，或者是否与网络隔离。

如果从属主机已停止数据存储检测信号，则认为该从属主机出现故障，并且其虚拟机已在别处重新启动。

vCenter Server 使用 vSphere HA 主机状况报告主机是首选主机还是从属主机。

如果已启用"HA 状况"列，则会在 vSphere Client 中主机的摘要选项卡上和群集或数据中心的"主机列表"视图中报告此状况。

HA 状况"正在运行 (master)"表示主机作为 vSphere HA 首选主机。

"已连接 (slave)"状况表示主机作为 vSphere HA从属主机。

注意:如果断开主机与群集之间的连接，则所有向该主机注册的虚拟机均不受 vSphere HA 保护。

vCenter Server 使用接入控制来确保群集内具有足够的资源，以便提供故障切换保护。

1、"群集允许的主机故障数目"接入控制策略：使用"群集允许的主机故障数目"接入控制策略，vSphere HA 允许指定数目的主机出现故障，同时可以确保群集内留有足够的资源来对这些主机上的虚拟机进行故障切换。

使用"群集允许的主机故障数目"策略，vSphere HA 以下列方式执行接入控制：1 、插槽大小计算：插槽大小由两个组件（CPU 和内存）组成。

a .vSphere HA 计算 CPU 组件的方法是先获取每台已打开电源虚拟机的 CPU 预留，然后再选择最大值。

如果没有为虚拟机指定 CPU 预留，则系统会为其分配一个默认值 32 MHz。

b .vSphere HA 计算内存组件的方法是先获取每台已打开电源虚拟机的内存预留和内存开销，然后再选择最大值。