H3C CAS高可靠性和高可用性技术白皮书
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
H3C CAS高可靠性和高可用性技术白皮书
目录
1 技术应用背景 (1)
2 H3C实现的技术特色 (2)
2.1 H3C CAS云计算管理平台简介 (2)
2.2 相关技术基础简介 (3)
2.2.1 共享存储 (3)
2.2.2 动态迁移 (4)
2.3 H3C CAS高可靠性(HA)技术 (5)
2.3.1 相关术语 (5)
2.3.2 物理服务器主机HA工作原理 (5)
2.3.3 虚拟机HA工作原理 (6)
2.3.4 技术特色总结 (7)
2.4 H3C CAS高可用性技术 (8)
2.4.1 动态资源调整 (8)
2.4.2 虚拟机资源限额 (10)
2.5 应用限制 (11)
3 典型组网案例 (12)
3.1 组网拓扑 (12)
3.2 注意事项 (13)
3.2.1 对服务器硬件的要求 (13)
3.2.2 整合比(单台服务器上虚拟机数量)的决定因素 (13)
4 参考文献 (14)
i
1 技术应用背景
随着虚拟化和云计算浪潮在全球IT行业的兴起,越来越多的企业、行业和运营商纷纷将自身的IT 架构切换到虚拟化环境中。虚拟化技术对数据中心内未被充分利用的服务器进行整合,极大地降低了客户的一次性投入成本,精简了数据中心物理服务器的数量,同时,减少了供电、制冷、场地和运维人员方面的运营成本。
但是,虚拟化也为IT应用带来了单点故障问题,在未实施虚拟化技术之前,IT管理员往往遵循“根据最坏情况下的工作负载来确定所有服务器的配置”这一策略,即一台高性能物理服务器仅安装一个应用程序。在这种情况下,即使该物理服务器出现了断电或操作系统崩溃等异常状况,最多只会影响到一个应用的运行,而在虚拟化环境下,每台物理服务器往往运行多个虚拟的应用服务器,因此,虚拟化技术的实施将使IT环境面临的灾难破坏性更严重,尤其对于一些重要的业务入口或接入点(如企业的生产服务器和金融行业的数据库服务器等),即使出现秒级的业务中断,也将遭受灾难性的后果。在这种应用背景下,如何保证虚拟化环境下业务应用的高可靠性和高可用性,成为急需解决的一个技术问题。
VM VM VM
图1物理服务器故障造成虚拟化业务全部中断
传统的集群解决方案(如微软的Cluster Service和Veritas Cluster Server)致力于在发生服务器主机故障或虚拟机故障时,在最短的应用程序停机时间内实现即时恢复,要达到这个目标,IT基础架构必须进行如下设置:
•每台物理服务器和虚拟机都必须有一个镜像虚拟机(可能在其它服务器主机上)。
•使用集群软件将服务器(或虚拟机及其主机)设置为互相镜像,一般情况下,由主虚拟机向镜像发送心跳信号,一旦发生故障,镜像将立即接管。
下图显示使用传统集群方法的典型的虚拟机设置:
1
机箱内集群跨机箱集群
图2使用传统集群配置确保虚拟化应用的高可靠性
设置和维护这样的集群解决方案成本昂贵,并会占用大量资源。每添加一台新的虚拟机,可能需要更多的虚拟机甚至是更多的服务器主机才能进行故障切换。您将不得不设置、连接和配置所有的新计算机,并更新群集应用程序的配置。
总之,传统解决方案虽然能够保证快速恢复,但却是资源和劳动密集型的,而且通常存在对应用程序和操作系统的依赖性问题。
由于集群解决方案的成本和复杂性问题,它们通常只被一小部分企业应用程序所采用,而大部分应用程序则没有任何故障切换保护。
为了解决虚拟化和云计算部署带来的单点故障问题,H3C CAS云计算软件摒弃了高成本、高复杂度的传统集群方案,通过为应用程序提供可用的、经济的高可用性,而使其更“大众化”。
2 H3C实现的技术特色
2.1 H3C CAS云计算管理平台简介
H3C CAS云计算管理平台是H3C公司面向企业和行业数据中心推出的虚拟化和云计算管理软件,通过精简数据中心服务器的数量,整合数据中心IT基础设施资源,精简IT操作,提高管理效率,达到提高物理资源利用率和降低整体拥有成本的目的。同时,利用先进的云管理理念,建立安全的、可审核的数据中心环境,为业务部门提供成本更低、服务水平更高的基础架构,从而能够针对业务部门的需求做出快速的响应。
H3C CAS云计算管理平台由三个组件构成:
•CVK:Cloud Virtualization Kernel,虚拟化内核平台
运行在基础设施层和上层客户操作系统之间的虚拟化内核软件。针对上层客户操作系统对底层硬件资源的访问,CVK用于屏蔽底层异构硬件之间的差异性,消除上层客户操作系统
对硬件设备以及驱动的依赖,同时增强了虚拟化运行环境中的硬件兼容性、高可靠性、高
可用性、可扩展性、性能优化等功能。
•CVM:Cloud Virtualization Manager,虚拟化管理系统
主要实现对数据中心内的计算、网络和存储等硬件资源的软件虚拟化管理,对上层应用提供自动化服务。其业务范围包括:虚拟计算、虚拟网络、虚拟存储、高可用性(HA)、动
态资源调度(DRS)、虚拟机容灾与备份、虚拟机模板管理、集群文件系统、虚拟交换机策
略等。
2
•CIC:Cloud Intelligence Center,云业务管理中心
由一系列云基础业务模块组成,通过将基础架构资源(包括计算、存储和网络)及其相关策略整合成虚拟数据中心资源池,并允许用户按需消费这些资源,从而构建安全的多租户
混合云。其业务范围包括:组织(虚拟数据中心)、多租户数据和业务安全、云业务工作流、
自助式服务门户、兼容OpenStack的REST API接口等。
图3H3C CAS云计算管理平台系统逻辑结构图
2.2 相关技术基础简介
2.2.1 共享存储
H3C CAS云计算管理平台中的存储用于保存虚拟机的操作系统、应用程序文件、配置文件以及与活动相关的其它数据,是虚拟机正常工作的基本前提条件。
根据存储的种类不同,可以分为本地存储和共享存储两种。
•在部署了H3C CAS云计算管理平台,并将主机作为被管理资源对象添加到H3C CAS云计算管理平台之后,该主机默认使用本地磁盘介质作为存储,其它主机不能使用。
•在数据中心中,很多用户选择使用共享存储来承载虚拟机及其数据,目前,H3C CAS云计算管理平台支持IP SAN等类型的存储。
采用共享存储的好处是:
•共享存储往往比本地存储提供更好的I/O性能(尤其在多虚拟机环境下)。
•H3C CAS云计算管理平台中的高可用性功能需要共享存储作为先决条件,例如HA和动态资源调整等。
3