云计算

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.1整体数据中心方案设计

1.2可靠性设计分析

数据中心虚拟化项目从整体、服务器、存储、网络、虚拟化综合考虑可靠性,保障业务的续性,主要涉及:

●虚拟化可靠性

虚拟化是数据中心的核心机制,数据中心进行虚拟化后,支持虚拟机热迁移,虚拟机HA功能,保障业务系统的连续性。支持对虚拟机的快照功能,系统提供虚拟机、卷快照功能,便于在系统出现故障的时候还原系统。

●管理可靠性

管理软件均采用1+1备份或负载均衡的方式运行,保障可靠性。

支持对支持服务器、软件和资源的监控。系统可以收集服务器的核心指标如CPU使用情况、基础网络流量和内存数据等,检测到诸如进程异常、管理和存储链路异常,节点异常、系统资源过载等各种故障,使系统具备完善的故障检测能力。

管理节点和计算节点引入电信领域“黑匣子”技术,在系统出现异常时自动存储内核日志、系统快照、内核诊断信息及临终遗言,并保存至非易失性存储设备(计算节点)或自动传送至网络服务器(例如日志服务器),以便系统故障后,导出分析定位。

●服务器可靠性

2014-8-15 Confidential Information of Huawei. No Spreading without

Permission华为机密,未经许可不得扩散Page2, Total 6 第2页, 共6页

服务器支持对CPU,内存,风扇,电源,硬盘等热关键器件的温度实时监控,设备故障时会产生告警。配合智能的风扇调速和监控,确保系统运行的可靠性。

服务器支持硬盘热插拔和RAID功能,提供硬盘在线故障检测和预警。支持电源1+1冗余和热插拔。

●存储可靠性设计

数据中心虚拟化采用集中式存储设备,虚拟化平台支持存储热迁移、存储冷迁移、支持根据存储访问IO进行存储动态资源调度(DRS:Dynamic Resource Scheduler)。

支持存储多路径,每个计算节点与存储集群之间,至少配置两个完全冗余的路径,保障存储网络的可靠性。

存储设备采用双控制器,在SAN高可靠性的基础之上,配置热备盘做冗余备份,保证数据不丢失和故障快速恢复。

●网络可靠性设计

交换机通过使用交换机堆叠技术,保证对外与汇聚层交换设备和对内虚拟网络层连接的冗余。虚拟网络层通过采用多网卡绑定等技术避免单个网卡故障引发的业务中断。

对于各通信平面(业务、存储、管理)均采用双网卡,双网卡采用了Bonding模式,两网卡被绑定成逻辑上的“一块网卡”后,同步一起工作。既能对服务器的访问流量进行负荷分担,又能保证网卡的可靠性。

1.3云管理设计

华为云管理平台聚焦于数据中心虚拟化资源管理、自动化运维发放、并对企业IT管理提供开放的管理接口。华为云管理系统将整个数据中心云化,并对系统中用户可见的资源抽取出来纳入统一的资源池管理,为用户提供一体化的资源管理,自动资源发放。为用户提供了方便的获取资源的途径。用户可以通过在服务目录自动化的获取资源并在资源上部署用户需要的应用。华为云管理平台系统架构如下图:

Figure图1 华为云管理平台系统架构参考

2014-8-15 Confidential Information of Huawei. No Spreading without

Permission华为机密,未经许可不得扩散Page3, Total 6 第3页, 共6页

方框内是FusionManager云管理平台的功能模块。“虚拟化管理”可以采用华为的虚拟化管理软件FusionCompute,也可以采用其他厂家的,如VMware的VCenter+Vsphere等。

云管理软件从软件层面拉通统一各资源管理。FusionManager云管理平台负责全系统硬件和软件资源的操作维护管理,用户业务的自动化运维。主要模块包括:

1.统一资源管理

FusionManager云管理平台,通过对各种物理资源、虚拟化资源数据统一建模,将资源以用户可见的资源池形式提供给上层应用。

统一资源管理可以屏蔽不同硬件和虚拟化的差异,资源的更换升级对用户零感知。实现对所有硬件资源进行统一管理,包括设备自动发现、自动配置和故障监控等,实现资源快速发放,缩短业务上线时间。

云管理平台支持对资源分集群管理。集群的创建、删除、扩容、减容,对集群进行性能监控,配置集群的资源调度策略,调度策略可以设置为手动和自动,实现虚拟机根据系统负荷在不同服务器上迁移。

2014-8-15 Confidential Information of Huawei. No Spreading without

Permission华为机密,未经许可不得扩散Page4, Total 6 第4页, 共6页

云管理平台支持对虚拟机生命周期管理:业务管理员通过应用对虚拟机进行创建、销

毁操作,对虚拟机的日常维护包括:启动、重启、迁移、关闭、修复、快照、虚拟机资源

调整和监控;

云管理平台支持虚拟化网络管理:对子网、WLAN、端口组、分布式交换机进行管理;

云管理平台支持虚拟化存储管理:可以管理IPSAN、FusionStorage、FC SAN、NAS

的存储资源,向存储资源池中增加、删除数据存储,对已经存在的数据存储可以进行扩容。

2.自动运维

自动化运维是云管理平台提供的主要功能。管理员可以实现物理设备的自动发现,虚

拟机、操作系统和应用软件自动化部署,提高管理平台的部署效率。管理员通过配置不同

的调度策略,同时实现智能调度管理,提升设备利用率和弹性伸缩。

华为运维管理系统集中维护系统的调度策略,保证资源的合理分配,实现资源最大化

利用或实现节能目标等。根据应用场景,可以分为三种策略类型:组内自动伸缩策略、组

间资源回收策略和时间计划策略。

组内自动伸缩策略

针对单独的应用而言,应用根据应用的当前负载动态的调整应用实际使用的资源,当

一个应用资源负载较高时,自动启动虚拟机或添加虚拟机并安装应用软件;当应用的资源

负载很低时,自动关闭或删除虚拟机,释放相应的资源。

组间资源回收策略

当系统资源不足的情况下,系统可以根据组间设置的资源复用策略,优先使优先级高

的应用使用资源,使优先级低的应用释放资源,以供优先级高的应用使用。

时间计划策略

时间计划策略允许用户对于不同的应用实现资源的分时复用。用户可以设置计划策略,使得不同的应用分时段的使用系统资源,比如说白天让办公用户的虚拟机使用系统资源,

到了晚间可以让一些公共的虚拟机占用资源。

智能负载调度

Figure图2 智能节能调度策略

相关文档
最新文档