云计算带来的数据中心变革
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(收稿日期:2011-07-27)
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
1数据中心的发展
最初的数据中心是为了满足大型计算机对于电
力、制冷、布线等基础环境的需要而建立的专用计算机房。随着计算机的小型化,并伴随着IT 技术及计算机网络技术的发展,大型企业逐步产生了建设自身IT 系统的需求,于是,将计算机(服务器)、网络设备、存储设备等集中放置在专用机房之中,同时将企业IT 系统部署在服务器集群(Server Farm )之上,就形成了企业数据中心(EDC )的雏形。
20世纪90年代后期,随着互联网的迅速普及,各种网站大量出现,一种拥有完善的机房环境和基础设施,并为互联网企业提供服务器存放、互联网接入,以及各种代维及增值服务的互联网数据中心(IDC )出现了。与传统的EDC 主要面向企业自身IT 系统应用不同,IDC 主要面向互联网服务商(ISP 或ICP ),为其提供场地、环境及相关软硬件租用服务;同时,IDC 更加强调整体环境(包括电力、制冷、网络、运维等)的可靠性,并需要提供多方面的客户服务能力(如客户接待,远程监控,故障响应等)。
云计算带来的数据中心变革
高
巍工业和信息化部电信研究院通信标准研究所互联网中心主任工程师,高工
摘
要云计算的出现使数据中心呈现了新的发展趋势,可扩展、虚拟化、绿色化将是数据中
心的重要发展方向。本文从数据中心的演进出发,分析了数据中心中的网络新技术以及数据中心规划布局的基本原则。
关键词云计算数据中心网络虚拟化
从IDC的发展历程来看,到目前为止主要经历了3个发展阶段(见图1):
(1)第一代IDC以为网站等提供互联网接入能力和服务器放置场地为主,主要业务包括场地(机架)、电力、带宽的租赁。
(2)第二代IDC在提供基础设施出租服务的基础上开始提供安全(防火墙、流量清洗、数据备份等)、业务控制(负载均衡,Cache等),以及代维等增值服务。
(3)前两代IDC都是以用户提供服务器,IDC提供场地和服务为基本模式,而第三代IDC开始通过对自身所拥有的计算、存储、网络等资源进行虚拟化和聚合,向用户提供虚拟资源出租、应用服务部署等资源型服务,这时用户已经不需要拥有自己的物理IT 设施,只需要在IDC所提供的虚拟资源上部署自己的业务系统即可,这也就是云计算中的IaaS(基础设施即服务)模式。
未来,随着云计算业务规模的逐渐扩大,在IDC 之间将产生资源共享、业务互通的需求,众多IDC可以通过不同层次的开放接口互联形成“云”IDC,或“IDC云”,将能够提供近乎无限的服务扩展能力,从而为互联网业务的发展提供最大限度的支持。
2云计算与数据中心
前文提到了IDC的发展将会引入云计算的模式,那么云计算与IDC之间是什么关系呢?云计算是否需要依赖于IDC呢?目前来看答案基本上是肯定的。这也要从云计算的实现方式上说起。
目前所说的云计算,从技术上来看基本上是两种思路:
(1)通过虚拟化技术将计
算、存储资源实现一分多,并
通过资源自动调度和管理技
术实现虚拟资源的生成、撤销
和转移,从而提高物理资源的
利用率。
(2)通过分布式计算的算法
和管理技术,将大量计算工作
分散到多个计算节点上去,从
而使用多个廉价的计算节点实
现大规模海量计算,也就是实
现资源的多合一。这两种思路的最终目的都是要实现资源利用率的最大化。
对于第一种思路,其目的是通过虚拟化和对虚拟资源的自动化调配提供具有竞争力的基础资源出租服务,满足用户即来即用,弹性扩展的需要,目前主要的做法就是在现有IDC服务器资源的基础上,通过部署虚拟机和资源管理系统(Hypervisor)来实现,这一变革对数据中心管理和内部组网产生了许多新的需求。
对于第二种思路,其目的是要实现高性能计算或海量计算,目前实现这一目的主要有3种方式,即高性能计算机(HPC),网格计算(Grid Computing)和以谷歌MapReduce,BigTable,GFS等技术为代表的“云计算”方式。对于HPC方式,基本上仍是对传统计算机体系结构的横向扩展,即通过Infiniband等高速网络实现CPU,内存之间的总线高速互联,从而将分布式的CPU,存储器等资源组合构成一个大型的计算系统,这实际上是计算资源的一种“紧耦合”方式。这种方式能够形成具有超高计算能力的超级计算机,但成本也很高;网格计算是将各种异构(基于不同的平台,硬件/软件体系结构,以及计算机语言)的计算资源(通常位于不同的地理位置)通过公开的标准连接起来,实现计算任务的分布式处理,从而达到海量计算的目的,这实际上是计算资源的一种“松耦合”方式。云计算介于以上两种方式之间——
—通过内部网络(通常是以太网)将数据中心内部的各种计算资源和存储资源连接起来,通过分布式算法将大型任务分割为同质化的小任务,并分配给各个计算单元(通常是PC)进行处理。
图1IDC的发展
云计算以PC和以太网构成分布式计算系统,与HPC 相比能够大大节省成本。另一方面,由于云计算的计算任务交互过程一般来说都在一个数据中心内部完成,与网格计算相比也能够大大提高响应速度和实时水平。
因此,无论哪种云计算的实现思路,IDC都是其基本载体。随着云计算的发展,以承载云计算业务为主要目的的云计算数据中心呈现出规模化、虚拟化、绿色化等新特点,云计算将给IDC带来一系列新的变革。
3数据中心内部组网技术
传统IDC基本上沿用了IP网络中层次化汇聚的组网模式,业务服务器、数据库服务器等IT设备通过接入以太网交换机(TOR,柜顶交换机)、汇聚交换机、核心交换机,直至出口路由器连接至互联网。由于传统IDC中大多是互联网用户与数据中心中服务器之间的交互数据,即所谓“南北向”流量,而服务器之间的“东西向”流量较小,因此适合采用这种层层汇聚的层次化组网模式。无论采用虚拟机模式还是分布式计算模式,目前的IDC内部网络都无法满足云计算的业务需求。
图2仅以虚拟机模式为例,介绍云计算场景下IDC内部组网的技术变化。
出于充分利用资源,节省投资的目的,云计算数据中心中大量部署虚拟机,同时原本独立的数据网络和存储网络也逐步被统一的以太网所代替,这就产生了几个新问题:
(1)大二层网络的扩展性问题
一个物理服务器分为多个虚拟机,每个虚拟机都拥有一个独立的虚拟MAC地址,这使得IDC中MAC 地址的数量大大增加,在一个大型IDC中可能达到几十万甚至百万量级。同时,为了保证虚拟机在迁移到IDC中任何一台物理服务器时IP地址保持不变,决定了IDC不能采用三层网关来分隔巨大的二层网络,而只能构成一个大二层网络,这样每个汇聚层交换机都要维护所有的MAC地址,这给交换机带来了沉重的压力。
(2)大二层网络的选路问题
目前的以太网中为了避免出现广播环路,采用生成树协议来进行“破环”,但生成树协议只支持单路径,即使两个节点之间存在两条以上的通路,生成树也只会选择其中一条,而将另外一条路径“Block”掉,这就造成了链路资源的大量浪费。由于二层网络过大,也会大大降低生成树的收敛速度,造成整个网络性能的下降。
(3)虚拟机之间的数据交换问题
在以太网中,为了避免产生环路,一个基本的原
则是一个物理接口发出的帧不
能再被转发回这个物理接口,
但在虚拟机环境下,同一个物
理机内部的多个虚拟机经常会
产生流量交换的需求。虽然通
过虚拟操作系统内嵌的软件交
换机(如VMware v Sphere平台
中的vSwitch)可以实现这一功
能,但这样IDC的网络管理者
就无法像物理服务器一样实现
对这部分流量控制功能。
(4)融合网络的问题
传统IDC中数据流量主要
由以太网来承载,服务器到存
储设备之间的数据读取主要由
存储网络(FC SAN)来承载,高
图2数据中心组网的变化