云存储技术研究1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
云存储技术研究报告
(1) 什么是云存储,与传统存储有什么异同。
云存储是在云计算概念上延伸和发展出来的一个新的概念,是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。当云计算系统运算和处理的核心是大量数据的存储和管理时,云计算系统中就需要配置大量的存储设备,那么云计算系统就转变成为一个云存储系统,所以云存储是一个以数据存储和管理为核心的云
计算系统。
当我们使用某一个独立的存储设备时,我们必须非常清楚这个存储设备是什么型号,什么接口和传输协议,必须清楚地知道存储系统中有多少块磁盘,分别是什么型号、多大容量,必须清楚存储设备和服务器之间采用什么样的连接线缆。为了保证数据安全和业务的连续性,我们还需要建立相应的数据备份系统和容灾系统。除此之外,对存储设备进行定期地状态监控、维护、软硬件更新和升级也是必须的。
如果采用云存储,那么上面所提到的一切对使用者来讲都不需要了。云状存储系统中的所有设备对使用者来讲都是完全透明的,任何地方的任何一个经过授权的使用者都可以通过一根接入线缆与云存储连接,对云存储进行数据访问。
云存储不是存储,而是服务
就如同云状的广域网和互联网一样,云存储对使用者来讲,不是指某一个具体的设备,而是指一个由许许多多个存储设备和服务器所构成的集合体。使用者使用云存储,并不是使用某一个存储设备,而是使用整个云存储系统带来的一种数据访问服务。所以严格来讲,云存储不是存储,而是一种服务。
云存储的核心是应用软件与存储设备相结合,通过应用软件来实现存储设备向存储服务的转变。
(2)了解云存储的发展现状。
ID C研究表明,从2006年到2010年,全球信息总量将增长6倍以上,从161EB增加到988EB(1EB=1024PB)。一些新推出的磁盘阵列中已经普遍采用了750GB或1TB的SATA 硬盘。目前已知存储密度最高的磁盘阵列可以在4U空间内提供高达42TB的存储容量,这在以前是根本无法想像的。
最新一代LTO-4磁带的单盒磁带存储容量也达到了1.6TB(压缩比为2∶1)。技术的不断进步必将推动存储向更高容量发展,而重复数据删除、压缩等技术的引入,可以进一步提升存储空间的利用率。从性能方面看,FC磁盘阵列已经逐步过渡到4Gb时代,而8Gb FC又在向数据中心用户招手;万兆IP存储不再是纸上谈兵;在InfiniBand领域,已经有厂商推出了40Gb InfiniBand适配器产品。
现有的网络存储架构,比如SAN或NAS还能够有效支撑无处不在的云计算环境吗?有人表示怀疑。其主要论据是:面对PB级的海量存储需求,传统的SAN或NAS在容量和性能的扩展上会存在瓶颈;云计算这种新型的服务模式必然要求存储架构保持极低的成本,而现有的一些高端存储设备显然还不能满足这种需求。
从谷歌公司的实践来看,它们在现有的云计算环境中并没有采用SAN架构,而是使用了可扩展的分布式文件系统Google File System(GFS)。这是一种高效的集群存储技术。近几年逐渐兴起的集群存储技术,不仅轻松突破了SAN的性能瓶颈,而且可以实现性能与容量的线性扩展,这对于追求高性能、高可用性的企业用户来说是一个新选择。
随着一些专注于集群存储业务的厂商,比如Panasas、Isilon、龙存科技等在中国市场的快速发展,集群存储技术的应用会更加普及。虽然集群存储在处理非结构化数据方面优势十分明显,但从目前情况看,集群存储不太可能在短时间内完全取代传统的网络存储方式,SAN和NAS仍会有用武之地。
需要强调的是,虚拟化是实现云计算远景目标的一项核心技术,因为云计算本身就是一个能提供虚拟化和高可用性的新一代计算平台。从目前的市场情况看,服务器虚拟化已经是如火如荼,而存储虚拟化的发展相对慢一些。
2007年底,EMC推出了SAN存储虚拟化产品Invista2.0。与上一代产品相比,Invista 2.0
支持的存储容量扩大了5倍,进一步提升了可用性,强化数据保护机制和管理功能,提高使用效率,增强可扩展性。此外,Invista 2.0还通过了VMware认证,可以让用户在VMware 的架构中更妥善地管理、分享和保护信息。
存储公司3PAR营销副总裁Craig Nunes表示:“为了有效支持云计算,基础架构必须具备几个关键特征。首先,这些系统必须是自治的,也就是说,它们必须内嵌自动化技术,消除人工部署和管理,允许系统自己智能地响应应用的要求。如果系统需要人为干预来分配和管理资源,那么它就不能充分地满足云计算的要求。其次,云计算架构必须是敏捷的,能够对需求信号或变化的工作负载做出及时反应。换句话说,内嵌的虚拟化技术和集群技术,必须能够应对业务增长或服务等级要求的快速变化。如果系统需要花几个小时、几天或几个星期的时间来响应新的应用或用户需求,那么这个系统也就不能满足云计算的要求了。”
SaaS也是Storage as a Service的缩写,意为存储即服务。在云计算环境下,存储不再是冷冰冰的硬件设备,而是一种服务。
这会不会改变今后用户的存储采购方式,从采购硬件转变为购买存储服务?
Craig Nunes表示:“在大型企业内,不管是采用云计算模式还是自建一个公用数据中心,终端用户的IT要求终将以服务方式来满足。”
(3)实施云存储面临的问题和采用的关键技术。
云存储系统是一个多设备、多应用、多服务协同工作的集合体,它的实现要以多种技术的发展为前提。
一、宽带网络的发展
真正的云存储系统将会是一个多区域分布、遍布全国、甚至于遍布全球的庞大公用系统,使用者需要通过ADSL、DDN等宽带接入设备来连接云存储,而不是通过FC、SCSI 或以太网线缆直接连接一台独立的、私有的存储设备上。只有宽带网络得到充足的发展,使用者才有可能获得足够大的数据传输带宽,实现大量容量数据的传输,真正享受到云存储服务,否则只能是空谈。
二、WEB2.0技术
Web2.0 技术的核心是分享。只有通过web2.0技术,云存储的使用者才有可能通过PC、手机、移动多媒体等多种设备,实现数据、文档、图片和视音频等内容的集中存储和资料共享。Web2.0技术的发展使得使用者的应用方式和可得服务更加灵活和多样。
三、应用存储的发展
云存储不仅仅是存储,更多的是应用。应用存储是一种在存储设备中集成了应用软件功能的存储设备,它不仅具有数据存储功能,还具有应用软件功能,可以看作是服务器和存储设备的集合体。应用存储技术的发展可以大量减少云存储中服务器的数量,从而降低系统建设成本,减少系统中由服务器造成单点故障和性能瓶颈,减少数据传输环节,提供系统性能和效率,保证整个系统的高效稳定运行。
四、集群技术、网格技术和分布式文件系统
云存储系统是一个多存储设备、多应用、多服务协同工作的集合体,任何一个单点的存储系统都不是云存储。
既然是由多个存储设备构成的,不同存储设备之间就需要通过集群技术、分布式文件系统和网格计算等技术,实现多个存储设备之间的协同工作,使多个的存储设备可以对外提供同一种服务,并提供更大更强更好的数据访问性能。如果没有这些技术的存在,云存储就不可能真正实现,所谓的云存储只能是一个一个的独立系统,不能形成云状结构。
五、CDN内容分发、P2P技术、数据压缩技术
CDN内容分发、P2P技术、数据压缩技术、重复数据删除技术、数据加密技术