浅析云存储
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5
综合评论
浅析云存储
薛 刚 上海超级计算中心 上海 201203 gxue@ssc.net.cn
引言:
随着云的兴起,作为云架构中数据的存储体,云存储变得越来越热,大家众说纷“云”。
根据IDC的数据,到2013年,云存储服务的增长率预计将超过所有其他IT云服务。在未来三四
年内,云服务的市场规模将从现在的174亿美元增长到442亿美元,其中云存储的市场比例将从
目前的9%增长到14%,也就是说云存储的市场规模将接近62亿美元。
1. 什么是云存储
从根本上来说,云存储技术是一种实用型服务,它可以为众多用户提供一个通过网络访问的共享存储池。云存储不是一个设备,而是一种服务。具体说来,它是把数据存储和访问作为一种服务并通过网络提供给用户。云存储是可以调整的,它们可以很轻松地扩展或根据客户需求定制。云计算是提供计算能力,相应的,云存储是提供存储能力。
云存储是在云计算概念上延伸和发展出来的一个新的概念,与云计算类似,它是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。
云存储可以帮助用户解决日益增长的数据的可访问性、安全性、移动性和成本问题,还可以帮助明确定义与数据所有权、归档、发现和搜索相关的角色和职责。围绕数据存储评估、保证和审计的服务水平协议(SLA)也将得到一致而明确的定义。
2009年4月,全球存储工业协会(SNIA)宣布成立了云存储技术工作组(TWG),目前TWG已拥有140多名成员。同年6月,该工作组发布了第一个工作文档《云存储使用情境和参考模型》。根据该文档,TWG在2009年夏天提出了云数据管理接口(CDMI)标准。CDMI规范致力于帮助云用户、服务提供商、开发者和IT硬件/软件厂商简化云存储的各个方面。更准确地说,云数据管理接口定义了应用程序将用于在云中创建、搜索、更新和删除数据组件的功能接口。客户端将可以发现云存储服务的功能,并利用云数据管理接口来管理封装器和其中的数据。此外,通过云数据管理接口还可以在封装器和它们的数据组件上设定元数据。云数据管理接口也可以用于行政管理和管理型应用程序,以便管理封装器、账号、安全访问和监视/账单信息,甚至还可以用于其他我们所熟知的协议所访问的存储,比如SAN、NAS、FTP、WebDAV和HTTP/REST。云数据管理接口规范1.0版正在寻求SNIA批准。
在云数据管理接口规范最初草案发布之后,SNIA成员很快就在2009年10月成立了云存储行动(Cloud Storage Initiative,CSI)组。该CSI将与TWG一起规范云存储技术发展的国际标准。CSI的主要目标就是成为云存储标准推广的权威组织,CSI正致力于通过教育厂商、开发人员和用户群体来达成这个目标。CSI的创始成员包括Actifio、Bycast、EMC、Hitachi、HP、LSI、NetApp、Olocity、Sun、赛门铁克和Xiotech。
2. 云存储技术架构
无论存储虚拟化也好,还是集群存储、SAN+NAS等都是一种技术,二者之间没有必然的联系。但是从架构上看,云存储会利用到现有的存储技术。例如存储虚拟化,云存储可以借助该技术构建庞大的存储池,屏蔽底层存储差异,从而对外提供一致的服务。
云存储并没有更多技术上的突破,它只是更好利用了现有的存储技术,更好进行了发挥,对外提供统一的存储外包服务。从形式上看,与软件SaaS服务有些类似,所不同的是云存储所提供的存储管理
6《高性能计算发展与应用》 2011年第二期 总第三十五期
和服务。
与传统的存储设备相比,云存储不只是一个硬件,而是一个网络设备、存储设备、服务器、应用软件、公用访问接口、接入网、和客户端程序等多个部分组成的复杂系统。各部分以存储设备为核心,通过应用软件来对外提供数据存储和业务访问服务。云存储系统的结构模型如下:
图1 云存储系统的4层结构模型
2.1 存储层
存储层是云存储最基础的部分。存储设备可以是FC光纤通道存储设备,可以是NAS和 iSCSI等IP存储设备,也可以是 SCSI或SAS等 DAS存储设备。云存储中的存储设备往往数量庞大且分布于多个不同地域,彼此之间通过广域网、互联网或者FC光纤通道网络连接在一起。
存储设备之上是一个统一存储设备管理系统,可以实现存储设备的逻辑虚拟化管理、多链路冗余管理,以及硬件设备的状态监控和故障维护。
2.2 基础管理层
基础管理层是云存储最核心的部分,也是云存储中最难以实现的部分。基础管理层通过集群、分布式文件系统和网格计算等技术,实现云存储中多个存储设备之间的协同工作,使多个存储设备可以对外提供同一种服务,并提供更大更强更好的数据访问性能。
CDN内容分发系统、数据加密技术保证云存储中的数据不会被未授权的用户所访问。同时,通过各种数据备份和容灾技术和措施可以保证云存储中的数据不会丢失,保证云存储自身的安全和稳定。
2.3 应用接口层
应用接口层是云存储最灵活多变的部分。不同的云存储运营单位可以根据实际业务类型,开发不同的应用服务接口,提供不同的应用服务。比如视频监控应用平台、IPTV和视频点播应用平台、网络硬盘引用平台,远程数据备份应用平台等。
2.4 访问层
任何一个授权用户都可以通过标准的公用应用接口来登录云存储系统,享受云存储服务。云存储运营单位不同,云存储提供的访问类型和访问手段也不同。
尽管云存储有这样四层结构的划分,并且有一些尖端的技术也正处在研发阶段,例如EMC所宣布的道里(Daoli)可信基础架构项目,旨在提供可信的云计算平台,使用虚拟化和可信计算技术,支持对单个主机计算机环境进行隔离,使之适合租借给多用户。简单说,道里项目就是解决云计算下的安全问题。
3. 云存储发展需要的技术
从云存储结构模型可知,云存储系统是一个多设备、多应用、多服务协同工作的集合体,它的实现要以多种技术的发展为前提。总共可以分为六类:宽带网络的发展;WEB2.0技术;应用存储的发展;集群技术、网格技术和分布式文件系统;CDN内容分发、P2P技术、数据压缩技术、重复数据删除技术、数据加密技术;存储虚拟化技术、存储网络化管理技术。
3.1 宽带网络的发展
真正的云存储系统将会是一个多区域分布、遍布全国、乃至遍布全球的庞大公用系统。使用者需要通过ADSL、DDN等宽带接入设备来连接云存储,而不是通过FC、SCSI或以太网线缆直接连接一台独立的、私有的存储设备上。只有宽带网络得到充足的发展,使用者才有可能获得足够大的数据传输带宽,实现大量容量数据的传输,真正享受到云存储服务,否则只能是空谈。
3.2 WEB2.0技术
Web2.0技术的核心是分享。只有通过Web2.0技术,云存储的使用者才有可能通过PC、手机、移动多媒体等多种设备,实现数据、文档、图片和视音频等内容的集中存储和资料共享。Web2.0技术的发展使得使用者的应用方式和可得服务更加灵活和多样。
3.3 应用存储的发展
云存储不仅仅是存储,更多的是应用。应用存储是一种在存储设备中集成了应用软件功能的存储