软件定义存储SDS精编版
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
软件定义存储S D S精
编版
MQS system office room 【MQS16H-TTMS2A-MQSS8Q8-MQSH16898】
软件定义存储SDS
摘要:软件定义存储,SoftwareDefinedStorage。出现背景:应对数据暴增,成本降低到普通机架式服务器硬盘的价位,兼容各种硬件的开放性,可在线横向扩展;哪些新的技术显着地改变了存储架构:SSD,SDS,CPU多核技术,高速网络,大容量服务器和磁盘,多副本存储方式。最近两、三年,在IT圈里,除了云计算、大数据、人工智能之外,最火的就属“软件定义”了,先是有软件定义网络
(SDN,SoftwareDefinedNetworking),继而有软件定义数据中心
(SDDC,SoftwareDefinedDataCenter)和软件定义存储
(SDS,SoftwareDefinedStorage)。转载自百度百家或微信公众号-?乐生活与爱IT。
1.为何出现软件定义存储?
为何出现软件定义存储?
人类各项发明、创新,大多都是为了更加的高效、方便、灵活,并且节省成本。例如,从种植业、畜牧业的出现,到蒸汽机的发明,到自来水、集中供电的出现,再到互联网的出现(信息传递更快更高效,更省成本),无一不是如此。
IT也不例外,以企业级存储为例,近10年来逐渐出现的自动分级、去重、压缩也是为了更高效地使用存储资源,更节省成本。而最近两三年,软件定义存储的出现,依然是为了这个需求。
伴随着需求,还有两大背景:
一是,随着个性化、物联网、万联网的发展,数据以前所未有的速度迅猛增长,数据的存放、管理、优化、利用成为难题,用户面临着如下挑战:
存储利用率低,数据僵化在某些硬件组件里,难以提供随需动态变化的服务等级,缺乏精确的控制,部署和调整存储资源需要经过复杂的流程(例如需要应用管理员与存储管理员等进行协调),自动化程度低,对请求的响应慢,……。
二是,虚拟化、云计算和硬件技术的发展,使得软件定义成为可能;在此之前,存储用户也希望更加高效、简单、灵活,且成本较低,但十年前,SSD和高速网络尚未出现或发展不够,分布式存储难以堪当重任;彼时虚拟化云计算还未出现或者尚未成熟,从存储中调用控制信息给前端应用或OS使用,去实现灵活敏捷的存储资源的部署,在那时还不是那么迫切。
随着虚拟化和云计算的普及,用户的思维方式也发生了转变,逐渐意识到,快速、敏捷、灵活地获取计算资源已经成为可能,并且逐渐要求能按需使用,按
需付费。因此,做为虚拟化和云计算里重要的组成部分,存储也应适应新的需求而不断完善。
下面围绕这这两大背景展开阐述:
我们先来看一下,在物联网、万联网(IoT,InternetofThings)的伴随下,未来数字宇宙的惊人变化。我们知道:
KB=210xByte;
MB=210xKB;
GB=210xMB;
TB=210xGB;
PB=210xTB;
EB=210xPB;
ZB=210xEB;
IDC在2012年预计,到2020年数字宇宙规模将超出其在2011年的预期,达到40ZB,
40ZB到底有多大呢?假设地球人口按照73亿计算,40ZB相当于地球上人均
5600GB以上的数据。
2014年4月,IDC发现数据的增长超过其在2012年的预期,预计2020年将达
44ZB的数据量,比2012年的预估增加了10%。
有趣的是,在整个全球的数字宇宙中,2017年新兴市场(EmergingMarkets)的数据所占全球数据的百分比,将首次超过成熟市场(MatureMarkets,也即指发达国家和地区)。
预计,2014~2020的6年里,IT从业人员仅仅增长到倍。平均每个IT人员管理的数据量从230GB增加到1231GB,5倍多!
过去十多年甚至二十多年里,数据的增长速度在很多时候超越了摩尔定律(半导体芯片上集成的晶体管将每一两年翻一番)。
从硬盘厂商希捷的一份报告可以发现:在企业级SSD普及以前,存放数据的盘,无论性能还是容量,与CPU、内存比较,都发展得异常缓慢。以1987-2004年为例,17年间,CPU和内存的性能提升了200万倍!而磁盘仅仅提升了11倍!
最后总结一下,为何出现软件定义存储?
简而言之,随着用户需求的变化(因为数据激增),技术的变革,软件定义存储能够提供给用户更快的性能,更高的灵活性和开放性,更强的扩展性,更简单的管理(后面的篇章会提到),更少的投入。
以ServerSAN为例:
从投入成本看:由于省却了外置磁盘阵列的存储控制器,存储光纤交换机,服务器HBA光纤卡,仅硬件的投入,即可降低到普通机架式服务器硬盘的价位。它将传统存储的专用硬件,转变成通用硬件,通过融合计算,存储达到降低成本的目的;
从开放性看:只要通过兼容性验证,它支持业界标准的硬件,如服务器、SSD、磁盘、IO控制器,并且能在最快时间采纳新的硬件,灵活性极高;
从扩展性看:分布式的存储,都能支持在线的横向扩展,能自动地在一个资源池里线性地、同时地增加计算资源和存储资源,使用户获得可预测的性能和容量;
2.什么是软件定义存储?
什么是软件定义存储
在IT基础架构领域的软件定义,最早出现的是:软件定义网络(SDN)。SDN起源于2006年斯坦福大学的CleanSlate研究课题。2009年,Mckeown教授正式提出了SDN概念。通过将网络设备的控制平面与数据平面分离开来,并实现可编程化控制,实现了网络流量的灵活控制,为核心网络及应用的创新提供了良好的平台。
2012年,VMware在其VMworld大会上首次提出软件定义数据中心(SDDC)的概念。作为VMware软件定义数据中心五大组成部分(计算、存储、网络、管理和安全)之一,软件定义存储(SDS)的概念也首次被提出。
EMC公司在当年的EMCWorld发布大会上也发布了SDS战略,引发了业界对SDS的大讨论,SDS迅速成为存储业界的研究热点。
不过,时至今日,SDS的定义并没有统一的标准,各家权威咨询机构,各大厂商等,都对这一概念有着不同的解释或描述。下面我们列出主要的机构和厂商对SDS的描述,看看有何共性和差异。
通过对SDS市场的深入了解和研究,对SDS定义如下:SDS将数据中心或者跨数据中心的各种存储资源抽象化、池化,以服务的形式提供给应用,满足应用按需(如容量、性能、QoS、SLA等)自动化使用存储的需求。
副总裁NeilMacDonald在其位于Gartner网站的博客上撰写道:
SDS必备的四个基本特征是:Abstraction(抽象化)、Instrumentation、Automation(自动化)和Orchestration(编排)。
另外,2013年10月Gartner发布2014年十大战略技术中,重要的组成部分就有:软件定义一切。Gartner认为:软件定义一切囊括了在基础设施可编程性标准提升下不断增长的市场势头、由云计算内在自动化驱动的数据中心互通性、