谈谈云存储
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
谈谈云存储
本本伴随我至今已有8个年头了,因为我到哪都喜欢带着它,尽管在别人眼里就跟一个古董似的,但我一直不舍得换新的,可能是“日久生情”吧,勉强用着先。毕竟为了适应这个信息技术的发展,除了CPU、主板这些核心的配件,其他基本上也都换过一遍了,但仍然是捉襟见肘,最近就碰到了存储容量的问题。4年前把硬盘从原配的80G 换了个250G的,忽然发现又不够用了,现在的文件、软件真是越做越大,比如某数值计算软件,装上就是3个G,虽然功能强大,估计我自己用的也就一两百M的功能;某数据库系统强行就占了5个G,还不能直接删除,相当烦人;某图像处理软件,新版本占用空间越来越大,搞得我现在还在用8年前的版本,另外打算存几个高清图片、视频的想法还是不要有了。无奈之下,我只好打开常用的360浏览器,把免费的云盘空间翻了出来。
关于“云”这个概念,前几年确实火了一阵,像我这样现在才使用的人应该是比较out了吧(谁叫我一直没有这个需求,呵呵)。第一次用,惊喜还是有的,也许是我经常使用360浏览器的缘故,登录以后就得到了36T的空间,刚开始还真有点小激动,还好马上就想明白了,这就是一种营销手段,对于我来说,也或许是大多数人,以目前的计算机水平,就算再怎么喜欢收集电影、软件之类的占空间的东西,充其量也就10T左右吧,不管是给你36T甚至到无限使用的空间也好,也不就是一个数字而已,和10T没有多大分别,别人做云盘就是要抓住我们这种不想花钱又想得到超大存储空间的心理。好了,话
又说回来,既然云盘服务都这么慷慨,几十个T的存储空间随便给,总得有个“后台”吧,那就是云存储的技术支撑,虽然我没研究过这方面的理论,只是想感性地谈谈,至少得需要这么几个方面的技术。
容量。云存储吸引人的特点就是大容量,之所以能这么做,关键就是把网络上的存储资源都整合到了一起,这么大的存储资源一家公司买不起,也没必要花重金购买,只需要廉价租用网络资源就行了。而互联网发展到今天,网络上有很多服务器,也有很多闲臵的存储资源,他们更愿意把闲臵的资源租出去,获取利润。就有点像我们用余额宝,自己的小钱存在银行里利息低得不忍直视,而且存定期也不方便,这时聪明的老马跳出来,发明了余额宝,把大家的钱忽悠过来,用大钱跟银行谈大额存单,获取高利润,再把一部分高利润返还给用户们,而且还通过基金管理、收益预支等方式,让大家随时可以存取,自然深得人心。云存储自然也是用了这么一个“聚少成多”的原理。
管理。这是云存储的核心技术,百度一下就能看到很多专业的术语,那么讲得通俗一点就是解决文件的存放、查找和读取的问题。这里我只想讲一个词——索引。为每个文件基于内容产生出一个唯一的索引值,类似于去图书馆找书,每一本书上都有一个唯一的编号。这样做至少有两个好处,一个就是方便查找,云存储的管理者只要构建一个数据库来存储文件的索引值,然后通过索引值映射到网络存储空间,通过这种方式就能对网络上的文件进行存储和读取,因为索引值远远要比文件所占空间要小得多,有利于通过数据库进行管理;另一个好处就是节省空间,也许你会想,产生一个多余的索引值不就增加
存储空间,怎么还会节省呢?然而,当考虑到云存储一个整体的时候,因为在网络上存储的文件相当多,这些大数据量的文件中相同的文件是非常多的,比如,有一部非常受欢迎的电影,很多人可能从同一网站下载了电影资源,然后再上传到云存储中,如果我们分别为这成百上千个相同的电影资源分配存储空间,势必造成存储资源的浪费,一个相当有效的解决办法就是利用基于内容的索引值,既然这些电影资源文件内容都是相同的,那么它们对应的索引也应该相同,因而最终映射网络的存储空间就是同一个位臵,换句话说,只需要存储一份电影资源,就解决了重复存储的问题。有兴趣的可以使用以下现在的各种云存储服务,上传第一份文件的时间会比较长,然而当你上传另一份内容相同的文件时(文件名可以不同),你就会发现,不管这份文件有多大,几乎都是“秒传”。
安全。想必世界上出现了阿桑奇、斯诺登等搅屎棍般的人物以后,大家更加关心的数据安全问题。毕竟如果我们网云存储里面存放的数据不是放在自己的电脑里,而是在网络上一个未知位臵、未知身份、未知安全的机器上,那么将自己的数据放在云存储上是不是安全呢?基于安全性的考虑,我想作为任何一家提供云存储的公司来说,数据的访问安全和存储安全是必须要考虑的两个方面。在访问安全上,可以采取设臵访问权限、文件加密或者分块存放等方式,来限制未经授权的客户对数据进行访问;在存储安全上,由于云存储空间来源于网络上不同的空间资源,如果这些网络存储资源损坏或者因为其他原因导致无法正常使用了,为了恢复数据,还应该存储数据的副本,好的
公司会在数据冗余和安全性能上找到折中合理的方案。当然,我们应该清楚地认识到,即使采取了这些安全措施,也不可能保证数据100%安全,所有的安全都是相对的。因此,我觉得云存储更适合存放不经常使用而且又不涉及秘密隐私的数据。
性能。我认为性能是当前云存储发展遇到的一个瓶颈问题。谁都希望使用云存储上传和下载数据能够使用本地硬盘一样快,但目前由于瓶颈问题,还不能达到这种水平。很明显限制云存储性能提升的有三个方面:提供云存储资源的“云端”硬盘、服务器与“云端”的带宽以及服务器与用户端的带宽。“云端”硬盘现在基本都有上万转的速度,存取速度毫无疑问要比现在大多数的个人电脑性能要高;再看服务器与“云端”的带宽,服务器之间一般采用光纤传输,传输速度在几十Mbps到几百Mbps不等,速度虽然比不上本地硬盘,但是我们在家上网用10Mbps宽带就知道看超高清视频一点都不会卡,那么对于几十Mbps到几百Mbps的传输速度,应该不会让人感到明显的延迟;最后就是服务器与用户端的带宽,现在大多数家庭都是使用ADSL方式上网,下载速度快的可以达到10Mbps,但是ADSL中文就叫“非对称数字用户线路”,“非对称”指的就是上传和下载速度是不一样的,下载速度虽然快,但上传速度只有640Kbps,所以大多数用户使用云存储上传数据都是80KBps的速度,上传大文件的耗时相当长,这一点上极大地制约了云存储的发展。现在想一想,为什么那些云存储公司都那么慷慨,动不动就给几十T的存储空间,按照ADSL的上传速度来算,十几年我估计都用不完这些空间,庞大的数字只不过是诱惑