云计算与大数据第三章 云计算与大数据体系架构剖析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.1 关于开源与闭源的探讨
3.1.1 软件在吃所有人的午餐!
无论媒介的形式是软件还是硬件,开源与闭源指的都是信息(特别是 科技信息)被共享的方式。开源通常被无差别地等同于免费(尽管不准确, 但是大体上是不错的),而闭源则通常以携带copyright(版权)的方式呈 现,需要付费购买。
以史为鉴,笔者把人类开源的发展史划分为7个阶段,如图3-1所示。
孙宇熙 编著
云计算与大数据的到来一前一后,但两者之间又是相辅相成的关系。 云计算改变了IT,大数据改变了业务。云计算作为基础架构与平台化运 维的使能者为大数据系统的实现提供了弹性、敏捷性与健壮性;大数据 作为一种主要的应用类型也持续地推动了底层云基础架构向高效性、实 时性、基于API的互联互通方向发展。本章我们将就开源、闭源、软件定 义、一切皆服务等行业趋势展开论述。
真正的开源(Open-Source)软件要到1998年1月,Netscape公司宣布 把Navigator(1994年问世的第一款互联网浏览器,Mozilla Firefox的前 身)浏览器的代码开源。RMS在第一时间意识到开源的潜在价值,同年二月 即成立了OSI(Open-Source Initiative,开放源码促进会)。
业界的另一个大趋势,是随着底层硬件的同构化(通用化、商品化), 系统主要的差异性都通过软件来体现(例如,虚拟化,容器化,软件定义的 计算、网络、存储等)。软件,无论开源与否,以其远超硬件的灵活性(可 定制性、可编程性、可二次开发性)顺应并引领了信息时代需求多变的特点 而越来越受到青睐。
接下来让我们聚焦大数据与云计算体系架构,无论是Hadoop、NoSQL还是 NewSQL,无论是IaaS、PaaS还是SDX(软件定义一切),它们都具有一个共性— —分布式处理系统架构,而大多数的分布式系统是采用商品硬件(Commodity Hardware)平台作为底层支撑架构。我们在本章后续部分中将分别阐述商品硬件 趋势、软件定义一切、硬件回归三个前后关联的议题(如图3-3所示)。
GNU免费软件项目出现的时候其目标是构建一个完整的、可以取代UNIX 操作系统的集编程、编译、调试、集成与运行环境于一体的生态系统。显然 这个宏大的目标在头十年内 (1983—1993年)并没有实现,而最完整的实 现是LAMP开源技术栈(见图3-2)。
图3-2 LAMP开源栈与系统环境
开源技术在最早期并非纯粹以商业目的为驱动,确切地说是一种黑客文 化(Hacker Culture),以RMS为首的开源推动者们认为开源+共享+众筹是 更高层次的精神享受(成就感)继而带来更高的劳动生产率(效率)—这一 点和当下的互联网思维如出一辙。
图3-1 技术信息开源发展历程
最早的开源可追溯到互联网出现之前的汽车工业时代。1911年,福特 汽车之父Henry Ford打赢了一场美国司法历史上著名的历时八年之久的专 利官司,导致从1895年开始就垄断汽车发动机两冲程引擎专利技术的律师 George B. Seldon再也无法以独享(闭源)专利的方式从数以千家的美国 汽车企业(是的,没有看错,和今天的中国汽车生产企业数量一样多,但是 最后终将只剩下三家)那里征收专利费用了。随之形成的机动车厂商联盟在 其后的数十年间免费(“开源”)共享了数以百计的专利技术。
图3-3 软件在统治世界,硬件在哪里?
3.1.2 商品化硬件趋势分析
笔者将商品化硬件(Commodity Hardware)的发展历程分为6个里程 碑(如图3-4所示),我们在此逐一梳理。
DEC PDP8 (1965)
通用
微处理器 (1971)
Apple II & VisiCalc (1977)
互联网前时代的科技共享 - Ford Motors、Marie S. Curie 互联网曙光初现 (1970) - ARPANET - RFC 免费软件运动 (1983 – GNU; 1985 – FSM by Richard Stallman) 开源软件诞生 - Netscape Navigator (1998) 操作系统、软件体系架构 (2000 -) 云时代、软件定义时代 (2005 -) 谁会笑到最后? (2016 -)
RMS的另一大贡献是以组织、机构的方式系统化地推动免费软件深入人心。 他于1985年成立了FSF(Free Software Foundation,免费软件基金会), 业界为此有了个充满政治含义的新名词—FSM(Free Software Movement, 免费软件运动)。从最早的GNU项目到后来的LAMP,到近年来经互联网公司大 肆鼓吹的共享经济形态,究其根本是,如果有免费的“午餐”(来替代需付费 的产品或服务方式),绝大多数人会趋之若鹜,此人性也。免费理念与实践之 集大成者非RMS莫属。
IBM PC & MSDOS (1981) & Lotus 1-2-3
(1983)
X来自百度文库6/Intel 80386 & Windows
(1985), Linux
(1994 -)
64-bit系统 & 虚 拟化、云计算、 大数据 (2005 -)
图3-4 商用(通用)硬件发展之路
2005年对于PC市场而言是个分水岭,X86-64位中央处理器的推出让基 于PC架构的服务器处理能力成倍增长,虚拟化技术让新的PC具有像原来的 大型机一样有分时处理、服务多租户的能力,而其相对低廉的价格更是对同 时期其他解决方案(如RISC指令集)形如一剑封喉。即便是在不计成本追 求性能的超算中心(Supercomputing Center)领域,基于X86-64的Intel 自2005年开始连续10年高速增长(见图3-5),10年内其他竞争对手几乎全 部经历了销售萎缩、资产减记最终或委身于下家或破产的命运。即便是如日 中天的IBM PowerPC、Sun Microsystems SPARC也难逃一劫,令人唏嘘。
20世纪80年代见证了免费软件(Free Software)运动的诞生,始作俑 者非当时尚在MIT的Richard Stallman(RMS)莫属。他最早于1983年在 USENET上面宣布开始编写一款完全免费的操作系统GNU(GNU’s Not UNIX— 时代背景为当时流行的操作系统UNIX 100%被商业企业闭源控制)。为了确保 GNU项目代码保持免费并可被公众获取,RMS还编写了GNU GPL(GNU General Public License,通用大众版权)。GNU的创立为Linux最终的诞生(1991年 Linus Torvalds编写的Linux内核问世,采用GPL v2许可)铺平了道路,而 GPL则逐渐成为开源最主要的版权许可方式。
相关文档
最新文档