华为首席架构师武湛:未来一定是以数据为中心

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

西部网讯11月30日上午,“2013陕西互联网大会”在西安高新区举行,在以“陕西承接互联网产业西移”为主题的主论坛上,华为服务器首席架构师武湛做了关于“大数据”的发言,他认为,无论做什么行业,唯一不变的是对于数据发展的认识,未来一定是以数据为中心。

以下为文字实录:
在开讲之前,我比较担心演讲的题目能不能跟大家形成一个共鸣,因为前面三个演讲嘉宾讲的都是他们对整个互联网行业的看法,他们本身也是网络运营商,只有华为一家应该说是平台提供商,在演讲之前我想跟各位稍微调查一下,有没有技术背景的,对于互联网平台比较了解的?我看到不是很多,下面我就尽量讲的稍微通俗一点,这样大家会有比较好的理解。

唯一不变的是我们对于数据发展的认识
我今天讲的是从硬件平台角度看一下现在发生的事情和未来发生的事情,以及对华为能力的简单展示。

对于已经发生的事情,前面几个演讲嘉宾都提到,无论做什么行业,唯一不变的东西是我们对于数据发展的认识,也就是现在炒的比较热的概念——大数据。

大数据从本质来看,并不是什么神秘的东西,无论是数据挖掘、利用和存储,现在所谓互联网公司对于整个数据平台的创新,无非围绕统一存储数据和对不同热点数据进行存储的区分。

第一个是冷数据平台存储创新,原来用的存储服务器是盒子,后面是CPU,内存,现在你并不能看到CPU在什么地方,你也看不到跟其他地方的互联,这是一个创新。

百度现在推出非因特尔平台异构架构的冷数据存储服务器,有三个地方值得关注的,第一个是异构处理器应用,第二个是SMR硬盘的使用,第三个是ERASURE CODING。

异构处理器多样性的优势已经非常明显
无论搞硬件背景还是软件背景,大家都应该学过摩尔定律,两年数量增加一倍,但是这有一个问题,现在一个处理器,假如说是2X纳米的制成,我们就用20纳米的制成,这么大的晶圆再去缩小制成,在10纳米以下,摩尔定律不会增加很多,因为做不下了,再做下来有一个关键的问题,成本。

假如说现在投资一个晶圆厂,做晶圆,那20纳米假如说一块钱,投资10纳米以下可能就是一百,最后做出来的处理器随着性能增长,但是价格增长不能被客户接受,这是关键问题。

大家知道除了因特尔以外,其他公司正在转型,不一定会走高集成化的路,会走别的方向,所以通过并行计算实现整个异构处理器平台是整个未来的趋势,处理器慢慢从不行到非常强再到专业化,导致处理器越来越偏向应用的结合,优化,异构处理器多样性的优势已经非常明显,包括今天在有个演讲嘉宾讲的腾讯技术架构,它也是在这个方向走,百度、阿里都不例外。

HMR是五年来最重要的发展技术
前面讲对数据的创新,数据存在哪?无非是传统硬盘,我上学时代硬盘可能是多少兆,我觉得那是浩大的硬盘了,现在看是什么概念,买个1T的硬盘都不夸张,但是硬盘只有3.5寸,不可能加无限的碟片,因为读取的磁力尺寸有限,解决的办法,第一种是冷数据存储,磁片
堆叠之后容量可以加大,以前做4T可能做不上去,未来可能做20T。

第二个是HGST的存储,以前我们知道,在硬盘里面抽真空,现在是加入惰性气体,这样对磁头污染很小,然后它去加热磁片,使得整个污染变小,功耗变低容量变大。

第三个是HMR技术,相当于把激光聚集到一个点,增大了读取密度。

从硬盘发展可以看到,无论现在处于什么阶段,但是从我角度来看,HMR是五年来最重要的发展技术。

因为它的数据中心非常大,随着公共云这样的发展,未来数据中心的演变并不是像传统那样一台一台服务器放,一台一台交换机买,然后再往上补充业务。

未来整个处理中心的变化是买资源,也就是说云计算对外出租,出租什么?出租资源,出租计算资源,出租存储资源。

这里有几个创新技术:从电脑互联走向光互联,硅光不能叫创新性技术,但是它是非常绿色的技术,会把整个光互联成本下降,可以把功耗做下来,以后这是一个趋势;集中化管理与交付,我大家如果做大网站建数据中心,或者租用别人的数据中心,如何更好运用资源,必须跟资源管理平台对齐;更加绿色的数据中心,这里的高压供电是直流的,高温服务器,做大型数据中心,如果做绿色的数据中心,把PUE提升,或者把PUE更加优化,一定是在某些时段,把空调和电力利用最大化,所以现在对于服务器,存储器,交换机设备都要进行非常环境适应。

未来一定是以数据为中心
现在发生的事情无非两个方向,一个是把数据进行硬件化应用,第二个是看到未来数据中心往什么方向走,未来可能发生的事情,大家各有各的认识。

不管做业务,做硬件还是做平台,都是看到以计算能力,也就是CPU构建有多少资源,支持多少用户的东西,是以CPU构建整个平台。

而未来一定是以数据为中心,以数据为中心的时候,硬件怎么做,对硬件怎么用。

如果我们计算一个东西,就是数据计算,数据计算有很强的时效性,不像以前,可能别人知道的事情你算算就知道了,那没有价值。

内存计算可以开发很多应用,但这跟应用平台业务相关,这在未来是一个趋势,无论在互联网还是企业侧,我觉得企业侧更高一些,因为内存很便宜,大家知道,美国股票交易中心,美国证券交易所,它用的是什么?肯定是内存计算,再加上最高主频计算,第一个是网络连接来为整个股市服务,它的内存计算加上网络,可以让我每一秒或者每0.1秒可以多赚一些,这应该是美国交易所对大数据时时计算比较看好的方向。

第二个是LIASL成为一个主存,前面讲硬盘是存储性数据主要东西,但是看到很关键的,硬盘是有瓶颈,一个是尺寸,一个是IU,内存不可能全部成为主流,你还要有东西承载下一个数据,这一定是给内存相匹配的东西,并且它不会丢失,因为它是一个随机存储器,我们现在的FLASH,随着制成增长,制成就是缩小整个间距,你看到整个FLASH,我们现在看到一个新东西,3D,它是相当于硅片进行叠加,导致了FLASH成本下降,这样我刚才讲的SID就是FLASH构成的,这样整个IU我估计是上万倍的提高了,这是非常大的部分。

第三个就是异构加速,在两年前,华为把整个现代互联网全部应用抽象了一遍,然后发现了什么问题?把整个互联网应用在自己模拟器上跑,跑完以后发现基本都是整形数据,整形应用,我去跟搜狐,腾讯人交流,为什么你们都是整形数据,你理解错了,不都是整形数据,未来大部分是浮点,为什么大部分是浮点,因为整形机构达不到,百度现在做的是文字输入,点回车,搜索出来整形就够了,匹配字符就够了,未来会做图象识别,人脸识别,这个编程不是计算可以达到,必须上浮点,然后上传一些图片,打游戏,做其他方面的应用浮点非常多。

所以我们认为浮点会非常多,这就是整个异构加速重要部分。

前面有个演讲嘉宾提到微信,我给全场照个照片,然后我要上传到微信,我不能这样传,假如说一个照片5兆,一个照片5兆,两下就崩溃了,一定做一个压缩或者抽取,或者改整个象素或者大小,这种东西怎么做?它是简单的,需要大型处理化的系统,以前你CPU做的东西远远达不到,然后按照逻辑做,这样会降低你的成本。

未来发展的几个事情从我观点上列出来,这偏向于硬件,这不是我们自己捏造出来,一定是基于大数据应用抽象出来的东西,我们作为硬件提供商来看,肯定要把业务趋势转向需求,所以未来可能都是我的客户,我先给大家普及一下这个概念。

华为的能力不用讲太多,大家如果用华为服务器慢慢会更加了解。

整个布局,我们在西安也有布局,所以我们西安也是整个硬件非常大的TM,它做的是云计算,所以各位如果有兴趣,也可以跟这边聊一聊。

这个是IO,我现在看到很多大公司在买标准设备,买了之后发现你买了贵的,但是发现用不出贵的性能,那就是某些瓶颈出现,并不是这个系统不行,是你要解决什么,一个是解决整个IO瓶颈,反过来看,这是华为在业界第一次做,我们往回退五年、六年,那时候大家用百度的时候,发现那时候搜索怎么那么慢,受不了,因为你的磁盘IO不够,不停要增加你的机器来满足高IO的请求,所以说百度会用这种东西,这是第一个我们看到的产品,我现在一个服务器配这样一个卡,可以让原来四到五台服务器成为一个一个,然后就是数据压缩,另外是深度挖掘网络,让你挖掘更深度的信息。

所以各位如果用我们的服务器完全不用担心性能问题,我们知道跟别人做服务器和存储是不太一样,因为我们是电信运营公司,至少我们整个质量控制都是电信的标准,所以我们可靠性也不用担心。

最后是我们看到华为在今年前三季度华为出货量,现在排到中国第二名,第一名可以看到是戴尔,今天本来是互联网论坛。

可以把华为服务器在互联网占有率,我自己感觉算了一下,30-40范围,这个数据应该是非常有说服力,有很大部分出货也是在互联网公司。

所以今天跟大家分享对业界看法,当然我是从硬件角度看的,如果有兴趣大家下面再聊。

相关文档
最新文档