并行计算机的发展趋势与应用前景
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
并行计算机的发展趋势与应用前景
国家智能计算机研究开发中心
曙光信息产业有限公司
李国杰
以市场大量销售的主流微处理机芯片、主板甚至微机或工作站为基本单元构成并行计算机已成为发展高性能计算机的主要方向。微处理机芯片与并行处理是促使计算机性能飞速增长的两项主要技术。传统的以独家使用的芯片为主的高性能计算机将逐渐退出市场。过去人们常用的巨、大、中、小、微计算机分类也将逐步被两大类机器取代:一类是只有单处理机的微机与工作站(除了操作系统不同以外,高档微机与工作站的界限也日益模糊。),另一类是各种不同档次的并行计算机,机器的性能与规模将取决于系统所包含的处理机数目。以并行处理技术为基础的高性能计算机被认为是高技术的一个致高点,美、日、西欧等发达国家和一些发展中国家都制定了国家科研计划下大力气发展高性能计算机。我国也开始重视发展以并行处理技术为基础的高性能计算机产业和推广应用并行计算机。并行计算机的发展趋势与应用前景如何?从研制和使用并行机的角度出发,人们应注重哪些关键技术?我们在推广并行机时应消除哪些误解,注意哪些问题?本文就上述问题谈一些初浅看法,供大家参考。
一、并行计算机的发展趋势
并行处理机80年代初开始较大量地进入市场。一开始多数采用SIMD和向量机方式,以Cray公司为代表,保持巨型机的领先地位。从80年代中期基于RISC技术的微处理芯片问世以来,计算机的性能有明显提高。86年以前向量机与小巨型机的性能每年平均增长35%左右,86年以后,微机工作站与基于微处理机的多处理机性能平均每年增加55%以上,也就是说,每隔一年半左右,计算机的性能就翻一番。由于MIMD计算机性能价格比高,可扩展性强,近几年发展较快,逐步抢占了传统向量机的市场。目前人们一致认为传统的向量机
很难突破万亿次大关,MIMD分布存储多处理机是唯一可以达到万亿次速度(Teraflops)的技术。
高性能的并行计算机的主流究竟是“蚁群”方式(上百万台功能较弱的机器构成一个大系统)还是“象阵”方式(最多几千台功能较强的机器组成),80年代曾有一场大争论。1989年,并行处理的两位权威人士G.Bell(VAX系列总设计师)和W.Hillis(Connection Machine的总设计师)曾公开打赌,赌到1995年哪一类机器会成为主流机型。到今天,结论已经不言自明。CM系列并行机已不再生产,Think Machine公司已申请破产保护,转为并行软件公司。以市场上容易买到的主流微处理机芯片为基础构造包含几十到几千台处理的多处理机或多计算机系统无疑已成为并行机的主流产品。连技术上十分先进但采用自家专门设计CPU芯片的KSR公司也濒于破产。一只无形的手在控制着并行机的发展,这就是市场。只有在市场上有竞争力的并行机产品才有生命力。并行机的体系结构已逐步殊途同归,
SGI(Cray)、IBM、DEC、SUN等几大公司生产的并行机几乎都是采用现成的工作站或微机主板,甚至直接采用工作站或微机(多处理机)整机做基本单元,通过总线或专门设计的互连网连成一台并行机,体系结构已逐渐走向标准化。专家们预测这种相对稳定的体系结构20年内不会有大的变化。由于芯片集成度提高,今后处理机芯片中将包含更多存储单元(一级和二级Cache),出现处理器嵌在大量存储单元中的所谓主动存储器或智能存储器,克服存储速度远远跟不上处理机速度这一明显瓶颈。过去十分热门的并行机拓扑结构问题现在已不大受人关注,因为通信开销主要在软件,多经过几个结点不是大问题,而且采用Wormhole等传输技术以后,传送信息的时间与机器中结点距离关系不大。体系结构的逐步一致化为并行机的推广奠定了基础。
目前市场上能买到的并行机大致可分为以下几类:并行向量机PVP(如Cray C-90、Hitachi SR2201等),共享存储对称式多处理机SMP(如SGI Power challenge、 IBM RS/6000 PowerPC Server、SUN Ultra Enterprises、HP9000、DEC8000、Sequent Symmentry、Compaq Proliant等),分布式共享存储并行机DSM(如Cray T3D等),大规模并行机MPP(如IBM SP-2, Intel paragon),工作站机群,NOW或COW,(如Convex Exemplar, DEC Alpha Farm等)。Cray公司被SGI收购以后,主要的并行向量机供应商只剩下日本厂商。日本较重视峰值速度很高的并行向量机,即具有向量处理能力的并行机。最近Hitachi也向大规模并行处理方面发展,今年3月推出1024个RISC处理机(含伪量处理功能)的SR2201, 峰值速度达3000亿次。对称式多处理机(SMP)是已基本成熟的并行机, 多数公司推出16个处理机以下的共享
存储多处理机,最近有些公司(如SUN公司)已推出32个处理机的SMP,大多数SMP采用高速内部总线(可达2GB/S以上)或纵横开关。SGI(Cray)最近推出可扩展SMP(S2MP)最多可扩展到128个处理机。在线事务处理和数据库应用是SMP的主要市场。所谓对称式是指每个处理机有相等的权力存取存储器、I/O设备和操作系统。这种系统比主从结构有更高的并行性。SMP具有高性能价格比的重要原因是大大节约了占机器成本很大比例的主存储器,也就是说,多处理机价格并不正比于处理机数目。分布式共享存储系统目前还不大成熟,关键是高速缓存一致性的控制用硬件实现成本高,用软件支持效率较低,目前MIT等大学都在主攻这一关键技术。MPP和NOW的界限很模糊,主要区别是采用专门设计的互连网还是采用通用的通信网如ATM等。随着网络接口技术的成熟,将来这两种结构会逐步趋于统一。许多专家都认为比较理想的并行机结构是采用商品化的SMP多处理机做结点,再用通用或专门设计的互连网连接成MPP或Cluster结构,这种结构性能价格比较高,而且避免了目前MPP结构的
I/O瓶颈。
94年2月一批世界著名学者在有关“Petaflops计算的可能技术”讨论会上对20年后最高水平的计算机技术做过预测,他们认为三种可能的体系结构结合起来可以满足不同领域Petaflops(10[fang1]15次)计算的要求。第一种是采用400台左右速度为一万亿次的处理机(可能采用超导计算机),通过交叉开关(可能是光互连Crossbar)构成共享存储的紧耦合多处理机,这是一种类似Cray公司巨型机的结构。第二种是用几万台工作站(每台10~100GFlops),通过多级互连网络构成机群结构式的MPP。第三种结构采用一种新概念,即所谓智能随机存取存储器或称为主动存储器,将处理器(1GFlops/CPU)做在存储器芯片中,每块芯片包含8GB存储器和100个CPU,采用4000块主动存储器芯片(共40万个处理器)构成多维网络结构。采用这种结构的计算基本上在片内存取数据,存储带宽大大增加,机器成本也大大降低。美国能源部制定了一个更为乐观的先进战略计算计划(ASCI),要求96年做出1.8万亿次机,由Intel公司完成; 1998年底前推出3万亿次机,由IBM公司研制。99年做出10万亿次机; 到2002年研制出每秒100万亿次的超高性能计算机。五年内投资约9亿美元研制高性能计算机。此计划能否如期实现,人们试目以待。
二、并行处理技术的主要发展方向