从术语变化看高性能计算机的发展
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
孙凝晖 陈明宇
中国科学院计算技术研究所
从术语变化看高性能计算机的发展*
历史回顾
电子计算机自1946年诞生至今一直处于不断的创新和发展中,在此过程产生了许多技术术语。从不同时期计算机科学技术名词术语的变化,可以窥见计算机技术的发展脉络。
在计算机最初发展的十几年里,不存在大型、小型或者高性能计算机的区别。术语主要由计算机的基本部件和功能构成,包括中央处理器(CPU)、内存、外存、输入/输出(I/O)、指令系统、高级语言、数据结构、操作系统、编译等等。计算机特有的基本术语随着相应的理论和技术的成熟逐步固定下来。
1964年推出的CDC6600计算机是公认的世界上第一台高性能计算机。CDC6600采用了当时多项领先的技术,包括硅晶体管、多功能单元并行技术、专用I/O 处理机等。CDC6600比当时其他公司的产品快3倍以上,领先地
关键词:术语 高性能计算机 分类
位保持了5年左右。从此,高性能计算机成为一个新术语,特指采用新技术并使性能远高于主流产品的计算机系统。
1976年向量计算机Cray I 的发布标志着向量机成为高性能计算机的主流。与之同步的是向量化技术的发展,以及相应衍生出的名词,包括:向量部件、向量
流水线、向量化、向量编译等。这个时期,90%以上的高性能计算机都是向量机。
到了80年代,依靠器件和工艺技术提高频率的难度提高,并行开始逐渐成为高性能计算机的关键技术和核心名词。1987年面世的Connection Machine2(CM-2)计算机把并行化发展到极致。它最多可配备
6万多个处理单元。这一时期
图1 世界上第一台高性能计算机CDC6600
* 本文系作者根据2012年12月30日在《计算机科学技术名词 第三版(草稿)》研讨会上的发言整理而成。
总计算能力
前100名志愿者统计数据-------------------活跃:301442位志愿者,542855台计算机24小时平均:3899.77万亿次浮点运算Phil Klassen 贡献2.601万亿次浮点运算
国家:加拿大 团队:加拿大
图2 SETI@Home Internet 分布计算运行统计33.5%
54.3%
2.3%
1.8%1.7%
SETI@home SETI@home Beta
Docking@home MilkyWay@home GPUGRID HAL@home Collatz Conjecture DNETC@home
1.0%出现了各种并行系统结构的计算机,如:并行向量机(parallel vector processor, PVP)、对称多处理机(symmetric multi-processor, SMP)、非一致性存储结构(non uniform memory access, NUMA)、大规模并行处理结构(massively parallel processing, MPP),以及阵列、脉动、主从式计算机等变种的并行计算机。并行化、加速比、单指令多数据(single instruction multiple data, SIMD)/多指令多数据(multiple instruction multiple data, MIMD)等术语也在这个时期成为流行名词。
1990年以后,随着向量机的退出和微处理器的崛起,MPP 开始逐渐成为高性能计算机的主流。代表系统是英特尔公司在1997年推出的ASCI Red ,这是历史上第一台T 级(万亿次)系统。这一时期高性能计算机技术的重点已不再是处理器设计,而是支持高效并行计算的互联网络和并行软件。与之相关的核心名词是:消息传递、虚拟通道、虫
孔路由、集合通信、Mesh 拓扑等。在2000年左右,定制的MPP 系统在高性能计算机中的地位被性能价格比更高、采用主流商用计算机和互联网络构建的机群系统所替代。美国这一时期的ASC 计划研制的大部分系统都是机群系统,其中具有代表性的ASCI White 完全是由IBM 公司的商业节点RS/6000构成。“机群”这一技术名词也从网络工作站(network of workstations,
NOW)、工作站机群(cluster of workstations, COW)、Beowulf 机群等,最终演变为被人们广泛接受的“机群”(也称集群)。高性能计算机的网络也从定制转向商业化,多级互联网络、胖树和Clos 拓扑等成为新的研究热点。在同一时期,系统规模(而非节点和网络技术)成为衡量高性能计算机的主要尺度之一。
在机群系统普及的同时,对基于互联网的分布式高性能计算
机的探索开始成为学术界关注的热点之一。著名的SETI@Home 计划,在2005年左右就可以联合全球54万台分布式计算机进行协同计算,计算速度达到每天3.8P (千万亿次),如图2所示。这时期诞生了以网格(grid)为核心名词的一系列术语,如:网格中间件、计算网格、数据网格、信息网格、知识网格等。虽然网格技术最终没有成为高性能
计算的主流,但是相关的研究成果已经融合到近年的云计算热潮之中。
2000年以后,有观点认为,依托商用部件的机群系统具有无可比拟的性能价格比优势,将成为高性能计算机体系结构的终结
者。但是大规模机群系统应用过程中遇到的各种开发、使用、管理、维护等问题促使学术界开始对什么是高性能计算机以及高性能的评价标准产生了疑问。传统的以单位时间内的浮点计算能力来衡量高性能计算机的方法遇到了挑战。一个新的术语——高效能(high productivity)被提了出来。高效能考虑的是高性能计算机系统和应用的全生命周期,除
了生产成本,还要考虑应用开发成本、使用成本、运行成本、维护成本等。但是到目前为止高效
能仍然只是概念,还缺乏有效的测量方法,这个名词的内涵还在
1.2%4.1%