超级计算机小论文

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

超级计算机技术已不再是一个新鲜的话题，美国IBM、日本NEC、中国曙光都已推出自己的超级计算机，但比较而言，以美国两院院士、“世界超级涡轮式刀片计算机之父”陈世卿博士为首的专家团队回归祖国后研发出的超级计算机仍然具有绝对的优势。

新一代的超级计算机采用涡轮式设计，每个刀片就是一个服务器，能实现协同工作，并可根据应用需要随时增减。单个机柜的运算能力可达460.8千亿次/秒，理论上协作式高性能超级计算机的浮点运算速度为100万亿次/秒，实际高性能运算速度测试的效率高达84.35%，是名列世界最高效率的超级计算机之一。通过先进的架构和设计，它实现了存储和运算的分开，确保用户数据、资料在软件系统更新或CPU升级时不受任何影响，保障了存储信息的安全，真正实现了保持长时、高效、可靠的运算并易于升级和维护的优势。

2011年6月21日国际TOP500组织宣布，日本超级计算机“京”（K computer）以每秒8162万亿次运算速度成为全球最快的超级计算机。由日本政府出资、富士通制造的巨型计算机“K Computer”目前落户于日本理化研究所，并成功从中国手中夺回运算速度排行榜第一的宝座。以每

秒8162万亿次运算速度成为全球最快的超级计算机。“K Computer”当前运算速度为每秒8千万亿次，而到2012年完全建成时，其运算速度将达到每秒一万万亿次。“K Computer”比现居第二的中国超级计算机速度快出约3倍，甚至比排名第2至第6的计算机运算速度总和还要快。

目前各种超级计算机的高速处理能力基本上都是利用并

行体系结构实现的，并行计算(Parallel Computing)已成为提高处理性能的关键技术之一。简单地讲，并行计算技术就是用同时运行的多个处理机或计算机来处理同一任务，从而大幅度提高任务的处理速度、缩短了任务的处理时间。

超级计算机的五大形态

在超级计算机技术的发展历程中，先后出现过多种超级计算机并行体系结构，主要有如下5种。

1.并行向量处理(Parallel Vector Processing，PVP)系统

采用一定数量的、并行运行的向量处理器和共享式内存(Shared Memory，SM)结构的计算机系统。PVP系统的SM结构，也就是采用高带宽的交叉开关将各个向量处理器与其共享的

内存模块连接。向量处理器(Vector Processor)的一条指令能够同时对多个数据项(向量矩阵)执行运算，而一般的通用CPU 属于标量处理器(Scalar Processor)，每次只能对一个数据项进行处理。其代表机型有Cray XMP、Cray YNP、NEC SX2、我国的银河一号和二号等。

2.对称式多处理(Symmetric Multi Processing，SMP)系统

采用一定数量、并行运行的微处理器和共享式内存(SM)结构的计算机系统，各处理器通过系统总线或交叉开关连接共享的内存模块，可“均等”或“对称”地共享内存和其它系统资源并由同一操作系统管理，提高整个系统的数据处理能力，因此SMP属于“一致性内存访问”(Uniform Memory Access，UMA)方式，SMP的代表机型有IBM R50、SGI Power Challenge、Sun SPARC Center 2000、曙光一号等。

3.分布式共享内存(DistributedShared Memory，DSM)系统

由一定数量的并行处理节点(Node)组成，每个节点都是一个相对完整的计算单元(配置有处理器和内存模块)，各节点通过高速网络互连，系统由单一操作系统管理，分布于各个节点的全部内存被统一编址，可由所有用户共享。与SMP不同，DSM 对内存资源的共享是非对称的，因为每个节点访问本地内存与远程节点内存时的延迟和带宽是不同的，故DSM系统属于“非一致性内存访问”(Non-Uniform Memory Access，NUMA)方式，其代表机型有SGI Origin 2000/3000、Sequent NUMA-Q、

HP/Convex SPP 1600、银河三号和神威一号等。

4.大规模并行处理(Massive Parallel Processing，MPP)系统

由成百上千计算节点组成的并行处理计算机系统，每个计算节点配置一个或多个处理器，各个节点相对独立，有各自独立的内存模块和操作系统。MPP系统的特点是可以获得很高

的峰值运算速度，且由于系统的内存分布于各个节点，所以MPP 属于“分布式内存”(Distributed Memory，DM)结构，具有易扩展性。MPP的易扩展性使其能够与SMP、DSM等结合，于是出现了SMP-MPP(各个MPP节点采用SMP并行多处理机)和DSMMPP(各个节点采用DSM并行多处理机)等复合型超级计算机系统。MPP系统的代表机型主要有IBM SP2、Intel Paragon、CRAY T3E、曙光1000等。

5机群式超级计算机系统

上世纪90年代中后期，随着Intel芯片等造价低廉的微型计算机组件的出现和网络技术的迅速发展，使采用普通微型机或工作站作为计算节点并采用高速网络互连的并行计算系

统成为了可能，超级计算机体系结构由此开始迈入工作站机群(Cluster of Workstations，COW)或工作站网络(Network of Workstations，NOW)时代。2000年以后，又出现了节点采用商用级处理器的机群系统(Cluster)，以及采用SMP并行机作为计算节点的SMP机群或星群(Constellation)。从内存访问方式上看，机群系统采用了与MPP相同的分布式内存(DM)结构，因而具有很高的可扩展性。机群系统的代表机型有洛斯阿拉莫斯国家实验室的Avalon Cluster、ASCI Blue Mountain、深腾1800/6800和曙光2000/3000等。

超级计算机的展望

一般认为，自1946年第一台电子计算机ENIAC问世至今，超级计算机的发展已先后经历了5个阶段或5代，即早期的单处理器巨型机、向量处理系统、大规模并行处理系统、共享内存处理系统和机群系统。如前所述，

机群系统由于采用了分布式内存(DM)结构因而具有很高

的可扩展性，理论上只要以高带宽的网络互连技术为基础，增加节点数量就能提高并行处理能力或计算速度。另外，由于机群系统可以采用低成本的微型机组件、免费的Linux操作系统和并行编程平台来构建，因而具有非常高的性价比。的确，易于扩展、高性价比等特点赋予了机群系统很强的生命力，但是机群系统的计算性能是否简单地利用其可扩展性就能无限地

提升呢？事实上，当机群节点数量过于庞大时，就不可避免地会遭遇到网络延迟加剧和并行处理环境等方面的瓶颈，系统的可靠性会大打折扣且维护的难度明显增加，同时占地面积和耗电量也将十分惊人。因此，目前“正在兴旺时期”的机群技术并不是超级计算机技术发展的终结者，未来超级计算机性能的进一步提升，依然要靠超级计算机体系结构和关键技术的创新来实现

按照有关专家和研究人员的构想，与现有第5代的机群系统相比，未来的HPC-G6将具备更高的可扩展性、可用性、可持续性、计算密度、可管理性、运行效率和性能功耗比等特征。更高的可扩展性意味着未来的HPC-G6可以更大规模地扩展节