高性能pc集群的的研究与应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Abstract
Asthesocietyevolves,theneedsofHighPerformanceComputing(HPC)aregrowingfast.TheapplicationofHPCisnolongerrestrictedincertainareassuchasmilitaryornuclearphysics.itcouldbeusedinal』areasofthesocie{y.Withthedevelopingofhardwareandsoftwaretechnologies.theClusters.
whichareassembledbycommerciaIoff-the—shelffCOTS)PCswithhigh.speednetworkandfreelydistributedsoftware.deliversuperiorperformance.AslhecosfofPChardwareandnetworkequipmentcontinueslorapidlydescendtheClustershavebeenacceptedbymoreandmorecustomersanditcouldbereflectedinthe“Top500SupercomputingSitesl一alislthatnamesthemostpowerfulcomputersintheworld,
However,IheCOTShardwarest川hassomedisadvanlaaescompared
withsewer-specifichardware,sowehavetodesignoptimaIClusterarchitectureandClustersOfCwaresystamtomakeClusterexhibititshighperformance.highavailabilityandscalability.TheClusterarchitectureisusuallydesignedaccordingtotheapplicationandtheimplementationof
softwaresystemisbasedonthearchitecture.TheClustersystem’sperformanceandreliabilitydependonarangeofkeysoftwaremodules,includingcommunicationmodule.10adbalancemoduleandhighavailabilitymodule.
ThislhesisintroducestwoexamplesofClustersystem’sdesignandimplementation.oneisaClusterVideoServerforDVBsystemandtheotheris
anIndexCalculationSystemfordecision-making.EitherVideoServerorIndexCalculationSystemhasstrongrequirementsofcomputationperformanceand
I/0throughput.besidesthatthesystemsmustbereliable.Thesetwokindsof
serversaretraditionallyimplementedbySMPservers.whicharequiteexpensive.However,thesystemscouldprovidecost-effectireservicesbyusingClusters.
Thethesisgivesthesolutionsto.ImplementthekeysoftwaremodulesofClustersbythesetwosamplesystems.1tusessocketcommunicationcombinedwiththreadtechnologyorMPlfunctionsdirectlyinthecommunicationmodule.whichguaranteeIhecommunicationefficiencyItalsousesdatastripmethodtoimptementthesystem’sIoadbalance.andthesystemperformancewouldn’tdescendbycarefuImemorymanagement.Takingadvantageofredundantequipmentandcarefullyarrangingthetasksllransition.1hehighavailabilityproblemissolved.
VarioustestshavebeentakenontwosystemsandtheresultshowsthatlheClustersystemscouldmeettheservices。requirements.
KeyWords:Cluster,HPC,LoadBalance,HighAvailability,Linux
2
第一章概述和背景
1.1高性能计算机
1.1.1高性能计算机的分类
高性能计算机是计算机科学发展的最重要的‘个标志。高性能计算技术在航空航天技术、石油勘探开发、大范围气象预报、核爆炸模拟、材料设计、药物设计、基因信息学、密码学、人工智能、经济模型、数字电视电影等领域起着重要的作用。它强大的计算能力,在当今科学发展中起着不可替代的重要作用。高性能计算技术及其应用水平已经成为显示国家综合实力的’个标志。
高性能计算机都是并行处理系统,按照体系结构来分可以分为5类{qt31:
●并行向量处理机(PVP)
PVP系统含有为数不多、功能强大的定制向量处理器(VP),定制的高
带宽纵横交叉开关及高速的数据访问。但是这种系统通常不使用高速缓
存,而是使用大量向量寄存器及指令缓存,使得该系统对程序编制的要
求较高。只有那些充分考虑了向量处理特点的程序才能在该系统上获得
较好的性能。另外,由于价格昂贵、难于管理等原冈,这种类型计算机
的应用主要集中在一些大型国家关键部门。
·对称多处理机(SMP)
SMP系统采用商品化的处理器,这些处理器通过总线或交义开关连接到
共享存储器。像IBMP系列服务器、HPQ的Superdoom、Alpha的ES,GS
系列等都属于SMP结构的机型。
●大规模并行处理机(MPP)
MPP系统是在同一一地点由大量(数百或者数千)处理单元构成的高性能
并行处理系统。从应用程序界面核存储管理的角度看,多机系统可分为
共享存储系统和消息传递系统两类。在共享存储系统中,所有处理机共
享主存储器,处理机之间的通信通过访问共享存储器来实现;在消息传
递系统中,每个处理机都有自己的局部存储器,处理机之间的通信通过
消息传递来进行。MPP的计算机由于价格偏贵、灵活性不好等原因,也
没有得到较好的推,1。。
●一作站集群(Cluster)
cIuster系统将大量同一品种或者不同品种的1.:作站或者PC通过高速网
络互联,以构成廉价的高性能计算系统。这类系统近年来发展势头晟为