高性能并行计算平台及并行计算环境概述

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

IWHR 高性能并行计算平台硬件体系结构
Hale Waihona Puke Baidu
Sun Fire 6800 技术指标
• 硬件完全冗余,可以从任何硬件故障中恢 复。 • 最多24个CPU,最大192GB内存,32PCI 或者16cPCI插槽。 • 每台Sun Fire 6800机器最多分为4个域,每 个域相当于一台独立的服务器。 • 具有很好的线性扩充能力,24个CPU运行 时的Linpack值是1个CPU运行时的23.3倍。
四、结语
我院高性能并行技术的应用处于初步 探索阶段,经过这半年多来的努力,现在 已经取得了一定的成果。希望能够继续和 院内各研究所合作,共同努力,把我院高 性能计算这一块迅速发展起来,为我院的 知识创新搭建一个高起点的平台,更好的 为院内以及整个水利水电行业的科研项目 服务。
集成方法
IWHR 高性能并行计算平台软件体系结构
三、高性能并行计算实践
课题一
• 在结构材料所使用服务器计算的工程 项目“小湾坝踵应力诱导峰分析”中,服 务器发挥了内存、硬盘空间大,计算稳定 的特点,为该工程项目的计算提供了有力 的支持。
课题二
• 在抗震中心的有关“混凝土三维细观力 学模型的研究”中,信息网络中心联系太 极公司、国防科大等单位对原有串行程序 进行并行化改造,在我院高性能服务器上 试运行后,效果比较明显。经介绍,原来 的串行程序运行需要7、8天左右时间经改 造后只需3~4个小时。
软件平台建设
• 操作系统 • 开发环境
– 编译器 – 数学函数库
• 高性能并行计算软件
– 作业管理接口 – 并行程序运行环境 – 并行数学函数库 – 并行程序调试分析工具
• 资源管理系统
IWHR 高性能并行计算平台软件体系结构
操作系统:Solaris 9
• • • • • 64位的Unix操作系统 具有杰出的稳定性和可维护性 单一服务器上最多可支持106个CPU 支持多线程,最多100万个进程。 支持多种应用软件,如 Sun Cluster软件、 Sun 管理中心软件、Sun Studio 编译环境 Sun Grid Engine等等。
并行程序调试分析工具 Prism和MPProf
• Prism是一个图形编程环境,使用户能够对 并行程序进行调试和性能监控。 • MPProf是一个用来查看Sun MPI程序的分 析工具。运行它可以获得程序的一些时间 信息:
– 在所有进程里MPI函数库调用所花费的时间占 程序运行时间的百分比; – 每个进程在MPI函数库调用上花费的时间百分 比; – MPI 函数库调用的次数、程序花费的时间;
我院Sun Fire 6800现有配置
• CPU 数量
– 4 * 1200Mhz
• 内存容量
– 8 GB (16 X 512MB DIMMs)
• I/O板
– 4个,PCI扩展槽共32个
• Sun Storage 3510 SCSI 磁盘阵列
– 可提供539GB 的存储空间
现 状
目前,本院的高性能并行计算平台建设 处于初步试验阶段,待并行计算技术在我 院应用成熟以后,可以很方便的对该平台 进行硬件升级,以获得更高的性能和计算 能力。
高性能并行计算软件
Sun HPC ClusterTools 5.0
• 作业管理接口
– Sun ClusterTools Runtime Environment(CRE)
• 并行计算运行环境
– Sun MPI and MPI I/O
• 并行数学函数库
– Sun S3L( Scalable Scientific Subroutine Library)
• 并行程序调试分析工具
– Sun Prism – Sun MPProf
作业管理接口:Sun CRE
• • • • 执行程序(mprun) 杀死程序(mpkill) 显示作业信息 显示节点信息
并行计算运行环境
Sun MPI and MPI I/O
• Sun MPI 是一个高度优化的MPI版本。它 支持MPI1.2 标准和 MPI2.0 标准。 • 支持多线程编程。 • 与Sun CRE 集成。 • 完全支持Fortran77、C和C++ ,支持一些 基本的Fortran90 语法。 • 通过共享内存通信会获得更好的性能。
• 模型2:全级配试件静动态弯拉强度三维细观力学分析
– 剖分后的单元有骨料单元、融入小骨料后的固化水泥砂浆单 元和两者之间的界面单元,共有24257个节点,113920个单 元。
– 计算时间:在以上配置相同的PC机上,三维静力计算耗时 209小时50分钟,约9天时间;动力计算耗时291小时57分钟, 约12天时间。
国内发展动态
– 中国的第一名,中国气象局的高性能计算机, Linpack值为每秒10.3万亿次。 – 曙光系列、神威系列、银河系列、深腾系列 – 中科院计算所、曙光公司和上海超级计算中心三 方共同研制的曙光4000A,Linpack测试值为每秒 8.061万亿次。 – 联想公司为中科院网络信息中心生产的深腾6800, 共有1060颗1.3Ghz的安腾2处理器,Linpack测试 值为每秒4.183万亿次。
资源管理系统(Resource Management)
• Sun HPC ClusterTools 5 software可以和下 面三种分布式资源管理系统集成,用来管 理资源的分配、并行作业的控制和监视, 以及作业信息的统计。
– Sun Grid Engine:Codine 5.2 – Load Sharing Facility: LSF 4.x – Portable Batch System: PBS 2.3.15 and PBS Pro 5.0
并行数学函数库:Sun S3L
• 它是建立在Sun MPI之上的,给用户提供了 一系列广泛应用的并行函数库。如LU分解、 最小二乘法运算、矩阵转置等等。 • 支持Fortran77、Fortran90、C和C++ • Sun S3L 子程序调用Sun Performance Library 来在节点上进行运算。
Sun Fire Link Interconnect
• Sun Fire Link 为一套高带宽、低延迟的互 联系统,可以扩展Sun Fire6800 系统的可 用性。 • 一个Sun Fire Link系统最多可以由8个Sun Fire 6800服务器节点组成,每个节点由 Sun Fire Link光纤网络连接在一起, • 一整套软件支持。Sun Management Center可以为Sun Fire Link 网络资源的配 置、监视与管理提供最佳可用性。
国际发展动态
– 2005年6月22日公布的全球高性能计算机 top500,第一名是IBM的Blue Gene/L, Linpack测试值为每秒136.8万亿次,第二名 是IBM的Blue Gene/W,Linpack测试值为 每秒91万亿次。 – 日本第一的高性能计算机,Earth Simulator (地球模拟器),Linpack测试值为35.6万 亿次。
高性能并行计算平台及并行 计算环境概述
中国水利水电科学研究院 信息网络中心 2005年8月11日
内容提要
1、前言
2、高性能并行计算平台建设 3、水利水电高性能计算实践 4、结语
1、前言
什么是高性能并行计算?
– 科学家和工程师可以用它来解决一些程序 规模庞大、运算时间长以及数据量大的科 研课题。 – 并行计算是提高服务器计算速度和处理能 力的一种有效手段。 – 计算机按照编好的程序对计算问题进行分 解,并把分解的任务块通过一定的方式交 给不同的处理器去求解。
编译器
对于科研课题的计算程序而言,编译器 的优劣对生成的程序的执行效率有着非常 明显的影响,现在在Unix下的免费编译器 软件主要是GNU计划提供的GCC,该编译 器可以编译C、C++、F77 等语言编写的程 序。Sun Fire 6800 服务器配套的编译器是 Sun 公司开发的商业编译软件-Sun Studio 9,该编译器在Solaris上编译运行的效率比 GNU的免费软件要高30%~40%。
开发环境:Sun Studio 9
• 主要组件包含如下:
– C Compiler – C++ Compiler – Fortran Compiler – Sun Performance Library – Distributed make utility, dmake – dbx Command-Line Debugger – Performance Analysis Tools – Integrated Development Environment (IDE)
院内需求分析
随着工程规模的逐渐扩大、复杂问题求 解分析的日益深入,其科学计算的“瓶颈” 日趋严重,即使对模型和算法进行简化, 一次计算仍需要几个小时、几天甚至数十 天的时间,这一现状严重制约了我院水利 水电学科的发展,许多工程师、教授提出 的理论和设想都因为计算能力受到限制而 无法实施。
课题1:小湾坝踵应力诱导缝研究
问 题
• 要实现三维细观力学数值计算,计算速度 这一难题必须克服,通常,针对一个模型 研究人员需要反复调整参数进行数值计算, 一个算例耗时数天甚至数周简直无法忍受。
上述种种计算和数据的处理对计算环境提 出了新的要求,如果以传统的个人PC机作 为计算平台,计算的时间和效率远远满足 不了科研的需求,甚至会由于内存、CPU 等硬件的限制而无法进行计算。因此我院 急需建设一个高性能并行计算平台,更好 的为科研项目服务。
二、高性能并行计算平台建设
硬件平台建设
• 初步构想
– 采用Sun公司提供的Sun Fire Supercluster解决 方案。 – 2~4台高性能的Sun Fire 6800服务器作为集群 节点。 – 每台服务器达到满配置,即24个1.2Ghz UltraSPARCIII CPU,192GB内存。 – 节点之间采用Sun Fire Link Interconnect 技术 通过光纤互联。
– 小湾拱坝坝底缝计算采用网格有20万个单 元,总共24万多个节点。 – 单机上运行模拟计算程序时,一个计算步 需要将近4~5个小时,一个工况一般有 30~40个计算步,总共有几十种工况。
课题2:混凝土三维细观力学模型的研究
• 模型1:湿筛试件静动态弯拉强度细观力学分析
– 研究中对试件进行划分,用4面体单元将细网格6面体 单元过渡到两边粗网格6面体单元,共有24257节点, 29952个单元,其中骨料2160个单元,固化水泥砂浆 体3805单元,粘结界面14515单元以及宏观均匀混凝 土9472个单元。 – 以上三维计算是在内存1G,CPU为2.8G的PC机上进 行的。静力计算耗时163小时39分,约7天时间;动力 计算耗时196小时25分钟,约8天时间。
数学函数库:Sun Performance Library
• 它是Sun公司基于以下标准的线性代数库而 生成的,具有相同的函数名和接口,但是 在Sun的服务器上运行得更快更精确。
– LAPACK :用来解决线性代数问题 – BLAS1:用来解决向量-向量运算问题 – BLAS2:用来解决矩阵-向量运算问题 – BLAS3:用来解决矩阵-矩阵运算问题 – FFTPACK和VFFTPACK:快速傅立叶转换
相关文档
最新文档