高性能计算集群项目采购需求
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高性能计算集群项目采购需求
以下所有指标均为本项目所需设备的最小要求指标,供应商提供的产品应至少大于或等于所提出的指标。系统整体为“交钥匙”工程,厂商需确保应标方案的完备性。
投标商在投标方案中须明确项目总价和设备分项报价。数量大于“1”的同类设备,如刀片计算节点,须明确每节点单价。
硬件集成度本项目是我校校级高算平台的组成部分,供应商提供的硬件及配件要求必须与现有相关硬件设备配套。相关系统集成工作由供应商负责完成。
刀片机箱供应商根据系统结构和刀片节点数量配置,要求电源模块满配,并提供足够的冗余。配置管理模块,支持基于网络的远程管理。配置交换模块,对外提供4个千兆以太网接口,2个外部万兆上行端口,配置相应数量的56Gb InfiniBand接口
刀片计算节点双路通用刀片计算节点60个,单节点配置2个CPU,Intel Xeon E5-2690v4(2.6GHz/14c);不少于8个内存插槽,内存64GB,主频≥2400;硬盘裸容量不小于200GB,提供企业级SAS或SSD 硬盘;每节点配置≥2个千兆以太网接口,1个56Gb InfiniBand 接口;满配冗余电源及风扇。
刀片计算节点(大内存)双路通用刀片计算节点5个,单节点配置2个CPU,Intel Xeon E5-2690v4;不少于8个内存插槽,内存128GB,主频≥2400;硬盘裸容量不小于200GB,提供企业级SAS或SSD硬盘;每节点配置≥2个千兆以太网接口,1个56Gb InfiniBand接口;满配冗余电源及风扇。
GPU节点2个双路机架GPU节点;每个节点2个Intel Xeon E5-2667 v4每节点2块NVIDIA Tesla K80GPU加速卡;采用DDR4 2400MHz ECC内存,每节点内存16GB*8=128GB;每节点SSD 或SAS硬盘≥300GB;每节点配置≥2个千兆以太网接口,1个56Gb/s InfiniBand接口;满配冗余电源及风扇。
数据存储节点机架式服务器2台,单台配置2颗Intel Xeon E5-2600v4系列CPU;配置32GB内存,最大支持192GB;配置300GB 2.5" 10Krpm
SAS 企业级硬盘2块;配置3.5" 7.2Krpm SATA企业级硬盘总容量(裸容量)不少于45TB;配置≥2个千兆以太网接口;配置1个FDR 56Gb主机接口;八通道高性能SAS RAID卡(1GB缓存);1+1冗余服务器电源;须并入现有集群Lustre文件系统,扩展现有文件系统存储容量和读写带宽;供应商须负责在保证现有文件系统数据安全的前提下,完成此项工作;扩容完成后,存储系统整体读写带宽≥7GB/s,以IOZone实测结果为准。
计算网络配套Mellanox InfiniBand 交换机SX6512,18 port FDR Leaf for SX65xx Chassis Switch, ROHS6刀片页板4块。
配置数量足够的Infiniband FDR线缆,QSFP接口,10m,光纤缆。
管理节点2U机架式服务器1台,每台配置≥2颗Intel Xeon E5-2600 v4系列CPU;≥64GB DDR4 ECC 内存,主频≥2133;≥3块300GB 10Krpm SAS热插拔硬盘,支持RAID 0/1;≥2个千兆以太网接口,1个56Gb InfiniBand接口;满配冗余电源及风扇
IPMI交换机24个10/100/1000Base-T以太网端口,4个1000Base-X SFP千兆以太网端口,交换容量为208Gbps(全双工),包转发率51Mpps 支持链路聚合、端口聚合,支持VLAN,可管理,支持2.5G堆叠,支持IPv6+MAC绑定,支持USB备份日志及配置。配备足够数量的6类千兆网线。
管理网络管理网络利用现有交换机。要求刀片机箱管理网络通过2个外部万兆上行端口链接至现有万兆交换机,配置长度及数量足够的10Gb以太网SFP+直连线缆和模块。
机柜、KVM系统及供电系统42U工业标准机柜2个,每个机柜配备专业工业PDU,可选220V/380V供电环境。
提供机柜至配电柜的双路供电电缆、接地线缆及相关辅材,以及与PDU配套的机房PDU专用航空插头,并负责安装施工,须严格遵循机房施工及电工施工相关规范。机柜与配电柜的直线距离约为5米。
提供数量足够并且能够与现有SKVM串行视频切换系统集成的USB节点、终结器等设备及配套线缆。
集群管理软件1.要求集群管理软件支持双机热备方式部署。
2.作业管理模块:支持脚本提交、命令提交、模板提交;支
持查看作业状态及结果;支持停止、删除、启动、查看图形化作业;支持回填、资源预留、公平共享等多种策略,并支持自定义策略。
3.集群管理模块:提供IP管理,Hosts管理,进程管理,服
务管理,远程开机/关机管理。
4.集群系统部署模块:可以同时针对不同的节点分发不同的
系统镜像与定制软件包,系统镜像及定制软件包安装过程中无需手动干预,可指定系统最终IP、主机名,自动适应各节点间的软硬件配置。
5.监控模块:可监控集群实时信息、历史信息、节点性能对
比数据;可生成作业信息面板、资源使用情况面板、报警信息监控面板等。
6.报警模块:提供详细报警信息列表、报警参数设置、报警
阈值设置;支持邮件报警,短信报警,web界面报警。7.文件管理模块:支持文件的上传、下载操作,支持在线复
制、粘贴、删除、打包、重命名、新建、打开等操作。8.记账统计模块:支持记账配置,支持按照CPU、内存、存
储使用情况计费或者自定义计费策略;支持统计报表导出;
支持在线用户缴费和余额管理。
9.物理视图模块:可通过物理视图展示整体视图,监控机柜
中各节点状态;可通过物理视图直接对节点进行远程桌面、远程shell、报警信息、显示节点运行情况、开关机等操作。
10.支持通过Web界面的脚本作业提交。至少提供以下应用软
件的Web界面模板提交:Lammps、VASP、Materials Studios、Gaussian、Fluent、ABAQUS、CP2k、STARCCM、SIESTA。提供以上应用软件的测试算例和作业提交方法的详细说明文档。
11.大屏幕监控模块:适用于大屏幕监控,适用于无人干预的
长期显示,包括集群资源使用情况监控,集群节点状态监控,集群作业信息监控;提供集群概况监控页面,集群节点状态监控页面,集群作业监控页面。
到货及安装服务本项目到货安装地点西安交通大学兴庆校区网络中心一楼数据中心机房。要求系统整体在2016年11月15日前完成系统安装调试。应标方负责集群系统安装调试,集群管理软件、作业调度系统、开发环境等的安装,协助进行应用软件的移植安装,常用计算软件的整合等。验收时应能够达到完整功能使用需求。
售后服务投标产品是当前主流产品,备品备件充足,满足本系统保修期内备件需求并及时响应。产品软硬件五年以上质保。应标方应对平台软件与硬件提供不低于五年的上门服务与技术支持;在此期间提供2小时内上门服务,一般问题应在48小时内解决,重大问题或其它无法迅速解决的问题应在三个工作日内解决或提出明确解决方案。