高性能计算应用21

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

21
高性能计算应用
大规模柴油机动力学抗冲击并行仿真计算
●丁峻宏 王 惠 刘 波
上海超级计算中心 上海 201203 jhding@ssc.net.cn
●宋雅丽 任建军
沪东重机有限公司 上海 200129
摘要:
针对柴油机动力冲击仿真问题,采用显式动力算法,对柴油机复杂结构进行了详细建模和
精细仿真,并对处于不同工作状态下的柴油机开展了机构运动和动力冲击问题的单独和综合模
拟。

为满足计算调试和多组工况带来的大规模计算需求,问题求解借助了高性能计算资源;通
过不同计算平台上多核并行计算和性能数据比较,分析了独特并行加速现象,并探求了合理的
并行加速策略。

计算表明,动态仿真方法有利于柴油机运动和动力问题的一体化研究,而借助
高性能计算资源方能为问题求解和深入研究提供必要保障,文中结论可对柴油机类似复杂冲击
问题研究提供一定参考。

关键词:柴油机,显式算法,机构运动,动力冲击,并行计算
柴油机是目前船舶上使用最广的动力装置,在船只受到不可预测的外部冲击载荷作用下,作为主动力源的柴油机抗冲击性能将直接影响到船舶的续航,因此对其开展研究具有重要意义。

包括柴油机在内的船舶设备结构力学性能相对复杂,研究难度大,此外由于一些应用比较特殊,因而关于其冲击响应特性研究的国外文献资料并不太多。

虽然国内这方面工作起步较晚,但近年来相关研究逐渐涌现,随着计算数学和计算力学的发展,基于仿真计算并结合少量实验的方法对船用设备开展抗冲击研究正不断走向深入。

船舶设备冲击响应计算分析方法包括模态叠加法、直接积分法、冲击因子法、有限元法以及多体动力学方法等[1]。

随着计算机软硬件技术的飞速发展以及对船舶设备研究的深入,结合有限元法和多体动力学法特点的刚柔混合模拟实际运用越来越多并逐渐成为主流。

比如从有限元模型子结构缩减出发,转入多体动力学软件中分析求得力学边界条件,最后恢复有限元精细模型计算动应力[2,3]。

再比如借助有限元软件进行模态分析得到柔性体中性输出文件,转入多体动力学软件计算系统动力学特性[4-6]。

计算过程涉及跨软件操作和中间数据传递,需要由专业研究人员才能完成。

对于柴油机等复杂机械设备来说,无论是有限元法还是多体动力学法,最关键的是对各零部件之间的联接处理,比如运动联接、螺栓联接,焊铆联接等。

多体动力学法多用于模拟分析复杂机械系统运动规律和部件受力环境,但是刚体定义过多必然失真,而定义过多柔体将增加模型和处理过程的复杂性。

有限元法则可以更好地模拟船用设备柔体冲击力学特性,网格细化和细节模拟也将有助于深化研究,但大量零部件机构运动模拟以及计算网格规模扩大对普通计算机的能力提出了挑战。

更重要的是,对于处于运行状态下的柴油机承受冲击问题来说,仿真模型应该要同时考虑系统机构运动和动力冲击两方面特性的影响。

在针对大型复杂柴油机结构开展研究分析时,如若在同一模型中能同时直接模拟这两个问题[7,8],减少中间数据传递,则有利于提高工业企业仿真计算的一体化、便捷性甚至准确性。

本文针对某型号16缸柴油机,利用有限元前处理软件Hypermesh以及ABAQUS,对其所包含大量零部件进行了合理建模和一体化组装,建立了大规模柴油机动力学冲击仿真模型,计算则基于超级计算
注: 原文发表于《振动与冲击》2014年第33卷第2期第163-167页, 此处略有改动.
22
《高性能计算发展与应用》 2014年第一期 总第四十六期
机、显式动力算法和区域分解并行求解方法,研究了冲击载荷作用下柴油机中重要零部件受到的冲击响应和安全性能,并就如何有效使用高性能计算资源来解决此类大规模仿真分析进行了探讨。

1. 原理与方法
显式算法非常适合解决柴油机动态响应求解时所遇到的机构运动大位移以及多零部件瞬态冲击问题,它由前一增量步向前推算动态行为,通过节点逐个求解而不必迭代,通过小时间增量来获得高精度求解。

不仅能有效避免隐式算法求解复杂动力学问题时由于反复迭代造成的收敛困难、以及硬盘空间存储问题,而且此算法具有很好的并行加速比,有助于利用硬件环境的改善来提高所求解问题的计算规模和复杂程度。

1.1 显式算法基本方程
三维有限元体系的运动方程可表达为:
(1)
其中,


分别为体系节点的加速
度、速度和位移矢量,[M]为总体质量矩阵,[K]为总体刚度矩阵,[C]为总体阻尼矩阵,{P}为总体载荷矢量。

显式算法基于tn时刻及之前的信息来求解tn+1时刻的位移
n+1
,结合位移Taylor表达式和中心差分法,
可分别得到速度和加速度的表达式为:
(2)
(3)
将公式(2)和(3)代入tn时刻的公式(1),可以得到下一时刻
n+1
的求解表达式:
(4)
在整个时域范围内,可由上述积分递推公式求得各个离散时间点处的位移、速度和加速度。

1.2 多CPU/核并行求解
ABAQUS显式并行算法可分为Domain和Loop两种不同方式,通常来说基于MPI的Domain并行求解方式效率更高。

如图1所示,采用并行处理模式进行大规模问题求解时,采用METIS区域分解方法(Domain Decomposition Method,简称DDM)来处理分析对象,即把整个模拟问题区域划分成很多相对小的求解子区域, 把每个子区域分配给不同的处理器核心分别进行求解,区域分解允许每个处理器核心独立于其他
处理单元来求解自己的那部分问题,而处理器及其核心相互之间通过交互机制进行数据交换,最后将每个子区域的解综合起来,得到整个模型区域的全局解。

图1 并行求解的模型分区和CPU布局
2. 应用实例
2.1 柴油机装配体有限元建模
真实的柴油机及其附属结构非常复杂,包含上千个零部件,需要进行合理和必要的建模和简化,本文主要针对柴油机内部运动件和主要固定件开展分析。

借助前处理软件,首先建立了包括曲轴、平衡块、连杆、活塞和机架等零部件在内的柴油机全三维详细有限元模型,在对柴油机各零部件进行网格划分时,需要对几何模型进行必要的结构特征简化,如局部过小倒角等。

但是重要零部件如整体式曲轴保留了内部油孔油道等细部特征,以及曲柄臂与连杆轴(曲柄销)和主轴颈交接处的过渡圆角。

然而,各零件非重要几何特征细节的保留不便于六面体单元的划分,因此本文通过局部网格加密(如曲轴油孔油道和轴颈过渡区域)、增加四面体单元数量(如仅曲轴就划分了28万单元)并保证整体网格质量(如严格执行翘曲度、长宽比和扭曲度等检查)等手段以求进一步提高模型计算精度。

柴油机的零部件基本上可以分为固定件和运动件两大类,在本文模型中,机架、主轴承座和气缸套等为固定件,而曲轴组件、连杆组件和飞轮等为运动件,需要通过多种连接单元和仿真手段模拟了各零部件之间的机构连接关系和装配关系。

对于本文所建柴油机计算模型而言,考虑到的零部件之间的主要装配关系包括:1)曲轴和连杆之间、曲轴与主轴承座(主轴瓦)、连杆和活塞之间均定义为圆柱副;2)曲轴与飞轮及齿轮之间定义为固定副;3)活塞和气缸套之间定义为平动副;4)气缸套与机架之
23
高性能计算应用
间、机架与主轴承座均设有绑定约束。

包括四面体和六面体在内的整个柴油机网格模型单元总数超过216万,节点总数近66万。

图2显示
的是隐蔽部分机架网格后的柴油机整体计算模型。

图2 柴油机整体有限元模型
2.2 相关边界、载荷、参数和工况设定
柴油机工作时,曲柄连杆机构主要外力为最高燃烧压力和惯性力,并对外输出扭矩。

本项目中针对柴油机整体计算模型力学边界条件,以及各种载荷和参数因素的设定,主要考虑了以下几个方面:
(1)选取机架底部对于螺栓连接的部分区域的节点集合,在其上施加固定边界;同时,沿冲击方向,施加如图3所示的历时50ms峰值为39g的短程加速度冲击曲线。

(2)在柴油机运行状态下,针对曲轴等运动部件施加工作转速110rad/s;将计算得到的输出扭矩作为阻力矩施加在曲轴输出端,以使曲轴在整体计算中保持转速平稳。

(3)柴油机一个完整发火周期为0.114s。

根据不同气缸发火顺序和发火时间间隔,在活塞盖的顶端施加各自对应的压力时程曲线(见图4)。

(4)曲轴连杆等运动件采用42CrMoA,屈服强度930MPa;机架采用铸铁,屈服强度为250MPa。

(5) 当柴油机静止受冲击时,直接施加冲击加速度时程曲线,计算历时50ms;当柴油机正常运行受冲击时,设计工况使得冲击波第一个加速度峰值恰
好与A4缸发火瞬间重合,总计算时间历时75ms。

图3 冲击加速度时程曲线
图4 气缸内燃烧压力时程曲线
3. 计算和分析
3.1 柴油机抗冲击性能评估
针对此计算模型进行了大量冲击模拟,限于篇幅,本文在此仅以柴油机受垂向冲击为例,介绍重要零部件处于停机和运行两种不同状态下的结构响应分析。

为作相互比较,也另外进行了运行但不受冲击时的柴油机机构运动仿真。

根据相关行业规范,要求设备上由冲击载荷引起的应力不得超过静态屈服极限。

对此,可首先得到各重要零部件各时刻的应力云图,再遍历寻求零部件在受冲击时间历程中最大应力数值,见表1。

通过进一步分析比较发现:
(1)柴油机静止受垂向冲击时,曲轴紧邻飞轮的1#连杆轴颈上将产生最大78MPa的等效应力,机架底部固支表面靠飞轮端边缘也有超过80MPa的数值出现;主轴承座和活塞上有近70MPa的冲击应力产生,而连杆和活塞销上产生的冲击应力相对较小。

(2)柴油机运行但不受冲击时,曲轴上最低应力数值也在100MPa以上,最高近300MPa;各连杆上最大应力分布在250 ̄330MPa之间,A4连杆上有超过300MPa的数值(见图5);各活塞和活塞销最大应力分布在100 ̄200MPa之间。

固定件如主轴承座最大值出现在紧邻飞轮端的1#主轴承座上。

表1 垂向冲击时不同工况下零部件最大应力对比
计算工况部件名称
静止受冲击(MPa)运行无冲击(MPa)运行受冲击(MPa)曲轴78.23294.6322.6连杆44.28323.1378.3活塞销29.93202.4222.1活塞67.30165.0198.2 主轴承座66.54166.6180.3机架
81.79
80.19
97.60
(3)柴油机运行受垂向冲击时,各零部件最大应
力数值均有数十MPa的增加,曲轴应力极值出现位置(见图6)和“运行无冲击”工况相比没有变化,但
24
《高性能计算发展与应用》 2014年第一期 总第四十六期
是连杆和活塞等则出现在不同位置和不同时刻。

主轴承座和机架上最大应力出现位置基本没有变化,
应力增幅也不大。

图5 连杆上最大等效应力出现时刻云图
图6 曲轴上最大等效应力出现时刻云图
(4)各零部件受冲击后产生的最大冲击应力数值均小于各自屈服极限,柴油机总体上能够承受峰值峰值为39g的加速度垂向冲击。

采用42CrMoA材料的曲轴连杆等运动件安全裕度比较大,但是针对采用铸铁材料的机架开展进一步研究发现,如果考虑气缸内燃烧压力沿气缸盖内侧和连接螺栓传递到机架的影响,那么需要注意机架螺栓孔中连接区域的局部应力。

(5)综合比较发现,“柴油机运行受冲击”工况并非“静止受冲击”和“运行无冲击”两工况的简单叠加,系统冲击响应具有非线性特性。

以曲轴为例(见图7),当柴油机静止时,曲轴最大应力出现在冲击加速度到达第一个峰值时刻附近,而当柴油机运行时,不仅最大应力出现位置改变,而且应力变化趋势也主要受机构运动特性影响,即便受冲击
应力增幅也不太大。

(1) 静止状态
(2) 运行状态
图7 不同状态下曲轴最大等效应力时变曲线
3.2 高性能计算平台并行求解
本文建立的柴油机抗冲击计算模型规模大,历时较长,如果使用普通工作站(1 ̄4个CPU核心;内
存8 ̄16GB),计算一个工况至少需要5 ̄10天,且需预留硬盘空间50GB以上。

如果计算工况多,则对计算时间和计算效率提出了更高要求,必须要借助高性能计算资源。

上海超级计算中心目前有两套计算平台,一是运行四年多的“魔方”超级计算机,其中用于工程计算的A区由82个计算节点构成,每个节点含八个AMD四核处理器(主频1.9 GHz,共享128GB内存);二是今年新建“蜂鸟”集群,该集群包括65台HS23刀片计算节点,每个节点含两个Intel八核Intel处理器(主频2.6GHz, 共享64G内存)。

针对柴油机抗冲击计算模型的单个计算工况,在这两个高性能计算平台上分别进行了多核并行计算测试和性能比较,数据汇列于表2和表3中,并据此得到了以下一些认识:
(1)在使用“魔方”计算机进行求解时,随着CPU计算核心数的增加,单个工况所需计算时间迅速降低,在使用64核时,可能将单工况求解时间压缩至近一个工作日。

8核以内多核并行求解时,出现超线性加速比现象;16核以上多核并行计算时,并行效率才回落到100%以下,并随着计算核心数的比例增加呈明显下降趋势。

对此进行分析认为:1)由于本文建立的柴油机冲击计算模型规模较大,在使用单核计算时,高速缓存(Cache)存入数据量小,因此需要更多调用内存,运行时间因而变长;2)随着核数增加,每个进程分发问题规模随之变小,高速缓存可容纳必要处理数据相对增加,Cache命中率提高,因此总体运行性能大幅提高。

整体上高速缓存效应优势大于通信
25
高性能计算应用
开销导致的性能损失,从而造成超线性加速现象;
3)针对本文问题,使用16核以上甚至更多核数时,
由于进程间开销增加以及负载均衡性降低的影响逐
渐加大,因此才会出现加速比性能和并行效率数值
回落至正常数据水平,并使并行效率逐渐降低。

(2)在使用“蜂鸟”计算机进行计算时,随着
CPU计算核心数的增加,单个工况所需计算时间也
随之不断降低,在使用16核时,就可以将单工况求
解时间迅速降低至一个工作日,与“魔方”相比计
算性能优势比较明显。

随着计算核心数的进一步增
加,加速比和计算效率呈有规律的正常下降趋势,
无超线性加速现象出现。

对此进行分析认为:1)由于蜂鸟CPU性能比魔
方CPU不仅体现在主频的提高,缓存尤其是三级缓
存更增加了十倍,单核数据处理能力相对有了很大
提升,因此没有出现超线性加速现象;2)区域分解
属于粗粒度算法,意味着计算开销要远大于通信开
销,但当计算核数增加到一定数目使得通信开销影
响加剧时也必须予以重视;3)虽然这两台不同计算
集群的计算节点之间均采用InfiniBand网高速互联,
但数据表明“蜂鸟”跨节点计算时能够相对有更佳
表现,数十核求解问题时仍可使并行效率保持在高
位。

表2 魔方计算机上的单工况并行计算性能比较
性能比较计算核数计算时间
(h)
加速比
并行效率
(%)
113791.001002578.42.381194327.84.211058158.38.201021686.7315.999.93246.3829.792.96427.3150.579.0
表3 蜂鸟计算机上的单工况并行计算性能比较
性能比较
计算核数
计算时间
(h)
加速比
并行效率
(%)
1401.81.00100
2200.91.9999.5
4101.93.9498.5
851.737.7797.1
1626.5115.294.6
3213.7929.191.0
647.56753.183.04. 结论
本文详细阐述了在高性能计算平台基础上,如何将显式有限元算法、并行计算以及加速策略有效结合起来,对大型柴油机结构动力冲击问题进行数值仿真,给出了具体实现方法和结果分析,并有以下认识:
(1)以高性能计算资源为支撑,可全力对柴油机动力冲击问题进行细致建模和有限元模拟、同时能真实再现柴油机处于不同工作状态下时机构运动和动力冲击问题的一体化分析,并将此大规模复杂计算仿真模型的问题求解和深入研究付诸实现。

(2)基于区域分解法的并行策略和集群架构高性能计算机,显式算法计算量开销大于通讯量,非常适合柴油机等设备大规模冲击问题的求解。

数据表明,对本文百万级计算模型而言,64核时加速比和并行效率依然不低,仍表现出较好的可扩展性。

(3)不同体系结构超级计算机的并行计算性能差别较大,工业用户进行同类问题仿真时,可据此进行合理的资源搭建或配置。

此外,在进行超线性加速和并行性能数据差异比较时,要和不同CPU具体性能参数以及网络连接技术参数结合起来分析。

参考文献
[1] 贺少华,吴新跃. 舰艇机械设备冲击响应仿真建模计算方法综述[J]. 船舶科学技术, 2011, 33(1): 14-33.
[2] Poloni C, Geremia P, Clarich A. Multi-objective robust design optimization of an engine crankshaft[C]. III European Conference on Computational Mechanics: Solids, Structures and Coupled Problems in Engineering, Lisbon, June 5-8, 2006.
[3] 陈亮, 宋希庚, 明章杰等. 基于有限元和多体动力学的柴油机曲轴动态强度与冲击响应分析[J]. 振动与冲击, 2008, 27(11): 186-189.
[4] Yilmaz Y, Anlas G. An investigation of the effect of counterweight configuration on main bearing load and crankshaft bending stress [J]. Advances in Engineering Software, 2009, 40: 95-104.
[5] 郭磊, 郝志勇, 林琼. 柴油机曲轴与气缸体系统动力学仿真研究[J].浙江大学学报(工学版),2007,41(5): 780-784.
[6] 吴问鲍. 柴油机抗冲击性能分析[J]. 船海工程, 2010, 39(1): 63-65.
[7] 汪玉, 赵建华, 杜俭业等. 基于多体动力学有限元计算的一种舰用柴油机抗冲击性能仿真[J]. 振动与冲击, 2009, 28(11): 87-90.
[8] 王承禹, 常汉宝, 郑仁伯等. 基于DYTRAN的发动机曲轴系冲击动力学问题[J]. 内燃机工程,2009,30(4): 87-92.。

相关文档
最新文档