相场模拟的并行计算方法
基于MPI的三维枝晶生长相场法的并行计算
![基于MPI的三维枝晶生长相场法的并行计算](https://img.taocdn.com/s3/m/dd07d7df09a1284ac850ad02de80d4d8d15a01b9.png)
基于MPI的三维枝晶生长相场法的并行计算朱昶胜;车超;冯力;肖荣振【摘要】充分利用MPI(message passing interface)在并行环境下远高于单CPU 的强大计算能力,探索基于MPI的并行系统结构,求解三维枝晶生长的高性能计算方法.通过多进程的并发执行,实现三维相场方程求解的并行计算,探讨MPI中点对点通信与集合通信在并行计算时数据传输的效率,讨论热噪声幅值Fu=0与Fu=10-3时三维枝晶生长过程.计算结果表明:基于MPI的并行算法可使模拟尺度达到1 000×1 000×1 000网格,大大提高可模拟尺度;采用集合通信模式比点对点通信模式具有更高的并行效率,更加适合大规模并行计算环境.【期刊名称】《兰州理工大学学报》【年(卷),期】2015(041)005【总页数】6页(P5-10)【关键词】枝晶生长;相场法;MPI;并行计算【作者】朱昶胜;车超;冯力;肖荣振【作者单位】兰州理工大学计算机与通信学院,甘肃兰州730050;兰州理工大学省部共建有色金属先进加工与再利用国家重点实验室,甘肃兰州730050;兰州理工大学计算机与通信学院,甘肃兰州730050;兰州理工大学省部共建有色金属先进加工与再利用国家重点实验室,甘肃兰州730050;兰州理工大学省部共建有色金属先进加工与再利用国家重点实验室,甘肃兰州730050【正文语种】中文【中图分类】TG244Key words: dendritic growth; phase-field method; MPI; parallel computing 随着计算材料科学的发展,通过数值模拟方法真实再现铸件凝固过程,揭示铸件内部各种组织花样的形成机制及演化历程,已逐渐成为研究凝固过程的一种重要手段.相场法作为目前最有效的微观组织数值模拟方法,已在凝固微观组织演化研究中体现出越来越重要的作用.此外,相场法通过相场与温度场、溶质场、重力场、磁场及其他外部场的耦合,可有效地将微观与宏观尺度结合起来,能够对金属凝固过程进行真实的模拟,成为模拟材料微观组织的热点[1-4].随着相场法在凝固微观组织模拟中的应用越来越深入,所建立的相场模型也越来越复杂,相应地,相场模型的数值求解方法也应不断优化改进,以降低模拟软件对计算机硬件的要求,从而使模拟研究与实际生产相结合.相场模型的数值求解方法通常采用有限差分法[5-6],其程序结构简单,采用这种方法的模拟结果都基本与枝晶生长理论吻合良好,取得了预期结果.但是由于其求解相场方程计算量巨大,所以寻求高性能加速算法非常必要.采用基于MPI的并行编程算法求解三维相场模型[7-8],在大幅减少计算时间、提高计算效率的同时,以三维枝晶相场模拟为应用背景,进行相应的并行设计方法及其性能效率的比较研究,重点论述点对点通信和集合通信实现的不同,并通过实际测试结果分析二者的性能差异,旨在展现并行设计的一般思路,扩大求解规模、缩短运行时间、提高效率.Karma和Rappel等对在相场模型中耦合热噪声进行了研究[9].在他们的模型中,非能量守恒扰动(nonconserved noise)和能量守恒扰动(conserved noise)分别以下面的形式加入到相场方程和温度场控制方程中:其中,无量纲温度,D为热扩散系数,λ为耦合常数,τ和W都是界面法向矢量n的函数:式中:ε4为各向异性强度,T为热力学温度,TM为熔点,L为结晶潜热,Cp为等压热熔.θ和q分别表示热噪声矢量,热噪声幅值通过热噪声矢量按照公式求得,各自遵循下述高斯分布:其中,δ为 delta函数,δmn为〈θm(r,t)θn(r′,t)〉在m、n不同情况下的取值,将其中的一些变量按下述形式无量纲化:,热噪声矢量将变成:其中,Fu是热噪声幅值,可以写成以下形式:式中:kB为Boltzmann常数,W0为界面厚度,λ为温度在相场中的耦合系数,J取16/15.MPI(message passing interface),即消息传递接口标准,用于开发基于消息传递的并行程序,具有可移植性、灵活性、可靠性等优点.三维模型采用有限差分方法离散[10],设计方法是将整个计算域划分为多个子域,把各子域上的迭代计算任务分配给相应的节点执行.并行设计过程中需要考虑的问题有计算域划分、计算域通信等. 下面结合实现三维枝晶生长的迭代法并行求解过程,探讨基于MPI的三维枝晶生长并行处理机制提高相场的计算效率.分析三维枝晶生长相场的串行算法,程序的主要数据结构是一个用来保存相场和温度场值的三维数组,可以看作是由多个二维数组组成,三维的计算区域,如图1a所示.MPI并行计算需要将计算区域划分为多个子区域,如图1b,每个子区域分配给MPI节点,并在时间步内临近的网格进行相场值与温度场值的数据交换,最后在该时间步内进行各个节点的数据同步,其数据会根据任务规模和处理器数量分布在集群的各个处理器上,每一个时间步、每个点的相场和温度场的值都会在一次迭代计算后重新被更新.考虑到各处理器的高利用率与处理器间通信最小化之间的平衡,在划分子域时尽可能使每个子域包含的网格算点数相等,保证进程间的负载平衡.对于一个大小为X×Y×Z的均匀模拟网格,使用P个处理器进行并行计算,选择X轴方向的数据是分布式的,在并行时每个处理器会被分配(X/P)×Y×Z的数组,而每个处理器为了保存相邻节点发送的数据,把每个处理器的数组大小设置为(X/P+2)×Y×Z.三维枝晶模拟生长的迭代过程需要反复通信,为使最小化通信时间,减少通信次数,使用点对点通信和集合通信对并行程序进行计算.同时,采用重复非阻塞通信对反复执行的通信进行优化,实现通信与计算重叠,以降低不必要的通信开销.每个处理器保存相邻节点发送数据的区域,每经过一次迭代计算,每个节点都需要对各自内部的计算区域进行边界重新赋值,然后才能进行下一次迭代计算,而每个节点间传输的数据大小为Y×Z.当节点内部数据被更新时,每个节点需要等待接收边界数据,同时也需要发送自己的边界数据给相邻节点,这些发送数据、接收数据的时间就是通信开销[11],接收完边界数据后,更新节点内的数据,这样就完成了一次迭代计算.MPI最基本的通信模式是在一对进程之间进行的消息收发操作:一个进程发送消息,另一个进程接收消息.这种通信方式称为点对点通信(point to point communications).MPI提供2大类型的点对点通信函数.第一种类型称为阻塞型(blocking),第二种类型称为非阻塞型(non blocking).阻塞型函数需要等待指定操作的实际完成,或至少所涉及的数据已被MPI 系统安全地备份后才返回.如MPI_Send 和MPI_Recv都是阻塞型的.由于三维枝晶在计算过程中,需要多次的迭代计算,考虑负载平衡的问题,在并行计算过程中,每个节点之间在经过迭代计算后,使用阻塞型函数来完成各节点间数据的交换,它的完成可能需要与其他进程进行通信[12].集合通信与点对点通信在多个方面是不同的:在通信中的所有进程都必须调用相同的集合通信函数.每个进程传递给MPI集合通信函数的参数必须是“相容的”.点对点通信函数是通过标签和通信子来匹配的.集合通信函数不使用标签,只通过通信子和调用的顺序来进行匹配.图2为在三维枝晶生长的并行计算中采用点对点通信与集合通信的模型示意图.在进程间的通信阶段都采用点对点通信,在输出相场、温度场阶段之前,各节点需要将自己的计算数据发送给主节点,并由主节点进行相场温度数值的输出,在发送数据时分别采用点对点通信与集合通信对计算数据进行传输,并统计各自的计算时间,比较二者在大规模并行计算任务时进行数据传输的效率.采用高纯丁二腈(SCN)为研究对象,材料物性参数为:Tm=331.1 K,cp/= 2.00J/(kg·K),L=46.250 J/kg,ρ=1.020 kg/m3.相场参数为:d0/w0=0.139,Δ=0.55,ε=0.05,D=4,τ0=1.00,λ=6.3.假设区域内充满SCN过冷熔体,半径为r0的初始球形晶核置于区域中心:式中:x,y,z为直角坐标系代表的坐标轴,分别对应于[100]、[010]、[001]枝晶生长方向.在计算区域的边界上,相场和温度场均采用Zero-Neumann边界条件[13-15].为了获得可靠而稳定的计算结果,取空间步长Δx=Δy=Δz=0.08,Δx≤W0,时间步长为Δt,取值要满足稳定性条件Δt<Δx2/6D,Δt=0.060.采用枝晶生长的八分之一区域为计算和后处理区域.实验环境如下:刀片计算系统共有20台曙光CB65-G双路刀片,CPU整体峰值性能达到5.888万亿次/秒.每台刀片计算节点配置2颗AMD Opteron 6272 2.3 GHz十六核处理器,32 G DDR3内存.相场模型的界面厚度约束限制了其模拟尺度,使得相场和温度场在串行机上的计算变得非常困难.而且为了缩短计算时间,三维枝晶生长的模拟常采用高于常规铸造工艺条件下的大过冷度,且主要针对纯物质或对二元合金中的单枝晶和多枝晶的形貌进行定性模拟.限于硬件条件,目前在单CPU上的计算规模为500×500×500,而这也导致枝晶没有足够的生长空间,很难较好地考虑非受限生长的情况.在集群环境下利用MPI并行方式,对三维枝晶的模拟生长进行模拟计算.图3为网格数为1 000×1 000×1 000,t=25 000Δt,热噪声幅值Fu=10-3时,利用5个节点进行并行计算得出的相场与温度场图形,在对计算区域进行计算任务分配时,每个节点的计算规模为200×1 000×1 000,成功实现了较大尺度三维枝晶的定量模拟,解决了传统相场法求解方法计算效率低、内存需求容量大、计算规模小等问题,提高了模拟计算能力.同时可以看出,由于引入噪声,三维枝晶具有发达的二次晶臂.另外,在一次枝晶臂根部有明显的颈缩现象,还可观察到侧向分支根部的断裂和部分二次枝晶的合并现象.同时还可看出,温度的分布情况与枝晶生长吻合,在固相区域因凝固潜热的释放,从而使温度比液相中要高,并且在固液界面处的温度比中心要高,而且在二次枝晶生长比较快的固液界面温度最高,在枝晶尖端由于界面移动速率大,释放的潜热多,热量来不及扩散,因此温度梯度最大,在枝晶根部由于界面移动速率小,因此温度梯度最小.实验中,将计算规模设为N×N×N的均匀网格,对三维枝晶生长实现并行处理,分别用点对点通信与集合通信对数据进行传输,并将计算所需的时间进行比较.当相场的计算规模较小,网格规模为300×300×300时,点对点通信与集合通信的时间统计如图4所示.通过比较可以看出,在实验集群环境下,点对点通信与集合通信的2种并行计算时间相差不是很明显.考虑可能是因为实验计算规模较小,整体的计算时间相对较短.为了更进一步了解点对点通信与集合通信2种并行计算的效率问题,扩大计算规模,当网格数为1 000×1 000×1 000时,2种计算方式的时间统计如图5所示.通过图5可以看出,在大规模计算任务时,集合通信较点对点通信表现出了更高的通信效率,点对点通信在计算过程中需要考虑预防死锁、阻塞与非阻塞、同步与异步,以及各节点间的执行顺序问题,因此在数据传输过程中花费了许多通信开销.随着处理器个数的增加,计算所需时间随之减少,但当处理器的个数增加到10个以后,计算时间减少得并不明显,这主要是因为在任务规模不变时,随图5 网格数为1 000×1 000×1 000时,2种方式的计算时间着处理器个数增加,各处理器之间的通信开销变大,从而影响了整个程序的运行时间,当处理器大于14个时,计算时间逐步趋于稳定.通过实验得出在三维枝晶生长模拟的并行计算中,集合通信比点对点通信更具计算效率,点对点通信与集合通信有各自的传输信息特点.通过对2种通信方式测试,目的在于更明确地了解二者在三维枝晶模拟生长中的优劣性,以便于在并行计算中更有针对性地利用MPI不同的通信方式来解决大量数据的计算问题.采用基于MPI的编程模型,力求提高计算效率的同时,使计算结果能体现较大区域下的非受限生长.图6中为没有加入热噪声时t分别为15 000Δt、20 000Δt、25 000Δt、30 000Δt的三维相场枝晶生长形貌图,可以看出,没有加入热噪声时,整个三维枝晶的界面生长平滑,并不接近现实中的枝晶生长形貌.为了使枝晶的生长形貌更具真实效果,加入热噪声幅值Fu=10-3,程序的计算结果如图7所示,图中为加入热噪声时t分别为15 000Δt、20 000Δt、25 000Δt、30 000Δt的三维相场枝晶生长形貌,从图可以看出,在界面前沿形成持续扰动,并在距尖端几个波长的后方出现侧枝,实现了模拟三维枝晶生长的目的.1) 采用基于MPI的并行编程求解三维相场模型,提高了模拟计算能力,较大尺度地实现了三维枝晶定量模拟,增大了计算区域网格数,扩大了计算规模,解决了在单CPU 下计算规模小的问题.2) 并行程序在求解过程中,分别采用点对点通信与集合通信对各节点间数据进行传输,结果显示,在大规模任务情况下,集合通信比点对点通信更具计算效率,验证了MPI在并行计算三维枝晶模拟生长问题上的性能状况.3) 加入热噪声幅值参数后,三维枝晶生长在界面前沿形成持续扰动,并在距尖端几个波长的后方出现侧枝,实现了模拟三维枝晶生长的目的.致谢:本文得到兰州理工大学红柳杰出人才基金(J201304) 的资助,在此表示感谢. 【相关文献】[1] JOHNSON A E,VOORHEES P W.A phase-field model for grain growth with trijunction drag [J].Acta Materialia,2014,67:134-144.[2] BERG B A,WU H.Fortran code for SU (3) lattice gauge theory with and without MPI checkerboard parallelization [J].Computer Physics Communications,2012,183(10):2145-2157.[3] 朱昌盛,王军伟,王智平,等.受迫流动下的枝晶生长相场法模拟 [J].物理学报,2010,59(10):7417-7423.[4] SUWA Y,SAITO Y,ONODERA H.Three-dimensional phase field simulation of the effect of anisotropy in grain-boundary mobility on growth kinetics and morphology of grain structure [J].Computational Materials Science,2007,40(1):40-50.[5] SUWA Y,SAITO Y,ONODERA H.Phase field simulation of grain growth in three dimensional system containing finely dispersed second-phase particles [J].Scripta Materialia,2006,55(4):407-410.[6] 邬延辉,陆鑫达,曾志勇,等.消息传递接口在偏微分方程中的并行计算 [J].上海交通大学学报,2003,37:416-419.[7] 卢照,张锦娟,师军,等.MPI 动态负载平衡策略的研究与实现 [J].计算机技术与发展,2010,20:132-135.[8] AMRITKAR A,TAFTI D,LIU R,et al.Open MP parallelism for fluid and fluid-particulate systems [J].Parallel Computing,2012,38(9):501-517.[9] DHOTE R,GOMEZ H,MELNIK R,et al.Isogeometric analysis of coupled thermo-mechanical phase-field models for shape memory alloys using distributed computing [J].Procedia Computer Science,2013,18:1068-1076.[10] 朱昌盛,冯力,王智平,等.三维枝晶生长的相场法数值模拟研究 [J].物理学报,2009,11:8055-8061.[11] WONG U H,AOKI T,WONG H C.Efficient magnetohydrodynamic simulations on distributed multi-GPU systems using a novel GPU Direct-MPI hybrid approach[J].Computer Physics Communications,2014,185(7):1901-1913.[12] 王巍,李旺.基于 Linux 数据链路层 MPI 通信机制的设计与实现 [J].电子技术应用,2012,38:127-130.[13] JIN H,JESPERSEN D,MEHROTRA P,et al.High performance computing using MPI and OpenMP on multi-core parallel systems [J].Parallel Computing,2011,37(9):562-575. [14] 朱昶胜,李椿茂,冯力,等.基于自适应有限元法的纯物质三维枝晶生长模拟 [J].兰州理工大学学报,2015,41(4):1-5.[15] 朱昶胜,贾金芳,冯力,等.基于GPU的流动影响枝晶生长相场方法 [J].兰州理工大学学报,2015,41(3):19-25.。
相场法数值 模拟
![相场法数值 模拟](https://img.taocdn.com/s3/m/667db80ea76e58fafab00390.png)
四、相场方程 (phase-field equations)
Ginzburg-Landau 方程 f 0 k (r , t ) F Lk k k Lk t k (r , t ) k
Cahn-Hilliard 方程
2、凝固-单相场变量
ϵ 2 * 2 F f 0 ( xB , , T ) (xB ) ( ) dr V 2 2
等温凝固,假设摩尔体积不变,即组成梯度项不考虑 ϵ则=0
均质自由能密度
f 0 ( xB , , T * ) f p ( xB , , T * ) g ( )
图1(a)性能不连续
(b)性能连续
N. Moelans, B. Blanpain , P. Wollants, "An introduction to phase-field modeling of microstructure evolution", CALPHAD -Computer Coupling of Phase Diagrams and Thermochemistry, 32, 268-294, 2008
相场量(phase-fields)
两相
多相
p相,相应的变量 k 在系统中任一点 r
1表示在固相中 0表示在液相中 0 1在固液界面
k 1
p
k
1,k 0, k
三、热力学势函数 (thermodynamic energy functional)
经典热力学
F ( xB ,k ) f 0 ( xB ,k ) 1 xB (r , t ) M M xB (r , t ) Vm t xB (r , t ) xB
计算材料学概述之蒙特卡洛方法详解课件
![计算材料学概述之蒙特卡洛方法详解课件](https://img.taocdn.com/s3/m/83cda407f6ec4afe04a1b0717fd5360cba1a8d05.png)
组合优化方法
针对组合优化问题,通过随机搜索和迭代优 化求解。
分子动力学模拟中的蒙特卡洛方法
01
分子动力学模拟是一种基于物理 模型的模拟方法,通过蒙特卡洛 方法可以模拟分子间的相互作用 和运动轨迹。
02
蒙特卡洛方法在分子动力学模拟 中主要用于求解势能面和分子运 动轨迹,通过随机抽样和迭代优 化实现分子运动状态的模拟。
重要性
随着科技的发展,计算材料学已成为 材料科学研究中不可或缺的工具,有 助于加速新材料的发现和优化现有材 料的性能。
计算材料学的主要研究方法
分子动力学模拟
01
基于原子或分子的动力学行为,模拟材料的微观结构和动态性
质。
蒙特卡洛方法
02
通过随机抽样和概率统计方法研究材料的宏观性质和相变行为
。
密度泛函理论
蒙特卡洛方法可以与分子动力学模拟结合,实现更精确的原子尺 度模拟。
元胞自动机
蒙特卡洛方法可以与元胞自动机结合,模拟复杂系统的演化过程。
有限元分析
蒙特卡洛方法可以与有限元分析结合,实现更高效的数值计算。
蒙特卡洛方法在材料设计中的应用前景
新材料发现
蒙特卡洛方法可用于预测新材料性能,加速新材料发现和开发进 程。
总结词
通过蒙特卡洛方法模拟复合材料的界面行为,包括界面润湿性、粘附力和传质过程等。
详细描述
利用蒙特卡洛方法模拟复合材料的界面行为,分析不同组分间的相互作用和界面结构, 预测材料的界面润湿性、粘附力和传质过程等性能,为复合材料的制备和应用提供理论
依据和技术支持。
蒙特卡洛方法的发
05
展趋势与展望
蒙特卡洛方法的未来发展方向
计算统计量
根据模型和抽样结 果,计算所需的统 计量或系统参数。
LBM三维相场模型模拟并行方法研究
![LBM三维相场模型模拟并行方法研究](https://img.taocdn.com/s3/m/7024e1b076eeaeaad0f33039.png)
物质相场模型结合,忽略重力和动力学影响,建立了 耦 合 流 动 场 的 三 维 枝 晶 非 等 温 生 长 PF-LBM (Phase-LBM field model)模型,研究对流作用下枝晶 生长机理。然而,计算量大一直是制约相场法推广和 应用的一个劣势,相场法耦合流场后,在原有的尺度 上增加了新的空间和时间尺度,三维也比二维增加了 一个维度,其计算量更大,加之计算机本身硬件条件 的限制,其模拟规模都比较小,仍缺乏定量研究。另 外,目前相场模型一般采用有限差分方法求解[7-9],其 在整个求解域对控制方程进行同尺寸均匀离散,导致 计算量巨大,限制了三维凝固微观组织模拟的发展。 所以,为了更切实际地反映金属凝固的微观组织演化 过程,对微观组织演化在多尺度进行多场耦合三维定 量模拟具有重要意义,研究更快速、合理的数值求解
文献标识码:A
Research on Parallel Method of LBM Three-Dimensionalphase-Field Model
Jia Jinfang Xue Wandong Deng Xin Cao Tengfei Feng Li Yang Pei
Computer Technology and Application Department, Qinghai University, Qinghai Xining 810016
凝固过程中材料微观组织形成与生长演化对材料 使用性能有重要影响[1]。枝晶凝固过程受多种参数和复 杂边界条件的影响,实际试验成本比较高[2]。使用计算 机进行微观组织数值模拟因其低成本、便捷等优势备 受关注。相场法作为一种数值计算技术,应用于凝固 过程的模拟,可直观再现复杂的微观组织演化过程, 自问世以来就受到各国研究者的关注[3-4]。
二元合金定向凝固的三维相场模拟
![二元合金定向凝固的三维相场模拟](https://img.taocdn.com/s3/m/922ceb57ff4733687e21af45b307e87101f6f81a.png)
二元合金定向凝固的三维相场模拟冯力;胡海皇;朱昶胜;王刚刚;路阳;肖荣振【摘要】利用三维相场模型对Al-Cu二元合金定向凝固过程进行数值模拟,研究定向凝固过程中固液界面前沿的变化规律和胞晶的粗化机制,分析不同过冷度对界面形态的影响.结果表明:在定向凝固过程中,胞晶的粗化是熔化和合并共同作用的结果;定向凝固过程中,随着过冷度的减小,定向凝固中的固液界面形态易向平界面发展.【期刊名称】《兰州理工大学学报》【年(卷),期】2016(042)001【总页数】6页(P11-16)【关键词】定向凝固;三维模拟;相场法;胞晶粗化【作者】冯力;胡海皇;朱昶胜;王刚刚;路阳;肖荣振【作者单位】兰州理工大学材料科学与工程学院,甘肃兰州730050;兰州理工大学省部共建有色金属先进加工与再利用国家重点实验室,甘肃兰州730050;兰州理工大学材料科学与工程学院,甘肃兰州730050;兰州理工大学省部共建有色金属先进加工与再利用国家重点实验室,甘肃兰州730050;兰州理工大学材料科学与工程学院,甘肃兰州730050;兰州理工大学材料科学与工程学院,甘肃兰州730050;兰州理工大学省部共建有色金属先进加工与再利用国家重点实验室,甘肃兰州730050;兰州理工大学材料科学与工程学院,甘肃兰州730050;兰州理工大学省部共建有色金属先进加工与再利用国家重点实验室,甘肃兰州730050【正文语种】中文【中图分类】TG21定向凝固技术可较好地控制凝固组织晶粒取向,消除横向晶界,提高材料的纵向力学性能,已成为富有生命力的工业生产手段,然而通过实验研究定向凝固条件下的界面形态演变和微观组织变化规律还存在技术困难,很难观察到某一时刻下的界面形貌[1-2].而相场法在处理微观组织演化方面具有其独特的优势,并且不需要追踪复杂界面,应用非常广泛[3-6],国内外对于定向凝固的相场法研究已成为热点.随着计算机技术和计算材料科学的迅速发展,定向凝固的二维相场模拟研究已较为普遍[7-12],但国内外对于三维定向凝固相场模拟还是很少.目前,国际上对于定向凝固的三维相场模拟已经开展,Mathis Plapp[13]采用了时间依赖的三维相场模拟,研究了六角胞晶族和共晶层状生长的形态稳定性;H.K.Lin和n[14]采用自适应相场模型模拟了硅薄膜定向凝固的三维相场,给出了形态演化的过程,并讨论了平界面形成机制和晶粒的竞争生长;高木友广[15]等人利用GPU超级计算机和高性能算法并行计算了大尺度的三维定向凝固模拟,探讨了枝晶的生长情况.本文基于KKS模型,采用固-液界面迁移方向的法向量做自变量推导相场控制函数,建立一个新的相场模型.以Al -Cu合金(其中w(Cu)=2%)为例,进行定向凝固的三维数值模拟.1.1 相场方程的建立在相场模型中,相场序参量用Φ来表示,序参量构成的泛函数I[Φ]表达形式为将式(1)分部积分后可以得到相场控制方程,在KKS相场模型中,三维相场控制方程可以表示为其中,下标x、y、z表示相场序参量对空间坐标x、y、z的一阶导数,M 为固相界面迁移速率,t表示时间变量,ε(θ)是与界面能相关的参数,fΦ 表示自由能密度对相场序参量的一阶导数.研究中采用枝晶固-液界面迁移方向的法向量作自变量来定义相场控制函数.枝晶固-液界面迁移方向的法向量为将n带入式(2)中,可以得到一个以枝晶固-液界面迁移方向的法向量为自变量的相场控制方程:其中,fΦ可表示为其中,R为气体常数,T为温度,Vm为摩尔体积,h(Φ)为势函数,W是双阱势高,g(Φ)是剩余自由能函数,c表示合金中的溶质浓度,下标L、S分别表示液相和固相,上标e 表示平衡状态.ε(θ)的表达式为其中,v为各向异性系数,夹角θ1、θ2和θ3定义为θ1=arccosθ2=arccosθ3=arccos其中,立方晶系中最优生长方向的晶向指数是〈100〉,这一组晶向指数恰好可以组成一个三维坐标系,θ1、θ2、θ3分别是枝晶生长界面迁移的法向方向和这个坐标系的3个夹角,且θ1、θ2、θ3满足式(10)条件:1.2 溶质场方程的建立凝固过程中溶质扩散再分配的控制方程可表示为其中,D(Φ)是溶质扩散率,fc、fcc分别为自由能对浓度的一阶和二阶导数.1.3 相场参数的确定相场参数ε0和W与界面能σ、界面厚度λ有关,为固相界面迁移速率M的表达式为其中,ζ 为界面迁移参数矩阵,表达式为2.1 数值计算选用Al-Cu为研究合金,计算中使用的物性参数如表1所示.计算时,采用显式有限差分法同时求解方程(4、11).计算的时间步长Δt受浓度场计算的限制,即其中,Δx、Δy、Δz(Δx=Δy=Δz)为空间步长,DL为液相的溶质扩散系数.对应直角坐标系的x轴、y轴和z轴,相场和溶质场的计算区域在网格数为200个×200个×200个的区域内,网格尺寸为1×10-8 m.初始设置网格数z≤5个的区域为固相区,在界面以上是过冷熔体,为了简化计算,令这个过冷熔体的温度为恒定常数,等同于将熔化好的金属液浇入到侧壁绝热、底部冷却的环境中,刚开始会形成一凝固层,在金属液和已凝固金属中建立起一个自上而下的温度梯度,使铸件自上而下进行凝固,实现定向凝固.2.2 固液界面的形态演化图1是Al-Cu二元合金在温度为900 K、各向异性系数为0.063下定向凝固过程中组织演化的三维模拟结果,其中Δt是时间步长,为1.5×10-9 s.图中黑色区域表示液相区,灰白区域是固相区,中间区域为固液界面,其相场序参量的值如标尺所示.根据界面失稳理论可知,定向凝固过程中,固液界面形态经历由平界面向胞晶界面转变的过程;固液界面前沿由于存在能量起伏、结构起伏和溶质起伏,出现了温度的波动以及溶质再分配,界面发生失稳,出现小的凸起,如图1a中1 000Δt时刻;随着时间的进行,成分过冷增大,扰动随时间而增强,界面不稳定,突出部分继续生长,导致界面凹凸不平,如图1b中3 000Δt时刻;凸入液相中的部分推进更快,促进了胞晶组织的形成,由于生长条件对于每一个胞晶来说有差异,那些生长快的胞晶,生长中排出的溶质一部分将排向生长慢的胞晶顶端,使之生长受阻,最后被“淹没”掉,从而使胞晶间的距离增大,胞晶长大,如图1c中5 000Δt时刻.图2是在温度为900 K、各向异性系数为0.063下垂直于生长方向的切片.在胞晶的形成和发展过程中,随“空间规则干扰”的影响[16],界面处部分会出现小的成分过冷,引起过冷度的减小,生长速率减慢,出现凹坑,如图2a;溶质在凹坑处富集,成分过冷增大,凹坑增多增大,进而连接成沟槽,部分突出的峰形成胞晶,如图2b、c;随着凝固的进行,成分过冷继续增大,再加上胞晶横截面处各向异性和生长过程中胞晶间的相互影响,形成不规则四角胞晶,如图2d中胞晶1、2、3所示;胞晶生长中,发生溶质再分配,如图2f所示,胞晶间含有高溶质的液相,成分过冷会进一步增大,胞晶变得更不规则,如图2e所示.图3是在温度为905 K、各向异性系数为0.073下定向凝固过程中胞晶熔化和合并现象[17]的结果,其中图3a、c是晶体形貌切片图;图3b、d是溶质分布切片图,溶质标尺不同颜色代表不同的溶质百分比.由图可知,胞晶在生长过程中会逐渐变粗,发生了胞晶的熔化和合并现象.径向熔化现象如图3a中的①切片,在4 000Δt时胞晶α存在,到20 000Δt时胞晶α熔化消失.如溶质分布图3b中的①切片所示,胞晶α、β附近的溶质浓度不同,且Cα大于Cβ,二者间存在浓度差,由于溶质浓度梯度的存在促使溶质从胞晶α向胞晶β处扩散,造成胞晶α熔化和胞晶β粗化.合并现象如图3a中的①切片,在4 000Δt时胞晶间γ处为液相,到20 000Δt时胞晶间γ处发生合并.如溶质分布图3b和图3d中的切片③、④中的γ处所示,在胞晶的横截面上存在各向异性,胞晶生长过程中最优方向生长较快,会向两侧排出溶质,胞晶间γ处的溶质浓度较高,但最优生长方向处的溶质浓度相对周围较低,生长速度较快,相邻胞晶最终合并.图3c中2条实线分别为①和②的切片位置,③和④分别为同一时刻不同位置的切片,包含了胞晶α在不同位置的切片图.可知胞晶α并不是完全熔化或合并,而是如图3a、c所示,局部发生熔化和合并,表明胞晶的粗化是熔化和合并共同作用的结果.凝固过程中胞晶经过持续的熔化和合并,最终得到稳定的胞晶组织.2.3 过冷度对界面形态的影响温度梯度对于胞晶的生长有重要的影响,不同的过冷度反应了不同的温度梯度,研究中温度梯度是通过过冷度来影响胞晶的生长.图4是不同过冷度下同一时刻的固液界面形貌.由图可知,过冷度越小,固液界面形态越趋向于平界面发展,生长速率越缓慢.图5是不同过冷度下固液界面失稳时的溶质分布图.如图所示,过冷度较小时,液相中的温度较大,扩散较快,固液界面前沿浓度梯度较小,成分过冷较小,固液界面较稳定,根据M-S理论,界面趋于平界面向前生长;而过冷度较大时,溶质容易在凹坑处富集,且扩散较慢,成分过冷较大,界面各处的生长速率不同,从而生成胞晶;过冷度越大,温度梯度越大,界面失稳更快,胞晶形成更早.其中溶质扩散层的厚度随着过冷度的增大而减小,相应的溶质梯度就增大,界面易失稳,容易生成胞晶组织.1) 基于新建立的三维相场模型,实现了Al-Cu二元合金定向凝固的三维相场模拟,再现了定向凝固过程中固液界面形态从平界面到胞晶生成的演化过程.2) 胞晶生长过程中会逐渐粗化,发生了胞晶的熔化和合并现象,但胞晶并不会完全发生熔化或者合并,仅是局部发生熔化和合并,胞晶的粗化是熔化和合并共同作用的结果.3) 在定向凝固过程中,过冷度越小,液相中温度越高,溶质扩散层的厚度增大,相应的溶质梯度减小,定向凝固的固液界面形态易向平界面发展.致谢:本文得到兰州理工大学红柳青年人才基金(Q201114)的资助,在此表示感谢.【相关文献】[1] 黄春丽,常辉,唐斌,等.Ti-43Al合金定向凝固的相场法模拟 [J].特种铸造及有色金属,2013,33(2):119-123.[2] CHEN Ming,HU Xiaodong,JU Dongying,et al.The microstructure prediction of magnesium alloy crystal growth in directional solidification [J].Computational Materials Science,2013,79(11):684-690.[3] 王智平,张殿喜,石可伟,等.多元合金等温凝固相场法模拟[J].兰州理工大学学报,2008,34(6):1-4.[4] MOELANS N,BLANPAIN B,WOLLANTS P.An introduction to phase-field modeling of microstructure evolution [J].Calphad-Computer Coupling of Phase Diagrams and Thermochemistry,2008,32(2):268-294.[5] GU Yijia,CHEN Longqing,HEO T W,et al.Phase field model of deformation twinning in tantalum: parameterization via molecular dynamics [J].Scripta Materialia,2013,68(7):451-454.[6] 王智平,李生建,冯力,等.基于多相场模型的二元合金共晶层片生长方式数值模拟 [J].兰州理工大学学报,2013,39(5):15-18.[7] 肖荣振,朱昶胜,安国升,等.Ni-Cu合金定向凝固海藻状生长形态的相场法模拟 [J].兰州理工大学学报,2014,40(6):9-13.[8] 张云鹏,林鑫,魏雷,等.界面能各向异性对定向凝固枝晶生长的影响 [J].物理学报,2013,62(17):1781051-1781058.[9] WANG Zhijun,LI Junjie,WANG Jincheng,et al.Phase field modeling the selection mechanism of primary dendritic spacing in directional solidification [J].Acta Materialia,2012,60(5):1957-1964.[10] 陈明文,陈弈臣,张文龙,等.各向异性表面张力对定向凝固中深胞晶生长的影响 [J].物理学报,2014,63(3):0381011-0381019.[11] CHEN P,TSAI Y L,LAN C W.Phase field modeling of growth competition of silicon grains [J].Acta Materialia,2008,56(15):4114-4122.[12] LIN H K,CHEN H Y,LAN C W.Phase field modeling of facet formation during directional solidification of silicon film [J].Journal of Crystal Growth,2014,385(1):134-139.[13] PLAPP M.Three-dimensional phase-field simulations of directional solidification [J].Journal of Crystal Growth,2007,303(1):49-57.[14] LIN H K,LAN C W.Three-dimensional phase field modeling of silicon thin-film growth during directional solidification:facet formation and grain competition [J].Journal of Crystal Growth,2014,401(9):740-747.[15] TOMOHIRO T,TAKASHI S,MUNEKAZU O,et al.Unexpected selection of growing dendrites by very-large-scale phase-field simulation [J].Journal of CrystalGrowth,2013,382(8):21-25.[16] KURZ W,FISHER D J.Fundamentals of solidification[M].Erstauflage:Trans Tech Publications,1984.[17] 陈亚军,陈琦,王自东,等.定向凝固过程中柱状晶的生长机制 [J].清华大学学报,2004,44(11):1464-1467.。
哈工大传输原理之相场模拟
![哈工大传输原理之相场模拟](https://img.taocdn.com/s3/m/02e45922a32d7375a41780df.png)
选定空间网格为 300×300,时间共运行 400 步。赋初值为-0.005 到 0.005 的均匀分布,生长
后结果如下左图示,右侧为真实晶粒的图片。
计算机模拟生长出的晶粒与真实的晶粒有一定的相似之处,但也存在较大差异。这主要体现 在晶粒的形状上,这应当与序参量选取较少和生长时间较短应该有很大的关系,不过模拟生 长的晶粒仍有部分形状与真实晶粒接近。通过对模拟晶粒连续的观察发现,晶粒的生长主要 包含大晶粒对小晶粒的吞并以及晶界的光滑化。 七、 小结 文献中指出,要与真实晶粒生长结果相近,至少要选取 20 个序参量。而在本次作业中,为 了使程序的运行更为迅速,仅取了 3 个序参量,事实证明这样的工作是不可取的。 由于缺乏对朗道方程的理解,在模拟过程中所做的事情只是一个简单的编程。编程过程中存 在的疑惑在文章开头已经指出。如何建立相场法模拟与实际生产生活的联系,并提供一定的 指导意义,是当前最为疑惑的问题。这可能要通过更进一步的学习才能找到答案。 参考文献 《传输原理讲义》,张雁祥 《晶粒生长过程的相场模型研究进展》,周有欣等,《材料导报》,2010 年 5 月
的办法(递归搜索),可以对晶粒进行划分。可以在另一个矩阵中将晶粒记录下来,最终进
行序参量的赋值。我们在作业中完成了晶粒的划分,但没有对图片进行读取,这与时间紧张
存在一定的关系。不过这样做是否有必要也是不确定的。
六、 晶粒的生长
取序参量为 3 个,离散空间 h 为 1,离散时间 t 为 0.1,取 L 为 1,a 为 1,γ 为 1,k 为 0.5。
三、 唯象参数的确定
采用一种并不太严谨的方法对上述方程进行分析,希望得到一些对于唯象参数选择的启发。
这里将右端项拆开,分别考察其分别可能对动力学方程造成的影响。
并行计算合成绝缘子串电压分布及金具表面电场强度
![并行计算合成绝缘子串电压分布及金具表面电场强度](https://img.taocdn.com/s3/m/7c9b78c13086bceb19e8b8f67c1cfad6195fe927.png)
并行计算合成绝缘子串电压分布及金具表面电场强度厉天威;阮江军;杜志叶;黄道春【摘要】实际工程应用中的大规模电磁场数值计算需要借助于并行计算。
本文首先介绍了适合并行计算的非重叠型区域分解法。
基于非重叠型区域分解法的有限元并行计算在单元分析和线性方程组的形成及求解上都是并行的,在传统的只对线性方程组实行并行求解的方法的基础上进一步提高了并行度。
为了更精确地对500kV高压输电线路合成绝缘子串上的电位分布以及金具表面电场强度进行计算,建立三维有限元模型,并对该模型分别划分为2~6个分区在本研究室构建的机群环境下实行并行求解。
结果表明并行计算能够有效地提高电磁分析的计算效率,计算数据可作为优化屏蔽环位置,以及确定并降低绝缘子端部电场强度的依据。
【期刊名称】《电工技术学报》【年(卷),期】2010(000)003【总页数】8页(P6-13)【关键词】并行计算;区域分解法;高压输电线路;电位分布【作者】厉天威;阮江军;杜志叶;黄道春【作者单位】广西电力工业勘察设计研究院,南宁530023;武汉大学电气工程学院,武汉430072【正文语种】中文【中图分类】TM1511 引言合成绝缘子相对于玻璃和瓷绝缘子具有重量轻、强度高、耐污性能好、便于运输和安装、运行维护方便等优点,在国内外得到了广泛的应用[1]。
但在运行过程中有出现芯棒脆断的情况,分析表明主要是高压端部电场强度较高,电晕严重,产生电腐蚀并加剧酸腐作用的结果[2],所以必须降低高压端的电压分布。
随着电网超高压的发展,在线路上发生污闪事故的绝缘子几乎都损坏了均压环、端部金具及金具附近的伞裙、护套。
这些被损坏的绝缘子有很多是由于绝缘子端部区域的场强过高引起的,给电网的安全运行带来极大的危害。
计算合成绝缘子串的电位分布以及金具表面的电场强度并以此来采取防护措施势在必行。
文献[1]和文献[3]用三维有限元法计算高压输电线路的绝缘子串的电位分布,由于单机计算速度和内存大小的限制,网格剖分数量有限,因此计算结果会存在一定的误差。
微观组织数值模拟——相场法与元胞自动机
![微观组织数值模拟——相场法与元胞自动机](https://img.taocdn.com/s3/m/8cbec336b4daa58da0114ab3.png)
微观组织的数值模拟——相场法与元胞自动机法相场法和元胞自动机法是材料科学与工程研究中常用的两种数值模拟方法。
相场模型是一种建立在热力学基础上,考虑有序化势与热力学驱动力的综合作用来建立相场方程描述系统演化动力学的模型。
其核心思想是引入一个或多个连续变化的序参量,用弥散界面模型代替传统的尖锐界面来描述界面。
相场法的不足是计算量巨大,可模拟的尺度较小(最大可达几十个微米)。
元胞自动机法是一种用来描述复杂系统在离散空间-时间上演化规律的数学算法。
元胞在某一时间步的状态转变由一定的演化规则来决定,并且这种转变是随时间推移对体系各元胞同步进行的。
元胞的状态受其相邻元胞状态的影响,同时也影响着相邻元胞的状态。
局部之间相互作用,相互影响,通过一定的规则变化而整合成一总体行为。
相场法相场法的起源与发展相场法PFM(Phase Field Method)的提出是针对具有十分复杂的界面结构的问题时,用经典尖锐界面模型去跟踪界面演化,会遭遇到严重的数值困难。
并且真实材料中的相界或晶界实际上并不是严格的零厚度界面,而是具有一定厚度(纳米尺度)的边界层,这层厚度控制材料相变动力学,由此引入一个序参量场Φ来区分两相(如固相和液相),通常称之为相场。
在相场中,Φ在固/液界面的一侧从一个常值逐渐过渡至界面另一侧的某一常值,将这个扩散界面层定义为界面,因此,在相场法中的固/液界面为弥散型界面。
Φ的主要目的是跟踪两相不同的热力学状态,可以不严格地将其理解为结晶程度的度量。
相场模型的想法最初由Langer(1978, 1986)提出的,Collin和Levine (1985)也引入了类似的相场模型(Phase field model)。
Caginalp(1985-1991)分析了这些相场模型,证明它们在界面层厚度趋于零时可以还原为尖锐界面的自由边界模型,这就从数学上证明了Langer 等人相场模型的有效性。
Fix(1983),Kobayashi(1991)等采用相场模型对具体凝固过程进行数值模拟。
电磁仿真HFSS并行计算配置方案2014
![电磁仿真HFSS并行计算配置方案2014](https://img.taocdn.com/s3/m/b5cad146c850ad02de80417d.png)
HFSS电磁仿真应用与硬件配置方案2014 Ansoft HFSS是Ansoft公司推出的三维电磁仿真软件;是世界上第一个商业化的三维结构电磁场仿真软件,业界公认的三维电磁场设计和分析的电子设计工业标准。
HFSS提供了一简洁直观的用户设计界面、精确自适应的场解器、拥有空前电性能分析能力的功能强大后处理器,能计算任意形状三维无源结构的S参数和全波电磁场。
Ansoft HFSS 15.0高性能计算的改进与硬件配置推荐HFSS 15.0 新版本增加了多项新功能,帮助设计师大幅提升设计能力与效率,主要包括:●更快矩阵求解器;新的有限大阵列天线求解器,大幅度提高求解效率●FEM-IE 混合算法进一步改进,宽带扫频的改进,提升低频段扫频精度,更方便的ECAD接口●HFSS Transient 瞬态求解器GPU加速●支持多层次并行计算HFSS三维电磁仿真网格计算应用之计算硬件架构1.图形工作站求解方案HFSS 15.0支持共享内存(SMP)架构的双路或四路多核的并行计算求解,支持双路和四路系列处理器,内存容量越多,求解规模越大,CPU核数越多和频率越高,计算速度越快,计算时间也就越短,增加支持GPU并行计算。
目前最新CPU规格是 intel的双路Xeon E5 2600v2系列或四路Xeon E5 4600、XeonE7 4800v2系列,GPU计算卡Quadro K5000、K6000、Tesla K20、K40等2.分布式计算集群求解方案HFSS支持分布式集群的并行计算,通过访问计算机分布式集群大容量内存,实现高仿真模型计算,借助多个处理器运算,减少仿真时间DDM自动分割几何体的有限元网格到一组更小的网格(称为域,对等尺寸大小)。
HFSS根据网格大小和可用的处理器的计算机和数量而定,确定域的最佳数目。
由于HFSS计算能力的不断提升,工程师们越来越多地依赖HFSS进行大规模电磁场仿真,与此同时,还需要对大规模运算问题进行参数扫描分析和优化,ANSYS R15 中,HFSS15 支持多层次的并行运算,能够将多个设计变量自动分配到多个计算节点上进行,而每个计算节点. 又可以作为主机,发起大规模并行计算,利用多台计算机上的多个处理器核与内存进行并行求解,从而提升大规模、多设计变量问题的仿真速度按电磁仿真计算规模划分硬件配置方案:推荐机型:UltraLAB T330(通用型图形工作站)型号: UltraLAB T330 13532-S11T1AA主要配置:4核Xeon E3 1270v3/32GB/QK600/128GB SSD+1TB SATA企业级推荐机型:UltraLAB T570(通用型图形工作站)型号: UltraLAB T570 23464-S11T4ARA主要配置:8核Xeon E5 2687Wv2/64GB/QK600/128GBSSD/3TB 超级盘推荐机型:高性能计算工作站EX570型号:UltraLAB EX570 230160-S12T8AC主要配置20核Xeon E5 2690v2/160GB/QK4000/256GB SSD/7TB 超级盘推荐机型:超级图形工作站EX580型号:UltraLAB EX580 427256-S15P6T5BRD主要配置32核Xeon E5 4650/256GB/QK5000/512GB SSD+600GB闪电盘/7TB超级盘推荐机型:超级图形工作站Alpha700型号:UltraLAB Alpha700 428512-S15PAT8ARE主要配置60核Xeon E7 4890v2/512GB/4*QK6000/512GB SSD+1.2TB闪电盘+7TB超级盘6.分布式集群仿真计算方案6.1管理节点型号 UltraLAB R330 13316-S12T8DRi主要配置:4核Xeon E3 13032/16GB/128GB SSD/28TB超级盘6.2主计算节点型号 UltraLAB R570 23496-S11A43Ri主要配置 16核Xeon E5 2687Wv2/96GB/128GBSSD+900GB高速盘配置明细配件品牌和型号数量CPU 8核Xeon E5 2687Wv23.4Ghz/25MB/双8.0GTs,共计16核2芯片组intel C600+PCH Chips内存8GB DDR3 1866 Reg ECC 12 GPU计算卡可选 1硬盘系统128GB SSD系统盘900GB PCIE-SAS高速读写盘1光驱DVD 1 网卡千兆以太端口 26.3计算节点型号 UltraLAB R570 23464-S11A43Ri主要配置 16核Xeon E5 2687Wv2/64GB/128GBSSD+900GB高速盘配置明细该集群特点:1.处理器采用最高频率高达3.4Ghz,无论前处理还是求解都能达到最大性能2.支持GPU加速扩展(可选)3.配置高速盘保证迭代计算密集回写的瓶颈降到最低4.整个集群达到做到了高性能计算均衡配置的完美5.支持工作站/服务器双应用扩展,提升机器的使用效率6.整个集群可以在办公环境下运行,全速计算45分贝以内。
《2219铝合金各向异性塑性本构模型研究》
![《2219铝合金各向异性塑性本构模型研究》](https://img.taocdn.com/s3/m/cdd1717454270722192e453610661ed9ac515566.png)
《2219铝合金各向异性塑性本构模型研究》一、引言随着现代工业的快速发展,轻质、高强度的材料成为众多工程领域中不可或缺的材料之一。
铝合金作为轻质合金材料的重要代表,在航空、航天、汽车等领域具有广泛的应用。
其中,2219铝合金因其优良的机械性能和加工性能,在航空航天领域得到了广泛的应用。
然而,由于材料在加工和服役过程中会受到复杂的应力状态和温度环境的影响,其塑性变形行为表现出显著的各向异性特点。
因此,对2219铝合金各向异性塑性本构模型的研究具有重要的理论意义和实际应用价值。
二、文献综述在过去的研究中,众多学者对铝合金的塑性变形行为进行了广泛的研究。
其中,各向异性塑性本构模型是描述材料在多轴应力状态下的塑性变形行为的重要工具。
目前,针对2219铝合金的各向异性塑性本构模型研究已经取得了一定的进展,但仍然存在一些问题和挑战。
例如,模型的准确性、适用范围以及与实际工程问题的结合等方面仍需进一步研究和改进。
三、研究内容本研究旨在建立准确的2219铝合金各向异性塑性本构模型,并探讨其在实际工程中的应用。
具体研究内容包括:1. 材料制备与性能测试:制备不同工艺参数下的2219铝合金试样,进行拉伸、压缩等力学性能测试,获取材料的应力-应变曲线。
2. 本构模型建立与验证:基于试验数据,建立考虑各向异性的塑性本构模型。
通过与有限元软件相结合,对模型进行验证和优化。
3. 模型应用研究:将建立的模型应用于实际工程问题中,如航空航天结构的优化设计、材料加工工艺的改进等。
四、方法与实验1. 试验方法:采用金相显微镜、扫描电镜等手段对2219铝合金的微观组织结构进行观察和分析;通过拉伸、压缩等力学性能测试获取材料的应力-应变曲线。
2. 本构模型建立:基于试验数据,采用合适的数学方法建立考虑各向异性的塑性本构模型。
其中,采用有限元软件对模型进行验证和优化。
3. 模型应用:将建立的模型应用于航空航天结构的优化设计、材料加工工艺的改进等实际工程问题中,通过有限元分析等方法对模型的适用性和准确性进行评估。
五分钟学会相场模拟计算
![五分钟学会相场模拟计算](https://img.taocdn.com/s3/m/16af30a364ce0508763231126edb6f1aff0071bb.png)
五分钟学会相场模拟计算
⼀、STEMS ——材料微观组织演化模拟计算软件
STEMS(Simulation Tools for Evolution of Micro-Structures)是⼀款基于相场和晶体相场理论⽅法(Phase-Field /Phase-Field-Crystal Methods)的材料微观组织结构演化模拟软件。
其中相场⽅法部分适⽤于研究多种合⾦凝固过程中的组织结构演化过程,如⽀晶⽣长,共晶⽣长等现象。
晶体相场部分⽤于研究晚期凝固过程中和凝固压⼒相关的纳⽶尺度机制,可以弥补相场⽅法在描述凝固缺陷⽅⾯的不⾜。
⼆、五分钟教会你使⽤STEMS软件,⽤pf研究枝晶⽣长,还不戳了看看?
附:STEMS功能列表
1. Dendritic solidification
设计功能:凝固过程中的⽀晶⽣长现象
2. Eutectic growth
设计功能:共晶⽣长现象
3. Directional solidification
设计功能:定向凝固
4. Rapid solidification
设计功能:快速凝固
5. Solidification defects
设计功能:凝固缺陷
6. Solidification stress
设计功能:凝固压⼒。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
That Should Have Worked !
CrayPAT Workaround
Use the API for “fine grain” instrumentation Add “PAT_region_{begin/end}” calls to most subroutines After narrowed down to a couple major subroutines, split labels to “computation” and “communication”
Easily parallelized and low memory requirement
Convergence rate depends on resolution, but roughly constant from problem to problem larger problem (with similar resolution) should not increase iterations.
#include <pat_api.h> ... void Complex_Jacobi(…){ ... int PAT_ID, ierr; PAT_ID = 41; ierr = PAT_region_begin(PAT_ID, "communication");
MPI_Internal_Communicate( …);
the project team (Victor Chan) and tested.
7
Profiling the Code with CrayPAT
Measure before optimize Can use sampling or tracing Using CrayPAT is simple: load module, re-compile, build instrumented code, re-run CayPAT can trace only specified group, e.g. mpi, io, heap, fftw, ...
8
> module load perftools > make clean > make
> pat_build –g mpi pfc_jacobi.exe
> aprun –n 48 pfc_jacobi.exe+pat > pat_report –o profile.txt \ <output_data>.xf
5
Complex Iterative Jacobi Solver
Hadley, G. R, A complex Jacobi iterative method for the indefinite Helmholtz Equation, p.Phys. 203 (2005) 358-370
6
Complex Iterative Jacobi Solver
Hadley, G. R, A complex Jacobi iterative method for the indefinite Helmholtz Equation, p.Phys. 203 (2005) 358-370
Project Background
Project Team (University of Michigan): Katsuyo Thornton (P.I.), Victor Chan Phase-field-crystal (PFC) formulation to study dynamics of various metal systems Original in-house code written in C++ Has been run in 2D and 3D systems Solves multiple Helmholtz equations, a reduction, then an explicit time step
Replaced HYPRE A modification of standard Jacobi method
������ ������+1 ������ ������ , Δ������������ , �������பைடு நூலகம்����2 , ������������2 is computed with centereddifference
MPI_Boundary_Communicate(…) ierr = PAT_region_end(PAT_ID); PAT_ID = 42;
ierr = PAT_region_begin(PAT_ID, "computation");
for (int i=1; i<size.L1+1; i++){ for (int j=1; j<size.L2+1; j++){ for (int k=1; k<size.L3+1; k++){ residual(i,j,k)=(1.0/D)*(. . .); } } } ierr = PAT_region_end(PAT_ID);
10
CrayPAT Workaround
Use the API for “fine grain” instrumentation Add “PAT_region_{begin/end}” calls to most subroutines After narrowed down to a couple major subroutines, split labels to “computation” and “communication” Communication subroutine eventually dominate at certain MPI size
MPI_Boundary_Communicate(…) ierr = PAT_region_end(PAT_ID); PAT_ID = 42;
ierr = PAT_region_begin(PAT_ID, "computation");
for (int i=1; i<size.L1+1; i++){ for (int j=1; j<size.L2+1; j++){ for (int k=1; k<size.L3+1; k++){ residual(i,j,k)=(1.0/D)*(. . .); } } } ierr = PAT_region_end(PAT_ID);
Profiling the Code with CrayPAT
Measure before optimize Can use sampling or tracing Using CrayPAT is simple: load module, re-compile, build instrumented code, re-run CayPAT can trace only specified group, e.g. mpi, io, heap, fftw, ...
9
> module load perftools > make clean > make
> pat_build –g mpi pfc_jacobi.exe
> aprun –n 48 pfc_jacobi.exe+pat > pat_report –o profile.txt \ <output_data>.xf
Decrease the time to solution to 1 sec / time step
– Strong scaling: decrease time-to-solution with increasing number of process and a fixed problem size – Exploit other parallelism (with OpenMP?) – Investigate better preconditioner – Different method (library?) to solve the equations
Easily parallelized and low memory requirement
Convergence rate depends on resolution, but roughly constant from problem to problem larger problem (with similar resolution) should not increase iterations. A draft version was quickly implemented by
Decrease the time to solution to 1 sec / time step
– Strong scaling: decrease time-to-solution with increasing number of process and a fixed problem size – Exploit other parallelism (with OpenMP?) – Investigate better preconditioner – Different method to solve the equations
Hybrid MPI + OpenMP Approach to Improve the Scalability of a Phase-Field-Crystal Code