一种改进的基于线性有限元并行计算的追赶算法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 概述
1.1 线性方程组系数矩阵分解及追赶算法 其中 A 是 假设大型线性方程组用矩阵形式表示为 Ax = b , 系数矩阵。最为成熟的分解算法是高斯消元法。这种分解算法 分为两个阶段。首先 , 用一些代数运算把 Ax = b 化简成上三角 把这个方程组写成 Ux = y , 其 形式的方程组 , 系数矩阵为 U , 使用回代法 , 对方程 中 U 是单位上三角矩阵。第二个阶段 , 组 Ux = y 进行求解。对这种方法的一种改进方法是 ,LU 算法 , 就是将矩阵 A 分解为上三角矩阵 U 和下三角矩阵 L 的分解算 法 ,即 A = LU 。将 L 存储在 A 的下三角的位置 ,将 U 存储在 除主对角线以外的上三角的位置(因为 U 的对角线元素都为 1 不用存储 , 默认为 1) 。高斯分解法适用于一般的稠密矩阵 , 对于正定矩阵 , 目前较为成熟的分解算法是 Cholesky 分解算法。 它可以看成是 LU 分解法对对称正定矩阵的特例。即把一个矩 阵分解成一个三角矩阵和它的转置的乘积 , 即 A = RRT , 其中
5n − 4 次乘除运算 , 且追赶算法也是数值稳定的算 结构刚度矩阵 结构中的 结构刚度矩阵 K 的任一元素 kij 的物理意义是 : 需在第 i 结 第 j 结点位移为单位值而其它结点位移皆为零时 , 点位移方向上施加的结点力的大小。与单元不同之处在于结构 是单元的集合体 , 每个单元都对结构起一定的作用。由于单元 刚度矩阵是对称和奇异的 , 由它们集成的结构刚度矩阵 K 也是 对称和奇异的 , 也就是说结构至少需给出能限制刚体位移的约 以便求得结点位移。 束条件才能消除 K 的奇异性 , 结构刚度矩阵是由单元刚度矩阵集合而成。因此 , 虽然总 体单元数和结点数很多 , 结构刚度矩阵的阶数很高 , 但刚度系 数中非零系数却很少 , 这就是刚度矩阵的大型和稀疏性。只要 结点编号是合理的 , 这些稀疏的非零元素将集中在以主对角线 为中心的一条带状区域内 , 即具有带状分布的特点。 综上所述 , 结构刚度矩阵的特点是具有奇异性、对称性、 稀疏性和非零元素成带状分布的特点。如果单元节点的编号合 理, 可以确保结构刚度矩阵是正定三对角阵。 1.3 问题的提出 有限元分析是一种非常重要的数值分析方法 , 在工程技术 及科学计算领域中得到了广泛的应用。然而 , 运用有限元分析 方法对大型或超大型复杂结构进行有效的结构分析 , 所带来的 计算量呈几何级数增长 , 通常方法是采用超级计算机进行计算。 近年来 , 对有限元并行计算的研究受到研究者的关注 , 关注之 一是改进有限元并行计算算法 , 使得这种大型复杂的结构分析 在通常的分布式并行计算环境下 , 计算效率得到提高 , 适合于 普通用户。 有限元分布式并行计算可分成三个阶段 , 前置处理、计算 求解和后置处理。前置处理是建立有限元模型 , 完成单元网格 划分 ; 后置处理则是对处理结果进行分析, 便于用户提取信息, 了解计算结果。而大量的计算主要集中在求解部分 , 这一部分 的计算本质上是大型线性方程组的求解 , 求解过程涉及线性方 程组系数矩阵算法、追赶算法和结构刚度矩阵 , 求解的重点是 如何对刚度矩阵进行分解。 本文将在现有线性方程组系数矩阵及追赶算法的基础上 , 结合结构刚度矩阵的特点提出一种有效刚度矩阵的分解策略 , 进而提出一种适合大型复杂结构分析的追赶算法 , 提高计算效
基础科学 Basic Science
一种改进的基于线性有限元 并行计算的追赶算法
于 丹 同济大学电子与信息工程学院 , 上海 200233 摘 要 随着有限元计算规模的扩大, 有限元并行计算的作用日益凸显。 目前, 对于有限元计算的并行处理的研究, 主要集中在有限元计算的前置处理阶段 , 即有限元模型建立和网格划分阶段 ; 研究以提高每个处理器所负责的子结 构中的单元节点数的均匀程度及减少通信开销为目标。然而 , 鲜有对有限元分析的计算求解阶段的并行处理进行深 入研究 , 而有限元并行计算绝大部分都在此阶段完成。本文就是针对该问题 , 对线性有限元并行计算求解阶段需要 处理的刚度矩阵进行分析 , 依据刚度矩阵的特点和比较各种矩阵分解算法的优劣之后 , 提出一种优化的并行计算策 略。经过验证 , 在对刚度矩阵的计算进行分布式并行处理后 , 有限元分析的计算速度有明显提高。 关 键 词 有限元并行计算 ; 刚度矩阵 ; 线性方程组 ; 追赶算法 ; 卷帘存储 中图分类号 O241 文献标识码 A 文章编号 1674-6708(2013)82-0112-04 Abstract With the expansion of the scale of the finite element analysis, the finite element parallel computation is playing an increasingly prominent role.At present, the researches on finite element parallel computation are mainly concentrated on the pre-processing phase. Those researches aim to reduce the communication overhead and improve the homogeneous degree. However, the researches on calculation phase is rare. Problem is that most of calculation cost is in this phase. In this paper, stiffness matrix decomposition is studied. After comparing the different matrix decomposition algorithms, a new method based on Thomas algorithm is proposed. The numerical experiments indicate that, this method highly improves the performance of finite element analysis with low computational complexity and memory overhead. Keywords finite element parallel computing;stiffness matrix;tridiagonal equation;Thomas algorithm;Wrapped Interleaved Storage