06_2多层快速多极子技术MLFMM

合集下载

一种新型针对快速多极子法(FMM)的预条件技术

一种新型针对快速多极子法(FMM)的预条件技术

1
积分方程和快速多极子算法
对于一般的电磁场散射问题, 都可以或 者 C FIE 的 离 散 得 到 如 下 表 达 式:
收 稿 日 期 :2003 * 03 - 21; 定 稿 日 期 :2003*07-15 基金项目: 国家自然科学基金项目( 编 号 4 99 31030)
表1 不同数值丢弃阈值时, 矩阵•向量相乘的次数 (最大迭代步数:500;迭代残量相对误差:l E -4) 预 预条件矩阵稀疏度 阻抗矩阵近场矩阵
0 . 1194834 0 . 1012016 0. 0807 9 30 0 . 0 6 8 99 43 0 . 0 6 37 6 33 1 .0000000 0 . 8482 993 0 . 67722 9 3 0 .5 7832 9 4 0 .5 34481 9 K ry lm 子空间迭代法
第 20卷第1期
项铁铭等:一种新型针对快速多极子法( FMM)的预条件技术
69
Apply a dropping rule to row w l ,j = W j for j = 1 ,• • • ,i - 1 ui j = W j for j = I , ... w = 0 End do
其 中 ,% 表示工作向量, a ,.表 示 矩 阵 A 的 第 〖 行元 素 。对 于 ILUT 预 条 件 算 法 的 两 个 参 数 : 7 和 /), 其 物理意义分别为数值丢弃阈值和( 除原矩阵非零元 素外 ) 分解过程中新填充的非零元素个数:
68
微 波 学 报
2004年 3 月
v
n
为左预条件: M _1丄^ = 财_16 ;右 预条件: 儿衫_12 = 6
= 匕 爪 = I 2 ,… , 々
= 1

快速多级子算法(FMM)介绍和实现

快速多级子算法(FMM)介绍和实现

快速多级子算法(FMM)介绍和实现国内对FMM(Fast Multipole Method)的介绍都比较复杂,涉及大量的计算公式。

本文试图用最简单的语言介绍FMM的原理和实现,并介绍使用C++开发的快速多级算法模块,用户可自定义核函数,收敛标准,截断系数等参数,可用于实际工程,后续会介绍FMM与边界元方法(Boundary Element Method)/ 矩量法(Method of Moment)结合解决大规模声场,电磁场问题。

在前面简单介绍了快速多级算法 FMM。

快速多级子算法能加快解决非对称满秩矩阵,扩展了矩量法,边界元等方法的应用规模,使其能解决较大规模的实际工程问题。

以下是电磁计算软件FEKO中关于多层快速多级算法(MultiLevelFMM)的介绍,是对FMM的一种改进:/product-detail/numerical_methods/mlfmm1. 概述FMM算法的提出来源于多粒子系统相互作用的势场计算,比如带电粒子或者天体之间引力等。

以静电场为例,空间中N个带点离子构成的系统,第i个离子所在位置的静电势 A(xi)表示为:其中1. i不等于j;2. xi是第i个粒子所在的坐标;3. mj是第j个粒子所占的权重,与带电量呈正比;4. rij是第i个粒子和第j个粒子之间的距离;按照常规计算方法,对N个粒子实现求和问题,计算量达到O(N^2);在BEM MOM 等数值计算中,一次这样的求和也就是一次矩阵和向量的乘法迭代。

FMM的实现基本思想是以树形结构为基础,通过多级展开和局部展开,把原对象进行分层分组,将N*N的关系转换为少数组对象之间的关系(如上图),从而减少计算量。

该算法实现的核心是如何把每个对象归纳到一组对象中,这个主要是通过动态树结构来实现的。

计算过程如下:1. 多级展开:多级展开将叶子节点内(每个小方块内)所有多级展开系数累加,即可以得到该叶子节点的多级展开系数,展开节点为叶子节点的中心。

FEKO7.0各类求解器的介绍分析

FEKO7.0各类求解器的介绍分析

FEKO 各类求解器的介绍FEKO 中的求救器有矩量法(MOM )、多层快速多极子方法(MLFMM )、物理光学法(PO )、一致性绕射理论(UTD )、有限元(FEM )等计算方法,FEKO Suite 7.0在其原有算法基础上,新增时域有限差分(FDTD )求解器,同时增加了多层快速多极子(MLFMM)与物理光学(PO)的混合算法。

1.矩量法矩量法是一种基于积分方程的严格的数值方法,其精度主要取决于目标几何建模精度和正确的基权函数的选择及阻抗元素的计算。

其思想主要是将几何目标剖分离散,在其上定义合适的基函数,然后建立积分方程,用权函数检验从而产生一个矩阵方程,求解该矩阵方程,即可得到几何目标上的电流分布,从而其它近远场信息可从该电流分布求得。

下面以电场积分方程求解理想导体的电磁散射问题为例,简要介绍矩量法的一般方法。

由麦克斯维方程组和理想导体的边界条件可以推导出,表面电场积分方程(EFIE )如下:tan tan (), on .inc j A E r S w +裏=v v v(1)其中,A为矢量磁位, 为标量电位,表达形式分别如下:''||'0||4)()('ds r r e r J r A r r jk S (2)''||'||4)(1)('ds r r er r r r jk S(3)定义基函数系列n J ,将电流展开为N n n n J I J 1(4)其中n I 为与第n 个基函数相关的的电流展开系数。

为了将积分方程离散成为矩阵方程,采用伽略金匹配方法,选取与基函数相同的函数系列作为权函数,表示为g,对式(3-1)求内积得m inc m m J E J J A j ,,,(5)将式(3-4)代入式(3-5),得到包含N 个未知量的N 个线性方程,可以写成][]][[em n mn V I Z(6)其中,][mn Z 为N N 的矩阵,][n I 和][emV 均为1 N 的向量,][n I 为电流系数,][emV 为激励向量,N 为未知量数目。

FEKO并行求解经验技巧

FEKO并行求解经验技巧

延迟 1580 µs
6.7 µs 4.9 µs 1654 µs 772 µs 6.2 µs 0.64 µs 1620 µs 2.3 µs 1.5 µs 0.44 µs
带宽 11 MByte/s 112 MByte/s 116 MByte/s 198 MByte/s 227 MByte/s 231 MByte/s 369 MByte/s 437 MByte/s 561 MByte/s 732 MByte/s 1894 MByte/s
线性方程组求解
❖ 有多种方法
直接求解,如LU分解、高斯消元法等 迭代求解,如CG,BiCGSTAB等
❖ 对于直接求解方法
可以将问题分解为按行或按列的任务元,每个进 程负责若干任务元
直接按行或按列的分解方式可扩展性不好,可以 采用流水线算法实现计算与通信的重叠,提高并 行效率
矩矢相乘并行算法(按行)
主要内容
1
FEKO并行简介
2
矩量法(MoM)并行
3 多层快速多极子算法(MLFMM)并行
4
PO & UTD 并行
FEKO并行模块
矩量法(MoM) 多层快速多极子算法(MLFMM)
高频方法(PO & UTD)
FEKO 并行计算
FEKO支持的平台
FEKO 并行平台
硬件平台
• Intel • AMD • 32/64bit • 共享内存系统 • 分布式内存系统
4
• 随着问题规模增大,单机内存 和计算能力已不能处理电大问题, 此时需要并行求解
矩量法的基本步骤
预处理
矩阵填充
方程求解
后处理
❖ 考察矩量法运行并过行程关中的键时间分配
SUMMARY OF REQUIRED TIMES IN SECONDS

06_2,FEKO电磁仿真数值方法

06_2,FEKO电磁仿真数值方法
( m 1, 2, ..., N )
L ( f n ), W m g , W m
© 2008 PERA Global
区域的离散化
利用算子线性和内积的性质,得到需要的矩阵方程:
a
n 1 N n
L ( f n ), W m g , W m
( m 1, 2, ..., N )
写成矩阵形式
l m n a n g m
( m 1, 2, ..., N )
a1 a a n 2 a N

L f1 , W 1 L f1 , W 2 lm n L f1 , W N
电场积分方程(EFIE)
E ZL (J ) t 0
i
由于是根据电场边界条件建立的,被称 为电场积分方程
算子L为
1 L ( X ) jk X 2 X G d k
磁场积分方程
J n K (J ) n H
?代入磁场积分方程并按伽略金法选择试函数1jsniiijg?tetepjb????teijijsteiiispzglgdsbgeds?????ththpjb????thijijjsthiiispggnkgdsbgnhds??????????2008peraglobal离散积分方程及性态分析?源于电场积分方程是第一类弗雷德霍姆积分方程?源于磁场积分方程是第二类弗雷德霍姆积分方程?比具有好得多的条件数?如果采用迭代方法求解最终离散方程求解离散磁场积分方程的如果采用迭代方法求解最终离散方程求解离散磁场积分方程的收敛速度要快的多tep????thp????thp????tep?????2008peraglobalfeko中的混合积分方程?对闭合的理想导体通过efie和mfie线性组合可以得到cfie混合场积分方程?系数可以在0至1之间选择当系数为1的时就是efie05时就是cfie?feko中同时提供了混合cfieefie技术1efiemfie?cfieefie?2008peraglobal矩量法mom?离散积分方程数学表达形式的离散化方法?矩量法的四要点

FEKO在雷达散射截面计算中的应用

FEKO在雷达散射截面计算中的应用

数字时代■贾云峰现代战争首先是电子高科技的对抗,而雷达探测与隐身技术又是其主要的对抗领域之一。

目标的雷达散射截面(RCS)是评判目标电磁隐身特性的一个重要指标,快速精确的目标RCS分析对于隐身设计人员具有重要的指导意义,尤其是飞机、导弹、舰船等的雷达目标特性分析引起了世界各国的高度重视。

根据问题的类型,RCS有以下不同工况:1、单站 VS 双站:RCS分为单站和双站两种类型,所谓单站RCS即为发射机与接收机为同一部雷达,双站RCS则为一发一收,分别用不同的雷达。

2、极化:其含义为入射电磁波的电场方向与扫描面的夹角。

根据扫描面的不同,通常分为水平极化和垂直极化,此处垂直和水平的含义都是相对于扫描面而言。

3、电小和电大:以入射电磁波波长计算的模型尺度称为电尺寸。

当模型的电尺寸较小时,通常属于电小问题,反之属于电大问题。

飞机、导弹、舰船等军用目标,它们的电尺寸往往非常巨大,因此分析其电磁散射特性对一般软件是一个巨大的挑战。

为了计算RCS,发展了一系列的计算方法,通常可分为:解析方法:典型的如MIE级数方法;积分方程方法:矩量法(MoM)及其快速算法(FMM,MLFMM等);微分方程方法:有限元(FEM)、时域有限差分(FDTD);高频方法:物理光学(PO)、几何光学(GO)、几何绕射理论(UTD)等。

解析方法只能处理极少数规则问题;传统的积分方程方法和微分方程方法可处理电小和中等电尺寸的问题,其中对于RCS问题,MOM及其快速算法精度高、未知量少,成为这一类方法的首选;高频方法适用于电尺寸巨大的问题,以有限的计算资源换取对工程设计有指导意义的结果。

各类方法各有利弊,适用对象不同,需要加以灵活运用、组合运用。

FEKO简介FEKO是针对天线与布局、RCS分析而开发的专业电磁场分析软件,从严格的电磁场积分方程出发,以经典的矩量法(MOM:Method Of Moment)为基础,采用了多层快速多级子(MLFMM:Multi-Level Fast Multipole Method)算法在保持精度的前提下大大提高了计算效率,并将矩量法与经典的高频分析方法(物理光学PO:Physical Optics,一致性绕射理论UTD:Uniform Theory of Diffraction)完美结合,从而非常适合于分析开域辐射、雷达散射截面(RCS)领域的各类电磁场问题。

FEKO7.0各类求解器的介绍

FEKO7.0各类求解器的介绍

FEKO 各类求解器的介绍FEKO 中的求救器有矩量法(MOM )、多层快速多极子方法(MLFMM )、物理光学法(PO )、一致性绕射理论(UTD )、有限元(FEM )等计算方法,FEKO Suite 7.0在其原有算法基础上,新增时域有限差分(FDTD )求解器,同时增加了多层快速多极子(MLFMM)与物理光学(PO)的混合算法。

1.矩量法矩量法是一种基于积分方程的严格的数值方法,其精度主要取决于目标几何建模精度和正确的基权函数的选择及阻抗元素的计算。

其思想主要是将几何目标剖分离散,在其上定义合适的基函数,然后建立积分方程,用权函数检验从而产生一个矩阵方程,求解该矩阵方程,即可得到几何目标上的电流分布,从而其它近远场信息可从该电流分布求得。

下面以电场积分方程求解理想导体的电磁散射问题为例,简要介绍矩量法的一般方法。

由麦克斯维方程组和理想导体的边界条件可以推导出,表面电场积分方程(EFIE )如下:tan tan (), on .inc j A E r S w +裏=v v v(1)其中,A为矢量磁位,ψ为标量电位,表达形式分别如下:''||'0||4)()('ds r r e r J r A r r jk S -=--⎰πμ (2)''||'||4)(1)('ds r r er r r r jk S-=ψ--⎰πσε (3)定义基函数系列n J,将电流展开为∑=≈N n n n J I J 1(4)其中n I 为与第n 个基函数相关的的电流展开系数。

为了将积分方程离散成为矩阵方程,采用伽略金匹配方法,选取与基函数相同的函数系列作为权函数,表示为g,对式(3-1)求内积得>>=<ψ∇<+><m inc m m J E J J A j,,,ω(5)将式(3-4)代入式(3-5),得到包含N 个未知量的N 个线性方程,可以写成][]][[em n mn V I Z =(6)其中,][mn Z 为N N ⨯的矩阵,][n I 和][em V 均为1⨯N 的向量,][n I 为电流系数,][em V 为激励向量,N 为未知量数目。

世界各国对第四代战斗机的战技要求主要体现在5个方面

世界各国对第四代战斗机的战技要求主要体现在5个方面

第四代战斗机世界各国对第四代战斗机的战技要求主要体现在5个方面: 低可探测度, 超强隐形性能; 超强机动性和良好的操控敏捷性; 超声速巡航能力; 较大的有效载荷, 远航程; 短距起降。

隐身要求做为四代机的一个重要指标,主要是为了提高其生存和防御能力而提出的。

而隐身技术的发展日新月异, 成为了各国军事竞相追逐的制高点。

本文借黑丝机成功曝光满月之机,对小白兔现有的各种已投入实际应用和在研的飞机隐身技术做一次既不全面也不细致的梳理。

隐身技术又称为低可探测技术, 是通过降低飞机的信号特征, 使其难以被发现、识别、跟踪和攻击的一种技术。

按照个人习惯的分类方法,隐身技术可大体分为:无源隐身技术,有源隐身技术,新生隐身技术等三大类。

一、无源隐身技术目前我们所熟知的隐身技术均属此类,其原理是通过对飞机的外形,结构进行巧妙设计和采用吸波、透波材料等一系列措施,尽量减少飞机对电波、红外波、可见光和声波等能量的反射或辐射,降低信号特征,从而达到隐身的目的。

目前,各国军队都大量装备了远程搜索和目标指示雷达, 防空导弹和大部分高炮是由雷达引导攻击,因此,雷达隐身技术成为了飞机隐身技术研究应用的重要方向。

飞机对雷达的隐身性能指标主要是雷达散射截面积(RCS),它是指飞机截获雷达辐射功率后,向雷达接收机天线方向散射电磁波能力的量度。

RCS与许多因素有关, 其中包括目标本身的几何尺寸、形状、材料以及目标视角、雷达频率和电波的极化等。

通常, 目标尺寸越大, 其RCS可能越大, 但许多理论和试验研究都表明, 目标(散射体) 的外形对其RCS的大小影响更显著; 同时, 雷达散射截面积与雷达波长也有关, 当飞机的长度(如翼展) 为雷达波长的一半时, 其雷达散射截面积很大, 也最易被雷达探测到。

目前,降低飞机RCS的常用方法有两种: 外形隐身技术和材料隐身技术。

1. 外形隐身技术外形隐身技术是最直接有效的手段, 但需要与飞机的气动外形设计相结合。

微波技术在大脑深层信息探测的应用研究进展

微波技术在大脑深层信息探测的应用研究进展

第 21 卷 第 9 期2023 年 9 月太赫兹科学与电子信息学报Journal of Terahertz Science and Electronic Information TechnologyVol.21,No.9Sept.,2023微波技术在大脑深层信息探测的应用研究进展蒋廷锋1a,叶菁华*1b,施开波1b,朱铧丞2(1.成都大学 a.计算机学院;b.电子信息与电气工程学院,四川成都610106;2.四川大学电子信息学院,四川成都610064)摘要:微波技术对大脑信息进行探测正处于发展时期,目前正逐渐走向成熟,现已用于实体的检测与操作中。

通过联合超声波、核磁等方法,完善了微波信息探测体系,增强了微波信息探测的效率。

本文基于对大脑深层信息探测的3种微波技术以及现有微波探测技术中存在的问题进行总结,并对微波技术未来在大脑信息探测上的应用进行展望。

通过对3种不同微波探测应用的分析,发现微波技术对大脑的探测具有巨大的潜力。

这些应用可以有效地为脑部组织或人体其他组织的病态检查提供解决方案。

同时,通过与人工智能结合,微波技术还可用于脑部的远程监测或身体的其他部位的远程监测中。

关键词:微波技术;脑神经;电位变化;温度探测;超宽带技术中图分类号:TN99 文献标志码:A doi:10.11805/TKYDA2021234Application of microwave technology in deep brain information detectionJIANG Tingfeng1a,YE Jinghua*1b,SHI Kaibo1b,ZHU Huacheng2(1a.School of Computing;1b.School of Electronic Information and Electrical Engineering,Chengdu University,ChengduSichuan 610106,China;2.College of Electronics and Information Engineering,Sichuan University,Chengdu Sichuan 610064,China) AbstractAbstract::Microwave technology for brain information detection, which is gradually becoming mature, has been applied to the entity detection and operation. Through the combination of ultrasonicand nuclear magnetic methods, the microwave information detection system has been improved and theefficiency of information detection has also been enhanced. Three kinds of microwave technologies ofbrain deep information detection and the existing problems are concluded in this paper. It is found thatthe microwave technology has great potential in brain detection through the analysis on three differentmicrowave detection applications. These applications can effectively provide solutions for pathologicalexamination of brain tissue or other human tissue. By combining with artificial intelligence, microwavetechnology can also be applied in remote monitoring of the brain or other parts of the body.KeywordsKeywords::microwave technology;brain nerve;potential change;temperature detection;Ultra-Wide Band(UWB)人类所有的智能活动,如学习、记忆、沟通,思考和决策等,都依赖于大脑神经细胞有组织的活动和功能。

fast multipole method

fast multipole method

文章标题:深入探讨快速多极方法快速多极方法(Fast Multipole Method,FMM)是一种用于求解N-body问题的快速算法。

N-body问题是指在物理学和工程学中经常遇到的一类问题,即求解由大量相互作用的粒子组成的系统的运动规律。

快速多极方法通过将空间分解成层次结构,利用多极展开和局部近似的方式,显著提高了求解N-body问题的效率。

在本文中,我们将深入探讨快速多极方法的原理、应用和未来发展方向。

1. 快速多极方法的原理快速多极方法的核心思想是将相互作用的粒子分组,并用多极展开来近似其作用。

它利用了空间的层次结构,将粒子分为不同的区域,从而减少了相互作用的计算量。

通过多极展开和局部近似,快速多极方法在保证一定精度的情况下,显著减少了计算时间,使得求解N-body问题的效率大大提高。

2. 快速多极方法的应用快速多极方法广泛应用于分子动力学模拟、电磁场求解、流体动力学和地震模拟等领域。

在分子动力学模拟中,由于分子间相互作用的复杂性,快速多极方法能够显著提高模拟计算的效率。

在电磁场求解中,快速多极方法可以用于加速求解Maxwell方程组,从而实现电磁场的快速计算。

在流体动力学中,快速多极方法可以用于求解Navier-Stokes方程,提高流体模拟的效率。

在地震模拟中,快速多极方法可以用于快速求解地震波传播和地震灾害预测。

3. 快速多极方法的未来发展方向随着大规模并行计算和人工智能技术的发展,快速多极方法在规模化和智能化方面仍有很大的发展空间。

未来,快速多极方法将更加注重在异构多核、众核和神经网络等评台上的优化实现,以实现更高的并行性和效率。

快速多极方法还将结合深度学习和强化学习等人工智能技术,实现对粒子系统的自适应建模和智能优化,从而推动其在科学计算和工程应用中的广泛应用。

总结回顾快速多极方法作为一种用于求解N-body问题的快速算法,通过多极展开和局部近似的方式,显著提高了求解效率。

它的应用涵盖了分子动力学模拟、电磁场求解、流体动力学和地震模拟等领域。

多层快速多极子算法

多层快速多极子算法

多层快速多极子算法多层快速多极子算法(MLFMA)是一种用于计算电磁散射问题的高效算法。

它通过将计算域划分为多个层级,并利用快速多极子算法(FMM)来加速计算过程,从而大大提高了计算效率。

在传统的计算电磁散射问题时,需要对整个计算域进行离散化,然后通过求解边界积分方程来求解散射场。

然而,这种方法的计算量非常大,尤其是对于大型散射体或复杂的计算域。

为了解决这个问题,人们提出了快速多极子算法,通过近似散射体与其他散射体之间的相互作用,从而减少计算量。

快速多极子算法将计算域划分为多个层级,每个层级包含一定数量的散射体。

每个散射体通过多极子展开来表示其电荷分布,然后通过多极子展开的近似方法来计算与其他散射体之间的相互作用。

这样一来,整个计算过程可以分解为多个子问题,并且每个子问题的计算量都大大减少。

多层快速多极子算法的关键在于如何选择层级的划分方式。

一般来说,每个层级的散射体数量应该尽量相等,以保证计算的平衡性。

同时,每个层级之间的相互作用也应该尽量减少,以提高计算效率。

在选择划分方式时,可以采用自适应的方法,根据散射体的分布密度和计算要求来确定。

除了快速多极子算法,多层快速多极子算法还可以与其他加速技术结合使用,进一步提高计算效率。

例如,可以将多层快速多极子算法与迭代求解方法相结合,通过多次迭代来逐步求解散射场。

这样可以进一步减少计算量,并提高计算精度。

多层快速多极子算法是一种用于计算电磁散射问题的高效算法。

它通过将计算域划分为多个层级,并利用快速多极子算法来加速计算过程,从而大大提高了计算效率。

在实际应用中,可以根据具体情况选择合适的层级划分方式,并结合其他加速技术来进一步提高计算效率。

多层快速多极子算法

多层快速多极子算法

多层快速多极子算法介绍多层快速多极子算法(Multilevel Fast Multipole Algorithm,简称MFMA)是一种高效的数值计算方法,用于求解在空间中分布的电磁场问题。

该算法综合了快速多极子算法(Fast Multipole Method,简称FMM)和多层次方法(Multilevel Method,简称MM),以加速计算过程并降低算法的复杂度。

在计算大规模电磁场问题时,MFMA能够显著提高计算效率,是现代科学计算领域的重要工具。

FMM的原理FMM是一种用于求解具有长程相互作用的问题的数值方法。

它采用了分治的思想,将问题分解成多个较小的子问题,然后利用局部信息来逼近全局解。

FMM的核心是将空间中的电磁场分解成多个级别的多极子展开,从而减少计算复杂度。

FMM的步骤如下: 1. 构建一棵树结构,将问题空间划分成多个较小的区域。

2.在每个区域内,计算多极子展开系数,即将局部电磁场通过多项式展开表示。

3. 利用多极子展开系数,计算每个区域与其他区域之间的相互作用。

4. 通过迭代的方式,逐渐提高多极子展开的级别,从而提高计算精度。

5. 对于远离目标区域的区域,可以使用近似方法来加速计算。

FMM的优势在于其计算复杂度只与问题的大小相关,而与空间维度无关。

因此,对于高维问题,FMM比其他方法更具优势。

MM的原理MM是一种将问题分解成多个层次的方法。

它通过递归的方式,由粗到细逐渐求解问题,以降低计算复杂度。

MM的核心是将原始问题分解成多个规模不同的子问题,通过先求解较粗的层次,再利用求解结果来逼近较细的层次。

MM的步骤如下: 1. 将原始问题分解成多个规模较大的子问题。

2. 递归求解各个子问题,直到达到最细层次。

3. 根据求解结果,从细到粗逐层修正求解。

4. 将各个子问题的求解结果合并,得到原始问题的近似解。

MM的优势在于能够利用各个层次的求解结果来修正计算,从而提高求解准确度。

06_2多层快速多极子技术MLFMM

06_2多层快速多极子技术MLFMM

近远相互作用介绍
• 下边来分析两小长方体A和B的远相互作用。设A和B内分别都有100个未知数, 如图1所示。如果用通常方式来执行他们之间的相互作用,则需要100*100次计 算机操作。而快速多极子技术是用一种新的方式来执行A和B之间的远相互作用。 其基本思路是将整个相互作用过程分解成三步:聚集、转移、发散。聚集就是 将分布在A内的100个未知数所对应的等效电流聚集在A的中心。其目的是获得 一组具有下列转移特性的新函数:A内所有等效电流对远处的作用可以由执行 这组函数的转移完成;转移就是将聚集过程中得到的一组函数由A的中心转移 到B的中心;发散就是将转移到B中心的那组函数发散到B内所有100个未知数 所对应的等效电流上,从而完成A和B的远相互作用。此种作用方式由图2表示。 下边会阐述平面波函数具有上述转移特性,而且在能够保证高精度情况下,所 需平面波个数少于原未知数个数。这就是说,完成新函数从A中心到B中心的转 移,只需要少于100次的计算机操作。这就是快速多极子技术能够加快完成A和 B远相互作用的原因。作用过程的分解来源于积分方程中格林函数的多极子展 开,故此项技术称为快速多极子技术。由于格林函数的多极子展开在近相互作 用时很难达到满意精度,则这种新作用方式只适用于远相互作用。这也就是我 们将相互作用分成近相互作用和远相互作用的原因。
快速多极子技术的数学原理
ij j i 离散积分方程系数矩阵的元素可表示成 (2.71) 这里P(G)表示作用在格林函数G上的算子。假设{x}和{y}分别代表相距较远的两个小长方体A、B中的 的未知数。那么{x}对{y}的作用可表示成 {y}=[Z]{x} (2.72) 快速多极子技术将此矩阵和矢量相乘分解成聚集、转移、发散三步骤进行。下边具体介绍此分解过程。 很简单,主要靠下面两个数学恒等式。第一个便是关于格林函数的加法定律 e jk |r d | (2.73) jk (1)l (2l 1) jl (kd )hl (2) (kr ) Pl (d r ) |rd | l 0 (2) 这里jl是第一类球面Bessel函数,hl 是第二类球面Hankel函数,Pl是Legendre多项式,以及d<r.值得 注意的是,在l<z时,函数jl(z)和hl(z)幅度大致保持常数;在l〉z时,jl(z)衰减非常快,而hl2(z) 递增非常快。这样当d<<r时,式(2.73)能在保证精度下截断。这样展开(2.73)便可以写成 L (2.74) e jk|r d | jk (1)l (2l 1) jl (kd )hl (2) (kr ) Pl (d r ) |rd | l 0 通常取L=kd+2ln(kd+pi)就能保证较高精度了。第二个恒等式便是式(2.74)中jlPl的平面波展开

积分方程方法的h矩阵直接解法

积分方程方法的h矩阵直接解法

南京理工大学硕士学位论文积分方程方法的H--矩阵直接解法姓名:***申请学位级别:硕士专业:电磁场与微波技术指导教师:丁大志;陈如山201203硕士论文积分方程方法的“-矩阵直接解法摘要㈩IIIlll]1IIIIIIIIIIIIIIIll0Y2061554在计算电磁学中,积分方程得到的矩阵是一个稠密的线性方程,求解这个方程往往是费时费力的。

最近以低秩压缩类方法为代表的快速算法在日趋完善,此类方法可以显著降低内存需求与方程迭代的求解时间。

本文以冗.矩阵的数学框架为基础,实现了一种高效LU分解直接求解技术,其存储消耗为O(NlogN),计算复杂度为O(Nl092忉。

本文首先由电场积分方程引出“.矩阵的基本概念,并且引入低秩压缩类算法,这里主要介绍了三种低秩压缩类算法:自适应交叉近似.奇异值分解算法,矩阵分解.奇异值分解算法,多层矩阵分解算法。

其次,分别结合以上三类低秩压缩类算法实现了基于冗.矩阵技术的直接求解方法。

首先详细介绍了咒.矩阵的运算法则,分别给出了理论上的存储消耗与计算复杂度。

并对三种方法的性能以及对H.矩阵直接求解方法的影响进行了详细比较。

而且爿一矩阵方法是纯数学方法,可以有效的分析平面微带结构以及有限大介质加载的频率选择表面结构。

最后,基于多层Uv算法构造了一种新的咒.矩阵(Uniform.爿)技术,并且实现了直接解法。

相对于冗.LU分解方法,新的方法可以进一步减少存储消耗和计算时间。

关键词:积分方程,直接解法,氕.矩阵,自适应交叉近似算法,矩阵分解算法,多层矩阵分解算法,Uniform.咒矩阵,电容提取硕士论文AbstractTheintegralequation(IE)basedcomputationalelectromagneticmethodsgenerallyleadtoadensesystemoflinearequations,thesolutionofwhichcouldbeveryexpensive.Recently,fastsolversuchasfastlow-rankcompressionmethods,hasbeendeveloped,whichdramaticallyreducesthememoryandCPUtimeofiterativeIEsolversforelectrodyuamicproblems.Inthiswork,byfurtherdevelopingthe7-/-matrixbasedmathematicalframework,weachieveallefficientLU—factorizationbaseddirect1EsolverofO(Nl092Ⅳ)timecomplexityandO(NlogMmemorycomplexity.Firstly,basedontheelectricfieldintegralequation,wehaveallintroductiontothebasicconceptofH—matrix.Thenweintroducethreefastlow-rankcompressionmethods:adaptiveerossapproximation--singularvaluedecompositionalgorithm(ACA—SVD),matrixdecompositionalgorithm····singularvaluedecompositionalgorithm(MDA··SVD)andmultilevelmatrixdecompositionalgorithm(MLMDA).Secondly,combinedwiththeabovethreefastlow-rankcompressionmethods,wedeveloptheH-matrix·baseddkectsolver.Wedescribetheoperationsdefinedin7-1一matrixarithmeticindetail,andgivethestorageconsumptionandcomputationalcomplexityofthetheoretical.Thispaperemphasizesontheanalysisoftheperformanceamongthethreemethodsand冗-matrix-baseddirectsolver,whichcombinedwiththeabovethreemethods,foradetailedcomparison.The冗一matrixbasedmethodsarekernelindependent.SothismethodisusedwidelytoanalyzethescatteringofmicrostripstructureandFSSstructure.Finally,basedonMultilevelUVmethod,wedevelopanew7-/-matrix(Uniform—mtechnology,andachieveanewdirectsolver.Comparedtothe7Lf·LUdecompositionmethod,thenewmethodcanfurtherreducethecomputerstoragerequirementsandthecomputationtime.Keywords:Integralequations,Directsolution,Hierarchicalmatrix(氕-matrix),ACA,MDA,MLMDA,Uniform-H-matrix,CapacitanceextractionⅡ硕士论文积分方程方法的W.矩阵直接解法1绪论1.1研究背景1886年,英国伟大的科学家麦克斯韦(Maxwell)在求解电磁场微分方程中预测到了电磁场辐射波的存在,而在20年后,赫兹(Hertz)才在实验中首次产生并接收到了电磁波,从而证明了麦克斯韦的推理。

多层快速多极子算法中的两步插值技术

多层快速多极子算法中的两步插值技术
( l -1) f ( l) = I l, , l -1 f
(1)
( l - 1)
Gauss 插 值 系 数 构 成 的 矩 阵, f 其 中 I l, l-1 为 由 (N
( l) θ
( l)
, I l, f l-1 和
分 别 为 (N
( l) θ
N
( l) φ
× 1 ),
N
( l) φ
×N
( l - 1) θ
[ 6]
. 聚集和扩散过程需 要 在 角 谱 空 间 内 沿 θ 方 向 和 φ 方 向 计 算 数 值 积 分, 由于层与层之间
[ 4, 7 - 8]
为了高效计算层间的角谱积分, 引进插值技术计算层 间 角 谱 空 间 的 积 分 . 实 际 操 角谱空间的采样点数不同, 作过程中, 有两种最主要的插值算法, 即全局插值( 傅立叶变换 ) 与局部插值 局部插值计算效率高于全局插值, 且计算精度可控 . , 本文主要讨论局部插值,
l) ( l) C1 = N ( θ Nφ Oθ Oφ ,
(2)
其中 C 1 中的下标 1 表示该计算复杂度是由一步 插 值 操 作 得 到 的 . 计 算 过 程 中, 认 为 I l, l - 1 含有 Oθ Oφ 个 非 零 Nθ ∝Ll , N φ ∝2 L l , L l 为多极子展开极子数, 元素 . 对每一层, 将上式改写为 C1 ∝ 2 ( L l ) 2 O θ O φ , 其中 ∝ 为正比于符号 . 1. 2 两步局部插值技术 两步局部插值, 将单步插值沿 θ 向和 φ 向 分 别 进 行 插 值 . 首 先, 角 谱 空 间 的 采 样 点 沿 φ 向 增 加, 用矩阵 表示为
( 16 )
ν i ( θ) =

浅谈PCB电磁场求解方法及仿真软件

浅谈PCB电磁场求解方法及仿真软件

浅谈PCB电磁场求解⽅法及仿真软件商业化的EDA软件于上世纪90年代⼤量的涌现,EDA是计算电磁学和数学分析研究成果计算机化的产物,其集计算电磁学、数学分析、虚拟实验⽅法为⼀体,通过仿真的⽅法可以预期实验的结果,得到直接直观的数据。

“兴森科技-安捷伦联合实验室”经常会接到客户咨询,如何选择的问题。

那么,在众多电磁场EDA软件中,我们如何“透过现象看本质”,知道每种软件的优缺点呢?需要了解此问题,⾸先得从最最基本的维度说起。

本⽂旨在⼯程描述⼀些电磁场求解器基本概念和市场主流PCB仿真EDA软件,更为深⼊的学习可以参考计算电磁学相关资料。

电路算法谈到电磁场的算法,不要把场的算法和路的⽅法搞混,当然也有场路结合的⽅法。

电路算法主要针对线性⽆源集总元件和⾮线性有源器件组成的⽹络,采⽤频域 SPICE和纯瞬态电路⽅程⽅法进⾏仿真。

这类仿真的特性是⽆需三维实体模型、线性和⾮线性器件时域或频域模型(SPICE和IBIS等)、仿真速度快、电压电流的时域信号和频谱为初级求解量。

电路仿真简称路仿真,主要⽤于端⼝间特性的仿真,就是说当端⼝内的电磁场对⽹络外其他部分没有影响或者影响可以忽略时,则可以采⽤路仿真;采⽤路仿真的必要条件是电路的物理尺⼨远⼩于波长。

换⾔之,当电路板的尺⼨可以和电路上最⾼频率所对应的波长相⽐拟时,则必须使⽤电磁场理论对该电路板进⾏分析。

举例说明,⼀块PCB尺⼨为10*10cm,⼯作的最⾼频率是3GHz,3GHz对应的真空波长是10cm,此时PCB 的尺⼨也是10cm,则我们必须使⽤电磁场理论对此板进⾏分析,否则误差将很⼤,⽽⽆法接受。

⼀般⼯程上,PCB的尺⼨是⼯作波长的1/10时,就需要采⽤电磁场理论来分析了。

对于上⾯的那块板⼦,当板上有300MHz的信号时,就需要场理论来析了。

电磁场求解器分类电⼦产品设计中,对于不同的结构和要求,可能会⽤到不同的电磁场求解器。

电磁场求解器(Field Solver)以维度来分:2D、2.5D、3D;逼近类型来分:静态、准静态、TEM波和全波。

多层快速多极子算法的改进措施

多层快速多极子算法的改进措施

多层快速多极子算法的改进措施
刘战合;武哲;周钧;高旭
【期刊名称】《航空学报》
【年(卷),期】2008(029)005
【摘要】为精确求解散射问题,采用混合场积分方程(CFIE)、多层快速多极子算法(MLFMA)和共轭梯度算法(CG)的收敛技术.基于传统多层快速多级子算法,详细研究了二维拉格朗日插值节点数对计算精度的影响,并改进了插值方法,在不同的层采用不同的插值节点数;提出了在不同的层采用不同的精度控制来计算多级子模式数;分析了稀疏矩阵的对称性对内存使用的影响以及磁场积分方程对迭代初始值的选择.数值计算结果表明以上改进可较大幅度地提高计算精度和计算效率,同时降低内存使用,可满足复杂目标电磁散射计算要求.
【总页数】6页(P1180-1185)
【作者】刘战合;武哲;周钧;高旭
【作者单位】北京航空航天大学,航空科学与工程学院,北京,100191;北京航空航天大学,航空科学与工程学院,北京,100191;北京航空航天大学,航空科学与工程学院,北京,100191;北京航空航天大学,航空科学与工程学院,北京,100191
【正文语种】中文
【中图分类】V218
【相关文献】
1.基于多层快速多极子算法分析平面多层结构 [J], 丁大志;刘金权;胡云琴;陈如山
2.自适应多层快速多极子算法及其并行算法 [J], 袁军;邱扬;刘其中;郭景丽;谢拥军
3.一种基于矢量有限元与多层快速多极子技术的电磁散射快速并行算法 [J], 袁军;刘其中;郭景丽
4.多层快速多极子算法的改进措施 [J], 陈晓昕;张红霞;倪维立
5.多层快速多极子算法中修正多极子模式数技术 [J], 温彬;胡俊;聂在平
因版权原因,仅展示原文概要,查看原文内容请购买。

关于CFIE-MLFMA算法的一类预条件方法

关于CFIE-MLFMA算法的一类预条件方法

关于CFIE-MLFMA算法的一类预条件方法
李卫东;洪伟;周后型
【期刊名称】《应用科学学报》
【年(卷),期】2007(025)001
【摘要】研究了多层快速多极子算法(MLFMA)的预条件加速技术.利用MLFMA 的近场矩阵的结构特征,先将其分裂为对角块阵、不完全下三角块阵和不完全上三角块阵,再将对角块作LU分解,就可以构造出一系列的预条件阵DILU.与不用预条件或只用对角块预条件相比,这些预条件阵能大幅度地减少迭代次数,节省计算时间.一部分预条件阵不会增加存储量,而另外一部分只增加很少的存储量.文中给出的数值算例比较了几种不同预条件阵的优缺点,也验证了这些预条件加速方法的正确性和有效性.
【总页数】6页(P40-45)
【作者】李卫东;洪伟;周后型
【作者单位】东南大学,毫米波国家重点实验室,江苏,南京,210096;东南大学,毫米波国家重点实验室,江苏,南京,210096;东南大学,毫米波国家重点实验室,江苏,南京,210096
【正文语种】中文
【中图分类】TN011
【相关文献】
1.一类预条件矩阵USSOR迭代方法的比较定理 [J], 郭煜;畅大为
2.一类预条件AOR方法的比较性定理 [J], 王福;袁东锦;董霞;赵海燕;刘春辉
3.一类虚拟边界预条件多重网格并行算法 [J], 卫加宁;王伟沧;皮新明;章社生
4.一类预条件下2PPJ型方法收敛性的加速 [J], 雷刚;王慧勤
5.L-矩阵的一类新预条件迭代方法 [J], 薛秋芳
因版权原因,仅展示原文概要,查看原文内容请购买。

多层快速多极子法的内存占用与控制分析

多层快速多极子法的内存占用与控制分析

多层快速多极子法的内存占用与控制分析
刘战合;武哲;高旭
【期刊名称】《系统工程与电子技术》
【年(卷),期】2010(032)004
【摘要】从多层快速多极子算法的内存组成出发,建立了内存与未知数之间的关系,首次提出了网格划分尺寸与入射波长之比和多极子模式数对内存的影响.入射频率不变而网格划分尺寸减小时,聚合配置量内存与总未知数成正比,稀疏矩阵内存与相关未知数数目成平方关系,总内存迅速增加.网格不变而频率降低时,若分层数相同,稀疏矩阵内存不变,聚合配置量内存随频率降低而减小;若分层数降低,稀疏矩阵内存平方递增;若频率成偶数倍关系,聚合配置量占用内存不变,总内存振荡增加.改进模式数的精度控制后,提高了精度,但聚合配置量内存相应增加,总内存随之增加.
【总页数】5页(P724-728)
【作者】刘战合;武哲;高旭
【作者单位】北京航空航天大学航空科学与工程学院,北京,100191;北京航空航天大学航空科学与工程学院,北京,100191;中航第一飞机设计研究院,陕西,西
安,710089
【正文语种】中文
【中图分类】TN011
【相关文献】
1.电大目标散射问题的预修正多层快速多极子分析 [J], 满明远;雷振亚;谢拥军;王元源
2.应用于舰载天线电磁兼容性分析的改进多层快速多极子算法 [J], 潘龙;朱志宇
3.基于多层快速多极子算法分析平面多层结构 [J], 丁大志;刘金权;胡云琴;陈如山
4.多层快速多极子算法中修正多极子模式数技术 [J], 温彬;胡俊;聂在平
5.基于共享内存的高效OpenMP并行多层快速多极子算法 [J], 潘小敏;皮维超;盛新庆
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

小长方体多大合适


这里我们讨论小长方体多大合适的问题?
由上述分析可以知道:转移步骤所需计算量很小。然而,聚集和发散步骤并非如此。实 际上,将原来的100个未知数所对应的100个基函数聚集成大致100个平面波函数,需要 100x100次计算机操作;将100个平面波函数发散给100个未知数所对应的100个基函数, 也需要100x100次计算机操作。因此,如果只考虑两个小长方体的远相互作用,快速多极 子技术所需计算量是超过通常方式的计算量。然而,当我们考虑100个小长方体的远相互 作用时,情况就不同了。此时有100x100=10000个未知数,用通常方式完成它们的相互作 用需10000x10000次计算机操作。如用快速多极子技术,每个小长方体中的聚集需 100x100次计算机操作,现有100个小长方体,因此整个聚集需100x100x100次计算机操作。 同样道理,整个发散需100x100x100次计算机操作。至于转移步骤,因为完成一次转移需 100次计算机操作,现有100个小长方体,需100x100次转移,因此整个转移也需 100x100x100次计算机操作,故用快速多极子技术完成整个相互作用需3*100x100x100次 计算机操作,大大少于通常方式的计算量。由此可见,小长方体尺寸不能过大,因为过 大会导致聚集和发散两步骤地计算量过大;小长方体尺寸不能过小,因为过小会导致转 移步骤的计算量过大。严格来说,假如有N个未知量,分成M组,这样每组大致有N/M个未 知数。根据上面分析,聚集和发散步骤所需计算机操作都是O(N2/M),转移步骤需O (NM)次计算机操作。因此完成整个相互作用需要O(N2/M+MN)次计算机操作。不难知 道,在M=N1/2时,完成整个相互作用需要的计算机操作次数最少为O(N3/2)。不难分析, 此时的内存需要量也为O(N3/2)
快速多极子技术的数学原理
ij j i 离散积分方程系数矩阵的元素可表示成 (2.71) 这里P(G)表示作用在格林函数G上的算子。假设{x}和{y}分别代表相距较远的两个小长方体A、B中的 的未知数。那么{x}对{y}的作用可表示成 {y}=[Z]{x} (2.72) 快速多极子技术将此矩阵和矢量相乘分解成聚集、转移、发散三步骤进行。下边具体介绍此分解过程。 很简单,主要靠下面两个数学恒等式。第一个便是关于格林函数的加法定律 e jk |r d | (2.73) l (2) jk (1) (2l 1) jl (kd )hl (kr ) Pl (d r ) |rd | l 0 (2) 这里jl是第一类球面Bessel函数,hl 是第二类球面Hankel函数,Pl是Legendre多项式,以及d<r.值得 注意的是,在l<z时,函数jl(z)和hl(z)幅度大致保持常数;在l〉z时,jl(z)衰减非常快,而hl2(z) 递增非常快。这样当d<<r时,式(2.73)能在保证精度下截断。这样展开(2.73)便可以写成 L (2.74) e jk|r d | jk (1)l (2l 1) jl (kd )hl (2) (kr ) Pl (d r ) |rd | l 0 通常取L=kd+2ln(kd+pi)就能保证较高精度了。第二个恒等式便是式(2.74)中jlPl的平面波展开
快速多极子技术的数学原理(续)
Zij DipTp Apj
K p 1
(2.80)
其中
jk p rmo Dip p gi e dS S
(2.81)
Apj g j e
S'
jk p rm'o'
dS'
(2.82)
注意Dip、Apj是矢量,Tp是标量。于是式(2.72)的矩阵和矢量相乘便可表示成 (2.83)


多层快速多极子技术实施办法示意图
m’
m’
m 转移过程
m
m’
聚集过程
m’
m 发散过程
m
图4 多层快速多极子技术实施办法示意图
多层快速多极子技术的基本思路
• 为了给出一个完整的多层快速多极子技术实现步骤,不失一般性,下面以求解域是正方形 为例来具体说明。如图5所示,将正方形分成四个小正方形,这是第一层分组,其中“*” 号表示小组中心。后再将每一小正方形一分为四,此过程反复进行,直到最小正方形边长 在半个波长为止。为了叙述方便,这里只给出三层分组。图5(b)和图5(c)分别给出第二层 和第三层的分组情况,其中符号“。”和“.”分别表示第二层和第三层的小组中心。 和快速多极子技术一样,多层快速多极子技术也是将矩阵与矢量相乘分解成聚集、转移、 发散三步骤。然聚集和发散过程是先在最高层进行,后通过移置中心、以及插值完成低层 的聚集和发散。至于转移过程,与快速多极子技术中的执行方式完全一样,只是多层快速 多极子技术只在同一层的次相邻中心(后面将解释)进行。 先考虑聚集过程。以第二层的聚集为例。这层的聚集是通过将其高一层即第三层平面波的 中心先移置、后插值完成的。假设在第三层中的每一小正方体有N3个未知数,这样便有 M=N/N3个小正方体。因为聚集在小正方体中心“.”的平面波个数通常小于未知数个数N3, 因此从中心“.”到中心“。”的移置所需计算量要小于N3xM=N。同样可以分析得到其他层 的移置过程所需计算量也要小于N。下边会阐述每一层中插值过程所需计算量也大致为O (N)。这样执行每一层的聚集过程计算量也就在O(N)量级。发散过程相似,计算量也 在O(N)量级。
FEKO Suite 5.5 基本算法介绍
快速多极子(FMM) 多层快速多极子技术(MLFMM)
FMA overview

我们知道解线性方程组的方法可分为两类:一类是直接法,如高斯消元法等; 一类是迭代法,如:共轭梯度法等 用矩量法(MoM)求解线性方程组,它的系数矩阵是满秩的。如用直接法求解, 则计算机内存需要O(N2),运算量达O(N3);如用迭代法求解,内存一样 需要O(N2),而每次迭代的运算量达O(N2)).如此之多的内存需要量,如此之 大的运算量,大大限制了矩量法的应用范围,在90年代以前,矩量法仅仅适用 于电小尺寸物体(物理尺寸/工作波长< 10)。 20世纪90年代以后,情况发生了改变,目前矩量法已可以计算相当大的电大尺 寸物体,这主要归归功于Rokhlin提出的快速多极子算法,这是一种减少内存需 求,加快矩阵和矢量相乘的技术。
Байду номын сангаас
Z
g P (G ) g dS ' dS
2 jk d 4 ( j) jl (k0d ) P l (d r ) e Pl (k r )d kˆ l
(2.75)
快速多极子技术的数学原理(续)
ˆ ”表示是积分在整个单位球面上进行。此积分可用高斯面积分方法进行。 这里的积分符号“d k 具体来说,就是在区间[0,pi]上取L点,使得cos( )在区间[-1,1]上满足Gauss-Legendre L点 积分公式。这L点的theta值及积分权因子可以直接调用可以直接调用文献[7]中的子程序“”得 到。对于水平方向phi值得选取,可以在区间[0,2pi]上等间隔选取2L个值。于是式(2.75)右 边的积分便可写成: (2.76)
快速多极子技术的数学原理(续)
m’ O’
m
O
图3:快速多极子技术具体实施示意图
多层快速多极子技术的基本思路
• 由前边的讨论可知,快速多极子技术中的组不能太大,因为那样转移过程虽然能非常有 效地计算,但聚集和发散过程都不能有效进行;组也不能太小,因为那样聚集和发散过 程能够虽能有效进行,然转移过程又不能有效计算。为此,我们是通过组的恰当大小来 获得快速多极子技术的最佳效率。 这里我们将介绍一种新的方式来更有效地实现快速多极子技术。其基本思路就是将未知 数分成不同层次的组,低层组大,高层组小,让聚集和发散过程先在最高层进行,后通 过移置、插值完成底层中的聚集和发散,而转移过程只在每层的部分组之间进行。这种 实现方式被称为多层快速多极子技术。 这里,我们以聚集过程为例来具体阐述这一实现方式。如图4所示,假设大组中有4m个 未知数,这样实现聚集需16m2次计算机操作。如果聚集先在小组进行,需4m2次计算机 操作。后将所得的四类以小组中心为起点的平面波移到以大组中心为起点,并相加得到 m个以大组中心为起点的平面波,这又需4m次计算机操作。接着再将m个以大组中心为 起点的平面波插值,得到4m个大组中心平面波,从而完成大组聚集过程。后边我们会说 明此插值过程需64m次计算机操作。因此这种实现方式总共需4m2+4m+64m次计算机操 作。在m很大时,明显少于原来的16m2次计算机操作。
远相互作用示意图
100 个 未知数
100 x 100次计算机操作
100 个 未知数
图1:远相互作用常规实施办法示意图
远相互作用FMM实施方法
小于100个平面波 小于100个平面波
O’
转移过程 100次计算机操作
O
聚集过程 100x100次计算机操作 100x100次计算机操作
发散过程
图2:远相互作用FMA实施办法示意图
(2.78)
pVp (k p d )Tp (kr, k p r )
p 1
K



(2.77)
(2)
l 0 注意式(2.77)右边中的 Vp (k p d ) 与r无关,而 T (kr , k p r )
Tp (kr , k p r ) ( j ) (2l 1)hl
{ y} [ D][T ][ A]{x}
矩阵[D]和[A]的元素已由式(2.81),(2.82)给出。矩阵[T]的元素可写成Tpq= Tp pq 。 显然,[T]是对角阵。表达式(2.83)便是快速多极子技术将直接相互作用分解成聚集、转 移、发散三步骤的数学表达式。在这表达式中,[A]{x}表示聚集过程。它将A中基函数聚 集得到的平面波函数,所得结果{x1}表示K个平面波;[T]{x1}表示转移过程。它将聚集 得到的平面波从A中心转移到B中心,所得结果{y1}表示在B中心的K个平面波;最后 [D]{y1}就是发散过程。它将K个平面波发散到B中的基函数,从而得到最终结果{y}。
相关文档
最新文档