电磁散射问题的快速计算
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2001年最快的机器为ASCI White (LLNL),包含8192个处理机, 测试LINPACK时,峰值为12.3 TFLOPS, 可求解的稠密线性 方程组规模达到518,000 (优化的高斯消去法, 内存: 6.2TB)
计算直径为12个波长的金属球,未知量规模:172, 800
MLFMM: 内存474MB, 计算时间:21分钟(P4, 2G CPU, 1G Memory) GE: 内存2.4TB, 计算时间:约1个月 (估计值)
8
国外研究现状
V. Rokhlin(1993)给出了转移算子对角化的概念; M.A. Epton(1995)综述了FMBiblioteka Baidu在Laplace方程和HelmHoltz方程中的
相关理论; L. Greengard和V. Rokhlin (1997)提出了新版本的快速多极子方法,并
用于求解3维Laplace方程,它增加了指数展开的概念,并将其用于低 频Helmholtz方程(1998),克服了传统FMM方法的不稳定性; X.B. Sun (2001)给出了矩阵形式描述的FMM,代替了传统FMM求解 Laplace方程的级数和形式。 E. Darve和H. Pascal(2004)给出了基于指数展开,同时在低频和高 频下稳定的新版本的FMM在Maxwell方程组求解的详细数学描述和 数值实现。类似的方法W.C. Chew也曾提到(2005)。 M. Nilsson(2002)提出了适合频域Maxwell方程的块QMR 迭代 FMM方法; 法国CERFACS的G. Alleon等2004年给出了基于MLFMM 的有效双层迭代GMRES(m)算法和稀疏近似逆预处理的数值实现。
ZnearI 数
聚集
据
转移
交
ZnearI
聚集 转移
ZnearI 数
聚集
据
转移
交
发散 换 发散 换 发散
P0
P1
Pnp-1
MLFMM的并行计算
5
Fast Algorithm
2u f n
n
n
year method
reference
storage flops
1947 GE (banded) Von Neumann, Goldstine n5
电磁散射问题的快速计算
电磁散射问题
计算复杂电大尺寸导体的雷达散射截面(RCS)
例如: 飞机 (VFY 218)
三角形网格剖分
积分方程离散
迭代法求解
预条件子
多层组划分
MLFMM
并行化
后处理
2
计算原理
Maxwell方程组 E B / t, H D / t J
D , B 0, J / t; D E, B H, J E
4
并行迭代方法
[Zij] [Ij]
向量运算(BLAS-1)
向量运算的并行
矩阵-向量乘积(BLAS-2)
结构矩阵对角化 (FFT) 稠密矩阵稀疏化 (FMM, 小波变换)
矩阵-向量乘积的并行
传统: 矩阵分块、区域分解 MLFMM: 树结构并行划分
提高并行效率
高效预条件子 (块对角、稀疏近似逆) 重排运算次序,让计算与通信的重叠 计算任务的划分尽可能保证负载平衡
SciDAC Initiative, DOE, CSGF, 2005
6
计算结果对比
2001年W.C. Chew等开发出计算电磁散射问题的并行程序 — Scale ME,该程序在SGI Origin 2000 上完成了问题规模超过 1000万的VFY 218飞机模型的RCS计算 (128个CPU,内存69G, 计算时间为7.5 hour,入射波频率为8GHz)。它显示了MLFMM 和并行处理技术在计算电磁学中的巨大作用
1994年,Illinois大学计算电磁中心的W.C. Chew等提出了多层 快速多极子方法 (MLFMM),也就是通过多层组划分和层间插 值,将迭代求解电磁场积分方程的复杂度降低到 O(NlogN)。
L. Greengard (1999) 给出了N体问题的FMM严格误差估计;S. Amini (2000) 给出了声波散射问题的FMM的误差分析;对于电 磁散射问题的FMM严格误差估计和复杂度分析,M.A. Epton和 B. Dembart (1995),J. Rahola (1998) ,法国巴黎大学的E. Darve (2001)和 Q. Carayol,F. Collino(2004)给出了许多重要结果。
电磁场积分方程
离散后的系数矩阵
zmn
S
S ' gm P(G) gndS ' dS
格林函数
由多极子展开得到 矩阵远场部分的近似
G(r, [Zmn
r') ] far
e jk|r-r'|
k 2 16 2
/ 4 | r
K
Dmp
p1
- r' Tp
| Anp
通过多层组划分和层间插值, j 1, k 2 / , /
7
国外研究现状
1987年,耶鲁大学的L. Greengard和V. Rokhlin发明了快速多极 子方法 (FMM) ,将求解多点源位势的复杂度降到O(N);
1988年,J. Carrier提出了自适应树结构策略,解决了粒子不均 匀分布时FMM的计算效率下降的问题;
1993年,R. Coifman和V. Rokhlin用FMM求解 Helmholtz型积分 方程,将求解积分方程的计算与存储的复杂度降到O(N1.5);
迭代法求解过程中的矩阵-向量乘积的复杂度降低到O(NlogN)
3
网格剖分与几何信息读入
计算流程
构造分布式八叉树
电磁场积分方程 最细层的近场信息
矩量法
近场矩阵
线性方程组 预条件子
近场作用
各层的远场信息 聚集 (内插值) 转移 (次相邻组) 发散 (外插值)
迭代法求解
矩阵-向量乘积
远场作用
向量运算
BLAS, LAPACK
n7
1950 Optimal SOR Young
n3
n4logn
1971 CG
Reid
n3
n3.5logn
1984 Full MG
Brandt
n3
n3
1987 FMM
Greengard, Rokhlin
n2logn n2logn
If n=64, this table implies an overall reduction in flops of 160 million, which meets the Moore’s Law! (doubling in 1.5 year)
计算直径为12个波长的金属球,未知量规模:172, 800
MLFMM: 内存474MB, 计算时间:21分钟(P4, 2G CPU, 1G Memory) GE: 内存2.4TB, 计算时间:约1个月 (估计值)
8
国外研究现状
V. Rokhlin(1993)给出了转移算子对角化的概念; M.A. Epton(1995)综述了FMBiblioteka Baidu在Laplace方程和HelmHoltz方程中的
相关理论; L. Greengard和V. Rokhlin (1997)提出了新版本的快速多极子方法,并
用于求解3维Laplace方程,它增加了指数展开的概念,并将其用于低 频Helmholtz方程(1998),克服了传统FMM方法的不稳定性; X.B. Sun (2001)给出了矩阵形式描述的FMM,代替了传统FMM求解 Laplace方程的级数和形式。 E. Darve和H. Pascal(2004)给出了基于指数展开,同时在低频和高 频下稳定的新版本的FMM在Maxwell方程组求解的详细数学描述和 数值实现。类似的方法W.C. Chew也曾提到(2005)。 M. Nilsson(2002)提出了适合频域Maxwell方程的块QMR 迭代 FMM方法; 法国CERFACS的G. Alleon等2004年给出了基于MLFMM 的有效双层迭代GMRES(m)算法和稀疏近似逆预处理的数值实现。
ZnearI 数
聚集
据
转移
交
ZnearI
聚集 转移
ZnearI 数
聚集
据
转移
交
发散 换 发散 换 发散
P0
P1
Pnp-1
MLFMM的并行计算
5
Fast Algorithm
2u f n
n
n
year method
reference
storage flops
1947 GE (banded) Von Neumann, Goldstine n5
电磁散射问题的快速计算
电磁散射问题
计算复杂电大尺寸导体的雷达散射截面(RCS)
例如: 飞机 (VFY 218)
三角形网格剖分
积分方程离散
迭代法求解
预条件子
多层组划分
MLFMM
并行化
后处理
2
计算原理
Maxwell方程组 E B / t, H D / t J
D , B 0, J / t; D E, B H, J E
4
并行迭代方法
[Zij] [Ij]
向量运算(BLAS-1)
向量运算的并行
矩阵-向量乘积(BLAS-2)
结构矩阵对角化 (FFT) 稠密矩阵稀疏化 (FMM, 小波变换)
矩阵-向量乘积的并行
传统: 矩阵分块、区域分解 MLFMM: 树结构并行划分
提高并行效率
高效预条件子 (块对角、稀疏近似逆) 重排运算次序,让计算与通信的重叠 计算任务的划分尽可能保证负载平衡
SciDAC Initiative, DOE, CSGF, 2005
6
计算结果对比
2001年W.C. Chew等开发出计算电磁散射问题的并行程序 — Scale ME,该程序在SGI Origin 2000 上完成了问题规模超过 1000万的VFY 218飞机模型的RCS计算 (128个CPU,内存69G, 计算时间为7.5 hour,入射波频率为8GHz)。它显示了MLFMM 和并行处理技术在计算电磁学中的巨大作用
1994年,Illinois大学计算电磁中心的W.C. Chew等提出了多层 快速多极子方法 (MLFMM),也就是通过多层组划分和层间插 值,将迭代求解电磁场积分方程的复杂度降低到 O(NlogN)。
L. Greengard (1999) 给出了N体问题的FMM严格误差估计;S. Amini (2000) 给出了声波散射问题的FMM的误差分析;对于电 磁散射问题的FMM严格误差估计和复杂度分析,M.A. Epton和 B. Dembart (1995),J. Rahola (1998) ,法国巴黎大学的E. Darve (2001)和 Q. Carayol,F. Collino(2004)给出了许多重要结果。
电磁场积分方程
离散后的系数矩阵
zmn
S
S ' gm P(G) gndS ' dS
格林函数
由多极子展开得到 矩阵远场部分的近似
G(r, [Zmn
r') ] far
e jk|r-r'|
k 2 16 2
/ 4 | r
K
Dmp
p1
- r' Tp
| Anp
通过多层组划分和层间插值, j 1, k 2 / , /
7
国外研究现状
1987年,耶鲁大学的L. Greengard和V. Rokhlin发明了快速多极 子方法 (FMM) ,将求解多点源位势的复杂度降到O(N);
1988年,J. Carrier提出了自适应树结构策略,解决了粒子不均 匀分布时FMM的计算效率下降的问题;
1993年,R. Coifman和V. Rokhlin用FMM求解 Helmholtz型积分 方程,将求解积分方程的计算与存储的复杂度降到O(N1.5);
迭代法求解过程中的矩阵-向量乘积的复杂度降低到O(NlogN)
3
网格剖分与几何信息读入
计算流程
构造分布式八叉树
电磁场积分方程 最细层的近场信息
矩量法
近场矩阵
线性方程组 预条件子
近场作用
各层的远场信息 聚集 (内插值) 转移 (次相邻组) 发散 (外插值)
迭代法求解
矩阵-向量乘积
远场作用
向量运算
BLAS, LAPACK
n7
1950 Optimal SOR Young
n3
n4logn
1971 CG
Reid
n3
n3.5logn
1984 Full MG
Brandt
n3
n3
1987 FMM
Greengard, Rokhlin
n2logn n2logn
If n=64, this table implies an overall reduction in flops of 160 million, which meets the Moore’s Law! (doubling in 1.5 year)