一种基于对抗学习的地震波阻抗反演方法[发明专利]

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 202010895121.2
(22)申请日 2020.08.31
(71)申请人 电子科技大学
地址 611731 四川省成都市高新区(西区)
西源大道2006号
(72)发明人 王峣钧 王良基 胡光岷 
(74)专利代理机构 成都虹盛汇泉专利代理有限
公司 51268
代理人 王伟
(51)Int.Cl.
G01V 1/30(2006.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于对抗学习的地震波阻抗反演方法
(57)摘要
本发明公开了一种基于对抗学习的地震波
阻抗反演方法,应用于地震数据处理领域,针对
传统高分辨率地震波阻抗反演方法中测井数据
缺乏的问题,本发明通过对神经网络的预训练获
取井数据分布信息,将训练生成对抗网络和波阻
抗反演过程结合,实现了在反演过程中无需测井
数据参与便获取高分辨率波阻抗反演结果,解决
了传统高分辨率地震波阻抗反演对测井数据的
严重依赖。

权利要求书1页 说明书9页 附图7页CN 111983681 A 2020.11.24
C N 111983681
A
1.一种基于对抗学习的地震波阻抗反演方法,其特征在于,所述方法基于的对抗网络包括:生成器网络与判别器网络;
在对抗网络训练的阶段,生成器网络的输入为训练数据与其同维度的噪声数据,生成器网络的输出为阻抗数据;判别器网络的输入包括真实地震数据以及合成地震数据,所述合成地震数据根据生成器网络输出的阻抗数据与地震子波合成;根据判别器网络的输出对生成器网络与判别器网络进行交替训练;
采用训练完成后的对抗网络进行波阻抗反演。

2.根据权利要求1所述的一种基于对抗学习的地震波阻抗反演方法,其特征在于,在对抗网络训练的阶段,生成器网络的输入的训练数据为获取的地震数据,将该地震数据作为条件数据,通过在每一道沿单道数据长度的方向拼接在噪声数据后面。

3.根据权利要求1所述的一种基于对抗学习的地震波阻抗反演方法,其特征在于,所述噪声数据采样自标准正态分布的且与训练数据具有相同维度。

4.根据权利要求1所述的一种基于对抗学习的地震波阻抗反演方法,其特征在于,在对抗网络训练的阶段,判别器网络输入的合成地震数据,具体为:生成器网络输出的阻抗数据进行反归一化后与地震子波进行卷积,得到合成地震数据。

5.根据权利要求1所述的一种基于对抗学习的地震波阻抗反演方法,其特征在于,采用训练完成后的对抗网络进行波阻抗反演时,生成器网络的输入为采样自标准正态分布的噪声数据,以及和该数据相同维度的经过标准化后的地震数据。

6.根据权利要求1所述的一种基于对抗学习的地震波阻抗反演方法,其特征在于,生成
对抗网络预训练时生成器网络的损失函数为:
其中,Seismic G 代表利用生成的阻抗合成的地震记录,Seismic R 表示真实的地震记录。

7.根据权利要求1所述的一种基于对抗学习的地震波阻抗反演方法,其特征在于,生成对抗网络训练时生成器网络的损失函数为:
Loss G =cross_entropy(Seismic G ,1)+norm(Seismic G -Seismic R )+norm(G ip -init ip )其中,Seismic G 代表利用生成的阻抗合成的地震记录,Seismic R 表示真实的地震记录,G ip 表示生成器生成的阻抗,init ip 表示初始的阻抗模型。

权 利 要 求 书1/1页CN 111983681 A
一种基于对抗学习的地震波阻抗反演方法
技术领域
[0001]本发明属于地震数据处理领域,特别涉及一种地震阻抗反演技术。

背景技术
[0002]地震波阻抗反演通过人工激发反射地震波获取地下波阻抗信息,是油气储层预测的重要技术手段。

受限于地震波频带宽度,通过常规地震反演方法很难获取高分辨率地震波阻抗信息,因此目前高分辨率地震反演仍然是地震波阻抗反演的难点问题。

目前比较常用的高分辨率地震波阻抗反演技术手段主要是地质统计学反演方法。

该技术利用了测井数据的纵向高分辨率和地震数据的横向展布特征,实现了地震数据控制下的高分辨率井插值。

其具体实现过程为通过已知测井数据构建变差函数和统计分布,将该统计分布作为先验信息,将地震数据作为似然函数,在贝叶斯框架下获取后验信息实现无井区的阻抗曲线生成。

从该实现过程可以发现,常规基于变差函数的地质统计学反演方法先验信息依赖于井数据,如果测井数据样本偏少,或者是地下储层非均质性较为严重时,得到的先验信息是不充分和不完整的,这也必将导致反演结果出现偏差。

因此,想要获得较高准确性和精度的反演结果,则需要依赖大量的井数据,而实际工作中,测井数据总是十分有限的。

[0003]地质统计学反演是目前获得高分辨率波阻抗反演结果的主要方法,但现有的地质统计学反演方法仍存在着一些问题。

首先,常规的两点地质统计学反演方法要依赖于已知的测井数据来构建变差函数,即地质统计获取的先验信息与测井数据密切相关。

这就带来了两个严重的问题:一是,当测井数据偏少时,我们所获得的先验信息是不完整的;二是,当地下地质结构变得十分复杂的时候,我们基于变差函数的地质信息描述是不充分的。

后来提出的多点地质统计学反演方法,在一定程度上克服了两点地质统计学无法很好描述复杂地下地质结构的缺陷,但也引入了新的问题。

首先,多点地质统计学的随机模拟过程十分耗时[9]。

其次,多点地质统计学对训练图片的要求高;它要求训练图像所反映的地质特征与所要模拟的储层特征必须一致。

而实际工作中往往难以得到这样高质量的训练图片。

发明内容
[0004]为解决传统高分辨率地震波阻抗反演方法中测井数据缺乏问题,本发明实现了一种基于生成对抗网络(Generate Adversarial Network,GAN)的高分辨率地震波阻抗反演方法。

[0005]本发明采用的技术方案为:一种基于对抗学习的地震波阻抗反演方法,所述方法基于的对抗网络包括:生成器网络与判别器网络;
[0006]在对抗网络训练的阶段,生成器网络的输入为训练数据与其同维度的噪声数据,生成器网络的输出为阻抗数据;判别器网络的输入包括真实地震数据以及合成地震数据,所述合成地震数据根据生成器网络输出的阻抗数据与地震子波合成;根据判别器网络的输出对生成器网络与判别器网络进行交替训练;
[0007]采用训练完成后的对抗网络进行波阻抗反演。

[0008]在对抗网络训练的阶段,生成器网络的输入的训练数据为获取的地震数据,将该地震数据作为条件数据,通过在每一道沿单道数据长度的方向拼接在噪声数据后面。

[0009]所述噪声数据采样自标准正态分布的且与训练数据具有相同维度。

[0010]在对抗网络训练的阶段,判别器网络输入的合成地震数据,具体为:生成器网络输出的阻抗数据进行反归一化后与地震子波进行卷积,得到合成地震数据。

[0011]采用训练完成后的对抗网络进行波阻抗反演时,生成器网络的输入为采样自标准正态分布的噪声数据,以及和该数据相同维度的经过标准化后的地震数据。

[0012]生成对抗网络预训练时生成器网络的损失函数为:
[0013]
[0014]其中,Seismic G代表利用生成的阻抗合成的地震记录,Seismic R表示真实的地震记录。

[0015]生成对抗网络训练时生成器网络的损失函数为:
[0016]Loss G=cross_entropy(Seismic G,1)
[0017]+norm(Seismic G-Seismic R)
[0018]+norm(G ip-init ip)
[0019]其中,Seismic G代表利用生成的阻抗合成的地震记录,Seismic R表示真实的地震记录,G ip表示生成器生成的阻抗,init ip表示初始的阻抗模型。

[0020]本发明的有益效果:本发明的方法将生成对抗网络和地震波阻抗反演相结合,通过对神经网络的预训练获取井数据分布信息,将训练生成对抗网络和波阻抗反演过程结合,可以在反演过程中无需测井数据参与便获取高分辨率波阻抗反演结果,解决了传统高分辨率地震波阻抗反演对测井数据的严重依赖;本发明的方法具备以下优点:
[0021](1)引入条件生成对抗网络,不仅能够描述更复杂的地下地质信息,而且还能引入地震数据作为条件引导反演结果;
[0022](2)引入地震数据作为训练数据,突破了传统反演方法对测井数据的严重依赖。

附图说明
[0023]图1为波阻抗反演技术流程图;
[0024]图2为两点地质统计学技术流程图;
[0025]图3为多点地质统计学技术流程图;
[0026]图4为生成对抗网络原理流程图;
[0027]图5为基于生成对抗网络的地震波阻抗反演方法;
[0028]图6为基于生成对抗网络的高分辨率地震波阻抗反演网络结构;
[0029]图7为条件生成对抗网络流程图;
[0030]图8为加入物理导向之后的单道反演结果;
[0031]图9为加入初始模型约束之后的单道反演结果;
[0032]图10为模型波阻抗及地震剖面;
[0033]其中,图10(a)为真实阻抗模型,图10(b)为合成记录;
[0034]图11为反演结果对比图;
[0035]其中,图11(a)为常规方法反演结果,图11(b)为本发明反演结果;
[0036]图12为模型反演结果的单道对比图;
[0037]图13为实际资料反演结果的单道对比图;
[0038]其中,图13(a)实际资料采用本发明方法的反演结果,图13(b)为实际资料采用常规方法的反演结果;
[0039]图14为实际资料反演结果的剖面对比图;
[0040]其中,图14(a)为A井本发明方法阻抗反演结果剖面,图14(b)为A井常规反演结果剖面;
[0041]图15为实际资料反演结果的切片对比图;
[0042]其中,图15(a)为地震数据切片,图15(b)为本发明方法反演结果切片,图15(c)为常规反演结果切片。

具体实施方式
[0043]为便于本领域技术人员理解本发明的技术内容,首先对于本发明内容相关的现有技术进行介绍:
[0044]相关现有技术如下:
[0045]1、地震波阻抗反演方法
[0046]地震波阻抗反演是利用地震资料来反演地层波阻抗的地震特殊处理解释技术,它是将叠后地震资料、测井数据及地质解释有效结合的一种地震反演技术。

该方法不仅能让地质研究人员对地质特征有更好的认识,也对油气勘探工作具有重要指导性意义。

它的核心思想就是利用测井资料纵向高分辨率和地震资料横向高分辨率的特点,再结合地质解释资料,将给定初始波阻抗模型经过迭代更新最终得到一个可读性较强的波阻抗剖面。

地震波阻抗反演方法始于上世纪70年代,当时主要研究基于褶积模型的叠后一维波阻抗反演。

1983年出现的地震资料广义线性反演方法使波阻抗反演技术进入到了一个新的发展阶段。

90年代,李宏兵又提出了递推反演与带宽约束反演相结合的方法。

[0047]地震波阻抗反演原理如下,根据Robinson褶积模型,叠后地震道可以用子波与反射系数的卷积来表示:
[0048]s(t)=w(t)*r(t)+n(t) (1)
[0049]其中,s(t)表示地震道数据,w(t)表示地震子波,r(t)表示地层反射系数,n(t)表示随机噪声。

该模型也可表示为:
[0050]
[0051]其中,W i-j+1表示子波,r j表示零偏反射系数,n i表示随机噪声,N表示反射系数序列的点数。

[0052]将上式表示成矩阵形式:
[0053]s=Wr (3)
[0054]W表示地震子波矩阵,r表示反射系数序列;
[0055]根据Russell近似公式,当地层波阻抗系数之差远小于波阻抗的绝对值时,有如下关系:
[0056]
[0057]其中,Z i为第i层的波阻抗系数。

由上述公式便可将阻抗转换为反射系数,反之也可由反射系数转换得到阻抗。

将上式表示成矩阵形式:
[0058]r=Dl (5)
[0059]
[0060]将上述关系带入式(3)得到:
[0061]s=WDl (7)
[0062]于是令G=WD,叠后波阻抗的正演模型可表示为:
[0063]s=Gl (8)
[0064]
[0065]其中,向量s表示叠后的地震记录,D表示差分矩阵,G表示正演矩阵,l表示需要反演的地层波阻抗序列。

波阻抗反演的流程如图1所示。

[0066]2、地质统计学反演方法
[0067]本世纪以来,非线性反演方法被用于波阻抗反演中,使得该项技术得到了极大的发展。

其中,地质统计学的兴起使得地质统计学反演方法受到海内外学者们的广泛关注,并取得了十分重要的发展成果。

[0068]地质统计学反演应用地质统计信息来描述解空间的先验密度函数,它主要由随机建模、对模拟结果进行优化两部分组成。

它的特点是结合了随机建模和地震反演的优势,反演结果突破了地震频带宽度的限制,从而可以获得高分辨的地层波阻抗反演结果。

并且,地质统计学反演获得的波阻抗结果与测井数据吻合较好。

传统地质统计学试图用两点之间的空间关系来对地质信息进行描述。

首先,计算待反演区域中的已知井点两两之间的变差值,并以此构建变差函数,表达式如下:
[0069]r(x,d)=0.5*E[Z(x)-Z(x+d)]2=r(d) (10)
[0070]即是在某位置x处,求出相距d的参数之差,然后取它的半方差,变差值记为r(x, d)。

其次,利用克里金方法估计出待模拟点的均值与方差。

用Z*(x0)记为某位置x0处的模拟值,λi代表克里金插值的权重,则待模拟点估计值计算方式如下所示:
[0071]
[0072]最后,利用均值和方差构建高斯分布,并采样得到该点的模拟值。

最终,将模拟结果和子波卷积,通过合成记录与实际地震资料的误差来优化模拟结果。

它的完整流程如图2所示:
[0073]随着研究的深入,人们逐渐发现仅用两点的空间关系无法描述地下复杂结构的地质信息。

为了克服上述不足,人们又提出了多点地质统计学反演方法。

多点地质统计学利用空间多个点的组合模式来描述地下地质结构信息,因此更适合于进行具有复杂结构的地质信息模拟。

首先,要得到包含待研究工区先验地质认识的训练图像。

其次,用模板来扫描训练图像生成许多的数据事件。

然后,从数据事件库中寻找与待模拟点最接近的原型,并以此构建条件概率密度函数进行随机模拟。

最终,将模拟结果和子波卷积,通过合成记录与实际地震资料的误差来优化模拟结果。

地质统计学反演的完整流程如图3所示。

[0074]3、生成对抗网络
[0075]深度学习作为机器学习的一个分支,是一种以人工神经网络为架构,对大规模数据进行表征学习的算法。

20世纪60年代开始,Ivakhnenko等提出了用于前馈的多层深度感知器,1984年提出了卷积神经网络的原始模型,2006年G.Hinton提出深度学习概念,与其团队提出的深信度网络和逐层贪心算法打开了深度学习的大门。

但是对深度学习的首次应用是在1989年,Y.LeCun等将标准反向传播算法应用于深度神经网络。

1998年,Y.LeCun提出了深度学习常用模型一卷积神经网络(Convoluted Neural Network,CNN),将深度学习推向了一个新的高度。

2014年,Goodfellow等提出了生成对抗网络(Generate Adversarial Network,GAN),受到了国内外学者和工业界的广泛关注,成为了人工智能领域的研究热点。

[0076]基于零和博弈思想的生成对抗网络(Generate Adversarial Network,GAN)可以通过无监督学习获得数据的分布,并生成较逼真的数据。

它主要由两个部分组成:生成器网络(Generator,G)和判别器网络(Discriminator,D)。

在训练过程中,生成器网络不断学习真实样本的数据分布,并不断生成与真实数据分布接近的“假”样本。

而判别器网络则是分别对输入的真实样本和生成器生成的“假”样本进行鉴别;如果输入为真实样本,则判定结果为1;如果输入的是生成器生成的“假”样本,则判定结果为0。

随着训练的不断进行,最终两者将到达一个平衡,即生成器将生成以假乱真的样本数据,而判别器对于生成器生成的样本数据,输出的判定结果也始终趋近于0.5左右。

如图4所示,为生成对抗网络(Generate Adversarial Network,GAN)的流程示意图。

[0077]以下结合附图对本发明的内容做进一步阐述:
[0078]针对现有技术中存在的地质统计学反演的不足之处,本发明引入了深度学习领域的生成对抗网络(Generate Adversarial Network,GAN)。

目的是在地震波阻抗反演中利用生成对抗网络技术获取高分辨率波阻抗反演结果,提高油气储层预测精度,并减少高分辨率反演对测井数据的依赖性。

本发明技术方案的主要内容如下:
[0079](1)通过生成对抗网络的学习和表示能力获取对地下复杂地质结构更完备的刻画。

[0080](2)将地震数据引入到训练数据中从而减少对测井数据的严重依赖。

[0081]如图5所示,本发明的具体实施过程包括以下步骤:
[0082]S1、获取训练数据。

众所周知,要训练出一个表现优异的神经网络需要大量的训练数据,而实际工作中测井数据往往是十分有限的,这使得利用测井数据来进行网络训练的
想法难以实现。

为了解决这个问题,我们将实际工作中容易获取的地震数据作为训练数据,它既解决了训练数据不足的问题,同时也极大的减轻了我们的反演结果对测井数据的依赖程度。

同时,为了使得网络更容易训练,我们将地震数据进行标准化,其表达式如下:
[0083]
[0084]其中,d std表示标准化后的地震数据,d表示原始地震数据,μ表示地震数据的均值,σ表示地震数据的标准差。

[0085]S2、获取生成器网络训练时的输入数据。

在原始的生成对抗网络中,生成器的输入数据都是从高斯分布中采样得到的噪声向量,这就导致了网络的交互性变得很差。

为了解决这一问题,本发明决定采用条件生成对抗网络(Conditional Generate Adversarial Network,CGAN)框架。

与原始的生成对抗网络相比,该网络的输入数据中还加入了带有额外信息的条件数据。

为了得到符合条件的输入数据,首先生成一个与步骤S1中训练数据同样维度的采样自标准正态分布的噪声数据。

然后,将步骤S1中的地震数据作为条件数据,每一道沿单道数据长度的方向拼接在对应的噪声数据后面。

[0086]S3、获取判别器网络的输入数据。

从生成对抗网络的原理可以知道,判别器网络的输入数据分别是:真实的地震数据和生成器生成的阻抗数据与地震子波合成的地震数据。

此时,由于生成器的生成结果是0-1之间的归一化阻抗结果,因此在与子波合成前,需要将归一化的阻抗结果进行反归一化。

此时作为“假”样本的合成地震数据与原始地震数据的值域是一致的,因此输入判别器的真实样本数据应该是未经过标准化处理的原始地震数据。

[0087]S4、训练网络。

首先从步骤S2中得到的训练数据每次取patch输入生成器网络,得到生成器生成的归一化阻抗,将该阻抗结果反归一化之后与地震子波进行卷积,卷积结果即为“假”的样本数据。

将真、假样本数据分别输入判别器网络,得到判别结果来对生成器和判别器进行交替训练。

[0088]S5、反演。

当网络训练好后,便可以进行波阻抗反演。

此时的输入数据为采样自标准正态分布的噪声数据,以及和该数据相同维度的经过标准化后的地震数据,注意此时应按照步骤S2中方式对这两组数据进行拼接。

该输入数据得到的结果便是归一化后的波阻抗反演结果,对该反演结果进行反归一化便得到最终的波阻抗反演结果。

[0089]如图6所示为基于生成对抗网络的高分辨率地震波阻抗反演网络结构图,图6中D 代表了生成对抗网络中的判别器网络,G表示其中的生成器网络。

Seismic表示真实的地震记录,Input表示步骤S2中所得到的输入数据。

图6中的output即为生成器网络生成的归一化阻抗数据,output下面的为反归一化阻抗后计算出的反射系数。

反射系数左边依次代表地震子波以及合成的地震数据synthetic seismic。

[0090]在网络训练过程中,我们生成器网络输入的是一个四维的张量,它的维度等于[Batch×NP×NT×channel],其中Batch表示输入的样本数量;NP表示的是输入样本的高度,它等于每一道的数据点个数;NT表示输入样本的宽度,即指的是每一次输入的地震道数;channel表示的是输入样本的通道数,这里等于1。

每一个样本就是一个patch,是从步骤S3的训练数据中随机选取的。

并且,输出的维度以及它所代表的意义与输入一样,在输入与输出之间有三个全连接层,它们的激活函数都是Sigmoid函数,其表达式如下:
[0091]
[0092]Sigmoid是一个数学函数,x就是这个函数的变量。

对应到本发明中这个变量等于网络最后一个全连接层未经过激活函数的输出值。

[0093]我们利用地震数据作为训练数据集来解决了训练样本不足的问题。

为了加快网络的训练和充分利用已有的测井数据,首先将从测井数据中得到的阻抗数据与相应的地震数据组成“标签-训练样本”数据对,并用这些数据对先对生成器网络进行有监督的预训练。

在预训练过程中的损失函数按如下方式计算:
[0094]
[0095]其中,第一项[G ip log(Real ip)+(1-G ip)log(1-Real ip)]表示的是生成器生成的阻抗
与真实阻抗的交叉熵,第二项表示的是真实阻抗与生成器生成阻抗的L2损失
函数。

G ip表示生成器生成的阻抗,Real ip表示真实阻抗值。

[0096]然后,当生成器网络预训练以后,再通过交替的训练生成器网络和判别器网络来对整个生成对抗网络进行训练。

首先,我们先对原始生成对抗网络的损失函数进行介绍:
[0097]
[0098]其中,G、D分别表示生成器网络和判别器网络,x、P data(x)分别表示真实样本数据以及它所服从的真实分布,z、P z(z)分别表示输入的噪声数据以及生成器学习到的分布。

[0099]其核心思想是:首先,让判别器网络D学习分辨假样本和真实样本。

当D有了一定的分辨能力之后,生成器网络G尝试用生成的假样本来欺骗D,并让D相信这些假样本是真实的。

随着D对真、假样本判别能力的增强(即学习的样本数据越来越多),G越来越难以欺骗D,因此,G也不断提升自己生成假样本的能力。

如此循环多次,D的鉴别能力和G造假的能力都在这种博弈中得到了极大的提升。

在生成对抗网络的训练过程中,我们通过最大化将标签分别正确的分配给训练样本和G生成样本的概率,来训练判别器网络D;也通过不断地最小化log(1-D(G(z))),来训练生成器网络G。

[0100]D有一定的分辨能力,应理解为:分别把真假样本送入判别器,判别器网络能够正确区分出这些样本中的一部分(这里的一部分取值为大于或等于1但是小于所有样本的总数)哪些是真,哪些是假。

但是分辨能力还不够强,所以不能正确区分出所有样本中哪些是真,哪些是假。

[0101]这里,为了避免原始生成对抗网络只输入随机噪声造成的网络交互性差的问题,本发明决定采用条件生成对抗网络(Conditional Generate Adversarial Network,CGAN)框架来增强的网络的可交互性。

条件生成对抗网络允许我们加入额外的信息来对原始生成对抗网络中生成的结果进行有针对性地引导,这个额外的信息可以是类别信息或者其他的任意信息。

下面为条件生成对抗网络的损失函数:
[0102]
[0103]其中,G、D分辨表示生成器网络和判别器网络,x、P data(x)分别表示真实样本数据以及它所服从的真实分布,z、P z(z)分别表示输入的噪声数据以及生成器学习到的分布,y 是条件数据。

从公式中可以看出,生成器生成的结果是带有y信息或者说是受到y的约束。

因。

相关文档
最新文档