矿体三维模拟技术中的空间数据插值方法_劳婧华
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.基于支持向量机的插值方法 20 世纪 90 年代,V.Vapnik 等人提出了支持向量机 SVM
( Support Vector Machine)它建立在统计学习的 VC 维理论和 结构风险最小原理基础上,较好地解决了小样本、非线性、 高维数和局部极小点等实际问题。迅速发展为基于统计学习 理论 ( Statistical Learning Theory,简称 SLT) 的机器学习算 法,成功地应用于分类、函数逼近和时间序列预测等方面。 它通过寻求结构风险最小化来实现实际风险最小化和进行二 次优化,因此,在样本量较少时,也能保证所得到的解为全 局最优解。
n
∑ F ( x, y , z ) = f k ⋅ W k ( x, y , z ) k =1
Wk (x, y, z) =
1/ d k (x, y, z)μ
n
∑ 1/ 特点:易于理解,便于计算;考虑了 待求点与已知点之间的距离对插值结果的影响;没考虑由采 样点分布形式产生的已知点“丛聚效应”;对于属性各向异 性的研究对象,距离幂次反比法不能得出正确权重及属性值。
图 2 BP 神经网络基本结构
BP 学习算法的基本思想是使用梯度搜索技术,以期使网 络的实际输出与期望输出的均方差最小。
将此方法应用于空间插值的主要原理是:建立空间属性 分布模型,将样本位置与样本属性间的关系视为复杂函数, 其中仅有少量经过考虑的输入输出对为已知,通过神经网络 学习得到样品位置和属性的关系函数或映射,以此估算其它 未知点属性。对于该插值方法目前主要是将其用于矿石品位 的估算研究中,虽然该方法在计算中显示出一定的潜力,但 现在仍处在研究的过程中,其在理论和实践上仍有待于更大 程度上的深入。
方法,称之为普通克立格法。还有一些譬如:泛克立格法、 对数克立格法、协同克立格法、指示克立格法等,它们都是 普通克立格法的各种改进形式和在一些特殊条件下的应用。
克立格法的特点:变异函数既可以反映变量空间的结构 性,又可以反映变量空间分布的随机性;充分考虑各采样点 属性之间的相关性和变异性,通过区域化变量理论,能够较 好地解决采样点之间的“丛聚效应”、各向异性等问题;适宜 构造规则空间数据,可以描述采样点在拓扑空间和属性空间 的变化。
3.克里格法
克立格法(Kriging)最早是由南非采矿工程师 D.G.Krige 于 1951 年提出用于矿床品位及储量计算的一种方法。19 世纪
【收稿日期】2008-05-17 【作者简介】劳婧华,女,广西北海人,平顶山工学院电气与电子工程系助教,从事仿真及三维模拟技术研究。
- 100 -
60 年代法国学者 G.Matheron 对它进一步概括和完善从而发 展成为一种地质统计学的方法。该方法是以区域化变量理论 为基础、以变异函数为基本工具,能够用来研究分布于空间 并呈现出一定结构性和随机性的数据场,并对这些数据进行 最优、线性、无偏内插估计。该法目前已经推广到环保、农 林、气象、水利等多种学科及领域中。
2008 年第 8 期 (总第 108 期)
大众科技 DA ZHONG KE JI
No.8,2008 (Cumulatively No.108)
矿体三维模拟技术中的空间数据插值方法
劳婧华,余东明
(平顶山工学院,河南 平顶山 467000)
【摘 要】要进行矿体的三维模拟仿真,必须要将有限的工程采样数据经过空间插值计算整理成三维空间体数据,文章结
值法介绍[J].物探化探计算技术,2002,24(2):157-162. [5] Shepard D. A Two Dimensional Interpolation Function for
Irregularly Spaced Data[J].Proceedings of ACM 23rd National Conference.1968,517-524.
正是因为克立格法这些优点,所以目前大部分的矿体三 维模拟技术都采用这种方法作为空间数据插值手段。
4.神经网络法 人工神经网络是 20 世纪 80 年代获得迅速发展的一门非 线性科学。它力图建立一个模仿人脑某些功能的模型。该模 型是以大量的简单神经元相互连接而形成的一种网络计算结 构,具有联想存储、自组织、自适应和自学习等特点。它能 通过对已知外界的样本学习,寻找到隐含在样本中的特征和 规则,最终推断出未知的外界属性。神经网络有许多种模型, 但 广 泛 采 用 并 被 人 们 接 受 的 是 采 用 BP 学 习 算 法 ( Back Propagation Learning Algorithm)的 BP 神经网络模型。基 本的 BP 网是三层网络模型,即输入层、隐含层和输出层(如 图 2)。
王志民、童光煦则把分形理论的思想引入到幂指数的确 定中,从几何角度出发,提出了一种分形幂指数确定方法, 并通过对实际数据的交叉验证,证明了其可行性。
以上这些在地矿工程实际中的研究,重点集中在对权系数 的合理改进及幂指数的具体确定上,使之更符合矿体空间变异 性的实际情况。这些方法对于如何更好地在地矿工程中应用距 离幂次反比法进行空间插值计算提供了参考和借鉴的意义。
- 101 -
(一)空间数据插值方法
1.多边形法 多边形法全称泰森(Thiessen)多边形法,由荷兰气象 学家 A.H.Thiessen 提出的一种插值分析方法。最初是用于从 离散分布气象站的降雨量数据中计算平均降雨量。多边形法 插值法是将平面按照已知点为中心分成若干个多边形,多边 形内的每一点的属性都由那个已知点来决定,如图 1。这是一 种原理简单,而且在某些应用方面精度较高的插值方法,在 地学、资源、环境、气象等方面的研究中作为一种由点到面 的插值方法被广泛的应用。泰森多边形有以下重要的性质: (1)每个多边形所控制的区域的属性都由内部的原始已知点 的属性决定;(2)多边形内任意点与其内部已知点的距离均小 于与外部其它已知点的距离;(3)位于多边形边界上的点到以 此边为公共边的相邻多边形内的原始已知点的距离相等。
图 1 泰森多边形
根据未知点所处的已知原始点控制的多边形这一特性计 算出未知点的属性。一般的推断是运用公式:Z(A)=Z(O)·f(d)
式中:Z(O)为已知原始点的属性值;Z(A)为所要求的未 知点的属性值;f(d)为 OA 之间的距离函数。
由其插值原理可看出其只能用于平面,但通过对三维空 间分层就可以将看似空间插值问题转化成若干个平面插值问
100矿体三维模拟技术中的空间数据插值方法劳婧华余东明平顶山工学院河南平顶山467000摘要要进行矿体的三维模拟仿真必须要将有限的工程采样数据经过空间插值计算整理成三维空间体数据文章结合我国的矿体仿真技术分别介绍了几种成熟和较新的空间数据插值技术并对各自特点进行对比总结最后对矿体模拟技术中插值方法的发展提出简单的预测
支持向量机现在已被广泛并成熟的运用于各种分类和预 测问题的研究中。而在地矿工程领域中,矿体空间数据的插 值问题可以看作一种对采样数据及其各个影响因子间的复杂 的非线性函数关系的逼近问题。基于这一前提,可以考虑地 把 SVM 理论引入到空间数据的插值计算中,目前这一理论已 经在石油工程中测井的信息数据重构和预测以及缺失数据补 齐中取得很好的应用效果,但在矿体三维模拟技术中,尚无 成熟应用,不过这种方法已经引起了关注,北京科技大学等 单位已经开始运用 SVM 理论从事矿体空间数据插值的研究。
题,这样可以做到空间数据的插值计算。
该方法特点是简单、形象、直观,但是多边形构造时因 为采样点的布局容易产生奇异多边形,并且计算粗略,估值 准确程度差。
2.距离幂次反比法 距离幂次反比法首先是由气象学家和地质工作者提出 的,后来由于 D. Shepard 的工作,所以又被称作 Shepard 法, 是一种常见的广泛应用的插值方法。它将待求点属性值 F(x,y,z)定义为各已知点属性 fk 对待求点和各已知点间距离 反比的加权平均值,计算公式如下:
(二)总结与展望
通过以上对各种插值方法的分析,可以看出它们各自具 有自身的优势和缺陷,而且技术的成熟程度和应用的范围也 各不相同。现阶段,在矿体三维模拟及矿床计算方面采用的 插值方法还是以多边形法、距离幂次反比法和克里格法为主, 其中公认最好的方法当属克里格法,多边形法、距离幂次反 比法以其简单易算也受到极大的欢迎。而神经网络法和支持 向量机法的应用和研究极少。但是由于矿体采样数据本身具 有的空间性、各向异性,不连续性和非线性等复杂的特点, 传统的插值方法已经很难适应真三维模拟及计算的要求,随 着计算机硬件技术的飞速提高以及算法语言的快速发展,神 经网络法和支持向量机法的优势会得到充分的发挥,尤其是 支持向量机法,将会是以后矿体空间数据插值方法研究的一 个重要方向。
该方法的优点:所采用的结构风险最小准则保证了在 “最坏情形下”的学习机器的泛化能力;它把“原始问题” 利用对偶法则转化为凸二次优化问题,保证了求解对象解的 惟一性;能有效地对小样本进行处理,无论所采用的训练样 本有多丰富,相比于原问题都是小样本;已应用的研究结果 表明此法比 BP 神经网络法的预测结果要更优。
对于空间中某一待求点属性的估计值可以用 Z*(x0)该待 求点影响范围内 n 个有效样品值的线性组合得到,即
n
∑ Z * (x0 ) = i=1 λi Z (xi ) , i =1,2,…, n
式中:Z(xi)是已知点 xi 处的采样值;λi 为加权因子 以上是克立格法中最基本、最重要、应用最广泛的一种
合我国的矿体仿真技术,分别介绍了几种成熟和较新的空间数据插值技术,并对各自特点进行对比总结,最后对矿体模拟技术
中插值方法的发展提出简单的预测。
【关键词】矿体模拟;空间数据;插值方法
【中图分类号】TD164;TP182
【文献标识码】A
【文章编号】1008-1151(2008)08-0100-02
在矿体的可视化研究中,矿体的三维模拟仿真是其核心 内容。实现三维仿真的基本思路是:获取地质勘探和生产勘 探的原始采样资料,整理转换为空间离散点数据,利用一定 的空间插值方法加密出规则的结构化数据。形成三维空间体 数据,再运用光线投射法的原理,直接将整个的三维数据空 间投影到二维屏幕上,实现矿体的真三维显示。因此能否比 较真实、有效的模拟矿体,获得最佳的矿体模型,服务于矿 产资源的开发,其中空间数据插值起到了极其重要的作用。 而合理适宜的插值方法是描述接近真实情况,揭示矿体内部 规律的关键。
矿体的空间属性往往呈各向异性,这使它的估算精度受 到极大的限制,给它的应用带来了困难。因此,多年来,有 关学者提出了种种改进的方法用以提高估值精度。
例如杨晓雷结合地质统计学中的区域化变量理论对其进 行改造,利用变异函数分析各方向上空间变异性,一定程度 上弥补了距离幂次反比法在空间变异性上的不足。
王铁等总结出一套距离幂次反比法的改进措施及参数的 确定方法,提高了距离幂次反比法的实用价值。
【参考文献】 [1] 唐泽圣.三维数据场可视化[M].北京:清华大学出版社,1999. [2] 李翠平.面向地矿工程的体视化技术及其应用[D].北京:北
京科技大学资源开发工程系,2002. [3] 李仲学,等.地矿工程三维可视化技术[M].北京:科学出版
社,2007. [4] 白世彪,陈晔,王建.等值线绘图软件 SURFER7.0 中的九种插
支持向量机(SVM)的基本思想是:首先通过非线性变 换将输入向量映射到高维特征空间,在这个空间中根据 Mercer 条件,定义核函数构造最优决策函数,在构造最优决 策函数时应用结构风险最小化原则,并巧妙地利用原空间的 核函数取代高维特征空间中的点积运算。这种方法把在样本 原空间中的非线性问题投影到另外一个空间中,把非线性问 题转化为线性问题来处理。
( Support Vector Machine)它建立在统计学习的 VC 维理论和 结构风险最小原理基础上,较好地解决了小样本、非线性、 高维数和局部极小点等实际问题。迅速发展为基于统计学习 理论 ( Statistical Learning Theory,简称 SLT) 的机器学习算 法,成功地应用于分类、函数逼近和时间序列预测等方面。 它通过寻求结构风险最小化来实现实际风险最小化和进行二 次优化,因此,在样本量较少时,也能保证所得到的解为全 局最优解。
n
∑ F ( x, y , z ) = f k ⋅ W k ( x, y , z ) k =1
Wk (x, y, z) =
1/ d k (x, y, z)μ
n
∑ 1/ 特点:易于理解,便于计算;考虑了 待求点与已知点之间的距离对插值结果的影响;没考虑由采 样点分布形式产生的已知点“丛聚效应”;对于属性各向异 性的研究对象,距离幂次反比法不能得出正确权重及属性值。
图 2 BP 神经网络基本结构
BP 学习算法的基本思想是使用梯度搜索技术,以期使网 络的实际输出与期望输出的均方差最小。
将此方法应用于空间插值的主要原理是:建立空间属性 分布模型,将样本位置与样本属性间的关系视为复杂函数, 其中仅有少量经过考虑的输入输出对为已知,通过神经网络 学习得到样品位置和属性的关系函数或映射,以此估算其它 未知点属性。对于该插值方法目前主要是将其用于矿石品位 的估算研究中,虽然该方法在计算中显示出一定的潜力,但 现在仍处在研究的过程中,其在理论和实践上仍有待于更大 程度上的深入。
方法,称之为普通克立格法。还有一些譬如:泛克立格法、 对数克立格法、协同克立格法、指示克立格法等,它们都是 普通克立格法的各种改进形式和在一些特殊条件下的应用。
克立格法的特点:变异函数既可以反映变量空间的结构 性,又可以反映变量空间分布的随机性;充分考虑各采样点 属性之间的相关性和变异性,通过区域化变量理论,能够较 好地解决采样点之间的“丛聚效应”、各向异性等问题;适宜 构造规则空间数据,可以描述采样点在拓扑空间和属性空间 的变化。
3.克里格法
克立格法(Kriging)最早是由南非采矿工程师 D.G.Krige 于 1951 年提出用于矿床品位及储量计算的一种方法。19 世纪
【收稿日期】2008-05-17 【作者简介】劳婧华,女,广西北海人,平顶山工学院电气与电子工程系助教,从事仿真及三维模拟技术研究。
- 100 -
60 年代法国学者 G.Matheron 对它进一步概括和完善从而发 展成为一种地质统计学的方法。该方法是以区域化变量理论 为基础、以变异函数为基本工具,能够用来研究分布于空间 并呈现出一定结构性和随机性的数据场,并对这些数据进行 最优、线性、无偏内插估计。该法目前已经推广到环保、农 林、气象、水利等多种学科及领域中。
2008 年第 8 期 (总第 108 期)
大众科技 DA ZHONG KE JI
No.8,2008 (Cumulatively No.108)
矿体三维模拟技术中的空间数据插值方法
劳婧华,余东明
(平顶山工学院,河南 平顶山 467000)
【摘 要】要进行矿体的三维模拟仿真,必须要将有限的工程采样数据经过空间插值计算整理成三维空间体数据,文章结
值法介绍[J].物探化探计算技术,2002,24(2):157-162. [5] Shepard D. A Two Dimensional Interpolation Function for
Irregularly Spaced Data[J].Proceedings of ACM 23rd National Conference.1968,517-524.
正是因为克立格法这些优点,所以目前大部分的矿体三 维模拟技术都采用这种方法作为空间数据插值手段。
4.神经网络法 人工神经网络是 20 世纪 80 年代获得迅速发展的一门非 线性科学。它力图建立一个模仿人脑某些功能的模型。该模 型是以大量的简单神经元相互连接而形成的一种网络计算结 构,具有联想存储、自组织、自适应和自学习等特点。它能 通过对已知外界的样本学习,寻找到隐含在样本中的特征和 规则,最终推断出未知的外界属性。神经网络有许多种模型, 但 广 泛 采 用 并 被 人 们 接 受 的 是 采 用 BP 学 习 算 法 ( Back Propagation Learning Algorithm)的 BP 神经网络模型。基 本的 BP 网是三层网络模型,即输入层、隐含层和输出层(如 图 2)。
王志民、童光煦则把分形理论的思想引入到幂指数的确 定中,从几何角度出发,提出了一种分形幂指数确定方法, 并通过对实际数据的交叉验证,证明了其可行性。
以上这些在地矿工程实际中的研究,重点集中在对权系数 的合理改进及幂指数的具体确定上,使之更符合矿体空间变异 性的实际情况。这些方法对于如何更好地在地矿工程中应用距 离幂次反比法进行空间插值计算提供了参考和借鉴的意义。
- 101 -
(一)空间数据插值方法
1.多边形法 多边形法全称泰森(Thiessen)多边形法,由荷兰气象 学家 A.H.Thiessen 提出的一种插值分析方法。最初是用于从 离散分布气象站的降雨量数据中计算平均降雨量。多边形法 插值法是将平面按照已知点为中心分成若干个多边形,多边 形内的每一点的属性都由那个已知点来决定,如图 1。这是一 种原理简单,而且在某些应用方面精度较高的插值方法,在 地学、资源、环境、气象等方面的研究中作为一种由点到面 的插值方法被广泛的应用。泰森多边形有以下重要的性质: (1)每个多边形所控制的区域的属性都由内部的原始已知点 的属性决定;(2)多边形内任意点与其内部已知点的距离均小 于与外部其它已知点的距离;(3)位于多边形边界上的点到以 此边为公共边的相邻多边形内的原始已知点的距离相等。
图 1 泰森多边形
根据未知点所处的已知原始点控制的多边形这一特性计 算出未知点的属性。一般的推断是运用公式:Z(A)=Z(O)·f(d)
式中:Z(O)为已知原始点的属性值;Z(A)为所要求的未 知点的属性值;f(d)为 OA 之间的距离函数。
由其插值原理可看出其只能用于平面,但通过对三维空 间分层就可以将看似空间插值问题转化成若干个平面插值问
100矿体三维模拟技术中的空间数据插值方法劳婧华余东明平顶山工学院河南平顶山467000摘要要进行矿体的三维模拟仿真必须要将有限的工程采样数据经过空间插值计算整理成三维空间体数据文章结合我国的矿体仿真技术分别介绍了几种成熟和较新的空间数据插值技术并对各自特点进行对比总结最后对矿体模拟技术中插值方法的发展提出简单的预测
支持向量机现在已被广泛并成熟的运用于各种分类和预 测问题的研究中。而在地矿工程领域中,矿体空间数据的插 值问题可以看作一种对采样数据及其各个影响因子间的复杂 的非线性函数关系的逼近问题。基于这一前提,可以考虑地 把 SVM 理论引入到空间数据的插值计算中,目前这一理论已 经在石油工程中测井的信息数据重构和预测以及缺失数据补 齐中取得很好的应用效果,但在矿体三维模拟技术中,尚无 成熟应用,不过这种方法已经引起了关注,北京科技大学等 单位已经开始运用 SVM 理论从事矿体空间数据插值的研究。
题,这样可以做到空间数据的插值计算。
该方法特点是简单、形象、直观,但是多边形构造时因 为采样点的布局容易产生奇异多边形,并且计算粗略,估值 准确程度差。
2.距离幂次反比法 距离幂次反比法首先是由气象学家和地质工作者提出 的,后来由于 D. Shepard 的工作,所以又被称作 Shepard 法, 是一种常见的广泛应用的插值方法。它将待求点属性值 F(x,y,z)定义为各已知点属性 fk 对待求点和各已知点间距离 反比的加权平均值,计算公式如下:
(二)总结与展望
通过以上对各种插值方法的分析,可以看出它们各自具 有自身的优势和缺陷,而且技术的成熟程度和应用的范围也 各不相同。现阶段,在矿体三维模拟及矿床计算方面采用的 插值方法还是以多边形法、距离幂次反比法和克里格法为主, 其中公认最好的方法当属克里格法,多边形法、距离幂次反 比法以其简单易算也受到极大的欢迎。而神经网络法和支持 向量机法的应用和研究极少。但是由于矿体采样数据本身具 有的空间性、各向异性,不连续性和非线性等复杂的特点, 传统的插值方法已经很难适应真三维模拟及计算的要求,随 着计算机硬件技术的飞速提高以及算法语言的快速发展,神 经网络法和支持向量机法的优势会得到充分的发挥,尤其是 支持向量机法,将会是以后矿体空间数据插值方法研究的一 个重要方向。
该方法的优点:所采用的结构风险最小准则保证了在 “最坏情形下”的学习机器的泛化能力;它把“原始问题” 利用对偶法则转化为凸二次优化问题,保证了求解对象解的 惟一性;能有效地对小样本进行处理,无论所采用的训练样 本有多丰富,相比于原问题都是小样本;已应用的研究结果 表明此法比 BP 神经网络法的预测结果要更优。
对于空间中某一待求点属性的估计值可以用 Z*(x0)该待 求点影响范围内 n 个有效样品值的线性组合得到,即
n
∑ Z * (x0 ) = i=1 λi Z (xi ) , i =1,2,…, n
式中:Z(xi)是已知点 xi 处的采样值;λi 为加权因子 以上是克立格法中最基本、最重要、应用最广泛的一种
合我国的矿体仿真技术,分别介绍了几种成熟和较新的空间数据插值技术,并对各自特点进行对比总结,最后对矿体模拟技术
中插值方法的发展提出简单的预测。
【关键词】矿体模拟;空间数据;插值方法
【中图分类号】TD164;TP182
【文献标识码】A
【文章编号】1008-1151(2008)08-0100-02
在矿体的可视化研究中,矿体的三维模拟仿真是其核心 内容。实现三维仿真的基本思路是:获取地质勘探和生产勘 探的原始采样资料,整理转换为空间离散点数据,利用一定 的空间插值方法加密出规则的结构化数据。形成三维空间体 数据,再运用光线投射法的原理,直接将整个的三维数据空 间投影到二维屏幕上,实现矿体的真三维显示。因此能否比 较真实、有效的模拟矿体,获得最佳的矿体模型,服务于矿 产资源的开发,其中空间数据插值起到了极其重要的作用。 而合理适宜的插值方法是描述接近真实情况,揭示矿体内部 规律的关键。
矿体的空间属性往往呈各向异性,这使它的估算精度受 到极大的限制,给它的应用带来了困难。因此,多年来,有 关学者提出了种种改进的方法用以提高估值精度。
例如杨晓雷结合地质统计学中的区域化变量理论对其进 行改造,利用变异函数分析各方向上空间变异性,一定程度 上弥补了距离幂次反比法在空间变异性上的不足。
王铁等总结出一套距离幂次反比法的改进措施及参数的 确定方法,提高了距离幂次反比法的实用价值。
【参考文献】 [1] 唐泽圣.三维数据场可视化[M].北京:清华大学出版社,1999. [2] 李翠平.面向地矿工程的体视化技术及其应用[D].北京:北
京科技大学资源开发工程系,2002. [3] 李仲学,等.地矿工程三维可视化技术[M].北京:科学出版
社,2007. [4] 白世彪,陈晔,王建.等值线绘图软件 SURFER7.0 中的九种插
支持向量机(SVM)的基本思想是:首先通过非线性变 换将输入向量映射到高维特征空间,在这个空间中根据 Mercer 条件,定义核函数构造最优决策函数,在构造最优决 策函数时应用结构风险最小化原则,并巧妙地利用原空间的 核函数取代高维特征空间中的点积运算。这种方法把在样本 原空间中的非线性问题投影到另外一个空间中,把非线性问 题转化为线性问题来处理。