SDM四种方法使用流程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SDM四种方法使用流程
一模糊逻辑
模糊逻辑是一种无源评价方法,是一种主观评价方法,因此它不需要输入已知矿点。
需要有若干原始证据图层。
证据图层分为类型类和等值线类两大类。
模糊逻辑对这两类图层在具体的模糊化操作上有所不同。
进行模糊逻辑评价有两大步骤,分别是隶属度图层的生成和图层信息的合成。
(1)隶属度图层的生成
隶属度图层的生成是在空间数据建模工具—模糊逻辑—模糊隶属函数下进行。
对于类型类证据图层,我们使用<模糊隶属函数>下的<类型和重分类>工具进行类型数据的隶属度图层的生成。
对于等值线类数据,我们使用和<模糊隶属函数>下的<模糊大>、<模糊小>、<模糊MS大>等工具来生成隶属度图层,具体使用哪种方法,根据评价的需要来选择,模糊大在矿产资源评价中的应用极为广泛,如果想要进行乐观评价,也可采用模糊MS大工具。
(2)图层信息合成
使用<模糊逻辑>--<模糊算子>下提供的各种模糊算子来实现若干图层之间的信息合成。
可以根据评价的需要来设计模糊推理网络,如先用一种算子合成几个图层,再用合成的结果与其他图层一起使用另一种算子合成,直到最后达到的唯一一个处于网络顶点的合成图层,就是资源环境评价的目标图层。
或者就用一种算子合成所有图层。
具体使用哪种合成方式,可以根据需要来设计。
模糊AND:对若干个数据组成的集合取最小值,即如果有m个图层参数隶属度的合成,对每个网格单元访问m个隶属度数据,取最小值为合成图层该单元的模糊隶属度值。
模糊AND在五种算子中给隶属度强度赋值的强度名列第三。
模糊OR:对若干个数据组成的集合取最大值,即如果有m个图层参与隶属度的合成,对每个网格单元访问m个隶属度数据,取最大值为合成图层该单元的模糊隶属度值。
模糊OR在5种算子中给隶属度赋值的强度名列第二。
模糊代数积:对若干个数据组成的集合取其代数积,即该集合的所有数据相乘。
对若干个数据组成的集合取其代数积,即该集合的所有数据相乘。
如果有m个图层参与隶属度的合成,对每个网格单元访问m个隶属度数据,取其代数积为合成图层该单元的模糊隶属度值。
模糊代数积在5种算子中给隶属度的赋值的强度名列第五,是赋值最低的算子。
模糊代数和:此算子的算法是1-模糊代数积。
如果有m个图层参与隶属度的合成,对每个网格单元访问m个隶属度数据,取1-代数积为合成图层该单元的模糊隶属度值。
模糊代数和在5种算子中给隶属度的赋值的强度名列第一,是赋值最高的算子。
γ算子:γ算子在模糊代数积与模糊代数和之间进行调和,找到一个居二者之间的隶属度。
γ越大,越靠近模糊代数和,γ越小,越靠近模糊代数积。
二证据权法与逻辑回归
证据权法与逻辑回归都是有源评价的方法,它需要已知目标图层,即它需要一些已知的矿点。
(一)证据权法的基本思路是:
第一,需要一个已知目标图层。
第二,需要若干证据图层,即同目标有关系的图层。
是否有关系则需要专业的石油地质研究人员确定。
第三,对每个证据图层,计算两个权系数,w+和w-,建立预测未知区目标的预测模型。
根据预测模型计算每个单元的后验概率,它是一个在0与1之间的数,数字越
大,出现目标的可能性也越大。
证据权法的输入图层是已知目标图层和证据图层,证据权法给出四个输出图层,分别是后验概率图层、置信度图层、权系数标准离差栅格、缺失数据方差栅格和总标准差图层。
其中,证据图层同样分为类型类和等值线类。
等值线类的证据图层需要转化为栅格文件才可使用。
(二)SDM中证据权法的操作流程:
1 首先根据需要进行训练点缩减,通过建立训练点随机子集,或以每个单位面积设置一个单元的抽稀方式缩减训练点数目。
这一处理过程是为证据权法服务的,该方法的假设前提是每个单元包含一个训练点。
当前掩模区中的点首先被选择,然后通过选择缩减方法选择其他的点。
2 第二步是计算证据权,对每个证据图层计算证据权,使用<计算证据权>工具对证据图层计算证据权,此工具的输出是一张权系数表。
3 计算响应图层,使用此工具通过证据权系数表中提供的推广合成证据权系数,此工具基于证据计算后验概率栅格、由权系数引起的标准离差栅格、由缺失数据引起的方差栅格、总标准差栅格、置信度栅格。
4 使用阿格特伯格-陈条件独立性检验工具对上一步的响应图层栅格进行条件独立性检验。
此工具计算两个条件独立性测度:条件独立性(CI)比值和阿格特伯格-陈条件独立性检验。
这一检验是非常必要的,因为证据权法是一种贝叶斯方法,它假定证据对于训练点具有条件独立性。
条件独立性通常要影响到后验概率。
此工具的输入时响应图层的计算结果。
(三)下面介绍一下<证据权与逻辑回归>下其他工具的使用:
逻辑回归:逻辑回归是一种统计方法,具体地说就是一种多元回归方法。
同一般线性多元回归不同的是,这种回归具有指数形式,且因变量是后验概率。
逻辑回归的思路很简单,就是把输入的证据图层值转换为同目标关系的后验概率值,后验概率越高,同目标的关系就越密切。
因为逻辑回归的很多步骤与证据权法步骤相同,所以了解了证据权法,再来了解逻辑回归就很简单。
逻辑回归的已知目标图层、证据图层、输出图层跟证据权法大同小异,而且与证据权法共享一套权系数表,所以使用方法跟<计算响应图层>工具类似。
联合证据权:联合证据权法同时完成证据权法和逻辑回归作业,包括计算证据权和对证据的推广,然后再对诸证据图层的每个有效权系数表的证据组合计算证据权和逻辑回归响应栅格。
因此,这个工具把权系数的计算和响应栅格图层的计算组合在一起。
面积频率表:面积频率可检验以确认模型的有效性。
此工具用来检验训练点分类的有效性。
详见面积频率工具帮助。
三神经网络方法
(一)神经网络的基本原理
神经网络是一种非线性方法,在解决资源环境空间分析问题方面具有独特之处。
SDM 提供了三种神经网络方法:径向基函数网络(RBFLN)、概率神经网络(PNN)和模糊聚类。
神经网络的原理简单地说就是一个输入、网络系数运算和输出的过程。
对于资源环境问题来说,输入是证据图层,输出是对目标的评价图层,网络系数运算是一个黑箱,我们可以不用了解其细节。
SDM使用的神经网络统称RBF网络,即径向基函数神经网络,其中又分为两大类:一类是有监督的网络,另一类是无监督的网络。
有监督指的是有已知目标点(如矿床点、灾害点等)约束,无监督网络则无此种约束。
有监督的网络包括RBFLN(径向基函数连接网络)和PNN(概率神经网络)两种;无监督的RBF网络称为模糊聚类。
RBF网络由四层神经元组成:第一层为输入层;第二层为RBF层,这是一个聚类层或竞争层;第三层为求和层;第四层为输出层。
第一层的意义不言自明。
第二层是RBF网络核心,它实际上是通过K-均值聚类分析获得的若干个群聚组,由第一层向第二层计算的目的是把
每个单元的输入数据转换为一个属于某个群聚组的概率、隶属度或亲近度指标。
聚类层的群聚组数量、中心(模糊均值)和模糊方差都是变化的,能否进入到某个群聚组参与该群聚组的参数计算,诸输入样品之间存在竞争,因此第二层又称竞争层。
第三层是一个求和层,即对每个输出类型求所有群聚组数值之和;第四层是输出层,将第三层的和值修改为资源环境目标要求的输出值。
RBFLN网络:是一个有监督的RBF网络,输入层除通过聚类层到求和层外,还直接连接到求和层,在这种双重连接下实现对目标的逼近。
RBFLN网络的聚类层变量是一个径向基函数值。
径向基函数是一个钟型函数,类似正态分布密度函数。
越靠近群聚组的中心,函数值越高,远离中心则函数值降低。
因此,这个值表示对某个聚类中心的亲近度。
RBFLN的最终输出是一个表示目标出现可能性的隶属度数值,其值在0与1 之间。
PNN网络:是一个有监督的RBF网络,其网络结构与RBF基本网络结构一致,但聚类层使用的是正态分布密度函数。
PNN的最终输出也是一个表示目标出现可能性的隶属度数值,其值在0与1 之间。
模糊聚类网络:是一个无监督的网络,PNN网络只有两层:输入层和输出层,输出层其实就是聚类层。
聚类层变量是径向基函数。
群聚组的数目可以在程序运行中调整。
最终的输出结果是一些独立的类型,类型间无级序关系。
(二)图层操作原理
SDM神经网络的图层操作原理由证据图层、唯一条件图层、模型训练、模型回代四个环节构成,简单地说就是输入、叠加、训练、回代输出。
第一步为输入证据图层。
第二步是将所有的证据图层简单叠加,形成一个叠加图层。
第三步是进行训练,即从原始的叠加图层中,选择若干个单元进行训练,建立预报或分类模型。
对有监督的训练来说,需要有已知的目标点作为训练的约束条件;对于无监督的训练来说,没有已知目标点的监督约束,完全是一种自由聚类的训练。
(三)输入图层和输出图层
神经网络的输入图层有点图层、证据图层和唯一条件图层。
点图层:RBFLN和PNN网络要求的点图层有已知目标点图层和无目标点图层。
模糊聚类网络中可以选择跟RBFLN和PNN网络一样的已知目标点图层和无目标点图层,也可以随机构造两个点图层,将其中一个作为“已知目标点图层”,将另一个作为“无目标点图层”。
要注意的是,对模糊逻辑网络而言,两个图层并无有目标和无目标的含义,只是一种概念上的需要。
证据图层:即类型类和等值线类两类证据图层。
下一步的叠加操作形成唯一栅格图层的操作将基于基本单位(Unique)模式。
对类型类证据图层,一个基本单位是该图的一个类型;对等值线类证据图层,基本单位为将每个等值线值转换的整数值。
唯一条件图层:点图层是神经网络的输入图层,但证据图层不是神经网络的输入图层,需要将其转换为唯一条件图层,才能作为神经网络的直接输入栅格图层。
唯一条件图层是通过诸证据图层的简单叠加获得的,叠加的条件是所有参与叠加的图层都是基本单元类型图层。
在实施叠加操作时,SDM默认被操作的图层为基本单元图层,因此用户无需选择显示模式或做任何变换。
唯一条件图层上的每个基本类型,都带有原证据图层属性,它们是神经网络的输入层数值。
神经网络的输入是一个网格单元诸属性的值。
神经网络的输出图层:RBFLN和PNN神经网络的输出为隶属度,是一个0与1 之间的数值。
模糊聚类输出的是一个类型码,哪些类型同目标关系密切需要专业人员分析和判断,最好的办法是将每个类型显示为一个单独的图层,分析其同已知目标的空间关系。
(四)训练与分类
SDM神经网络工具运行有两个基本过程:训练过程和分类过程。
训练过程和分类过程
所需的两个基本文件是训练文件和分类文件,软件已根据用户先前的输入准备好了,用户按照正确的路径找到调出就可以。
对每一种神经网络方法要生成一个训练结果文件,不用方法其后缀是不同的,应予注意。
简单地说,训练与分类的过程是:第一步训练过程,调出训练文件进行训练,生成训练结果文件,存储训练结果文件;第二步是分类过程,调出分类文件和训练结果文件,进行分类,存储分类结果。
在每完成一次神经网络运算后,不能直接显示结果。
SDM提供一个输出工具,将每次作业形成的各种神经网络结果整合到一个图层上,从这个图层可以显示原始的唯一条件类型、各种神经网络方法结果及其他辅助性数据的图形。