有序地质量最优分割法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第七章有序地质量最优分割法

第一节概述

地层划分与对比是煤田地质勘探的主要任务之一。在地质工作中,通常是寻找地层的不整合或假整合界线,或者利用古生物化石、岩石矿物等地质特征对地层进行划分与对比。这种划分方法比较直观,适用于较大地层单元的划分与对比。当地质特征间的差异性不显著时,运用上述直观、定性的方法来解决较小地层单元的进一步划分就有一定的困难。因此,近年来开始利用有序地质量,即运用数学方法,并借于电子计算机定量地划分地层,提出了“有序地质量最优分割法”。

地质数据中有相当多是有序的。这些按一定顺序排列的地质变量,叫做有序地质量。例如,沿地层露头剖面采集的岩石标本;钻孔取出的岩芯样品;与这些岩石、样品有关的岩性、物理化学和古生物数据;以及地球物理测井数据等。它们都是有序地质量。这类数据的特点是样品的前后次序不能变更。所以,一些不考虑样品排列顺序的数学处理方法,对此不适用。有序地质量最优分割法,就是对一批有序数据(地质体)进行分段的统计方法。

设有n个按顺序排列的样品,每个样品测得p个变量,这批

数据可用数据矩阵的形式表示为

[]nxp

np n n p p il x x x x x x x x x x X ⎪⎪⎪⎪

⎪⎭⎫

⎝⎛==ΛM M M M ΛΛ212222111211 其中,il x 表示第i 个样品第l 个变量的取值。

若对以上n 个有序样品进行分割(分段),可能有

12

1

112211-=+++-----n n n n n c c c Λ

种划分方法,每一种分法称为一种分割。在所有这些分割中,存在这样一种分割,它使得各段(组)内部样品之间的差异性最小(即样品数据的组内离差平方和最小),而使段(组)之间的差异性最大(即样品数据的组间离差平方和最大)。这种对n 个样品分段并使组内离差平方和最小的分割方法,称为最优分割法。

样品变量总离差平方和的分解式为

B W T += (7—1)

式中,T 为总离差平方和;W 为组内离差平方和;B 为组间离差平方和。

由式(7—1)可知,如果n 个样品分为K 段,每段的样品个数为k n ,若每个样品只取一个变量,则

∑∑==-=K k n i k ik

k

x x W 11

2)(

(7—2)

∑∑∑===-=-=K

k k k K

k n i k

x x n x x B k

1

2

112

)()(

(7—3)

因此,寻求最优分割,就是用计算的分法找出使组内离差平方和(W )最小的那些分割点。这与判别分析中费歇准则相似,所以有序地质量最优分割法,有人又称为“F -分割法”或“有序样品的聚类分析”。

第二节 单元有序数据的最优分割

若有n 个有序样品,每个样品只取一个变量,则有n 个有序数据序列,为

{}n x x x X ,,,21Λ=

现在试图将这n 个样品按顺序分割为K 段,使段(组)内离平差和尽可能小,而组间离差平方和尽可能大。为此,用

{}j i i

x x

x ,,,1

Λ+表示从第i 个样品数据开始至第j 个样品数据为止的

某段样品,其中

n j i ≤≤≤1

该段样品变量的离差平方和为

()[]2

),(,∑=-=j

i

j i j i x x d αα

(7-4)

式中 ()∑=+-=j

i

x i j j i x αα11

,

由于),(j i d 能够反映样品段{}j i i x x x ,,,1Λ+内样品间差异的情况,

),(j i d 愈小,表示段内各样品之间差异性愈小;反之,),(j i d 愈大,

表示段内各样品之间差异性愈大。因此,又把),(j i d 称为{}j i ,,Λ段的直径。

n

个样品分为

K

段:

{}1

11211

,,,n x x x

Λ

{}{}k

Kn K K n x x x x x x

,,,,,2222221

2ΛΛΛ,为最优K 段分割。其各段离差平方

和(段直径)分别为:),(1j i d ,),(),,(2j i d j i d K Λ。根据最优分割的原则,其组内离差平方和必须满足

()

[]

()()()min

,.,,2111

2

=+++=-=∑∑==j i d j i d j i d j i x x W k K k n i k ik k

Λ

(7-5)

或 ()[]

∑==-=K

k k k x j i x n B 1

2

max ,

(7-6)

在实际应用时,往往事先不知道n 个有序样品客观上究竟能划分为几段。因此,必须从最优分成二段、三段、…、K 段进行

分析。

一、最优二段分割

若把n 个有序样品{}n x x x ,,,21Λ分为两段,则有如下1-n 种不同的分法,即

{}1x {}n x x x ,,,32Λ {}21,x x {}n x x x ,,,43Λ {}321,,x x x {}n x x x ,,,54Λ {}ΛΛΛΛΛ{}ΛΛΛΛΛ {}121,,,-n x x x Λ{}n x

在上述1-n 种分法中,究竟哪一种方法最优?只须计算出每一种分割的组内离差平方和,并从其中找出组内离差平方和()W 最小的那一种分割,就是所求的最优二段分割。

在n 个有序样品中,对任意一个()11-≤≤

n j j 都可以确定一个

二段分割,即{}j ,,1Λ{}n j ,,1Λ+。若把对n 个样品在第j 个样品处进行的二段分割的组内离差平方和记为

()()()n d d j W n ,21,1;2+= (7-7)

式中,n 表示被分割的样品数;2表示把n 个样品分为二段;

j 表示以第j 个样品为分割点。

相关文档
最新文档