有序地质量最优分割法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章有序地质量最优分割法
第一节概述
地层划分与对比是煤田地质勘探的主要任务之一。在地质工作中,通常是寻找地层的不整合或假整合界线,或者利用古生物化石、岩石矿物等地质特征对地层进行划分与对比。这种划分方法比较直观,适用于较大地层单元的划分与对比。当地质特征间的差异性不显著时,运用上述直观、定性的方法来解决较小地层单元的进一步划分就有一定的困难。因此,近年来开始利用有序地质量,即运用数学方法,并借于电子计算机定量地划分地层,提出了“有序地质量最优分割法”。
地质数据中有相当多是有序的。这些按一定顺序排列的地质变量,叫做有序地质量。例如,沿地层露头剖面采集的岩石标本;钻孔取出的岩芯样品;与这些岩石、样品有关的岩性、物理化学和古生物数据;以及地球物理测井数据等。它们都是有序地质量。这类数据的特点是样品的前后次序不能变更。所以,一些不考虑样品排列顺序的数学处理方法,对此不适用。有序地质量最优分割法,就是对一批有序数据(地质体)进行分段的统计方法。
设有n个按顺序排列的样品,每个样品测得p个变量,这批
数据可用数据矩阵的形式表示为
[]nxp
np n n p p il x x x x x x x x x x X ⎪⎪⎪⎪
⎪⎭⎫
⎝⎛==ΛM M M M ΛΛ212222111211 其中,il x 表示第i 个样品第l 个变量的取值。
若对以上n 个有序样品进行分割(分段),可能有
12
1
112211-=+++-----n n n n n c c c Λ
种划分方法,每一种分法称为一种分割。在所有这些分割中,存在这样一种分割,它使得各段(组)内部样品之间的差异性最小(即样品数据的组内离差平方和最小),而使段(组)之间的差异性最大(即样品数据的组间离差平方和最大)。这种对n 个样品分段并使组内离差平方和最小的分割方法,称为最优分割法。
样品变量总离差平方和的分解式为
B W T += (7—1)
式中,T 为总离差平方和;W 为组内离差平方和;B 为组间离差平方和。
由式(7—1)可知,如果n 个样品分为K 段,每段的样品个数为k n ,若每个样品只取一个变量,则
∑∑==-=K k n i k ik
k
x x W 11
2)(
(7—2)
∑∑∑===-=-=K
k k k K
k n i k
x x n x x B k
1
2
112
)()(
(7—3)
因此,寻求最优分割,就是用计算的分法找出使组内离差平方和(W )最小的那些分割点。这与判别分析中费歇准则相似,所以有序地质量最优分割法,有人又称为“F -分割法”或“有序样品的聚类分析”。
第二节 单元有序数据的最优分割
若有n 个有序样品,每个样品只取一个变量,则有n 个有序数据序列,为
{}n x x x X ,,,21Λ=
现在试图将这n 个样品按顺序分割为K 段,使段(组)内离平差和尽可能小,而组间离差平方和尽可能大。为此,用
{}j i i
x x
x ,,,1
Λ+表示从第i 个样品数据开始至第j 个样品数据为止的
某段样品,其中
n j i ≤≤≤1
该段样品变量的离差平方和为
()[]2
),(,∑=-=j
i
j i j i x x d αα
(7-4)
式中 ()∑=+-=j
i
x i j j i x αα11
,
由于),(j i d 能够反映样品段{}j i i x x x ,,,1Λ+内样品间差异的情况,
),(j i d 愈小,表示段内各样品之间差异性愈小;反之,),(j i d 愈大,
表示段内各样品之间差异性愈大。因此,又把),(j i d 称为{}j i ,,Λ段的直径。
若
n
个样品分为
K
段:
{}1
11211
,,,n x x x
Λ
{}{}k
Kn K K n x x x x x x
,,,,,2222221
2ΛΛΛ,为最优K 段分割。其各段离差平方
和(段直径)分别为:),(1j i d ,),(),,(2j i d j i d K Λ。根据最优分割的原则,其组内离差平方和必须满足
()
[]
()()()min
,.,,2111
2
=+++=-=∑∑==j i d j i d j i d j i x x W k K k n i k ik k
Λ
(7-5)
或 ()[]
∑==-=K
k k k x j i x n B 1
2
max ,
(7-6)
在实际应用时,往往事先不知道n 个有序样品客观上究竟能划分为几段。因此,必须从最优分成二段、三段、…、K 段进行
分析。
一、最优二段分割
若把n 个有序样品{}n x x x ,,,21Λ分为两段,则有如下1-n 种不同的分法,即
{}1x {}n x x x ,,,32Λ {}21,x x {}n x x x ,,,43Λ {}321,,x x x {}n x x x ,,,54Λ {}ΛΛΛΛΛ{}ΛΛΛΛΛ {}121,,,-n x x x Λ{}n x
在上述1-n 种分法中,究竟哪一种方法最优?只须计算出每一种分割的组内离差平方和,并从其中找出组内离差平方和()W 最小的那一种分割,就是所求的最优二段分割。
在n 个有序样品中,对任意一个()11-≤≤
n j j 都可以确定一个
二段分割,即{}j ,,1Λ{}n j ,,1Λ+。若把对n 个样品在第j 个样品处进行的二段分割的组内离差平方和记为
()()()n d d j W n ,21,1;2+= (7-7)
式中,n 表示被分割的样品数;2表示把n 个样品分为二段;
j 表示以第j 个样品为分割点。