【免费下载】变差函数的概念与计算分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
变差函数的概念与计算
谷跃民编写
在地质统计学随机模拟工作中,统计归纳区域变量的分布和变差函数,是
用好随机模拟技术最关键的两项工作,其中区域变量分布统计比较容易理解,
变差函数计算过程相对复杂,影响了解释人员对它的直观理解,为了使解释生
产人员快速了解变差函数,准确使用相关工具软件,并能依据现有的资料和对
工区地质情况的先验信息,统计归纳出合乎实际的变差函数,作者在学习相关
知识的基础上,对学习材料进行了初步总结,试图用通俗的方式,对变差函数
的概念和统计归纳方法与大家共同进行探讨。
一、变差函数的基本概念
在地质统计学中,变差函数是最基本与最重要的模拟工具,它用于描述数
据值的空间互相关,数据点在空间上相距越远,相关性就变得越小,变差函数
就是模拟这种现象的数学函数,通常用一张图来展示,用X轴表示滞后距离,
用Y轴表示方差,可以从区域变量
抽取的样本值中计算归纳出来,
见图1,它通过变程来反映变量
的影响范围,V(h)为变差函数值,
Lag(h)为滞后距。
变差函数可以用四个参数来描
述:
1、变差函数类型:决定了随着滞图1 变差函数图示
后距的增加变差(方差)变化的快慢,
在JASON STATMOD MC中,使用GAUSSIAN和EXPONENTIAL曲线类型;
2、变程a:指的是在超过这个距离后,数据点之间就不再有明显的相关性,也称作影响距离;
3、块金效应C0:表示在距离为0时的方差值,用来表示相距很近的两点的样品变化情况;
4、先验方差:Sill=C+C0也叫基台值,它反映变量的变化幅度。
二、变差函数的估算与拟合
1、变差函数的计算公式与估算
变差函数的定义是:区域化变量Z(x)和Z(x+h)两点之差的方差之半,定义为Z(x)的变差函数,数学定义如下:
h为滞后距。
如果有了区域化变量Z(x)的一部分采样,就可以估算该区域化变量的Z(x)变差函数,具体计算公式如下:
i为样本序号。
2、变差函数的估算示例
为了能更直观、更深刻地体会它的具体意义,下面举两个计算实例,各具体计算两个变差函数值,通过具体计算过程,就会知道什么样的资料可以满足变差函数估算的要求,具体在资料条件会出现怎样的异常,这两个实例分别为两种区域变量类型,一个是垂向区域变量类型,可以理解为井曲线等,一个是平面区域变量类型,可以理解为孔隙度平面变化等。
(1)垂向区域变量类型变差函数值计算示例。
右图为一口井的孔隙度曲线,纵向
采样间隔为1米,右侧为其数值,首先
根据公式1-2,求取h=1米时,v(1)
的数值,步骤如下:
①将数据下移1米,与原始数据对齐;
见图3a;
②找到对应数据对,求得各数据对的差
值,分别为:0.75、-2.75……、1等, 图2 孔隙度曲线
共26个数值;
③求取以上个数值的平方,再求和,得
0.752+(-2.75)2+……+12=27.625;
④由于共有26个数据对,因此,N=26,
所以,v(1)= 27.625/(2×26)=0.53125。
同理可以根据公式1-2,求取h=2米
时,v(2)的数值,步骤如下:
①将数据下移2米,与原始数据对齐;
见图3b ;
a
b
②找到对应数据对,求得各数据对的差
图3 v(1)和v(2)数据对
值,分别为:-2、-4……、1等,共组成了25个数据对,因此共有25个数值;
③求取以上个数值的平方,再求和,得(-2)2+(-4)2+……+12=43.6875;
④由于共有25个数据对,因此,N=25,所以,v(2)=
43.6875/(2×25)
=0.87375。
(2)平面区域变量类型变差函数值计算示例。
右图4为一假设的平面地质属性数据,其南北和东西间距都为1,
假定这一地质属性具有各向异性
特征,就应当计算它不同方向的
变差函数值,那么,这时滞后距
图4 平面地质属性数据
h 是指向某方向移动的距离,计算时,在指定方向上,对指定的h ,搜索所有相
距h 的点对[Z(x i ), [Z(x i +h)],并统计点对个数N ,其它步骤与前述垂向区域变量
类型变差函数值计算步骤是相同的,以下是不同方向两个滞后距的计算结果。
东西方向移动1个单位距离,共组成6个数据对,因此,N=6,变差函数
值为:
东西方向移动2个单位距离,共组成3个数据对,因此,N=3,变差函数
值为:
北
西北
东北
南北方向移动1个单位距离,共组成6个数据对,因此,N=6,变差函数值为:
南北方向移动2个单位距离,共组成3个数据对,因此,N=3,变差函数值为:
从北东向南西方向移动个单位距离,共组成4个数据对,因此,N=4,变差函数值为:
从北东向南西方向移动2 个单位距离,共组成1个数据对,因此,N=1,变差函数值为:
从北西向南东方向移动个单位距离,共组成4个数据对,因此,N=4,变差函数值为:
从北西向南东方向移动2 个单位距离,共组成1个数据对,因此,N=1,变差函数值为:
如果确信变差值与方向无关,也可以将这些计算结果,放到一张变差函数图上,来拟合确定一个变差函数。
3、变差函数的拟合
在统计模拟中,变差函数采用的是一个解析函数,因此,计算出样本值的
不同滞后距h的变差值V(h)
后,还必须拟合出一个解
析函数,变差函数的拟合
有很多种方法,比如,在
指定出函数类型后,可以
使用加权最小二乘法、线
性规划法、遗传算法等确
定出函数的常数项,得到图5 几种常用变差函数类型
变差函数的解析式;由于实际样本中,数量可能有限,或许分布代表性较差,常常采用交互式拟合方法,交互拟合既可以选择出更适合本区实际的函数类型,又可以添加上本人对本区地质规律的先验知识,解决由于样本值少参数不好确定的普遍问题。
选用哪种函数拟合,一方面取决于样本数据,另一方面,也取决于对实际规律的掌握程度,常用的函数有三种,分别是球状模型、高斯模型和指数模型,它们的具体特点如图5所示:
球状模型的标准化形式是:
变程a球型=a,由曲线可以看出,近距离相关性变化很快,接近变程时相关性变化小。
高斯模型的标准化形式是:
变程a高斯= ,由曲线可以看出,在变程中部距离相关性变化很快,接近变程时和近距离相关性变化慢。
指数模型的标准化形式是:
变程a指数=3 a,由曲线可以看出,在近距离相关性变化很快,远距离相关性变化慢。
了解了这些特点,就可以根据实际选取更合适的拟合函数类型了。
在实际应用中,为了更好地与样本值计算
的变差值拟合和更符合实际情况,还常用这几
种函数与Nugget(一个等概率随机型函数)线
性组合。
Nugget这个随机函数就是块金常数c0,
它的大小可反映区域化变量随机性的大小,随机图6 等概率随机型函数
性大这个数值就大。
变差函数的变程大小,不仅能反映某个区域变量在某一方向上变化的大小,同时还能从总体上反
映出区域变量的载体
(如砂岩)在某个方向
的平均尺度,从而可
利用变程来预测砂体
的某个方向的延仲尺
度,以实现预测砂体图7 变程的意义图示
规模为目的。
变差值的具体意义还可以做如下理解,以一个孔隙度区域变量为实例,将区域变量孔隙度样本值错开h距离后,
选取重合的点,做出右图所示交会
图,可以最佳拟合出一条直线,见
图,求取每一个点与这条直线的距
离di,再求取这些距离的平方和,用
总点数取平均,就是滞后距h时的变差值。
图8 变差函数值的意义
因此,v(h)值越大,表明这张交会图的点子越分散,相反,v(h)值越小,这些散带点在这条直线两侧就越集中;也可以如下理解,Porosity(x)与Porosity(x+h)相关性越好,v(h)值越小,关性越差,v(h)值越大。