地理建模

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

.
复相关系数 实际上, 一个要素的变化往往受多种要素的综合影响, 用单相关或偏相关分析的方法不 能反映各要素的综合影响,就需要用复相关分析加以解决。 复相关就是研究几个要素同时与某一个要素之间的相关关系。复相关系数是度量复相 关程度的指标,可利用单相关系数和偏相关系数求得。有 k 个自变量时,因变量 y 与它们的 复相关系数为������������ .12 …������ =
m; j=1, 2, … , n.经变换后,每列数据的均值为0,方差为1.使用标准差标准化处理后,在抽样 样本改变时,它仍然保持相对稳定性。
规格化变换方法是从数据矩阵的每一个变量中找出其最大值和最小值求差(极差),再 从每一个原始数据中减去该变量的最小值后除以极差,得到规格化数据。 设数据矩阵为(xij)m×n,对于第j列(j=1, 2, … ,n)的元素xij,其最大值记为max{xij},最 小值记为min{xij},则元素xij经规格化变换为������
=
(������−������ )(������−������ ) ������−������ 2
。 当|r|>0.95 为显著相关, |r|≥0.8 为高度相 ������ −������ 2
=
������12 −������13 ������23
2 )(1 −������ 2 ) (1−������13 23
地理建模第一章 1.地理建模的步骤: 问题分析: 明确研究对象和研究目的, 问题所依据的事实和数据资料来源是什么, 是否真实, 并确定问题的类型,是确定型还是随机型,是需要建模还是模拟? 模型假设:列举并分析模型可能相关的许多因素,并通过假设把所研究的问题进行简化,明 确模型中需要考虑的因素及在问题中所起的作用,以变量或参数的形式表达这些模型。 建立模型: 运用数学知识和数学技能技巧来描述问题变量之间的关系, 通常可以用数学表达 式来描述。 模型求解与分析:对已建立的模型进行数学上的求解,对模型中的参数得出估计值,并对此 进行分析,以得到最优决策或控制。 模型检验:把模型的运行结果与实际观测进行比较,如果与实际相合或基本一致,则说明是 符合实际问题的,反之则返回到建模时的假设,检查地理要素的选择是否准确合理,再给出 修正,重复过程。 模型应用:解决实际问题。 2.地理建模方法: 地理建模方法主要有两个过程,分别为地理系统分析和地理系统综合。 地理系统分析是地理系统综合的基础和前提,是简化、分解、建立简化数学模型的过程,而 地理系统综合是把经过地理系统分析的客观系统, 按其要素之间的关系, 各级系统连接的规 律,彼此逐级连接起来,形成从简单到复杂、从低级到高级的地理系统的过程,事实上也就 是一个地理建模的过程。 地理系统综合的过程就是地理系统模拟和建模的过程, 两者往往是 同义的。 地理系统分析和地理系统这两种地理系统研究和建模方法, 通过地理系统的各个地 理要素间的数量分析而相互连接起来。 第二章: 一、地理数据的种类: 地理数据是用一定的测度标准去衡量地理要素而取得的地理信息, 不同的测度标准可以产生 不同类型的地理数据,它们分别反映地理要素的不同特征。 地理数据根据表达方式的不同, 分为定量数据和定性数据两类。 定量地理数据包括间隔尺度 数据、比例尺度数据;定性地理数据则包括有序数据、二元数据、名义尺度数据。 间隔尺度数据是一种定量地理数据 (可以用数量表示) , 它以连续的量来表示地理要素, 并根据地理要素不同的性质采用不同度量单位作为标准。其特点是数据间不仅能比较大小, 而且能定量表示这种差异,没有自然0值。它是地理数据类型中最常见的一种,是统计分析 的基础。 比例尺度数据是一种定量地理数据(可以用数量表示),以连续的量表示地理要素,但 须事先规定一个基点(可以是间隔尺度数据的某个量),并将其它量换算为基点的比例,故 又称指数/百分比。在统计分析中,一般可以用于间隔尺度数据的技术也可以用于比例尺度 数据。 有序数据是一种定性地理数据,不表示连续的量,而只表示次序或等级关系。 二元数据也称0-1数据,是一种定性地理数据,表示地理要素的性质,以列成矩阵的0、 1变量表示,变量数比地理要素性质类型少1.通过二元数据矩阵将地理要素的定性、定量数 据联系起来进行的数量分析方法称为数量化方法。 名义尺度数据是一种定性地理数据, 可以用文字或字符表示, 是用来表示地理要素的类 型数据。在众多事物中只根据其固有特征进行区分时,可采用名义尺度数据。 二、空间地理数据: 空间地理数据是空分析的对象,是描述地理空间一定范围内空间实体及其相互关系的数据。 根据地理系统的基本特征,空间数据可以分为属性数据、几何数据、关系数据。
ቤተ መጻሕፍቲ ባይዱ
属性数据:描述空间实体的属性特征的数据。 几何数据:描述空间实体的空间特征的数据。 关系数据:描述空间实体之间拓扑关系的数据。 空间数据表示模型主要有三种: 栅格数据模型、 矢量数据模型、 栅格-矢量一体化数据模型。 栅格数据模型是指地理空间作为一个整体被划分为规则的格网, 空间位置由格网的行、 列表 示。格网的大小反映了数据的分辨率。主要有三角形,正方形,六边形格网。缺点是一个栅 格只能赋予一个特定的值,不利于多要素内容的表达。 矢量数据模型: 将地理空间作为一个空域, 地理要素根据其空间形态特征分为点、 线、 面等, 点用空间坐标表示,线由一串坐标表示,面是由线形闭合多边形表示。 栅格矢量一体化数据模型: 是结合栅格和矢量数据模型的优点提出的一种数据模型。 在栅格 矢量一体化数据模型中,面状数据用矢量边界的方式表示,同时也用栅格方式表示,线状数 据一般用矢量方式表示,如果将矢量方式表示的现状对象也用像元空间填充表达,则能力、 够将矢量和栅格的概念统一起来, 形成栅格矢量一体化的数据模型。 栅格矢量数据一体化模 型,本质上是以栅格为基础,结合栅格和矢量数据模型优点的空间数据模型。 三、地理系统要素统计量构造 地理系统要素统计量的建立, 有利于定量地刻画某种地理要素特征, 并且可以使其时间和空 间差异的对比采取数值形式,还可以对各要素之间的关系做定量分析。 根据已经应用的地理系统要素统计量,它们的构造特点如下: (1) 对于现象分布的集中程度和离散程度, 往往与平均值相联系或与最大、 最小值相联系, 构造出刻画地理特征的相对指标。 (2)构造地理要素在地区分布上的集中和离散程度,往往采取计算坐标或将分布范围面积 进行比较,确定中心坐标或求出面积比例。 (3)构造地理要素的地区分布形态的统计量,往往采取实际分布状况与其最小外接圆面积 作对比的方法。 (4)构造与发展速度有关的地理要素的统计量,往往采用指数函数或对数函数的形式,若 是均一的发展速度,则采取线性函数的形式。 (5)构造与发展速度变化有关的地理要素的统计量,往往采取求导数或偏导数的方法。 (6)地理因素的复杂性,多元统计分析被引入。 对于统计量的构造要求:信息便于收集、信息的可靠性大、在时间与空间上可比、并且能够 准确反映要素的特征。此外,在计算上还应简捷方便。 四、数据变换处理 为了使不同量纲、不同数量级的数据能放在一起比较,通常需要对数据进行变换处理。 所谓数据变换,是将原始数据矩阵中的每个元素,按照某种特定的运算把它变为一个新值, 而且数值的变化不依赖于原始数据几何中其他数据的新值。 常用的变换方法有: 中心化变换、 规格化变换、标准化变换和对数变换等。 标准化变换方法是对变量属性进行变换处理, 首先对列中心化, 再用标准差进行标准化。 设数据矩阵为(xij)m×n, (m为样本数,n为变量数) ,每列元素均值为������������
2 1 − 1 − ������������21 1 − ������������22.1 1 − ������������23.12 … (1 − ������������������ .12 …(������−1) ).
复相关系数必大于或等于单相关系数的绝对值, 大于等于由同一系列资料所求得的偏相 关系数的绝对值,即 R1.23≥|r12.3|。 相关系数的显著性检验 记 f 为使用资料对数,α 为信度。 偏相关系数的显著性检验一般用 t-检验法,计算式为
=
������ ������������ ������
,方差为
������������ =
(������ ������������ −������ ������ )2 ������−1
, 则元素xij经标准化变换为������
′ ������ ������
=
������ ������ ������ −������ ������ , 其中i=1, 2, … , ������ ������
′ ������ ������
=
������ ������ ������ −min ������ ������ ������ max ������ ������ ������ −min ������ ������ ������
,其
中i=1, 2, … , m.经规格化变换后,每列最大值为1,最小值为0,其余数据取值在(0,1)中。 中心化变换方法是一种标准化处理方法, 先求出每个变量的样本平均值, 再从原始数据 中减去它,就得到中心化后的数据。 设 数 据 矩 阵 为 (xij)m×n , 每 列 元 素 均 值 为 ������������ ������
′ ������ ������
=
������ ������������ ������
, 则 元 素 xij 经 中 心 化 变 换 为
= ������
������ ������
− ������
������
,其中i=1, 2, … , m; j=1, 2, … , n.变换后,每列数据之和均为0,平
方和为该列数据方差的(n-1)倍,任何不同两列数据的交叉积为这两列的协方差的(n-1)倍。 第三章:相关与回归地理模型 一、相关系数及其衍生指标 相关是指两个或两个以上的要素间相互关系是否密切。 在研究这种关系时并不专指哪一 个是自变量,哪一个是因变量,可视实际情况确定。相关分析仅限于测定两个或两个以上变 量具有相关关系者,其目的是计算出表示两个或两个以上变量间相关程度和性质。 相关系数是用来度量直线相关程度和方向的指标。 相关程度是指两个要素之间的关系有 多密切,相关方向则是指两个变量变化方向是否相反,可分为正相关、负相关、零相关。相 关系数的常用计算公式为r 关,|r|<0.3 认为不相关。 偏相关系数 由于地理系统是一种多要素系统, 所以一个要素的变化就要影响到其它要素的变化, 因此它 们之间存在着不同程度的相关关系。 如专门研究某一个要素对另一个要素的影响或相关程度, 而把其它要素的影响视为不变(除去其它要素的影响) ,单独研究那两个要素之间的相关关 系时,则称为偏相关。对应地,偏相关系数可以由相关系数法来计算。其中 “.”后的是视为 常量的要素。举例:������12.3
=
2 ������������ .12 …������ 2 1−������������ .12 …������
������−������−1 ������

式中,n 为样本容量,k 为自变量个数。 求出 F 值后再查 F 分布表,可得出不同的显著水平的临界值 Fα。 F>Fα0.01 为极( 0.01 水平上)显著; Fα0.05≤F<Fα0.01 ,复相关在 0.05 水平上显著; Fα0.10≤F<Fα0.05 ,0.10 水平上显著;F<Fα0.10 不显著。 二、回归分析与相关分析的异同(应先名词解释) 回归分析是从针对完全精确但由于观测资料的误差而可能不确定的函数关系,以及没有确 定性的关系、但在统计意义上存在着某种类型函数关系的统计相关关系进行,用数理统计 的方法,寻找出并用回归方程来表示。主要内容包括从一组地理数据出发,确定这些要素 间的定量数学表达式,即回归模型;根据一个或几个要素的值来预测或控制另一个要素的 取值; 从影响某一地理过程中的许多要素中, 找出哪些要素是主要的, 哪些要素是次要的, 这些要素之间又有些什么关系。 相关分析是计算出两个或两个以上变量相关程度或性质。 项目 相同 点 相关分析(回归分析的基础) 研究对象和内容相同 主要研究要素 (变量) 间联系密切程度问题 不同 点 没有严格的自变量和因变量之分 x,y 均为随机变量 测定相关程度和方向 主要研究要素(变量)间联系的数学表达 式(地理建模) 有严格的自变量和因变量之分 仅有 y 为随机变量 用回归模型进行预测和控制 回归分析 研究和处理变量之间相互关系的一种数理统计方法
t=
������12,34 …������
2 1 −������12,34 …������
������ − ������ − 1,
其中,r12,34……m 为偏相关系数,n 为样本容量,m 为自变量个数。 求出 t 值后,再查 t 分布表,可得出不同的显著水平的临界值 tα。 t>tα 表示偏相关显著;t≤tα 表示偏相关不显著。 复相关系数的显著性检验,可用 F-检验法: ,计算公式为F
相关文档
最新文档