第二章 空间数据的性质 B 2012
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
第2章 空间数据的性质
2.1 地理世界的概念模型与数据模型 2.2 空间数据的性质 2.3 空间数据的不确定性
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
假设每一种地理现象由一个过程及其表述的环境定义, 那么过程表示现象的基本因素的变化,环境表示现象的观 测框架(即空间和时间)。空间依赖性表示环境对于过程的 重要影响。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
• 传统的统计学理论假设观测是独立的,并服从独 立同分布。因为空间依赖性的存在,在空间分析 环境中是一个不能接受的假设。此外关于残差分 布的假设同样受到空间依赖性的影响。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
2.2 空间数据的性质
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
空间数据的特殊性质是多方面的,包括 空间异质性、空间自相关、可塑性面积单 元问题(MAUP)等。这些特殊性质直接影响 了空间数据分析和建模的方法。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
1)名义属性:是最简单的属性类型,即对地理 实体的测度,本质上是对地理实体的分类。名义属 性包括数字、文字,甚至颜色。即使名义属性是数 值的,对其应用算术运算也是没有意义。
2)序数属性:序数属性定义的类型之间存在等 级关系。在序数属性中,属性值具有逻辑顺序。序 数属性遵循明确定义的顺序,无论相继的属性之间 的间距已知或未知。序数数据本质上是一种分类等 级数据,即类型必须分为不同的等级。序数数据可 以进行优先级的比较运算。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
2.2.1 空间依赖性与空间异质性
1.空间依赖性
空间数据最为著名的特征就是Tobler的地理学第一定律 所描述的特征:空间上距离相近的地理事物的相似性比距 离远的事物相似性大,它所反映的就是空间数据的空间依 赖性。其含义是在空间的某一位置i处,某个变量的值与其 近邻位置j上的观测值有关,可写成式(2.1)的形式:
百度文库
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
• Voronoi多边形常用于气象和水文中,这是在假设 观测点代表最邻近的空间位置的基础上,快速构造 观测点所代表的空间区域的方法。
• 但Voronoi多边形的大小主要依赖于观测点分布的 疏密,并且可能存在一个观测点不合理地代表了一 个很大的区域,而其中的数值处处一致。
• 从量测层次上可将属性数据分为离散尺度的或连续尺度的, 定性的或定量的。虽然这两种分类方法对数据的性质给出了 区分,但是不足以明确地定义变量的运算分析方法。
• 一般划分为名义、序数、间距、比率等属性。其中前两种属 于离散尺度和定性的层次,后两者属于连续尺度和定量的层 次。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
• 离散对象观将现实世界作为一个能够容纳概念对象、 基本对象和复合对象的空间。
• 在离散对象方法中,空间对象的几何形态及其属性特 征共同构成地理信息的完整表示,其属性信息是所描 述的地理实体的特性,不因为这个实体位置的不同而 改变。
间距属性和比率属性是在连续尺度上的 数据测度,可以是所定义的连续区间上的 任何位置上的数值。
二者之间的重要区别是间距数据没有 自然的起点(或其量测的起点是相对的), 而比率数据定义在绝对的起点上。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
2.1.2 GIS空间数据模型——矢量和栅格
• 离散对象和连续场提供了关于表示地理世 界的两种不同的概念视图,但是两者都不 能解决任何地理现象数字化表示问题。
• 以数字形式表示地理数据的方法是栅格和 矢量。原理上,两者都可以用编码场和对 象,但是在实践中栅格与场、矢量与对象 之间形成了强烈的联系。
• 离散对象也可以用来表示连续变化的场,如用等高线 表示地形的连续起伏等。在每一条线上要素点的值处 处相等;线的稀疏密集表示空间变化的梯度。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
• 场的观点--用连续表面描述地理现象的方法。 它认为世界被很多变量描述,每一个变量在 任何可能的位置都是可量测的。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
• 不规则多边形表示场是经常使用的一种近似技术, 是典型的用适量数据模型表示连续场的技术,植 被覆盖类型、土壤类型和气候类型区等地理场经 常使用不规则多边形表示。
• 在这种情形下,需要多边形不重叠并完整地覆盖 所研究的空间范围。Voronoi多边形是经常使用 的表示地理场的模型,它又称为Thiessen多边形。 Voronoi多边形与Delauney三角形密切相关,根 据一组空间点,可首先构造Delauney三角形,然 后对三角形的边进行垂直等分即可导出Voronoi 多边形。
间距属性值之间的加减算术运算是有效的,但是 乘法和除法是无效的。间距属性数据还可以使用均值、 标准差等进行描述。
4)比率属性:是数值和其真实零点之间的差异幅 度的测度。两个比率数值之间的加减乘除算术运算都 有效。对于比率属性的数据可以实施各种数学运算。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
离散实体又称为对象,通过其独特的局部 化特征相互区别,并通过其拥有的特定属性的 个体被识别。其重要特征是对象可被计数。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
• 维数是离散实体的显著特 征,在离散的世界观中, 实体自然地被抽象为点、 线和多边形(面)3种类型。
2.空间异质性
• 空间异质性是空间数据的第二个特性。异质性源 于各地方的独特性质,表示空间数据的变化的不 平稳性。
• 空间异质性与空间上行为关系缺乏稳定性有关, 这一特性也称为空间非平稳性,意味着功能形式 和参数在所研究区域的不同地方是不一样的,但 是在区域的局部,其变化是一致的。
• 空间非平稳性是空间数据这一特征的数学表述, 各向同性是与此概念密切相关的一个概念,即假 设模式在所有方向上是一样的。对于大部分空间 数据而言,假设空间过程非平稳和各向异性能更 为真实地反映地理问题的实质。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
2.1.1 地理世界的概念模型--对象和场
人类一般以两种观念认识世界,一种认为 世界由离散的实体构成,另外一种认为世界是 连续的场。于是,离散的对象和连续的场就构 成了表示地理世界的两种基本方式,它提供了 概念层次上地理世界的认知模型。
• 连续场描述的是在空间—时间框架下地理变 量的空间变化。
• 场的表示:在数字世界中完全地表示连续空 间是不可能的,所有表示连续世界的空间数 据模型都是某种程度的近似,这些模型包括 规则的空间点、不规则的空间点、等值线、 规则单元格、不规则三角网,以及多边形等
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
1.栅格数据 • 在栅格表示中,地理空间被划分成矩形单元格矩
阵,通常使用正方形单元格。所有的地理变化通 过对单元格赋予性质或属性来表示。单元格也被 称为像素。 • 当信息以栅格形式表示时,每个单元格都有一个 数值描述其属性特征,单元格内部的细节变化信 息都丢失。 • 常用的编码方式有:最大份额法、中心点法。
• 空间依赖性程度是通过空间自相关测度的,这是 两个直接关联的概念。
• 空间自相关的指标有两种类型:全局测度和局部 测度。全局方法对研究区域的整体给出一个参数 或指数,而局部方法提供和数据观测点等量的参 数或指标。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
2.1.3 属性数据的测度
• 属性是描述实体特征的变量。地理信息中属性的范围极其广 泛,有些属性是自然或环境的而另外一些是社会或经济的。
• 区分属性信息的测度类型很重要,因为它规定了支撑量测的 数字系统的规范性质,并决定了什么样的算术运算有效,以 及使用什么样的统计过程。
在地理分析中必须注意属性数据的类型特征,因 为不同的属性测度规定了可应用的数学运算方法。在 GIS中,属性值是和地图对象相关联的,为了对地图 对象规定允许的地图运算还必须区分空间广延量和空 间强度量。
例如,区域的面积是空间的广延量,当两个区域 合并后的新的地图对象获得的是两个区域面积的和。 密度是空间强度量。在空间单元聚集后为了获得空间 强度量的正确的值,分子和分母必须分别聚集。这对 于空间插值、可视化以及统计分析都有影响。
• 这一模型表示场的适合性受到点分布合理性的制约, 在样本点的疏密程度变化合理的区域中场的表示好; 而样本极度稀疏的区域将会忽视其空间变化。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
总之,离散对象和连续场概念模型是建立在两种地理 世界认知观的基础上,它反映了地理世界的复杂性及认知 的复杂性。基于离散对象和连续场,GIS实现了两种有效 的空间数据模型,即矢量数据模型和栅格数据模型。
对名义和序数数据能够进行分类计数,所以常 被称为离散变量,或定性变量。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
3)间距属性:是一种对地理实体或现象的数量测 度方法。间距属性测度的是一个值对于另一个值差异 的幅度,但不是该值和真实零点之间的差值。由于间 距属性的数值测度不是基于自然的或绝对的零点,因 此数量关系的运算受到限制。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
2.矢量数据 • 在矢量数据表示中,所有的线通过点之间的直
线连接。 • 为了获取以矢量形式表示的区域对象,只需要
形成多边形顶点的点被获取。这种方法比较简 单,并且比栅格表示的效率更高,因为栅格表 示多边形需要列出所有的单元格。 • 为了在栅格中精确地表示一个区域,就必须使 用非常小的单元格,单元格的数量会成比例地 增加。
2.1 地理世界的概念模型 与数据模型
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
• 空间数据的特殊性质使得很多传统的数据分 析方法和技术不能够直接应用于空间数据的 分析,大量基于GIS的空间分析技术与传统的 数据统计分析技术有着本质的不同,其原因 在于这些分析方法和技术是基于空间数据性 质的。
第2章 空间数据的性质
2.1 地理世界的概念模型与数据模型 2.2 空间数据的性质 2.3 空间数据的不确定性
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
假设每一种地理现象由一个过程及其表述的环境定义, 那么过程表示现象的基本因素的变化,环境表示现象的观 测框架(即空间和时间)。空间依赖性表示环境对于过程的 重要影响。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
• 传统的统计学理论假设观测是独立的,并服从独 立同分布。因为空间依赖性的存在,在空间分析 环境中是一个不能接受的假设。此外关于残差分 布的假设同样受到空间依赖性的影响。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
2.2 空间数据的性质
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
空间数据的特殊性质是多方面的,包括 空间异质性、空间自相关、可塑性面积单 元问题(MAUP)等。这些特殊性质直接影响 了空间数据分析和建模的方法。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
1)名义属性:是最简单的属性类型,即对地理 实体的测度,本质上是对地理实体的分类。名义属 性包括数字、文字,甚至颜色。即使名义属性是数 值的,对其应用算术运算也是没有意义。
2)序数属性:序数属性定义的类型之间存在等 级关系。在序数属性中,属性值具有逻辑顺序。序 数属性遵循明确定义的顺序,无论相继的属性之间 的间距已知或未知。序数数据本质上是一种分类等 级数据,即类型必须分为不同的等级。序数数据可 以进行优先级的比较运算。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
2.2.1 空间依赖性与空间异质性
1.空间依赖性
空间数据最为著名的特征就是Tobler的地理学第一定律 所描述的特征:空间上距离相近的地理事物的相似性比距 离远的事物相似性大,它所反映的就是空间数据的空间依 赖性。其含义是在空间的某一位置i处,某个变量的值与其 近邻位置j上的观测值有关,可写成式(2.1)的形式:
百度文库
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
• Voronoi多边形常用于气象和水文中,这是在假设 观测点代表最邻近的空间位置的基础上,快速构造 观测点所代表的空间区域的方法。
• 但Voronoi多边形的大小主要依赖于观测点分布的 疏密,并且可能存在一个观测点不合理地代表了一 个很大的区域,而其中的数值处处一致。
• 从量测层次上可将属性数据分为离散尺度的或连续尺度的, 定性的或定量的。虽然这两种分类方法对数据的性质给出了 区分,但是不足以明确地定义变量的运算分析方法。
• 一般划分为名义、序数、间距、比率等属性。其中前两种属 于离散尺度和定性的层次,后两者属于连续尺度和定量的层 次。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
• 离散对象观将现实世界作为一个能够容纳概念对象、 基本对象和复合对象的空间。
• 在离散对象方法中,空间对象的几何形态及其属性特 征共同构成地理信息的完整表示,其属性信息是所描 述的地理实体的特性,不因为这个实体位置的不同而 改变。
间距属性和比率属性是在连续尺度上的 数据测度,可以是所定义的连续区间上的 任何位置上的数值。
二者之间的重要区别是间距数据没有 自然的起点(或其量测的起点是相对的), 而比率数据定义在绝对的起点上。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
2.1.2 GIS空间数据模型——矢量和栅格
• 离散对象和连续场提供了关于表示地理世 界的两种不同的概念视图,但是两者都不 能解决任何地理现象数字化表示问题。
• 以数字形式表示地理数据的方法是栅格和 矢量。原理上,两者都可以用编码场和对 象,但是在实践中栅格与场、矢量与对象 之间形成了强烈的联系。
• 离散对象也可以用来表示连续变化的场,如用等高线 表示地形的连续起伏等。在每一条线上要素点的值处 处相等;线的稀疏密集表示空间变化的梯度。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
• 场的观点--用连续表面描述地理现象的方法。 它认为世界被很多变量描述,每一个变量在 任何可能的位置都是可量测的。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
• 不规则多边形表示场是经常使用的一种近似技术, 是典型的用适量数据模型表示连续场的技术,植 被覆盖类型、土壤类型和气候类型区等地理场经 常使用不规则多边形表示。
• 在这种情形下,需要多边形不重叠并完整地覆盖 所研究的空间范围。Voronoi多边形是经常使用 的表示地理场的模型,它又称为Thiessen多边形。 Voronoi多边形与Delauney三角形密切相关,根 据一组空间点,可首先构造Delauney三角形,然 后对三角形的边进行垂直等分即可导出Voronoi 多边形。
间距属性值之间的加减算术运算是有效的,但是 乘法和除法是无效的。间距属性数据还可以使用均值、 标准差等进行描述。
4)比率属性:是数值和其真实零点之间的差异幅 度的测度。两个比率数值之间的加减乘除算术运算都 有效。对于比率属性的数据可以实施各种数学运算。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
离散实体又称为对象,通过其独特的局部 化特征相互区别,并通过其拥有的特定属性的 个体被识别。其重要特征是对象可被计数。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
• 维数是离散实体的显著特 征,在离散的世界观中, 实体自然地被抽象为点、 线和多边形(面)3种类型。
2.空间异质性
• 空间异质性是空间数据的第二个特性。异质性源 于各地方的独特性质,表示空间数据的变化的不 平稳性。
• 空间异质性与空间上行为关系缺乏稳定性有关, 这一特性也称为空间非平稳性,意味着功能形式 和参数在所研究区域的不同地方是不一样的,但 是在区域的局部,其变化是一致的。
• 空间非平稳性是空间数据这一特征的数学表述, 各向同性是与此概念密切相关的一个概念,即假 设模式在所有方向上是一样的。对于大部分空间 数据而言,假设空间过程非平稳和各向异性能更 为真实地反映地理问题的实质。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
2.1.1 地理世界的概念模型--对象和场
人类一般以两种观念认识世界,一种认为 世界由离散的实体构成,另外一种认为世界是 连续的场。于是,离散的对象和连续的场就构 成了表示地理世界的两种基本方式,它提供了 概念层次上地理世界的认知模型。
• 连续场描述的是在空间—时间框架下地理变 量的空间变化。
• 场的表示:在数字世界中完全地表示连续空 间是不可能的,所有表示连续世界的空间数 据模型都是某种程度的近似,这些模型包括 规则的空间点、不规则的空间点、等值线、 规则单元格、不规则三角网,以及多边形等
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
1.栅格数据 • 在栅格表示中,地理空间被划分成矩形单元格矩
阵,通常使用正方形单元格。所有的地理变化通 过对单元格赋予性质或属性来表示。单元格也被 称为像素。 • 当信息以栅格形式表示时,每个单元格都有一个 数值描述其属性特征,单元格内部的细节变化信 息都丢失。 • 常用的编码方式有:最大份额法、中心点法。
• 空间依赖性程度是通过空间自相关测度的,这是 两个直接关联的概念。
• 空间自相关的指标有两种类型:全局测度和局部 测度。全局方法对研究区域的整体给出一个参数 或指数,而局部方法提供和数据观测点等量的参 数或指标。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
2.1.3 属性数据的测度
• 属性是描述实体特征的变量。地理信息中属性的范围极其广 泛,有些属性是自然或环境的而另外一些是社会或经济的。
• 区分属性信息的测度类型很重要,因为它规定了支撑量测的 数字系统的规范性质,并决定了什么样的算术运算有效,以 及使用什么样的统计过程。
在地理分析中必须注意属性数据的类型特征,因 为不同的属性测度规定了可应用的数学运算方法。在 GIS中,属性值是和地图对象相关联的,为了对地图 对象规定允许的地图运算还必须区分空间广延量和空 间强度量。
例如,区域的面积是空间的广延量,当两个区域 合并后的新的地图对象获得的是两个区域面积的和。 密度是空间强度量。在空间单元聚集后为了获得空间 强度量的正确的值,分子和分母必须分别聚集。这对 于空间插值、可视化以及统计分析都有影响。
• 这一模型表示场的适合性受到点分布合理性的制约, 在样本点的疏密程度变化合理的区域中场的表示好; 而样本极度稀疏的区域将会忽视其空间变化。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
总之,离散对象和连续场概念模型是建立在两种地理 世界认知观的基础上,它反映了地理世界的复杂性及认知 的复杂性。基于离散对象和连续场,GIS实现了两种有效 的空间数据模型,即矢量数据模型和栅格数据模型。
对名义和序数数据能够进行分类计数,所以常 被称为离散变量,或定性变量。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
3)间距属性:是一种对地理实体或现象的数量测 度方法。间距属性测度的是一个值对于另一个值差异 的幅度,但不是该值和真实零点之间的差值。由于间 距属性的数值测度不是基于自然的或绝对的零点,因 此数量关系的运算受到限制。
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
2.矢量数据 • 在矢量数据表示中,所有的线通过点之间的直
线连接。 • 为了获取以矢量形式表示的区域对象,只需要
形成多边形顶点的点被获取。这种方法比较简 单,并且比栅格表示的效率更高,因为栅格表 示多边形需要列出所有的单元格。 • 为了在栅格中精确地表示一个区域,就必须使 用非常小的单元格,单元格的数量会成比例地 增加。
2.1 地理世界的概念模型 与数据模型
NANJING UNIVERSITY OF INFORMATION SICENCE & TECHNOLOGY
• 空间数据的特殊性质使得很多传统的数据分 析方法和技术不能够直接应用于空间数据的 分析,大量基于GIS的空间分析技术与传统的 数据统计分析技术有着本质的不同,其原因 在于这些分析方法和技术是基于空间数据性 质的。