第二章 地理数据的采集与处理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
月、季度、年等。
多维性
对于一个地理对象的具体意义要从空间、 属性、时间三个方面综合描述: 空间方面,描述该地理对象所处的地理位 置和空间范围,一般需要2~3个变量 ; 属性方面,描述该地理对象的具体内容, 至少需要1个以上,多则需要十几个、甚至几 十个变量 ;
时间方面,描述该地理对象产生、发 展和存在的时间范围 ,需要1个变量。 地理数据的这种多维性,被人们描述 为地理数据立方体(the geographical data cube)。
耕地复种指数 农业发展指数
矩阵法
地理矩阵 m个地点或地区;n个地理特征值
x11 x12 x1n x 21 x 22 x 2 n x x x m 1 m 2 mn m n
三、地理数据的基本特征
数量化、形式化与逻辑化
五、地理数据的处理与变换
广义的地理数据处理,是所有地理问题研究的 核心环节。
从理论上讲,在地理学中,数学方法的运用主 要有两个目的:(1)运用数学语言对地理问题的 描述,建立地理数学模型,从更高、更深层次上揭 示地理问题的机理;(2)运用有关数学方法,通 过定量化的计算和分析,对地理数据进行处理,从 而揭示有关地理现象的内在规律。因此,运用数学 方法也是为了处理地理数据。
数量标志数据
① 间隔(interval)尺度数据:以有量 纲的数据形式表示测度对象在某种单位(量纲 )下的绝对量。 ② 比例尺度数据:以无量纲的数据形式 表示测度对象的相对量。
品质标志数据
① 有序(ordinal)数据:当测度标准不是连 续的量,只是表示其顺序关系的数据。
② 二元数据:用0、1两个数据表示地理事物、 地理现象或地理事件的是非判断问题。 回归分析中,经常把它作为虚拟变量的数据
③ 名义尺度数据:用数字表示地理实体、地 理要素、地理现象或地理事件的状态类型。
其他变量系统分类
表2.1
城市A 城市A 城市B 城市C 城市D — 1 1 0 城市B 1 — 1 1
二元数据
城市C 1 1 — 1 城市D 0 1 1 — 城市E 1 0 0 1
城市E
1
0
0
1
—
注:1表示两城市之间通航; 0表示两城市之间不通航。
点——由一个独立的坐标点(x,y)定位,是空间 上不可再分的几何实体。
线——由若干个(至少两个,理论上是无穷个)坐 标点(xi,yi)(i =1,2,…)定义,有一定的长度 和走向,表示线状地物或点实体之间的联系。 面——表示在空间上连续分布的地理景观或区域。 点、线、面之间的拓扑关系。
相关数据网站:
中国国家统计局:www.stats.gov.cn 统计链接 stats.gov.cn/tj1j/index.htm#gwtjwz 新华社:http://www.xinhua.org 中国人民银行网:www.pbc.gov.cn 商务部: http://english.mofcom.gov.cn 国家外汇管理局:www.safe.gov.cn 国家信息产业部: www.mii.gov.cn/mii/hyzw 国信证券:www.guosen.com. 经济杂志网:www.economagic.com 中国网:http://www.china.org.cn 中国国家图书馆: http://www.nlc.gov.cn 中国蔚蓝网络书店:www.welan.com 经合组织数据库:http://www.oecd.org 美国人口普查局:www.census.gov 美国会图书馆:www.loc.gov 美国商业部:www.stat-usa.gov 亚洲东盟网站:www.aseansec.org APEC网站:www.apecsec.org.sg 美国IBM公司:www.ibm.com/investor 美国:www.imf.org 美国纳斯达克网: www.nasdaqnews.com 国际货币基金组织数据库: http://www.imf.org 搜索网站:www.google.com 英文书搜索网站:www.amazon.com
3. 系统分类
自然系统和人造系统 实体系统和抽象(概念)系统 静态系统和动态系统 开放系统和封闭系统 全球系统和区域系统
4. 地理系统的特点
系统性、整体性、综合性 区域性、开放性、层次性 随机性、动态性 系统的整体功能大于分要素功能之总和,这是因为存在 着要素与要素间的关系。 地理环境是由各个要素之间的密切的相互作用,才形成 了地理环境的整体性。 层次性:我国的北方地区,可将其视为一个系统,而它 又是我国季风区的子系统,属于温带季风气候,在气候 的影响下,植被、河流水文和农业生产表现出温带地区 的特点。 系统是不断演化的,系统存在于过程之中。
地理数据的采集、处理及其与数学方法、
地理信息系统、地理计算学之间的相互关系图:
数据 地 理 数 据 的 数 据 源 地 理 数 据 采 集 GIS 地理 数学方法
Geocomputation
处理
图1 地理数据采集与处理
地理计算学(Geocomputation,或 Computational
Geography )的实质是借助于现代化的计算理论、 计算方法和计算技术,通过对“整体”和“大容量” 的地理数据进行处理,揭示复杂地理系统的运行机 制,探索和寻求新的地理系统理论。
1996年英国利兹大学Stan Openshaw 等主导展开第一次地理计算学术会议, 这次会宣告了计算地理学作为地理学基 础学科的诞生。
第二章 地理数据的采集及处理
一、地理系统
二、地理数据的类型和表达
三、地理数据的基本特征
四、地理数据的来源
五、地理数据的变换 六、地理数据的分布特征
一、地理系统
1. 系统的概念 地理系统是地球表面的岩石圈、水圈、生物圈和 人类活动相互作用的物质、能量和信息运动系统。 什么是“系统”? 系统是由相互作用和相互依赖的若干组成部分 (要素)结合而成的具有特定功能的整体。 在这个定义中包括了系统、要素、结构、功能四 个概念,表明了要素与要素、要素与系统、系统 与环境三方面的关系。
地理空间数据源
地理空间数据的辨识、提取、采选、处理与变换等。这 是最为基本的内容,也是计量分析的基础和前提。
Geocode
Oracle Spatial
Load
其他数据
统计数据 文字 多媒体
Байду номын сангаас
Digitize
遥感数据
航天遥感数据
航空遥感数据 遥测数据 全球定位系统数据( GPS)
地图数据
道路
水系 居民地 地籍
2. 地理数据的表达方式 表格法
地理要素
区域
x1
x2
…
xn
区域1
x11
x12
…
x1n
区域2
x21
x22
…
x2n
…
…
…
…
…
区域m
xm1
xm2
…
xmn
表2.2
各区域的自然及经济社会指标
年降水量 /mm 500.2 498.6 550.9 土地面积 /hm2 245.6 1064. 894.3 人口 /人 1 210 1 023 848 国内生产总值 /万元 2 678.28 2 015.47 1 754.56
2. 系统的结构和功能
系统的结构是指不随时间发生变化的系统要 素之间的联系。
稳定性
层次性
可变性 相对性
系统的功能是指系统在包含它的超系统中起
的作用和承担的任务。 系统功能体现了系统与外部环境之间的物质、 能量、信息输入与输出的变换关系。系统输 入输出时同外部介质的相互作用就是系统的 功能。系统功能同时也是为实现系统目标所 具有的能力。
现实世界
数 据 采 集 与 输 入
文字报告、 遥感图象 等
数字化仪
扫描仪
解析测图仪
键盘 等
编辑、接边、分层、图形与 属性连接、加注记等
空间数据库
采集地理数据过程中需要注意的问题
①数据的完备性和可靠性。
②在数据采集过程中,最大限度 地减小数据的误差。 ③在数据采集完毕后,进行检验, 辨别真伪,通过数据筛选,去粗取精、 去伪存真。
地球表层系统
地球表层系统(the earth surface system)是由岩土圈、
大气圈、水圈、生物圈和人类圈所构成的地表自然社会综合 体。是人类圈与地相互作用的复合物质系统,是地球圈层结 构中的特定部分,与周围的地球圈层其他部分存在物质能量 交换关系,是一个开放的复杂次级巨系统。 钱学森教授于1983年倡议建立“地球表层学”,认为地球表 层学是“跨地理学、气象学、地质学、工农业生产技术、技 术经济和国土经济的新学科”是自然科学与社会科学的交叉 学科”。
不确定性
不确定性是地理数据的基本特征之一。 地理数据不确定性的来源:
地理系统本身的复杂性从本质上决定 着地理数据的不确定性。
各种原因所导致的数据误差。
多种时空尺度
从空间尺度上来看,描述地理区域的各种 地理数据,具有多种空间尺度——既有全球尺 度的、洲际尺度的、国家尺度的,也有流域尺 度的、地区尺度的、城市尺度的、社区尺度的。 从时间尺度上来看,描述地理过程的各种 地理数据具有多种时间尺度,如历史年代、天、
空间数据
空间数据,主要用于描述地理实体、地理要 素、地理现象、地理事件及地理过程产生、 存在和发展的地理位置、区域范围及空间联 系。 坐标,是描述空间数据的基本手段,一般用 经纬度坐标或者公里网来表示。 对于空间数据的表达,可以将其归纳为点、 线、面三种几何实体以及描述他们之间空间 联系的拓扑关系。
不确定性 多种时空尺度 多维性
数量化、形式化与逻辑化
定量化的地理数据是建立地理数学模 型的基础,其作用为:确定模型的参数、给 定模型运行的初值条件;检验模型的有效性。 形式化、逻辑化与数量化,是所有地 理数据的共同特征。 地理计算学,对于地理数据的形式化、 逻辑化提出了更高的要求,要求“整体”和 “大容量”的地理数据具有统一的数据形式 和交换标准。
二、地理数据的类型和表达
1. 地理数据类型 将所有的地理数据划分为两大基本类型,即 空间数据(spatial data)和属性数据 (attribute dada)。 GIS实现了空间数据和属性数据的完美结合 属性数据又可以进一步分为两种类型,即定量 数据和定性数据。 Acrview 主体文件:*. shp 、*.dbf 、 *.sbx分别存储空间,属性和前两者的关系
图 2.2.1
地理数据立方体
四、地理数据的来源
1. 2.
3.
4. 5. 6. 7.
8.
9.
来自观测、测量部门的有关专业数据。比如,来自水文观测站的有关 水文数据;来自气象观测站的有关气象数据;来自环境监测部门的空 气、水质数据等。 来自统计年鉴、统计公报中的有关自然资源及社会经济发展数据。比 如,从各级政府统计部门公布和出版的统计年鉴中,可以得到当地的 耕地面积、各类农作物播种面积、粮食产量、人口、劳动力、工业投 资和产值、国内生产总值等。 来自有关单位或者个人的不定期的典型调查数据、抽样调查数据。比 如,来自城乡抽样调查队的城市、农村家庭收支数据;来自有关有关 单位或者个人的某一方面的专题调查数据等等。 来自政府公报、政府文件中的有关数据。 来自档案、图书等文献资料中的有关数据。 来自互联网中的有关共享数据。 地图图件。主要包括各种比例尺的地形图、影像地图、专题地图等。 遥感数据。主要包括各种航空遥感数据和卫星遥感数据。 其他来源的有关数据。
三种基本的地理几何实体及其组合
属性数据
属性数据:用于描述地理实体、地理要素、
地理现象、地理事件、地理过程的有关属性 特征。 一般从数量标志和品质标志两个方面来描述。
定量数据:是用数量表示的地理数据,如温度,人
口数量,人均收入等。 定性数据:只表征地理要素性质上的差异,而没有 数量的变化。但是,通过“数量化方法”可以对一 定的地理要素予以赋值。通常采用二分法,即以二 元数据1和0来表示。比如,性别
年平均气温/℃
区域1 区域2 区域3
8.0 7.6 6.5
区域3
8.5
586.4
668.7
654
1 365.46
表2.3
年 份
某地区耕地复种指数和农业发展指数
1996 120.40 100 1997 113.56 115.68 1998 126.54 124.50 1999 132.76 135.69 2000 121.43 129.56