空间数据库中涉及到的基本知识讲解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相离(disjoint),邻接(meet),交叠 (overlap),相等(equal),包含 (contain),在内部(inside),覆盖 (cover)和被覆盖(covered by)。
2019/6/15
12
3.基于方位的关系
● 绝对方位 即在全球定位系统背景下定义的 方位,例如东、西、南、北,东南、西南、 东北等。
区域 ● CDT 集合型(collection)空间数据类型,例如
网络、划分等
2019/6/15
17
● PT 点 ● LN 线 ● RG 区域 ● PTN 划分 ● NTW 网络
2019/6/15
18
2.基于拓扑的描述 ●两个同类型空间数据是否相等(= 或 ≠) PT×PT →Bool LN×LN→ Bool RG×RG → Bool ●空间数据SDT是否在区域RG中(INSERT) SDT× RG →Bool
非负性 <x,x>≥0,<x,x>=0x=0, x∈V
对称性 <x,y>=<y,x>
线性性 <αx+βy,z >=α < x,z >+β< y,z >,α, β∈R;x,y,z∈V
直线R,平面R2和空间R3通过适当的定义内积都是 欧氏空间。
2019/6/15
6
2. 空间对象间的关系 • 集合 • 拓扑 • 方位 • 度量
2019/6/15
19
●两个大小非零的空间数据是否相交 (INTERSECTS)
NZS× NSZ→ Bool ●两个区域是否邻接(IS-NEIGHBOR—OF) RG×RG→Bool
2019/6/15
20
3.基于集合运算的描述 (1)相交(Intersection) ●两条线相交为点的集合 LN×LN →2PT ●线与区域相交为线的集合 LN×RG→2LN ●区域与区域相交为区域的集合 RG×RG→2RG
(3)区域(Region)例如森林、湖泊、行政区域 等。区域不但有位置,而且有面积、周长等参数, 以表示其覆盖范围。
2019/6/15
3
以上三种是最基本空间数据类型,以此为基础,还 可以导出下面两种空间数据类型:
(4)划分(Partition)一个区域可以是按其自然、 行政或其他特征,分成若干个区域。如果这些子 区域互不相交,但其“并”覆盖该区域,则此子 区域的集合就称为该区域的一个划分。国家行政 区域划分图,土地利用图等都是划分的例子。划 分可嵌套,例如国家分成省市,省市分成县区、 县区分成乡镇等。
∏河流名,城市名(河流 ⋈F城市)
其中,F=Mindist(城市名,ROUTE(河流流域 图))<10000
2019/6/15
32
2.7空间数据查询语言
一般在SQL语言基础上扩充空间数据类型及 其操作和相应的保留字。
2019/6/15
33
例3 ●选择广东省所有城市及其人口: select 城市名,人口 from 城市 where center(城市地图)inside广东省;
城市是个关系,“广州”是城市名,F中的第一个谓词是空 间谓词,要用到广东省地图。
2019/6/15
31
2.空间连接
例2 对每条河流找出沿河10000米的所有城市
设“河流”、“城市”是两个关系。在关系“河流” 中,有属性“河流流域图”。如果城市中心距离 河流小于等于10000米,则该城市和河流匹配。 可以用空间连接表示如下:
2019/6/15
7
2.3 空间对象之间关系
1.基于集合的关系 基于集合的空间对象关系主要有元素与
集合的属于及不属于的关系,集合与集合 的包含、相交、并等关系。在空间对象间 的层次关系就适合用集合的关系理论来讨 论,例如城市包含公园,公园包含树林等。
2019/6/15
8
2.基于拓扑的关系
基于拓扑的空间对象关系主要有邻接 (meet)、包含(within)和交叠(overlap), 这三类拓扑关系也是空间数据查询中最有可能出 现的情况。空间数据库中,基于拓扑的查询需要 解决这样两个问题:
2019/6/15
34
●选择流经广东省所有河流的河流名及其在 广东省境内的长度:
select 河流名,length(intersection(route (河流流域图),广东))
from 河流 where route(河流流域图)intersects广东;
2019/6/15
35
●选择距离广州小于等于100000米,人口大 于等于50万的所有城市:
2019/6/15
21
(2)重叠(OVERLAP) PTN×PTN→2FG (3)中心点(CENTER) NZS→PT
2019/6/15
22
4.基于度量的描述 ●两点间距离(DIST) PT×PT → NUM DIST ●两空间图形间的最大、最小距离
(MAXDIST,MINDIST) SDT×SDT→NUM MAXDIST或MINDIST
设A、B线段的起点和终点分别为x1A,x2A, x1B,x2B,则(1)~(5)的关系可以归纳 为max{x1A,x1B}<min{x2B,x2B}
2019/6/15
26
A B
£¨1£© A=B
A B
£¨1£© A[ B
A B
£¨1£© A%B
A B
£¨1£© A]B
A B
£¨5£© A/B
ห้องสมุดไป่ตู้
A B
2
在GIS中,基本空间数据类型由下述三种空间对象 组成:
(1)点(Point) 例如城市。点只表示其空间位置, 不表示其范围(extent)
(2)线(Line)例如河流、道路、管道、航线、等 高线、等降雨线、通信或电力线路等。线不仅表 示线上各点在空间的位置,而且还有长度,即表 示其在空间的延伸范围。
select 城市名,人口
from 城市,广东区域图
where dist(城市名,广州)<=100000 and 人口=>500000;
2019/6/15
36
例4 将例2表示的查询用SQL风格表示出来 select 河流名,城市名 from 河流,城市 where mindist(城市名,ROUTE(河流流域
29
1.空间选择
例1 写出下列空间选择表达式。
●选择广东省所有城市:
σF(城市)其中,F=CENTER(城市地图) INSIDE 广东;
城市是关系名,其中有属性“城市名”、“人口”、 “城市地图”。城市地图表示市区及其周边地区, “广东”是一个区域名称。显然,如果城市中心 点在广东省区域内,则该城市一定属于广东省
2019/6/15
10
对象的这六个部分分别构成九种相交情况: A∩ﹾB, A∂∩ﹾB,A ∩ﹾB- ; ∂A∩Bﹾ, ∂A ∩∂B,∂A∩ B-; A- ∩ Bﹾ, A-∩∂B, A-∩B-。
2019/6/15
11
考虑到{0,1}取值情况{0,1},可以确定有 29=512种二元拓扑关系,这里,人们研究 其中的八种彼此互斥关系:
1 空间数据库中涉及到的知识
●空间数据模型 ●空间索引 ●空间数据库管理系统
2019/6/15
1
2 空间数据模型
12.1空间数据模型 特点:模型的提出、引入与相应的实际应用 密切相关。 空间数据库的一个重要应用领域是GIS。 通常就以GIS为应用背景,介绍其中的基本 空间数据类型。
2019/6/15
在空间数据库中,空间关系主要用于查 询。为了获得可以接受的查询效率,常常 把空间对象用点、矩形和方盒等简单,规 则的图形表示。
规则的几何图形可以看做空间中标准 的“点集合”,因此,空间数据操作的集 合描述就是这些标准集合间关系的描述。
2019/6/15
25
1.一维空间中两个线段的关系
一维空间中两个线段的7种可能的关系,分别 用记号“=、[、%、]、/、|、<”表示。图104表示了这些关系,其中,(1)~(5)是 相交关系,(6)(7)是非相交关系。
● 相对方位 即根据与给定目标的方向来定义 的方位,例如左右、前后、上下等。
● 基于观察者的方位 即按照专门指定的称为 观察者参照对象来定义的方位。
2019/6/15
13
4.基于度量的关系 设有一个集合E,如果在E上定义了一个二元函数d
(x,y),x,y∈E,满足如下条件: (1)非负性 d(x,y)≥0 (2)对称性 d(x,y)= d(y,x) (3)三角不等性 d(x,y)≤d(x,z)+ d(z,y) 则称V是一个度量空间,d(x,y)称为V上的度量
£¨6£© A| B
A B
£¨7£© A<B
2019/6/15
27
2.二维空间中边平行于坐标轴矩形间的关系
设A、B为这种矩形,其左下角坐标和右上角 坐 {(标x1分B,别y为1B){(,x1(A,x2yB1,A)y2,B)(}。x2A可,以y2得A)到}和, 如果A和B在x轴和y轴上的投影分别相交, 则A、B相交。因此,A,B相交的条件可以 表示为
函数。
2019/6/15
14
考察一个空间的“测度”,例如线段的长度, 平面图形的面积,空间立体的体积,以及 一个空间对象相对于另一个空间对象的距 离等都是基于度量的关系。
2019/6/15
15
2.4空间数据操作的谓词描述
从理论上讲,空间数据操作特别是空间 数据查询的基础是空间对象之间的相互关 系,从实际上看,由于空间数据类型取决 于实际应用,空间数据操作主要也由现实 中的应用所决定。
● 查询所有与给定对象具有某种拓扑关系R的空间 对象。
● 对象A和B具有怎样的拓扑关系。
2019/6/15
9
在平面上,两个对象A和B之间的二元拓扑关 系时基于以下对象成分的相交(insection) 关系:
A的内部——Aﹾ,A的边界∂A,A的外部—— A-。
B的内部——Bﹾ,B的边界∂B,B的外部—— B-。
空间数据操作的描述可以有谓词形式、 集合形式和代数形式三种。
2019/6/15
16
1.基本符号 先定义空间数据操作中的一些记号。 ● SDT 空间数据类型 ● ZS 大小为零(zero size)空间数据类型,例如
点 ● NZS 大小非零(non-zero size)的空间数据类
型,例如线、区域等 ● ADT 原子(atomic)空间数据类型 例如点、线、
2019/6/15
30
●选择广东省的所有河流:
σF(河流)其中 F=ROUTE(河流)INSIDE广东;
“河流”是关系名,其中有属性“河流流域图”。ROUTE是 空间数据库中的一个函数,计算河流、道路等的中心线。
●选择距离广州小于等于100000米,人口大于等于50万的 所有城市:
σF(城市,广东区域图)其中F=DIST(城市名,广州) <=100000 AND 人口 =>500000;
行于坐标轴的最小矩形来代替不规则土星进行查 询。这种矩形就称为不规则区域的最小限定矩形 (minimum bounding rectangle ,MBR)。设 My和和2B纵纵)R坐坐,左标 标则下, 。x角1,x不坐2,y但标1就y区为2分分域(别别可x1为为以,空空用y1间间)M对对B,R象象右近的的上似最最角表大小为示横横(,坐坐x线2标标,也 可以用MBR近似表示;进一步,不但单个空间对 象可以用MBR近似表示,有时MBR还可以包含多 个空间对象。最小限定矩形如下图所示。
图))<=10000
2019/6/15
37
3 空间索引
空间数据库查询的开销一般比关系数据库大, 特别是空间谓词求值的开销远比数值或字 符串的比较要大。若采用顺序扫描方法进 行查询,则效率就会很低,因此采取空间 索引十分必要的。
2019/6/15
38
3.1空间索引概述
1.空间索引的思路 为了减少开销,通常是采用近似规则图形例如边平
2019/6/15
4
(5)网络(Network)网络是由若干点和一 些点与点之间的联线组成。例如公路网、 河网、电力网、电话网、交通线路图等都 是网络的例子。
2019/6/15
5
2.2空间对象所处的环境
1.欧氏空间
设R表示实数域,V是R上向量的非空集合,如果在 V上定义了满足如下条件并称之为内积的一个二 元函数<x,y>,则称V为R的欧氏空间:
[mya1xB{}<x1mA,in{xy1B2A},<myi2nB{}x] 2A,x2B }]和[max{ y1A,
2019/6/15
28
2.6空间关系的代数描述与运算
空间代数运算的特点在于选择条件或连接条 件中出现空间谓词。投影、集合运算不涉 及空间谓词,与关系代数没有本质区别。
2019/6/15
2019/6/15
23
●多点的直径(DIAMETER)
PT→ NUM DIAMETER ●线的长度(LENGTH)
LN → NUM LENGTH ●区域的周长(PERIMETER)或面积
(AREA) RG → NUM PERIMETER 或AREA
2019/6/15
24
2.5空间关系的集合描述与判断
2019/6/15
12
3.基于方位的关系
● 绝对方位 即在全球定位系统背景下定义的 方位,例如东、西、南、北,东南、西南、 东北等。
区域 ● CDT 集合型(collection)空间数据类型,例如
网络、划分等
2019/6/15
17
● PT 点 ● LN 线 ● RG 区域 ● PTN 划分 ● NTW 网络
2019/6/15
18
2.基于拓扑的描述 ●两个同类型空间数据是否相等(= 或 ≠) PT×PT →Bool LN×LN→ Bool RG×RG → Bool ●空间数据SDT是否在区域RG中(INSERT) SDT× RG →Bool
非负性 <x,x>≥0,<x,x>=0x=0, x∈V
对称性 <x,y>=<y,x>
线性性 <αx+βy,z >=α < x,z >+β< y,z >,α, β∈R;x,y,z∈V
直线R,平面R2和空间R3通过适当的定义内积都是 欧氏空间。
2019/6/15
6
2. 空间对象间的关系 • 集合 • 拓扑 • 方位 • 度量
2019/6/15
19
●两个大小非零的空间数据是否相交 (INTERSECTS)
NZS× NSZ→ Bool ●两个区域是否邻接(IS-NEIGHBOR—OF) RG×RG→Bool
2019/6/15
20
3.基于集合运算的描述 (1)相交(Intersection) ●两条线相交为点的集合 LN×LN →2PT ●线与区域相交为线的集合 LN×RG→2LN ●区域与区域相交为区域的集合 RG×RG→2RG
(3)区域(Region)例如森林、湖泊、行政区域 等。区域不但有位置,而且有面积、周长等参数, 以表示其覆盖范围。
2019/6/15
3
以上三种是最基本空间数据类型,以此为基础,还 可以导出下面两种空间数据类型:
(4)划分(Partition)一个区域可以是按其自然、 行政或其他特征,分成若干个区域。如果这些子 区域互不相交,但其“并”覆盖该区域,则此子 区域的集合就称为该区域的一个划分。国家行政 区域划分图,土地利用图等都是划分的例子。划 分可嵌套,例如国家分成省市,省市分成县区、 县区分成乡镇等。
∏河流名,城市名(河流 ⋈F城市)
其中,F=Mindist(城市名,ROUTE(河流流域 图))<10000
2019/6/15
32
2.7空间数据查询语言
一般在SQL语言基础上扩充空间数据类型及 其操作和相应的保留字。
2019/6/15
33
例3 ●选择广东省所有城市及其人口: select 城市名,人口 from 城市 where center(城市地图)inside广东省;
城市是个关系,“广州”是城市名,F中的第一个谓词是空 间谓词,要用到广东省地图。
2019/6/15
31
2.空间连接
例2 对每条河流找出沿河10000米的所有城市
设“河流”、“城市”是两个关系。在关系“河流” 中,有属性“河流流域图”。如果城市中心距离 河流小于等于10000米,则该城市和河流匹配。 可以用空间连接表示如下:
2019/6/15
7
2.3 空间对象之间关系
1.基于集合的关系 基于集合的空间对象关系主要有元素与
集合的属于及不属于的关系,集合与集合 的包含、相交、并等关系。在空间对象间 的层次关系就适合用集合的关系理论来讨 论,例如城市包含公园,公园包含树林等。
2019/6/15
8
2.基于拓扑的关系
基于拓扑的空间对象关系主要有邻接 (meet)、包含(within)和交叠(overlap), 这三类拓扑关系也是空间数据查询中最有可能出 现的情况。空间数据库中,基于拓扑的查询需要 解决这样两个问题:
2019/6/15
34
●选择流经广东省所有河流的河流名及其在 广东省境内的长度:
select 河流名,length(intersection(route (河流流域图),广东))
from 河流 where route(河流流域图)intersects广东;
2019/6/15
35
●选择距离广州小于等于100000米,人口大 于等于50万的所有城市:
2019/6/15
21
(2)重叠(OVERLAP) PTN×PTN→2FG (3)中心点(CENTER) NZS→PT
2019/6/15
22
4.基于度量的描述 ●两点间距离(DIST) PT×PT → NUM DIST ●两空间图形间的最大、最小距离
(MAXDIST,MINDIST) SDT×SDT→NUM MAXDIST或MINDIST
设A、B线段的起点和终点分别为x1A,x2A, x1B,x2B,则(1)~(5)的关系可以归纳 为max{x1A,x1B}<min{x2B,x2B}
2019/6/15
26
A B
£¨1£© A=B
A B
£¨1£© A[ B
A B
£¨1£© A%B
A B
£¨1£© A]B
A B
£¨5£© A/B
ห้องสมุดไป่ตู้
A B
2
在GIS中,基本空间数据类型由下述三种空间对象 组成:
(1)点(Point) 例如城市。点只表示其空间位置, 不表示其范围(extent)
(2)线(Line)例如河流、道路、管道、航线、等 高线、等降雨线、通信或电力线路等。线不仅表 示线上各点在空间的位置,而且还有长度,即表 示其在空间的延伸范围。
select 城市名,人口
from 城市,广东区域图
where dist(城市名,广州)<=100000 and 人口=>500000;
2019/6/15
36
例4 将例2表示的查询用SQL风格表示出来 select 河流名,城市名 from 河流,城市 where mindist(城市名,ROUTE(河流流域
29
1.空间选择
例1 写出下列空间选择表达式。
●选择广东省所有城市:
σF(城市)其中,F=CENTER(城市地图) INSIDE 广东;
城市是关系名,其中有属性“城市名”、“人口”、 “城市地图”。城市地图表示市区及其周边地区, “广东”是一个区域名称。显然,如果城市中心 点在广东省区域内,则该城市一定属于广东省
2019/6/15
10
对象的这六个部分分别构成九种相交情况: A∩ﹾB, A∂∩ﹾB,A ∩ﹾB- ; ∂A∩Bﹾ, ∂A ∩∂B,∂A∩ B-; A- ∩ Bﹾ, A-∩∂B, A-∩B-。
2019/6/15
11
考虑到{0,1}取值情况{0,1},可以确定有 29=512种二元拓扑关系,这里,人们研究 其中的八种彼此互斥关系:
1 空间数据库中涉及到的知识
●空间数据模型 ●空间索引 ●空间数据库管理系统
2019/6/15
1
2 空间数据模型
12.1空间数据模型 特点:模型的提出、引入与相应的实际应用 密切相关。 空间数据库的一个重要应用领域是GIS。 通常就以GIS为应用背景,介绍其中的基本 空间数据类型。
2019/6/15
在空间数据库中,空间关系主要用于查 询。为了获得可以接受的查询效率,常常 把空间对象用点、矩形和方盒等简单,规 则的图形表示。
规则的几何图形可以看做空间中标准 的“点集合”,因此,空间数据操作的集 合描述就是这些标准集合间关系的描述。
2019/6/15
25
1.一维空间中两个线段的关系
一维空间中两个线段的7种可能的关系,分别 用记号“=、[、%、]、/、|、<”表示。图104表示了这些关系,其中,(1)~(5)是 相交关系,(6)(7)是非相交关系。
● 相对方位 即根据与给定目标的方向来定义 的方位,例如左右、前后、上下等。
● 基于观察者的方位 即按照专门指定的称为 观察者参照对象来定义的方位。
2019/6/15
13
4.基于度量的关系 设有一个集合E,如果在E上定义了一个二元函数d
(x,y),x,y∈E,满足如下条件: (1)非负性 d(x,y)≥0 (2)对称性 d(x,y)= d(y,x) (3)三角不等性 d(x,y)≤d(x,z)+ d(z,y) 则称V是一个度量空间,d(x,y)称为V上的度量
£¨6£© A| B
A B
£¨7£© A<B
2019/6/15
27
2.二维空间中边平行于坐标轴矩形间的关系
设A、B为这种矩形,其左下角坐标和右上角 坐 {(标x1分B,别y为1B){(,x1(A,x2yB1,A)y2,B)(}。x2A可,以y2得A)到}和, 如果A和B在x轴和y轴上的投影分别相交, 则A、B相交。因此,A,B相交的条件可以 表示为
函数。
2019/6/15
14
考察一个空间的“测度”,例如线段的长度, 平面图形的面积,空间立体的体积,以及 一个空间对象相对于另一个空间对象的距 离等都是基于度量的关系。
2019/6/15
15
2.4空间数据操作的谓词描述
从理论上讲,空间数据操作特别是空间 数据查询的基础是空间对象之间的相互关 系,从实际上看,由于空间数据类型取决 于实际应用,空间数据操作主要也由现实 中的应用所决定。
● 查询所有与给定对象具有某种拓扑关系R的空间 对象。
● 对象A和B具有怎样的拓扑关系。
2019/6/15
9
在平面上,两个对象A和B之间的二元拓扑关 系时基于以下对象成分的相交(insection) 关系:
A的内部——Aﹾ,A的边界∂A,A的外部—— A-。
B的内部——Bﹾ,B的边界∂B,B的外部—— B-。
空间数据操作的描述可以有谓词形式、 集合形式和代数形式三种。
2019/6/15
16
1.基本符号 先定义空间数据操作中的一些记号。 ● SDT 空间数据类型 ● ZS 大小为零(zero size)空间数据类型,例如
点 ● NZS 大小非零(non-zero size)的空间数据类
型,例如线、区域等 ● ADT 原子(atomic)空间数据类型 例如点、线、
2019/6/15
30
●选择广东省的所有河流:
σF(河流)其中 F=ROUTE(河流)INSIDE广东;
“河流”是关系名,其中有属性“河流流域图”。ROUTE是 空间数据库中的一个函数,计算河流、道路等的中心线。
●选择距离广州小于等于100000米,人口大于等于50万的 所有城市:
σF(城市,广东区域图)其中F=DIST(城市名,广州) <=100000 AND 人口 =>500000;
行于坐标轴的最小矩形来代替不规则土星进行查 询。这种矩形就称为不规则区域的最小限定矩形 (minimum bounding rectangle ,MBR)。设 My和和2B纵纵)R坐坐,左标 标则下, 。x角1,x不坐2,y但标1就y区为2分分域(别别可x1为为以,空空用y1间间)M对对B,R象象右近的的上似最最角表大小为示横横(,坐坐x线2标标,也 可以用MBR近似表示;进一步,不但单个空间对 象可以用MBR近似表示,有时MBR还可以包含多 个空间对象。最小限定矩形如下图所示。
图))<=10000
2019/6/15
37
3 空间索引
空间数据库查询的开销一般比关系数据库大, 特别是空间谓词求值的开销远比数值或字 符串的比较要大。若采用顺序扫描方法进 行查询,则效率就会很低,因此采取空间 索引十分必要的。
2019/6/15
38
3.1空间索引概述
1.空间索引的思路 为了减少开销,通常是采用近似规则图形例如边平
2019/6/15
4
(5)网络(Network)网络是由若干点和一 些点与点之间的联线组成。例如公路网、 河网、电力网、电话网、交通线路图等都 是网络的例子。
2019/6/15
5
2.2空间对象所处的环境
1.欧氏空间
设R表示实数域,V是R上向量的非空集合,如果在 V上定义了满足如下条件并称之为内积的一个二 元函数<x,y>,则称V为R的欧氏空间:
[mya1xB{}<x1mA,in{xy1B2A},<myi2nB{}x] 2A,x2B }]和[max{ y1A,
2019/6/15
28
2.6空间关系的代数描述与运算
空间代数运算的特点在于选择条件或连接条 件中出现空间谓词。投影、集合运算不涉 及空间谓词,与关系代数没有本质区别。
2019/6/15
2019/6/15
23
●多点的直径(DIAMETER)
PT→ NUM DIAMETER ●线的长度(LENGTH)
LN → NUM LENGTH ●区域的周长(PERIMETER)或面积
(AREA) RG → NUM PERIMETER 或AREA
2019/6/15
24
2.5空间关系的集合描述与判断