12 空间索引解析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•Root search identifies child x •Search of x identifies children b and c •Search of b does not find object 5 •Search of c find object 5
Fig 4.16
空间数据库之空间索引技术 R+ 树
空间数据库之空间索引技术
4 空间索引的分类—R树空间索引-B树
B树的定义 B树是一种平衡的多分树,通常我们说m阶的B树,它必须满足如 下条件: (1)每个结点至多有m个子结点; (2)除根结点和叶结点外,其它每个结点至少有m/2 个子结点; (3)若根结点不是叶子结点,则至少有两个子结点; (4)所有的叶结点在同一层;
4 空间索引的分类—R树空间索引
● 1-9是图层中相应几何体的MBR。 ● a、b、c、d是R树的叶结点,含有所包括的几何体的MBR和指向该几何体的 指针;即a含1-MBR、1-ID、2-MBR、2-ID,b含3-MBR、3-ID、4-MBR、4-ID, c含5-MBR、5-ID、6-MBR、6-ID、7-MBR、7-ID,d含8-MBR、8-ID、9-MBR、 9-ID。 ● A含a-MBR、a-ID和b-MBR、b-ID,B含c-MBR、c-ID和d-MBR、d-ID。 ● 根结点(root)含A和B的MBR。
空间数据库之空间索引技术
1 问题引入—如何找到人力资源部
空间数据库之空间索引技术
主要内容
1 1 3
2 3
问题引入 索引的概念 空间索引的概念 空间索引的分类
3
3 4
空间数据库之空间索引技术
2 索引的概念
索引:英文index,指示位置的意思。
索引是将文献中具有检索意义的事项(可以是人名、地名、 词语、概念、或其他事项)按照一定方式有序编排起来,以 供检索的工具书。(摘自互动百科) 索引是根据表中一列或若干列按照一定顺序建立的列值与记 录行之间的对应关系表。(摘自百度百科) 索引本身是一个文件,当索引很大时,可以分块,建立高一
2 3
问题引入 索引的概念 空间索引的概念 空间索引的分类
3
3 4
空间数据库之空间索引技术
3 空间索引的概念—引入空间索引的原因
计算机自身原因
计算机存储器分为内存、外存,空间数据采用外 存存储 访问一次内存时间30~40ns(纳秒),外存 8~10ms(毫秒),可以看出两者相差十万倍以上 如果对外存上数据的位置不加以记彔和组织,每 查询一个数据项就要扫描整个数据文件 必须将数据在磁盘上的位置加以记彔和组织,通 过在内存中的一些计算来取代对磁盘漫无目的的 访问(空间换时间)
空间数据库之空间索引技术
4 空间索引的分类--格网索引(Grid Index)
3).查询(开窗)
空间数据库之空间索引技术
4 空间索引的分类--格网索引(Grid Index)
对应格元: G(2,3), G(2,4), G(3,3), G(3,4)
空间数据库之空间索引技术
4 空间索引的分类--格网索引(Grid Index)
R 树缺点
查询效率有时很低:索引空间经常重叠,可能要对 多条路径进行搜查后才能得到最后的结果。 频繁的数据更新影响查询效率:空间对象插入顺序 的不同会形成不同结构的R 树。
空间数据库之空间索引技术
4 空间索引的分类—R树空间索引
R树索引 不能调整对几何体的逼近精度(Spatial使用最 小边界矩形来进行调整) 索引的创建和调整容易 对存储量的需求较小 对邻近查询(SDO-NN操作)速度较快 几何实体的更新操作频繁时,性能影响较大 索引可以达到四维 对于全球(whole-earth)索引需要使用R树 四叉树索引 通过设置格网(tile)以及格网数目调整对几何 实体的逼近精度 索引的调整比较复杂,设置合适的微调参数 值对性能影响很大 需要很多的存储量 临近查询效率比较低 大量更新不影响四叉树的性能 只能索引二维数据
空间数据库之空间索引技术
4 空间索引的分类—四叉树空间索引
空间数据库之空间索引技术
4 空间索引的分类—R树空间索引-平衡树
• 树的概念
– 构成:根节点、中间结点、叶结点、无回路 的图。 – 度量:树的深度,子结点个数
• 平衡树
– 根结点到每一个叶结点的深度相等 。 – 树中每个非叶结点有n到M个子结点,M 对 特定的树是固定的(阶数)。2=< n<= M/2
层的索引。如此继续下去,得到一个多级索引结构。
空间数据库之空间索引技术
2 索引的概念—索引构件
索引的基本构件是索引
项。一个索引项中有关
键词值和指针,通过指 针就可找到含有此关键 词值的记录,即一个索 引项为:(关键词值,
指针)。多个索引项就
构成了一个索引(表)
索引项:关键词值和指针
主要内容
1 1 3
空间数据库之空间索引技术
3 空间索引的概念—内涵
依据空间对象的位置和形状或空间对象之间的某种空间 关系按一定的顺序排列的一种数据结构,其中包含空间 对象的概要信息,如对象的标识、外接矩形及指向空间 对象实体的指针。 作为一种辅助性的空间数据结构,空间索引介于空间操 作算法和空间对象之间,它通过筛选作用,大量与特定 空间操作无关的空间对象被排除,从而提高空间操作的 速度和效率。
4 空间索引的分类--格网索引(Grid Index)
2).记录每一个格网所包含的空间实体和记录实体 穿过的网格; G(1,2):1 G(1,3):2,8 G(2,3):3,4 7: G(2,1),G(2,2),G(3,1),G(3,2) … 8: G(1,3),G(2,4),G(3,4),G(3,5),G(4,5) … … … … … …
空间数据库之----
北京建筑大学测绘与城市空间信息学院
2015年12月03日
空间数据库之空间索引技术
主要内容
1 1 3
3 2
问题引入 索引的概念 空间索引的概念 空间索引的分类
3
3 4
空间数据库之空间索引技术
1 问题引入
在图书馆中找到自己想要的书?
怎样在字典里查找生字?
怎样在一栋大楼里找到人力资源部?
i=0, N=2i=1 1 i=1, N=2i=2
11 10 01
i=2,
N=2i=4
0 0 1
00 00 01 10 11
• 如何计算每个单元的Z值?
空间数据库之空间索引技术
4 空间索引的分类—填充曲线-Z曲线的构造步骤
• 1)读入每个网格x和y坐标的二进制表示; • 2)交叉扫描X、Y二进制数字的比特,形成一个新二进制 字符串;
空间数据库Байду номын сангаас空间索引技术
4 空间索引的分类—R树空间索引
R 树优点
很强的灵活性:无须预知整个空间对象所在的空间 范围, 就能建立空间索引。 高维索引:MBR是个广义的概念。 插入和删除操作相对较容易,索引空间可以重叠。 较少的存储空间
空间数据库之空间索引技术
4 空间索引的分类—R树空间索引
空间数据库之空间索引技术
4 空间索引的分类—R树空间索引
R 树结点的表示
• R树的非叶结点
– (I, 子结点的指针):I为子树结点所表示的矩 形MBR; 子结点的指针: 指向低一层结点。
• R树的叶结点
– (I, 元组标识符): I为空间对象的MBR;元组 标识符是数据库中存储对应于MBR的对象的元 组唯一标识符。
思路: 将研究区域用横竖线条划分大小相等或不等的格网,记录每一个格网所包含 的空间实体。当用户进行空间查询时,首先计算出用户查询对象所在格网, 然后再在该网格中快速查询所选空间实体,这样一来就大大地加速了空间索 引的查询速度。
步骤:
1).将研究区域用横竖线条划分大小相等或不等的格网;
空间数据库之空间索引技术
4.1.5 聚类文件组织
• 目的:
– 降低常见的大查询的寻道时间和等待时间; – 对于空间数据库,在二级存储中,空间上相邻 的和查询上有关联的对象在物理上应当存储在 一起。 – 有序文件不能体现空间数据的特点。
Z曲线
• 类别:
– 内部聚类:一个对象的全部存放在一个磁盘页 面中; – 局部聚类:一组近似的对象存放在一个磁盘页 面中; – 全局聚类:一组邻接对象存放在多个物理上相 邻的磁盘页面中
INDEXTYPE IS MDSYS.SPATIAL_INDEX;
创建四叉树索引
CREATE INDEX ROADS_FIXED ON ROADS(SHAPE) INDEXTYPE IS MDSYS.SPATIAL_INDEX
PARAMETERS(‘SDO_LEVEL = 8’);
空间数据库之空间索引技术
• 计算出结果二进制串的十进制值作为该网格的Z值。
空间数据库之空间索引技术
4 空间索引的分类—填充曲线-Z曲线的例子
4 空间索引的分类—R树空间索引
•R+特征 平衡树 结点是矩形 子结点矩形位于父结点矩形内; 中间结点不重叠; 叶结点-Polygon, Line的MBR Fig 4.18 查找操作的实现 与R树类似 但查找时每次只有一个子节点跟 随(子结点上的查找路径只有一条) Fig 4.17
空间数据库之空间索引技术
空间数据库之空间索引技术
主要内容
1 1 3
2 3
问题引入 索引的概念 空间索引的概念 空间索引的分类
3
3 4
空间数据库之空间索引技术
4 空间索引的分类
基于格网的空间索引
空 间 索 引
基于树的空间索引结构
基于填充曲线的空间索引结构
空间数据库之空间索引技术
4 空间索引的分类--格网索引(Grid Index)
空间数据库之空间索引技术
•R-树的特征 •平衡树 • 结点是矩形 • 子结点矩形位于父结点矩形内; • 中间结点可能重叠; Fig 4.15 • 其他属性见4.2.2节; •查找操作的实现 •搜索根结点、确定相关的子结点。 •递归地搜索子结点; •由于中间结点可以重叠,查找路 径可能有多条
•例如: find record for rectangle 5
对于大地数据上使用SDO-WITHINDISTANCE查询,推荐使用R树
选择R树或者四叉树索引
空间数据库之空间索引技术
4 空间索引的分类—空间索引
Oracle中空间索引的创建
创建R树索引
CREATE INDEX territory_idx ON territories (territory_geom)
Hilbert曲线
• 全局聚类:用空间填充曲线的方法
– Z曲线; – Hilbert曲线。
空间数据库之空间索引技术
4 空间索引的分类—填充曲线
Z曲线的搜素顺序(Z值)
4
1
3
0
2
空间数据库之空间索引技术
4 空间索引的分类—填充曲线-Z曲线的构造
• 将一个区域在x和y坐标上进行折半(0,1)迭代划分; • 在i次迭代中(i=0,1,……,n-1),x, y轴上的分段数为N=2i,分段 的x,y位置可以用i位二进制数(0,1)表示。 • 将平面分成NxN的网格区域。 • 每个网格坐标的二进制表示
对应实体:相交模式下:3,4,5,8,12
对应实体:包含模式下:3,4,5, 12
空间数据库之空间索引技术
4 空间索引的分类—四叉树空间索引
• 将坐标空间中所有的几何体以分解完整且互不重叠的分块面片覆 盖,其基本思想是将坐标空间的范围视为一矩形,四叉树分解的 第一步是将矩形沿坐标轴方向平均分割生成四个相同大小的分块, 对每一个与几何体相交的面片继续以相同形式分割,直至满足一 定的原则,如面片达到一定大小或覆盖几何体的面片达到一定数 目,则分解停止。
空间数据库之空间索引技术
4 空间索引的分类—R树空间索引
•基本思想 •用最小外接矩形的层次集合来组织空间对象; •是B树在多维上的扩展 • R-树的分类 • 处理大的空间对象 • R 树:叶结点(数据)矩形可能重叠,中间结点 (目录)矩形允许重叠 ( overlap ) • R+ 树:中间结点的目录矩形不允许重叠; •R树和R+树的基本概念,阅读课本
空间数据库之空间索引技术
3 空间索引的概念—引入空间索引的原因
空间数据管理的独有特征
空间数据具有海量数据特征,NASA每天产生TB级数据,如
无索引管理将寸步难行,必将成为“数据坟墓”。 由于地理数据的多维性,在任何方向上并不存在优先级问 题。普通索引所针对的字符、数字等在一个维度上,任意 两个元素,都可以确定其关系(<,>,=)
相关文档
最新文档