空间数据库-存储讲解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
空间数据库
胡茂胜
Tel: 13476106137 E-mail: humosen@
【空间数据库原理】 中国地质大学信息工程学院
第4章 空间数据组织与管理
本章内容 • §4.1文件组织与数据库 • §4.2空间数据管理方式 • §4.3空间数据引擎 • §4.4空间数据与属性数据的连接 • §4.5空间数据组织 • §4.6栅格数据存储和管理
City, River表映射到磁盘页
Canada
Mexico
共4条记录,每条72字节 Rio Parana St. Lawrence
Cuba
Rio Grande
表目录所在的块
Brazil
Mississippi
Country 6 1
USA
River
41
Argentina
City
-2
City 共7条记录,每条73字节
✓ CPU密集型操作。
• 空间数据库:
✓ 涉及的函数计算复杂。
DBMS C程序 SDBMS
CPU代价 低 高 高
I/O代价 高 低 高
✓ 数据太大,存储需求更高。
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
磁盘的几何结构和含义: • 构成:主轴、磁盘片、磁道 • 磁盘块(页面):磁盘与主存之间的最小传输单元。 • 数据从磁盘向主存中传输过程:
• 例子:二进制大对象(BLOB)域类型。
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库 River
实例:将记录从Country, country 共6条记录,每条80字节
• POLYGON((0 0,10 0,10 10,0 10,0 0),(5 5,7 5,7 7,5 7, 5 5))
– Well-Known Binary (WKB) format
• 0101000000000000000000F03F000000000000F03F • Byte order : 01 • WKB type : 01000000 • X : 000000000000F03F • Y : 000000000000F03F
§4.1文件组织与数据库
(1)磁头到达特定磁道上。(寻道时间ts) (2)磁盘块旋转到磁头下方。(延迟时间tl) (3)磁头读或写块中数据。(传输时间tt,固定的) • 总时间 ta = ts + tl + tt • 且满足 ts > tl > tt
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
缓冲区管理器: • DBMS中的一个软件模块,负责管理主存与二级存储之间的
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
域、记录和文件: ✓ 文件是记录的集合,一个文件可能跨越多个页面。 ✓ 一个页面是槽(slot)的集合,每个槽包含一条记录。 ✓ 每条记录是相同或不同类型的域的集合。
➢ 一条记录的域可以是定长或变长的。 ➢ 文件中的记录可以是有序或无序的。 ➢ 文件可以组织成链表或页面目录。
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库 1、数据文件
域、记录(物理、逻辑)、文件 2、数据库系统 3、空间数据库系统
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
空间数据的存储形式:二进制流或复杂结构, 如:
– Well-Known Text (WKT) format
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
• 传统数据库:
✓ 数据库事务和应用程序的需求是正交的(orthogonal)。
✓ 数据操作函数简单:包括<, =, >, MIN, MAX, AVG等。
✓ 衡量标准:数据从二级存储到主存之间的传输代价 (即I/O代价)。
• 应用程序:
Havana
......
Ottawa
......
共2条记录,每条73字节 Mexico City Buenos Aires
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
• 文件结构:文件中记录的组织形式。 • (1)无序文件(unordered file):
✓ 又叫堆(heap),其中记录没有特定的顺序,是最简单的组织形式。 ✓ 优点:在进行插入操作时可以很容易地在文件末尾插入一条新记录。 ✓ 代价:平均需要检索一半的磁盘页面,最坏情况需访问所有存储该文件数据的
和删除操作都非常有效,可以在一个常数时间内完成查询,与文件中记录的个 数无关。 ✓ 缺点:不适合范围查询。例如查找名字以字母”B”开头的城市。 ✓ 代价:常数时间内完成查询(例如两次磁盘访问)
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
示例:City表的散列 文件组织方式
2条记录 Havana Ottawa
磁盘页面。 ✓ 示例:上图River表。
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
• 文件结构:文件中记录的组织形式。 • (2)散列文件(hashed file):
✓ 使用散列函数把记录分到一系列散列单元中。 ✓ 优点:能够把数量大致相同的记录放入每个散列单元中,对于点的查询、插入
2条记录 Rosario Toronto
4个散列单元,9条记录
关键码<=6
1
关键码7—8 2
关键码9—10 3
关键码>=11 4
2条记录
Buenos Aries
......
Washington DC
3条记录 Brasillia Monterrey Mexico City
【空间数据库原理】 中国地质大学信息工程学院
数据传输。 • 置换策略:确保事务不会因为一部分数据不在主存中而停顿。 • 关系数据库的缓冲区管理:
✓ 主要基于关系查询行为。 ✓ 频繁访问集(hot set)模型:最近最少使用(LRU)算法。 ✓ 查询本地集(QLSM)模型:DBMIN算法。引用模式为:顺序引用、随机引
用、分层引用。 ✓ 使用DBMIN比使用频繁集访问的算法的吞吐量高出7到13个百分点。
胡茂胜
Tel: 13476106137 E-mail: humosen@
【空间数据库原理】 中国地质大学信息工程学院
第4章 空间数据组织与管理
本章内容 • §4.1文件组织与数据库 • §4.2空间数据管理方式 • §4.3空间数据引擎 • §4.4空间数据与属性数据的连接 • §4.5空间数据组织 • §4.6栅格数据存储和管理
City, River表映射到磁盘页
Canada
Mexico
共4条记录,每条72字节 Rio Parana St. Lawrence
Cuba
Rio Grande
表目录所在的块
Brazil
Mississippi
Country 6 1
USA
River
41
Argentina
City
-2
City 共7条记录,每条73字节
✓ CPU密集型操作。
• 空间数据库:
✓ 涉及的函数计算复杂。
DBMS C程序 SDBMS
CPU代价 低 高 高
I/O代价 高 低 高
✓ 数据太大,存储需求更高。
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
磁盘的几何结构和含义: • 构成:主轴、磁盘片、磁道 • 磁盘块(页面):磁盘与主存之间的最小传输单元。 • 数据从磁盘向主存中传输过程:
• 例子:二进制大对象(BLOB)域类型。
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库 River
实例:将记录从Country, country 共6条记录,每条80字节
• POLYGON((0 0,10 0,10 10,0 10,0 0),(5 5,7 5,7 7,5 7, 5 5))
– Well-Known Binary (WKB) format
• 0101000000000000000000F03F000000000000F03F • Byte order : 01 • WKB type : 01000000 • X : 000000000000F03F • Y : 000000000000F03F
§4.1文件组织与数据库
(1)磁头到达特定磁道上。(寻道时间ts) (2)磁盘块旋转到磁头下方。(延迟时间tl) (3)磁头读或写块中数据。(传输时间tt,固定的) • 总时间 ta = ts + tl + tt • 且满足 ts > tl > tt
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
缓冲区管理器: • DBMS中的一个软件模块,负责管理主存与二级存储之间的
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
域、记录和文件: ✓ 文件是记录的集合,一个文件可能跨越多个页面。 ✓ 一个页面是槽(slot)的集合,每个槽包含一条记录。 ✓ 每条记录是相同或不同类型的域的集合。
➢ 一条记录的域可以是定长或变长的。 ➢ 文件中的记录可以是有序或无序的。 ➢ 文件可以组织成链表或页面目录。
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库 1、数据文件
域、记录(物理、逻辑)、文件 2、数据库系统 3、空间数据库系统
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
空间数据的存储形式:二进制流或复杂结构, 如:
– Well-Known Text (WKT) format
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
• 传统数据库:
✓ 数据库事务和应用程序的需求是正交的(orthogonal)。
✓ 数据操作函数简单:包括<, =, >, MIN, MAX, AVG等。
✓ 衡量标准:数据从二级存储到主存之间的传输代价 (即I/O代价)。
• 应用程序:
Havana
......
Ottawa
......
共2条记录,每条73字节 Mexico City Buenos Aires
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
• 文件结构:文件中记录的组织形式。 • (1)无序文件(unordered file):
✓ 又叫堆(heap),其中记录没有特定的顺序,是最简单的组织形式。 ✓ 优点:在进行插入操作时可以很容易地在文件末尾插入一条新记录。 ✓ 代价:平均需要检索一半的磁盘页面,最坏情况需访问所有存储该文件数据的
和删除操作都非常有效,可以在一个常数时间内完成查询,与文件中记录的个 数无关。 ✓ 缺点:不适合范围查询。例如查找名字以字母”B”开头的城市。 ✓ 代价:常数时间内完成查询(例如两次磁盘访问)
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
示例:City表的散列 文件组织方式
2条记录 Havana Ottawa
磁盘页面。 ✓ 示例:上图River表。
【空间数据库原理】 中国地质大学信息工程学院
§4.1文件组织与数据库
• 文件结构:文件中记录的组织形式。 • (2)散列文件(hashed file):
✓ 使用散列函数把记录分到一系列散列单元中。 ✓ 优点:能够把数量大致相同的记录放入每个散列单元中,对于点的查询、插入
2条记录 Rosario Toronto
4个散列单元,9条记录
关键码<=6
1
关键码7—8 2
关键码9—10 3
关键码>=11 4
2条记录
Buenos Aries
......
Washington DC
3条记录 Brasillia Monterrey Mexico City
【空间数据库原理】 中国地质大学信息工程学院
数据传输。 • 置换策略:确保事务不会因为一部分数据不在主存中而停顿。 • 关系数据库的缓冲区管理:
✓ 主要基于关系查询行为。 ✓ 频繁访问集(hot set)模型:最近最少使用(LRU)算法。 ✓ 查询本地集(QLSM)模型:DBMIN算法。引用模式为:顺序引用、随机引
用、分层引用。 ✓ 使用DBMIN比使用频繁集访问的算法的吞吐量高出7到13个百分点。