数据库系统原理及应用--第十一章 半结构化数据模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2019/2/20
11.1 半结构化数据
5
11.1.2 半结构化数据表示
半结构化数据是节点(node)的集合,节点分 为叶子节点(leaf)和内部节点(interior); 叶子节点表示具体数据,数据的类型是数据库 中提供的数据类型,如:数字型、字符串型等; 内部节点至少有一条向外的弧,弧上都有一个 标签(label),该标签指明连接的节点之间的 关系。有一个根节点,没有进入弧。
2019/2/20
11.1 半结构化数据
6
11.1.2 半结构化数据表示
例如:电影数据库模式如下,电影数据库对应 的半结构化数据表示。
Movies(title,year,length,genre,studioName,producerC)
名称 年份 长度(分钟) 流派 住址 年份 电影公司名称 生日 主演姓名 导演证书号
11.2 XML 12
2019/2/20
11.2.2 有模式和无模式XML
XML可以应用于两种不同的模式: 1. 格式规范的XML允许用户自定义标签,就 像半结构化数据中的弧标签一样。 2. 合法的XML包括一个DTD(文档类型定义 ),它指定了允许使用的标签并给出了如何 嵌套它们的语法。
2019/2/20
2019/2/20
导演证书号 净资产 老总证书号
Studio(name, address, presC)
11.1 半结构化数据
7
11.1.2 半结构化数据表示
例如:电影数据库对应的半结构化数据表示如 下:
root movies moviestar row row
studio
row
row
row
row
root movies moviestar row row
studio
row
row
row
row
row
title
year length genre 101
studioname 剧情
producerc 56334
不能说的秘密 2007
安乐影片有限公司
2019/2/20
11.1 半结构化数据
9
11.1.3 信息集成与半结构化数据
半结构数据的灵活与自描述性使其成为数据交 换和信息集成的工具; 在互联网环境下得到广泛应用; 在信息集成中等到广泛应用。集成模型如下:
应用
XML接口
历史数据库
历史数据库
2019/2/20
11.1 半结构化数据
10
11.2 XML
XML(Extensible Markup Language,可扩展标记 语言)是一种基于标签的、最初是为“标记”文档 而设计的符号语言; 11.2.1 语义标签 11.2.2 有模式和无模式的XML 11.2.3 格式规范的XML 11.2.4 属性 11.2.5 连接元素的属性 11.2.6 命名空间 11.2.7 XML和数据库
row
title
year length genre 101
studioname 剧情
producerc 56334
不能说的秘密 2007
安乐影片有限公司
2019/2/20
11.1 半结构化数据
8
11.1.2 半结构化数据表示
例如:访问movies关系中的电影名称 的路径表达式为:/movies/row/title
3
11.1 半结构化数据
11.1.1 为何需要半结构化数据模型 11.1.2 半结构化数据表示 11.1.3 信息集成与半结构化数据
2019/2/20
第11章 半结构化数据模型
4
11.1.1 为何需要半结构化数据模型
关系数据库系统提供的是关系模型, 描述数据的模式是关系模式; 半结构化模型,更加灵活,因为他是 “无模式”、“自描述”的。半结构 化数据自身携带了模式信息。
第11章 半结构化数据模型 11
2019/2/20
11.2.1 语义标签
XML中的标签是用尖括号括起来的文本, 如:<movies>、 <row>、<title> XML中标签是配对的,如:
<movies> …… </movies>
配对标签和配对标签之间的内容称为XML 元素(element)。
第三部分 半结构化数据的 建模和程序设计
• 第11章 半结构化数据模型 • 第12章 XML程序设计语言
2019/2/20
第11章 半结构化数据模型
1
第11章 半结构化数据模型
11.1 半结构化数据 11.2 XML 11.3 文档类型定义 11.4 XML模式
2019/2/20
wenku.baidu.com
第11章 半结构化数据模型
2
11.1 半结构化数据
半结构化数据(semistructured-data)模型 在数据库系统中有着独特的地位: 1. 是一种适于数据库集成(integration) 的数据模型; 2. 是一种标记服务的基础模型,用于在 Web上共享信息,如:XML;
2019/2/20
第11章 半结构化数据模型
11.2 XML
13
11.2.3 格式规范的XML
模式规范的XML文档是由一行XML声明和 XML元素组成,如:
<? xml version="1.0" encoding="utf-8" standalone="yes" ?> <movies> <row> <title>不能说的秘密</title> <year>2007</year> <length>101</length> <genre>剧情</genre> <studioname>安乐影片有限公司</studioname> <producerc>56334</producerc> </row> …… </movies>
2019/2/20 11.2 XML 14
11.2.4 属性 11.2.5 连接元素的属性 11.2.6 命名空间
2019/2/20
11.2 XML
15
11.2.7 XML和数据库
数据库中的关系可以转换为XML数据,如: 开放实验的内容; 通过XML进行信息集成和信息共享。
MovieStar(name, address, gender, birthdate)
姓名 影片名称 性别
StarsIn(movieTitle, movieYear, starName) MovieExec(name, address, cert, netWorth)
导演姓名 住址 电影公司名称 地址