数据库技术及应用chapter1数据库技术基础
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2)文件系统阶段
程序1
程序2
存取方式
数据1 数据2
程序n
数据n
2)文件系统阶段
特点
系统提供一定的数据管理功能 存取方式支持对文件的基本操作,用户不必考虑物理细节
数据仍是面向应用的 一个数据文件对应一个或几个用户程序
数据与程序有一定的独立性 文件的逻辑结构与存储结构由系统进行转换,数据在存储上 的改变不一定反映在程序上
1.2.3 概念模型
图1.11 一对一联系 图1.12 一对多联系 图1.13 多对多联系
1.2.3 概念模型
1)信息世界中的基本概念 元或度(Degree)
参与联系的实体集的个数称为联系的元。
图1.14 3个实体之间的联系
1.2.3 概念模型
编制数据库系统的首要工作是把现实世界用 计算机表述出来。
E-R模型,又称E-R图,是描述概念世界,建立概念世界 的工具。
E-R图的基本要素包括: 实体 联系 属性
1.2.3 概念模型
1)概念模型中的基本概念
实体(Entity) 客观存在并可相互区分的事物叫实体
属性(Attribute) 实体所具有的某一特性
码(Key) 能唯一标识实体的属性或属性组
1.1.5 数据库系统的分级结构
用户A 用户B
用户D 用户E
外模式1(子模式1)
外模式2(子模式2)
子模式/概念模式 映射A
子模式/概念模式 映射B
概念模型(模式)
DBMS
模式/内模式映射
OS
三级结构
两级映射 物理模型(内模式)
1.1.5 数据库系统的分级结构
模式的分级
为了提高数据的物理独立性和逻辑独立性,使数据库 的用户观点,即用户看到的数据库,与数据库的物理 方面,即实际存储的数据库区分开来,数据库系统的 模式是分级的。
3)数据库系统阶段
特点2
数据的冗余度小,易扩充
数据面向整个系统,而不是面向某一应用,数据集 中管理,数据共享,因此冗余度小
节省存储空间,减少存取时间,且可避免数据之间 的不相容性和不一致性
每个应用选用数据库的一个子集,只要重新选取不 同子集或者加上一小部分数据,就可以满足新的应 用要求,这就是易扩充性
3)数据库系统阶段
特点3
具有较高的数据独立性
把数据库的定义和描述从应用程序中分离出去 数据描述是分级的(全局逻辑、局部逻辑、存储) 数据的存取由系统管理,用户不必考虑存取路径等
细节,从而简化了应用程序
3)数据库系统阶段
特点4
数据由DBMS统一管理与控制 数据的安全性控制(Security) 数据的完整性控制(Integrity) 并发控制(Concurrency)
模式(Schema)
所有用户的公共数据视图 是数据库中全体数据的全局逻辑结构和特性的描述
内模式(Storage Schema)
又称存储模式 是数据的物理结构及存储方式
1.1.5 数据库系统的分级结构
外模式/模式映像
定义某一个外模式和模式之间的对应关系,映象定义通常 包含在各外模式中。
3)数据库系统阶段
背景
计算机管理的数据量大,关系复杂,共享性要 求强
外存有了大容量的磁盘,光盘 硬件价格下降,编制和维护软件及应用程序成
本相对增加
3)数据库系统阶段
程序1
程序2
统一存取
数据1 数据2 数据n
程序n
3)数据库系统阶段
人事处
财务处
补贴 住址
系别 学号 性别
年龄 学位
姓名
学分 籍贯
1.1.3 数据库系统
数据库系统(Data Base System ,DBS) ,通常是指带 有数据库的计算机应用系统。
一般由数据库、数据库管理系统、计算机软件、硬件及系统 人员和用户等组成, 如图1.7 所示。
1.1.3 数据库系统
用户
用户
……
用户
应用系统/软件 应用开发工具 数据库管理系统
域(Domain) 属性的取值范围
1.2.3 概念模型
1)概念模型中的基本概念
实体型(Entity Type)
实体名与其属性名集合共同构成实体型 例,学生(学号、姓名、年龄、性别、系、年级) 注意实体型与实体(值)之间的区别,后者是前者的一个特例 如(0308100,王平,19,男,管理学院,2)是一个实体(值)
数据库系统三级模式结构
CODASYL(Conference On Data System Language,美 国数据系统语言协商会)提出模式、外模式、存储模 式三级模式的概念ห้องสมุดไป่ตู้三级模式之间有两级映像。
1.1.5 数据库系统的分级结构
外模式(Sub-Schema)
用户的数据视图 是数据的局部逻辑结构,模式的子集
数据与程序没有独立性 程序中存取数据的子程序随着存储结构的改变而改变
磁带的特点 优点:廉价地存放大容量数据 缺点:顺序访问;1%所需,100%访问
1)人工管理阶段
程序1
访问
数据1
程序2
访问
数据2
程序n
访问
数据n
2)文件系统阶段
背景
计算机不但用于科学计算,还用于管理 外存有了磁盘、磁鼓等直接存取设备 有了专门管理数据软件,一般称为文件系统
对于计算机科学而言, 数据的含义极其广泛, 如数字、文字、 图形、图像、声音等都可以通过编码而归之于数据的范畴。
1.1 数据库基本概念
3)信息与数据的关联
信息是指经过加工处理并可以对人类客观行为产生影响 的数据表现形式。任何事物的属性都是可以通过数据来 表示的。
数据是信息的符号表示, 是信息的具体表现形式, 或 称载体;信息是数据的内涵, 是数据的语义解释。
实体集(Entity Set)
同型实体的集合称为实体集 如全体学生
1.2.3 概念模型
1)信息世界中的基本概念 联系(Relationship)
实体之间的相互关联 联系的种类
一对一联系(1:1) 一对多联系(1:n) 多对多联系(m:n)
联系也可以有属性,如学生与课程之间有选课联 系,每个选课联系都有一个成绩作为其属性。
房产科
教务科
3)数据库系统阶段
特点1
面向全组织的复杂的数据结构
支持全企业的应用而不是某一个应用 数据反映了客观事物间的本质联系,而不是着眼于
面向某个应用,是有结构的数据。这是数据库系统 的主要特征之一,与文件系统的根本差别。文件系 统只是记录的内部有结构,一个文件的记录之间是 个线性序列,记录之间无联系
第一章 数据库技术基础
本章从数据库基本概念与知识出发, 介绍数据库技 术的产生与发展、数据库系统的组成、数据库管理 系统的功能、数据库系统的分级结构及数据模型。
主要内容
1.1 数据库基本概念 1.2 数据模型 1.3 数据库技术的发展与应用
1.1 数据库基本概念
1.1.1 信息、数据与数据处理 1)信息
当模式改变时,修改外模式/模式映像,使外模式保持不 变,从而应用程序可以保持不变,称为数据的逻辑独立性。
模式/内模式映像
定义数据逻辑结构与存储结构之间的对应关系。 存储结构改变时,修改模式/内模式映像,使模式保持不
变,从而应用程序可以保持不变,称为数据的物理独立性。
1.1.5 数据库系统的分级结构
1.2 数据模型
1.2.2 三类数据模型
1)概念数据模型,简称为概念模型,是独立于任何计算机实现 的。这类数据模型完全不涉及信息在计算机系统中的表示问题, 只用来描述某个特定的组织所关心的信息结构。
2)数据结构模型,简称为数据模型,是按计算机系统的观点对 数据建模,直接面向数据库中的数据的逻辑结构。
操作系统
数据库系统 管理员
数据库 图1.7 数据库系统组成
1.1.4 数据库管理系统
数据库管理系统(Data Base Management System,DBMS)是位于用户与操作系统之间的一层 数据管理软件。
DBMS的主要功能包括以下方面:
1)数据库定义功能 2)数据库查询和操纵功能 3)数据库运行管理功能 4)数据库的建立和维护功能 5)数据字典
1.1.2 数据管理技术的发展与数据库技术的产生
1)人工管理阶段 2)文件系统阶段
•数据库系统阶段
3)数据库系统阶段
•文件系统阶段
•人工管理阶段
1)人工管理阶段
背景
计算机主要用于科学计算 数据量小、结构简单,如高阶方程、曲线拟和等
外存为顺序存取设备 磁带、卡片、纸带,没有磁盘等直接存取设备
2)文件系统阶段
财务处 学号 姓名 系别 补贴 房产科 学号 姓名 性别 系别 住址 教务科 学号 姓名 系别 学分 学位 人事处 学号 姓名 性别 系别 年龄 学位 学分 籍贯
2)文件系统阶段
从这个例子中你能看出用文件管理数据有什 么优点与不足吗?
2)文件系统阶段
缺点
数据与程序的独立性差 数据的共享性差,冗余度大 数据的不一致性 数据查询困难 数据完整性难于保证
数据管理是指数据的收集、整理、组织、存储、维护、 检索、传送等操作,这部分操作是数据处理业务的基本 环节, 而且是任何数据处理业务中必不可少的共有部分。
数据处理是与数据管理相联系的, 数据管理技术的优 劣,将直接影响处理的效率。数据库技术正是瞄准这一 目标研究、发展并完善起来的专门技术。
1.1 数据库基本概念
3)物理数据模型,简称为物理模型,属于底层数据模型,通过 诸如记录格式、记录顺序和存取路径等表示信息,描述数据在 数据库系统中的实际存储方式。存取路径是一个特殊的结构, 用于在数据库文件中有效地搜索一个特定的数据库记录。
1.2.3 概念模型
概念模型是对现实的抽象 。如实体-联系模型(EntityRelationship Model, E-R模型)、语义网络模型等 。
所谓信息, 就是对客观事物的反映,从本质上看信息是对社会、 自然界的事物特征、现象、本质及规律的描述。
信息所描述的内容能够通过某种载体, 如符号、声音、文字、图 形、图像等来表征和传播。
信息具有可感知、可存储、可加工、可传递和可再生等属性。 2)数据
数据(Data) 是描述现实世界事物的符号记录, 在计算机科学 中是指所有能输入到计算机中并被计算机程序处理的符号的总称。
没有操作系统,没有数据管理软件 用户用机器指令编码,通过纸带机输入程序和数据, 程序运行完毕后,由用户取走纸带和运算结果,再让 下一用户上机操作
1)人工管理阶段
特点
用户完全负责数据管理工作 数据的组织、存储结构、存取方法、输入输出等
数据完全面向特定的应用程序 用户使用自己的数据,数据不保存,用完就撤走
现实世界
信息世界
计算机
计算机世界
应用
抽象、概念化
概念模型
转换、形式化
数据模型
1.2 数据模型
1.2.1 信息的抽象过程
信息的循环经历了三个领域:现实世界、信息世界和数据世界。 1)现实世界(Real Word),指存在于人们头脑之外的客观
世界,是具体事物和抽象概念的总和,是数据处理的源泉。事物 可分成“对象”与“性质”两大类。 2)信息世界(Information World),指现实世界在人们 头脑中的反映。信息世界的主要对象是实体以及实体间的相互联 系。 3)数据世界(Data World),指数据库系统的处理对象。现 实世界中的事实经过信息世界转换成信息,并经过加工、编码进 入计算机世界。
4)信息处理的基本环节
将原始信息表示成源数据, 然后对源数据进行处理而抽 取或推导出新的数据, 即结果数据。
信息处理的基本环节主要包括信息的收集、信息的输入、 信息的加工、信息的输出、信息的存储和传输, 其中信 息加工是信息处理的核心。
1.1 数据库基本概念
5)数据处理与数据管理
数据处理是指对数据进行分类、收集、组织、存储, 进 而从已有数据出发,抽取或推导出新的数据, 这些数据 表示了新的信息。
? 你有什么好办法吗
下一个问题
你知道实体之间的关系有多少种吗? 父子、师生、商品-消费者…… 关系复杂,种类繁多,作为数据的管理者怎
么办?
1.2.4 概念模型的表示方法——E-R模型
E-R模型可以用来说明数据库中实体的等级和属性。 E-R模型提供了直观的方法,可以清楚地表示实体、
房产科
教务科
学生(学号,姓名,系别,性别,住址) 学生(学号,姓名,系别,学分,学位)
视图
视图
学生(学号,姓名,性别,系别,年龄,住址,学分,学位,籍贯) 模式
1.1.5 数据库系统的分级结构
三级模式两级映像在生活中无处不在,你能 举一个例子吗?
1.2 数据模型
1.2.1 信息的抽象过程
用户