菜鸟要学的数据库基础知识
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三阶段:数据库系统阶段
(60年代后期至今)
特点:为了解决多用户、多应用共享数据的要求,由数 据库管理系统DBMS管理数据,提高数据共享,减少数据 冗余,提供数据与应用程序独立, 达到有效的管理和存 取大量的数据资源。
应用程序1
应用程序2 ..
DBMS
DB
应用.程序3
第四阶段: 分布式数据库系统与面向对象数据库系统
1. 三个世界 计算机信息管理的对象是现实生活中的客
观事物,但这些事物是无法直接送入计算 机的,必须进一步整理和归类,进行信息 的规范化,然后才能将规范信息数据化并 送入计算机的数据库中保存起来。 这一过程经历了三个领域──现实世界、 信息世界和数据世界。
(1) 现实世界:存在于人脑之外的客观世界,包括事物及事物之间的联系。 (2) 信息世界:是现实世界在人们头脑中的反映。 (3) 数据世界:将信息世界中的实体进行数据化,事物及事物之间的联系
数据库系统层次图
1.1.2 数据管理的发展历史
数据管理: 是数据处理的中心问题,指如何 对数据 分类、组织、编码、存储、检索和 维护。
数据管理的发展历史可以分为四个阶段
第一阶段:人工管理阶段
(50年代中期以前): 人工管理阶段 特点:数据与程序不具有独立性,一组数
据对应一组程序。程序与程序之间存在大 量数据冗余。
学号 姓名 001 王 003 李 004 张
性别 男 女 女
成绩 66 77 25
学号 姓名 001 王 003 李 004 张
成绩 66 77 25
3. 联接
关系的横向结合,将两个关系模式拼接成一个
更宽的关系模式,生成的新关系中包含满足联 接条件的元组。
表1 班级 学生
wk.baidu.com一班 张三
一班 李四
二班 王五
①关系:一个关系就是一张二维表,每个关系有 一个关系名。如:纳税登记(税号,姓名,联系 电话) 。
②元组:一个二维表中,水平方向的一行成为一 个元组元组对应表中的一个具体记录。Access中 表示为记录。
③属性:二维表中垂直方向的列。Access中表示 为字段名。
④域:属性的取值范围。
⑤关键字:其值能唯一地标识一个元组的属性或 属性的组合。
第四阶段: 分布式数据库系统与面向对象数据库系统
面向对象数据库系统:是数据库技术与面 向对象程序设计技术结合
优点:它克服了传统数据库的局限性,能 够自然地存储复杂的数据对象及它们之间 的复杂关系,大幅提高了数据库管理效率、 降低了用户使用的复杂性。
书中银行系统为对象——关系数据库系统
1.1.3 数据模型
并为学生和借阅两个表建立联系,为书籍和借阅 两个表建立联系。这样,就完成了从现实世界到 数据世界的转换。
2.数据模型
数据库的数据结构形式,叫数据模型,它是对数 据库如何组织的一种模型化表示。
如果这个模型只能表示存储什么信息,那么它是 简单的,是文件系统早已解决了的问题,更重要 的是要以一定数据结构方式表示各种信息的联系。
应用程序1 应用程序1 应用程序1
数据组1 数据组1 数据组1
第二阶段:文件系统阶段
(50年代后期至60年代中期): 特点:程序和数据分开存储,形成程序文件和数据文件,
程序可以按名访问数据文件。但是, 同一个数据项可能 重复出现在多个文件中,导致数据冗余度较大,浪费空间, 没有形成数据共享,又不易统一修改容易造成数据的不一 致。
例如:从表中选出成绩在60分以下的人员得 到不及格人员成绩表。
学号 姓名 性别 成绩 001 王 男 66 003 李 女 77
学号 姓名 性别 成绩 004 张 女 25
004 张 女 25
2.投影
从一个关系(表)中选出若干列生成一个新的 关系(表)。
例如:从表中抽出“学号”.“姓名”.“成绩” 三列得到成绩表。
数据模型表示的是数据库框架。打个比方,建设 一幢楼房,首先要有建筑结构图,根据这个结构 图先搭好架子,然后才能堆砖砌瓦,使建筑物符 合要求,数据模型就相当于这个建筑结构图,根 据这个结构图组织装填数据。
数据模型的形式
概念模型(抽象的)
概念模型是数据库设计人员在认识现实世界中实体与 实体间联系后进行的一种抽象。
(1)层次模型
l 有且仅有一个结点无双亲,称之为“根”。 l 除根结点外,其他子结点,有且仅有一个双亲。 l 各实体型由上向下是一对多关系
网络模型
能够表示实体间的多种复杂联系和实体类型之间的 对对多的联系。网络模型的特点:
l 可以有一个以上的结点无父结点; l 至少有一个子结点有一个以上的父结点; 在两个结点之间有两个或两个以上的联系。
1.3数据库设计基础
1.3.1 数据库设计步骤 一、设计原则
1. 概念单一化“一事一地”的原则 2. 避免在表之间出现重复字段 3. 表中的字段必须是原始数据和基本数据元素 4. 用外部关键字保证有关联的表之间的联系
二、设计步骤
1. 需求分析 2. 确定需要的表 3. 确定所需字段 4. 确定主键 5. 确定联系 6. 设计求精与优化
如:教师关系中的“学号”属性、选课成绩关系 中的“学号”与“课程号”属性组合。
⑥外部关键字:如果表中一个字段不是本表的主 关键字,而是另外一个表的关键字和候选关键字, 这个字段就称为外关键字。通过外部关键字使表 与表建立联系。
关系的特点
1. 关系必须规范化 表中不能再包含表
课程名 学时数 讲课 上机
数据处理的目的是从大量数据中,通过分析、归纳、推理 等科学方法,利用计算机技术、数据库技术等技术手段, 提取有效的信息资源,为进一步分析、管理、决策提供依
据。
原始数据
编码转换 编码表示形 数据输入 计算机表示形
式
式
计算机处理
信息 (结果数据)
搜集
输出
用户
2.数据库(DataBase,DB)
孤立的数据不能代表确切的信息,为反映某一方面的信息往往需要若 干数据。
用数据模型来描述。
术语的对照
现实世界 事物类 事物 性质
信息世界 实体集
数据世界 (在关系模型理论中)
关系
在关系数据库 中
表
实体
元组
记录
属性
属性
字段
例子:学生借阅图书
现实世界中:学生借阅图书 在信息世界中将抽象为学生和书籍两个实体集,
两个实体集间的联系为“借阅”。 用关系模型表示为学生、书籍和借阅三个关系。 用ACCESS中建立学生、书籍和借阅三个数据表,
功能:数据定义、数据操纵、数据库运行管理、 数据组织、存储与管理、数据库的建立与维护、 数据通信接口。
4.数据库系统(DataBase System,DBS)
是运行数据库系统的计算机系统。包括:
计算机硬件环境和操作系统环境
DBMS
数据库应用系统
数据库 数据库应用系统 用户
数据库管理系统 操作系统 硬件
“1980.12.21” 明天天气是“阴有雨”,也可以用图形符号: 用数据符号表示信息通常有三种: 数值型:如年龄、体重、价格、温度 字符型:姓名、单位、地址
特殊型:照片(图像)、刮风、下雨(图形符 号),还有声音、视频(多媒体数据)
数据处理
也称信息处理,是利用计算机对各种类型的数据进行处理。 包括数据的采集、整理、存储、分类、排序、检索、维护、 加工、统计和传输等一系列操作过程。
数据库中的数据具有高度的共享性。数据不是面向某一种应用,而是 面向多种应用,可以被多个应用程序共享。
3.数据库管理系统 (DataBase Management System,DBMS)
DBMS是数据管理软件,它需要操作系统的支持, 向用户提供了一系列的数据管理功能。
组成:数据定义语言、数据操纵语言、数据库运 行控制程序、实用程序
计算机 65 15 基础 C语言 70 20
课程名
计算机 基础 C语言
讲课时 上机
数
讲课
65
15
70
20
2. 在同一个关系中不能出现相同的属性名。 3. 关系中不允许有完全相同的元组。 4. 在一个关系中元组的次序无关紧要。 5. 在一个关系中列的次序无关紧要。
实际关系模型
关系数据库中,基本数据结构是二维表,表之间的联系通过不同表中的 公共字段来体现。各个关系模式不是孤立的,他们不是随意堆砌在一 起的一堆二维表,要正确反映事物及事物之间的联系,需要进行仔细 的关系数据库设计。
实现模型(具体的)
有三种:层次型、网络型和关系型
概念模型
最常用的描述概念模型的方法,称为实体—联系方法 (Entity-Relationship Approach),简称E-R方法。
实体:指客观存在并可相互区别的物体。实体可以是实在 的物体,如学生、图书等,也可以是抽象的事件,如订货、 借书等。
班长
1
班长-班级
1
班级
(a)
班长
1
班长-学生
n
学生
(b)
教师
m
教师-学生
n
学生
(c)
例教师讲课E——R图
2. 概念模型(实现模型)
目前有三种常用的实现模型形式: ①层次型-----IMS ②网状型-----DBTG ③ 关 系 型 -----Access 、 vfp 、 oracle 、 DB2 、 sybase等。
属性:实体具有的某一种特性。如学生实体具有的姓名、 性别等属性。
实体集:性质相同的同类实体的集合称为。如一个班的学 生、图书馆的所有图书、皇马球队的所有场比赛等。
实体型:属性的集合,例学生实体型描述为:学生(学号、 姓名、性别、出生年月)
实体之间的联系
一对一:工厂——厂长 一对多:系——教师 多对多:商店——顾客
引进我们的工作中时,财务部门所处理的单据、 报表等属于数据处理。 计算机中的数据是存储在某一种媒介上能够识别 的物理符号。 有两个含义:
描写事物的特性:例某人生日是“1980年12月21日” 数据在计算机中的表示形式:同一种意义的数据可能
用多种不同形式表示
例: 生 日 是 “ 1980 年 12 月 21 日 ” , 也 可 以
教师
学生
学校
课程教材
教室
(3)关系型数据模型
用二维表结构来表示实体以及实体之间联 系的模型称为关系数据模型。
无论实体本身还是实体间的联系均用称为 “关系”的二维表来表示。能自然地反映 实体间的联系。
与前两者区别:数据描述的一致性,模型 概念单一。
关系模型举例
教师关系
1.2关系数据库
1.2.1、关系术语
表2 二班 刘六 班级 班主 任
表3
学生
合并条件:
张三
表1.班级=表2.班级 李四
王五
刘六
班级 班主任 一班 李老师 一班 李老师 二班 王老师 二班 王老师
一班 李老 师
二班 王老
4.自然联接
在联接运算中,按照字段值对应相等为条 件进行的联接操作称为等值联接。是去掉 重复属性的等值联接。自然联接是最常用 的联接运算。
1.2.2关系运算
一、传统的集合运算 并:两个相同结构关系的并是由属于这两
个关系的元组组成的集合。 差:两个结构相同的关系R和S 的差是由属
于R但不属于S的元组组成。 交:两个结构相同的关系R和S的交是由既
属于R又属于S的元组组成的
二、专门的关系运算
1.选择
从一个关系(表)中按照一定的条件选出若干 记录(行)生成一个新的关系(表)。
第一章 数据库基础知识
本章学习任务
1.1 数据库基础知识 1.2 关系数据模型 1.3 数据库设计基础
1.1 数据库基本概念
数据库:能将大量的数据按照一定的方式 组织并存储起来,能够快速方便的管理与 维护数据的方法与技术,大大地方便了数 据共享。
1.1.1 数据库概述
1.数据与数据处理 数据处理并不是计算机特有的概念,计算机没有
例学生基本信息:姓名、性别、出生年月、籍贯、专业……这些数据 需组织起来。
最初的数据以文件形式组织,处理数据时,更多的是涉及对文件的操 作(读、写),带来了数据处理不便、数据共享困难等一系列问题。 数据库技术的产生有效地克服了这类问题。
数据库是存储在计算机系统中的存储介质上,按一定的方式组织起来 的相关数据的集合。数据库是结构化的,不仅仅描述数据本身,而且 数据之间的关系进行描述。
(70年代后期至今) 分布式数据库系统阶段:与网络技术紧密结合 特点:合理分布数据在系统的相关节点上,实现
节点共享,逻辑上属于同一系统,但在物理结构 上是分布式,因此用户不感觉到数据的分布。 由若干个节点集合而成,在通讯网络中联接在一 起,每个节点都是一个独立的数据库系统,都拥 有各自的数据库、中央处理机、终端以及各自的 局部数据库管理系统。