菜鸟要学的数据库基础知识

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三阶段:数据库系统阶段
(60年代后期至今)
特点:为了解决多用户、多应用共享数据的要求,由数 据库管理系统DBMS管理数据,提高数据共享,减少数据 冗余,提供数据与应用程序独立, 达到有效的管理和存 取大量的数据资源。
应用程序1
应用程序2 ..
DBMS
DB
应用.程序3
第四阶段: 分布式数据库系统与面向对象数据库系统
1. 三个世界 计算机信息管理的对象是现实生活中的客
观事物,但这些事物是无法直接送入计算 机的,必须进一步整理和归类,进行信息 的规范化,然后才能将规范信息数据化并 送入计算机的数据库中保存起来。 这一过程经历了三个领域──现实世界、 信息世界和数据世界。
(1) 现实世界:存在于人脑之外的客观世界,包括事物及事物之间的联系。 (2) 信息世界:是现实世界在人们头脑中的反映。 (3) 数据世界:将信息世界中的实体进行数据化,事物及事物之间的联系
数据库系统层次图
1.1.2 数据管理的发展历史
数据管理: 是数据处理的中心问题,指如何 对数据 分类、组织、编码、存储、检索和 维护。
数据管理的发展历史可以分为四个阶段
第一阶段:人工管理阶段
(50年代中期以前): 人工管理阶段 特点:数据与程序不具有独立性,一组数
据对应一组程序。程序与程序之间存在大 量数据冗余。
学号 姓名 001 王 003 李 004 张
性别 男 女 女
成绩 66 77 25
学号 姓名 001 王 003 李 004 张
成绩 66 77 25
3. 联接
关系的横向结合,将两个关系模式拼接成一个
更宽的关系模式,生成的新关系中包含满足联 接条件的元组。
表1 班级 学生
wk.baidu.com一班 张三
一班 李四
二班 王五
①关系:一个关系就是一张二维表,每个关系有 一个关系名。如:纳税登记(税号,姓名,联系 电话) 。
②元组:一个二维表中,水平方向的一行成为一 个元组元组对应表中的一个具体记录。Access中 表示为记录。
③属性:二维表中垂直方向的列。Access中表示 为字段名。
④域:属性的取值范围。
⑤关键字:其值能唯一地标识一个元组的属性或 属性的组合。
第四阶段: 分布式数据库系统与面向对象数据库系统
面向对象数据库系统:是数据库技术与面 向对象程序设计技术结合
优点:它克服了传统数据库的局限性,能 够自然地存储复杂的数据对象及它们之间 的复杂关系,大幅提高了数据库管理效率、 降低了用户使用的复杂性。
书中银行系统为对象——关系数据库系统
1.1.3 数据模型
并为学生和借阅两个表建立联系,为书籍和借阅 两个表建立联系。这样,就完成了从现实世界到 数据世界的转换。
2.数据模型
数据库的数据结构形式,叫数据模型,它是对数 据库如何组织的一种模型化表示。
如果这个模型只能表示存储什么信息,那么它是 简单的,是文件系统早已解决了的问题,更重要 的是要以一定数据结构方式表示各种信息的联系。
应用程序1 应用程序1 应用程序1
数据组1 数据组1 数据组1
第二阶段:文件系统阶段
(50年代后期至60年代中期): 特点:程序和数据分开存储,形成程序文件和数据文件,
程序可以按名访问数据文件。但是, 同一个数据项可能 重复出现在多个文件中,导致数据冗余度较大,浪费空间, 没有形成数据共享,又不易统一修改容易造成数据的不一 致。
例如:从表中选出成绩在60分以下的人员得 到不及格人员成绩表。
学号 姓名 性别 成绩 001 王 男 66 003 李 女 77
学号 姓名 性别 成绩 004 张 女 25
004 张 女 25
2.投影
从一个关系(表)中选出若干列生成一个新的 关系(表)。
例如:从表中抽出“学号”.“姓名”.“成绩” 三列得到成绩表。
数据模型表示的是数据库框架。打个比方,建设 一幢楼房,首先要有建筑结构图,根据这个结构 图先搭好架子,然后才能堆砖砌瓦,使建筑物符 合要求,数据模型就相当于这个建筑结构图,根 据这个结构图组织装填数据。
数据模型的形式
概念模型(抽象的)
概念模型是数据库设计人员在认识现实世界中实体与 实体间联系后进行的一种抽象。
(1)层次模型
l 有且仅有一个结点无双亲,称之为“根”。 l 除根结点外,其他子结点,有且仅有一个双亲。 l 各实体型由上向下是一对多关系
网络模型
能够表示实体间的多种复杂联系和实体类型之间的 对对多的联系。网络模型的特点:
l 可以有一个以上的结点无父结点; l 至少有一个子结点有一个以上的父结点; 在两个结点之间有两个或两个以上的联系。
1.3数据库设计基础
1.3.1 数据库设计步骤 一、设计原则
1. 概念单一化“一事一地”的原则 2. 避免在表之间出现重复字段 3. 表中的字段必须是原始数据和基本数据元素 4. 用外部关键字保证有关联的表之间的联系
二、设计步骤
1. 需求分析 2. 确定需要的表 3. 确定所需字段 4. 确定主键 5. 确定联系 6. 设计求精与优化
如:教师关系中的“学号”属性、选课成绩关系 中的“学号”与“课程号”属性组合。
⑥外部关键字:如果表中一个字段不是本表的主 关键字,而是另外一个表的关键字和候选关键字, 这个字段就称为外关键字。通过外部关键字使表 与表建立联系。
关系的特点
1. 关系必须规范化 表中不能再包含表
课程名 学时数 讲课 上机
数据处理的目的是从大量数据中,通过分析、归纳、推理 等科学方法,利用计算机技术、数据库技术等技术手段, 提取有效的信息资源,为进一步分析、管理、决策提供依
据。
原始数据
编码转换 编码表示形 数据输入 计算机表示形


计算机处理
信息 (结果数据)
搜集
输出
用户
2.数据库(DataBase,DB)
孤立的数据不能代表确切的信息,为反映某一方面的信息往往需要若 干数据。
用数据模型来描述。
术语的对照
现实世界 事物类 事物 性质
信息世界 实体集
数据世界 (在关系模型理论中)
关系
在关系数据库 中

实体
元组
记录
属性
属性
字段
例子:学生借阅图书
现实世界中:学生借阅图书 在信息世界中将抽象为学生和书籍两个实体集,
两个实体集间的联系为“借阅”。 用关系模型表示为学生、书籍和借阅三个关系。 用ACCESS中建立学生、书籍和借阅三个数据表,
功能:数据定义、数据操纵、数据库运行管理、 数据组织、存储与管理、数据库的建立与维护、 数据通信接口。
4.数据库系统(DataBase System,DBS)
是运行数据库系统的计算机系统。包括:
计算机硬件环境和操作系统环境
DBMS
数据库应用系统
数据库 数据库应用系统 用户
数据库管理系统 操作系统 硬件
“1980.12.21” 明天天气是“阴有雨”,也可以用图形符号: 用数据符号表示信息通常有三种: 数值型:如年龄、体重、价格、温度 字符型:姓名、单位、地址
特殊型:照片(图像)、刮风、下雨(图形符 号),还有声音、视频(多媒体数据)
数据处理
也称信息处理,是利用计算机对各种类型的数据进行处理。 包括数据的采集、整理、存储、分类、排序、检索、维护、 加工、统计和传输等一系列操作过程。
数据库中的数据具有高度的共享性。数据不是面向某一种应用,而是 面向多种应用,可以被多个应用程序共享。
3.数据库管理系统 (DataBase Management System,DBMS)
DBMS是数据管理软件,它需要操作系统的支持, 向用户提供了一系列的数据管理功能。
组成:数据定义语言、数据操纵语言、数据库运 行控制程序、实用程序
计算机 65 15 基础 C语言 70 20
课程名
计算机 基础 C语言
讲课时 上机

讲课
65
15
70
20
2. 在同一个关系中不能出现相同的属性名。 3. 关系中不允许有完全相同的元组。 4. 在一个关系中元组的次序无关紧要。 5. 在一个关系中列的次序无关紧要。
实际关系模型
关系数据库中,基本数据结构是二维表,表之间的联系通过不同表中的 公共字段来体现。各个关系模式不是孤立的,他们不是随意堆砌在一 起的一堆二维表,要正确反映事物及事物之间的联系,需要进行仔细 的关系数据库设计。
实现模型(具体的)
有三种:层次型、网络型和关系型
概念模型
最常用的描述概念模型的方法,称为实体—联系方法 (Entity-Relationship Approach),简称E-R方法。
实体:指客观存在并可相互区别的物体。实体可以是实在 的物体,如学生、图书等,也可以是抽象的事件,如订货、 借书等。
班长
1
班长-班级
1
班级
(a)
班长
1
班长-学生
n
学生
(b)
教师
m
教师-学生
n
学生
(c)
例教师讲课E——R图
2. 概念模型(实现模型)
目前有三种常用的实现模型形式: ①层次型-----IMS ②网状型-----DBTG ③ 关 系 型 -----Access 、 vfp 、 oracle 、 DB2 、 sybase等。
属性:实体具有的某一种特性。如学生实体具有的姓名、 性别等属性。
实体集:性质相同的同类实体的集合称为。如一个班的学 生、图书馆的所有图书、皇马球队的所有场比赛等。
实体型:属性的集合,例学生实体型描述为:学生(学号、 姓名、性别、出生年月)
实体之间的联系
一对一:工厂——厂长 一对多:系——教师 多对多:商店——顾客
引进我们的工作中时,财务部门所处理的单据、 报表等属于数据处理。 计算机中的数据是存储在某一种媒介上能够识别 的物理符号。 有两个含义:
描写事物的特性:例某人生日是“1980年12月21日” 数据在计算机中的表示形式:同一种意义的数据可能
用多种不同形式表示
例: 生 日 是 “ 1980 年 12 月 21 日 ” , 也 可 以
教师
学生
学校
课程教材
教室
(3)关系型数据模型
用二维表结构来表示实体以及实体之间联 系的模型称为关系数据模型。
无论实体本身还是实体间的联系均用称为 “关系”的二维表来表示。能自然地反映 实体间的联系。
与前两者区别:数据描述的一致性,模型 概念单一。
关系模型举例
教师关系
1.2关系数据库
1.2.1、关系术语
表2 二班 刘六 班级 班主 任
表3
学生
合并条件:
张三
表1.班级=表2.班级 李四
王五
刘六
班级 班主任 一班 李老师 一班 李老师 二班 王老师 二班 王老师
一班 李老 师
二班 王老
4.自然联接
在联接运算中,按照字段值对应相等为条 件进行的联接操作称为等值联接。是去掉 重复属性的等值联接。自然联接是最常用 的联接运算。
1.2.2关系运算
一、传统的集合运算 并:两个相同结构关系的并是由属于这两
个关系的元组组成的集合。 差:两个结构相同的关系R和S 的差是由属
于R但不属于S的元组组成。 交:两个结构相同的关系R和S的交是由既
属于R又属于S的元组组成的
二、专门的关系运算
1.选择
从一个关系(表)中按照一定的条件选出若干 记录(行)生成一个新的关系(表)。
第一章 数据库基础知识
本章学习任务
1.1 数据库基础知识 1.2 关系数据模型 1.3 数据库设计基础
1.1 数据库基本概念
数据库:能将大量的数据按照一定的方式 组织并存储起来,能够快速方便的管理与 维护数据的方法与技术,大大地方便了数 据共享。
1.1.1 数据库概述
1.数据与数据处理 数据处理并不是计算机特有的概念,计算机没有
例学生基本信息:姓名、性别、出生年月、籍贯、专业……这些数据 需组织起来。
最初的数据以文件形式组织,处理数据时,更多的是涉及对文件的操 作(读、写),带来了数据处理不便、数据共享困难等一系列问题。 数据库技术的产生有效地克服了这类问题。
数据库是存储在计算机系统中的存储介质上,按一定的方式组织起来 的相关数据的集合。数据库是结构化的,不仅仅描述数据本身,而且 数据之间的关系进行描述。
(70年代后期至今) 分布式数据库系统阶段:与网络技术紧密结合 特点:合理分布数据在系统的相关节点上,实现
节点共享,逻辑上属于同一系统,但在物理结构 上是分布式,因此用户不感觉到数据的分布。 由若干个节点集合而成,在通讯网络中联接在一 起,每个节点都是一个独立的数据库系统,都拥 有各自的数据库、中央处理机、终端以及各自的 局部数据库管理系统。
相关文档
最新文档