数据库原理课件 4规范化.
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.求出函数依赖集合的最小覆盖集
when we list a set of FDs, we normally try to list
a MINIMAL set, so that a smaller set doesn't exist that will imply these. It will turn out that finding a minimal set of FDs is very important in finding the right relational design by Normalization.
个系及其系主任的信息存入数据库。
⒋ 删除异常(Deletion Anomalies)
不该删除的数据不得不删
例,如果某个系的学生全部毕业了, 我们在删除该系 学生信息的同时,把这个系及其系主任的信息也丢掉
了。
概述
结论:
• Student关系模式不是一个好的模式。 • “好”的模式:
不会发生插入异常、删除异常、更新异常,
数据冗余应尽可能少。
原因:由存在于模式中的某些数据依赖引起的 解决方法:通过分解关系模式来消除其中不合适 的数据依赖。
概述
一、函数依赖 二、平凡函数依赖与非平凡函数依赖 三、完全函数依赖与部分函数依赖 四、传递函数依赖
一、函数依赖
主属性:候选键中的任意一个属性元素称为主属性
非主属性:不是候选键中的属性 定义1 设R(U)是属性集U上的关系模式,X、Y是U的一个子 集。r是R(U)中任意给定的一个关系。若对于r中任意两个 元组s和t,当s[X] = t[X]时,就有s[Y] = t[Y],则称属性 子集X函数决定属性子集Y或者称Y函数依赖于X(Functional Dependence),记其为 X→Y。否则就称X不函数决定Y或者 称Y不函数依赖于X。
范式
范式是符合某一种级别的关系模式的集合。 关系数据库中的关系必须满足一定的要求。满足不 同程度要求的为不同范式。 范式的种类:
第一范式(1NF) 第二范式(2NF) 第三范式(3NF) BC范式(BCNF) 第四范式(4NF) 第五范式(5NF)
范式
各种范式之间存在联系:
1NF 2 NF 3 NF BCNF 4 NF 5 NF
例:每一个系主任的姓名重复出现
⒉ 更新异常(Update Anomalies)
数据冗余 ,更新数据时,维护数据完整性代价大。
例:某系更换系主任后,系统必须修改与该系学生有关的每一 个元组
概述
⒊ 插入异常(Insertion Anomalies)
该插的数据插不进去
例,如果一个系刚成立,尚无学生,我们就无法把这
判断是否是一个好模式的例子(2)
例:在关系模式STJ(S,T,J)中,S表示学生,
T表示教师,J表示课程。
每一教师只教一门课。每门课由若干教师教,某一学 生选定某门课,就确定了一个固定的教师。某个学生 选修某个教师的课就确定了所选课的名称 :
(S,J)→T,(S,T)→J,T→J
不是好模式
如何分解?
Pseudotransitivity Rule(伪传递):
If X Y and W Y Z then X W Z
set Accumulation Rule: If X Y Z and Z B then X Y Z B
表中那些属性可以做候选键?
Def
属性集的闭包 Given a set X of attributes in a
T1 Row# 1 2 3 4 5 6 A X1 X2 X3 X4 X5 X6 B Y1 Y2 Y1 Y1 Y2 Y2 A X1 X2 X1 X3 X2 X4
T2 B Y1 Y4 Y1 Y2 Y4 Y3 A X1 X2 X1 X3 X2 X4
T3 B Y1 Y4 Y1 Y2 Y4 Y4
AB BA
U ={ Sno, Sdept, Mname, Cname, Grade }
判断是否是一个好模式的例子(1)
学校数据库的语义:
⒈ 一个系有若干学生, 一个学生只属于一个系; ⒉ 一个系只有一名主任; ⒊ 一个学生可以选修多门课程, 每门课程有若干学生选修; ⒋ 每个学生所学的每门课程都有一个成绩。 属性组U上的一组函数依赖F:
1.ABD A, ABD C, C B, C E,AD B, AD F,B E
2.进行无损分解T——〉T1,T2
步骤一:求解最小覆盖
Step 1. 用 decomposition rule.将所有的函数依赖的右边只
有一个属性 xyz x y 和x z
F: (1) A B, (2) C B, (3) D A B C, (4) A C D H: (1) A B, (2) C B, (3) D A, (4) D B, (5) D C, (6) A C D
某一关系模式R为第n范式,可简记为
R∈nNF。
范式
1NF的定义 如果一个关系模式R的所有属性都是不可分的基本 数据项,则R∈1NF。 第一范式是对关系模式的最起码的要求。不满足第 一范式的数据库模式不能称为关系数据库。 但是满足第一范式的关系模式并不一定是一个好的 关系模式。
什么是一个好的模式
(1) A B, (2) C B, (3) D A, (4) D C, (5) ACD
A+=AB
C+=BC D+=ABCD AC+=ACDB
Step 4. Apply Union rules to bring things back together on
the right for common sets of attributes on the left of FDs, renamed M. (X
y and x z then x yz (1) A B, (2) C B, (3) D A, (4) D C, (5) A C D (1) A B, (2) C B, (3) D A C, (4) A C D
Other example
ABD AC, C BE,AD BF,B E
table T and a set F of FDs on T, we define the CLOSURE of the set X (under F), denoted by X+, as the largest set of attributes Y such that X -> Y is in F+.
Step 2.去除多余的函数依赖Remove inessential FDs from the set H to get the set J. Determine inessential X A if A
is in X+ under FDs without X -> A.
(1) A B, (2) C B, (3) D A, (4) D B, (5) D C, (6) A C D
P
Y, 则称Y完全函数依赖于X,记作X
f
Y。
完全函数依赖与部分函数依赖(续)
例: 在关系SC(Sno, Cno, Grade)中,
由于:Sno →Grade,Cno → Grade,
因此:(Sno, Cno) f Grade
四、传递函数依赖
定义3 在关系模式R(U)中,如果X→Y,Y→Z,且Y X,Y→X,则称Z传递函数依赖于X。
AB BA
AB BA
函数依赖说明:
1. 函数依赖不是指关系模式R的某个或某些关系实例满足 的约束条件,而是指R的所有关系实例均要满足的约束 条件。 2. 函数依赖是语义范畴的概念。只能根据数据的语义来 确定函数依赖。 例如“姓名→年龄”这个函数依赖只有在不允许有同 名人的条件下成立
3. 数据库设计者可以对现实世界作强制的规定。例如规 定不允许同名人出现,函数依赖“姓名→年龄”成立。 所插入的元组必须满足规定的函数依赖,若发现有同 名人存在, 则拒绝装入该元组。
设关系模式R<U,F>∈1NF,如果对于
R的每个函数依赖X→Y,若Y不属于X, 则X必含有候选码,那么这个关系模式就 是一个好的模式(BCNF)。
要知道的7个公式
Inclusion rule(包含律): if Y X, then X -> Y(平凡依赖)
Transitivity rule(传递率): if X -> Y and Y -> Z, then X -> Z
二、平凡函数依赖与非平凡函数依赖
在关系模式R(U)中,对于U的子集X和Y, 如果X→Y,但Y X,则称X→Y是非平凡的函数依赖 若X→Y,但Y X, 则称X→Y是平凡的函数依赖
例:在关系SC(Sno, Cno, Grade)中,
非平凡函数依赖: (Sno, Cno) → Grade
平凡函数依赖:
Algorithm
如何求闭包的算法
如果某个属性集的闭包为表中的全体属性,则此属性集 可以为候选键
判断是否是一个好模式的例子(1)
例:描述学校的数据库:
学生的学号(Sno)、所在系(Sdept) 系主任姓名(Mname)、课程名(Cname) 成绩(Grade)
单一的关系模式 : Student <U、F>
(Sno, Cno) → Sno
(Sno, Cno) → Cno
平凡函数依赖与非平凡函数依赖(续)
于任一关系模式,平凡函数依赖都是必然
百度文库
成立的,它不反映新的语义,因此若不特 别声明, 我们总是讨论非平凡函数依赖。
三、完全函数依赖与部分函数依赖
定义2 在关系模式R(U)中,如果X→Y,并且对 于X的任何一个真子集X’,都有 X’ Y。 若X→Y,但Y不完全函数依赖于X,则称Y部 分函数依赖于X,记作X
A+=AB
C+=BC D+=ABCD AC+=ACDB H = (1) A B, (2) C B, (3) D A, (4) D C, (5) A C D (Renumber)
Step 3.去除左边多余的属性 Successively replace FDs
in H with FDs that have a smaller number of FDs on the left-hand side so long as H+ remains the same:changing X A to Y A, then checking if Y+ under new FD set is unchanged.如果第三步函数依赖有改变要回到第二步
注: 如果Y→X, 即X←→Y,则Z直接依赖于X。
例: 在关系Std(Sno, Sdept, Mname)中,有: Sno → Sdept,Sdept → Mname Mname传递函数依赖于Sno
规范化
规范化理论正是用来改造关系模式,通
过分解关系模式来消除其中不合适的数 据依赖,以解决插入异常、删除异常、 更新异常和数据冗余问题。
F ={ Sno → Sdept, Sdept → Mname, (Sno, Cname) → Grade }
判断是否是一个好模式的例子(1)
Student <U、F> U ={ Sno, Sdept, Mname, Cname, Grade }
属性组U上的一组函数依赖F:
F ={ Sno → Sdept, Sdept → Mname, (Sno, Cname) → Grade } 不是好模式
数 据 库
规 范
基
化
础
汤 娜 中山大学计算机科学系
isstn@mail.sysu.edu.cn
一、概述 二、规范化 三、反规范化
概述
关系模式Student<U, F>中存在的问题
U ={ Sno, Sdept, Mname, Cname, Grade }
⒈ 数据冗余太大
浪费大量的存储空间
Augmentation rule(增广率): if X -> Y, then X Z -> Y Z Union Rule(合并): If X Y and X Z then X Y Z
Decomposition Rule(分解): If X Y Z then X Y and X Z
when we list a set of FDs, we normally try to list
a MINIMAL set, so that a smaller set doesn't exist that will imply these. It will turn out that finding a minimal set of FDs is very important in finding the right relational design by Normalization.
个系及其系主任的信息存入数据库。
⒋ 删除异常(Deletion Anomalies)
不该删除的数据不得不删
例,如果某个系的学生全部毕业了, 我们在删除该系 学生信息的同时,把这个系及其系主任的信息也丢掉
了。
概述
结论:
• Student关系模式不是一个好的模式。 • “好”的模式:
不会发生插入异常、删除异常、更新异常,
数据冗余应尽可能少。
原因:由存在于模式中的某些数据依赖引起的 解决方法:通过分解关系模式来消除其中不合适 的数据依赖。
概述
一、函数依赖 二、平凡函数依赖与非平凡函数依赖 三、完全函数依赖与部分函数依赖 四、传递函数依赖
一、函数依赖
主属性:候选键中的任意一个属性元素称为主属性
非主属性:不是候选键中的属性 定义1 设R(U)是属性集U上的关系模式,X、Y是U的一个子 集。r是R(U)中任意给定的一个关系。若对于r中任意两个 元组s和t,当s[X] = t[X]时,就有s[Y] = t[Y],则称属性 子集X函数决定属性子集Y或者称Y函数依赖于X(Functional Dependence),记其为 X→Y。否则就称X不函数决定Y或者 称Y不函数依赖于X。
范式
范式是符合某一种级别的关系模式的集合。 关系数据库中的关系必须满足一定的要求。满足不 同程度要求的为不同范式。 范式的种类:
第一范式(1NF) 第二范式(2NF) 第三范式(3NF) BC范式(BCNF) 第四范式(4NF) 第五范式(5NF)
范式
各种范式之间存在联系:
1NF 2 NF 3 NF BCNF 4 NF 5 NF
例:每一个系主任的姓名重复出现
⒉ 更新异常(Update Anomalies)
数据冗余 ,更新数据时,维护数据完整性代价大。
例:某系更换系主任后,系统必须修改与该系学生有关的每一 个元组
概述
⒊ 插入异常(Insertion Anomalies)
该插的数据插不进去
例,如果一个系刚成立,尚无学生,我们就无法把这
判断是否是一个好模式的例子(2)
例:在关系模式STJ(S,T,J)中,S表示学生,
T表示教师,J表示课程。
每一教师只教一门课。每门课由若干教师教,某一学 生选定某门课,就确定了一个固定的教师。某个学生 选修某个教师的课就确定了所选课的名称 :
(S,J)→T,(S,T)→J,T→J
不是好模式
如何分解?
Pseudotransitivity Rule(伪传递):
If X Y and W Y Z then X W Z
set Accumulation Rule: If X Y Z and Z B then X Y Z B
表中那些属性可以做候选键?
Def
属性集的闭包 Given a set X of attributes in a
T1 Row# 1 2 3 4 5 6 A X1 X2 X3 X4 X5 X6 B Y1 Y2 Y1 Y1 Y2 Y2 A X1 X2 X1 X3 X2 X4
T2 B Y1 Y4 Y1 Y2 Y4 Y3 A X1 X2 X1 X3 X2 X4
T3 B Y1 Y4 Y1 Y2 Y4 Y4
AB BA
U ={ Sno, Sdept, Mname, Cname, Grade }
判断是否是一个好模式的例子(1)
学校数据库的语义:
⒈ 一个系有若干学生, 一个学生只属于一个系; ⒉ 一个系只有一名主任; ⒊ 一个学生可以选修多门课程, 每门课程有若干学生选修; ⒋ 每个学生所学的每门课程都有一个成绩。 属性组U上的一组函数依赖F:
1.ABD A, ABD C, C B, C E,AD B, AD F,B E
2.进行无损分解T——〉T1,T2
步骤一:求解最小覆盖
Step 1. 用 decomposition rule.将所有的函数依赖的右边只
有一个属性 xyz x y 和x z
F: (1) A B, (2) C B, (3) D A B C, (4) A C D H: (1) A B, (2) C B, (3) D A, (4) D B, (5) D C, (6) A C D
某一关系模式R为第n范式,可简记为
R∈nNF。
范式
1NF的定义 如果一个关系模式R的所有属性都是不可分的基本 数据项,则R∈1NF。 第一范式是对关系模式的最起码的要求。不满足第 一范式的数据库模式不能称为关系数据库。 但是满足第一范式的关系模式并不一定是一个好的 关系模式。
什么是一个好的模式
(1) A B, (2) C B, (3) D A, (4) D C, (5) ACD
A+=AB
C+=BC D+=ABCD AC+=ACDB
Step 4. Apply Union rules to bring things back together on
the right for common sets of attributes on the left of FDs, renamed M. (X
y and x z then x yz (1) A B, (2) C B, (3) D A, (4) D C, (5) A C D (1) A B, (2) C B, (3) D A C, (4) A C D
Other example
ABD AC, C BE,AD BF,B E
table T and a set F of FDs on T, we define the CLOSURE of the set X (under F), denoted by X+, as the largest set of attributes Y such that X -> Y is in F+.
Step 2.去除多余的函数依赖Remove inessential FDs from the set H to get the set J. Determine inessential X A if A
is in X+ under FDs without X -> A.
(1) A B, (2) C B, (3) D A, (4) D B, (5) D C, (6) A C D
P
Y, 则称Y完全函数依赖于X,记作X
f
Y。
完全函数依赖与部分函数依赖(续)
例: 在关系SC(Sno, Cno, Grade)中,
由于:Sno →Grade,Cno → Grade,
因此:(Sno, Cno) f Grade
四、传递函数依赖
定义3 在关系模式R(U)中,如果X→Y,Y→Z,且Y X,Y→X,则称Z传递函数依赖于X。
AB BA
AB BA
函数依赖说明:
1. 函数依赖不是指关系模式R的某个或某些关系实例满足 的约束条件,而是指R的所有关系实例均要满足的约束 条件。 2. 函数依赖是语义范畴的概念。只能根据数据的语义来 确定函数依赖。 例如“姓名→年龄”这个函数依赖只有在不允许有同 名人的条件下成立
3. 数据库设计者可以对现实世界作强制的规定。例如规 定不允许同名人出现,函数依赖“姓名→年龄”成立。 所插入的元组必须满足规定的函数依赖,若发现有同 名人存在, 则拒绝装入该元组。
设关系模式R<U,F>∈1NF,如果对于
R的每个函数依赖X→Y,若Y不属于X, 则X必含有候选码,那么这个关系模式就 是一个好的模式(BCNF)。
要知道的7个公式
Inclusion rule(包含律): if Y X, then X -> Y(平凡依赖)
Transitivity rule(传递率): if X -> Y and Y -> Z, then X -> Z
二、平凡函数依赖与非平凡函数依赖
在关系模式R(U)中,对于U的子集X和Y, 如果X→Y,但Y X,则称X→Y是非平凡的函数依赖 若X→Y,但Y X, 则称X→Y是平凡的函数依赖
例:在关系SC(Sno, Cno, Grade)中,
非平凡函数依赖: (Sno, Cno) → Grade
平凡函数依赖:
Algorithm
如何求闭包的算法
如果某个属性集的闭包为表中的全体属性,则此属性集 可以为候选键
判断是否是一个好模式的例子(1)
例:描述学校的数据库:
学生的学号(Sno)、所在系(Sdept) 系主任姓名(Mname)、课程名(Cname) 成绩(Grade)
单一的关系模式 : Student <U、F>
(Sno, Cno) → Sno
(Sno, Cno) → Cno
平凡函数依赖与非平凡函数依赖(续)
于任一关系模式,平凡函数依赖都是必然
百度文库
成立的,它不反映新的语义,因此若不特 别声明, 我们总是讨论非平凡函数依赖。
三、完全函数依赖与部分函数依赖
定义2 在关系模式R(U)中,如果X→Y,并且对 于X的任何一个真子集X’,都有 X’ Y。 若X→Y,但Y不完全函数依赖于X,则称Y部 分函数依赖于X,记作X
A+=AB
C+=BC D+=ABCD AC+=ACDB H = (1) A B, (2) C B, (3) D A, (4) D C, (5) A C D (Renumber)
Step 3.去除左边多余的属性 Successively replace FDs
in H with FDs that have a smaller number of FDs on the left-hand side so long as H+ remains the same:changing X A to Y A, then checking if Y+ under new FD set is unchanged.如果第三步函数依赖有改变要回到第二步
注: 如果Y→X, 即X←→Y,则Z直接依赖于X。
例: 在关系Std(Sno, Sdept, Mname)中,有: Sno → Sdept,Sdept → Mname Mname传递函数依赖于Sno
规范化
规范化理论正是用来改造关系模式,通
过分解关系模式来消除其中不合适的数 据依赖,以解决插入异常、删除异常、 更新异常和数据冗余问题。
F ={ Sno → Sdept, Sdept → Mname, (Sno, Cname) → Grade }
判断是否是一个好模式的例子(1)
Student <U、F> U ={ Sno, Sdept, Mname, Cname, Grade }
属性组U上的一组函数依赖F:
F ={ Sno → Sdept, Sdept → Mname, (Sno, Cname) → Grade } 不是好模式
数 据 库
规 范
基
化
础
汤 娜 中山大学计算机科学系
isstn@mail.sysu.edu.cn
一、概述 二、规范化 三、反规范化
概述
关系模式Student<U, F>中存在的问题
U ={ Sno, Sdept, Mname, Cname, Grade }
⒈ 数据冗余太大
浪费大量的存储空间
Augmentation rule(增广率): if X -> Y, then X Z -> Y Z Union Rule(合并): If X Y and X Z then X Y Z
Decomposition Rule(分解): If X Y Z then X Y and X Z