04_数据库和数据仓库(信息系统,上海财经大学刘鹏)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多个字符组成一个词或者一个完整的数字(如人 名或年龄),
字段是数据的最小单位,它不能再分成有意义的 单位
记录(Record)
由与某个特殊对象或活动有关的所有字段组成。
文件(File)
同一类型的所有记录组成一个文件 文件就是与某个特定主题相关的数据记录的集合。
数据的层次 数据库
文件 纪录 字段 字节 位
第四章 数据库和数据仓库
第一节 数据管理 第二节 数据库与数据库管理系统环境 第三节 关系数据库模型 第四节 数据库的建立 第五节 数据仓库与数据挖掘 第六节 高级数据库技术和高级数据库应
用
第一节 数据管理
数据组织的层次 实体、属性和关键字 数据管理的传统方法 数据管理的数据库方法
结构化查询语言标准 利用SQL可以查询不同数据库管理系统下的
数据. 基本形式 SELECT…FROM…WHERE…
数据视图和逻辑视图
DBMS把数据的逻辑视图和物理视图分 开
逻辑视图以最终用户所使用的直观的方式来 显示数据
物理视图则显示了数据的实际组织形式以及 它在物理存储介质上的结构
接从存储介质获得所需的数据。它必须 先将请求提交给DB数M据S库,由DBMS负责从 应用程存用序储B 介质检索数据管并理提系统供给应用程数序据库使
应用程序 C
基于数据库方法的优点
减少数据冗余,更有效利用存储空间并增强 数据的完整性。也为组织提供了更大地利用 数据的灵活性。
两个文件中的数据放在了同一个数据库,可 以多种方法定位数据并获得要处理的数据
第五节 数据仓库与数据挖掘
数据往往放在不同的数据库系统中 数据难以收集 数据仓库是通过集成企业的关键运行数
据,产生一致的、可靠的、易于访问的 数据形式。
数据仓库
数据仓库(Data Warehouse)是信息的逻 辑集合,这些信息来自于许多不同的业 务数据库,并用于支持企业的分析活动 和决策任务
数据组织的层次
数据按照层次方式进行组织
由位、字节、字段、记录、文件和数据库组 成
位(Bit)
位是计算机中最小的数据单位,其值为0或1,是 一个二进位,表示一个导通或未通的电路。
字节(Byte)
字节是由若干位组成的,代表一个字符。字符是 信息的最基本构架。
数据组织的层次
字段(Field)。
系.
关系是表的数学术语
每一个表或关系所保存的信息都与一个 特定的实体有关.
二维表使描述信息间的关系十分便利,容 易处理二维表所包含的信息.
可以灵活地查询数据库和建立报表
关系数据库模型
可以灵活地查询数据库和建立报表
查询单个表和多个表 不必建立数据项之间的所有连接,随时可以
建立.
第四节 关系数据库的建立
科 学 , 你 是 国力的 灵魂; 同时又 是社会 发展的 标志。 上午6时 31分 25秒上 午6时 31分06:31:2520.12.3
每 天 都 是 美 好的一 天,新 的一天 开启。 20.12.320.12.306:3106:31:2506:31:25Dec-20
等是库存的属性
实体、属性和关键字
关键字 Primary Key
关键字是用来识别记录的一个或一组数据项, 是识别记录和文件中查找记录的标志
学生文件中的学号,产品文件中的产品号, 订单文件中的订单号
辅助关键字 Secondary Key
不能唯一表示一个记录的字段
数据管理的传统方法
利用文件管理数据
为每个应用程序分别创建和存储数据文
件的数据管理方法都称为传统方法
应用程序 A
文件A
应用程序 B
文件B
应用程序 C
文件C
数据管理传统方法的不足
数据冗余大
冗余是指在多个数据文件中重复出现相同的 数据。
数据与程序独立性不高
数据文件和维护它的相关程序之间过分依赖。
数据管理的数据库方法
数据库是逻辑相关的记录和文件的集合。
让 自 己 更 加 强大, 更加专 业,这 才能让 自己更 好。2020年 12月 上 午6时31分 20.12.306:31December 3, 2020
这 些 年 的 努 力就为 了得到 相应的 回报。 2020年 12月 3日星期 四6时 31分25秒 06:31:253 December 2020
支持OLAP 支持决策任务
数据挖掘工具
包括:
查询与报表工具
QBE,SQL,报表生成器
智能代理
应用各种像神经网络、模糊逻辑这样的人工智能 工具形成OLAP信息发现的基础
多维分析工具
是一种横纵分割的技术,允许人们从不同的角度 来观看多维信息
第六节 高级数据库技术和高级数据库应用
生 活 中 的 辛 苦阻挠 不了我 对生活 的热爱 。20.12.320.12.3Thursday, December 03, 2020
1.5
75
3
88
确定实体和关键字
三个实体
学生 专业 课程
关键字
学号 专业号 课程号
确定实体之间的联系 --画实体联系图
实体联系图(Entity-Relationship Diagram, E-R图)
矩形表示实体 菱形表示实体之间的联系 直线表示连接
1代表出现一次,M代表多次
上海 人民路 44 号 上海 五四路 32 号 西安 金花南路 5 号 厦门 海滨路 51 号
201044 200321 710432 361324
电话 55553125 84661154 3239270 65894113
数据库特征
逻辑结构
数据字典包含信息的逻辑结构
数据库的特征
信息中的逻辑联系
确定实体之间的联系 --画实体联系图
学生
M
分配
1
专业
M
选修
M
课程
确定实体之间的联系 --画实体联系图
先画上矩形 填上实体名 判断是否有联系 有联系画上菱形,判断联系是1还是M
利用E-R图得到关系
将每一个实体都转化为一个关系
学生、课程、专业
将每一个多对多的联系都转换为一个关 系联系的名称为关系的名称
3116
1143 陈晨
020204
金融学
2401
2402
7142 沈俊
120202 企业管理
8301
8311
8402
课程名称 现代企业管理
营销管理 公司财务 经济法基础理论 商法专题 货币银行理论 金融工程学 现代企业管理 营销策划 公司财务
学分 成绩
3
86
2
75
3
90
3
65284源自378286
3
80
程序 2
数据操作语言
程序 3
物理数据库
数据字典
数据库管理系统组成
数据定义语言
描述数据库内容和结构的正式语言
数据操作语言
操作数据库中的数据,提供了一组提取数据 的命令
数据字典
自动生成或者手工生成的文件,用来存储数 据元素的定义和特性。如用途,物理表现,所 属关系,授权和安全.被动的,主动的.
安 全 放 在 第 一位, 防微杜 渐。20.12.320.12.306:31:2506:31:25December 3, 2020
加 强 自 身 建 设,增 强个人 的休养 。2020年 12月 3日上 午6时 31分20.12.320.12.3
精 益 求 精 , 追求卓 越,因 为相信 而伟大 。2020年 12月 3日星 期四上 午6时 31分25秒 06:31:2520.12.3
选修
将每一个一对多的联系都转换为一个关 系 分配
合并具有相同关键字的关系:学生与分配
合并
为每个关系确定信息(字段)
确保每个关系中所含的信息确实处于正 确的关系之中
这组信息只依赖于所属关系的主关键字 专业名称
信息不能从其他的信息中派生出来
用数据定义语言创建数据库
根据前面四步的结果来,运用数据定义 语言来创建关系
数据仓库
数据仓库的特征
数据仓库将来自于不同数据库的信息结合在 一起
数据仓库是多维的
包含若干层的行列 数据字典:信息的逻辑结构、信息的来源和处理
方式
数据仓库支持决策而不是事务处理
联机分析处理(OLAP) 联机事物处理(OLTP)
数据挖掘工具
Data Mining Tools是用户对数据仓库 进行信息生成的软件工具
数据库特征
信息的集合
产品文件
供应商 ID 1125 2038 3069 4058
产品 ID 产品名称 单价 供应商 ID
137
门锁 26.25 4058
145
电钻 212.50 2038
152 压缩机 70.00 1125
供应商文件
供应商名称 城市
地址
邮政编码
光明公司 先锋公司 方联公司 智远公司
一个物理视图可支持多个逻辑视图 DBMS使用专门的数据库管理软件,使得物
理数据库可用于不同应用程序所需的不同的 逻辑视图。
第三节 关系数据库模型
四种数据库模型
层次型 网状型 关系型
目前使用最为广泛
面向对象
关系数据库模型
利用一系列的二维表或文件存储信息. 在关系模型中,每个二维表都描述一种关
共享数据和信息资源
第二节数据库与数据库管理系 统环境
数据库及其特征 数据库管理系统 数据库查询语言 数据的逻辑视图和物理视图
数据库及其特征
数据库的定义
数据库(Database)是一个信息的集合,在 这个集合中可以按照信息的逻辑结构对其进 行组织与存取。
数据库由两部分组成
信息本身 信息的逻辑结构
把先前提及的所有存储在独立文件中的记录 归并在一个数据库内,以便让不同的应用程 序存取。
储存在数据库中的数据既独立于使用它的计 算机程序,也独立于存储它的外部存储器的 类型。
数据库管理系统
Database Management System,DBMS 应用程在序数A 据库管理系统中,应用程序不能直
确定实体和关键字 确定实体之间联系 利用E_R图得到关系 为每个关系确定信息(字段) 用数据定义语言创建数据库
学生修课管理
学生选修样本报表 学号 姓名
专业编号 专业名称 课程编号
6117 马晓然 120202 企业管理
8301
8302
8402
4132 谢以东 030107
经济法
3101
产品ID不能重复
产品文件中的供应商ID不应该是供应商文件中 没有的供应商ID
数据库管理系统
Database Management System
是一组软件,允许组织集中并有效地管理数 据以供应用程序访问
相当与应用程序和物理数据文件之间的接口
数据库管理系统的组成
数据定义语言 应用 程数序据操作语言 DBMS 程序数1 据字典 数据定义语言
建立信息间的联系或关系意味着找出文件之 间的相互关系.
主关键字
数据库文件中的一个字段,唯一描述一个记录 产品文件中的产品ID,供应商文件中的供应商编
号
外部关键字
一个文件中的主关键字出现在另一个文件中就是 外部关键字,比如产品文件中的供应商文件.
数据库的特征
内在的完整性约束
完整性约束是保证信息质量的一种规则 比如
数据库查询语言
属于数据操作语言
自然语言
自然语言查询命令
LIST THE NAMES AND ADDRESSES OF ALL SUPPLIERS WHO LIVE IN SHANGHAI
QBE
Query By Example 通过拖曳数据项等方法来查询数据
数据库查询语言
SQL Structured Query Language
0,1
实体、属性和关键字
实体entity
实体是所收集的数据相关的一类事物,可以 是物,人,实际的东西,或者具体的东西
员工 库存 客户 订单 教室
实体、属性和关键字
属性Attribute
属性是试题的某一方面的特征 学生的姓名、学号、年龄、性别成绩是学生
的属性 库存号、说明、现有数量、在仓库中的位置
举例
职员文件 部门文件 财务文件
项目数据库
900811刘汉云 2000-9-4 900206李卓宇 2002-7-2 910810张昕阳 2001-8-2
职员文件
900811刘汉云 2000-9-4
包含:职员编号、姓名、
聘用日期
刘汉云
(名字字段) 学分及成绩的记录
01001010 (字母J的ASCII码)
人 生 得 意 须 尽欢, 莫使金 樽空对 月。06:31:2506:31:2506:3112/3/2020 6:31:25 AM
做 一 枚 螺 丝 钉,那 里需要 那里上 。20.12.306:31:2506:31Dec-203-Dec-20
日 复 一 日 的 努力只 为成就 美好的 明天。 06:31:2506:31:2506:31Thursday, December 03, 2020
字段是数据的最小单位,它不能再分成有意义的 单位
记录(Record)
由与某个特殊对象或活动有关的所有字段组成。
文件(File)
同一类型的所有记录组成一个文件 文件就是与某个特定主题相关的数据记录的集合。
数据的层次 数据库
文件 纪录 字段 字节 位
第四章 数据库和数据仓库
第一节 数据管理 第二节 数据库与数据库管理系统环境 第三节 关系数据库模型 第四节 数据库的建立 第五节 数据仓库与数据挖掘 第六节 高级数据库技术和高级数据库应
用
第一节 数据管理
数据组织的层次 实体、属性和关键字 数据管理的传统方法 数据管理的数据库方法
结构化查询语言标准 利用SQL可以查询不同数据库管理系统下的
数据. 基本形式 SELECT…FROM…WHERE…
数据视图和逻辑视图
DBMS把数据的逻辑视图和物理视图分 开
逻辑视图以最终用户所使用的直观的方式来 显示数据
物理视图则显示了数据的实际组织形式以及 它在物理存储介质上的结构
接从存储介质获得所需的数据。它必须 先将请求提交给DB数M据S库,由DBMS负责从 应用程存用序储B 介质检索数据管并理提系统供给应用程数序据库使
应用程序 C
基于数据库方法的优点
减少数据冗余,更有效利用存储空间并增强 数据的完整性。也为组织提供了更大地利用 数据的灵活性。
两个文件中的数据放在了同一个数据库,可 以多种方法定位数据并获得要处理的数据
第五节 数据仓库与数据挖掘
数据往往放在不同的数据库系统中 数据难以收集 数据仓库是通过集成企业的关键运行数
据,产生一致的、可靠的、易于访问的 数据形式。
数据仓库
数据仓库(Data Warehouse)是信息的逻 辑集合,这些信息来自于许多不同的业 务数据库,并用于支持企业的分析活动 和决策任务
数据组织的层次
数据按照层次方式进行组织
由位、字节、字段、记录、文件和数据库组 成
位(Bit)
位是计算机中最小的数据单位,其值为0或1,是 一个二进位,表示一个导通或未通的电路。
字节(Byte)
字节是由若干位组成的,代表一个字符。字符是 信息的最基本构架。
数据组织的层次
字段(Field)。
系.
关系是表的数学术语
每一个表或关系所保存的信息都与一个 特定的实体有关.
二维表使描述信息间的关系十分便利,容 易处理二维表所包含的信息.
可以灵活地查询数据库和建立报表
关系数据库模型
可以灵活地查询数据库和建立报表
查询单个表和多个表 不必建立数据项之间的所有连接,随时可以
建立.
第四节 关系数据库的建立
科 学 , 你 是 国力的 灵魂; 同时又 是社会 发展的 标志。 上午6时 31分 25秒上 午6时 31分06:31:2520.12.3
每 天 都 是 美 好的一 天,新 的一天 开启。 20.12.320.12.306:3106:31:2506:31:25Dec-20
等是库存的属性
实体、属性和关键字
关键字 Primary Key
关键字是用来识别记录的一个或一组数据项, 是识别记录和文件中查找记录的标志
学生文件中的学号,产品文件中的产品号, 订单文件中的订单号
辅助关键字 Secondary Key
不能唯一表示一个记录的字段
数据管理的传统方法
利用文件管理数据
为每个应用程序分别创建和存储数据文
件的数据管理方法都称为传统方法
应用程序 A
文件A
应用程序 B
文件B
应用程序 C
文件C
数据管理传统方法的不足
数据冗余大
冗余是指在多个数据文件中重复出现相同的 数据。
数据与程序独立性不高
数据文件和维护它的相关程序之间过分依赖。
数据管理的数据库方法
数据库是逻辑相关的记录和文件的集合。
让 自 己 更 加 强大, 更加专 业,这 才能让 自己更 好。2020年 12月 上 午6时31分 20.12.306:31December 3, 2020
这 些 年 的 努 力就为 了得到 相应的 回报。 2020年 12月 3日星期 四6时 31分25秒 06:31:253 December 2020
支持OLAP 支持决策任务
数据挖掘工具
包括:
查询与报表工具
QBE,SQL,报表生成器
智能代理
应用各种像神经网络、模糊逻辑这样的人工智能 工具形成OLAP信息发现的基础
多维分析工具
是一种横纵分割的技术,允许人们从不同的角度 来观看多维信息
第六节 高级数据库技术和高级数据库应用
生 活 中 的 辛 苦阻挠 不了我 对生活 的热爱 。20.12.320.12.3Thursday, December 03, 2020
1.5
75
3
88
确定实体和关键字
三个实体
学生 专业 课程
关键字
学号 专业号 课程号
确定实体之间的联系 --画实体联系图
实体联系图(Entity-Relationship Diagram, E-R图)
矩形表示实体 菱形表示实体之间的联系 直线表示连接
1代表出现一次,M代表多次
上海 人民路 44 号 上海 五四路 32 号 西安 金花南路 5 号 厦门 海滨路 51 号
201044 200321 710432 361324
电话 55553125 84661154 3239270 65894113
数据库特征
逻辑结构
数据字典包含信息的逻辑结构
数据库的特征
信息中的逻辑联系
确定实体之间的联系 --画实体联系图
学生
M
分配
1
专业
M
选修
M
课程
确定实体之间的联系 --画实体联系图
先画上矩形 填上实体名 判断是否有联系 有联系画上菱形,判断联系是1还是M
利用E-R图得到关系
将每一个实体都转化为一个关系
学生、课程、专业
将每一个多对多的联系都转换为一个关 系联系的名称为关系的名称
3116
1143 陈晨
020204
金融学
2401
2402
7142 沈俊
120202 企业管理
8301
8311
8402
课程名称 现代企业管理
营销管理 公司财务 经济法基础理论 商法专题 货币银行理论 金融工程学 现代企业管理 营销策划 公司财务
学分 成绩
3
86
2
75
3
90
3
65284源自378286
3
80
程序 2
数据操作语言
程序 3
物理数据库
数据字典
数据库管理系统组成
数据定义语言
描述数据库内容和结构的正式语言
数据操作语言
操作数据库中的数据,提供了一组提取数据 的命令
数据字典
自动生成或者手工生成的文件,用来存储数 据元素的定义和特性。如用途,物理表现,所 属关系,授权和安全.被动的,主动的.
安 全 放 在 第 一位, 防微杜 渐。20.12.320.12.306:31:2506:31:25December 3, 2020
加 强 自 身 建 设,增 强个人 的休养 。2020年 12月 3日上 午6时 31分20.12.320.12.3
精 益 求 精 , 追求卓 越,因 为相信 而伟大 。2020年 12月 3日星 期四上 午6时 31分25秒 06:31:2520.12.3
选修
将每一个一对多的联系都转换为一个关 系 分配
合并具有相同关键字的关系:学生与分配
合并
为每个关系确定信息(字段)
确保每个关系中所含的信息确实处于正 确的关系之中
这组信息只依赖于所属关系的主关键字 专业名称
信息不能从其他的信息中派生出来
用数据定义语言创建数据库
根据前面四步的结果来,运用数据定义 语言来创建关系
数据仓库
数据仓库的特征
数据仓库将来自于不同数据库的信息结合在 一起
数据仓库是多维的
包含若干层的行列 数据字典:信息的逻辑结构、信息的来源和处理
方式
数据仓库支持决策而不是事务处理
联机分析处理(OLAP) 联机事物处理(OLTP)
数据挖掘工具
Data Mining Tools是用户对数据仓库 进行信息生成的软件工具
数据库特征
信息的集合
产品文件
供应商 ID 1125 2038 3069 4058
产品 ID 产品名称 单价 供应商 ID
137
门锁 26.25 4058
145
电钻 212.50 2038
152 压缩机 70.00 1125
供应商文件
供应商名称 城市
地址
邮政编码
光明公司 先锋公司 方联公司 智远公司
一个物理视图可支持多个逻辑视图 DBMS使用专门的数据库管理软件,使得物
理数据库可用于不同应用程序所需的不同的 逻辑视图。
第三节 关系数据库模型
四种数据库模型
层次型 网状型 关系型
目前使用最为广泛
面向对象
关系数据库模型
利用一系列的二维表或文件存储信息. 在关系模型中,每个二维表都描述一种关
共享数据和信息资源
第二节数据库与数据库管理系 统环境
数据库及其特征 数据库管理系统 数据库查询语言 数据的逻辑视图和物理视图
数据库及其特征
数据库的定义
数据库(Database)是一个信息的集合,在 这个集合中可以按照信息的逻辑结构对其进 行组织与存取。
数据库由两部分组成
信息本身 信息的逻辑结构
把先前提及的所有存储在独立文件中的记录 归并在一个数据库内,以便让不同的应用程 序存取。
储存在数据库中的数据既独立于使用它的计 算机程序,也独立于存储它的外部存储器的 类型。
数据库管理系统
Database Management System,DBMS 应用程在序数A 据库管理系统中,应用程序不能直
确定实体和关键字 确定实体之间联系 利用E_R图得到关系 为每个关系确定信息(字段) 用数据定义语言创建数据库
学生修课管理
学生选修样本报表 学号 姓名
专业编号 专业名称 课程编号
6117 马晓然 120202 企业管理
8301
8302
8402
4132 谢以东 030107
经济法
3101
产品ID不能重复
产品文件中的供应商ID不应该是供应商文件中 没有的供应商ID
数据库管理系统
Database Management System
是一组软件,允许组织集中并有效地管理数 据以供应用程序访问
相当与应用程序和物理数据文件之间的接口
数据库管理系统的组成
数据定义语言 应用 程数序据操作语言 DBMS 程序数1 据字典 数据定义语言
建立信息间的联系或关系意味着找出文件之 间的相互关系.
主关键字
数据库文件中的一个字段,唯一描述一个记录 产品文件中的产品ID,供应商文件中的供应商编
号
外部关键字
一个文件中的主关键字出现在另一个文件中就是 外部关键字,比如产品文件中的供应商文件.
数据库的特征
内在的完整性约束
完整性约束是保证信息质量的一种规则 比如
数据库查询语言
属于数据操作语言
自然语言
自然语言查询命令
LIST THE NAMES AND ADDRESSES OF ALL SUPPLIERS WHO LIVE IN SHANGHAI
QBE
Query By Example 通过拖曳数据项等方法来查询数据
数据库查询语言
SQL Structured Query Language
0,1
实体、属性和关键字
实体entity
实体是所收集的数据相关的一类事物,可以 是物,人,实际的东西,或者具体的东西
员工 库存 客户 订单 教室
实体、属性和关键字
属性Attribute
属性是试题的某一方面的特征 学生的姓名、学号、年龄、性别成绩是学生
的属性 库存号、说明、现有数量、在仓库中的位置
举例
职员文件 部门文件 财务文件
项目数据库
900811刘汉云 2000-9-4 900206李卓宇 2002-7-2 910810张昕阳 2001-8-2
职员文件
900811刘汉云 2000-9-4
包含:职员编号、姓名、
聘用日期
刘汉云
(名字字段) 学分及成绩的记录
01001010 (字母J的ASCII码)
人 生 得 意 须 尽欢, 莫使金 樽空对 月。06:31:2506:31:2506:3112/3/2020 6:31:25 AM
做 一 枚 螺 丝 钉,那 里需要 那里上 。20.12.306:31:2506:31Dec-203-Dec-20
日 复 一 日 的 努力只 为成就 美好的 明天。 06:31:2506:31:2506:31Thursday, December 03, 2020