数据仓库与数据挖掘技术 第二章 数据仓库

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第2章数据仓库2.1数据仓库的基本概念

1. 数据仓库的数据是面向主题的

数据仓库与数据挖掘技术

图2-1主题间的重叠关系

2. 数据仓库的数据是集成的

3. 数据仓库的数据是不可更新的

数据仓库与数据挖掘技术4. 数据仓库的数据是随时间不断变化的

图2-2数据仓库体系结构2.2数据仓库的体系结构

数据仓库与数据挖掘技术

图2-3数据仓库数据组织结构2.2.1元数据

1. 元数据在数据仓库中的作用

2. 元数据的使用

3. 元数据的分类

4. 元数据的内容

2.2.2粒度的概念

1. 按时间段综合数据的粒度

2. 样本数据库

2.2.3分割问题

1. 分割的优越性

2. 数据分割的标准

3. 分割的层次

2.2.4数据仓库中的数据组织形式

1. 简单堆积结构

图2-4简单堆积结构数据组织形式2. 轮转综合结构

数据仓库与数据挖掘技术

图2-5轮转综合结构数据组织形式3. 简单直接结构

图2-6简单直接结构数据组织形式4. 连续结构

图2-7连续结构数据组织形式

数据仓库与数据挖掘技术

2.3数据仓库的数据模型

2.3.1概念数据模型

图2-8商品、顾客和供应商E-R图

2.3.2逻辑数据模型

2.3.3物理数据模型

2.3.4高层数据模型、中间层数据模型和低层数据模型

1. 高层数据模型

2. 中间层数据模型

3. 低层数据模型

数据仓库与数据挖掘技术2.4数据仓库设计步骤

图2-9数据仓库设计步骤2.4.1概念模型设计

1. 界定系统边界

2. 确定主要的主题域

3. 实例

2.4.2技术准备工作

2.4.3逻辑模型设计

1. 分析主题域

2. 划分粒度层次

3. 确定数据分割策略

4. 定义关系模式

5. 定义记录系统

2.4.4物理模型设计

1. 确定数据的存储结构

数据仓库与数据挖掘技术

2. 确定索引策略

3. 确定数据存放位置

4. 确定存储分配

2.4.5数据仓库的生成

1. 接口设计

2. 数据装入

2.4.6数据仓库的使用和维护

1. 开发DSS应用

图2-10DSS应用开发步骤

2. 进一步理解需求,改善系统,维护数据仓库

图2-11William H.Inmon数据仓库设计步骤

数据仓库与数据挖掘技术

2.5利用SQL Server 2005构建数据仓库

图2-12使用Visual Studio 2005系统新建项目

图2-13新建Analysis Services项目

图2-14新建数据源

数据仓库与数据挖掘技术

图2-15新建数据源向导

图2-16选择如何连接数据源

图2-17连接管理器

图2-18连接管理器连接测试成功窗口

图2-19选择已经连接的数据库作为数据源

图2-20选择连接数据源的凭证

图2-21新建数据源向导完成

图2-22右击新建数据源视图

图2-23新建数据源视图向导

图2-24选择视图的数据源

图2-25选择表和视图

图2-26完成新建数据源视图向导

图2-27新建多维数据集

图2-28多维数据集向导

图2-29选择生成多维数据集的方法

图2-30选择多维数据集的数据源视图

图2-31检测事实数据表和维度表

图2-32标示事实表和维度表

图2-33选择度量值

图2-34扫描维度

图2-35查看维度结构

图2-36完成多维数据集向导

图2-37创建完成数据仓库界面

习题2

1. 如何理解数据仓库是面向主题的、集成的、不可更改的和是随时间不断变化的。

2. 什么叫元数据?起什么作用?

3. 如何理解数据仓库中的粒度的概念?如何确定数据仓库的粒度?数据量与粒度有什么关系?

4. 为什么要进行数据仓库的清理?如何清理?

5. 数据仓库设计有哪3级数据模型?各如何设计?

6. 采用什么方法可以提高数据仓库的性能?

7. 叙述数据仓库设计的具体步骤,如何实现?

8. 什么是数据仓库的直接访问,什么是数据仓库的间接访问?两者有何不同?

9. 数据仓库有哪些应用领域?各举例说明。

相关文档
最新文档