数据仓库基础(多维数据库举例)精品PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
我们曾听说:
数据仓库用来为当前的业务系统做个备份 去买个数据仓库回来装上,应该不是很贵,
看看有没有盗版 数据仓库是否成功是技术人员的事情 一个数据存储方面的项目怎么会失败?!
数据仓库基础
王喆
“A data warehouse is a subjectoriented, integrated, time-variant, and nonvolatile collection of data in support of management’s decisionmaking process.”—W. H. Inmon 1992
Data cleaning and data integration techniques are applied.
Ensure consistency in naming conventions, encoding structures, attribute measures, etc. among different data sources E.g., Hotel price: currency, tax, breakfast covered, etc.
Data Warehouse—Integrated
Constructed by integrating multiple, heterogeneous data sources
relational databases, flat files, on-line transaction records
Data warehousing:
The process of constructing and using data warehouses
Data Warehouse—SubjectOriented
Organized around major subjects, such as customer, product, sales.
Operational database: current value data. Data warehouse data: provide information from a
historical perspective (e.g., past 5-10 years)
Every key structure in the data warehouse
目录
从 决策支持系统 的发展看为什么会有 数据 仓库 的产生
决策支持系统发展-演化
60年代 主文件 磁带 70年代 直接存取存储设备 DASD 数据库 80年代 个人PC 4GL
自然演化式体系结构的问题
数据可信性 生产率 无法将数据转化为信息
数据可信性
数据无时间基准 数据在算法上存在差异 抽取的多层次问题 外部数据问题 无公共起始数据
生产率问题
除非事先知道未来的企业报表需求,并且在 第一张企业报表的建造时考虑到了这些需求 因素,否则每个新的企业报表总要花费同前 面差不多的代价。
无法将数据转化为信息
从自然演化式体系结构中建立起来的系统缺 乏集成性,并且在分析型处理所需的时间范 围/时间参数上与应用系统中数据的可用时 间范围存在差异。
什么是数据仓库
What is Data Warehouse?
Defined in many different ways, but not rigorously.
A decision support database that is maintained separately from the organization’s operational database
When data is moved to the warehouse, it is converted.
Data Warehouse—Time Variant
The time horizon for the data warehouse is significantly longer than that of operational systems.
Contains an element of time, explicitly or implicitly But the key of operational data may or may not
contain “time element”.
体系结构设计环境的层次
操作层
原子/数据 仓库层
部门层
个体层
数据操作层只保存原始数据并且服务于高性能事务处理领域;
数据仓库层存储不更新的原始数据,此外一些导出数据也在此存 在;
数据的部门层几乎只存放导出数据;
在数据个体层中完成大多数启发式分析
目录
从 决策支持系统 的发展看为什么会有 数据仓库 的产生
Focusing on the modeling and analysis of data for decision makers, not on daily operations or transaction processing.
Provide a simple and concise view around particular subject issues by excluding data that are not useful in the decision support process.
Support information processing by providing a solid platform of consห้องสมุดไป่ตู้lidated, historical data for analysis.
“A data warehouse is a subject-oriented, integrated, time-variant, and nonvolatile collection of data in support of management’s decision-making process.”—W. H. Inmon
数据仓库用来为当前的业务系统做个备份 去买个数据仓库回来装上,应该不是很贵,
看看有没有盗版 数据仓库是否成功是技术人员的事情 一个数据存储方面的项目怎么会失败?!
数据仓库基础
王喆
“A data warehouse is a subjectoriented, integrated, time-variant, and nonvolatile collection of data in support of management’s decisionmaking process.”—W. H. Inmon 1992
Data cleaning and data integration techniques are applied.
Ensure consistency in naming conventions, encoding structures, attribute measures, etc. among different data sources E.g., Hotel price: currency, tax, breakfast covered, etc.
Data Warehouse—Integrated
Constructed by integrating multiple, heterogeneous data sources
relational databases, flat files, on-line transaction records
Data warehousing:
The process of constructing and using data warehouses
Data Warehouse—SubjectOriented
Organized around major subjects, such as customer, product, sales.
Operational database: current value data. Data warehouse data: provide information from a
historical perspective (e.g., past 5-10 years)
Every key structure in the data warehouse
目录
从 决策支持系统 的发展看为什么会有 数据 仓库 的产生
决策支持系统发展-演化
60年代 主文件 磁带 70年代 直接存取存储设备 DASD 数据库 80年代 个人PC 4GL
自然演化式体系结构的问题
数据可信性 生产率 无法将数据转化为信息
数据可信性
数据无时间基准 数据在算法上存在差异 抽取的多层次问题 外部数据问题 无公共起始数据
生产率问题
除非事先知道未来的企业报表需求,并且在 第一张企业报表的建造时考虑到了这些需求 因素,否则每个新的企业报表总要花费同前 面差不多的代价。
无法将数据转化为信息
从自然演化式体系结构中建立起来的系统缺 乏集成性,并且在分析型处理所需的时间范 围/时间参数上与应用系统中数据的可用时 间范围存在差异。
什么是数据仓库
What is Data Warehouse?
Defined in many different ways, but not rigorously.
A decision support database that is maintained separately from the organization’s operational database
When data is moved to the warehouse, it is converted.
Data Warehouse—Time Variant
The time horizon for the data warehouse is significantly longer than that of operational systems.
Contains an element of time, explicitly or implicitly But the key of operational data may or may not
contain “time element”.
体系结构设计环境的层次
操作层
原子/数据 仓库层
部门层
个体层
数据操作层只保存原始数据并且服务于高性能事务处理领域;
数据仓库层存储不更新的原始数据,此外一些导出数据也在此存 在;
数据的部门层几乎只存放导出数据;
在数据个体层中完成大多数启发式分析
目录
从 决策支持系统 的发展看为什么会有 数据仓库 的产生
Focusing on the modeling and analysis of data for decision makers, not on daily operations or transaction processing.
Provide a simple and concise view around particular subject issues by excluding data that are not useful in the decision support process.
Support information processing by providing a solid platform of consห้องสมุดไป่ตู้lidated, historical data for analysis.
“A data warehouse is a subject-oriented, integrated, time-variant, and nonvolatile collection of data in support of management’s decision-making process.”—W. H. Inmon