数据仓库实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据仓库与数据挖掘上机实验报告
实验目的:学习Analysis Services的操作
实验内容:
浏览SQL Server 2000 Analysis Services 随机教程;规划需求分析;仓库设计;建立分析数据库,设置数据源;建立多维数据库(Cube);设置多维数据库的数据存储方式及访问权限实验分析:
下面进行实验,建立多维数据库(使用Northwind数据库),先用数据清洗转换,将需要的表从源库转换到新数据库,为数据仓库提供需要的数据,要形成的维表有Products,Category,Employees,Dates,Facts(事实表),在实验二中Products和Category将组成雪花架构的维表。
实验过程:建立多维数据库
内容:建立多维数据库(cube),要建立事实表Facts和维表Products,Categories,Employees,Dates,设置多维数据库的数据存储方式
目的:学会建立事实表,度量,时间维度,雪花表,使用数据存储方式
步骤:
1) 设置数据源,建立myNorthwind数据库。
2) 建立多维数据集的事实表,使用Analysis Server的向导。此时显示刚才选中的myNorthwind数据集,还有一个系统自带的FoodMart数据集。向导提示选择事实数据表,在这里我们选好了Facts表作为事实表。
*在下一步用了定义度量值的数据中选择TotalPrice,UnitPrice,Quantity,Discount作为度量,度量值的选择与决策者关心的项目有关。在这里假设决策者关心的是价格对销量产生的影响,从这些数据中可以得出进一步的经营方针。
3)定义好事实表后,我们要建立cube的维度表
①选择维度的创建方式,维度表的结构有星型架构,雪花架构等等,在本实验中,只用到前两个架构,因为本实验中根本没必要用到其他的结构。而雪花架构的运用也只是用于学习和研究,在实际中,如此简单的数据仓库结构也不需要雪花架构,因为它会降低系统的性能。
②在Products和Categories表上用雪花结构,Employees和Dates用星型架构,
使用Dates的OrderDate作为时间维度的日期列。选择的时间级别为年,季度,月,日,点下一步再下一步,最给给出列的名字Times。
建立Employees维度表时,需要注意的是选择维度的级别,注意下图,级别名称的列中,Country应该是在City上面,分级关系中,先分国家再分城市,最后才到员工。
在建立雪花架构时,将Categories和Products两表都选中,并根据其中的关系创建和编辑联接。接着是选择维度的级别等等。。。。
4)各维度表已经完成。最后在多维数据集编辑器中就可能看到大体的结构:5)用MOLAP方式保存数据,最后得到的视图是这样的:
实验总结:
实验一:DTS转换中对Employees,Dates,Facts表的转换存在一定的难度,但通过对VB函数的学习,也不是很困难。
不过应该是注意的是:
1)要新建一个数据库(此处,命名为myNorthwind),将原来数据库的内容转换格式后导回来。
2)对Facts表的转换时,要充分考虑到各表与之的关系。
总的来说,Microsoft的Analysis Server在人性化方面做得非常的好,操作者好容易上手,学习起来也有大量的文档资料,所以基本上不存在大问题,只要认识了数据仓库的具体意义,学习起来就会很简单。