数据挖掘实验1任务书

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据仓库与数据挖掘实验一任务书

多维数据集的建立以及数据的加载

一、目的和要求

(1)建立关系数据库,为多维数据集的建立做好准备。

(2)在没有数据源的情况下,创建一个多维数据集,熟悉多维数据集建立的过程。

(3)为创建的多维数据集添加数据源,并向关系架构加载数据。

二、实验内容

一)建立关系数据库

1.建立数据库my sales

数据库表如下

订单信息:订单号,订单日期,订单金额,商品号,单价,数量,客户号,员工号,付款状态

客户信息表:客户号,姓名,家庭地址,性别,联系电话,年龄,生日,文化程度商品信息表:商品号,商品名称,类别编号,大小范围,大小,颜色范围,颜色,照片,吊牌价,标准成本,开始销售日期,重量,销售状态

类别信息表:类别编号,类别名称,描述,小类别编号

小类别信息表:小类别编号,小类别名称,描述,大类别编号

大类别信息表:大类别编号,大类别名称,描述

2.建立外键关系,新建数据库关系图

3.输入数据库数据

二)根据分析需求收集数据源导入数据仓库并进行抽取,转换,集成。

1)打开Microsoft SQL Server Management Studio,创建一个新的数据库sales_DW.

2)右击数据源my sales,选择单击任务—导出数据,出现导出界面,单击“下一步”按钮,“选择数据源”页自动填入创建到my sales 的连接的数据源、服务器和数据库,单击“下一步”。

3)在“选择目标”页,从数据库下拉列表框中选择sales_DW.

4)在“指定表复制和查询”页可以选择“复制一个或多个表或视图的数据”,页可以选择“编写查询以指定要传输的数据”,如果选择后者,可以在下一步出现的对话框中输入“select……………from [数据表]”语句实现数据的抽取。也可以选择前者,出现如下的对话框,根据任务选择要复制的数据表。

5) 两次单击“下一步”,完成源数据的复制以及初步抽取。

6)为了使多维数据集在分析时能够分析事实的时间维度,可以在sales_DW中添加一个时间表,其中有“订单时间”,“年”,“月”“日”等属性,以“订单时间”为主键。

7)由于对于钻取任务而言,一些属性例如商品信息表中的“标准成本”“重量”是不需要的,所以可以删除。如果在复制数据源时在“指定表复制和查询”页选择“编写查询以指定要传输的数据”,则可以在复制初期就完成表中属性的选择。

8)建立关系数据库中的各表的关系,建立sales_DW的数据库关系图。

三)创建新项目,生成新的多维数据集

1.设置数据源

1)打开BIDS,单击“文件”—“新建”—“项目”,创建新项目,自取项目名。2)创建新项目之后,在“解决方案资源管理器”窗口找到新建的项目,右击新建项目下的数据源,选择“新建数据源”命令,打开“数据源向导”对话框。3)在“数据源向导”对话框“数据连接”列表中选择刚创建好的数据源“sales_DW”,接着单击“下一步”按钮,进入“模拟信息”界面。选择“默认值”,单击下一步,进入完成向导界面,单击“完成”按钮,数据源就设置好了。

2.设置数据源视图

1)在“解决方案资源管理器”窗口,在新建的项目下,右击数据源视图文件夹,接着在弹出的快捷菜单中选择“新建数据源视图菜单”命令,打开“数据源视图向导”对话框,如下图所示:

2)单击“下一步”按钮,进入“选择表和视图”界面,使用“>”按钮可将可用对象列表框中表移动到“包含的对象”列表中,单击下一步,进入“完成向导”界面,可更改数据源视图名称,单击“完成”按钮,完成创建数据源视图的工作,双击新建的数据源视图,观察数据源视图窗口变化。

3.创建多维数据集

1)在“解决方案资源管理器”窗口,在新建的项目下,右击多维数据集文件夹,接着从弹出的快捷菜单中选择“新建多维数据集”命令,进入“多维数据集向导”界面,单击“下一步”按钮。

2)出现“选择生成方法”界面,选中“使用数据源生成多维数据集”单选按钮,并取消选中“自动生成”复选框。

3)单击下一步,进入“选择数据源视图”界面,选中刚建好的数据源视图,单击“下一步”,进入“标识事实数据表和维度表”界面,选择事实和维度,接着单击“下一步”按钮进入“选择度量值”界面,选择默认,单击下一步,进入查看“新建维度”界面。

4)接受默认值,单击“下一步”按钮,进入“完成向导”界面。

5)输入多维数据集名称,单击“完成”按钮,向导创建这个多维数据集以及其中包含的维度。此时,设计器中会显示多维数据集的数据视图和结构,观察视图和结构。

4.为维度创建层次结构

1)双击需要创建层次的维度,界面就会出现一个维度窗口,单击“层次结构”标签。

2)展开维度节点,以时间维度为例,并单击“编辑时间”按钮,此时设计器窗口会显示“维度结构”选项卡。

3}将“年”,“月”,“日”属性拖拽到“层次结构和级别”列表中的“层次结构”组下。那么时间维度层次就创建完成了。

相关文档
最新文档