数据挖掘实验三汇总

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验三设计并构造AdventureWorks数据仓库实例

【实验要求】

在SQL Server 平台上,利用AdventureWorks数据库作为商业智能解决方案的数据源,设计并构造数据仓库,建立OLAP和数据挖掘模型,并以输出报表的形式满足决策支持的查询需求。

【实验内容】

步骤1:需求分析:以决策者的视角分析和设计数据仓库的需求;

步骤2:根据所设计的需求,确定本数据仓库的主题和主题与边界;

步骤3:设计并构造逻辑模型;

步骤4:进行数据转换和抽取,建立数据仓库:创建数据源,,建立OLAP和挖掘模型,使用多维数据集进行分析,建立数据挖掘结构和数据挖掘模型,创建报表。

【实验平台】

Win7操作系统,SQL Server 2005

【实验过程】

一、创建Analysis Services 项目

1.打开Business Intelligence Development Studio。

2.在“文件”菜单上,指向“新建”,然后选择“项目”。

3.确保已选中“模板”窗格中的“Analysis Services 项目”。

4.在“名称”框中,将新项目命名为AdventureWorks。

5. 单击“确定”。

二、创建数据库和数据源

1.运行AdventureWorks sql server 2005示例数据库.msi,然后用SQL Server Management Studio 附加数据库AdventureWorks_Data.mdf 。

(1)运行AdventureWorks sql server 2005示例数据库.msi

(2)用SQL Server Management Studio附加数据库AdventureWorks_Data.mdf

2.在解决方案资源管理器中,右键单击“数据源”文件夹,然后选择“新建数据源”。

3.在“欢迎使用数据源向导”页面中,单击“下一步”按钮。

4.在“选择如何定义连接”页上,单击“新建”向Adventure Works 数据库中添加连接。

5.在“连接管理器”的“提供程序”列表中,选择“本机OLE DB\SQL Native Client”。

6.在“服务器名称”列表中,键入或选择承载AdventureWorks 的服务器的名称。

7.在“登录到服务器”组中,选择身份验证方法,并输入凭据。

8.在“选择或输入一个数据库名”列表中,选择AdventureWorks,然后测试连接。若连接成功,再单击“确定”按钮。

9.单击“下一步”按钮进入向导的下一页。

10.在“模拟信息”页中,选择“使用服务帐户”,再单击“下一步”。

11.请注意,在“完成向导”页中,数据源名称默认为Adventure Works。

12.单击“完成”。

新的数据源Adventure Works 将显示在解决方案资源管理器的“数据源”文件夹中。

三、创建数据源视图

1.在解决方案资源管理器中,右键单击“数据源视图”,选择“新建数据源视图”。系统将打开数据源视图向导。

2.在“欢迎使用数据源视图向导”页上,单击“下一步”。

3.在“选择数据源”页的“关系数据源”下,系统将默认选中您在上一个任务中创建的Adventure Works DW 数据源。单击“下一步”。

若要创建新数据源,请单击“新建数据源”,启动数据源向导。

4.在“选择表和视图”页上,选择下列各表,然后单击右箭头键,将这些表包括在新数据源视图中:

5.单击“下一步”。

6.在“完成向导”页上,默认情况下,系统将数据源视图命名为Adventure Works 。单击“完成”。

系统将打开数据源视图设计器,显示Adventure Works 数据源视图。

四、定义维度

1.在解决方案资源管理器中,右键单击“维度”,然后单击“新建维度”。

2. 在“欢迎使用维度向导”页上,单击“下一步”。

3. 在“选择生成方法”页上,验证是否选择了“使用数据源生成维度”选项,然后单击“下一步”。

4. 在“选择数据源视图”页上,验证是否选择了Adventure Works 数据源视图。

5.在“选择维度类型”列表中,选择“标准维度”。

6.在“选择主维度表”中,点击“下一步”。

7.在“选择维度属性”中,点击“下一步”。

8.在“指定维度类型”中,点击“下一步”。

9.在“定义父子关系”中,点击“下一步”。

10.“检测层次结构”中,点击“下一步”。

11.点击“下一步”,然后点击“完成”。

五、使用多维数据集进行分析

1.在解决方案资源管理器中,右键单击“多维数据集”并选择“新建多维数据集”启动多维数据集向导。

2.在“欢迎使用多维数据集向导”页上,单击“下一步”。

3.在“选择生成方法”页上,确认已选中“使用数据源生成多维数据集”选项,然后单击“下一步”。

4.在“选择数据源视图”页上,点击“下一步”。

5.在“检测事实数据表和维度表”页上,点击“下一步”。

6.在“时间维度表”页上,如下所示。

7.在“查看共享维度”页上,点击“>”,然后“下一步”。

8.在“选择度量值”页上,选择可用度量值。

9.在“检测层级结构”页上,查看结果,点击“下一步”。

10.在“查看新建维度”中,选择新建维度,然后点击“下一步”。

“度量值组”和“维度”。

12.点击“完成”。

13.在多维数据集设计器的工具栏上,将“缩放”级别更改为50 %,以便更轻松地查看多维数据集内的维度和事实数据表。注意,事实数据表是黄色的,维度表是蓝色的。

14.在“文件”菜单上,单击“全部保存”。

六、创建用于个人客户方案的挖掘结构

1.在解决方案资源管理器中,右键单击“挖掘结构”并选择“新建挖掘结构”启动数据挖掘向导。

相关文档
最新文档