SQLSERVER构建数据仓库.

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.2 超市数据仓库系统的数据加载
数 据 仓 库 的 数 据 导 入
1.2 超市数据仓库系统的数据加载
D T S 数 据 导 入 / 导 出 向 导
1.2 超市数据仓库系统的数据加载
数 据 导 入 源 的 选 择
1.2 超市数据仓库系统的数据加载
数 据 导 入 源 的 确 定
1.2 超市数据仓库系统的数据加载
3.创建强制新订阅向导
• 在强制订阅中,集中的分发服务器将建立调度, 按照此调度与远程的、偶尔连接的订阅服务器进行 连接。使用强制订阅,分发代理程序(用于快照发 布和事务发布)或合并代理程序(用于合并发布) 可以运行于分发服务器。 • 建立订阅时要考虑的因素是需要订阅的类型(强 制、请求或匿名)以及运行复制代理程序的位置。 • 为了创建订阅,发布服务器上必须有发布,订阅 服务器上也必须有订阅数据库。可以在创建订阅之 前创建订阅数据库,或在创建强制订阅向导中指定 新的订阅数据库。可以为任何在发布服务器和分发 服务器的属性中启用的订阅服务器创建强制订阅。
2.挖掘数据的准备
一、建立数据挖掘库的步骤: 1. 选择业务数据、 2. 转换业务数据、 3. 验证业务数据。 二、为数据挖掘工作准备训练数据集与数据 验证集的步骤: 1. 确定数据质量、 2. 准备适当的数据、 3. 为目标变量确定初值、 4. 确定数据挖掘变量的格式。
2.3 数据挖掘模型的应用
数据仓库应用实例
1数据仓库的数据加载与钻取
2数据挖掘模型的设计
3SQL Server中的数据挖掘工具
4数据仓库客户端界面的设计
1 数据仓库的数据加载与钻取
1.1 数据仓库的数据加载 1. SQL Server的数据复制工具与应用 5个有关复制的向导工具: 创建发布向导、 创建强制新订阅向导、 创建请求订阅发布、 禁用发布或分布向导、 配置发布和分布向导、
SQL Server数据复制向导
2.创建发ቤተ መጻሕፍቲ ባይዱ向导
利用发布向导可以完成这样一些操作: •选择发布数据库。 •使用发布模板。 •选择发布类型。 •选择可更新的订阅。 •可传送的订阅(快照复制或事务复制可使 用的选项)。 •指定订阅服务器类型。 •指定要发布的数据和数据库对象项目。 选择发布名称和描述。
3.创建强制新订阅向导
4.创建请求订阅向导
5.禁用发布或分布向导
在SQL Server的企业管理器中的“工具”菜 单中打开向导菜单项,调出“选择向导”对 话框,选择其中的“复制”节点,选择“禁 用发布或分布向导”菜单项。 进入“欢迎使用禁用发布或分布向导”对话 框。 利用该向导可以完成“除去所选服务器上的 所有发布”或“除去对应已除去发布的所有 订阅”这些设置不会影响到该服务器从其它 发布服务器接受到的订阅。
MDX新查询建立
MDX查询结果显示
MDX的立方体旋转显示
2 数据挖掘模型的设计
2.1 数据挖掘对象的分析
•由数据挖掘项目组成员共同分析数据挖掘对象 •超市营销策略评价主要通过门市、商品、营销策略、日期和客 户五个维度。要分析的则是商品的销售量、销售额、商品的成 本和商品销售的利润等度量信息。 •商品销售量增长率=(实施促销策略后商品销售量/实施促销策 略前商品销售量-1)×100% •商品销售额增长率=(实施促销策略后商品销售额/实施促销策 略前商品销售额)×100% •商品利润增长率=(实施促销策略后商品利润/实施促销策略前 商品利润)×100% •商品促销策略门市影响率=不同门市相同促销策略商品利润增 长率之比 •商品促销策略时间影响率=不同时间相同促销策略商品利润增 长率之比等各种新的变量。
数 据 导 入 的 转 换 语 言
1.2 超市数据仓库系统的数据加载
数 据 导 入 任 务 包 的 保 存 与 调 度
1.2 超市数据仓库系统的数据加载
任 务 包 的 作 业 调 度
任务包的保存
任务包完成提示
任务包的浏览
1.3 多维数据集的更新
D T S 调 度 包 的 建 立
处理任务框架
5.钻取数据的选择
6.钻取结果显示
1.5 数据仓库的多维表达式MDX应用
MDX启动顺序:开始→程序→Microsoft SQL Server→Analysis Services→MDX示例应用程序。启 动MDX以后将出现Connect对话框,在Server输入框中 输入Analysis Services服务器名称,Provider输入 框中输入MSOLAP,单击“OK”按钮后,出现示例应用程 序窗口
数 据 导 入 目 的 库 选 择
1.2 超市数据仓库系统的数据加载
数 据 导 入 方 式 选 择
1.2 超市数据仓库系统的数据加载
导 入 数 据 表 和 视 图 的 选 择
1.2 超市数据仓库系统的数据加载
数 据 导 入 源 和 目 的 的 映 射 确 定
1.2 超市数据仓库系统的数据加载
•注意多目标变量之间的相互关系 •确定多目标变量最终的分析顺序 •剔除那些对目标变量具有强相关性的 变量 •挖掘模型的维护和完善 •将所获得挖掘结果存储进多维数据集
3 SQL Server中的数据挖掘工具
2.2 数据挖掘模型与相关数据的准备
1.挖掘模型的确定 • 映射:业务数据是否能够转换成多维的、可比较的、 地理的、时间的或不同的层次问题。 • 主要方法:分类、估计、关联分组、聚类、细分或 预测等 • 有时为了解决一些较大的业务问题,可能还需要对 业务问题进行分解,将业务问题分解成多个较小的问题。 如果这些问题能够使用分类、估计、关联分组、聚类、 细分或预测等挖掘方法来解决。那么这一较大的问题也 就可以用数据挖掘方法解决。
选择处理对象
调度任务处理选项确定
任务的建立
任务工作流确定
任务工作流属性设置
DTS包的保存
任务包的调度设置
任务包的运行时间设置
1.4 数据仓库的钻取访问
1. 数 据 钻 取 的 进 入
2.数据钻取选项的确定
3.钻取数据列的选择
4.数据钻取角色的管理
在进行数据钻取前,还需要利用与编辑命 令同一菜单中的“管理角色”命令确定可 以进行数据钻取的管理人员。
相关文档
最新文档