BI技术方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
\
'
、
#
~
<
: BI技术方案
变更说明
(
目录
1 前言 1
1.1 目的 1
1.2 读者对象 1
&
1.3 定义、缩略语 1
1.4 参考资料 1
2 方案概述 1
2.1 架构设计 1
:
2.2 软件列表 3
2.3 域控服务 3
2.4 邮件服务 3
2.5 协同办公平台 3 '
3 数据仓库设计 4
3.1 设计原则 4
3.2 设计规范 5
3.3 设计阶段划分 6 |
3.4 可伸缩性 7
3.5 数据集市 8
4 ETL过程管理 8
4.1 开发 9
》
4.2 运行 13
4.3 预警 13
5 OLAP设计 13
5.1 最佳实践 14
,
5.2 向下兼容 17
5.3 权限管理 18
5.4 接口 19
6 数据挖掘模型的开发及应用 19 ~
6.1 过程及方法 19
6.2 挖掘分析示例 22
6.3 接口 25
7 分析结果展现 25
$
7.1 多维透视分析 25
7.2 报表 27
7.3 挖掘分析结果展现 29
8 门户平台 30
—
9 软硬件配置 31
9.1 硬件环境 31
9.2 软件环境 31
/
1 前言
1.1 目的
1.2 读者对象
1.3 定义、缩略语
1.4 参考资料
2 方案概述
—
2.1 架构设计
系统整体架构采用以微软SQL Server 2008为中心的技术架构,集成ETL技术、OLAP技术、报表技术、数据挖掘技术和门户技术,有效地保障了数据的时效性、准确性和易用性。
逻辑架构图如下:
[
系统架构图
产品架构图
2.2 软件列表
1.数据仓库及ODS数据库:SQL Server 2008关系型数据库
`
2.OLAP服务:SQL Server 2008的分析服务(Analysis Service)
3.ETL工具:SQL Server 2008的SSIS(SQL Server Integration Service)
4.前端报表展现工具:SQL Server 2008的RS(Reporting Service)、OWC 和Office2003。
5.数据挖掘:SQL Server 2008的分析服务(Analysis Service)
《
6.门户:SharePoint Server 2010
2.3 域控服务
采用AD(域控,下同)为HIS BI系统以及医院未来进一步信息建设提供强大的帐户以及权限统一管理的基础框架服务。 HIS BI系统采用AD的帐户集成存储管理的模式为报表权限,数据访问权限提供统一的管理模式。大大简化了帐户及
权限的管理设置。为程序的扩展提供良好的基础。结合AD, 为MOSS平台提供文档管理权限控制。MOSS平台可通过AD的帐户统一的管理权限,每个用户都可以自行控制其所属文件的访问权限。
2.4 邮件服务
采用开源免费的邮箱系统,该邮箱系统可结合AD服务提供完善统一的邮箱帐户信息。并且支持多种协议访问,可使用Foxmail,Outlook等免费或者收费软件访问邮箱系统。该邮箱服务产品是开源的,意味着可以通过院信息化平台开发人员自行拓展邮箱功能,也为邮箱的安全性提供进一步的支持。该邮箱产品支持多种后台数据库产品,例如SQL Server, DB2, Oracle, MySQL.此项为数据库产品的选型提供更加灵活的方式。
&
2.5 协同办公平台
基于上述域控管理和邮件服务功能,安普莱软件的BI系统可以和海军总医院现有办公平台无缝集成,我们也可以帮助海军总医院搭建企业级的协同办公平台,为海军总医院提供完善的办公平台服务,简化办公流程复杂度,提高办公协同的工作效率。
3 数据仓库设计
SQL Server 2008 基于 SQL Server 2008 的强大功能之上,提供了一个完整的数据管理和分析解决方案,它将会给不同规模的组织带来帮助:
1.构建、部署和管理企业应用程序,使其更加安全、伸缩性更强和更可靠。
2.降低开发和支持数据库应用程序的复杂性,实现了 IT 生产力的最大化。
3.能够在多个平台、应用程序和设备之间共享数据,更易于连接内部和外部系统。
4.在不牺牲性能、可用性、可伸缩性或安全性的前提下有效控制成本。
|
数据仓库将依据于数据仓库的标准规则创建,以确保其具有良好的可扩展性。数据仓库在项目中起到了呈上启下的作用,对其它部分的影响很大,所以数据仓库设计非常重要。
3.1 设计原则
1. 第三范式
第三范式的基本特征是非主键属性只依赖于主键属性。基于第三范式的数据库表设计具有很多优点:
1)消除了冗余数据,节省了磁盘存储空间;
。
2)有良好的数据完整性限制,即基于主外键的参照完整限制和基于主键的实体完整性限制,这使得数据容易维护,也容易移植和更新;
3)数据的可逆性好,在做连接(Join)查询或者合并表时不遗漏、也不重复;
4)因为消除了冗余数据(冗余列),在查询(Select)时每个数据页存的数据行就多,这样就有效地减少了逻辑I/O,每个Cash存的页面就多,也减少物理I/O;
5)对大多数事务(Transaction)而言,运行性能好;
《
6)物理设计(Physical Design)的机动性较大,能满足日益增长的用户需求。