多维数据库表设计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
BI报表开发,基础储备
前言
1.BI简介: /jiesin/archive/2008/06/23/1227694.html
/zxylonely/archive/2009/12/28/1634352.html
2.DW(数据仓库) :/view/19711.htm?fr=ala0_1_1
3.数据挖掘:/view/7893.htm?fr=ala0_1
4.Analysis Services :/zh-cn/library/ms175609(SQL.90).aspx
5.Reporting Services : /zh-cn/library/ms15910
6.aspx
A .基础知识
数据仓库:
1.数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成性、稳定性和时变性。
2、数据仓库是集成的,数据仓库的数据有来自于分散的操作型数据,将所需数据从原来的数据中抽取出来,进行加工与集成,统一与综合之后才能进入数据仓库;
3、数据仓库是不可更新的,数据仓库主要是为决策分析提供数据,所涉及的操作主要是数据的查询;
4、数据仓库是随时间而变化的,传统的关系数据库系统比较适合处理格式化的数据,能够较好的满足商业商务处理的需求,他在商业领域取得了巨大的成功。
数据仓库的出现,并不是要取代数据库。目前,大部分数据仓库还是用关系数据库管理系统来管理的。可以说,数据库、数据仓库相辅相成、各有千秋。
数据库是面向事务的设计,数据仓库是面向主题设计的。
数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。
数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库在设计是有意引入冗余,采用反范式的方式来设计。数据库是为捕获数据而设计,数据仓库是为分析数据而设计,它的两个基本的元素是维表和事实表。
B数据规则
tbl_MetaData_ 元数据表,比如说:tbl_MetaData_客户来源
tbl_StaticData_状态形数据,比如说tbl_StaticData_新建订单
tbl_RawData_记录形数据,比如说tbl_RawData_新建客户
tbl_ResultData_库存记录比如说tbl_ResultData_库存表
元数据表示的是下拉框列表的选项,
状态形数据:记录一条信息所拥有的状态,比如说订单的状态.
记录性数据:表示记录一次打电话的记录,比如说新建客户,打电话要记录的.
结果性数据是由状态形数据生成的,你不用管他,也不用建他.这个是最后做报表生成的.
C.BI
BI,也称商业智能(Business Intelligence),简而言之,是从大量数据中钻取信息和知识,能帮助企业利用数据价值提高决策质量的技术集合。具体地讲,它是对企业的海量数据,这些数据有来自企业内部应用系统的订单、库存、交易帐目以及客户和供应商的资料,有来自本行业其它竞争对手的资料,也有来自当前国际市场环境的一些相关信息,我们通过对这些数据进行过滤、加工、处理、分析,从中获取某种信息,探索其中的机会和规律,进而将这些信息和规律深华成一种知识,一种能力,帮助企业无论从战术层面,还是战略层面,搞高各级决策者决策质量,为企业带来更好的商业效益。如图所示:
D.数据挖掘:
数据挖掘,在人工智能领域,习惯上又称为数据库中知识发现(Knowledge Disc overy in Database, KDD),也有人把数据挖掘视为数据库中知识发现过程的一个基本步骤。知识发现过程以下三个阶段组成:(1)数据准备,(2)数据挖掘,(3)结果表达和解释。数据挖掘可以与用户或知识库交互。
并非所有的信息发现任务都被视为数据挖掘。例如,使用数据库管理系统查找个别的记录,或通过因特网的搜索引擎查找特定的Web页面,则是信息检索(information retrieval)领域的任务。虽然这些任务是重要的,可能涉及使用复杂的算法和数据结
构,但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。尽管如此,数据挖掘技术也已用来增强信息检索系统的能力。
总结
1、数据仓库是整合一个企业所有数据,实现跨部门、全公司数据集中存储、共享的工具,更实际一点说,它是所有业务数据的整合,需要经历ODS、ETL、DataMart等多个过程,而且随着公司的发展,数据仓库将实现自动扩充和扩展。其实它最底层还是基于数据库,最多是可以从多个数据库是提取数据,但我认为一个数据库开发数据仓库,可以有效地提高数据的利用利用效率,所谓的XML等数据用于文档管理也许是最适合的
2、数据挖掘是基于数据仓库的深层次分析工具,没有数据仓库提供的详尽的数据,数据挖掘根本是一套废物或者是幻想,应为数据挖掘所依赖的技术,都需要大量的数据,而且数据挖掘的结果是只能是专家才能理解,所以它是专家系统,不是推而广之
3、BI,号称是商业智能,能够为企业决策提供支持,其实是夸夸其谈,它真正能够起到是作用是展现日常的业务数据,更重要的是能够以一种直观有效的形式进行展示,使使用者能够从多个角度来观察数据,理解业务现状。所以BI根据业务日常需要分为三种形式:1)OLAP:包括Hyperion\Cognose PowerCube\AnalysisService,主要用于实现多维数据集;2)报表工具:包括BO\Brio\Cognose,其中BO可以说是这个行业中的老大;3)基于OLAP、报表的动态查询
4、BI其中包括Business和Intelligence,这两个概念就不是一般软件开发人员能够全部理解的,因此这是与业务直接相关的开发,所以BI的开发需要与专业的行业精英一起,由他们提供想法,由需求分析人员把它转化为业务数据模式和关联,然后才能交给开发人员进行设计,所以BI是离不开业务人员,不是用个工具就是简单开发的东西
F. Analysis Services
Microsoft SQL Server 2005 Analysis Services (SSAS) 为商业智能解决方案提供联机分析处理(OLAP) 和数据挖掘功能。在使用Analysis Services 设计商业智能解决方案之前,您应当熟悉成功的解决方案所必需的OLAP 和数据挖掘概念。
Analysis Services 通过允许开发人员在一个或多个物理数据源中定义一个称为统一
维度模型(UDM) 的数据模型,从而很好的组合了传统的基于OLAP 分析和基于关系报表的各个最佳方面。基于OLAP、报表以及自定义BI 应用程序的所有最终用户查询都将通过UDM(可提供一个此关系数据的业务视图)访问基础数据源中的数据。Analysis Services 提供了一组丰富的数据挖掘算法,业务用户可使用这组算法挖掘其数据以查找特定的模式和走向。这些数据挖掘算法可用于通过UDM 或直接基于物理数据存储区对数据进行分析。