数据仓库设计的21条原则

合集下载

2022年黄河科技学院计算机应用技术专业《数据库概论》科目期末试卷A(有答案)

2022年黄河科技学院计算机应用技术专业《数据库概论》科目期末试卷A(有答案)

2022年黄河科技学院计算机应用技术专业《数据库概论》科目期末试卷A(有答案)一、填空题1、SQL Server中数据完整性包括______、______和______。

2、数据库内的数据是______的,只要有业务发生,数据就会更新,而数据仓库则是______的历史数据,只能定期添加和刷新。

3、____________和____________一起组成了安全性子系统。

4、采用关系模型的逻辑结构设计的任务是将E-R图转换成一组______,并进行______处理。

5、数据仓库创建后,首先从______中抽取所需要的数据到数据准备区,在数据准备区中经过净化处理______,再加载到数据仓库中,最后根据用户的需求将数据发布到______。

6、“为哪些表,在哪些字段上,建立什么样的索引”这一设计内容应该属于数据库设计中的______阶段。

7、在SELECT命令中进行查询,若希望查询的结果不出现重复元组,应在SEL ECT语句中使用______保留字。

8、在RDBMS中,通过某种代价模型计算各种查询的执行代价。

在集中式数据库中,查询的执行开销主要包括______和______代价。

在多用户数据库中,还应考虑查询的内存代价开销。

9、关系规范化的目的是______。

10、使某个事务永远处于等待状态,得不到执行的现象称为______。

有两个或两个以上的事务处于等待状态,每个事务都在等待其中另一个事务解除封锁,它才能继续下去,结果任何一个事务都无法执行,这种现象称为______。

二、判断题11、在数据库恢复中,对已完成的事务进行撤销处理。

()12、数据模型的核心构成要素是数据结构。

()13、概念模型是对现实世界的第二层抽象。

()14、全码的关系模式一定属于BC范式。

()15、在关系模式中,候选码可以有多个,主码只能有一个。

()16、在第一个事务以S锁方式读数据R时,第二个事务可以进行对数据R加S锁并写数据的操作。

2022年安徽科技学院网络工程专业《数据库原理》科目期末试卷B(有答案)

2022年安徽科技学院网络工程专业《数据库原理》科目期末试卷B(有答案)

2022年安徽科技学院网络工程专业《数据库原理》科目期末试卷B(有答案)一、填空题1、如果多个事务依次执行,则称事务是执行______;如果利用分时的方法,同时处理多个事务,则称事务是执行______。

2、视图是一个虚表,它是从______导出的表。

在数据库中,只存放视图的______,不存放视图对应的______。

3、关系数据库中基于数学的两类运算是______________和______________。

4、已知系(系编号,系名称,系主任,电话,地点)和学生(学号,姓名,性别,入学日期,专业,系编号)两个关系,系关系的主码是______________,系关系的外码是______________,学生关系的主码是______________,外码是______________。

5、数据库内的数据是______的,只要有业务发生,数据就会更新,而数据仓库则是______的历史数据,只能定期添加和刷新。

6、数据的安全性是指____________。

7、关系系统的查询优化既是关系数据库管理系统实现的关键技术,又是关系系统的优点。

因为,用户只要提出______,不必指出 ______。

8、数据管理技术经历了______________、______________和______________3个阶段。

9、在SQL Server 2000中,某数据库用户User在此数据库中具有对T 表数据的查询和更改权限。

现要收回User对T表的数据更改权,下述是实现该功能的语句,请补全语句。

_____UPDATE ON T FROM User;10、____________和____________一起组成了安全性子系统。

二、判断题11、在一个关系中,不同的列可以对应同一个域,但必须具有不同的列名。

()12、并发执行的所有事务均遵守两段锁协议,则对这些事务的任何并发调度策略都是可串行化的。

()13、全码的关系模式一定属于BC范式。

2022年淮北师范大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A(有答案)

2022年淮北师范大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A(有答案)

2022年淮北师范大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A(有答案)一、填空题1、数据模型是由______________、______________和______________三部分组成。

2、对于非规范化的模式,经过转变为1NF,______,将1NF经过转变为2NF,______,将2NF经过转变为3NF______。

3、数据仓库是______、______、______、______的数据集合,支持管理的决策过程。

4、____________和____________一起组成了安全性子系统。

5、数据库管理系统的主要功能有______________、______________、数据库的运行管理以及数据库的建立和维护等4个方面。

6、数据库恢复是将数据库从______状态恢复到______的功能。

7、关系数据库中基于数学的两类运算是______________和______________。

8、____________、____________、____________和是计算机系统中的三类安全性。

9、已知系(系编号,系名称,系主任,电话,地点)和学生(学号,姓名,性别,入学日期,专业,系编号)两个关系,系关系的主码是______________,系关系的外码是______________,学生关系的主码是______________,外码是______________。

10、视图是一个虚表,它是从______导出的表。

在数据库中,只存放视图的______,不存放视图对应的______。

二、判断题11、在关系数据库中,属性的排列顺序是可以颠倒的。

()12、一个数据表只能有一个唯一索引。

()13、连接是数据库最耗时的操作。

()14、关系中任何一列的属性取值是不可再分的数据项,可取自不同域中的数据。

()15、在SQL中,ALTERTABLE语句中MODIFY用于修改字段的类型和长度等,ADD用于添加新的字段。

2024年会计本科-管理系统中计算机应用考试历年真题常考点试题4带答案

2024年会计本科-管理系统中计算机应用考试历年真题常考点试题4带答案

2024年会计本科-管理系统中计算机应用考试历年真题常考点试题带答案卷I一.综合检测题(共100题)1.下列选项中,模块凝聚程度最高的是()。

A.偶然凝聚B.时间凝聚C.功能凝聚D.逻辑凝聚2.管理信息系统投入运行后,根据用户提出的新需求,增加新功能,这属于系统的()。

A.完善性维护B.适应性维护C.纠错性维护3.外部实体模块有_____个。

4.一个企业的信息系统受到破坏后,会对企业或其他组织的合法权益产生损害,但不损害国家安全、社会秩序和公共利益,则该系统的信息安全等级为()。

A.第l级自主保护B.第2级系统审计C.第3级安全标记D.第4级结构化5.在一个E—R图中,包括3个实体集、一个1:n联系和一个m:n联系,则最终对应的关系模型应有()。

B.4个关系C.5个关系D.6个关系6.主要服务对象位于企业操作和执行层面的信息系统是()。

A.业务处理系统B.管理信息系统C.专家系统D.决策支持系统7.设计数据库在物理设备上的存储结构和存取方法的过程是()。

A.物理结构设计B.逻辑结构设计C.系统结构设计D.数据结构设计8.我国目前实行的信息安全等级保护制度分为()。

A.3级B.4级C.5级D.6级9.下列选项中,不属于管理信息特点的是()。

A.数据来源的广泛性B.信息价值的确定性C.信息资源的共享性D.信息形式的多样性10.检索供应商“红星机床公司”提供零件的工程号和工程名称;11.查询选修课程号为C1且成绩超过80分的学生姓名;12.我国“信息安全保护制度”分为5级,其中安全标记是()。

A.第2级B.第3级C.第4级D.第5级13.软件开发、工程建设等技术性因素会从哪些方面影响系统实施效果?15.TCP和UDP位于TCP/IP协议体系的()。

A.应用层B.传输层C.网络层D.网络接口层16.逆向测试17.将两个关系中相同的元组构成一个新关系的关系运算是()。

A.并B.差C.交D.投影18.为了防范系统的漏洞被黑客利用,及时设计和安装补丁程序,这种维护属于()。

2022年荆楚理工学院计算机应用技术专业《数据库概论》科目期末试卷B(有答案)

2022年荆楚理工学院计算机应用技术专业《数据库概论》科目期末试卷B(有答案)

2022年荆楚理工学院计算机应用技术专业《数据库概论》科目期末试卷B(有答案)一、填空题1、在SQL语言中,为了数据库的安全性,设置了对数据的存取进行控制的语句,对用户授权使用____________语句,收回所授的权限使用____________语句。

2、如图所示的关系R的候选码为;R中的函数依赖有;R属于范式。

一个关系R3、DBMS的完整性控制机制应具备三个功能:定义功能,即______;检查功能,即______;最后若发现用户的操作请求使数据违背了完整性约束条件,则采取一定的动作来保证数据的完整性。

4、SQL语言的数据定义功能包括______、______、______和______。

5、以子模式为框架的数据库是______________;以模式为框架的数据库是______________;以物理模式为框架的数据库是______________。

6、____________和____________一起组成了安全性子系统。

7、在一个关系R中,若每个数据项都是不可再分割的,那么R一定属于______。

8、在RDBMS中,通过某种代价模型计算各种查询的执行代价。

在集中式数据库中,查询的执行开销主要包括______和______代价。

在多用户数据库中,还应考虑查询的内存代价开销。

9、数据仓库创建后,首先从______中抽取所需要的数据到数据准备区,在数据准备区中经过净化处理______,再加载到数据仓库中,最后根据用户的需求将数据发布到______。

10、数据库系统在运行过程中,可能会发生各种故障,其故障对数据库的影响总结起来有两类:______和______。

二、判断题11、可串行化的调度一定遵守两段锁协议。

()12、有了外模式/模式映象,可以保证数据和应用程序之间的物理独立性。

()13、数据模型的核心构成要素是数据结构。

()14、数据库系统由软、硬件及各类人员构成。

()15、连接是数据库最耗时的操作。

2022年南昌工程学院计算机应用技术专业《数据库概论》科目期末试卷B(有答案)

2022年南昌工程学院计算机应用技术专业《数据库概论》科目期末试卷B(有答案)

2022年南昌工程学院计算机应用技术专业《数据库概论》科目期末试卷B(有答案)一、填空题1、在SQL Server 2000中,某数据库用户User在此数据库中具有对T 表数据的查询和更改权限。

现要收回User对T表的数据更改权,下述是实现该功能的语句,请补全语句。

_____UPDATE ON T FROM User;2、数据模型是由______________、______________和______________三部分组成。

3、DBMS的完整性控制机制应具备三个功能:定义功能,即______;检查功能,即______;最后若发现用户的操作请求使数据违背了完整性约束条件,则采取一定的动作来保证数据的完整性。

4、数据的安全性是指____________。

5、如图所示的关系R的候选码为;R中的函数依赖有;R属于范式。

一个关系R6、如果多个事务依次执行,则称事务是执行______;如果利用分时的方法,同时处理多个事务,则称事务是执行______。

7、某事务从账户A转出资金并向账户B转入资金,此操作要么全做,要么全不做,为了保证该操作的完整,需要利用到事务性质中的_____性。

8、关系系统的查询优化既是关系数据库管理系统实现的关键技术,又是关系系统的优点。

因为,用户只要提出______,不必指出 ______。

9、数据库恢复是将数据库从______状态恢复到______的功能。

10、数据仓库主要是供决策分析用的______,所涉及的数据操作主要是______,一般情况下不进行。

二、判断题11、可以用UNION将两个查询结果合并为一个查询结果。

()12、在数据表中,空值表示不确定。

()13、在数据库恢复中,对已完成的事务进行撤销处理。

()14、在一个关系模型中,不同关系模式之间的联系是通过公共属性来实现的。

()15、数据模型的核心构成要素是数据结构。

()16、在SELECT语句中,需要对分组情况满足的条件进行判断时,应使用WHERE子句。

2022年安徽电子信息职业技术学院计算机应用技术专业《数据库概论》科目期末试卷B(有答案)

2022年安徽电子信息职业技术学院计算机应用技术专业《数据库概论》科目期末试卷B(有答案)

2022年安徽电子信息职业技术学院计算机应用技术专业《数据库概论》科目期末试卷B(有答案)一、填空题1、DBMS的完整性控制机制应具备三个功能:定义功能,即______;检查功能,即______;最后若发现用户的操作请求使数据违背了完整性约束条件,则采取一定的动作来保证数据的完整性。

2、在SQL Server 2000中,新建了一个SQL Server身份验证模式的登录账户LOG,现希望LOG在数据库服务器上具有全部的操作权限,下述语句是为LOG授权的语句,请补全该语句。

EXEC sp_addsrvrolemember‘LOG’,_____;3、数据仓库是______、______、______、______的数据集合,支持管理的决策过程。

4、数据仓库主要是供决策分析用的______,所涉及的数据操作主要是______,一般情况下不进行。

5、设某数据库中有作者表(作者号,城市)和出版商表(出版商号,城市),请补全如下查询语句,使该查询语句能查询作者和出版商所在的全部不重复的城市。

SELECT城市FROM作者表_____SELECT城市FROM出版商表;6、某事务从账户A转出资金并向账户B转入资金,此操作要么全做,要么全不做,为了保证该操作的完整,需要利用到事务性质中的_____性。

7、对于非规范化的模式,经过转变为1NF,______,将1NF经过转变为2NF,______,将2NF经过转变为3NF______。

8、在SQL Server 2000中,数据页的大小是8KB。

某数据库表有1000行数据,每行需要5000字节空间,则此数据库表需要占用的数据页数为_____页。

9、关系代数运算中,基本的运算是______________、______________、______________、______________和______________。

10、在SELECT命令中进行查询,若希望查询的结果不出现重复元组,应在SEL ECT语句中使用______保留字。

2022年安徽农业大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A(有答案)

2022年安徽农业大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A(有答案)

2022年安徽农业大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A(有答案)一、填空题1、SQL语言的数据定义功能包括______、______、______和______。

2、关系系统的查询优化既是关系数据库管理系统实现的关键技术,又是关系系统的优点。

因为,用户只要提出______,不必指出 ______。

3、数据库内的数据是______的,只要有业务发生,数据就会更新,而数据仓库则是______的历史数据,只能定期添加和刷新。

4、数据仓库是______、______、______、______的数据集合,支持管理的决策过程。

5、数据库系统在运行过程中,可能会发生各种故障,其故障对数据库的影响总结起来有两类:______和______。

6、主题在数据仓库中由一系列实现。

一个主题之下表的划分可按______、______数据所属时间段进行划分,主题在数据仓库中可用______方式进行存储,如果主题存储量大,为了提高处理效率可采用______方式进行存储。

7、设有关系模式R(A,B,C)和S(E,A,F),若R.A是R的主码,S.A是S的外码,则S.A的值或者等于R中某个元组的主码值,或者______取空值,这是规则,它是通过______和______约束来实现的。

8、____________、____________、____________和是计算机系统中的三类安全性。

9、视图是一个虚表,它是从______导出的表。

在数据库中,只存放视图的______,不存放视图对应的______。

10、“为哪些表,在哪些字段上,建立什么样的索引”这一设计内容应该属于数据库设计中的______阶段。

二、判断题11、连接是数据库最耗时的操作。

()12、关系中任何一列的属性取值是不可再分的数据项,可取自不同域中的数据。

()13、DBMS提供授权功能控制不同用户访问数据的权限,主要目的是为了实现数据库的完整性。

数据仓库与数据挖掘教程(第2版)课后习题答案 第四章

数据仓库与数据挖掘教程(第2版)课后习题答案 第四章

第四章作业1.数据仓库的需求分析的任务是什么?P67需求分析的任务是通过详细调查现实世界要处理的对象(企业、部门用户等),充分了解源系统工作概况,明确用户的各种需求,为设计数据仓库服务。

概括地说,需求分析要明确用那些数据经过分析来实现用户的决策支持需求。

2.数据仓库系统需要确定的问题有哪些?P67、、(1)确定主题域a)明确对于决策分析最有价值的主题领域有哪些b)每个主题域的商业维度是那些?每个维度的粒度层次有哪些?c)制定决策的商业分区是什么?d)不同地区需要哪些信息来制定决策?e)对那个区域提供特定的商品和服务?(2)支持决策的数据来源a)那些源数据与商品的主题有关?b)在已有的报表和在线查询(OLTP)中得到什么样的信息?c)提供决策支持的细节程度是怎么样的?(3)数据仓库的成功标准和关键性指标a)衡量数据仓库成功的标准是什么?b)有哪些关键的性能指标?如何监控?c)对数据仓库的期望是什么?d)对数据仓库的预期用途有哪些?e)对计划中的数据仓库的考虑要点是什么?(4)数据量与更新频率a)数据仓库的总数据量有多少?b)决策支持所需的数据更新频率是多少?时间间隔是多长?c)每种决策分析与不同时间的标准对比如何?d)数据仓库中的信息需求的时间界限是什么?3.实现决策支持所需要的数据包括哪些内容?P68(1)源数据(2)数据转换(3)数据存储(4)决策分析4.概念:将需求分析过程中得到的用户需求抽象为计算机表示的信息结构,叫做概念模型。

特点:(1)能真实反映现实世界,能满足用户对数据的分析,达到决策支持的要求,它是现实世界的一个真实模型。

(2)易于理解,便利和用户交换意见,在用户的参与下,能有效地完成对数据仓库的成功设计。

(3)易于更改,当用户需求发生变化时,容易对概念模型修改和扩充。

(4)易于向数据仓库的数据模型(星型模型)转换。

5.用长方形表示实体,在数据仓库中就表示主题,椭圆形表示主题的属性,并用无向边把主题与其属性连接起来;用菱形表示主题之间的联系,用无向边把菱形分别与有关的主题连接;若主题之间的联系也具有属性,则把属性和菱形也用无向边连接上。

2022年衡阳师范学院网络工程专业《数据库原理》科目期末试卷A(有答案)

2022年衡阳师范学院网络工程专业《数据库原理》科目期末试卷A(有答案)

2022年衡阳师范学院网络工程专业《数据库原理》科目期末试卷A(有答案)一、填空题1、有两种基本类型的锁,它们是______和______。

2、设某数据库中有作者表(作者号,城市)和出版商表(出版商号,城市),请补全如下查询语句,使该查询语句能查询作者和出版商所在的全部不重复的城市。

SELECT城市FROM作者表_____SELECT城市FROM出版商表;3、SQL语言的数据定义功能包括______、______、______和______。

4、设某数据库中有商品表(商品号,商品名,商品类别,价格)。

现要创建一个视图,该视图包含全部商品类别及每类商品的平均价格。

请补全如下语句: CREATE VIEW V1(商品类别,平均价格)AS SELECT商品类别,_____FROM商品表GROUP BY商品类别;5、如果多个事务依次执行,则称事务是执行______;如果利用分时的方法,同时处理多个事务,则称事务是执行______。

6、在关系数据库的规范化理论中,在执行“分解”时,必须遵守规范化原则:保持原有的依赖关系和______。

7、关系数据库中基于数学的两类运算是______________和______________。

8、安全性控制的一般方法有____________、____________、____________、和____________视图的保护五级安全措施。

9、在SQL Server 2000中,某数据库用户User在此数据库中具有对T 表数据的查询和更改权限。

现要收回User对T表的数据更改权,下述是实现该功能的语句,请补全语句。

_____UPDATE ON T FROM User;10、数据仓库是______、______、______、______的数据集合,支持管理的决策过程。

二、判断题11、可以用UNION将两个查询结果合并为一个查询结果。

()12、有出现并发操作时,才有可能出现死锁。

数据挖掘复习题纲

数据挖掘复习题纲

一、1。

2 数据仓库与数据库有何不同?它们有哪些相似之处?简而言之,数据库是面向事务的设计,数据仓库是面向主题设计的。

数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。

数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库在设计是有意引入冗余,采用反范式的方式来设计.数据库是为捕获数据而设计,数据仓库是为分析数据而设计,它的两个基本的元素是维表和事实表。

维是看问题的角度,比如时间,部门,维表放的就是这些东西的定义,事实表里放着要查询的数据,同时有维的ID.单从概念上讲,有些晦涩。

任何技术都是为应用服务的,结合应用可以很容易地理解。

以银行业务为例。

数据库是事务系统的数据平台,客户在银行做的每笔交易都会写入数据库,被记录下来,这里,可以简单地理解为用数据库记帐。

数据仓库是分析系统的数据平台,它从事务系统获取数据,并做汇总、加工,为决策者提供决策的依据.比如,某银行某分行一个月发生多少交易,该分行当前存款余额是多少。

如果存款又多,消费交易又多,那么该地区就有必要设立ATM了。

显然,银行的交易量是巨大的,通常以百万甚至千万次来计算。

事务系统是实时的,这就要求时效性,客户存一笔钱需要几十秒是无法忍受的,这就要求数据库只能存储很短一段时间的数据。

而分析系统是事后的,它要提供关注时间段内所有的有效数据.这些数据是海量的,汇总计算起来也要慢一些,但是,只要能够提供有效的分析数据就达到目的了。

数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它决不是所谓的“大型数据库"。

那么,数据仓库与传统数据库比较,有哪些不同呢?让我们先看看W.H。

Inmon关于数据仓库的定义:面向主题的、集成的、与时间相关且不可修改的数据集合。

“面向主题的”:传统数据库主要是为应用程序进行数据处理,未必按照同一主题存储数据;数据仓库侧重于数据分析工作,是按照主题存储的。

这一点,类似于传统农贸市场与超市的区别—市场里面,白菜、萝卜、香菜会在一个摊位上,如果它们是一个小贩卖的;而超市里,白菜、萝卜、香菜则各自一块。

数据库系统原理练习题+答案

数据库系统原理练习题+答案

数据库系统原理练习题+答案一、单选题(共100题,每题1分,共100分)1、下列不属于数据定义语言包括的SQL语句的是A、DELETEB、ALTERC、CREATED、DROP正确答案:A2、下列关于MySQL的说法中,错误的是A、MySQL是一个RDBMSB、MySQL具有客户/服务器体系结构C、MySQL 由美国MySQL AB公司开发D、许多中、小型网站为了降低网站总体拥有成本而选择MySQL作为网站数据库正确答案:C3、下列关于存储函数与存储过程的说法中,错误的是A、存储过程可以拥有输出参数B、可以直接对存储函数进行调用,且不需要使用CALL语句C、存储过程中必须包含一条RETURN语句D、对存储过程的调用,需要使用CALL语句正确答案:C4、数据库设计的重要目标包括A、研究构造数据库B、良好的数据库性能C、数据库行为设计D、数据库结构设计正确答案:B5、在图存储数据库中,【】保存与结点相关的信息。

A、结点B、属性C、边D、联系正确答案:B6、主要反映应用部门原始业务处理的工作流程的是A、数据流程图B、数据操作特征表C、操作过程说明书D、任务分类表正确答案:A7、MySQL的用户账号及相关信息都存储在一个名为【】的MySQL数据库中。

A、rootB、mysqlC、adminD、user正确答案:B8、数据库管理系统是计算机的A、数据库系统B、数据库C、应用软件D、系统软件正确答案:D9、在图存储数据库中,【】用来连接结点。

A、属性B、边C、结点D、联系正确答案:B10、将数据库系统与现实世界进行密切地、有机地、协调一致地结合的过程是A、数据库设计的内容B、数据库设计方法C、数据库生命周期D、数据库设计正确答案:D11、控制数据在一定的范围内有效或要求数据之间满足一定的关系,保证输入到数据库中的数据满足相应的约束条件,以确保数据有效、正确是指A、故障恢复B、并发控制C、数据安全性D、数据完整性正确答案:D12、属于数据库结构设计阶段的是A、程序设计B、逻辑结构设计C、功能设计D、事务设计正确答案:B13、属于数据库实现与操作阶段的是A、概念设计B、数据库的修改与调整C、逻辑设计D、物理设计正确答案:B14、使用存储过程的好处不包括A、高性能B、存储过程可作为一种安全机制来确保数据库的安全性C、良好的封装性D、可增加网络流量正确答案:D15、使用存储过程的好处不包括A、可增强SQL语言的功能和灵活性B、移植性好C、存储过程可作为一种安全机制来确保数据的完整性D、良好的封装性正确答案:B16、下列不属于数据库系统三级模式结构的是A、内模式B、模式C、外模式D、数据模式正确答案:D17、在多表连接查询的连接类型中,最常用的是A、左连接B、内连接C、右连接D、交叉连接正确答案:B18、数据库的核心是A、概念模式B、内部模式C、外部模式D、存储模式正确答案:A19、表中的行,也称作A、分量B、属性C、超码D、记录正确答案:D20、同一数据被反复存储的情况是A、插入异常B、数据冗余C、更新异常D、删除异常正确答案:B21、SQL提供了【】进行数据查询,该功能强大、使用灵活。

2022年西安电子科技大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A(有答案)

2022年西安电子科技大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A(有答案)

2022年西安电子科技大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A(有答案)一、填空题1、数据仓库创建后,首先从______中抽取所需要的数据到数据准备区,在数据准备区中经过净化处理______,再加载到数据仓库中,最后根据用户的需求将数据发布到______。

2、在设计局部E-R图时,由于各个子系统分别有不同的应用,而且往往是由不同的设计人员设计,所以各个局部E-R图之间难免有不一致的地方,称为冲突。

这些冲突主要有______、______和______3类。

3、从外部视图到子模式的数据结构的转换是由______________实现;模式与子模式之间的映象是由______________实现;存储模式与数据物理组织之间的映象是由______________实现。

4、若事务T对数据对象A加了S锁,则其他事务只能对数据A再加______,不能加______,直到事务T释放A上的锁。

5、事务故障、系统故障的恢复是由______完成的,介质故障是由______完成的。

6、使某个事务永远处于等待状态,得不到执行的现象称为______。

有两个或两个以上的事务处于等待状态,每个事务都在等待其中另一个事务解除封锁,它才能继续下去,结果任何一个事务都无法执行,这种现象称为______。

7、主题在数据仓库中由一系列实现。

一个主题之下表的划分可按______、______数据所属时间段进行划分,主题在数据仓库中可用______方式进行存储,如果主题存储量大,为了提高处理效率可采用______方式进行存储。

8、在数据库系统封锁协议中,一级协议:“事务在修改数据A前必须先对其加X锁,直到事务结束才释放X锁”,该协议可以防止______;二级协议是在一级协议的基础上加上“事务T在读数据R之前必须先对其加S锁,读完后即可释放S锁”,该协议可以防止______;三级协议是在一级协议的基础上加上“事务T在读数据R之前必须先对其加S锁,直到事务结束后才释放S 锁”,该协议可以防止______。

2022年华北水利水电大学计算机科学与技术专业《数据库原理》科目期末试卷B(有答案)

2022年华北水利水电大学计算机科学与技术专业《数据库原理》科目期末试卷B(有答案)

2022年华北水利水电大学计算机科学与技术专业《数据库原理》科目期末试卷B(有答案)一、填空题1、在一个关系R中,若每个数据项都是不可再分割的,那么R一定属于______。

2、设某数据库中有作者表(作者号,城市)和出版商表(出版商号,城市),请补全如下查询语句,使该查询语句能查询作者和出版商所在的全部不重复的城市。

SELECT城市FROM作者表_____SELECT城市FROM出版商表;3、设有关系模式R(A,B,C)和S(E,A,F),若R.A是R的主码,S.A是S的外码,则S.A的值或者等于R中某个元组的主码值,或者______取空值,这是规则,它是通过______和______约束来实现的。

4、在数据库系统封锁协议中,一级协议:“事务在修改数据A前必须先对其加X锁,直到事务结束才释放X锁”,该协议可以防止______;二级协议是在一级协议的基础上加上“事务T在读数据R之前必须先对其加S锁,读完后即可释放S锁”,该协议可以防止______;三级协议是在一级协议的基础上加上“事务T在读数据R之前必须先对其加S锁,直到事务结束后才释放S 锁”,该协议可以防止______。

5、关系模型由______________、______________和______________组成。

6、数据模型是由______________、______________和______________三部分组成。

7、关系规范化的目的是______。

8、DBMS的完整性控制机制应具备三个功能:定义功能,即______;检查功能,即______;最后若发现用户的操作请求使数据违背了完整性约束条件,则采取一定的动作来保证数据的完整性。

9、数据仓库是______、______、______、______的数据集合,支持管理的决策过程。

10、如果多个事务依次执行,则称事务是执行______;如果利用分时的方法,同时处理多个事务,则称事务是执行______。

全国计算机等级考试上机考试题库三级数据库技术9

全国计算机等级考试上机考试题库三级数据库技术9

第9套新增真考试题一、单选题((1)~(20)每题1分,(21)~(30)每题2分,共40分)1.下列不属于数据库应用系统物理设计阶段活动的是()。

A)数据库物理结构设计B)数据库事务详细设计C)应用程序详细设计D)数据库备份与恢复设计2.在一个ER图中,包含三个实体集,两个二元一对多联系,两个二元多对多联系,则将该ER图转化为关系模型后,得到的关系模式个数是()。

A)4个B)5个C)6个D)7个3.DFD建模方法由四种基本元素组成,其中用来描述数据的提供者或使用者的是()。

A)数据流B)处理C)数据存储D)外部项4.从功能角度数据库应用系统可以划分为四个层次,其中负责与DBMS交互以获取应用系统所需数据的是()。

A)表示层B)业务逻辑层C)数据访问层D)数据持久层5.现有商品表(商品号,商品名,商品价格,商品描述),销售表(顾客号,商品号,销售数量,销售日期)。

关于性能优化有以下做法:Ⅰ.因为很少用到商品描述属性,可以将其单独存储Ⅱ.因为经常按照商品名查询商品的销售数量,可以在销售表中添加商品名属性Ⅲ.因为经常执行商品表和销售表之间的连接操作,可以将它们组织成聚集文件Ⅳ.因为经常按照商品号对销售表执行分组操作,可以将销售表组织成散列文件以上做法中,正确的是()。

A)仅Ⅰ和Ⅱ和ⅢB)仅Ⅰ、Ⅱ和ⅣC)仅Ⅱ、Ⅲ和ⅣD)全部都是6.已知有关系:学生(学号,姓名,年龄),对该关系有如下查询操作:SELECT学号FROM学生WHERE姓名LIKE′张%′AND年龄!=15为了加快该查询的执行效率,应该()。

A)在学号列上建索引B)在姓名列上建索引C)在年龄列上建索引D)在学号和年龄列上建索引7.已知有关系R(A,B,C),其中A是主码,现有如下创建索引的SQL 语句:CREATE CLUSTERED INDEX idx1 ONR(B)则下列说法中正确的是()。

A)idx1既是聚集索引,也是主索引B)idx1是聚集索引,但不是主索引C)idx1是主索引,但不是聚集索引D)idx1既不是聚集索引,也不是主索引8.在完成数据库的物理设计之后,就进入数据库系统的实施阶段。

2022年重庆大学软件工程专业《数据库原理》科目期末试卷B(有答案)

2022年重庆大学软件工程专业《数据库原理》科目期末试卷B(有答案)

2022年重庆大学软件工程专业《数据库原理》科目期末试卷B(有答案)一、填空题1、数据管理技术经历了______________、______________和______________3个阶段。

2、数据库系统是利用存储在外存上其他地方的______来重建被破坏的数据库。

方法主要有两种:______和______。

3、事务故障、系统故障的恢复是由______完成的,介质故障是由______完成的。

4、在SQL Server 2000中,新建了一个SQL Server身份验证模式的登录账户LOG,现希望LOG在数据库服务器上具有全部的操作权限,下述语句是为LOG授权的语句,请补全该语句。

EXEC sp_addsrvrolemember‘LOG’,_____;5、DBMS的完整性控制机制应具备三个功能:定义功能,即______;检查功能,即______;最后若发现用户的操作请求使数据违背了完整性约束条件,则采取一定的动作来保证数据的完整性。

6、SQL语言的数据定义功能包括______、______、______和______。

7、在VB 6.0中,已经用Adobel连接到数据库,并已绑定到数据库中的某个关系表,现要通过此控件向表中插入数据,需要用到Adobel.Recordset的_____方法和Update方法,使用Adobel.Recordset的_____方法可以使当前行指针在结果集中向前移动一行。

8、在RDBMS中,通过某种代价模型计算各种查询的执行代价。

在集中式数据库中,查询的执行开销主要包括______和______代价。

在多用户数据库中,还应考虑查询的内存代价开销。

9、设在SQL Server 2000环境下,对“销售数据库”进行的备份操作序列如下图所示。

①出现故障后,为尽可能减少数据丢失,需要利用备份数据进行恢复。

首先应该进行的恢复操作是恢复_____,第二个应该进行的恢复操作是恢复_____。

【企业管理信息系统】多选题(含答案)

【企业管理信息系统】多选题(含答案)

【企业管理信息系统】多选题(含答案)1、信息的要素包括OOA信道B.信源C.信宿D.信号E.媒介正确答案:A,B,C,E信息主要由信源、语言、载体、信道、信宿和媒介构成。

2、系统的构成必须具有以下哪三个条件OOA.必须由动态的组成成分构成B.必须有两个以上的组成成分C.两个以上的组成成分相互联系、相互制约D.必须有人的参与E.整体是具有特定功能的有机整体正确答案:B,C,E有两个以上的组成成分;两个以上组成成分相互联系、相互制约;整体是具有特定功能的有机整体。

3、根据系统组成的要素和功能,可以将系统分为以下类型OOA.人工系统B.自然系统C.复杂系统D.复合系统E.单一系统正确答案:A,B,D根据系统组成的要素和功能,可以将系统分为:人工系统、自然系统、复合系统。

4、从概念来看,管理信息系统由哪四大部分组成OOA.信息源B.信息使用者C.信息干扰源D信息处理器E.信息管理者正确答案:A,B,D,E从概念来看,管理信息系统由信息源、信息使用者、信息处理器、信息管理者四大部分组成。

5、系统的要素包括OOA.输入B.处理C.输出D.控制E.反馈正确答案:A,B,C,D,E系统的要素包括输入、处理、输出、控制、反馈。

6、按照结构化的思想,系统开发的生命周期可划分为OOA.总体规划B.系统分析C.系统设计D.系统实施E.运行维护正确答案:A,B,C,D,E按照结构化的思想,系统开发的生命周期可划分为:总体规划、系统分析、系统设计、系统实施、运行维护。

7、面向对象方法的特点是OA.具有抽象性B.具有封装性C.具有继承性D.间接反映了人们对客观世界的认知模式E.在设计中容易与用户沟通正确答案:A,B,C,E面向对象方法的特点是:具有抽象性、具有封装性、具有继承性、在设计中容易与用户沟通。

8、原型法的特点是OA.具有突破性,更好地满足客户的要求B.提高了用户的满意程度,更加贴近实际C.改进用户和系统开发人员的交流方式D.降低开发风险E.一定程度上减少了开发成本正确答案:A,B,C,D,E原型法的特点是:具有突破性,更好地满足客户的要求;提高了用户的满意程度,更加贴近实际;改进用户和系统开发人员的交流方式;降低开发风险;一定程度上减少了开发成本。

数据仓库中的数据及组织概述

数据仓库中的数据及组织概述
描整个数据库。
30
3.1 数据仓库中的数据组织 3.2 数据仓库中数据的追加 3.3 数据仓库中的元数据
31
3.3数据仓库中的元数据
❖ 传统数据库中为了说明数据引入了数据字典的概念。 ❖ 数据字典是描述数据的数据。
32
3.3.1元数据的定义
❖ 元数据:是用来描述数据的数据。它描述和定位数 据组件、它们的来源及它们在数据仓库进程中的活 动;关于数据和操作的相关描述(输入、计算和输 出)。
33
3.3.1元数据的定义
❖ 其主要目标是提供数据资源的全面指南,使得数据 仓库管理员和开发人员可以方便地了解数据仓库中 有什么数据?数据在什么地方?它们来源于哪里, 以及数据仓库系统中是如何利用这些数据?如何管 理这些数据?
34
3.3.1元数据的定义
❖ 与元数据产生、存储有关的工具: ❖ 数据抽取工具:完成ETL操作。 ❖ 前端展现工具:实现把关系表映射成与业务相关的
每种商品每一天的销售数据。 ❖ 高度综合数据:记录每个顾客每月或每年的购物金
额,或每种商品每月或每年的销售数据。
16
1)数据粒度
❖ 数据粒度的确定是业务分析、硬件、软件的一个折中。 ❖ 在数据仓库中多重粒度是必不可少的
17
1)数据粒度
❖ 数据粒度是数据仓库的重要概念。存在两种形式, 形式二: ❖ 样本数据库,其粒度是根据采样率的高低来划分的。 ❖ 盖洛普民意测验是一种观点的民意测验,其特点是用简
40
1)MDC的OIM标准
❖ OIM标准的目的 ❖ 通过公共的元数据信息来支持不同工具和系统之间
数据的共享和重用。 ❖ 它涉及信息系统的各个阶段。 ❖ 采用UML描述。
41
2)OMG组织的CWM标准

2022年哈尔滨师范大学计算机科学与技术专业《数据库原理》科目期末试卷A(有答案)

2022年哈尔滨师范大学计算机科学与技术专业《数据库原理》科目期末试卷A(有答案)

2022年哈尔滨师范大学计算机科学与技术专业《数据库原理》科目期末试卷A(有答案)一、填空题1、设在SQL Server 2000环境下,对“销售数据库”进行的备份操作序列如下图所示。

①出现故障后,为尽可能减少数据丢失,需要利用备份数据进行恢复。

首先应该进行的恢复操作是恢复_____,第二个应该进行的恢复操作是恢复_____。

②假设这些备份操作均是在BK设备上完成的,并且该备份设备只用于这些备份操作,请补全下述恢复数据库完全备份的语句RESTORE_____FROM BKWITH FILE=1,_____;2、数据库内的数据是______的,只要有业务发生,数据就会更新,而数据仓库则是______的历史数据,只能定期添加和刷新。

3、事务故障、系统故障的恢复是由______完成的,介质故障是由______完成的。

4、对于非规范化的模式,经过转变为1NF,______,将1NF经过转变为2NF,______,将2NF经过转变为3NF______。

5、从外部视图到子模式的数据结构的转换是由______________实现;模式与子模式之间的映象是由______________实现;存储模式与数据物理组织之间的映象是由______________实现。

6、采用关系模型的逻辑结构设计的任务是将E-R图转换成一组______,并进行______处理。

7、主题在数据仓库中由一系列实现。

一个主题之下表的划分可按______、______数据所属时间段进行划分,主题在数据仓库中可用______方式进行存储,如果主题存储量大,为了提高处理效率可采用______方式进行存储。

8、设某数据库中有作者表(作者号,城市)和出版商表(出版商号,城市),请补全如下查询语句,使该查询语句能查询作者和出版商所在的全部不重复的城市。

SELECT城市FROM作者表_____SELECT城市FROM出版商表;9、数据的安全性是指____________。

2022年柳州工学院计算机科学与技术专业《数据库原理》科目期末试卷A(有答案)

2022年柳州工学院计算机科学与技术专业《数据库原理》科目期末试卷A(有答案)

2022年柳州工学院计算机科学与技术专业《数据库原理》科目期末试卷A(有答案)一、填空题1、从外部视图到子模式的数据结构的转换是由______________实现;模式与子模式之间的映象是由______________实现;存储模式与数据物理组织之间的映象是由______________实现。

2、安全性控制的一般方法有____________、____________、____________、和____________视图的保护五级安全措施。

3、以子模式为框架的数据库是______________;以模式为框架的数据库是______________;以物理模式为框架的数据库是______________。

4、在SQL Server 2000中,数据页的大小是8KB。

某数据库表有1000行数据,每行需要5000字节空间,则此数据库表需要占用的数据页数为_____页。

5、完整性约束条件作用的对象有属性、______和______三种。

6、视图是一个虚表,它是从______导出的表。

在数据库中,只存放视图的______,不存放视图对应的______。

7、数据库系统是利用存储在外存上其他地方的______来重建被破坏的数据库。

方法主要有两种:______和______。

8、数据库系统在运行过程中,可能会发生各种故障,其故障对数据库的影响总结起来有两类:______和______。

9、数据管理技术经历了______________、______________和______________3个阶段。

10、已知系(系编号,系名称,系主任,电话,地点)和学生(学号,姓名,性别,入学日期,专业,系编号)两个关系,系关系的主码是______________,系关系的外码是______________,学生关系的主码是______________,外码是______________。

二、判断题11、在关系运算中,投影是最耗时的操作。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据仓库设计的21条原则:7个步骤,7个禁忌和7种思路(转)高效实现数据仓库的七个步骤数据仓库和我们常见的RDBMS系统有些亲缘关系,但它又有所不同。

如果你没有实施过数据仓库,那么从设定目标到给出设计,从创建数据结构到编写数据分析程序,再到面对挑剔的用户的评估,整个过程都会带给你一种与以往的项目完全不同的体验。

一句话,如果你试图以旧有的方式创建数据仓库,那你所面对的不是预算超支就是所建立的数据仓库无法良好运作。

在处理一个数据仓库项目时需要注意的问题很多,但同时也有很多有建设性的参考可以帮助你更顺利的完成任务。

开放思维,不断尝试新的途径,对于找到一种可行的数据仓库实现方法来说也是必需的。

1. 配备一个全职的项目经理或你自己全面负责项目管理在通常情况下,项目经理都会同时负责多个项目的实施。

这么做完全是出于资金和IT资源方面的考虑。

但是对于数据仓库项目的管理,绝对不能出现一人身兼数个项目的情况。

由于你所处的领域是你和你的团队之前没有进入过的领域,有关数据仓库的一切-数据分析、设计、编程、测试、修改、维护-全都是崭新的,因此你或者你指派的项目经理如果能全心投入,对于项目的成功会有很大帮助。

2. 将项目管理职责推给别的项目经理由于数据仓库实现过程实在是太困难了,为了避免自虐,你可以在当前阶段的项目完成后就将项目管理职责推给别的项目经理。

当然,这个新的项目经理一定要复合第一条所说的具有全职性。

为什么要这么做呢?首先,从项目经理的角度看,数据仓库实施过程的任何一个阶段都足以让人身心疲惫。

从物理存储设备的开发到Extract-Transform-Load的实现,从设计开发模型到OLAP,所有阶段都明显的比以前接触的项目更加困难。

每个阶段不但需要新的处理方法、新的管理方法,还需要创新性的观点。

所以将管理职责推给别的项目经理不但不会对项目有损害,还可以起到帮助作用。

3.与用户进行沟通这里所讲的内容远比一篇文章本身要重要的多。

你必须明白,在数据仓库的设计阶段,那些潜在用户自己也不清楚他们到底需要数据仓库为他们做什么。

他们在不断的探索和发现自己的需求,而你的开发团队也在和客户的接触中做着同样的事情。

更加频繁的与客户接触,多做记录,并让你的团队更关注于项目需求讨论的结果而不是讨论的过程本身。

既然你和客户的交流是为了了解存储的数据是何种类型以及如何有效存储数据,你也许需要(和你的用户一起)采用一种新的方法观察数据,而不是直接处理数据。

你可以尝试从中找出隐藏的信息,比如在一段时期内的数字涨落等。

不要试图追寻项目需求的答案,而是要让答案找上门来。

4. 以技术/信息库作为领导由于数据仓库实施的各个阶段都有很大不同,因此你需要有人能起到维持整个项目的连续进行的作用,不过这个职责并不需要那种全职性。

项目实施有三个重要方面:架构、技术和业务。

将架构作为重点可以保证在整个项目中,数据仓库的架构从物理层往上,都会受到良好的维护。

而我们应该将技术作为重点,因为开发团队和关键用户都在使用他们以前从未用过的工具,必须有人监督开发过程以及工具使用的一致性。

最后,在数据仓库的应用过程中浮现出来的业务需求必须被详细分析和记录,以促机开发过程持续下去。

如果用户不能很好的与开发人员以及其它用户沟通,那么数据分析和度量方面的开发进程就会延期,所以必须有人关注业务方面的开发,推动开发进入更高级别。

5. 跳出反复修改程序的陷阱第一次实现的数据仓库肯定不会是最终交付的版本。

为什么呢?实际上在真正见到产品前,你无法确定的知道自己的目标是什么。

或者说,最终用户只有在使用数据仓库产品一段时间后,才能明确告诉你这个产品是不是他所希望的。

与你以往处理的项目不同,业务智能还处于发展的初期,每个公司对业务智能都有不同的解释,因此你的项目决不会一次成功。

为了以正确的格式获得数据,你需要在不断变化的状况中摸索前进。

BI具有很强的个性,不同的环境、不同的市场以及不同的企业都有不同的BI。

这又代表什么呢?这表示你需要把数据库管理员放在一个消息相对封闭的环境中,不要让他知道数据仓库的数据结构以及ETL程序在不断的改变。

对此没有别的办法。

这样可以减轻你和DBA所承受的压力。

6. 对大量的前端资源进行数据源分析在数据仓库实现过程中,你不得不在旧有的数据中艰难跋涉,这些数据来自老的数据库、老的磁带机以及远程的数据。

它们中的大部分都凌乱不堪,并且难以获取。

你要对这些数据进行大量处理,并且还要设计ETL程序来寻找其中的有用信息。

如果你希望整个项目做起来比较顺利,并且找到一种方法能够一次成功,那就需要你的开发人员必须花费足够的时间来充分研究这些旧有数据,将凌乱的数据规则化,并尽力设计和实现强壮的数据采集和转换过程。

数据仓库的ETL部分会占用整个项目资源的百分之八十,所以一定要确定你的资源都用在刀刃上了。

7. 将人际关系处理放在首位在数据仓库实现过程中真正的地狱不是来自技术或者开发方面,而是来自你周围的人。

你也许会遇到一个对项目并不乐观而又没时间听你陈述的领导。

你也许会遇到一些开发人员将进度拖延太长时间还抱怨为什么不能用老方法实施。

你也许还会遇到一些抱有不切实际的幻想的用户,他们希望轻点鼠标就能实现想象中的功能,但却不愿在他们那边多做些智力投资,更好的培训他们自己的员工。

而你也已经疲惫不堪,鼓励投资,以及在开发团队和用户(甚至老板)中推广新的开发技巧。

总之你要保持微笑。

当一切搞定,你的烦恼也就一扫而空了,笑到最后才笑得最轻松。

数据仓库开发过程中的七个禁忌过去我们一直使用的OLTP技术也许隐藏着许多严重的缺陷。

数据仓库的实现并不是一个简单的任务,你会发现以前积累下来的丰富经验,并不适合处理每个数据仓库的独特需求。

下面列出的条款是你在实现数据仓库过程中一定会面对的问题,其中一些看起来并没有想象中那么严重,但是你还是应该尽量避免出现类似问题。

数据仓库并不是一个事务处理系统,它没有一定的标准也不会实现某个特定的应用,但它本质上是非常有组织性的。

总之,每个公司所建立的数据仓库都是唯一的,并且每一次数据仓库的实现方法都不是一成不变的。

在实现数据仓库时需要注意的不单是"应该如何作",更要注意"不该如何做"。

下面就是我们总结的七点"不该如何作"。

1.不要编写自己无法快速修改的代码你所要编写的程序主要用于数据分析,而不是处理事务。

而你的用户也并不真正知道他们自己真正想要一个什么样的程序。

因此你不得不反复修改代码好几次,才会明白用户到底需要一个什么样的程序。

如果你编写的程序具有良好的结构和灵活性,就算需要修改也不会太浪费力气。

反之,你会被自己累死。

2. 不要使用无法修改的数据库访问API在过去,你的数据库可以为大量的客户提供稳定的数据查询服务。

而如今,你的程序必须能够应付更多的数据查询。

这使得重新改写程序以使得每个查询请求能得到最大的数据量成为势在必行的工作,而一般来说这种代码修改都不会一次成功,所以只有选择合适的可以修改的API,才能使程序尽快适应新的需求。

3. 不要设计任何无法扩展的东西在联机处理过程(OLTP)应用中,数据分析并不是一个真正的应用程序。

实际上,数据分析的关键是获取大量旧的数据,从中提取数据模型,并以此模型推断出新的信息。

而你所编写的访问潜在信息的代码应该具有可扩展性,可以附加新的数据。

千万别在支持数据分析的代码中假定数据都是固定格式的。

4. 不要附加不必要的功能一个仓库要做的是恰到好处的服务,用户走进仓库,从货架上取得自己所需得信息,仅此而已。

由于业务智能、分析以及规律性的问题都有各自的处理程序,因此你的客户唯一的需要就是获取信息。

他们需要一种应用环境,可以让他们快速的从数据仓库中取得分析过程所需的数据,而不论这个数据是什么样子的。

也许你想帮助他们精炼一下获得的数据,但最好不要这么做。

一定要记住,不要给客户的数据分析程序添加任何会影响数据访问性能的功能。

5. 不要简化数据清除和数据源分析的步骤在实现数据仓库过程中最应该注意的地方就是为Extract-Transform-Load机制分析数据源,以及为优化负载而清除数据。

安全的做法是假设项目经理在这个阶段会需要整个项目资源的一半以上。

相反,如果你在这方面进行了简化,稍后肯定会后悔。

所以就算系统工作缓慢,也不要简化清理旧的数据的过程。

6. 不要避免颗粒度和分区问题在数据仓库设计过程中有两个最大的数据存储问题,第一是如何给转换数据定位一个恰当的颗粒度等级,第二是如何将数据绝对的分区。

为什么这两点问题如此重要呢?因为整个数据仓库的响应能力受颗粒度影响,并且数据访问的效率直接与数据分区性能有关。

因此这是具有关键性的工作,不要试图避免面对这些问题。

7. 不要在没考虑业务问题前就使用OLAP用户在亲眼见到程序前通常都不知道自己到底想要个什么样的程序。

因此他们的观点有不少错误,比如他们希望分析结果会忠实反应性能度量,或者希望程序会使他们部门或公司的业务工作有所不同。

而你必须跳出自己的职责范围,从IT管理者的角度考虑用户部门直至整个企业的运行方式,才能在开发过程中避免这类问题。

在通常的OLTP开发中,你可以比较方便的理解业务流程。

而在联机分析处理(OLAP)领域,任何事情都需要亲自考察,而在你周围工作的人也许并不会发现你对业务方面存在的误解。

因此,不要自以为已经了解了足够的信息。

不断的询问才能使你真正了解"业务智能"中的"业务"到底是什么样子的顺利开发数据仓库的七种思路对于大多数IT顾问来说,实现一个数据仓库的难度比以前做过的任何项目难度都要大。

考虑到不同的数据结构、用途以及应用程序开发方法,以前所积累的经验和技巧大部分都无用武之地了。

但是只要在你的前进道路上稍加修正,你就会发现实现一个数据仓库并不是难事,就算你是第一次实现数据仓库也没问题。

下面列出了数据仓库实施过程需要考虑的步骤,有一些你可能从来没有意识到,而另一些可能已经在实施过程中使用到了,但是重新思考一番也许你会有更多的领悟。

开放思维,不断尝试新的途径,找到一种可行的数据仓库实现方法。

1. 再三考虑应用程序的实现方法数据仓库并不涉及事务处理,并且在报表方面也仅占一小部分。

而数据仓库应用程序的本质是分析,尤其是针对业务智能的分析。

BI并不是通常所说的数据:它是一种从旧有数据中,模型化得到的新的数据。

那么如何才能从旧有数据中挖出这些新数据呢?事实上,这个工作不是让你来完成的,而是你的客户所要完成的。

从项目主管的角度看,应该有一个经验丰富的数据表格设计师与你合作,进而决定如何将各类程序融合在一起。

其中所遇到的最主要的挑战将是如何用新的方法观察数据,这也是你的客户正在试图使用的方法。

相关文档
最新文档