数据仓库习题集

合集下载

数据库题库含参考答案

数据库题库含参考答案

数据库题库含参考答案一、单选题(共98题,每题1分,共98分)1.在数据库应用系统生命周期模型中,规划与分析阶段的输出结果不包括()。

A、项目计划书B、需求规范说明书C、可行性分析报告D、系统范围与边界正确答案:B2.下列哪些属性不适合建立索引?()。

A、经常岀现在GROUP BY子句中的属性B、经常参与连接操作的属性C、经常出现在WHERE子句中的属性D、经常需要进行更新操作的属性正确答案:D3.下列属于数据仓库特点的是()。

A、一次处理的数据量小B、综合性和提炼性数据C、面向操作人员,支持日常操作D、重复性的、可预测的处理正确答案:B4.下述哪一个SQL语句用于实现数据存取的安全机制()。

A、COMMITB、ROLLBACKC、GRANTD、CREATE TABLE正确答案:C5.有教师表(教师号,姓名,职称.所在系)和授课表(教师号,课程号,授课学年,授课时数),同一门课程可由多个教师讲授,同一个教师也可讲授多门课程,査询从未被“教授”讲授过的课程的课程号,正确的语句是()。

A、SELECT课程号FROM授课表a JOIN教师表bON a 教师号=b.教师号WHERE职称!='教授'B、SELECT课程号FROM授课表a RIGHTOUTTER JOIN教师表bONa.教师号=b.教师号C、SELECT课程号FROM授课表WHERE课程号NOT IN (SELECT课程号FROM授课表a JOIN授课表b ON a 教师号=b.教师号WHERE职称!='教授')D、SELECT课程号FROM授课表WHERE课程号IN (SELECT课程号FROM授课表a JOIN授课表b ON a 教师号=b.教师号WHERE职称!=,教授,)正确答案:D6.下列有关范式的叙述中正确的是()。

A、如果关系模式RG 1NF,且R中主属性完全函数依赖于码,则R是2NFB、如果关系模式RG3NF, X、YCU,若X—Y,则R是BCNFC、如果关系模式ReBCNF,若X一一Y (Y4X)是平凡的多值依赖,则R 是4NFD、—个关系模式如果属于4NF,则一定属于BCNF;反之不成立正确答案:D7.下列说法正确的是( )。

数据仓库概念习题与答案(商务智能)

数据仓库概念习题与答案(商务智能)

1、商务智能包括哪些核心技术?A.计算机技术B.数据挖掘C.数据仓库D.数据库正确答案:B、C2、将商务智能从一种想法变为企业实际应用的主要技术包括哪些?A.数据存储B.电子商务C.计算机软件D.计算机硬件正确答案:A、C、D3、数据和信息之间的关系正确的是一下哪些选项?A.数据是加工过的信息B.信息是数据C.数据和信息没有关系D.信息是加工过的数据正确答案:B、D4、设计数据库的目的是为了解决数据的存储和访问等基本问题,数据库在设计之初就要考虑满足以下操作。

A.大数据量访问B.批量数据读写C.多用户访问正确答案:C、D5、分析数据包括以下哪些内容?A.细节数据B.外部数据C.企业内部数据D.当前业务数据正确答案:A、B、C、D6、分析型数中有冗余是因为以下哪些原因?A.减少存储空间B.提高查询效率C.减少细节数据D.减少算计量正确答案:B、D7、在事务型处理环境下,操作具有以下哪些特点?A.响应时间短B.多是过程重复操作C.经常进行删除、增加、更新操作D.操作次数少正确答案:A、B、C8、数据仓库有哪些特点?A.数据随时间而变化B.面向主题C.数据不常改变正确答案:A、B、C、D9、以下说法哪些是正确的?A.服务于决策支持B.数据仓库建设有明确的起、止时间C.数据仓库是一个数据集合D.数据仓库建设是一个过程正确答案:A、C、D10、数据集成主要完成以下哪些工作?A.模型设计B.数据转换C.消除数据冲突D.多数据源数据抽取正确答案:B、C、D二、判断题1、管理就是决策,决策是企业管理的核心。

正确答案:对2、分析数据来自于某一个指定的业务数据库,并通过批量读取的方式写入数据仓库。

正确答案:错3、数据越详细具体包含的信息也就越多,因此,分析型数据应该是明细数据。

正确答案:错4、当前的数据才能代表最新的信息,因此,分析型数据应该是当前数据而不是历史数据。

正确答案:错5、在数据库设计时使用范式约减的目的是为了:防止出现数据的更新、查找、删除异常,同时减少数据的冗余。

数据库习题与答案

数据库习题与答案

数据库习题与答案一、选择题1、以下哪个不是数据库的特征?A.共享性B.安全性C.完整性D.随意性答案:D.随意性解释:数据库具有共享性、安全性、完整性等特征,但随意性并不是数据库的特征。

2、下列哪个是关系型数据库的优点?A.易于使用和管理B.支持复杂查询C.可以存储大量数据D.以上都是答案:D.以上都是解释:关系型数据库具有易于使用和管理、支持复杂查询、可以存储大量数据等优点。

3、SQL是下列哪个数据库系统的标准语言?A. OracleB. MySQLC. SQL ServerD. DB2答案:A. Oracle解释:SQL是Oracle数据库系统的标准语言。

4、下列哪个是数据库系统的组成部分?A.数据库B.操作系统C.应用程序D.以上都是答案:D.以上都是解释:数据库系统由数据库、操作系统、应用程序等组成。

5、下列哪个是对数据库系统的正确描述?A.数据库系统可以取代文件系统B.数据库系统与文件系统完全不同C.数据库系统是一个层次结构D.数据库系统是一个客户-服务器结构答案:D.数据库系统是一个客户-服务器结构解释:数据库系统是一个客户-服务器结构,它由多个组成部分组成,包括数据库、操作系统、应用程序等。

与文件系统相比,数据库系统可以提供更高效、更可靠的数据存储和管理。

二、填空题1、________是指数据的结构化程度。

关系型数据库中的数据是按照__________组织的。

答案:数据结构化;表格形式解释:数据的结构化程度是指数据之间关系的清晰程度和组织方式。

在关系型数据库中,数据是按照表格形式组织的,每个表格由行和列组成,行表示记录,列表示字段。

2、SQL语言中,可以使用_________关键字来创建一个新的表格。

____________用于向表格中插入数据。

答案:CREATE TABLE;INSERT INTO解释:在SQL语言中,可以使用CREATE TABLE关键字来创建一个新的表格。

INSERT INTO用于向表格中插入数据。

数据库习题(含参考答案)

数据库习题(含参考答案)

数据库习题(含参考答案)习题1一、问答题1. 什么是数据?数据有什么特征?数据和信息有什么关系?答:答:数据是用于载荷信息的物理符号。

数据的特征是:①数据有“型”和“值’之分;②数据受数据类型和取值范围的约束;③数据有定性表示和定量表示之分;④数据应具有载体和多种表现形式。

数据与信息的关系为:数据是信息的一种表现形式,数据通过能书写的信息编码表示信息。

信息有多种表现形式,它通过手势、眼神、声音或图形等方式表达,但是数据是信息的最佳表现形式。

由于数据能够书写,因而它能够被记录、存储和处理,从中挖掘出更深层的信息。

但是,数据不等于信息,数据只是信息表达方式中的一种。

正确的数据可表达信息,而虚假、错误的数据所表达的是谬误,不是信息。

2. 什么是数据库?数据库中的数据有什么特点。

答:答:数据库是数据管理的新方法和技术,它是一个按数据结构来存储和管理数据的计算机软件系统。

数据库中的数据具有的特点是:①数据库中的数据具有数据整体性,即数据库中的数据要保持自身完整的数据结构;②数据库中的数据具有数据共享性,不同的用户可以按各自的用法使用数据库中的数据,多个用户可以同时共享数据库中的数据资源。

3. 什么是数据库管理系统?它的主要功能是什么?答:答:数据库管理系统简称DBMS(Database Management System),它是专门用于管理数据库的计算机系统软件。

数据库管理系统能够为数据库提供数据的定义、建立、维护、查询和统计等操作功能,并完成对数据完整性、安全性进行控制的功能。

数据库管理系统的主要功能是数据存储、数据操作和数据控制功能。

其数据存储和数据操作是:数据库的定义功能,指为说明库中的数据情况而进行的建立数据库结构的操作;数据库建立功能,指将大批数据录入到数据库的操作,它使得库中含有需要保存的数据记录;数据库维护功能,指对数据的插入、删除和修改操作,其操作能满足库中信息变化或更新的需求;数据查询和统计功能,指通过对数据库的访问,为实际应用提供需要的数据。

数据库系统原理练习题库(附参考答案)

数据库系统原理练习题库(附参考答案)

数据库系统原理练习题库(附参考答案)一、单选题(共100题,每题1分,共100分)1.属于数据库结构设计阶段的是A、程序设计B、功能设计C、事务设计D、逻辑结构设计正确答案:D2.人工管理阶段,计算机主要应用于A、数据集成B、科学计算C、过程控制D、故障恢复正确答案:B3.下列关于数据控制语言的说法中,正确的是A、REVOKE语句用于授予权限B、GRANT语句用于收回权限C、数据控制语言主要用于数据执行流程管理D、数据控制语言包括的主要SQL语句是GRANT和REVOKE正确答案:D4.下列属于关联分析算法的是A、AprioriB、GMMC、RedisD、HBase正确答案:A5.同一数据被反复存储的情况是A、删除异常B、插入异常C、更新异常D、数据冗余正确答案:D6.产生数据不一致的主要原因是并发操作破坏了事务的A、持续性B、一致性C、原子性D、隔离性正确答案:D7.DBMS提供【】来严格地定义模式。

A、模式描述语言B、子模式描述语言C、内模式描述语言D、程序设计语言正确答案:A8.关系数据库以【】作为数据的逻辑模型。

A、二维表B、关系C、关系模型D、数据库正确答案:C9.关于调用存储过程的说法,错误的是A、可以从交互式界面调用B、可以使用CALL语句来调用存储过程C、可以由嵌入式SQL调用D、不是所有的SQL接口都能调用存储过程正确答案:D10.可唯一标识实体的属性集称为A、键B、实体型C、域D、属性正确答案:A11.目的是为可实际运行的应用程序设计提供依据与指导,并作为设计评价的基础的是A、设计评价B、编制应用程序设计说明C、模型转换D、子模式设计正确答案:B12.在使用游标的过程中,需要注意的事项不包括A、游标不能单独在查询操作中使用B、在一个BEGIN···END语句块中每一个游标的名字并不是唯一的C、游标是被SELECT语句检索出来的结果集D、在存储过程或存储函数中可以定义多个游标正确答案:B13.对关系的描述不正确的是A、关系中的元组次序可交换B、关系可以嵌套定义C、关系是一张二维表D、关系是一个集合正确答案:B14.下列关于MySQL的说法中,正确的是A、在MySQL中,一个关系对应多个基本表B、在MySQL中,一个或多个基本表对应一个存储文件C、在MySQL中,一个表只能有一个索引D、在MySQL中,索引不能存放在存储文件中正确答案:B15.关系数据库是以【】的形式组织数据。

数据库设计综合练习题及答案

数据库设计综合练习题及答案

(3). 有若干比赛项目,包括:项目号,名称,比赛地点 (4). 每名运动员可参加多项比赛,每个项目可有多人参加 (5). 要求能够公布每个比赛项目的运动员名次与成绩 解题要求:
(1)请根据以上描述,绘制相应的 E-R 图,并直接在
E-R 图上注明实体名、属性、联系
类型;
(2)将 E-R 图转换成关系模型,画出相应的数据库模型图,并说明主键和外键。
聘用
聘期
N N 司机
牌照号
厂家
出厂日期
司机编号
姓名
电话
使用日期
公里数
(2)转换成的关系模型应具有 4 个关系模式:
车队(车队号,车队名) 车辆(牌照号,厂家,生产日期,车队号) 司机(司机编号,姓名,电话,车队号,聘用开始时间,聘期) 使用(司机编号,牌照号,使用日期,公里数)
相应的数据库模型图为:
车队与车辆之间存在“拥有”联系,每个车队可拥有若干车辆,但每辆车只能属于一个 车队;
司机与车辆之间存在着“使用”联系,司机使用车辆有“使用日期”和“公里数”两个 属性,每个司机可使用多辆汽车,每辆汽车可被多个司机使用。
(1)请根据以上描述,绘制相应的 E-R 图,并直接在 E-R 图上注明实体名、属性、联系 类型;
模式都是 3NF 模式。
因此,R 分解成 3NF关系模式集时, R={ R11,R12,R2 } 。
4、综合设计题 设有学生运动会模型:
(1). 有若干班级,每个班级包括: 班级号,班级名,专业号,专业名,人数 (2). 每个班级有若干运动员,运动员只能属于一个班,包括 : 运动员编号,姓名,性别,年 龄
商店与商品之间存在着“销售”联系,每个商店可销售若干种商品,每种商品可在若干 商店里销售,每个商店销售一种商品有月份和月销售量两个属性;

数据仓库-期末考试复习题

数据仓库-期末考试复习题

数据仓库-期末考试复习题复思考题(重点)一、单项选择题1)一般信息管理中,采用哪种方式的概念模型最多A。

ce模型B.实体-关系模型C.02O模型D.B/S模型(2)在关系表中,下列哪种属性不能承担主列关键字(Key)?A.身份证号B.银行卡号C.加密电文D.企业标识码(3)数据仓库的生命周期中,不包含下列哪个阶段?A.规划分析阶段B.设计实施阶段C.使用维护阶段D.反馈提升阶段(4)多维切片是指:A.在多个维度上观察全员操作B.多个成员的操作片段C.旋转数据集的部分维度D.在线分析或联机分析(5)一般信息管理中,采用哪种方式的分布式物理模型最多A。

ce模型 B.实体-关系模型C.02O模型D.B/S模型(6)在关系表中,下列哪种属性可以成为外键(Key)?A.客户信用程度B.银行卡行号C.加密的身份证号D.实体商户地址(7)数据仓库的生命周期中,不包含下列哪个阶段排在第三阶段?A.规划分析阶段 B.设计实施阶段 C.使用维护阶段D.反馈提升阶段(8)多维报表是指:A.在多个维度上观察全员操作B.分歧维度花式分歧叠加展示C.旋转数据集的部分维度D.在线阐发或联机阐发(9)数据表的多维索引的感化是:A.使数据表更节省存储空间B.加快数据存储速率C.表格花式美观大方C.加快数据查找效率10)de布局中的MAP职能是?A.钻取B.汇聚C.分发D.结晶11)下列哪种客户需求能够直接成为数据堆栈的多维报表?A.客户销售业绩清单B.客户根本名册C.客户关系图表D.客户反馈信息(12)数据堆栈开辟强调哪种主体特征?A.信息安全性B.业务流程C.操作事务性D.数据实时性(13)数据仓库与数据库系统相比,更加提倡:A.空间换时间B.数据范式更严格C.冗余度更小C.更加适用于分布式结构(14)透视表属于OLAP中的哪种能力范畴?A.存储本领B.展示本领C.稳定性本领D.安全性本领(15)OLAP的系统布局分为:A.胖客户端系统和瘦客户端系统B。

数据库习题集及答案参考

数据库习题集及答案参考

数据库系统概论习题集数据库基本概况一、选择题1. DBS是采用了数据库技术的计算机系统,它是一个集合体,包含数据库、计算机硬件、软件和()。

A. 系统分析员B. 程序员C. 数据库管理员D. 操作员2. 数据库(DB),数据库系统(DBS)和数据库管理系统(DBMS)之间的关系是()。

A. DBS包括DB和DBMSB. DBMS包括DB和DBSC. DB包括DBS和DBMSD. DBS就是DB,也就是DBMS3. 下面列出的数据库管理技术发展的三个阶段中,没有专门的软件对数据进行管理的是()。

I.人工管理阶段II.文件系统阶段III.数据库阶段A. I 和IIB. 只有IIC. II 和IIID. 只有I4. 下列四项中,不属于数据库系统特点的是()。

A. 数据共享B. 数据完整性C. 数据冗余度高D. 数据独立性高5. 数据库系统的数据独立性体现在()。

A.不会因为数据的变化而影响到应用程序B.不会因为系统数据存储结构与数据逻辑结构的变化而影响应用程序C.不会因为存储策略的变化而影响存储结构D.不会因为某些存储结构的变化而影响其他的存储结构6. 描述数据库全体数据的全局逻辑结构和特性的是()。

A. 模式B. 内模式C. 外模式D. 用户模式7. 要保证数据库的数据独立性,需要修改的是()。

A. 模式与外模式B. 模式与内模式C. 三层之间的两种映射D. 三层模式8. 要保证数据库的逻辑数据独立性,需要修改的是()。

A. 模式与外模式的映射B. 模式与内模式之间的映射C. 模式D. 三层模式9. 用户或应用程序看到的那部分局部逻辑结构和特征的描述是(),它是模式的逻辑子集。

A.模式B. 物理模式C. 子模式D. 内模式10.下述()不是DBA数据库管理员的职责。

A.完整性约束说明B. 定义数据库模式C.数据库安全D. 数据库管理系统设计选择题参考答案:(1) C (2) A (3) D (4) C (5) B (6) A (7) C (8) A (9) C (10) D二、简答题1.试述数据、数据库、数据库系统、数据库管理系统的概念。

数据仓库与数据挖掘考试习题汇总

数据仓库与数据挖掘考试习题汇总

第一章12、元数据是描述数据仓库内数据的结构和建立方法的数据,它为访问数据仓库提供了一个34转等各种分析动作,以求剖析数据,使拥护能从不同角度、不同侧面观察数据仓库中的数据,从而深入理解多维数据集中的信息。

5、ROLAP OLAP实现,而MOLAP是基于多维数据结构组织的OLAP 实现。

678发”的)、企业级的、详细的数据库,也叫运营数据存储。

9、“实时数据仓库”意味着源数据系统、度交换数据和业务规则。

10、从应用的角度看,数据仓库的发展演变可以归纳为5个阶段:以报表为主、以分析为主、以预测模型为主、以运营导向为主和以实时数据仓库和自动决策为主。

11、什么是数据仓库?数据仓库的特点主要有哪些?数据仓库通常是指一个数据库环境,而不是支一件产品,它是提供用户用于决策支持的当前和历史数据,这些数据在传统的数据库中通常不方便得到。

数据仓库就是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,通常用于辅助决策支持。

数据仓库的特点包含以下几个方面:(1)面向主题。

操作型数据库的数据组织是面向事务处理任务,各个业务系统之间各自分离;而数据仓库中的数据是按照一定的主题域进行组织。

主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点领域,一个主题通常与多个操作型业务系统或外部档案数据相关。

(2)集成的。

面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。

而数据仓库中的数据是在对原有分散的数据库数据作抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企事业单位一致的全局信息。

也就是说存放在数据仓库中的数据应使用一致的命名规则、格式、编码结构和相关特性来定义。

(3)相对稳定的。

操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。

数据仓库设计习题与答案(商务智能)

数据仓库设计习题与答案(商务智能)

一、多选题1、物理模型设计包括以下哪些步骤?A.实体转换成对应的表B.建立表之间的连接C.确定列类型D.属性转换成列正确答案:A、B、C、D2、在物理模型设计阶段除了考虑数据结构之外,还需要考虑以下哪些问题?A.维护代价B.存储时间C.字段类型D.字段大小正确答案:A、B3、以下哪种关于元数据的说法是错误的?A.元数据也有数据类型B.元数据是细节数据C.元数据是综合数据D.元数据是定义数据的数据正确答案:A、B、C4、元数据的使用者主要包括以下人员。

A.开发人员B.业务人员C.分析人员D.管理员正确答案:A、D5、数据仓库的数据抽取方法中,从逻辑抽取角度可以分为以下哪几种方式?A.相对抽取B.绝对抽取C.全量抽取D.增量抽取正确答案:C、D6、以下哪些内容是数据转换阶段需要完成的工作?A.数据分离B.数据合并C.数据转化D.数据类型确定正确答案:A、B、C7、以下哪些内容是数据转换的主要类型?A.字段导出B.特征集合转化C.日期时间转化D.信息合并正确答案:A、B、C、D8、在进行数据仓库中的数据装载时,如果遇到装载的数据和数据仓库中已有数据重复,常用的处理方法以下哪些是正确的?A.增加一条新记录B.覆盖(更新)原有记录C.丢弃新纪录D.合并新记录和已有记录正确答案:A、B、C、D9、以下对数据集市的特点描述中,哪些是正确的?A.数据源少B.主题少C.建设周期短D.只能满足部门级应用正确答案:A、B、C、D10、以下哪些方法可以用来实施数据仓库?A.自顶向下,总体规划,分步实施B.“big-bang“,爆炸式C.自底向上D.分项并举正确答案:A、B、C二、判断题1、数据库和数据仓库的的设计都以需求驱动为原则正确答案:错2、与数据库的设计相同,数据仓库的设计也是三级模型结构。

正确答案:对3、概念模型设计的核心是将实际需求机型高度的抽象和概括。

正确答案:对4、数据清洗就是消除数据源中不符合规范的数据的过程。

数据仓库试题

数据仓库试题

数据仓库试题一、选择题1. 数据仓库是一种用于存储、管理和分析大量数据的系统,其特点是()a) 存储海量数据b) 支持多维分析c) 支持实时查询d) 执行事务处理2. 下列哪项不是数据仓库的核心组件?a) 数据提取和转换(ETL)工具b) 数据集市c) 数据库管理系统d) 数据挖掘工具3. 数据仓库的建设过程中,以下哪项工作应该放在最后进行?a) 数据提取和清洗b) 数据建模c) 数据存储和加载d) 数据分析4. 在数据仓库中,维度模型和事实模型分别用于描述的是()a) 数据之间的关系b) 数据的粒度c) 数据的来源d) 数据的格式5. 下列哪个是数据仓库的主要目标之一?a) 实时交互式数据查询b) 高效的事务处理c) 存储大量数据d) 实现负载均衡二、填空题6. 数据仓库的架构通常包括三层,分别是()、()和()层。

7. 数据仓库的难点之一是数据的(),因为数据来自多个不同的系统和部门。

8. 数据仓库的存储技术包括()和()两种常见的方式。

9. 数据仓库建设过程中,将源数据转换为适合分析的数据称为()。

10. 数据仓库的数据分析可以采用多种方法,其中()分析是一种常见的方法。

三、简答题11. 数据仓库与传统的关系型数据库有何区别?12. 数据仓库的优势是什么?它在实际应用中有哪些场景?13. 数据仓库建设过程中的ETL过程是什么意思?它的作用是什么?14. 数据仓库中,维度模型和事实模型各自是如何描述数据的?15. 请简要说明数据仓库的架构和主要组件。

四、解答题16. 数据仓库的设计和建设步骤有哪些?请结合实际案例进行说明。

17. 请解释数据仓库中的数据清洗操作,并举例说明其重要性。

18. 请描述数据仓库的存储技术中,列式存储和行式存储的特点,并比较它们的优缺点。

五、实操题19. 假设你是某公司的数据分析员,请你根据实际需求,设计一个适合该公司业务的数据仓库架构,并简要说明其关键组件和数据流程。

数据库练习题库(含答案)

数据库练习题库(含答案)

数据库练习题库(含答案)一、单选题(共98题,每题1分,共98分)1.在需求分析阶段,结构化分析和建模方法是一种较为有效的需求分析方法,下列不属于结构化分析和建模方法优点的是()。

A、可避免过早陷入具体细节B、从局部或子系统开始分析问题,便于建模人员了解业务模型C、图形对象不涉及太多技术术语,便于用户理解模型D、用图形化的模型能直观表示系统功能正确答案:B2.DBMS通过加锁机制允许用户并发访问数据库,这属于DBMS提供的()。

A、数据定义功能B、数据操纵功能C、数据库运行管理与控制功能D、数据库建立与维护功能正确答案:C3.关于数据划分策略,下述说法错误的是()。

A、散列划分釆用某种散列函数,以数据的划分属性作为函数参数,计算数据应存储的磁盘序号B、范围划分根据某个属性的取值,将数据划分为n个部分,分别存储到不同磁盘上C、范围划分有利于范围查询和点查询,但也可能会引起数据分布不均匀及并行处理能力下降问题D、轮转法划分能保证元组在多个磁盘上的平均分配,并具有较高的点查询和范围查询正确答案:D4.存取方法设计属于数据库设计的()阶段的设计任务。

A、逻辑结构设计B、概念结构设计C、系统需求分析D、物理结构设计正确答案:D5.将新插入的记录存储在文件末尾,并使记录随机地分布在文件物理存储空间中的文件结构是()。

A、散列文件B、堆文件C、索引文件D、聚集文件正确答案:B6.关于"死锁”,下列说法中正确的是()。

A、在数据库操作中防止死锁的方法是禁止两个用户同时操作数据库B、只有出现并发操作时,才有可能出现死锁C、当两个用户竞争相同资源时不会发生死锁D、死锁是操作系统中的问题,数据库操作中不存在正确答案:B7.关于数据库应用系统的需求分析工作,下列说法正确的是()。

A、在需求分析阶段,系统需求分析员要与用户充分沟通,并做出各类用户视图B、通过需求分析过程,需要确定出整个应用系统的目标、任务和系统的范围说明C、数据操作响应时间、系统吞吐量、最大并发用户数都是性能需求分析的重要指标D、数据需求分析的主要工作是要辩识出数据处理中的数据处理流程正确答案:C8.如果一个系统定义为关系系统,则它必须( )oA、支持关系数据库B、支持选择、投影和连接运算C、A和B均成立D、A、B都不需要正确答案:C9.联机分析处理包括以下()基本分析功能。

《数据库系统概论》习题集

《数据库系统概论》习题集

一、选择题①②③④1、在学校中,学生与课程之间的联系是……………………………………(③ )①一对一联系 ②一对多联系 ③多对多联系 ④其他联系2、设有关系框架R (A ,B ,C ,D ,E )及其上的函数相关性集合F={A →D ,D →B ,E →C}该框架R 的候选关键字………………………………………………(④)①AD ②DB ③EC ④AE3、给定关系R 如图所示,R 最高是( )的……………………………(②)R①1NF ②2NF ③3NF ④BCNF4、对一个关系而言,只可能有一个的是它的……………………………(④)①超关键字 ②候选关键字 ③外部关键字 ④主关键字5、设关系框架R 上的函数相关性集合F={B →D ,CA →E}则利用FD 公理和规则可推出……………………………………………………………………(①④)①CB →B ②EA →D ③DA →B ④AB →AD6、关系模型的最大特色是描述的 ……………………………………(④)①抽象性 ②概括性 ③协调性 ④一致性7、设有关系框架R (A ,B ,C ,D ,E )及其上的函数相关性集合F={A →D ,B →C ,E →A}该框架R 的候选关键字………………………………………………(②)①AB ②BE ③CD ④DE8、给定关系R 如图所示,R 最高是( )的…………………………………(①)R①1NF ②2NF ③3NF ④BCNF9、子模式是用户与数据库的接口之一,它对应于数据库的…………(①)①外模式 ②概念模式 ③内模式 ④存储模式11.下面不是构成数据模型的要素的是 ( C )A.数据结构B.数据操作C.数据模型D.完整性约束12.数据库系统的基本特征是 ( C )A.数据的统一控制B.数据共享性和统一控制C.数据共享性、数据独立性和冗余度小D.数据共享性和数据独立性13.三个模式反映了对数据库的三种不同的观点,下面说法中正确的是 ( C )A.内模式表示了概念级数据库,体现了对数据库的总体观B.外模式表示了物理级数据库,体现了对数据库的存储现C.外模式表示了用户级数据库,体现了对数据库的用户现D.外模式表示了用户级数据库,体现了对数据库的存储现14.在数据库系统中,多种应用,多种语言互相覆盖地同时使用数据集合且易于扩充,称之为数据的( D )A.安全性B.独立性C.完整性D.共享性15.两个或更多的事务同时处于等待状态,每个事务都在等待其他的事务释放锁使其可继续执行,处于这种情况称之为( C )A.封锁B.解锁C.死锁D.加锁16.适用于分段查找的存储结构为( C )A.顺序存储结构B.链式存储结构C.有序或分段有序的顺序存储结构D.有序或分段有序的链式存储结构17.通过视图进行查询,首先要进行( C )A.安全性检查B.正确性检查C.有效性检查D.完整性检查18.设有“供应者”关系模式Supplier(Sname,Saddrenrs,Item,Price),其中各属性分别表示供应者名、供应者地址、货物名称、货物售价,一个供应者供应一种货物则对应到关系中的一个元组。

数据库题集一及参考答案

数据库题集一及参考答案

题集一及答案一、单项选择题1.___A__是位于用户与操作系统之间的一层数据库管理软件。

(A) 数据库管理系统 (B) 数据库系统(C) 数据库 (D) 文件组织2.单个用户使用的数据视图的描述称为___D__。

(A) 模式 (B) 存储模式 (C) 内模式 (D) 外模式3.在数据库设计中,将E-R图转换成关系数据模型的过程属于__B___。

(A)概念结构设计 (B) 逻辑结构设计 (C) 物理设计 (D) 需求分析4.同一张表上的多类触发器激活时遵循的执行顺序为__D___ 。

①执行该表上的AFTER触发器;②执行该表上的BEFORE触发器;③激活触发器的SQL语句。

(A) ①②③ (B) ③②① (C) ①③② (D)②③①5.把对表student的查询权限授予U1并获得传播该权限的权利,以下__D___SQL语句正确实现该功能。

(A) GRANT INSERT ON TABLE STUDENT (B) GRANT SELECT ON TABLE STUDENTTO U1 WITH GRANT OPTION; TO U1 WITH ADMIN OPTION;(C) GRANT INSERT ON TABLE STUDENT (D) GRANT SELECT ON TABLE STUDENTTO U1 WITH ADMIN OPTION; TO U1 WITH GRANT OPTION;6.SQL中,与“< ANY”等价的操作符是__C___。

(A) < MIN (B) > MIN (C) < MAX (D) > MAX7.如果事务T1获得了数据项P上的排它锁,则以下说法正确的是__D___。

(A) T1对P只能读不能写 (B) T2对P能加共享锁(C) T2对P能加排它锁 (D) 以上说法都不正确8.设关系模式R<A,B,C,D,E>,函数依赖集F={AB→C,AE→B,B→E,A→D},以下为R的候选码的是__D___。

数据仓库习题集

数据仓库习题集

一、选择填空.数据仓库的特点分别是面向主题、集成、相对稳定、反映历史变化。

、粒度是对数据仓库中数据的综合程度高低的一个衡量。

粒度越小,细节程度越高,综合程度越低,回答查询的种类越多。

维度可以根据其变化快慢分为元变化维度、缓慢变化维度和剧烈变化维度三类。

连续型属性的数据样本之间的距离有欧氏距离、曼哈顿距离和明考斯基距离。

在数据挖掘的分析方法中,直接数据挖掘包括(ACD)A 分类B 关联C 估值D 预言数据仓库的数据ETL过程中,ETL软件的主要功能包括(ABC)A 数据抽取B 数据转换C 数据加载D 数据稽核数据分类的评价准则包括( ABCD )A 精确度B 查全率和查准率C F-MeasureD 几何均值层次聚类方法包括( BC )A 划分聚类方法B 凝聚型层次聚类方法C 分解型层次聚类方法D 基于密度聚类方法贝叶斯网络由两部分组成,分别是( A D )A 网络结构B 先验概率C 后验概率D 条件概率表置信度(confidence)是衡量兴趣度度量( A )的指标。

A、简洁性B、确定性C.、实用性D、新颖性关于OLAP和OLTP的区别描述,不正确的是: (C)A. OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同.B. 与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务.C. OLAP的特点在于事务量大,但事务内容比较简单且重复率高.D. OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作( B )A、层次聚类B、划分聚类C、非互斥聚类D、模糊聚类将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C)A. 频繁模式挖掘B. 分类和预测C. 数据预处理D. 数据流挖掘为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一类任务?(B)A. 探索性数据分析B. 建模描述C. 预测建模D. 寻找模式和规则6.在数据挖掘的分析方法中,直接数据挖掘包括(ACD)A 分类B 关联C 估值D 预言7.数据仓库的数据ETL过程中,ETL软件的主要功能包括(ABC)A 数据抽取B 数据转换C 数据加载D 数据稽核8.数据分类的评价准则包括( ABCD )A 精确度B 查全率和查准率C F-MeasureD 几何均值9.层次聚类方法包括( BC )A 划分聚类方法B 凝聚型层次聚类方法C 分解型层次聚类方法D 基于密度聚类方法10.贝叶斯网络由两部分组成,分别是( A D )A 网络结构B 先验概率C 后验概率D 条件概率表二、判断题1. 数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、选择填空.数据仓库的特点分别是面向主题、集成、相对稳定、反映历史变化。

、粒度是对数据仓库中数据的综合程度高低的一个衡量。

粒度越小,细节程度越高,综合程度越低,回答查询的种类越多。

维度可以根据其变化快慢分为元变化维度、缓慢变化维度和剧烈变化维度三类。

连续型属性的数据样本之间的距离有欧氏距离、曼哈顿距离和明考斯基距离。

在数据挖掘的分析方法中,直接数据挖掘包括(ACD)A 分类B 关联C 估值D 预言数据仓库的数据ETL过程中,ETL软件的主要功能包括(ABC)A 数据抽取B 数据转换C 数据加载D 数据稽核数据分类的评价准则包括( ABCD )A 精确度B 查全率和查准率C F-MeasureD 几何均值层次聚类方法包括( BC )A 划分聚类方法B 凝聚型层次聚类方法C 分解型层次聚类方法D 基于密度聚类方法贝叶斯网络由两部分组成,分别是( A D )A 网络结构B 先验概率C 后验概率D 条件概率表置信度(confidence)是衡量兴趣度度量( A )的指标。

A、简洁性B、确定性C.、实用性D、新颖性关于OLAP和OLTP的区别描述,不正确的是: (C)A. OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同.B. 与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务.C. OLAP的特点在于事务量大,但事务内容比较简单且重复率高.D. OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作( B )A、层次聚类B、划分聚类C、非互斥聚类D、模糊聚类将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C)A. 频繁模式挖掘B. 分类和预测C. 数据预处理D. 数据流挖掘为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一类任务?(B)A. 探索性数据分析B. 建模描述C. 预测建模D. 寻找模式和规则6.在数据挖掘的分析方法中,直接数据挖掘包括(ACD)A 分类B 关联C 估值D 预言7.数据仓库的数据ETL过程中,ETL软件的主要功能包括(ABC)A 数据抽取B 数据转换C 数据加载D 数据稽核8.数据分类的评价准则包括( ABCD )A 精确度B 查全率和查准率C F-MeasureD 几何均值9.层次聚类方法包括( BC )A 划分聚类方法B 凝聚型层次聚类方法C 分解型层次聚类方法D 基于密度聚类方法10.贝叶斯网络由两部分组成,分别是( A D )A 网络结构B 先验概率C 后验概率D 条件概率表二、判断题1. 数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。

(对)2. 数据挖掘的目标不在于数据采集策略,而在于对于已经存在的数据进行模式的发掘。

(对)3. 图挖掘技术在社会网络分析中扮演了重要的角色。

(对)4. 模式为对数据集的全局性总结,它对整个测量空间的每一点做出描述;模型则对变量变化空间的一个有限区域做出描述。

(错)5. 寻找模式和规则主要是对数据进行干扰,使其符合某种规则以及模式。

(错)6. 离群点可以是合法的数据对象或者值。

(对)7. 离散属性总是具有有限个值。

(错)8. 噪声和伪像是数据错误这一相同表述的两种叫法。

(错)9. 用于分类的离散化方法之间的根本区别在于是否使用类信息。

(对)10. 特征提取技术并不依赖于特定的领域。

(错)11. 序列数据没有时间戳。

(对)12. 定量属性可以是整数值或者是连续值。

(对)13. 可视化技术对于分析的数据类型通常不是专用性的。

(错)14. DSS主要是基于数据仓库.联机数据分析和数据挖掘技术的应用。

(对)15. OLAP技术侧重于把数据库中的数据进行分析、转换成辅助决策信息,是继数据库技术发展之后迅猛发展起来的一种新技术。

(对)16. 商业智能系统与一般交易系统之间在系统设计上的主要区别在于:后者把结构强加于商务之上,一旦系统设计完毕,其程序和规则不会轻易改变;而前者则是一个学习型系统,能自动适应商务不断变化的要求。

(对)17. 数据仓库中间层OLAP服务器只能采用关系型OLAP (错)18.数据仓库系统的组成部分包括数据仓库,仓库管理,数据抽取,分析工具等四个部分. (错)19. Web数据挖掘是通过数据库仲的一些属性来预测另一个属性,它在验证用户提出的假设过程中提取信息. (错)21. 关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。

(错)22. 利用先验原理可以帮助减少频繁项集产生时需要探查的候选项个数(对)。

23. 先验原理可以表述为:如果一个项集是频繁的,那包含它的所有项集也是频繁的。

(错24. 如果规则不满足置信度阈值,则形如的规则一定也不满足置信度阈值,其中是X的子集。

(对)25. 具有较高的支持度的项集具有较高的置信度。

(错)26. 聚类(clustering)是这样的过程:它找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象类。

(错)27. 分类和回归都可用于预测,分类的输出是离散的类别值,而回归的输出是连续数值。

(对)28. 对于SVM 分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。

(对)29. Bayes 法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。

(错)30.分类模型的误差大致分为两种:训练误差(training error )和泛化误差(generalization error ). (对)31. 在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。

(错)32. SVM 是这样一个分类器,他寻找具有最小边缘的超平面,因此它也经常被称为最小边缘分类器(minimal margin classifier ) (错)33. 在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。

(错)34. 聚类分析可以看作是一种非监督的分类。

(对)35. K 均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。

(错36. 给定由两次运行K 均值产生的两个不同的簇集,误差的平方和最大的那个应该被视为较优。

(错)37. 基于邻近度的离群点检测方法不能处理具有不同密度区域的数据集。

(对)38. 如果一个对象不强属于任何簇,那么该对象是基于聚类的离群点。

(对)39. 从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。

(错)40. DBSCAN 是相对抗噪声的,并且能够处理任意形状和大小的簇。

(对)三、计算题1.一个食品连锁店每周的事务记录如下表所示,其中每一条事务表示在一项收款机业务中卖出的项目,假定sup min =40%,conf min =40%,使用Apriori 算法计算生成的关联规则,标明每趟数据库扫描时的候选集和大项目集。

(15分)事务项目事务项目 T1 T2T3面包、果冻、花生酱面包、花生酱面包、牛奶、花生酱 T4T5啤酒、面包啤酒、牛奶解:(1)由I={面包、果冻、花生酱、牛奶、啤酒}的所有项目直接产生1-候选C 1,计算其支持度,取出支持度小于sup min 的项集,形成1-频繁集L 1,如下表所示:项集C1 支持度项集L1支持度{面包}{花生酱}{牛奶} {啤酒}4/53/52/52/5{面包}{花生酱}{牛奶}{啤酒}4/53/52/52/5(2)组合连接L1中的各项目,产生2-候选集C2,计算其支持度,取出支持度小于sup min的项集,形成2-频繁集L2,如下表所示:项集C2支持度项集L2支持度{面包、花生酱} 3/5{面包、花生酱} 3/5至此,所有频繁集都被找到,算法结束,所以,confidence({面包}→{花生酱})=(4/5)/(3/5)=4/3> conf minconfidence({ 花生酱}→{面包})=(3/5)/(4/5)=3/4> conf min所以,关联规则{面包}→{花生酱}、{ 花生酱}→{面包}均是强关联规则。

2.给定以下数据集(2 ,4,10,12,15,3,21),进行K-Means聚类,设定聚类数为2个,相似度按照欧式距离计算。

(15分)解:(1)从数据集X中随机地选择k个数据样本作为聚类的出示代表点,每一个代表点表示一个类别,由题可知k=2,则可设m1=2,m2=4:(2)对于X中的任意数据样本xm(1<xm<total),计算它与k个初始代表点的距离,并且将它划分到距离最近的初始代表点所表示的类别中:当m1=2时,样本(2 ,4,10,12,15,3,21)距离该代表点的距离分别为2,8,10,13,1,19。

当m2=4时,样本(2 ,4,10,12,15,3,21)距离该代表点的距离分别为-2,6,8,11,-1,17。

最小距离是1或者-1将该元素放入m1=2的聚类中,则该聚类为(2,3),另一个聚类m2=4为(4,10,12,15,21)。

(3)完成数据样本的划分之后,对于每一个聚类,计算其中所有数据样本的均值,并且将其作为该聚类的新的代表点,由此得到k个均值代表点:m1=2.5,m2=12:(4)对于X中的任意数据样本xm(1<xm<total),计算它与k个初始代表点的距离,并且将它划分到距离最近的初始代表点所表示的类别中:当m1=2.5时,样本(2 ,4,10,12,15,3,21)距离该代表点的距离分别为-0.5,0.5,1.5,7.5,9.5,12.5,18.5。

当m2=12时,样本(2 ,4,10,12,15,3,21)距离该代表点的距离分别为-10,-9,-8,2,3,9。

最小距离是1.5将该元素放入m1=2.5的聚类中,则该聚类为(2,3,4),另一个聚类m2=12为(10,12,15,21)。

(5)完成数据样本的划分之后,对于每一个聚类,计算其中所有数据样本的均值,并且将其作为该聚类的新的代表点,由此得到k个均值代表点:m1=3,m2=14.5:(6)对于X中的任意数据样本xm(1<xm<total),计算它与k个初始代表点的距离,并且将它划分到距离最近的初始代表点所表示的类别中:当m1=3时,样本(2 ,4,10,12,15,3,21)距离该代表点的距离分别为-1,1,7,9,12,18,。

当m2=14.5时,样本(2 ,4,10,12,15,3,21)距离该代表点的距离分别为-12.58,-11.5,-10.5,-4.5,-2.5,0.5,6.5。

相关文档
最新文档