《商务智能》考试复习内容-(含答案)
商务智能复习题.doc
二、判断题(本题共10道小题,每小题1分,共10分)(F ) 4.独立的数据集市架构的优点是企业内数据一致,不会产生信息孤岛。
(F ) 6.企业风险分析是通过对企业的经营成本进行综合评价,拟定一个企业成本的临界值。
(T ) &在BI中,DW是前提和基础,负责统一数据规则的处理和存储。
(F ) 9.客户服务管理是对客户意见或投诉以及售前、售中、售后服务进行管理。
(F ) 10.平衡计分卡共包括三个层面,分别是财务层面、客户层面、内部业务流程层面。
(F ) 12.在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。
(F ) 13. OLAP是用来协助企业对响应事件或事务的日常商务活动进行处理。
(F ) 16. C4.5决策树算法是国际上最早、最有影响力的决策树算法,(T ) 17.平衡计分卡是从财务、客户、内部运营、学习与成长四个角度,将组织的战略落实为可操作的衡量指标和目标值的一种新型绩效管理体系。
(F ) 1&客户服务管理是对客户意见或投诉以及售前、售中、售后服务进行管理。
(F ) 19.企业绩效管理的目的在于进一步加强成本的事前控制,同时有助于通过盈亏分析,辅助产品科学的报价。
(T )等深分箱法使每个箱子的记录个数相同。
(F )数据仓库“粒度”越细,记录数越少。
F记录树越多,范围越广泛(F )回归分析通常用于挖掘关联规则。
(T )孤立点在数据挖掘时总是被视为异常、无用数据而丢弃。
34.决策树方法特别适合于处理数值型数据。
(F )数据立方体是广义知识发现的方法和技术之一。
(F )可信度是对关联规则的准确度的衡量。
(T )可视化技术对于分析的数据类型通常不是专用性的。
(T ) OLAP技术侧重于把数据库中的数据进行分析、转换成辅助决策信息,是继数据库技术发展之后迅猛发展起来的一种新技术。
(F)关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则(F )Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。
《商务智能》复习题及答案
《商务智能》复习题及答案1、把数据报表从一年展开成四个季度的操作是(C )A、上卷B、旋转C、下钻D、切片2、在多维数据集中,对某一个维度上的数据进行选择一维成员,其他维度没有变化的操作是( D)A、切块B、旋转C、下钻D、切片3、一个多维数组表示为:(维1,维2,维3,维4,变量),这是一个(B )维结构。
A、3B、4C、5D、64、一次购买行为的发起需要有:购买者、商家、商品、购买时间、供应商和订单金额。
如果设计星型模型,请问有几个维度(C )A、3B、4C、5D、65、在进行ETL时,应该在(C )里进行。
A、ODSB、数据仓库C、数据准备区D、源数据6、(多选题)此大数据带来的变革有(ABD ).A、思维变革B、商业变革C、购物变革D、管理变革7、自然演化式体系结构的问题有(ACD )。
(多选)A、数据可信性B、无法进行数据处理C、生产率问题D、无法将数据转化为信息8、数据立方体是指(C ).A、三维数据集B、三维以上的数据集C、三维和三维以上的数据集D、四维数据集'9、戈登·未尔提出在今后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度,每(D )左右可以翻一番。
A、1个月B、6个月C、12个月D、18个月10、大数据时代的核心价值是(B)A.数据收集B.数据分析C.数据挖掘D.数据可视化11、大数据的来源包括( ABCD).A.互联网数据B.传感器数据C.实时数据D.探测数据11、好友的QQ突然发来一个网站链接要求投票,最合理的做法是( C)A.因为是其好反信总,直接打开使接投票B.不参与任何投票C.可能是好友aq被盗,可能是恶意筑接。
先通过予机跟朋友确认链技按无异常,考虑是否投票D.把好友加入黑名单12、关于大数据特点,错误的是(C )A、数据量大B、数据类型多C.数据价值密度高D.数据处理速度快13、Hadop是基于(B )语言的数据分析框架。
A. C++B. JavaC. RD. C#14.Maphedue的主导思想是(C )A.集成化B.一体化C.分而治之D.综合化15.下列与大数据密切相关的技术是(B)A.蓝牙B.云计算C.博穿论D.WiFi16.大数据的数据类型包括结构化数据、非结构化数据和(A ).A.半结构化数据B.无结构化数据C.关系数据库数D.文本数据和WEe数报17.数据仓库中的数据(ABCD )A.集成的B.可以变化的C.面向主题的D.不易丢失的18.数据仓库是随着时间变化的。
商务智能复习
商务智能复习商务智能第第1 章商务智能概述1.1 商业决策需要商务智能一、数据、信息和知识1、数据:符号、事实和数字信息:有用的数据关系:信息是经过某种加工处理后的数据,是反映客观事物规律的一些数据。
数据是信息的载体, 信息是对数据的解释。
知识:对信息内容进行提炼、比较、挖掘、分析、概括、判断和推论。
2、决策离不开信息、知识①决策需要信息,更离不开知识;知识更多地表现为经验__学习的结晶;学习的过程是不断地对信息加工处理;信息的收集、加工、传输与利用贯穿着决策各阶段的工作过程。
②信息已成为企业经营中重要性仅次于人才的第二大要素。
③决策=信息+经验+冒险④商务智能是对企业信息的科学管理。
3、商务智能支持商业决策商务智能如何创造知识和价值1.2 商务智能简介商务智能这一术语1996年由Gartner 公司的分析师Howard Dresner首次提出,他提出商务智能描述了一系列的概念和方法,通过应用基于事实的支持系统来辅助商业决策的制定。
一、商务智能概念商务智能是整合了先进信息技术与创新管理理念的结合体,集成了企业内外的数据,进行加工并从中提取能够创造商业价值的信息,面向企业战略并服务于管理层、业务层,指导企业经营决策,提升企业竞争力,涉及企业战略、管理思想、业务整合和技术体系等层面,促进信息到知识再到利润的转变,从而实现更好的绩效。
①先进信息技术:商务智能是多项技术的综合应用;②集成了企业内外的数据,进行加工并从中提取能够创造商业价值的信息:商务智能的层次;③企业战略:商务智能服务于企业战略;④管理层、业务层:商务智能用户多样性;⑤更好的绩效:商务智能提升企业绩效。
二、商务智能的价值1、在商务智能背后有一些商业驱动力,如:①增加收入,减少费用和更有效地竞争的需求。
②管理和模拟当前商业环境复杂性的需求。
③减少IT 费用和利用已有公司业务信息的需求。
2、商务智能的价值①制定合适的市场营销策略;②改善顾客智能;③经营成本与收入分析;④提高风险管理能力;⑤改善业务洞察力;⑥提高市场响应能力。
商务智能的考试重点
1.商务智能的基本概念(简答)对工业界来说,商务智能是一类技术或工具,利用他们可以对大量的数据进行收集、管理、分析和挖掘,以改善业务决策水平,增强企业竞争力。
对学术界来说,商务智能是一套理论、方法、和应用,通过他们可以快速的发现海量数据中隐含的各种知识,有效的解决企业面临的管理和决策问题,支持企业的战略实施。
2.商务智能系统的开发过程3.在线分析处理和在线事务处理(简答)4.决策支持系统的系统架构(1)模型库管理系统主要用于管理决策所需的各种模型,例如财务、统计、预测以及管理等方面的定量模型,利用这些模型可以进行问题分析。
用户利用该系统可以方便快捷的构建和操纵模型。
系统提供对模型的分类、删除、复制等维护功能,可以将已有模型进行合并,以及对模型的执行情况进行跟踪、分析和评价,如对变量进行敏感度分析等。
(2)知识库管理系统提供知识的表示、存储和管理功能,用于支持定量模型无法解决的决策过程,帮助用户建立、应用和管理描述性、过程性和推理性知识。
(3)对话产生与管理系统主要负责用户与系统之间的交互。
接受用户的输入,能够与数据库管理系统、模型库管理系统和知识库管理系统进行交互,以各种形式将结果返回给用户,提供图形用户界面以及可视化功能。
6.回归:回归方法中最常用的是线性回归,包括一元线性回归、多元线性回归以及非线性回归。
线性回归方法不仅用于预测,也可以用作解释模型,以探寻变量之间的关系。
另外还有回归树和模型树等模型。
7.回归系数的显著性检验:回归系数的显著性检验可以采用t检验。
对于每个回归系数bi(i=1,2,....k),显著性检验的两个假设分别为H0:bi=0和H1:bi≠0。
若bi=0说明自变量xi的变化对因变量没有线性影响,即变量xi对因变量的影响不显著。
为每个回归系数b i 构造变量tbi如式所示:式中cii是对矩阵C=(X T X)-1的对角线上的第i个值。
给定显著性水平α,查自由度为(n-k-1)的t分布表,得到tα(n-k-1),若t bi>t α(n-k-1),则拒绝假设H0,即回归系数b i显著。
商务智能考试题目
商务智能考试题(共五个大题,每题20分)1、商务智能应用技术?功能组成?一般认为数据仓库、OLAP和数据挖掘技术是商业智能的三大组成部分数据仓库是存放为分析目的而收集的数据的数据库。
数据挖掘是从数据抽取正确的、有用的、以前未知的及可理解的信息,并使用该信息做商业决策的过程。
OLAP(联机分析处理)是针对特定问题的联机数据访问和分析。
通过对信息(这些信息已经从原始的数据进行了转换,以反映用户所能理解的企业的真实的“维”)的很多可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。
商业智能系统主要包括数据预处理、建立数据仓库、数据分析及数据展现四个主要阶段。
数据预处理是整合企业原始数据的第一步,它包括数据的抽取、转换和装载三个过程。
建立数据仓库则是处理海量数据的基础。
数据分析是体现系统智能的关键,一般采用联机分析处理和数据挖掘两大技术。
在海量数据和分析手段增多的情况下,数据展现则主要保障系统分析结果的可视化。
2、“商业智能是一种解决方案”这句话怎么理解?为什么商业智能没有“专业出版的教材”?(1)商务智能(Business Intelligence,简称BI):商务智能不是通常的业务处理。
它的目标是如何更快、更容易地做更好的决策。
BI将信息转换为知识。
商业智能是在正确的时间将正确的信息交给正确的用户以支持决策过程的应用。
目前,商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。
为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。
因此,从技术层面上讲,商业智能不是什么新技术,它只是数据仓库、OLAP和数据挖掘等技术的综合运用。
为此,把商业智能看成是一种解决方案应该比较恰当。
(2)3、商业智能(BI)与CRM,ERP,CIMS,等系统的异同和关联?4、商业智能系统的应用过程(步骤)?为什么说商业智能的步骤一般是“循环(迭代)”的?5、IBM说“商业智能之客户直销分析”应用商业智能中的什么技术?分析这些技术?。
数据库与商务智能考试
数据库与商务智能考试(答案见尾页)一、选择题1. 数据库系统的基本组成部分包括哪些?A. 关系模型B. 数据库管理系统(DBMS)C. 数据仓库D. 以上都是2. 关系模型的主要概念是什么?A. 实体-关系模型B. 对象关系模型C. 面向对象模型D. 以上都不是3. 数据库事务的特性中,ACID代表什么?A. 原子性、一致性、隔离性、持久性B. 原子性、可恢复性、一致性、隔离性C. 原子性、一致性、隔离性、持久性D. 原子性、可恢复性、一致性、持久性4. 以下哪个选项是数据仓库的特征?A. 集成性B. 非易失性C. 分布性D. 以上都是5. 商务智能(BI)的主要应用领域包括哪些?A. 数据分析B. 数据挖掘C. 数据可视化D. 以上都是6. 数据库性能优化通常涉及哪些方面?A. 索引优化B. 查询优化C. 硬件选择D. 以上都是7. 在数据库系统中,如何保证数据的安全性和完整性?A. 使用强密码策略B. 定期备份数据C. 实施访问控制D. 以上都是8. 数据库复制在商务智能中的应用主要目的是什么?A. 提高数据可用性B. 提高数据一致性C. 提供数据备份功能D. 提高数据访问速度9. 以下哪个选项是数据库管理系统的核心功能?A. 数据定义B. 数据查询C. 数据更新D. 数据安全10. 在数据库系统中,如何实现数据的标准化?A. 将数据分解为更小的单元B. 将数据组织到不同的表格中C. 将数据按照特定的规则进行转换D. 将数据按照特定的规则进行分组11. 数据库系统工程师的主要职责包括哪些?A. 设计和构建数据库管理系统B. 编写和维护数据库应用程序C. 管理和优化数据库性能D. 提供数据分析和商业智能解决方案12. 关系数据库中的基本概念是什么?A. 数据库、关系、元组、属性B. 数据库、关系、元组、列C. 数据库、关系、元组、属性、主键D. 数据库、关系、元组、属性、外键13. 以下哪个选项是关系数据库中常用的数据类型?A. 整数B. 浮点数C. 字符串D. 布尔值14. 在数据库设计中,哪一个阶段负责定义和描述数据的结构?A. 需求分析B. 概念设计C. 逻辑设计D. 物理设计15. 数据库管理系统(DBMS)的主要组成部分包括?A. 存储器管理B. 查询处理器C. 事务管理D. 数据定义语言(DDL)16. 以下哪个术语描述了数据库中数据的逻辑结构?A. 存储方式B. 逻辑结构C. 物理结构D. 结构式17. 在数据库系统中,哪一个概念用于定义数据之间的关系?A. 表格B. 结构式C. 关系模型D. 实体-关系模型18. 以下哪个选项是数据库性能优化的一个关键因素?A. 硬件资源B. 软件配置C. 数据库设计D. 查询负载19. 在数据库系统中,哪一个技术用于存储和管理数据?A. 文件系统B. 数据库管理系统(DBMS)C. 对象关系映射(ORM)D. 数据仓库20. 以下哪个选项提供了数据库系统的安全机制?A. 访问控制列表(ACL)B. 数据加密C. 审计和日志记录D. 数据备份和恢复21. 关系型数据库与非关系型数据库的主要区别是什么?A. 数据存储结构B. 数据处理速度C. 适用场景D. 所需硬件资源22. 数据仓库中需要进行数据清洗和预处理的原因是什么?A. 提高数据质量B. 增加存储空间C. 减少数据处理量D. 降低错误率23. 在数据库设计中,E-R图(实体-关系图)通常用于表示什么?A. 数据流B. 实体之间的关系C. 数据库模式D. 数据库结构24. 以下哪个选项是数据库事务的ACID特性之一?A. 原子性B. 一致性C. 隔离性D. 持久性25. 数据库索引的目的是什么?A. 加速查询速度B. 减少数据冗余C. 保证数据完整性D. 方便数据备份26. 在数据库系统中,什么是触发器?A. 一种数据库对象,用于执行特定的操作B. 一种数据库约束,用于限制用户操作C. 一种数据库触发器,用于自动执行某些操作D. 以上都不是27. 数据库备份策略通常包括哪些方面?A. 备份类型(全备、增量备份等)B. 备份频率C. 备份介质(磁带、光盘等)D. 备份数据的保留策略28. 在数据库性能优化中,如何提高查询响应时间?A. 添加合适的索引B. 改变数据库引擎C. 优化SQL查询语句D. 增加数据库硬件资源29. 数据库系统故障可能导致的数据丢失情况包括(多选)?A. 事务崩溃B. 磁盘损坏C. 网络问题D. 错误的数据库配置30. 在数据库设计中,什么是第一范式?它如何帮助简化数据库设计?A. 第一范式要求表中的每一列都是原子的,即不可分割的B. 第一范式要求表中的每一列都是唯一的C. 第一范式要求表中的每一行都是唯一的D. 第一范式要求表中的每一行都必须完全相同31. 什么是数据库索引?它有哪些优点?A. 提高查询性能B. 减少数据冗余C. 加速数据排序和分组D. 支持事务处理32. 数据库备份和恢复策略对于业务连续性至关重要。
《商务智能方法与技术》复习资料
商务智能方法与技术》课程复习资料、客观部分:(判断、不定项选择)一)、判断部分★ 考核知识点: 商务智能系统附1.1.1 (考核知识点解释):商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升各方面商务绩效,增强综合竞争力的智慧和能力。
商务智能不是通常的业务处理。
它的目标是如何更快、更容易地做更好的决卒策。
IBM商务智能解决方案远远不只是数据和技术的组合,BI帮助用户获得正确的数据,发现它的价值,并共享价值。
★ 考核知识点: 知识概念附1.1.2 (考核知识点解释):知识就是对信息进行的提炼、比较、挖掘、分析、概括、判断和推论。
知识分为事实性知识和经验知识。
事实性知识是人类对于客观事物和现象的认识结果。
经验知识多事一种隐性知识,是存储在人们大脑中的经历、经验、技巧、体会和感悟等尚未公开的知识。
隐性知识和显性知识之间是可以相互转化的。
★考核知识点: 元数据附1.1.3 (考核知识点解释):元数据管理包括对开发、管理数据仓库时所用的技术元数据和支持业务人员的业务元数据进行管理,它对数据仓库的设计和维护具有重要的作用。
数据仓库的所有数据都要通过元数据来管理和控制。
元数据描述关于源数据的说明,包括源数据的来源、源数据的名称、源数据的定义、源数据的创建时间等对源数据进行管理所需要的信息。
源数据的来源说明源数据是从哪个系统、哪个历史数据、哪个办公数据、哪个Web 页、哪个外部系统抽取而来。
源数据说明源数据在数据仓库的作用、用途、数据类型和长度等。
元数据:是用来描述数据的数据。
它描述和定位数据组件、它们的起源及它们在数据仓库进程中的活动;关于数据和操作的相关描述( 输入、计算和输出) 。
元数据可用文件存在元数据库中。
元数据反映数据仓库中的数据项是从哪个特定的数据源填充的,经过哪些转换、集成过程。
商务智能复习的题目
一、选择题〔此题共5道小题,每一小题2分,共10分〕1. 数据仓库是随着时间变化的,下面的描述不正确的答案是( C )。
A. 数据仓库随时间的变化不断增加新的数据内容B. 捕捉到的新数据会覆盖原来的快照C. 数据仓库随事件变化不断删去旧的数据内容D. 数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进展重新综合2. 有关数据仓库的开发特点,不正确的描述是( B )。
A. 数据仓库使用的需求在开发初期就要明确B. 数据仓库开发要从数据出发C. 数据仓库的开发是一个不断循环的过程,是启发式的开发D. 在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式3. 在有关数据仓库测试,如下说法不正确的答案是( D )。
A. 在完成数据仓库的实施过程中,需要对数据仓库进展各种测试。
测试工作中要包括单元测试和系统测试。
B. 当数据仓库的每个单独组件完成后,就需要对他们进展单元测试。
C. 系统的集成测试需要对数据仓库的所有组件进展大量的功能测试和回归测试。
D. 在测试之前没必要制定详细的测试计划。
4. 关于根本数据的元数据是指( D )。
A. 根本元数据与数据源、数据仓库、数据集市和应用程序等结构相关的信息B. 根本元数据包括与企业相关的管理方面的数据和信息C. 根本元数据包括日志文件和简历执行处理的时序调度信息D. 根本元数据包括关于装载和更新处理,分析处理以与管理方面的信息6. 下面关于数据粒度的描述不正确的答案是( C )。
A. 粒度是指数据仓库小数据单元的详细程度和级别B. 数据越详细,粒度就越小,级别也就越高C. 数据综合度越高,粒度也就越大,级别也就越高D. 粒度的具体划分将直接影响数据仓库中的数据量以与查询质量6. 关于OLAP的特性,下面正确的答案是:( D )(1)快速性(2)可分析性(3)多维性(4)信息性(5)共享性A. (1) (2) (3)B. (2) (3) (4)C. (1) (2) (3) (4)D. (1) (2) (3) (4) (5)7. 关于OLAP和OLTP的区别描述,不正确的答案是:( C )A. OLAP主要是关于如何理解聚集的大量不同的数据,它与OTAP应用程序不同。
商务智能复习资料
商务智能复习资料第一章商务智能概述1、4C(1)信息技术是指获取、传递、处理和存储、以及利用信息的技术。
(2)4C内容:感测技术(是信息的采集技术,对应于人的感觉器官);通讯技术(是信息的传递技术,对应于人的神经系统);计算机技术(是信息的处理和存储技术,对应于人的思维器官);控制技术(是信息的使用技术,对应于人的执行器官)。
(3)信息技术工具:信息处理技术和通信技术是最重要的两种。
2、定义商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累积商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升个方面商务绩效,增强综合竞争力的智慧和能力。
3、商务智能的基本功能:个性化的信息分析;预测;辅助决策。
5、商务智能的作用:理解业务;衡量绩效;改善关系;创造获利机会。
6、商务智能的体系结构:是指通过识别和理解数据在系统中的流动过程和数据在企业中的应用过程来提供商务智能系统的主框架。
7、BI与交易系统的关系:系统设计的区别数据类型的区别8、数据、信息、知识、智能之间的关系(1)数据:孤立的客观事实、文字、符号,适合保存、传递和处理。
TO知识:是知识的表现形式,是知识的来源。
TO信息:数据的价值通过其携带的信息表现。
(2)信息:人们对数据进行系统的采集、组织、整理、分析的结果,目的是使数据结构化、有序化。
TO数据:信息是数据的含义,是对数据的解释。
TO知识:信息是知识的表现形式。
(3)知识:是人们对自认识而总结出来的规律、经验。
第二章数据仓库导论1、什么是数据仓库数据仓库是面向主题的、集成的、稳定的,不同时间的数据集合,用于支持经营管理中决策制定过程。
2、数据仓库的特点:面向主题;集成;稳定;随时间而变化;数据量大;软硬件要求高。
3、数据仓库与传统数据库的区别4、OLTP与OLAP的区别5、数据仓库的用户包括(1)信息使用者的数据仓库应用:以一种可以预测的、重复的方式使用。
商务智能复习题
題型:1、判斷10分2、簡答30分3、案例分析30分2題4、計算、操作30分第一章(理解)数据、信息与知识的关系书本图1.1 p4数据数据是可以记录、通信和能识别的符号,它通过有意义的组合来表达现实世界中的某种实体(具体对象、事件、状态或活动)的特征。
商务智能技术可以分析结构化数据、半结构化数据以及非结构化数据、静态的历史数据和动态数据流等各种类型的数据。
信息:有用的数据一个人的垃圾(数据)是另一个人的财富(信息)Data endowed with relevance and purpose信息是经过某种加工处理后的数据,是反映客观事物规律的一些数据。
数据是信息的载体, 信息是对数据的解释。
决策离不开信息同一事物的信息对于不同的个人或群体具有不同的意义。
信息的效用在于对决策的影响。
高层决策、中层管理、基层运营都要决策。
越来越多的人从事与信息有关的工作,信息产业将成为全球最大产业。
首席信息官CIO (Chief Information Officer) 成为企业继CEO、CFO之后又一重要职位。
70% of employee time spent searching for relevant information知识Information from the human mind (includes reflection, synthesis),知识是对信息内容进行提炼、比较、挖掘、分析、概括、判断和推论。
事实性知识和经验知识(隐性和显性)。
洞察力(insight)Requires reflection and synthesisDifficult to structure, captureOften tacit事物运动数据信息记录解释信息和知识隐藏在数据中商务智能要求有一个坚固、可靠的大型数据库作后盾,建立这样一个数据库的任务是极其艰巨的。
数据的质量问题也是令人头疼而又不可以掉以轻心的。
虽然数据是宝贵的财富,然而许多公司并不能充分利用这种财富,因为信息隐藏在数据中,并不易识别。
商务智能复习题精编版
商务智能复习题精编版 MQS system office room 【MQS16H-TTMS2A-MQSS8Q8-MQSH16898】一、选择题(本题共5道小题,每小题2分,共10分)1.数据仓库是随着时间变化的,下面的描述不正确的是(C)。
A.数据仓库随时间的变化不断增加新的数据内容B.捕捉到的新数据会覆盖原来的快照C.数据仓库随事件变化不断删去旧的数据内容D.数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合2.有关数据仓库的开发特点,不正确的描述是(B)。
A.数据仓库使用的需求在开发初期就要明确B.数据仓库开发要从数据出发C.数据仓库的开发是一个不断循环的过程,是启发式的开发D.在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式3.在有关数据仓库测试,下列说法不正确的是(D)。
A.在完成数据仓库的实施过程中,需要对数据仓库进行各种测试。
测试工作中要包括单元测试和系统测试。
B.当数据仓库的每个单独组件完成后,就需要对他们进行单元测试。
C.系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试。
D.在测试之前没必要制定详细的测试计划。
4.关于基本数据的元数据是指(D)。
A.基本元数据与数据源、数据仓库、数据集市和应用程序等结构相关的信息B.基本元数据包括与企业相关的管理方面的数据和信息C.基本元数据包括日志文件和简历执行处理的时序调度信息D.基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息6.下面关于数据粒度的描述不正确的是(C)。
A.粒度是指数据仓库小数据单元的详细程度和级别B.数据越详细,粒度就越小,级别也就越高C.数据综合度越高,粒度也就越大,级别也就越高D.粒度的具体划分将直接影响数据仓库中的数据量以及查询质量6.关于OLAP的特性,下面正确的是:(D)(1)快速性(2)可分析性(3)多维性(4)信息性(5)共享性A.(1)(2)(3)B.(2)(3)(4)C.(1)(2)(3)(4)D.(1)(2)(3)(4)(5)7.关于OLAP和OLTP的区别描述,不正确的是:(C)主要是关于如何理解聚集的大量不同的数据,它与OTAP应用程序不同。
商务智能复习题讲课稿
商务智能复习题讲课稿商务智能复习题一、选择题(本题共5道小题,每小题2分,共10分)1. 数据仓库是随着时间变化的,下面的描述不正确的是 ( C )。
A. 数据仓库随时间的变化不断增加新的数据内容B. 捕捉到的新数据会覆盖原来的快照C. 数据仓库随事件变化不断删去旧的数据内容D. 数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合2. 有关数据仓库的开发特点,不正确的描述是( B )。
A. 数据仓库使用的需求在开发初期就要明确B. 数据仓库开发要从数据出发C. 数据仓库的开发是一个不断循环的过程,是启发式的开发D. 在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式3. 在有关数据仓库测试,下列说法不正确的是 ( D )。
A. 在完成数据仓库的实施过程中,需要对数据仓库进行各种测试。
测试工作中要包括单元测试和系统测试。
B. 当数据仓库的每个单独组件完成后,就需要对他们进行单元测试。
C. 系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试。
D. 在测试之前没必要制定详细的测试计划。
4. 关于基本数据的元数据是指 ( D )。
A. 基本元数据与数据源、数据仓库、数据集市和应用程序等结构相关的信息B. 基本元数据包括与企业相关的管理方面的数据和信息C. 基本元数据包括日志文件和简历执行处理的时序调度信息D. 基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息6. 下面关于数据粒度的描述不正确的是 ( C )。
A. 粒度是指数据仓库小数据单元的详细程度和级别B. 数据越详细,粒度就越小,级别也就越高C. 数据综合度越高,粒度也就越大,级别也就越高D. 粒度的具体划分将直接影响数据仓库中的数据量以及查询质量6. 关于OLAP的特性,下面正确的是:( D )(1)快速性 (2)可分析性 (3)多维性 (4)信息性 (5)共享性A. (1) (2) (3)B. (2) (3) (4)C. (1) (2) (3) (4)D. (1) (2) (3) (4) (5)7. 关于OLAP和OLTP的区别描述,不正确的是: ( C )A. OLAP主要是关于如何理解聚集的大量不同的数据,它与OTAP 应用程序不同。
商务智能题库整理
商务智能--复习提纲一.选择题(第一次作业)1.数据仓库是随着时间变化的,下面的描述不正确的是AA.数据仓库随时间变化不断删去旧的数据内容B.捕捉到的新数据会覆盖原来的数据C.数据仓库随时间的变化不断增加新的数据内容D.数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合2 . OLAP在辅助决策时,基于用户建立的一系列假设驱动,通过OLAP来证实或者推翻这些假设是个()的过程CA集成B转换C演绎D归纳3 .不同操作型系统之间的数据一般是相互独立、异构的。
而数据仓库中的数据是对分散的数据进行抽取、清理、转换和汇总后得到的,这样就保证了数据仓库的数据关于整个企业的()DA时变性B非易失性C差异性D 一致性4 .如下图所示操作是OLAP 分析的哪种操作(D )A切片B旋转C下钻D上钻5 .数据立方体中的数据单元格是一个数值函数,该函数可以对数据立方体求值,如下哪个函数可以用来对数据立方体进行度量( )CA.substring()B.rand()C.sum()D.trunc()6 .关于数据仓库数据的时变性,如下描述不正确的是DA操作型系统存储的是当前数据,而数据仓库中的数据是历史数据B数据仓库中的数据是按照时间顺序追加的,它们都带有时间属性C数据仓库的数据时限一般要远远长于操作型数据的数据时限D数据仓库对响应时间要求不严格,处理时间从几秒到几分钟,有时甚至几小时7.数据仓库是面向主题的,逻辑意义上每一个商业主题都对应与企业决策包含的分析对象,一家保险公司的数据仓库的主题可能包含哪些BA顾客储蓄账B顾客、账户、索赔C顾客保险金额D顾客账单8 .假如警察要得到某犯罪嫌疑人在指定时间段的通话记录最有可能在(C )系统中获得A决策支持系统B电信营业账务系统C电信数据仓库系统D元数据管理系统9 .下面关于数据粒度的描述不正确的是BA数据综合度越高,粒度也就越大,级别也就越高B数据越详细,粒度就越小,级别也就越高C粒度是指数据仓库小数据单元的详细程度和级别D粒度的具体划分将直接影响数据仓库中的数据量以及查询质量10 .数据仓库并非只是数据的简单累积,而是要经过一系列的处理过程,即ETL,ETL过程包括哪些CA数据操作、数据挖掘、数据转义B数据存储、数据维护、数据分析C数据抽取、数据转换、数据装载D数据定义、数据建模、数据管理11 .企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的AA尽可能多的适合的数据B得分集数据是建模集数据的一部分C数据越多越好D以上三条都正确12 .关于基本数据的元数据是指DA基本元数据与数据源、数据仓库、数据集市和应用程序等结构相关的信息B基本元数据包括日志文件和简历执行处理的时序调度信息C基本元数据包括与企业相关的管理方面的数据和信息D基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息13 .数据立方体中的数据单元格中的数据可以通过如下哪些函数获得?AA 分布聚集函数count()、sum()、min()、max()和代数聚集函数avg()、stddev() B分析函数C 分布聚集函数count()、sum()、min()、max()D 聚集函数avg()、stddev()14 .关于OLAP和OLTP的说法,下列不正确的是BA . OLTP以应用为核心,是应用驱动的B . OLAP事务量大,但事务内容比较简单且重复率高C . OLAP的最终数据来源与OLTP不一样D . OLTP面对的是决策人员和高层管理人员15 .数据挖掘是通过( )的方式在海量数据中主动找寻模型,自动发掘隐藏在数据中的价值信息,OLAP分析结果为挖掘提供分析依据。
《商务智能》复习题及答案
《商务智能》复习题及答案1、把数据报表从一年展开成四个季度的操作是(C )A、上卷B、旋转C、下钻D、切片2、在多维数据集中,对某一个维度上的数据进行选择一维成员,其他维度没有变化的操作是( D)A、切块B、旋转C、下钻D、切片3、一个多维数组表示为:(维1,维2,维3,维4,变量),这是一个(B )维结构。
A、3B、4C、5D、64、一次购买行为的发起需要有:购买者、商家、商品、购买时间、供应商和订单金额。
如果设计星型模型,请问有几个维度(C )A、3B、4C、5D、65、在进行ETL时,应该在(C )里进行。
A、ODSB、数据仓库C、数据准备区D、源数据6、(多选题)此大数据带来的变革有(ABD ).A、思维变革B、商业变革C、购物变革D、管理变革7、自然演化式体系结构的问题有(ACD )。
(多选)A、数据可信性B、无法进行数据处理C、生产率问题D、无法将数据转化为信息8、数据立方体是指(C ).A、三维数据集B、三维以上的数据集C、三维和三维以上的数据集D、四维数据集'9、戈登·未尔提出在今后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度,每(D )左右可以翻一番。
A、1个月B、6个月C、12个月D、18个月10、大数据时代的核心价值是(B)A.数据收集B.数据分析C.数据挖掘D.数据可视化11、大数据的来源包括( ABCD).A.互联网数据B.传感器数据C.实时数据D.探测数据11、好友的QQ突然发来一个网站链接要求投票,最合理的做法是( C)A.因为是其好反信总,直接打开使接投票B.不参与任何投票C.可能是好友aq被盗,可能是恶意筑接。
先通过予机跟朋友确认链技按无异常,考虑是否投票D.把好友加入黑名单12、关于大数据特点,错误的是(C )A、数据量大B、数据类型多C.数据价值密度高D.数据处理速度快13、Hadop是基于(B )语言的数据分析框架。
A. C++B. JavaC. RD. C#14.Maphedue的主导思想是(C )A.集成化B.一体化C.分而治之D.综合化15.下列与大数据密切相关的技术是(B)A.蓝牙B.云计算C.博穿论D.WiFi16.大数据的数据类型包括结构化数据、非结构化数据和(A ).A.半结构化数据B.无结构化数据C.关系数据库数D.文本数据和WEe数报17.数据仓库中的数据(ABCD )A.集成的B.可以变化的C.面向主题的D.不易丢失的18.数据仓库是随着时间变化的。
商务智能方法与应用试题和答案
商务智能方法与应用试题和答案一、判断题:1、(对)OLAP的目标:是满足决策支持或多维环境特定的查询和报表需求2、(错)星型模型规范化数据,消除冗余,其业务层级和维度都将存储在数据模型之中。
3、(对)星型模型加载维度表,不需要再维度之间添加附属模型,ETL就相对简单,而且9、可以实现高度的并行化。
4、(对)雪花模型在维度表、事实表之间的连接很多,因此性能方面会比较低。
5、(对)雪花模型数据模型的业务层级是由一个不同维度表主键-外键的关系来代表的。
二、多选题。
1、(A、B、C、D)OLAP特性包括:A.快速性B.可分析性C.多维性D.信息性2、(AB)构造多维数据的方法有:A.超立方结构B.多立方结构C.平面结构3、(ABD)关于OLTP与OLAP的区别,说法正确的是:A.前者是细节性数据,后者是综合性和提炼性数据B.前者是当前值数据,后者是历史数据C.前者不可更新但周期性刷新,后者可更新D.前者一次处理的数据量小,后者一次处理的数据量大4、(ABCD)关于星型模型的说法中错误的是:A.规范化数据,消除冗余,其业务层级和维度都将存储在数据模型之中。
B.数据模型的业务层级是由一个不同维度表主键-外键的关系来代表的。
C.雪花模型在维度表、事实表之间的连接很多,因此性能方面会比较低。
D.雪花模型加载数据集市,ETL操作在设计上更加复杂,而且由于附属模型的限制,不能并行化。
5、(ABCD)关于雪花模型的说法中正确的是:A.规范化数据,消除冗余,其业务层级和维度都将存储在数据模型之中。
B.数据模型的业务层级是由一个不同维度表主键-外键的关系来代表的。
C.雪花模型在维度表、事实表之间的连接很多,因此性能方面会比较低。
D.雪花模型加载数据集市,ETL操作在设计上更加复杂,而且由于附属模型的限制,不能并行化。
三、单选题:1、(C)关于OLAP和数据挖掘的描述错误:A.OLAP是数据汇总/聚集工具,帮助简化数据分析B.数据挖掘要求能够自动的发现隐藏在海量数据中的有用信息和有价值的知识C.数据挖过程不包含数据描述和数据建模D.数据挖掘工具的目标是尽可能自动处理2、(B)关于OLTP的特性,说法错误的是:A.可更新B.一次处理的数据量大C.面向应用,事务驱动D.面向操作人员,支持日常操作3、(D)关于OLTP的特性,说法错误的是:A.不可更新,但周期性刷新B.一次处理的数据量大C.面向分析,分析驱动D.面向操作人员,支持日常操作8、(D)关于星型模型的特性,说法错误的是:A.反规范化数据,业务层级不会通过维度之间的参照完整性来部署。
《商务智能》考试复习内容-(含答案)
《商务智能》考试复习内容-(含答案)闭卷考试,时间120分钟,五种题型:选择题(10分)、判断题(10分)、名词解释题(30分)、简答题(30分)、论述题(20分)第1章商务智能基本知识(1)商务智能的概念、价值、驱动⼒。
概念:商务智能是企业利⽤现代信息技术收集、管理和分析结构化和⾮结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策⽔平,采取有效的商务⾏动,完善各种商务流程,提升各⽅⾯商务绩效,增强综合竞争⼒的智慧和能⼒-王茁专著《三位⼀体的商务智能》.商务智能解决⽅案远远不只是数据和技术的组合,帮助⽤户获得正确的数据,发现它的价值,并共享价值。
价值:() .⽀持各级决策基于事实和商业管理的(科学)的预测当前和未来的业务情况下获得历史业务数据的智能分析。
恰当准确客观及时驱动⼒:在商务智能背后有⼀些商业驱动⼒,例如:增加收⼊,减少费⽤和更有效地竞争的需求。
管理和模拟当前商业环境复杂性的需求。
减少费⽤和利⽤已有公司业务信息的需求。
(2)商务智能系统的功能、主要⼯具。
功能:在商务智能背后有⼀些商业驱动⼒,例如:增加收⼊,减少费⽤和更有效地竞争的需求。
管理和模拟当前商业环境复杂性的需求。
减少费⽤和利⽤已有公司业务信息的需求。
主要⼯具:第2章商务智能核⼼技术(1)商务智能系统的架构如何?(2)什么是数据仓库?数据仓库⽤来保存从多个数据库或其它信息源选取的数据, 并为上层应⽤提供统⼀⽤户接⼝,完成数据查询和分析。
⽀持整个企业范围的主要业务来建⽴的,主要特点是,包含⼤量⾯向整个企业的综合信息及导出信息。
数据仓库是作为服务基础的分析型,⽤来存放⼤容量的只读数据,为制定决策提供所需要的信息。
数据仓库是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的、⾯向主题及不可更新的数据集合。
以1992年W H 出版《》为标志,数据仓库发展速度很快。
W H 被誉为数据仓库之⽗。
W H 对数据仓库所下的定义:数据仓库是⾯向主题的、集成的、稳定的、随时间变化的数据集合,⽤以⽀持管理决策的过程。
商务智能方法与应用试题及答案
商务智能方法与应用试题及答案单选题1、什么是商务智能产生的驱动力()A、将企业内部的数据转换为利润B、商务智能也制定企业决策C、商务智能可帮助企业收集信息D、商务智能可将数据转换为信息,将信息转换为知识,进而支持企业进行决策2、淘宝的“猜你喜欢”功能是商务智能产生的什么原因的具体应用()A、急切的分析型需求B、企业的精细化管理需要商务智能C、知识产品化D、数据中蕴含的知识可以帮助企业进行优化升级3、智能化企业具有快速吸收新想法的能力、适应新情况的能力有效解决问题的能力、调用适当资源的能力、有效积累经验和知识的能力,其中适应新情况的能力有效解决问题的能力指的是什么()A、即企业在日常活动中,应具备快速接收新想法、新事物的能力,不能因循守旧,与时俱进才能把握市场动态,跟上时代的步伐B、即企业在面对不在了解、不熟悉等新领域出现的问题时,需要迅速适应新状况,并解决问题的能力C、即企业在面对任何一项工作的时候不能不合理的安排资源D、即在公司做任何一项工作的过程中,都会遇到各种各样的问题,在面对问题和解决问题的过程中就是积累经验和知识的过程4、数据是企业最重要的信息化资产,那么数据、知识、信息、决策之间的关系是如何递进的()A、数据产生为知识,知识转变为信息,信息支持决策B、数据产生为信息,知识转变为知识,知识支持决策C、数据产生为知识,知识支持决策,决策转变为信息D、数据产生为信息,信息支持决策,决策转变为知识5、商务智能是由业务层、技术层、()、组织层和战略层5个层面自下而上构成的层次机构A、运营层B、管理层C、功能层D、决策层6、商务智能的层次结构中,其中将企业ERP、CRM、SCM等企业系统数据集成在一次的层次结构属于()A、业务层B、技术层C、组织层D、战略层7、商务智能实施方案过程中是集数据采集、数据预处理、数据挖掘、数据可视化等关键技术与一体的,一般整个数据处理的过程中,占据整个处理过程花费80%左右时间的为()A、数据预处理B、数据挖掘C、数据集成D、数据可视化8、在数据集成的过程当中,一个数据源中的顾客编号为customer_id,另一个数据源中的顾客编号为cust_number,在两个数据源进行整合的过程中,如何识别customer_id和cust_number是同一属性,涉及到的数据集成中的()A、模式集成B、对象匹配和实体识别C、冗余和相关性分析D、数据冲突的监测和处理9、以下哪个选项不是数据仓库与操作型数据库的区别()A、操作型数据库的数据组织面向事务处理任务;数据仓库中的数据是按照一定的主题域进行组织。
商务智能复习题
一、选择题(本题共5道小题,每小题2分,共10分)1. 数据仓库是随着时间变化的,下面的描述不正确的是 ( C ).A. 数据仓库随时间的变化不断增加新的数据内容B. 捕捉到的新数据会覆盖原来的快照C. 数据仓库随事件变化不断删去旧的数据内容D. 数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合2. 有关数据仓库的开发特点,不正确的描述是( B ).A. 数据仓库使用的需求在开发初期就要明确B. 数据仓库开发要从数据出发C. 数据仓库的开发是一个不断循环的过程,是启发式的开发D. 在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式3. 在有关数据仓库测试,下列说法不正确的是 ( D ).A. 在完成数据仓库的实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统测试.B. 当数据仓库的每个单独组件完成后,就需要对他们进行单元测试.C. 系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试.D. 在测试之前没必要制定详细的测试计划.4. 关于基本数据的元数据是指 ( D ).A. 基本元数据与数据源、数据仓库、数据集市和应用程序等结构相关的信息B. 基本元数据包括与企业相关的管理方面的数据和信息C. 基本元数据包括日志文件和简历执行处理的时序调度信息D. 基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息6. 下面关于数据粒度的描述不正确的是 ( C ).A. 粒度是指数据仓库小数据单元的详细程度和级别B. 数据越详细,粒度就越小,级别也就越高C. 数据综合度越高,粒度也就越大,级别也就越高D. 粒度的具体划分将直接影响数据仓库中的数据量以及查询质量6. 关于OLAP的特性,下面正确的是:( D )(1)快速性 (2)可分析性 (3)多维性 (4)信息性 (5)共享性A. (1) (2) (3)B. (2) (3) (4)C. (1) (2) (3) (4)D. (1) (2) (3) (4) (5)7. 关于OLAP和OLTP的区别描述,不正确的是: ( C )A. OLAP主要是关于如何理解聚集的大量不同的数据,它与OTAP应用程序不同.B. 与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务.C. OLAP的特点在于事务量大,但事务内容比较简单且重复率高.D. OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的.8. 关于OLAP和OLTP的说法,下列不正确的是: ( A )A. OLAP事务量大,但事务内容比较简单且重复率高B. OLAP的最终数据来源与OLTP不一样C. OLTP面对的是决策人员和高层管理人员D. OLTP以应用为核心,是应用驱动的9. OLAP技术的核心是( D ).A. 在线性B. 对用户的快速响应C. 互操作性D. 多维分析10.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题( A )A. 关联规则B. 聚类C. 分类D. 自然语言处理11. 分析型CRM的( C )功能可以让CRM对所进行的销售活动相关信息进行存储和管理,将客户所发生的交易与互动事件转化为有意义、高获利的销售商机.A. 促销管理B. 个性化和标准化C. 客户分析和建模D. 客户沟通12. 运用关键绩效指标法设计组织关键绩效指标依次经过以下几个步骤( A ).A. 确定关键成功领域、确定关键绩效要素、确定关键绩效指标B. 计划目标、实施目标、评价结果、反馈C. 确定目标、比较目标、收集分析数据、系统学习与改进、评价和提高D. 确定长期整体目标、确定短期目标13.什么是KDD ( A )A. 知识发现B. 领域知识发现C. 文档知识发现D. 动态知识发现14. 呼叫中心是一种基于( D )的一种新的综合信息服务系统.A IT技术B CTI技术C WEB技术D CRM技术15. 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务 (C )A. 频繁模式挖掘B. 分类和预测C. 数据预处理D. 数据流挖掘16. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离 (B )A. 分类B. 聚类C. 关联分析D. 隐马尔可夫链17. 使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务(A )A. 探索性数据分析B. 建模描述C. 预测建模D. 寻找模式和规则18. 为数据的总体分布建模,把多维空间划分成组等问题属于数据挖掘的哪一类任务 ( B)A. 探索性数据分析B. 建模描述C. 预测建模D. 寻找模式和规则19. 建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务( C )A. 根据内容检索B. 建模描述C. 预测建模D. 寻找模式和规则20. 用户有一种感兴趣的模式并且希望在数据集中找到相似的模式,属于数据挖掘哪一类任务 ( A )A. 根据内容检索B. 建模描述C. 预测建模D. 寻找模式和规则21.下面哪种不属于数据预处理的方法 ( D )A. 变量代换B. 离散化C. 聚集D. 估计遗漏值22.下面哪个不属于数据的属性类型( D ).A. 标称B. 序数C. 区间D. 相异23. 在上题中,属于定量的属性类型是( C ).A. 标称B. 序数C. 区间D. 相异24. 只有非零值才重要的二元属性被称作( C ).A. 计数属性B. 离散属性C. 非对称的二元属性D. 对称属性25. 以下哪种方法不属于特征选择的标准方法 ( D ).A. 嵌入B. 过滤C. 包装D. 抽样26.下面不属于创建新属性的相关方法的是( C ).A. 特征提取B. 特征修改C. 映射数据到新的空间D. 特征构造27. 下面哪个属于映射数据到新的空间的方法 ( A )A. 傅立叶变换B. 特征加权C. 渐进抽样D. 维归约28. 企业所建立的预测模型的好坏取决于模型在( A )上的表现效果.A. 得分集B. 训练集C. 测试集D. 评价集29. 客户在经济活动中具有多重身份,下面哪一种不是其身份之一( C ).A. 行为身份B. 所有权身份C. 学习身份D. 决策身份30. 下列四条描述中,正确的一条是( B ).A. 企业实施数据挖掘,必须要有数据仓库.B. 企业要实施数据挖掘最好的方式是请编外专家.C. 企业购买现成数据挖掘模型的一个先决条件是:该企业的产品、客户、市场定位和所买来的现成模型设计之初的假设相吻合.D. 在建模的时侯,增益最高的模型就是最好的模型.31. 数据挖掘算法以( D )形式来组织数据.A. 行B. 列C. 记录D. 表格32. 企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的是( B ).A. 数据越多越好.B. 尽可能多的适合的数据.C. 得分集数据是建模集数据的一部分.D. 以上三条都正确.33. K—均值类别侦测要求输入的数据类型必须是( B ).A. 整型B. 数值型C. 字符型D. 逻辑型34. 在决策树和累计增益图的关系转化过程图中,决策树上某一页节点的增益与累计增益图上的( D )相对应.A. 线段长度B. 线段斜率C. 相对应的线段长度D. 相对应的线段斜率35. 企业为提升每个客户的价值,应实现( C )最优化.A. 促销活动B. 预算最优化C. 客户最优化D. 三者都不是36. 数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了( C )数据挖掘方法.A. 分类B. 预测C. 组合或关联法则D. 聚类37. 企业成功实施数据挖掘, 需要以下( B )知识或技术.A. 预先的规划B. 对商业文体的理解C. 综合商业知识和技能D. 都需要38. 下列哪个不是专门用于可视化时间空间数据的技术( B ).A. 等高线图B. 饼图C. 曲面图D. 矢量场图39. 在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是 ( D ).A. 有放回的简单随机抽样B. 无放回的简单随机抽样C. 分层抽样D. 渐进抽样40. 设X={1,2,3}是频繁项集,则可由X产生( C )个关联规则.A. 4B. 5C. 6D. 741. 概念分层图是( B )图.A. 无向无环B. 有向无环C. 有向有环D. 无向有环42. 以下哪些算法是分类算法( B ).A. DBSCANB. C4.5C. K-MeanD. EM43. 以下哪些分类方法可以较好地避免样本的不平衡问题( A ).A. KNNB. SVMC. BayesD. 神经网络44. 以下关于人工神经网络(ANN)的描述错误的有 ( A ).A. 神经网络对训练数据中的噪声非常鲁棒B. 可以处理冗余特征C. 训练ANN是一个很耗时的过程D. 至少含有一个隐藏层的多层神经网络45. 通过聚集多个分类器的预测来提高分类准确率的技术称为 ( A ) .A. 组合(ensemble)B. 聚集(aggregate)C. 合并(combination)D. 投票(voting)46. 简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作( B ).A. 层次聚类B. 划分聚类C. 非互斥聚类D. 模糊聚类47. 在基本K均值算法里,当邻近度函数采用( A )的时候,合适的质心是簇中各点的中位数.A. 曼哈顿距离B. 平方欧几里德距离C. 余弦距离D. Bregman散度48.( C )是一个观测值,它与其他观测值的差别如此之大,以至于怀疑它是由不同的机制产生的.A. 边界点B. 质心C. 离群点D. 核心点48. 检测一元正态分布中的离群点,属于异常检测中的基于( A )的离群点检测.A. 统计方法B. 邻近度C. 密度D. 聚类技术49. DBSCAN在最坏情况下的时间复杂度是( B ).A. O(m)B. O(m2)C. O(log m)D. O(mlog m)50. 关于K均值和DBSCAN的比较,以下说法不正确的是( A ).A. K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象.B. K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念.C. K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇.D. K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇.51. 使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务(A )A. 探索性数据分析B. 建模描述C. 预测建模D. 寻找模式和规则52.下面哪种不属于数据预处理的方法 ( D )A变量代换 B离散化 C 聚集 D 估计遗漏值二、判断题(本题共10道小题,每小题1分,共10分)( T )1.商务智能指收集、转换、分析和发布数据的过程,目的是为了更好的决策.( F )2.数据分析是整合企业原始数据的第一步,包括数据抽取、转换和装载三个过程.( T )3.维是人们观察数据的特定角度,是考虑问题时的一类属性.( F )4.独立的数据集市架构的优点是企业内数据一致,不会产生信息孤岛.( T )5. 星型模型的核心是事实表,事实表把各种不同的维表连接起来.( F )6.企业风险分析是通过对企业的经营成本进行综合评价,拟定一个企业成本的临界值.( T )7.衡量客户忠诚的唯一尺度就是客户是否重复或持久地购买企业的产品或者服务.( T )8.在BI中,DW是前提和基础,负责统一数据规则的处理和存储.( F )9.客户服务管理是对客户意见或投诉以及售前、售中、售后服务进行管理.( F )10. 平衡计分卡共包括三个层面,分别是财务层面、客户层面、内部业务流程层面.( T )11.数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务.( F )12.在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差.( F )13.OLAP是用来协助企业对响应事件或事务的日常商务活动进行处理.( T )14.数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用以支持管理决策的过程.( T )15. 数据预处理是整合企业原始数据的第一步,包括数据抽取、转换和装载三个过程.( F )16.决策树算法是国际上最早、最有影响力的决策树算法,( T )17.平衡计分卡是从财务、客户、内部运营、学习与成长四个角度,将组织的战略落实为可操作的衡量指标和目标值的一种新型绩效管理体系.( F )18.客户服务管理是对客户意见或投诉以及售前、售中、售后服务进行管理.( F )19. 企业绩效管理的目的在于进一步加强成本的事前控制,同时有助于通过盈亏分析,辅助产品科学的报价.20. 数据仓库的数据量越大,其应用价值也越大.F21. 啤酒与尿布的故事是聚类分析的典型实例.F22. 等深分箱法使每个箱子的记录个数相同.T23. 数据仓库“粒度”越细,记录数越少.F24. 数据立方体由3维构成,Z轴表示事实数据.F25. 决策树方法通常用于关联规则挖掘.F26. ID3算法是决策树方法的早期代表.T27. 是一种典型的关联规则挖掘算法.F28. 回归分析通常用于挖掘关联规则.F29. 人工神经网络特别适合解决多参数大复杂度问题.T30. 概念关系分析是文本挖掘所独有的.F31. 可信度是对关联规则的准确度的衡量.F32. 孤立点在数据挖掘时总是被视为异常、无用数据而丢弃.T33. SQL Server 2005不提供关联规则挖掘算法.F34. 决策树方法特别适合于处理数值型数据.F35. 数据仓库的数据为历史数据,从来不需要更新.T36. 数据立方体是广义知识发现的方法和技术之一.F37. 数据立方体的其中一维用于记录事实数据.T38. 数据挖掘的目标不在于数据采集策略,而在于对于已经存在的数据进行模式的发掘.( T )39. 图挖掘技术在社会网络分析中扮演了重要的角色.( T )40. 模式为对数据集的全局性总结,它对整个测量空间的每一点做出描述;模型则对变量变化空间的一个有限区域做出描述.( F )41. 寻找模式和规则主要是对数据进行干扰,使其符合某种规则以及模式.( F )42. 离群点可以是合法的数据对象或者值. ( T )43. 离散属性总是具有有限个值. ( F )44. 噪声和伪像是数据错误这一相同表述的两种叫法. ( F )45. 用于分类的离散化方法之间的根本区别在于是否使用类信息. ( T )46. 特征提取技术并不依赖于特定的领域. ( F )47. 可信度是对关联规则的准确度的衡量.F48. 定量属性可以是整数值或者是连续值. ( T )49. 可视化技术对于分析的数据类型通常不是专用性的. ( T )50. DSS主要是基于数据仓库、联机数据分析和数据挖掘技术的应用.( F )51. OLAP技术侧重于把数据库中的数据进行分析、转换成辅助决策信息,是继数据库技术发展之后迅猛发展起来的一种新技术. ( T )52. 商业智能系统与一般交易系统之间在系统设计上的主要区别在于:后者把结构强加于商务之上,一旦系统设计完毕,其程序和规则不会轻易改变;而前者则是一个学习型系统,能自动适应商务不断变化的要求. ( T )53. 数据仓库中间层OLAP服务器只能采用关系型OLAP. ( F )54.数据仓库系统的组成部分包括数据仓库、仓库管理、数据抽取、分析工具等四个部分. ( F )数据挖掘是通过数据库仲的一些属性来预测另一个属性,它在验证用户提出的假设过程中提取信息.( F )56. 关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则.( F )57. 聚类(clustering)是这样的过程:它找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象类. ( F )58. 分类和回归都可用于预测,分类的输出是离散的类别值,而回归的输出是连续数值.( T )59. 对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响. ( T )60. Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体. ( F )三、名词解释(本题共4道小题,每小题5分,共20分)1.商务智能商务智能是融合了先进信息技术与创新管理理念的结合体,集成企业内外数据,进行加工并从中提取能够创造商业价值的知识,面向企业战略并服务于管理层、业务层,指导企业经营决策,提升企业竞争力. 2.数据仓库数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用以支持管理决策的过程.3. 数据集成数据集成是在逻辑上或物理上把不相同来源、格式、特点的数据有机地整合,从而为企业提供全面的数据共享.4. OLAP(联机分析处理)OLAP是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术.5. 数据挖掘数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取正确的、有用的、未知的、综合的以及人们感兴趣的知识并用于决策支持的过程.6. 孤立点:指数据库中包含的一些与数据的一般行为或模型不一致的异常数据.7. 数据规范化:指将数据按比例缩放(如更换大单位),使之落入一个特定的区域(如0-1)以提高数据挖掘效率的方法.规范化的常用方法有:最大-最小规范化、零-均值规范化、小数定标规范化.8. 聚类:是将物理或抽象对象的集合分组成为多个类或簇(cluster)的过程,使得在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大.9. ROLAP:是基于关系数据库存储方式的,在这种结构中,多维数据被映像成二维关系表,通常采用星型或雪花型架构,由一个事实表和多个维度表构成.10. 数据归约:缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果.11. 预测型知识:是根据时间序列型数据,由历史的和当前的数据去推测未来的数据,也可以认为是以时间为关键属性的关联知识.12. 决策树:是用样本的属性作为结点,用属性的取值作为分支的树结构.它是分类规则挖掘的典型方法,可用于对新样本进行分类.13. 遗传算法:是一种优化搜索算法,它首先产生一个初始可行解群体,然后对这个群体通过模拟生物进化的选择、交叉、变异等遗传操作遗传到下一代群体,并最终达到全局最优.14. 知识管理:知识管理就是对一个企业集体的知识与技能的捕获,是为增强组织的绩效而创造、获取和使用知识的过程(知识的创造、储存、分享、应用和更新).15. Web挖掘:Web挖掘是从大量Web文档的集合C中发现隐含的、有用的模式P的过程:C→P .四、简答题(本题共5道小题,每小题6分,共30分)1.实现商务智能的四个阶段是什么答:实现商务智能的四个阶段是数据预处理、建立数据仓库、数据分析及数据展现.(2分)数据预处理是整合企业原始数据的第一步,包括数据抽取、转换和装载三个过程; (1分)数据仓库则是处理海量数据的基础; (1分)数据分析是体现系统智能的关键,一般采用OLAP和DM两大技术.(1分)数据展现则主要保障系统分析结果的可视化.(1分)2. 数据库系统的局限性①数据库适于存储高度结构化的日常事务细节数据.决策分析型数据是多维性,分析内容复杂.②在决策分析环境中,如果事务处理的细节数据量太大一方面会严重影响分析效率,另一方面这些细节数据会分散决策者的注意力.③当事务型处理环境和分析型处理环境在同一个数据库系统中,事务型处理对数据的存取操作频率高,操作处理的时间短,而分析型处理可能需要连续运行几个小时,从而消耗大量的系统资源.④决策型分析数据的数据量大,这些数据有来自企业内部的,也有来自企业外部的.来自企业外部的数据又可能来自不同的数据库系统,在分析时如果直接对这些数据操作会造成分析的混乱.对于外部数据中的一些非结构化数据,数据库系统常常是无能为力.3.数据仓库与数据集市的区别是什么数据仓库收集了关于整个组织的主题信息,因此是企业范围的.对于数据仓库,通常使用星座模式,因为它能对多个相关的主题建模;(3分)数据集市是数据仓库的一个部门子集,它针对选定的主题,因此是部门范围的.对于数据集市,流行星型或雪花模式,因为它们都适合对单个主题建模.(3分)4. OLAP的特点①快速性Fast:用户对OLAP的快速反应能力有很高的要求.②可分析性Analysis:OLAP系统应能处理与应用有关的任何逻辑分析和统计分析.③多维性Multidimensional:多维性是OLAP的关键属性.系统必须提供对数据的多维视图和分析,包括对层次维和多重层次维的完全支持.④信息性Information:OLAP系统应能及时获得信息,并且管理大容量信息.5.简述OLAP的基本操作有哪些答:OLAP的基本操作有:1. 切片和切块(Slice and Dice):在多维数据结构中,按二维进行切片,按三维进行切块,可得到所需要的数据.(2分)2. 钻取(Drill) :钻取包含向下钻取(Drill-down)和向上钻取(Drill-up)/上卷(Roll-up)操作,钻取的深度与维所划分的层次相对应.(2分)3. 旋转(Rotate)/旋转(Pivot):通过旋转可以得到不同视角的数据.(2分)6.简述OLAP 与数据挖掘的区别和联系.答:OLAP 侧重于与用户的交互、快速的响应速度及提供数据的多维视图,而数据挖掘则注重自动发现隐藏在数据中的模式和有用信息,尽管允许用户指导这一过程.(3分)OLAP 的分析结果可以给数据挖掘提供分析信息作为挖掘的依据,数据挖掘可以拓展OLAP 分析的深度,可以发现OLAP 所不能发现的更为复杂、细致的信息.(3分)7.何谓数据挖掘它有哪些方面的功能从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程称为数据挖掘.相关的名称有知识发现、数据分析、数据融合、决策支持等.数据挖掘的功能包括:概念描述、关联分析、分类与预测、聚类分析、趋势分析、孤立点分析以及偏差分析等.(3分)8.在数据挖掘之前为什么要对原始数据进行预处理原始业务数据来自多个数据库或数据仓库,它们的结构和规则可能是不同的,这将导致原始数据非常的杂乱、不可用,即使在同一个数据库中,也可能存在重复的和不完整的数据信息,为了使这些数据能够符合数据挖掘的要求,提高效率和得到清晰的结果,必须进行数据的预处理.为数据挖掘算法提供完整、干净、准确、有针对性的数据,减少算法的计算量,提高挖掘效率和准确程度. 9.简述数据预处理方法和内容.数据清洗:包括填充空缺值,识别孤立点,去掉噪声和无关数据.数据集成:将多个数据源中的数据结合起来存放在一个一致的数据存储中.需要注意不同数据源的数据匹配问题、数值冲突问题和冗余问题等.数据变换:将原始数据转换成为适合数据挖掘的形式.包括对数据的汇总、聚集、概化、规范化,还可能需要进行属性的重构.数据归约:缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果.10. 数据挖掘的六种常用算法和技术分别是什么①聚类分析;②分类分析;③关联分析;④序列模式挖掘;⑤回归分析;⑥时间序列分析.11. 数据挖掘中的数据需要采用哪些格式数据挖掘中的数据需要采用以下格式:①所有数据应该在一个表格/数据库视图中②每一行对应于与业务问题相关的一个案例③忽略具有单一值/几乎单一值的列④忽略所有行的值都不同的列⑤删除所有同义列⑥对于预测模型,目标列必须是可识别的12.简述K-近邻分类法的基本思想.答:基本思想:K-近邻分类是基于类比学习的,每个样本代表d维空间的一个点.(3分)当给定一个未知样本时,K-近邻分类法将搜索样本空间,找出最接近未知样本的K个训练样本,这K个训练样本是未知样本的K个“近邻”. (3分)13.关联规则挖掘能发现什么知识简述其挖掘的基本步骤.答:关联规则挖掘有助于发现交易数据库中不同商品之间的联系,找出顾客购买行为模式.(2分)关联规则挖掘可以分解为两个步骤:首先找出交易项目中满足最小支持度(minSupp)的项集(称其为频繁项集);(2分)然后由频繁项集生成关联规则,对于频繁项集A,若BA,且置信度confidence(BA-B)不小于最小置信度minConf,则BA-B构成关联规则.(2分)14.遗传算法与传统寻优算法相比有什么特点遗传算法为群体搜索,有利于寻找到全局最优解;遗传算法采用高效有方向的随机搜索,搜索效率高;遗传算法处理的对象是个体而不是参变量,具有广泛的应用领域;遗传算法使用适应值信息评估个体,不需要导数或其他辅助信息,运算速度快,适应性好;遗传算法具有隐含并行性,具有更高的运行效率.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
元数据库及元数据管理部件:元数据库用来存储由定义部件生成的关于源数据、目标数据、提取规则、转换规则以及源数据与数据仓库之间的映射信息等。
数据转换部件:该部件把数据从源数据中提取出来,依定义部件的规则将不同数据格式的源数据转换成数据仓库的数据格式并装载进数据仓库。
数据集成部件:该部件根据定义部件的规则、统一各源数据的编码规则,并净化数据,根据元数据中定义的数据组织形式对数据进行汇总、聚合计算。
(3)和的区别?
事务型处理():即操作型处理,是指对数据库的联机操作处理。事务型处理是用来协助企业对响应事件或事务的日常商务活动进行处理。它是事件驱动、面向应用的,通常是对一个或一组记录的增、删、改以及简单查询等(大量、简单、重复和例行性)。
在事务型处理环境中,数据库要求能支持日常事务中的大量事务,用户对数据的存取操作频率高而每次操作处理的时间短。
(9)什么是数据集市?与数据仓库的区别是什么?
数据仓库是企业级的,能为整个企业各部门的运行提供决策支持手段。而数据集市( )是部门级别的,一般只能为某个局部范围内的管理人员服务,也称为部门级的数据仓库。
数据集市有两种:独立的数据集市和从属的数据集市。
数据集市不是数据仓库
数据集市并非小的数据仓库
多个数据集市集合并不构成数据仓库
数据仓库管理部件:它主要用于维护数据仓库中的数据,备份、恢复数据以及管理数据的安全权限问题。
数据仓库前端工具集:
查询/报表工具:以图形化方式和报表方式显示数据,帮助了解数据的结构、关系以及动态性。
工具:通过对信息的多种可能的观察形式进行快速、一致和交互性的存取,便于用户对数据进行深入的分析和观察。
数据挖掘工具:从大量数据中挖掘出具有规律性的知识,以及数据之间的内在联系。
数据仓库是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的、面向主题及不可更新的数据集合。
以1992年W H 出版《 》为标志,数据仓库发展速度很快。 W H 被誉为数据仓库之父。
W H 对数据仓库所下的定义:数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用以支持管理决策的过程。
商务智能解决方案远远不只是数据和技术的组合,帮助用户获得正确的数据,发现它的价值,并共享价值。
价值:
() .
支持各级决策基于事实和商业管理的(科学)的预测当前和未来的业务情况下获得历史业务数据的智能分析。
恰当
准确
客观
及时
驱动力:
在商务智能背后有一些商业驱动力,例如:
增加收入,减少费用和更有效地竞争的需求。
(1)商务智能系统的架构如何?
(2)什么是数据仓库?
数据仓库用来保存从多个数据库或其它信息源选取的数据, 并为上层应用提供统一 用户接口,完成数据查询和分析。支持整个企业范围的主要业务来建立的,主要特点是,包含大量面向整个企业的综合信息及导出信息。
数据仓库是作为服务基础的分析型,用来存放大容量的只读数据,为制定决策提供所需要的信息。
对提取出来的数据进行集成:数据仓库中的数据是从多个应用领域中提取出来的,在不同的应用领域和不同的数据库系统中都有不同的结构和形式,所以如何对数据进行集成也是构建数据仓库的一个重要方面。
对进行高层决策的最终用户的界面支持:提供各种分析应用工具。
(5)数据仓库系统的组成。
源数据:数据仓库中的数据来源于多个数据源,它不仅可以是企业内部的关系型数据库,还包括非传统数据,如文件、文档等。
分析型处理():用于管理人员的决策分析,例如、 和多维分析等。它帮助决策者分析数据以察看趋向、判断问题。
分析型处理经常要访问大量的历史数据,支持复杂的查询。
分析型处理过程中经常用到外部数据,这部分数据不是由事务型处理系统产生的,而是来自于其他外部数据源。
(4)数据仓库的技术要求。
复杂分析的高性能体现:涉及大量数据的聚集、综合等,在进行复杂查询时经常会使用多表的联接、累计、分类、排序等操作。
闭卷考试,时间120分钟,五种题型:选择题(10分)判断题(10分)、名词解释题(30分)、简答题(30分)、论述题(20分)
第1章 商务智能基本知识
(1)商务智能的概念、价值、驱动力。
概念:
商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升各方面商务绩效,增强综合竞争力的智慧和能力-王茁专著《三位一体的商务智能》.
前端开发工具:提供用户编程接口,便于在现有系统的基础上进行二次开发,增强系统的伸缩性。
数据仓库:在数据仓库系统中,数据仓库是一个数据存储集合,它的存储形式通常有多维数据库,关系型数据库及其他存储方式。
(6)什么是星型模型?
(7)元数据的概念。
元数据:是用来描述数据的数据。它描述和定位数据组件、它们的起源及它们在数据仓库进程中的活动;关于数据和操作的相关描述(输入、计算和输出)。元数据可用文件存在元数据库中。元数据反映数据仓库中的数据项是从哪个特定的数据源填充的,经过哪些转换、集成过程。
管理和模拟当前商业环境复杂性的需求。
减少费用和利用已有公司业务信息的需求。
(2)商务智能系统的功能、主要工具。
功能:
在商务智能背后有一些商业驱动力,例如:
增加收入,减少费用和更有效地竞争的需求。
管理和模拟当前商业环境复杂性的需求。
减少费用和利用已有公司业务信息的需求。
主要工具:
第2章 商务智能核心技术
第3章 在线分析处理
(1)、的概念。
定义1 :(联机分析处理)是针对特定问题的联机数据访问和分析。通过对信息(维数据)的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。
定义2 :(联机分析处理) 是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。(委员会的定义)
(8)数据仓库中的粒度概念。
对数据仓库中的数据综合程度高低的一个度量,它既影响数据仓库中的数据量的多少,也影响数据仓库所能回答询问的种类。
粒度越小,综合程度越低,回答查询的种类越多; 粒度越高,综合程度越高,查询的效率也越高。
在数据仓库中可将小粒度的数据存储在低速存储器上;大粒度的数据存储在高速存储器上。