《商务智能方法与技术》复习资料-
商务智能复习文档
商务智能:Business Intelligence-由数据仓库(或数据集市)、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的、以辅助企业决策为目的一类技术及其应用-工业界-商务智能可以被看作是一类技术或工具,利用它们可以对大量的数据进行收集、管理、分析和挖掘,以改善业务决策水平,增强企业的竞争力-学术界-商务智能是一套理论、方法和应用,通过它们可以快速地发现海量数据中隐含的各种知识,有效地解决企业面临的管理和决策问题,支持企业的战略实施。
商务智能指收集、转换、分析和发布数据的过程,目的是为了更好的决策。
商务智能是指将数据转化为知识的过程。
它包括捕获和分析信息,交流信息,以及利用这些信息开发市场。
商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升商务绩效,增强综合竞争力的智慧和能力。
Business Intelligence is a process of turning data into knowledge and knowledge into action for business gain—Data Warehouse Institute商务智能是指透过资料的萃取、整合及分析,支持决策过程的技术和商业处理流程,其目的是为了使使用者能在决策的时候,尽可能得到更好的协助。
商务智能是运用数据仓库、在线分析和数据挖掘技术来处理和分析数据的技术,它允许用户查询和分析数据库,进而得出影响商业活动的关键因素,最终帮助用户做出更好、更合理的决策。
商务智能是通过利用多个数据源的信息以及应用经验和假设,来促进对企业动态性的准确理解,以便提高企业决策能力的一组概念、方法和过程的集合。
商务智能是通过获取与各个主题相关的高质量和有意义的信息来帮助人们分析信息、得出结论、形成假设的过程。
商务智能是融合了先进信息技术与创新管理理念的结合体,集成企业内外数据,进行加工并从中提取能够创造商业价值的知识,面向企业战略并服务于管理层、业务层,指导企业经营决策,提升企业竞争力。
商务智能复习的题目
商务智能复习的题目一、选择题(本题共5道小题,每小题2分,共10分)1、数据仓库就是随着时间变化得,下面得描述不正确得就是( C )。
A、数据仓库随时间得变化不断增加新得数据内容B、捕捉到得新数据会覆盖原来得快照C、数据仓库随事件变化不断删去旧得数据内容D、数据仓库中包含大量得综合数据,这些综合数据会随着时间得变化不断地进行重新综合2、有关数据仓库得开发特点,不正确得描述就是( B )。
A、数据仓库使用得需求在开发初期就要明确B、数据仓库开发要从数据出发C、数据仓库得开发就是一个不断循环得过程,就是启发式得开发D、在数据仓库环境中,并不存在操作型环境中所固定得与较确切得处理流,数据仓库中数据分析与处理更灵活,且没有固定得模式3、在有关数据仓库测试,下列说法不正确得就是 ( D )。
A、在完成数据仓库得实施过程中,需要对数据仓库进行各种测试。
测试工作中要包括单元测试与系统测试。
B、当数据仓库得每个单独组件完成后,就需要对她们进行单元测试。
C、系统得集成测试需要对数据仓库得所有组件进行大量得功能测试与回归测试。
D、在测试之前没必要制定详细得测试计划。
4、关于基本数据得元数据就是指 ( D )。
A、基本元数据与数据源、数据仓库、数据集市与应用程序等结构相关得信息B、基本元数据包括与企业相关得管理方面得数据与信息C、基本元数据包括日志文件与简历执行处理得时序调度信息D、基本元数据包括关于装载与更新处理,分析处理以及管理方面得信息6、下面关于数据粒度得描述不正确得就是 ( C )。
A、粒度就是指数据仓库小数据单元得详细程度与级别B、数据越详细,粒度就越小,级别也就越高C、数据综合度越高,粒度也就越大,级别也就越高D、粒度得具体划分将直接影响数据仓库中得数据量以及查询质量6、关于OLAP得特性,下面正确得就是:( D )(1)快速性 (2)可分析性 (3)多维性 (4)信息性 (5)共享性A、 (1) (2) (3)B、 (2) (3) (4)C、 (1) (2) (3) (4)D、 (1) (2) (3) (4) (5)7、关于OLAP与OLTP得区别描述,不正确得就是: ( C )A、OLAP主要就是关于如何理解聚集得大量不同得数据,它与OTAP应用程序不同。
复习范围商务智能
一、选择题(5道,10分) 二、判断题(10道,10分) 三、名词解释(4道,20分)商务智能 数据仓库 数据挖掘 绩效管理企业经营分析系统. 平衡计分卡 数据规范化 ROLAP 决策树四、简答题(5道,30分)1. 简述数据、信息和知识之间的关系。
2. 画出商务智能的系统架构图,实现其功能的三大技术是什么?3. 实现商务智能的四个阶段是什么?4. 何谓数据仓库?为什么要建立数据仓库?5. 简述OLAP 与数据挖掘的区别和联系。
6. 简述OLAP 的基本操作有哪些?7. 简述数据挖掘从技术角度的定义和含义。
8. 何谓数据挖掘?它有哪些方面的功能?9. 在数据挖掘之前为什么要对原始数据进行预处理? 10. 简述构造智能CRM 系统的完整步骤。
11. 简述智能CRM 系统的特点。
12. 影响客户流失的因素有哪些?13. 简述客户流失模型的建立和应用过程。
14. 简述K-近邻分类法的基本思想。
15. 主成分分析法的基本思想是什么?16. 什么是决策树?ID3算法的步骤是什么? 17. 简述K-近邻分类法的基本思想。
18. 关联规则挖掘能发现什么知识?简述关联规则挖掘的基本步骤。
19. 什么是绩效管理?目的是什么?20. 什么是平衡计分卡?设计平衡计分卡的目的是什么? 五、计算题(10分)给定如下要进行聚类的元组:{3,5,11,13,4,21,31,12,26},假设分为2类,即K 1=2,初始时用前两个数值作为类的均值:m=3 和 m=5。
假设给定如下元组:{3,5,11,13,4,21,31,12,26}已分为两类:K1={3,4,5,110,12,13} 和 K2={21,31,26},应用K-近邻法判断元组x=16属于哪一类?设K=3,写出判断过程。
T )X ,X ,X (X 321=的协方差矩阵⎪⎪⎪⎭⎫ ⎝⎛--=200052021A 的特征值和特征向量分别为:)0,924.0,383.0(e 83.5T11-==,λ,)1,0,0(e 00.2T 22==,λ,)0,383.0,924.0(e 17.0T33==,λ,求X 的主成分,计算其贡献率。
《商务智能》复习题及答案
《商务智能》复习题及答案1、把数据报表从一年展开成四个季度的操作是(C )A、上卷B、旋转C、下钻D、切片2、在多维数据集中,对某一个维度上的数据进行选择一维成员,其他维度没有变化的操作是( D)A、切块B、旋转C、下钻D、切片3、一个多维数组表示为:(维1,维2,维3,维4,变量),这是一个(B )维结构。
A、3B、4C、5D、64、一次购买行为的发起需要有:购买者、商家、商品、购买时间、供应商和订单金额。
如果设计星型模型,请问有几个维度(C )A、3B、4C、5D、65、在进行ETL时,应该在(C )里进行。
A、ODSB、数据仓库C、数据准备区D、源数据6、(多选题)此大数据带来的变革有(ABD ).A、思维变革B、商业变革C、购物变革D、管理变革7、自然演化式体系结构的问题有(ACD )。
(多选)A、数据可信性B、无法进行数据处理C、生产率问题D、无法将数据转化为信息8、数据立方体是指(C ).A、三维数据集B、三维以上的数据集C、三维和三维以上的数据集D、四维数据集'9、戈登·未尔提出在今后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度,每(D )左右可以翻一番。
A、1个月B、6个月C、12个月D、18个月10、大数据时代的核心价值是(B)A.数据收集B.数据分析C.数据挖掘D.数据可视化11、大数据的来源包括( ABCD).A.互联网数据B.传感器数据C.实时数据D.探测数据11、好友的QQ突然发来一个网站链接要求投票,最合理的做法是( C)A.因为是其好反信总,直接打开使接投票B.不参与任何投票C.可能是好友aq被盗,可能是恶意筑接。
先通过予机跟朋友确认链技按无异常,考虑是否投票D.把好友加入黑名单12、关于大数据特点,错误的是(C )A、数据量大B、数据类型多C.数据价值密度高D.数据处理速度快13、Hadop是基于(B )语言的数据分析框架。
A. C++B. JavaC. RD. C#14.Maphedue的主导思想是(C )A.集成化B.一体化C.分而治之D.综合化15.下列与大数据密切相关的技术是(B)A.蓝牙B.云计算C.博穿论D.WiFi16.大数据的数据类型包括结构化数据、非结构化数据和(A ).A.半结构化数据B.无结构化数据C.关系数据库数D.文本数据和WEe数报17.数据仓库中的数据(ABCD )A.集成的B.可以变化的C.面向主题的D.不易丢失的18.数据仓库是随着时间变化的。
商务智能的考试重点
1.商务智能的基本概念(简答)对工业界来说,商务智能是一类技术或工具,利用他们可以对大量的数据进行收集、管理、分析和挖掘,以改善业务决策水平,增强企业竞争力。
对学术界来说,商务智能是一套理论、方法、和应用,通过他们可以快速的发现海量数据中隐含的各种知识,有效的解决企业面临的管理和决策问题,支持企业的战略实施。
2.商务智能系统的开发过程3.在线分析处理和在线事务处理(简答)4.决策支持系统的系统架构(1)模型库管理系统主要用于管理决策所需的各种模型,例如财务、统计、预测以及管理等方面的定量模型,利用这些模型可以进行问题分析。
用户利用该系统可以方便快捷的构建和操纵模型。
系统提供对模型的分类、删除、复制等维护功能,可以将已有模型进行合并,以及对模型的执行情况进行跟踪、分析和评价,如对变量进行敏感度分析等。
(2)知识库管理系统提供知识的表示、存储和管理功能,用于支持定量模型无法解决的决策过程,帮助用户建立、应用和管理描述性、过程性和推理性知识。
(3)对话产生与管理系统主要负责用户与系统之间的交互。
接受用户的输入,能够与数据库管理系统、模型库管理系统和知识库管理系统进行交互,以各种形式将结果返回给用户,提供图形用户界面以及可视化功能。
6.回归:回归方法中最常用的是线性回归,包括一元线性回归、多元线性回归以及非线性回归。
线性回归方法不仅用于预测,也可以用作解释模型,以探寻变量之间的关系。
另外还有回归树和模型树等模型。
7.回归系数的显著性检验:回归系数的显著性检验可以采用t检验。
对于每个回归系数bi(i=1,2,....k),显著性检验的两个假设分别为H0:bi=0和H1:bi≠0。
若bi=0说明自变量xi的变化对因变量没有线性影响,即变量xi对因变量的影响不显著。
为每个回归系数b i 构造变量tbi如式所示:式中cii是对矩阵C=(X T X)-1的对角线上的第i个值。
给定显著性水平α,查自由度为(n-k-1)的t分布表,得到tα(n-k-1),若t bi>t α(n-k-1),则拒绝假设H0,即回归系数b i显著。
关于商务智能复习题
一、选择题(本题共5道小题,每小题2分,共10分)1. 数据仓库是随着时间变化的,下面的描述不正确的是( C )。
A. 数据仓库随时间的变化不断增加新的数据内容B. 捕捉到的新数据会覆盖原来的快照C. 数据仓库随事件变化不断删去旧的数据内容D. 数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合2. 有关数据仓库的开发特点,不正确的描述是( B )。
A. 数据仓库使用的需求在开发初期就要明确B. 数据仓库开发要从数据出发C. 数据仓库的开发是一个不断循环的过程,是启发式的开发D. 在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式3. 在有关数据仓库测试,下列说法不正确的是( D )。
A. 在完成数据仓库的实施过程中,需要对数据仓库进行各种测试。
测试工作中要包括单元测试和系统测试。
B. 当数据仓库的每个单独组件完成后,就需要对他们进行单元测试。
C. 系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试。
D. 在测试之前没必要制定详细的测试计划。
4. 关于基本数据的元数据是指( D )。
A. 基本元数据与数据源、数据仓库、数据集市和应用程序等结构相关的信息B. 基本元数据包括与企业相关的管理方面的数据和信息C. 基本元数据包括日志文件和简历执行处理的时序调度信息D. 基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息6. 下面关于数据粒度的描述不正确的是( C )。
A. 粒度是指数据仓库小数据单元的详细程度和级别B. 数据越详细,粒度就越小,级别也就越高C. 数据综合度越高,粒度也就越大,级别也就越高D. 粒度的具体划分将直接影响数据仓库中的数据量以及查询质量6. 关于OLAP的特性,下面正确的是:( D )(1)快速性(2)可分析性(3)多维性(4)信息性(5)共享性A. (1) (2) (3)B. (2) (3) (4)C. (1) (2) (3) (4)D. (1) (2) (3) (4) (5)7. 关于OLAP和OLTP的区别描述,不正确的是:( C )A. OLAP主要是关于如何理解聚集的大量不同的数据,它与OTAP应用程序不同。
商务智能复习资料(必读)
商务智能复习纲要第1章 商务智能概述1.1 商业决策需要商务智能一、数据、信息和知识1、数据:符号、事实和数字 信息:有用的数据 关系:信息是经过某种加工处理后的数据,是反映客观事物规律的一些数据。
数据是信息的载体,信息是对数据的解释。
知识:对信息内容进行提炼、比较、挖掘、分析、概括、判断和推论。
2、决策离不开信息、知识①决策需要信息,更离不开知识;知识更多地表现为经验--学习的结晶;学习的过程是不断地对信息加工处理;信息的收集、加工、传输与利用贯穿着决策各阶段的工作过程。
②信息已成为企业经营中重要性仅次于人才的第二大要素。
③决策=信息+经验+冒险④商务智能是对企业信息的科学管理。
3、商务智能支持商业决策商务智能如何创造知识和价值1.2 商务智能简介商务智能这一术语1996年由 Gartner 公司的分析师Howard Dresner 首次提出,他提出商务智能描述了一系列的概念和方法,通过应用基于事实的支持系统来辅助商业决策的制定。
一、商务智能概念事物运动 数据 信息记录解释商务智能是整合了先进信息技术与创新管理理念的结合体,集成了企业内外的数据,进行加工并从中提取能够创造商业价值的信息,面向企业战略并服务于管理层、业务层,指导企业经营决策,提升企业竞争力,涉及企业战略、管理思想、业务整合和技术体系等层面,促进信息到知识再到利润的转变,从而实现更好的绩效。
①先进信息技术:商务智能是多项技术的综合应用;②集成了企业内外的数据,进行加工并从中提取能够创造商业价值的信息:商务智能的层次;③企业战略:商务智能服务于企业战略;④管理层、业务层:商务智能用户多样性;⑤更好的绩效:商务智能提升企业绩效。
二、商务智能的价值1、在商务智能背后有一些商业驱动力,如:①增加收入,减少费用和更有效地竞争的需求。
②管理和模拟当前商业环境复杂性的需求。
③减少IT费用和利用已有公司业务信息的需求。
2、商务智能的价值①制定合适的市场营销策略;②改善顾客智能;③经营成本与收入分析;④提高风险管理能力;⑤改善业务洞察力;⑥提高市场响应能力。
《商务智能方法与技术》复习资料
商务智能方法与技术》课程复习资料、客观部分:(判断、不定项选择)一)、判断部分★ 考核知识点: 商务智能系统附1.1.1 (考核知识点解释):商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升各方面商务绩效,增强综合竞争力的智慧和能力。
商务智能不是通常的业务处理。
它的目标是如何更快、更容易地做更好的决卒策。
IBM商务智能解决方案远远不只是数据和技术的组合,BI帮助用户获得正确的数据,发现它的价值,并共享价值。
★ 考核知识点: 知识概念附1.1.2 (考核知识点解释):知识就是对信息进行的提炼、比较、挖掘、分析、概括、判断和推论。
知识分为事实性知识和经验知识。
事实性知识是人类对于客观事物和现象的认识结果。
经验知识多事一种隐性知识,是存储在人们大脑中的经历、经验、技巧、体会和感悟等尚未公开的知识。
隐性知识和显性知识之间是可以相互转化的。
★考核知识点: 元数据附1.1.3 (考核知识点解释):元数据管理包括对开发、管理数据仓库时所用的技术元数据和支持业务人员的业务元数据进行管理,它对数据仓库的设计和维护具有重要的作用。
数据仓库的所有数据都要通过元数据来管理和控制。
元数据描述关于源数据的说明,包括源数据的来源、源数据的名称、源数据的定义、源数据的创建时间等对源数据进行管理所需要的信息。
源数据的来源说明源数据是从哪个系统、哪个历史数据、哪个办公数据、哪个Web 页、哪个外部系统抽取而来。
源数据说明源数据在数据仓库的作用、用途、数据类型和长度等。
元数据:是用来描述数据的数据。
它描述和定位数据组件、它们的起源及它们在数据仓库进程中的活动;关于数据和操作的相关描述( 输入、计算和输出) 。
元数据可用文件存在元数据库中。
元数据反映数据仓库中的数据项是从哪个特定的数据源填充的,经过哪些转换、集成过程。
商务智能复习资料
商务智能复习资料第一章商务智能概述1、4C(1)信息技术是指获取、传递、处理和存储、以及利用信息的技术。
(2)4C内容:感测技术(是信息的采集技术,对应于人的感觉器官);通讯技术(是信息的传递技术,对应于人的神经系统);计算机技术(是信息的处理和存储技术,对应于人的思维器官);控制技术(是信息的使用技术,对应于人的执行器官)。
(3)信息技术工具:信息处理技术和通信技术是最重要的两种。
2、定义商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累积商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升个方面商务绩效,增强综合竞争力的智慧和能力。
3、商务智能的基本功能:个性化的信息分析;预测;辅助决策。
5、商务智能的作用:理解业务;衡量绩效;改善关系;创造获利机会。
6、商务智能的体系结构:是指通过识别和理解数据在系统中的流动过程和数据在企业中的应用过程来提供商务智能系统的主框架。
7、BI与交易系统的关系:系统设计的区别数据类型的区别8、数据、信息、知识、智能之间的关系(1)数据:孤立的客观事实、文字、符号,适合保存、传递和处理。
TO知识:是知识的表现形式,是知识的来源。
TO信息:数据的价值通过其携带的信息表现。
(2)信息:人们对数据进行系统的采集、组织、整理、分析的结果,目的是使数据结构化、有序化。
TO数据:信息是数据的含义,是对数据的解释。
TO知识:信息是知识的表现形式。
(3)知识:是人们对自认识而总结出来的规律、经验。
第二章数据仓库导论1、什么是数据仓库数据仓库是面向主题的、集成的、稳定的,不同时间的数据集合,用于支持经营管理中决策制定过程。
2、数据仓库的特点:面向主题;集成;稳定;随时间而变化;数据量大;软硬件要求高。
3、数据仓库与传统数据库的区别4、OLTP与OLAP的区别5、数据仓库的用户包括(1)信息使用者的数据仓库应用:以一种可以预测的、重复的方式使用。
南开20秋学期(2009)《商务智能方法与技术》在线作业学习资料
南开20秋学期(2009 )《商务智能方法与技术》在线作业注:本科有多套试卷,请核实是否为您所需要资料,本资料只做参考学习使用!!!一、单选题 (共 12 道试题,共 24 分)1.()是一种以规范化的方式构造端到端的业务流程为中心,以持续地提高组织绩效为目的的系统化方法/A.知识管理/B.信息化管理/C.方法管理/D.业务流程管理提示:题目难度适中,请学习本科目相关知识,并作出准确作答【参考答案是】:D2.知识管理就是对信息的管理是哪个知识管理学派的说法()/A.行为学派/B.技术学派/C.管理学派/D.综合学派提示:题目难度适中,请学习本科目相关知识,并作出准确作答【参考答案是】:B3.从源数据中提取数据,转换成数据仓库所要求的格式后存储在数据仓库的()中。
/A.数据缓冲区/B.数据转换区/C.数据存储区/D.数据准备区提示:题目难度适中,请学习本科目相关知识,并作出准确作答【参考答案是】:D4.OLAP系统应能处理与应用有关的任何逻辑分析和统计分析,此描述是指OLAP的哪个特性。
/A.快速性/B.可分析性/C.多维性/D.信息性提示:题目难度适中,请学习本科目相关知识,并作出准确作答【参考答案是】:B5.OLAP分析属于哪种驱动型发现。
/A.验证驱动型/B.经验驱动型/C.事实驱动型/D.发现驱动型提示:题目难度适中,请学习本科目相关知识,并作出准确作答【参考答案是】:A6.归咎(imputation)是处理()的一种方法。
/A.数据分析/B.数据准备/C.数据质量/D.空缺值提示:题目难度适中,请学习本科目相关知识,并作出准确作答【参考答案是】:D7.数据仓库的哪个特性可保证在较高层次上对分析对象的数据给出完整、一致的描述,能完整、统一的刻画各个分析对象所涉及的企业的各项数据以及数据之间的联系。
/A.面向主题/B.集成性/C.稳定性/D.时变性提示:题目难度适中,请学习本科目相关知识,并作出准确作答【参考答案是】:A8.()是结构化、可以用语言、文字进行口头或书面表达的/A.显性知识/B.隐形知识/C.两者皆可/D.两者都不可提示:题目难度适中,请学习本科目相关知识,并作出准确作答【参考答案是】:A9.()是人们观察数据的特定角度,是考虑问题时的一类属性。
《商务智能》复习题及答案
《商务智能》复习题及答案1、把数据报表从一年展开成四个季度的操作是(C )A、上卷B、旋转C、下钻D、切片2、在多维数据集中,对某一个维度上的数据进行选择一维成员,其他维度没有变化的操作是( D)A、切块B、旋转C、下钻D、切片3、一个多维数组表示为:(维1,维2,维3,维4,变量),这是一个(B )维结构。
A、3B、4C、5D、64、一次购买行为的发起需要有:购买者、商家、商品、购买时间、供应商和订单金额。
如果设计星型模型,请问有几个维度(C )A、3B、4C、5D、65、在进行ETL时,应该在(C )里进行。
A、ODSB、数据仓库C、数据准备区D、源数据6、(多选题)此大数据带来的变革有(ABD ).A、思维变革B、商业变革C、购物变革D、管理变革7、自然演化式体系结构的问题有(ACD )。
(多选)A、数据可信性B、无法进行数据处理C、生产率问题D、无法将数据转化为信息8、数据立方体是指(C ).A、三维数据集B、三维以上的数据集C、三维和三维以上的数据集D、四维数据集'9、戈登·未尔提出在今后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度,每(D )左右可以翻一番。
A、1个月B、6个月C、12个月D、18个月10、大数据时代的核心价值是(B)A.数据收集B.数据分析C.数据挖掘D.数据可视化11、大数据的来源包括( ABCD).A.互联网数据B.传感器数据C.实时数据D.探测数据11、好友的QQ突然发来一个网站链接要求投票,最合理的做法是( C)A.因为是其好反信总,直接打开使接投票B.不参与任何投票C.可能是好友aq被盗,可能是恶意筑接。
先通过予机跟朋友确认链技按无异常,考虑是否投票D.把好友加入黑名单12、关于大数据特点,错误的是(C )A、数据量大B、数据类型多C.数据价值密度高D.数据处理速度快13、Hadop是基于(B )语言的数据分析框架。
A. C++B. JavaC. RD. C#14.Maphedue的主导思想是(C )A.集成化B.一体化C.分而治之D.综合化15.下列与大数据密切相关的技术是(B)A.蓝牙B.云计算C.博穿论D.WiFi16.大数据的数据类型包括结构化数据、非结构化数据和(A ).A.半结构化数据B.无结构化数据C.关系数据库数D.文本数据和WEe数报17.数据仓库中的数据(ABCD )A.集成的B.可以变化的C.面向主题的D.不易丢失的18.数据仓库是随着时间变化的。
《商务智能》考试复习内容-(含答案)
《商务智能》考试复习内容-(含答案)闭卷考试,时间120分钟,五种题型:选择题(10分)、判断题(10分)、名词解释题(30分)、简答题(30分)、论述题(20分)第1章商务智能基本知识(1)商务智能的概念、价值、驱动⼒。
概念:商务智能是企业利⽤现代信息技术收集、管理和分析结构化和⾮结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策⽔平,采取有效的商务⾏动,完善各种商务流程,提升各⽅⾯商务绩效,增强综合竞争⼒的智慧和能⼒-王茁专著《三位⼀体的商务智能》.商务智能解决⽅案远远不只是数据和技术的组合,帮助⽤户获得正确的数据,发现它的价值,并共享价值。
价值:() .⽀持各级决策基于事实和商业管理的(科学)的预测当前和未来的业务情况下获得历史业务数据的智能分析。
恰当准确客观及时驱动⼒:在商务智能背后有⼀些商业驱动⼒,例如:增加收⼊,减少费⽤和更有效地竞争的需求。
管理和模拟当前商业环境复杂性的需求。
减少费⽤和利⽤已有公司业务信息的需求。
(2)商务智能系统的功能、主要⼯具。
功能:在商务智能背后有⼀些商业驱动⼒,例如:增加收⼊,减少费⽤和更有效地竞争的需求。
管理和模拟当前商业环境复杂性的需求。
减少费⽤和利⽤已有公司业务信息的需求。
主要⼯具:第2章商务智能核⼼技术(1)商务智能系统的架构如何?(2)什么是数据仓库?数据仓库⽤来保存从多个数据库或其它信息源选取的数据, 并为上层应⽤提供统⼀⽤户接⼝,完成数据查询和分析。
⽀持整个企业范围的主要业务来建⽴的,主要特点是,包含⼤量⾯向整个企业的综合信息及导出信息。
数据仓库是作为服务基础的分析型,⽤来存放⼤容量的只读数据,为制定决策提供所需要的信息。
数据仓库是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的、⾯向主题及不可更新的数据集合。
以1992年W H 出版《》为标志,数据仓库发展速度很快。
W H 被誉为数据仓库之⽗。
W H 对数据仓库所下的定义:数据仓库是⾯向主题的、集成的、稳定的、随时间变化的数据集合,⽤以⽀持管理决策的过程。
商务智能方法与技术
一、客观部分:(判断、不定项选择)(一)、判断部分1.数据仓库与知识管理系统的结合就是商务智能系统。
()★考核知识点:商务智能系统,参见P7-P9 参见译者序、P5附 1.1.1(考核知识点解释):商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升各方面商务绩效,增强综合竞争力的智慧和能力。
商务智能不是通常的业务处理。
它的目标是如何更快、更容易地做更好的决策。
IBM商务智能解决方案远远不只是数据和技术的组合,BI帮助用户获得正确的数据,发现它的价值,并共享价值。
2.显性知识是指存在于人头脑中的隐性的、非结构化、不可编码的知识,是关于个人的思想、经验等。
()★考核知识点:知识概念,参见P4附 1.1.2(考核知识点解释):知识就是对信息进行的提炼、比较、挖掘、分析、概括、判断和推论。
知识分为事实性知识和经验知识。
事实性知识是人类对于客观事物和现象的认识结果。
经验知识多事一种隐性知识,是存储在人们大脑中的经历、经验、技巧、体会和感悟等尚未公开的知识。
隐性知识和显性知识之间是可以相互转化的。
3.元数据是数据仓库中非常重要的数据。
()★考核知识点:元数据,参见P39 参见P24-P26附 1.1.3(考核知识点解释):元数据管理包括对开发、管理数据仓库时所用的技术元数据和支持业务人员的业务元数据进行管理,它对数据仓库的设计和维护具有重要的作用。
数据仓库的所有数据都要通过元数据来管理和控制。
元数据描述关于源数据的说明,包括源数据的来源、源数据的名称、源数据的定义、源数据的创建时间等对源数据进行管理所需要的信息。
源数据的来源说明源数据是从哪个系统、哪个历史数据、哪个办公数据、哪个Web页、哪个外部系统抽取而来。
源数据说明源数据在数据仓库的作用、用途、数据类型和长度等。
元数据:是用来描述数据的数据。
商务智能1复习
数据仓库结构体系
♠ 数据仓库用来保存从多个数据库或其它信息源选
取的数据,并为上层应用提供统一用户接口,完成 数据查询和分析。
♠ 数据仓库是为支持整个企业范围的主要业务来建
立的,主要特点是:包含大量面向整个企业的综合 信息及导出信息。
♠ 作为一种数据环境必要功能包括:
☆ 数据收集 ☆ 数据存储 ☆ 数据传递
数据挖掘 借助数据库技术,使用统计分析的数学方法以及人工智能的算 技术 法,从海量数据中提取隐含的、有用的知识,挖掘数据背后隐 藏的规律和模式
第二章 数据仓库
• 决策的制定需要关于当前运作、趋势和变化的明 确、可靠的信息,而数据往往是分散于不同的操 作系统下,所以管理者常常是至多基于部分信息 来做出所谓的决策。数据仓库通过访问、整合、 组织关键业务数据使其一致、可靠、及时和可 用,排除了障碍,使得数据实现了随时随地地取 用。
联机分析 根据用户的要求设计多维模型,生成井存储多维数据结构,以 处理 便在响应查询时能尽快找到满足条件的数据;通过OLAP可以全 方位、多层次地考察数据
前端分析 提供简单易用的图形化界面给管理人员或一般用户,由他们自 展示 有选择要分析的数据、定义分析角度和需要显示的结果。该部 分往往与多维分析工具配合,作为多维分析服务器的前台界面
• (3)使用按箱中值平滑对以上数据进行平滑,箱 的深度是3。
进行分箱: 箱1:11,15,16 箱2:22,22,25 箱3:32,35,35 箱4:46,52,70 (1)箱1平均值为 (11+15+16)/3=14 箱2的平均值为 (22+22+25)/3=23 箱3的平均值为 (32+35+35)/3=34 箱4的平均值为 (46+52+70)/3=56
XXX《商务智能方法与技术》19秋期末考核作业资料答案
XXX《商务智能方法与技术》19秋期末考核作业资料答案题目】数据仓库系统的哪个部件负责将数据进行清洗、转换和整合,以保证数据的一致性和准确性?A.数据集成部件B.元数据管理部件C.查询和分析部件D.数据存储部件解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:A题目】商务智能的核心是什么?A.数据分析B.数据挖掘C.数据可视化D.数据集成解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:A题目】以下哪个不是商务智能系统的三层架构之一?A.数据挖掘层B.数据存储层C.数据分析层D.数据采集层解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:D题目】以下哪个不是数据仓库系统的四个基本特征之一?A.主题导向B.集成性C.时变性D.分布式解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:D题目】以下哪个不是数据挖掘的主要任务之一?A.分类B.聚类C.关联规则挖掘D.数据备份解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:D题目】以下哪个不是数据挖掘的应用场景之一?A.市场营销B.金融风险管理C.医学诊断D.人脸识别解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:D二、简答题(共5道试题,共20分)题目】什么是OLAP?其主要特征是什么?解析:此题是必答题,根据所学知识,完成作业]参考答案:OLAP(Online Analytical Processing)是一种多维、动态、交互式的数据分析方法。
其主要特征包括快速性、多维性、可分析性和自由探索性。
题目】数据仓库系统的四层架构是什么?各层的作用是什么?解析:此题是必答题,根据所学知识,完成作业]参考答案:数据仓库系统的四层架构分别是数据源层、数据集成层、数据存储层和数据应用层。
数据源层负责从各种数据源中采集数据;数据集成层负责将不同数据格式的源数据转换为数据仓库的数据格式;数据存储层负责存储数据,并保证数据的一致性和准确性;数据应用层负责提供各种数据分析和查询功能。
南开大学22春“计算机科学与技术”《商务智能方法与技术》期末考试高频考点版(带答案)试卷号2
南开大学22春“计算机科学与技术”《商务智能方法与技术》期末考试高频考点版(带答案)一.综合考核(共50题)1.数据仓库系统结构中主要参与人员有哪些。
A、决策人员B、管理人员C、分析人员D、业务人员参考答案:ABCD2.Web上的IR是Web挖掘的一个方面,仅是对信息有序化。
()A.错误B.正确参考答案:B3.给定一组权限集,通过逐步组合这些权限,就可以得到一个初步的角色层次图。
()A.错误B.正确参考答案:A4.Web挖掘主要处理()等半结构、非结构化的数据,这些数据分布在Web文档、Web服务器的日志、用户cookies等。
A.文本B.图形C.图像D.多媒体参考答案:ABC当某属性出现空缺值时,应丢弃这个属性。
()A.正确B.错误参考答案:B6.基于角色识别问题,角色挖掘是比较有效的方法。
()A.正确B.错误参考答案:A7.Web挖掘主要处理()等半结构、非结构化的数据,这些数据分布在Web文档、Web服务器的日志、用户cookies等A、文本B、图形C、图像D、多媒体参考答案:ABC8.传统的建模方法注意力主要集中于()两个阶段A.模型设计B.模型实现C.模型运行D.模型维护参考答案:AB9.知识运转的环节有()A、知识沉淀B、知识共享参考答案:ABCD10.选择供应商一般以满足时间约束的条件下()为目标A、最小化物流成本B、最大化物流成本C、最小化维护成本D、最大化维护成本参考答案:A11.WHInmon所下的定义中,数据仓库是具有哪些特点的数据集合?()A.面向主题B.集成性C.稳定性D.时变性参考答案:ABCD12.以下哪些显示了数据挖掘最小要求,可以用它来评价数据挖掘是否对业务环境增加了附加的价值。
()A.正确的B.有用的C.未知的D.综合的参考答案:ABC13.数据导向型决策支持系统,可以用等()分析得到隐藏对决策有用的模式和规则。
A.统计方法B.OLAPC.数据挖掘D.知识分析14.选择供应商一般以满足时间约束的条件下()为目标A.最小化物流成本B.最大化物流成本C.最小化维护成本D.最大化维护成本参考答案:A15.知识和信息最主要的区别是()。
南开大学《商务智能方法与技术》19秋期末考核作业资料答案
《商务智能方法与技术》20秋期末考核-复习资料学校:南开大学一、单选题 (共 15 道试题,共 30 分)【题目】)是一种以规范化的方式构造端到端的业务流程为中心,以持续地提高组织绩效为目的的系统化方法A.知识管理B.方法管理C.信息化管理D.业务流程管理[解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:D【题目】识和信息最主要的区别是A.知识比信息重要B.知识比信息更容易被组织C.信息系统比知识系统昂贵D.信息是某种事实而知识是某种经验[解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:D【题目】)存储格式一般比较适合于需要总结数据的查询有较快的响应时间,同时基数据的量又比较大的场合。
A.ServerOLAPB.ROLAPC.MOLAPD.HOLAP[解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:D【题目】种数据库工具采用矩阵方式来存储数据。
A.都不是B.桌面型数据库工具C.多维数据库工具(MOLAP)D.关系型数据库工具(ROLAP)[解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:C【题目】)针对包括Web页面内容、页面结构和用户访问信息等在内的各种Web数据,应用数据挖掘方法发现有用的知识帮助人们从大量Web文档集中发现隐藏的模式A.结构挖掘B.文本挖掘C.内容挖掘D.使用挖掘[解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:B【题目】LAP系统应能处理与应用有关的任何逻辑分析和统计分析,此描述是指OLAP的哪个特性。
A.快速性B.多维性C.可分析性D.信息性[解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:C【题目】)是基于网页内容或其描述中抽取知识的过程A.结构挖掘B.内容挖掘C.使用(日志)挖掘D.个性挖掘[解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:B【题目】)根据文本的不同特征划分为不同的类A.都可以B.文本聚类C.文本概括D.文本分类[解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:B【题目】据仓库系统组成中,哪个部件是把数据从源数据中提取出来,依定义部件的规则将不同数据格式的源数据转换成数据仓库的数据格式并装载进数据仓库。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《商务智能方法与技术》课程复习资料
一、客观部分:(判断、不定项选择)
(一)、判断部分
★考核知识点:商务智能系统
附 1.1.1(考核知识点解释):
商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升各方面商务绩效,增强综合竞争力的智慧和能力。
商务智能不是通常的业务处理。
它的目标是如何更快、更容易地做更好的决策。
IBM商务智能解决方案远远不只是数据和技术的组合,BI帮助用户获得正确的数据,发现它的价值,并共享价值。
★考核知识点:知识概念
附 1.1.2(考核知识点解释):
知识就是对信息进行的提炼、比较、挖掘、分析、概括、判断和推论。
知识分为事实性知识和经验知识。
事实性知识是人类对于客观事物和现象的认识结果。
经验知识多事一种隐性知识,是存储在人们大脑中的经历、经验、技巧、体会和感悟等尚未公开的知识。
隐性知识和显性知识之间是可以相互转化的。
★考核知识点:元数据
附 1.1.3(考核知识点解释):
元数据管理包括对开发、管理数据仓库时所用的技术元数据和支持业务人员的业务元数据进行管理,它对数据仓库的设计和维护具有重要的作用。
数据仓库的所有数据都要通过元数据来管理和控制。
元数据描述关于源数据
的说明,包括源数据的来源、源数据的名称、源数据的定义、源数据的创建时间等对源数据进行管理所需要的信息。
源数据的来源说明源数据是从哪个系统、哪个历史数据、哪个办公数据、哪个Web页、哪个外部系统抽取而来。
源数据说明源数据在数据仓库的作用、用途、数据类型和长度等。
元数据:是用来描述数据的数据。
它描述和定位数据组件、它们的起源及它们在数据仓库进程中的活动;关于数据和操作的相关描述(输入、计算和输出)。
元数据可用文件存在元数据库中。
元数据反映数据仓库中的数据项是从哪个特定的数据源填充的,经过哪些转换、集成过程。
要有效的管理数据仓库,必须设计一个描述能力强、内容完善的元数据。
★考核知识点:数据分析
附 1.1.4(考核知识点解释):
在线分析处理比较常用的操作包括对多维数据的切片与切块、等。
切片和切块(Slice and Dice):
在多维数据结构中,按二维进行切片,按三维进行切块,可得到所需要的数据。
如在“城市、产品、时间”三维立方体中进行切块和切片,可得到各城市、各产品的销售情况。
钻取(Drill):
钻取包含向下钻取(Drill-down)和向上钻取(Drill-up)/上卷(Roll-up)操作,钻取的深度与维所划分的层次相对应。
★考核知识点:数据集市
附 1.1.5(考核知识点解释):
数据仓库是企业级的,能为整个企业各部门的运行提供决策支持手段。
而数据集市( Data Mart )是部门级别的,一般只能为某个局部范围内的管理人员服务,也称为部门级的数据仓库。
数据集市有两种:独立的数据集市和从属的数据集市。
★考核知识点:知识管理
附 1.1.8(考核知识点解释):
知识管理综合运用战略、组织、流程、技术、变化等多种措施和管理工具,以富有效率的方式组织资源实现其管理目标。
★考核知识点:OLAP与OLTP
附 1.1.9(考核知识点解释):
OLAP的目标是满足决策支持或多维环境特定的查询和报表需求,它的技术核心是“维”这个概念,因此OLAP也可以说是多维数据分析工具的集合。
快速性:用户对OLAP的快速反应能力有很高的要求。
系统应能在5秒内对用户的大部分分析要求做出反应。
客户/服务器体系结构-两层或三层C/S结构。
可分析性:OLAP系统应能处理与应用有关的任何逻辑分析和统计分析。
多维性:多维性是OLAP的关键属性。
系统必须提供对数据的多维视图和分析,包括对层次维和多重层次维的完全支持。
信息性:不论数据量有多大,也不管数据存储在何处,OLAP系统应能及时获得信息,并且管理大容量信息。
★考核知识点:商务智能
附 1.1.10(考核知识点解释):
商务智能的主要功能包括:数据集成,(找到特定商业问题所有的相关信息经常是一件困难而费力的事情)、信息呈现、经营分析、战略决策支持。
(二)、不定项选择部分
★考核知识点: 知识管理系统
附 1.2.1(考核知识点解释):
知识管理系统是收集、处理、分享一个组织的全部知识的信息系统,通常有计算机系统支持。
它包括数据库、人、数据仓库、互联网。
★考核知识点:维的概念
附 1.2.3(考核知识点解释):
维:是人们观察数据的特定角度,是考虑问题时的一类属性 (时间维、地理维等)。
维的层次:人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的各个描述方面(时间维:日期、月份、季度、年)。
维的成员:维的一个取值。
是数据项在某维中位置的描述。
(“某年某月某日”是在时间维上位置的描述)
★考核知识点:日志挖掘
附 1.2.4(考核知识点解释):
Web日志挖掘是从用户访问日志(包括搜索引擎日志等)中获取有价值的信息,即通过分析Web日志数据,发现访问者存取Web页面的模式。
理解用户的行为,改进站点结构,发现潜在用户,为用户提供个性化的服务,增强网站的竞争力。
★考核知识点:商务智能
附 1.2.6(考核知识点解释):
商务智能的主要功能包括:数据集成,(找到特定商业问题所有的相关信息经常是一件困难而费力的事情)、信息呈现、经营分析、战略决策支持。
★考核知识点:决策的过程
二、主观部分(填空题、名词解释、简答题)
简答题
1、简述数据规约的几种策略。
2、试画图说明从属数据集市的含义。
3、画图说明数据挖掘的过程。
4、请简述商务智能的作用。
5、试画图说明决策的过程。
6.画表格简述数据库和数据仓库的关系。
7、Apriori算法是数据挖掘中挖掘频繁项集的关键算法,请回答下列问题:(1)请解释什么是频繁项集(假设目标集合中只有正例和反例)。
(2分)(2)请写出Apriori算法的伪代码。
(10分)
8、K-means是最基本的聚类算法,请回答下列问题:
(1)K-means算法适用于哪类数据,局限性在哪里,改进算法有哪些。
(2)简述算法过程
9、试画图说明独立数据集市的含义。
10、决策树是分类算法中一种非常有效的算法,请回答下列问题:
(1)决策树中的信息增益,即熵,如何计算,请写出计算公式(假设目标集合中只有正例和反例)。
(2)写出ID3算法的伪代码。