《商务智能》考试复习内容 (含答案)
商务智能复习题.doc
二、判断题(本题共10道小题,每小题1分,共10分)(F ) 4.独立的数据集市架构的优点是企业内数据一致,不会产生信息孤岛。
(F ) 6.企业风险分析是通过对企业的经营成本进行综合评价,拟定一个企业成本的临界值。
(T ) &在BI中,DW是前提和基础,负责统一数据规则的处理和存储。
(F ) 9.客户服务管理是对客户意见或投诉以及售前、售中、售后服务进行管理。
(F ) 10.平衡计分卡共包括三个层面,分别是财务层面、客户层面、内部业务流程层面。
(F ) 12.在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。
(F ) 13. OLAP是用来协助企业对响应事件或事务的日常商务活动进行处理。
(F ) 16. C4.5决策树算法是国际上最早、最有影响力的决策树算法,(T ) 17.平衡计分卡是从财务、客户、内部运营、学习与成长四个角度,将组织的战略落实为可操作的衡量指标和目标值的一种新型绩效管理体系。
(F ) 1&客户服务管理是对客户意见或投诉以及售前、售中、售后服务进行管理。
(F ) 19.企业绩效管理的目的在于进一步加强成本的事前控制,同时有助于通过盈亏分析,辅助产品科学的报价。
(T )等深分箱法使每个箱子的记录个数相同。
(F )数据仓库“粒度”越细,记录数越少。
F记录树越多,范围越广泛(F )回归分析通常用于挖掘关联规则。
(T )孤立点在数据挖掘时总是被视为异常、无用数据而丢弃。
34.决策树方法特别适合于处理数值型数据。
(F )数据立方体是广义知识发现的方法和技术之一。
(F )可信度是对关联规则的准确度的衡量。
(T )可视化技术对于分析的数据类型通常不是专用性的。
(T ) OLAP技术侧重于把数据库中的数据进行分析、转换成辅助决策信息,是继数据库技术发展之后迅猛发展起来的一种新技术。
(F)关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则(F )Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。
《商务智能》复习题及答案
《商务智能》复习题及答案1、把数据报表从一年展开成四个季度的操作是(C )A、上卷B、旋转C、下钻D、切片2、在多维数据集中,对某一个维度上的数据进行选择一维成员,其他维度没有变化的操作是( D)A、切块B、旋转C、下钻D、切片3、一个多维数组表示为:(维1,维2,维3,维4,变量),这是一个(B )维结构。
A、3B、4C、5D、64、一次购买行为的发起需要有:购买者、商家、商品、购买时间、供应商和订单金额。
如果设计星型模型,请问有几个维度(C )A、3B、4C、5D、65、在进行ETL时,应该在(C )里进行。
A、ODSB、数据仓库C、数据准备区D、源数据6、(多选题)此大数据带来的变革有(ABD ).A、思维变革B、商业变革C、购物变革D、管理变革7、自然演化式体系结构的问题有(ACD )。
(多选)A、数据可信性B、无法进行数据处理C、生产率问题D、无法将数据转化为信息8、数据立方体是指(C ).A、三维数据集B、三维以上的数据集C、三维和三维以上的数据集D、四维数据集'9、戈登·未尔提出在今后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度,每(D )左右可以翻一番。
A、1个月B、6个月C、12个月D、18个月10、大数据时代的核心价值是(B)A.数据收集B.数据分析C.数据挖掘D.数据可视化11、大数据的来源包括( ABCD).A.互联网数据B.传感器数据C.实时数据D.探测数据11、好友的QQ突然发来一个网站链接要求投票,最合理的做法是( C)A.因为是其好反信总,直接打开使接投票B.不参与任何投票C.可能是好友aq被盗,可能是恶意筑接。
先通过予机跟朋友确认链技按无异常,考虑是否投票D.把好友加入黑名单12、关于大数据特点,错误的是(C )A、数据量大B、数据类型多C.数据价值密度高D.数据处理速度快13、Hadop是基于(B )语言的数据分析框架。
A. C++B. JavaC. RD. C#14.Maphedue的主导思想是(C )A.集成化B.一体化C.分而治之D.综合化15.下列与大数据密切相关的技术是(B)A.蓝牙B.云计算C.博穿论D.WiFi16.大数据的数据类型包括结构化数据、非结构化数据和(A ).A.半结构化数据B.无结构化数据C.关系数据库数D.文本数据和WEe数报17.数据仓库中的数据(ABCD )A.集成的B.可以变化的C.面向主题的D.不易丢失的18.数据仓库是随着时间变化的。
商务智能复习题.doc.doc
一、选择题(本题共 5 道小题,每小题 2 分,共10 分)1. 数据仓库是随着时间变化的,下面的描述不正确的是( C )。
A. 数据仓库随时间的变化不断增加新的数据内容B. 捕捉到的新数据会覆盖原来的快照C. 数据仓库随事件变化不断删去旧的数据内容D. 数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合2. 有关数据仓库的开发特点,不正确的描述是( B )。
A. 数据仓库使用的需求在开发初期就要明确B. 数据仓库开发要从数据出发C. 数据仓库的开发是一个不断循环的过程,是启发式的开发D. 在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式3. 在有关数据仓库测试,下列说法不正确的是( D )。
A. 在完成数据仓库的实施过程中,需要对数据仓库进行各种测试。
测试工作中要包括单元测试和系统测试。
B. 当数据仓库的每个单独组件完成后,就需要对他们进行单元测试。
C. 系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试。
D. 在测试之前没必要制定详细的测试计划。
4. 关于基本数据的元数据是指( D )。
A. 基本元数据与数据源、数据仓库、数据集市和应用程序等结构相关的信息B. 基本元数据包括与企业相关的管理方面的数据和信息C. 基本元数据包括日志文件和简历执行处理的时序调度信息D. 基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息6. 下面关于数据粒度的描述不正确的是( C )。
A. 粒度是指数据仓库小数据单元的详细程度和级别B. 数据越详细,粒度就越小,级别也就越高C. 数据综合度越高,粒度也就越大,级别也就越高D. 粒度的具体划分将直接影响数据仓库中的数据量以及查询质量6. 关于OLAP 的特性,下面正确的是:( D )(1) 快速性(2)可分析性(3)多维性(4)信息性(5)共享性A. (1) (2) (3)B. (2) (3) (4)C. (1) (2) (3) (4)D. (1) (2) (3) (4) (5)7. 关于OLAP 和OLTP 的区别描述,不正确的是:( C )A. OLAP 主要是关于如何理解聚集的大量不同的数据,它与OTAP 应用程序不同。
商务智能的考试重点
1.商务智能的基本概念(简答)对工业界来说,商务智能是一类技术或工具,利用他们可以对大量的数据进行收集、管理、分析和挖掘,以改善业务决策水平,增强企业竞争力。
对学术界来说,商务智能是一套理论、方法、和应用,通过他们可以快速的发现海量数据中隐含的各种知识,有效的解决企业面临的管理和决策问题,支持企业的战略实施。
2.商务智能系统的开发过程3.在线分析处理和在线事务处理(简答)4.决策支持系统的系统架构(1)模型库管理系统主要用于管理决策所需的各种模型,例如财务、统计、预测以及管理等方面的定量模型,利用这些模型可以进行问题分析。
用户利用该系统可以方便快捷的构建和操纵模型。
系统提供对模型的分类、删除、复制等维护功能,可以将已有模型进行合并,以及对模型的执行情况进行跟踪、分析和评价,如对变量进行敏感度分析等。
(2)知识库管理系统提供知识的表示、存储和管理功能,用于支持定量模型无法解决的决策过程,帮助用户建立、应用和管理描述性、过程性和推理性知识。
(3)对话产生与管理系统主要负责用户与系统之间的交互。
接受用户的输入,能够与数据库管理系统、模型库管理系统和知识库管理系统进行交互,以各种形式将结果返回给用户,提供图形用户界面以及可视化功能。
6.回归:回归方法中最常用的是线性回归,包括一元线性回归、多元线性回归以及非线性回归。
线性回归方法不仅用于预测,也可以用作解释模型,以探寻变量之间的关系。
另外还有回归树和模型树等模型。
7.回归系数的显著性检验:回归系数的显著性检验可以采用t检验。
对于每个回归系数bi(i=1,2,....k),显著性检验的两个假设分别为H0:bi=0和H1:bi≠0。
若bi=0说明自变量xi的变化对因变量没有线性影响,即变量xi对因变量的影响不显著。
为每个回归系数b i 构造变量tbi如式所示:式中cii是对矩阵C=(X T X)-1的对角线上的第i个值。
给定显著性水平α,查自由度为(n-k-1)的t分布表,得到tα(n-k-1),若t bi>t α(n-k-1),则拒绝假设H0,即回归系数b i显著。
商务智能考点内容
商务智能考点内容一、商务智能内容●数据仓库、数据挖掘、OLAP二、数据挖掘内容●算法、数据库技术、可视化技术、其他、机器学习、模式识别、统计分析三、知识包括什么●显性:规范化、系统化●隐性:个人思想和经验四、OTAP和OLAP区别●特征、面向、关注、功能五、数据仓库的特点●时变性、稳定性、决策支持、集成性、面向主题●主题以表存储,采用同一套编码规则、定时增加删除、实时捕捉快照、决策支持六、数据仓库流程●获取、管理、分析、展现七、数据仓库可运用于●投资组合分析、利润成本分析、资产分析八、元数据概念●是对于源数据的说明,包括名称、定义、来源、创建时间等九、数据仓库模型及联系和区别●物理模型、逻辑模型、概念模型●物理模型是逻辑模型在数据仓库中的实现十、粒度概念●粒度说明数据仓库中数据综合程度的高低。
●粒度越小,综合程度越小,可查询的种类越多;粒度越大,综合程度越高,查询的效率越高●粒度小的数据存储在低速存储器,粒度大的数据存储在高速存储器十一、OLAP概念●OLAP是针对特点问题的数据的联机访问和分析,它通过信息的可能的观察形式来进行快速的、稳定一致的、交互性的存取。
允许管理决策人员对数据进行深入观察。
十二、OLAP特点●快速性,5秒内对请求做出回应●可分析性,系统必须能够处理和应用有关的逻辑分析和统计分析●多维性,系统必须提供对数据的多维视图及分析●信息性,获得信息和管理信息十三、OLAP操作●对二维数据切片,三维数据切块●钻取,包括下钻和上卷●旋转十四、MOLAP特点●对数据进行预处理,性能好十五、MOLAP和ROLAP比较●MOLAP把多维实视图在概念上看成一个超立方体,物理上为一个多维数组,而ROLAP以表的形式存储实视图。
ROLAP更加灵活、节省空间,MOLAP在性能和管理上更加优越。
十六、数据仓库和数据库中数据的比较●数据仓库:长期框架、静态、定期更新、数据驱动●数据库:短期框架、快速变化、实时更新、事件驱动十七、BP神经网络训练步骤●分析业务问题●选择训练样本集,对输入值和输出值进行预处理●利用经验确定网络的拓扑结构,对神经元的权值和偏置进行初始化●利用反向传播等算法训练网络,逐渐缩小网络权值误差以达到最佳值●用测试集检查网络分类或预测质量●预测未知样本的分类十八、二元变量相异度计算●对称性:d(X1,X2)=b+c/a+b+c+d●非对称性:d(X1,X2)=b+c/a+b+c十九、支持度和置信度●多大可能购买集X中商品的顾客同时也购买集Y中商品二十、回归分析的步骤●确定自变量和因变量●绘制散点图,观察大致关系●求回归系数,建立回归模型●检验回归模型●预测未来情况二十一、Web挖掘概念●主要是处理文本、图形、图像等半结构化、非机构化数据。
商务智能考试题目
商务智能考试题(共五个大题,每题20分)1、商务智能应用技术?功能组成?一般认为数据仓库、OLAP和数据挖掘技术是商业智能的三大组成部分数据仓库是存放为分析目的而收集的数据的数据库。
数据挖掘是从数据抽取正确的、有用的、以前未知的及可理解的信息,并使用该信息做商业决策的过程。
OLAP(联机分析处理)是针对特定问题的联机数据访问和分析。
通过对信息(这些信息已经从原始的数据进行了转换,以反映用户所能理解的企业的真实的“维”)的很多可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。
商业智能系统主要包括数据预处理、建立数据仓库、数据分析及数据展现四个主要阶段。
数据预处理是整合企业原始数据的第一步,它包括数据的抽取、转换和装载三个过程。
建立数据仓库则是处理海量数据的基础。
数据分析是体现系统智能的关键,一般采用联机分析处理和数据挖掘两大技术。
在海量数据和分析手段增多的情况下,数据展现则主要保障系统分析结果的可视化。
2、“商业智能是一种解决方案”这句话怎么理解?为什么商业智能没有“专业出版的教材”?(1)商务智能(Business Intelligence,简称BI):商务智能不是通常的业务处理。
它的目标是如何更快、更容易地做更好的决策。
BI将信息转换为知识。
商业智能是在正确的时间将正确的信息交给正确的用户以支持决策过程的应用。
目前,商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。
为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。
因此,从技术层面上讲,商业智能不是什么新技术,它只是数据仓库、OLAP和数据挖掘等技术的综合运用。
为此,把商业智能看成是一种解决方案应该比较恰当。
(2)3、商业智能(BI)与CRM,ERP,CIMS,等系统的异同和关联?4、商业智能系统的应用过程(步骤)?为什么说商业智能的步骤一般是“循环(迭代)”的?5、IBM说“商业智能之客户直销分析”应用商业智能中的什么技术?分析这些技术?。
商业智能考试试题及答案
商业智能考试试题及答案1. 多选题:商业智能的定义是什么?A. 利用数据和分析方法来提供有益的商业见解和指导B. 利用计算机技术来提高商业决策的质量和效率C. 利用互联网技术来推动企业的数字化转型D. 利用人工智能算法来优化商业流程答案:A和B2. 判断题:商业智能的目标是帮助企业做出更明智的商业决策。
答案:正确3. 单选题:以下哪项不是商业智能的关键组成部分?A. 数据仓库B. 数据可视化C. 数据挖掘D. 业务流程管理答案:D4. 填空题:商业智能的四个基本功能包括__________________。
答案:报表和查询、数据分析、数据挖掘、数据可视化5. 简答题:请解释商业智能的数据可视化功能及其重要性。
答案:数据可视化是商业智能的关键功能之一,它将数据以图表、图形等形式展示出来,使得用户可以直观地理解和分析数据。
通过数据可视化,决策者可以更快地发现数据中的模式和趋势,更准确地评估业务绩效,并做出更明智的决策。
数据可视化不仅可以提高决策速度和准确性,还能增强数据沟通的效果,帮助不具备专业数据分析能力的人员也能理解和利用数据。
6. 解答题:请简要描述商业智能的实施过程和关键要素。
答案:商业智能的实施过程包括以下几个关键步骤:1) 需求分析:明确商业智能的应用目标和需求,确定所需要分析的数据内容和指标。
2) 数据准备:收集、整理和清洗数据,建立数据仓库或数据湖,并确保数据的质量和完整性。
3) 数据建模:根据需求,设计和构建数据模型,包拟定数据分析方法和算法。
4) 可视化设计:选择合适的数据可视化工具和技术,设计直观、易于理解的数据可视化界面。
5) 实施和测试:部署商业智能系统,对系统进行测试和调优,确保系统的稳定性和性能。
6) 培训和推广:培训用户和决策者使用商业智能系统,推广系统在企业中的应用和效果。
关键要素包括:明确的需求、高质量的数据、合适的数据模型和算法、直观的可视化界面、稳定可靠的系统性能,以及用户培训和推广。
商务智能复习资料(必读)
商务智能复习纲要第1章 商务智能概述1.1 商业决策需要商务智能一、数据、信息和知识1、数据:符号、事实和数字 信息:有用的数据 关系:信息是经过某种加工处理后的数据,是反映客观事物规律的一些数据。
数据是信息的载体,信息是对数据的解释。
知识:对信息内容进行提炼、比较、挖掘、分析、概括、判断和推论。
2、决策离不开信息、知识①决策需要信息,更离不开知识;知识更多地表现为经验--学习的结晶;学习的过程是不断地对信息加工处理;信息的收集、加工、传输与利用贯穿着决策各阶段的工作过程。
②信息已成为企业经营中重要性仅次于人才的第二大要素。
③决策=信息+经验+冒险④商务智能是对企业信息的科学管理。
3、商务智能支持商业决策商务智能如何创造知识和价值1.2 商务智能简介商务智能这一术语1996年由 Gartner 公司的分析师Howard Dresner 首次提出,他提出商务智能描述了一系列的概念和方法,通过应用基于事实的支持系统来辅助商业决策的制定。
一、商务智能概念事物运动 数据 信息记录解释商务智能是整合了先进信息技术与创新管理理念的结合体,集成了企业内外的数据,进行加工并从中提取能够创造商业价值的信息,面向企业战略并服务于管理层、业务层,指导企业经营决策,提升企业竞争力,涉及企业战略、管理思想、业务整合和技术体系等层面,促进信息到知识再到利润的转变,从而实现更好的绩效。
①先进信息技术:商务智能是多项技术的综合应用;②集成了企业内外的数据,进行加工并从中提取能够创造商业价值的信息:商务智能的层次;③企业战略:商务智能服务于企业战略;④管理层、业务层:商务智能用户多样性;⑤更好的绩效:商务智能提升企业绩效。
二、商务智能的价值1、在商务智能背后有一些商业驱动力,如:①增加收入,减少费用和更有效地竞争的需求。
②管理和模拟当前商业环境复杂性的需求。
③减少IT费用和利用已有公司业务信息的需求。
2、商务智能的价值①制定合适的市场营销策略;②改善顾客智能;③经营成本与收入分析;④提高风险管理能力;⑤改善业务洞察力;⑥提高市场响应能力。
数据库与商务智能考试
数据库与商务智能考试(答案见尾页)一、选择题1. 数据库系统的基本组成部分包括哪些?A. 关系模型B. 数据库管理系统(DBMS)C. 数据仓库D. 以上都是2. 关系模型的主要概念是什么?A. 实体-关系模型B. 对象关系模型C. 面向对象模型D. 以上都不是3. 数据库事务的特性中,ACID代表什么?A. 原子性、一致性、隔离性、持久性B. 原子性、可恢复性、一致性、隔离性C. 原子性、一致性、隔离性、持久性D. 原子性、可恢复性、一致性、持久性4. 以下哪个选项是数据仓库的特征?A. 集成性B. 非易失性C. 分布性D. 以上都是5. 商务智能(BI)的主要应用领域包括哪些?A. 数据分析B. 数据挖掘C. 数据可视化D. 以上都是6. 数据库性能优化通常涉及哪些方面?A. 索引优化B. 查询优化C. 硬件选择D. 以上都是7. 在数据库系统中,如何保证数据的安全性和完整性?A. 使用强密码策略B. 定期备份数据C. 实施访问控制D. 以上都是8. 数据库复制在商务智能中的应用主要目的是什么?A. 提高数据可用性B. 提高数据一致性C. 提供数据备份功能D. 提高数据访问速度9. 以下哪个选项是数据库管理系统的核心功能?A. 数据定义B. 数据查询C. 数据更新D. 数据安全10. 在数据库系统中,如何实现数据的标准化?A. 将数据分解为更小的单元B. 将数据组织到不同的表格中C. 将数据按照特定的规则进行转换D. 将数据按照特定的规则进行分组11. 数据库系统工程师的主要职责包括哪些?A. 设计和构建数据库管理系统B. 编写和维护数据库应用程序C. 管理和优化数据库性能D. 提供数据分析和商业智能解决方案12. 关系数据库中的基本概念是什么?A. 数据库、关系、元组、属性B. 数据库、关系、元组、列C. 数据库、关系、元组、属性、主键D. 数据库、关系、元组、属性、外键13. 以下哪个选项是关系数据库中常用的数据类型?A. 整数B. 浮点数C. 字符串D. 布尔值14. 在数据库设计中,哪一个阶段负责定义和描述数据的结构?A. 需求分析B. 概念设计C. 逻辑设计D. 物理设计15. 数据库管理系统(DBMS)的主要组成部分包括?A. 存储器管理B. 查询处理器C. 事务管理D. 数据定义语言(DDL)16. 以下哪个术语描述了数据库中数据的逻辑结构?A. 存储方式B. 逻辑结构C. 物理结构D. 结构式17. 在数据库系统中,哪一个概念用于定义数据之间的关系?A. 表格B. 结构式C. 关系模型D. 实体-关系模型18. 以下哪个选项是数据库性能优化的一个关键因素?A. 硬件资源B. 软件配置C. 数据库设计D. 查询负载19. 在数据库系统中,哪一个技术用于存储和管理数据?A. 文件系统B. 数据库管理系统(DBMS)C. 对象关系映射(ORM)D. 数据仓库20. 以下哪个选项提供了数据库系统的安全机制?A. 访问控制列表(ACL)B. 数据加密C. 审计和日志记录D. 数据备份和恢复21. 关系型数据库与非关系型数据库的主要区别是什么?A. 数据存储结构B. 数据处理速度C. 适用场景D. 所需硬件资源22. 数据仓库中需要进行数据清洗和预处理的原因是什么?A. 提高数据质量B. 增加存储空间C. 减少数据处理量D. 降低错误率23. 在数据库设计中,E-R图(实体-关系图)通常用于表示什么?A. 数据流B. 实体之间的关系C. 数据库模式D. 数据库结构24. 以下哪个选项是数据库事务的ACID特性之一?A. 原子性B. 一致性C. 隔离性D. 持久性25. 数据库索引的目的是什么?A. 加速查询速度B. 减少数据冗余C. 保证数据完整性D. 方便数据备份26. 在数据库系统中,什么是触发器?A. 一种数据库对象,用于执行特定的操作B. 一种数据库约束,用于限制用户操作C. 一种数据库触发器,用于自动执行某些操作D. 以上都不是27. 数据库备份策略通常包括哪些方面?A. 备份类型(全备、增量备份等)B. 备份频率C. 备份介质(磁带、光盘等)D. 备份数据的保留策略28. 在数据库性能优化中,如何提高查询响应时间?A. 添加合适的索引B. 改变数据库引擎C. 优化SQL查询语句D. 增加数据库硬件资源29. 数据库系统故障可能导致的数据丢失情况包括(多选)?A. 事务崩溃B. 磁盘损坏C. 网络问题D. 错误的数据库配置30. 在数据库设计中,什么是第一范式?它如何帮助简化数据库设计?A. 第一范式要求表中的每一列都是原子的,即不可分割的B. 第一范式要求表中的每一列都是唯一的C. 第一范式要求表中的每一行都是唯一的D. 第一范式要求表中的每一行都必须完全相同31. 什么是数据库索引?它有哪些优点?A. 提高查询性能B. 减少数据冗余C. 加速数据排序和分组D. 支持事务处理32. 数据库备份和恢复策略对于业务连续性至关重要。
《商务智能方法与技术》复习资料
商务智能方法与技术》课程复习资料、客观部分:(判断、不定项选择)一)、判断部分★ 考核知识点: 商务智能系统附1.1.1 (考核知识点解释):商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升各方面商务绩效,增强综合竞争力的智慧和能力。
商务智能不是通常的业务处理。
它的目标是如何更快、更容易地做更好的决卒策。
IBM商务智能解决方案远远不只是数据和技术的组合,BI帮助用户获得正确的数据,发现它的价值,并共享价值。
★ 考核知识点: 知识概念附1.1.2 (考核知识点解释):知识就是对信息进行的提炼、比较、挖掘、分析、概括、判断和推论。
知识分为事实性知识和经验知识。
事实性知识是人类对于客观事物和现象的认识结果。
经验知识多事一种隐性知识,是存储在人们大脑中的经历、经验、技巧、体会和感悟等尚未公开的知识。
隐性知识和显性知识之间是可以相互转化的。
★考核知识点: 元数据附1.1.3 (考核知识点解释):元数据管理包括对开发、管理数据仓库时所用的技术元数据和支持业务人员的业务元数据进行管理,它对数据仓库的设计和维护具有重要的作用。
数据仓库的所有数据都要通过元数据来管理和控制。
元数据描述关于源数据的说明,包括源数据的来源、源数据的名称、源数据的定义、源数据的创建时间等对源数据进行管理所需要的信息。
源数据的来源说明源数据是从哪个系统、哪个历史数据、哪个办公数据、哪个Web 页、哪个外部系统抽取而来。
源数据说明源数据在数据仓库的作用、用途、数据类型和长度等。
元数据:是用来描述数据的数据。
它描述和定位数据组件、它们的起源及它们在数据仓库进程中的活动;关于数据和操作的相关描述( 输入、计算和输出) 。
元数据可用文件存在元数据库中。
元数据反映数据仓库中的数据项是从哪个特定的数据源填充的,经过哪些转换、集成过程。
商务智能复习资料
商务智能复习资料第一章商务智能概述1、4C(1)信息技术是指获取、传递、处理和存储、以及利用信息的技术。
(2)4C内容:感测技术(是信息的采集技术,对应于人的感觉器官);通讯技术(是信息的传递技术,对应于人的神经系统);计算机技术(是信息的处理和存储技术,对应于人的思维器官);控制技术(是信息的使用技术,对应于人的执行器官)。
(3)信息技术工具:信息处理技术和通信技术是最重要的两种。
2、定义商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累积商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升个方面商务绩效,增强综合竞争力的智慧和能力。
3、商务智能的基本功能:个性化的信息分析;预测;辅助决策。
5、商务智能的作用:理解业务;衡量绩效;改善关系;创造获利机会。
6、商务智能的体系结构:是指通过识别和理解数据在系统中的流动过程和数据在企业中的应用过程来提供商务智能系统的主框架。
7、BI与交易系统的关系:系统设计的区别数据类型的区别8、数据、信息、知识、智能之间的关系(1)数据:孤立的客观事实、文字、符号,适合保存、传递和处理。
TO知识:是知识的表现形式,是知识的来源。
TO信息:数据的价值通过其携带的信息表现。
(2)信息:人们对数据进行系统的采集、组织、整理、分析的结果,目的是使数据结构化、有序化。
TO数据:信息是数据的含义,是对数据的解释。
TO知识:信息是知识的表现形式。
(3)知识:是人们对自认识而总结出来的规律、经验。
第二章数据仓库导论1、什么是数据仓库数据仓库是面向主题的、集成的、稳定的,不同时间的数据集合,用于支持经营管理中决策制定过程。
2、数据仓库的特点:面向主题;集成;稳定;随时间而变化;数据量大;软硬件要求高。
3、数据仓库与传统数据库的区别4、OLTP与OLAP的区别5、数据仓库的用户包括(1)信息使用者的数据仓库应用:以一种可以预测的、重复的方式使用。
《商务智能》复习题及答案
《商务智能》复习题及答案1、把数据报表从一年展开成四个季度的操作是(C )A、上卷B、旋转C、下钻D、切片2、在多维数据集中,对某一个维度上的数据进行选择一维成员,其他维度没有变化的操作是( D)A、切块B、旋转C、下钻D、切片3、一个多维数组表示为:(维1,维2,维3,维4,变量),这是一个(B )维结构。
A、3B、4C、5D、64、一次购买行为的发起需要有:购买者、商家、商品、购买时间、供应商和订单金额。
如果设计星型模型,请问有几个维度(C )A、3B、4C、5D、65、在进行ETL时,应该在(C )里进行。
A、ODSB、数据仓库C、数据准备区D、源数据6、(多选题)此大数据带来的变革有(ABD ).A、思维变革B、商业变革C、购物变革D、管理变革7、自然演化式体系结构的问题有(ACD )。
(多选)A、数据可信性B、无法进行数据处理C、生产率问题D、无法将数据转化为信息8、数据立方体是指(C ).A、三维数据集B、三维以上的数据集C、三维和三维以上的数据集D、四维数据集'9、戈登·未尔提出在今后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度,每(D )左右可以翻一番。
A、1个月B、6个月C、12个月D、18个月10、大数据时代的核心价值是(B)A.数据收集B.数据分析C.数据挖掘D.数据可视化11、大数据的来源包括( ABCD).A.互联网数据B.传感器数据C.实时数据D.探测数据11、好友的QQ突然发来一个网站链接要求投票,最合理的做法是( C)A.因为是其好反信总,直接打开使接投票B.不参与任何投票C.可能是好友aq被盗,可能是恶意筑接。
先通过予机跟朋友确认链技按无异常,考虑是否投票D.把好友加入黑名单12、关于大数据特点,错误的是(C )A、数据量大B、数据类型多C.数据价值密度高D.数据处理速度快13、Hadop是基于(B )语言的数据分析框架。
A. C++B. JavaC. RD. C#14.Maphedue的主导思想是(C )A.集成化B.一体化C.分而治之D.综合化15.下列与大数据密切相关的技术是(B)A.蓝牙B.云计算C.博穿论D.WiFi16.大数据的数据类型包括结构化数据、非结构化数据和(A ).A.半结构化数据B.无结构化数据C.关系数据库数D.文本数据和WEe数报17.数据仓库中的数据(ABCD )A.集成的B.可以变化的C.面向主题的D.不易丢失的18.数据仓库是随着时间变化的。
商务智能方法与应用试题和答案
商务智能方法与应用试题和答案一、判断题:1、(对)OLAP的目标:是满足决策支持或多维环境特定的查询和报表需求2、(错)星型模型规范化数据,消除冗余,其业务层级和维度都将存储在数据模型之中。
3、(对)星型模型加载维度表,不需要再维度之间添加附属模型,ETL就相对简单,而且9、可以实现高度的并行化。
4、(对)雪花模型在维度表、事实表之间的连接很多,因此性能方面会比较低。
5、(对)雪花模型数据模型的业务层级是由一个不同维度表主键-外键的关系来代表的。
二、多选题。
1、(A、B、C、D)OLAP特性包括:A.快速性B.可分析性C.多维性D.信息性2、(AB)构造多维数据的方法有:A.超立方结构B.多立方结构C.平面结构3、(ABD)关于OLTP与OLAP的区别,说法正确的是:A.前者是细节性数据,后者是综合性和提炼性数据B.前者是当前值数据,后者是历史数据C.前者不可更新但周期性刷新,后者可更新D.前者一次处理的数据量小,后者一次处理的数据量大4、(ABCD)关于星型模型的说法中错误的是:A.规范化数据,消除冗余,其业务层级和维度都将存储在数据模型之中。
B.数据模型的业务层级是由一个不同维度表主键-外键的关系来代表的。
C.雪花模型在维度表、事实表之间的连接很多,因此性能方面会比较低。
D.雪花模型加载数据集市,ETL操作在设计上更加复杂,而且由于附属模型的限制,不能并行化。
5、(ABCD)关于雪花模型的说法中正确的是:A.规范化数据,消除冗余,其业务层级和维度都将存储在数据模型之中。
B.数据模型的业务层级是由一个不同维度表主键-外键的关系来代表的。
C.雪花模型在维度表、事实表之间的连接很多,因此性能方面会比较低。
D.雪花模型加载数据集市,ETL操作在设计上更加复杂,而且由于附属模型的限制,不能并行化。
三、单选题:1、(C)关于OLAP和数据挖掘的描述错误:A.OLAP是数据汇总/聚集工具,帮助简化数据分析B.数据挖掘要求能够自动的发现隐藏在海量数据中的有用信息和有价值的知识C.数据挖过程不包含数据描述和数据建模D.数据挖掘工具的目标是尽可能自动处理2、(B)关于OLTP的特性,说法错误的是:A.可更新B.一次处理的数据量大C.面向应用,事务驱动D.面向操作人员,支持日常操作3、(D)关于OLTP的特性,说法错误的是:A.不可更新,但周期性刷新B.一次处理的数据量大C.面向分析,分析驱动D.面向操作人员,支持日常操作8、(D)关于星型模型的特性,说法错误的是:A.反规范化数据,业务层级不会通过维度之间的参照完整性来部署。
商务智能题库整理
商务智能题库整理商务智能--复习提纲⼀.选择题(第⼀次作业)1.数据仓库是随着时间变化的,下⾯的描述不正确的是AA.数据仓库随时间变化不断删去旧的数据内容B.捕捉到的新数据会覆盖原来的数据C.数据仓库随时间的变化不断增加新的数据内容D.数据仓库中包含⼤量的综合数据,这些综合数据会随着时间的变化不断地进⾏重新综合2. OLAP在辅助决策时,基于⽤户建⽴的⼀系列假设驱动,通过OLAP来证实或者推翻这些假设是个()的过程CA集成B转换C演绎D归纳3.不同操作型系统之间的数据⼀般是相互独⽴、异构的。
⽽数据仓库中的数据是对分散的数据进⾏抽取、清理、转换和汇总后得到的,这样就保证了数据仓库的数据关于整个企业的()DA时变性B⾮易失性C差异性D⼀致性4.如下图所⽰操作是OLAP分析的哪种操作( D )A切⽚B旋转C下钻D上钻5.数据⽴⽅体中的数据单元格是⼀个数值函数,该函数可以对数据⽴⽅体求值,如下哪个函数可以⽤来对数据⽴⽅体进⾏度量()CA.substring()B.rand()C.sum()D.trunc()6.关于数据仓库数据的时变性,如下描述不正确的是DA操作型系统存储的是当前数据,⽽数据仓库中的数据是历史数据B数据仓库中的数据是按照时间顺序追加的,它们都带有时间属性C数据仓库的数据时限⼀般要远远长于操作型数据的数据时限D数据仓库对响应时间要求不严格,处理时间从⼏秒到⼏分钟,有时甚⾄⼏⼩时7.数据仓库是⾯向主题的,逻辑意义上每⼀个商业主题都对应与企业决策包含的分析对象,⼀家保险公司的数据仓库的主题可能包含哪些BA顾客储蓄账B顾客、账户、索赔C顾客保险⾦额D顾客账单8.假如警察要得到某犯罪嫌疑⼈在指定时间段的通话记录最有可能在( C )系统中获得A决策⽀持系统B电信营业账务系统C电信数据仓库系统D元数据管理系统9.下⾯关于数据粒度的描述不正确的是BA数据综合度越⾼,粒度也就越⼤,级别也就越⾼B数据越详细,粒度就越⼩,级别也就越⾼C粒度是指数据仓库⼩数据单元的详细程度和级别D粒度的具体划分将直接影响数据仓库中的数据量以及查询质量10.数据仓库并⾮只是数据的简单累积,⽽是要经过⼀系列的处理过程,即ETL,ETL过程包括哪些CA数据操作、数据挖掘、数据转义B数据存储、数据维护、数据分析C数据抽取、数据转换、数据装载D数据定义、数据建模、数据管理11.企业要建⽴预测模型,需准备建模数据集,以下四条描述建模数据集正确的A A尽可能多的适合的数据B得分集数据是建模集数据的⼀部分C数据越多越好D以上三条都正确12.关于基本数据的元数据是指DA基本元数据与数据源、数据仓库、数据集市和应⽤程序等结构相关的信息B基本元数据包括⽇志⽂件和简历执⾏处理的时序调度信息C基本元数据包括与企业相关的管理⽅⾯的数据和信息D基本元数据包括关于装载和更新处理,分析处理以及管理⽅⾯的信息13.数据⽴⽅体中的数据单元格中的数据可以通过如下哪些函数获得?AA分布聚集函数count()、sum()、min()、max()和代数聚集函数avg()、stddev() B分析函数C分布聚集函数count()、sum()、min()、max()D聚集函数avg()、stddev()14.关于OLAP和OLTP的说法,下列不正确的是BA.OLTP以应⽤为核⼼,是应⽤驱动的B.OLAP事务量⼤,但事务内容⽐较简单且重复率⾼C.OLAP的最终数据来源与OLTP不⼀样D.OLTP⾯对的是决策⼈员和⾼层管理⼈员15.数据挖掘是通过()的⽅式在海量数据中主动找寻模型,⾃动发掘隐藏在数据中的价值信息,OLAP分析结果为挖掘提供分析依据。
《商务智能》考试复习内容-(含答案)
《商务智能》考试复习内容-(含答案)闭卷考试,时间120分钟,五种题型:选择题(10分)、判断题(10分)、名词解释题(30分)、简答题(30分)、论述题(20分)第1章商务智能基本知识(1)商务智能的概念、价值、驱动⼒。
概念:商务智能是企业利⽤现代信息技术收集、管理和分析结构化和⾮结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策⽔平,采取有效的商务⾏动,完善各种商务流程,提升各⽅⾯商务绩效,增强综合竞争⼒的智慧和能⼒-王茁专著《三位⼀体的商务智能》.商务智能解决⽅案远远不只是数据和技术的组合,帮助⽤户获得正确的数据,发现它的价值,并共享价值。
价值:() .⽀持各级决策基于事实和商业管理的(科学)的预测当前和未来的业务情况下获得历史业务数据的智能分析。
恰当准确客观及时驱动⼒:在商务智能背后有⼀些商业驱动⼒,例如:增加收⼊,减少费⽤和更有效地竞争的需求。
管理和模拟当前商业环境复杂性的需求。
减少费⽤和利⽤已有公司业务信息的需求。
(2)商务智能系统的功能、主要⼯具。
功能:在商务智能背后有⼀些商业驱动⼒,例如:增加收⼊,减少费⽤和更有效地竞争的需求。
管理和模拟当前商业环境复杂性的需求。
减少费⽤和利⽤已有公司业务信息的需求。
主要⼯具:第2章商务智能核⼼技术(1)商务智能系统的架构如何?(2)什么是数据仓库?数据仓库⽤来保存从多个数据库或其它信息源选取的数据, 并为上层应⽤提供统⼀⽤户接⼝,完成数据查询和分析。
⽀持整个企业范围的主要业务来建⽴的,主要特点是,包含⼤量⾯向整个企业的综合信息及导出信息。
数据仓库是作为服务基础的分析型,⽤来存放⼤容量的只读数据,为制定决策提供所需要的信息。
数据仓库是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的、⾯向主题及不可更新的数据集合。
以1992年W H 出版《》为标志,数据仓库发展速度很快。
W H 被誉为数据仓库之⽗。
W H 对数据仓库所下的定义:数据仓库是⾯向主题的、集成的、稳定的、随时间变化的数据集合,⽤以⽀持管理决策的过程。
商务智能1复习
数据仓库结构体系
♠ 数据仓库用来保存从多个数据库或其它信息源选
取的数据,并为上层应用提供统一用户接口,完成 数据查询和分析。
♠ 数据仓库是为支持整个企业范围的主要业务来建
立的,主要特点是:包含大量面向整个企业的综合 信息及导出信息。
♠ 作为一种数据环境必要功能包括:
☆ 数据收集 ☆ 数据存储 ☆ 数据传递
数据挖掘 借助数据库技术,使用统计分析的数学方法以及人工智能的算 技术 法,从海量数据中提取隐含的、有用的知识,挖掘数据背后隐 藏的规律和模式
第二章 数据仓库
• 决策的制定需要关于当前运作、趋势和变化的明 确、可靠的信息,而数据往往是分散于不同的操 作系统下,所以管理者常常是至多基于部分信息 来做出所谓的决策。数据仓库通过访问、整合、 组织关键业务数据使其一致、可靠、及时和可 用,排除了障碍,使得数据实现了随时随地地取 用。
联机分析 根据用户的要求设计多维模型,生成井存储多维数据结构,以 处理 便在响应查询时能尽快找到满足条件的数据;通过OLAP可以全 方位、多层次地考察数据
前端分析 提供简单易用的图形化界面给管理人员或一般用户,由他们自 展示 有选择要分析的数据、定义分析角度和需要显示的结果。该部 分往往与多维分析工具配合,作为多维分析服务器的前台界面
• (3)使用按箱中值平滑对以上数据进行平滑,箱 的深度是3。
进行分箱: 箱1:11,15,16 箱2:22,22,25 箱3:32,35,35 箱4:46,52,70 (1)箱1平均值为 (11+15+16)/3=14 箱2的平均值为 (22+22+25)/3=23 箱3的平均值为 (32+35+35)/3=34 箱4的平均值为 (46+52+70)/3=56
商务智能方法与应用试题及答案
商务智能方法与应用试题及答案单选题1、什么是商务智能产生的驱动力()A、将企业内部的数据转换为利润B、商务智能也制定企业决策C、商务智能可帮助企业收集信息D、商务智能可将数据转换为信息,将信息转换为知识,进而支持企业进行决策2、淘宝的“猜你喜欢”功能是商务智能产生的什么原因的具体应用()A、急切的分析型需求B、企业的精细化管理需要商务智能C、知识产品化D、数据中蕴含的知识可以帮助企业进行优化升级3、智能化企业具有快速吸收新想法的能力、适应新情况的能力有效解决问题的能力、调用适当资源的能力、有效积累经验和知识的能力,其中适应新情况的能力有效解决问题的能力指的是什么()A、即企业在日常活动中,应具备快速接收新想法、新事物的能力,不能因循守旧,与时俱进才能把握市场动态,跟上时代的步伐B、即企业在面对不在了解、不熟悉等新领域出现的问题时,需要迅速适应新状况,并解决问题的能力C、即企业在面对任何一项工作的时候不能不合理的安排资源D、即在公司做任何一项工作的过程中,都会遇到各种各样的问题,在面对问题和解决问题的过程中就是积累经验和知识的过程4、数据是企业最重要的信息化资产,那么数据、知识、信息、决策之间的关系是如何递进的()A、数据产生为知识,知识转变为信息,信息支持决策B、数据产生为信息,知识转变为知识,知识支持决策C、数据产生为知识,知识支持决策,决策转变为信息D、数据产生为信息,信息支持决策,决策转变为知识5、商务智能是由业务层、技术层、()、组织层和战略层5个层面自下而上构成的层次机构A、运营层B、管理层C、功能层D、决策层6、商务智能的层次结构中,其中将企业ERP、CRM、SCM等企业系统数据集成在一次的层次结构属于()A、业务层B、技术层C、组织层D、战略层7、商务智能实施方案过程中是集数据采集、数据预处理、数据挖掘、数据可视化等关键技术与一体的,一般整个数据处理的过程中,占据整个处理过程花费80%左右时间的为()A、数据预处理B、数据挖掘C、数据集成D、数据可视化8、在数据集成的过程当中,一个数据源中的顾客编号为customer_id,另一个数据源中的顾客编号为cust_number,在两个数据源进行整合的过程中,如何识别customer_id和cust_number是同一属性,涉及到的数据集成中的()A、模式集成B、对象匹配和实体识别C、冗余和相关性分析D、数据冲突的监测和处理9、以下哪个选项不是数据仓库与操作型数据库的区别()A、操作型数据库的数据组织面向事务处理任务;数据仓库中的数据是按照一定的主题域进行组织。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
闭卷考试,时间120分钟,五种题型:选择题(10分)、判断题(10分)、名词解释题(30分)、简答题(30分)、论述题(20分)第1章商务智能基本知识(1)商务智能的概念、价值、驱动力。
概念:商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升各方面商务绩效,增强综合竞争力的智慧和能力-王茁专著《三位一体的商务智能》. IBM商务智能解决方案远远不只是数据和技术的组合,BI帮助用户获得正确的数据,发现它的价值,并共享价值。
价值:To support decision making at all levels of business management based on the facts and (scientific) predictions of current and future business situations that are obtained from intelligent analysis of historical business data.支持各级决策基于事实和商业管理的(科学)的预测当前和未来的业务情况下获得历史业务数据的智能分析。
Business decisions made with BI support are more-Correct 恰当-Accurate 准确-Objective 客观-Timely 及时驱动力:在商务智能背后有一些商业驱动力,例如:增加收入,减少费用和更有效地竞争的需求。
管理和模拟当前商业环境复杂性的需求。
减少IT费用和利用已有公司业务信息的需求。
(2)商务智能系统的功能、主要工具。
功能:在商务智能背后有一些商业驱动力,例如:增加收入,减少费用和更有效地竞争的需求。
管理和模拟当前商业环境复杂性的需求。
减少IT费用和利用已有公司业务信息的需求。
主要工具:第2章商务智能核心技术(1)商务智能系统的架构如何?(2)什么是数据仓库?数据仓库用来保存从多个数据库或其它信息源选取的数据, 并为上层应用提供统一用户接口,完成数据查询和分析。
支持整个企业范围的主要业务来建立的,主要特点是,包含大量面向整个企业的综合信息及导出信息。
数据仓库是作为DSS服务基础的分析型DB,用来存放大容量的只读数据,为制定决策提供所需要的信息。
数据仓库是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的、面向主题及不可更新的数据集合。
以1992年W H Inmon出版《Building the Data Warehouse》为标志,数据仓库发展速度很快。
W H Inmon被誉为数据仓库之父。
W H Inmon对数据仓库所下的定义:数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用以支持管理决策的过程。
(3)OLTP和OLAP的区别?事务型处理(OLTP):即操作型处理,是指对数据库的联机操作处理OLTP。
事务型处理是用来协助企业对响应事件或事务的日常商务活动进行处理。
它是事件驱动、面向应用的,通常是对一个或一组记录的增、删、改以及简单查询等(大量、简单、重复和例行性)。
在事务型处理环境中,数据库要求能支持日常事务中的大量事务,用户对数据的存取操作频率高而每次操作处理的时间短。
分析型处理(OPAP):用于管理人员的决策分析,例如DSS、EIS和多维分析等。
它帮助决策者分析数据以察看趋向、判断问题。
分析型处理经常要访问大量的历史数据,支持复杂的查询。
分析型处理过程中经常用到外部数据,这部分数据不是由事务型处理系统产生的,而是来自于其他外部数据源。
(4)数据仓库的技术要求。
复杂分析的高性能体现:涉及大量数据的聚集、综合等,在进行复杂查询时经常会使用多表的联接、累计、分类、排序等操作。
对提取出来的数据进行集成:数据仓库中的数据是从多个应用领域中提取出来的,在不同的应用领域和不同的数据库系统中都有不同的结构和形式,所以如何对数据进行集成也是构建数据仓库的一个重要方面。
对进行高层决策的最终用户的界面支持:提供各种分析应用工具。
(5)数据仓库系统的组成。
源数据:数据仓库中的数据来源于多个数据源,它不仅可以是企业内部的关系型数据库,还包括非传统数据,如文件、HTML文档等。
数据仓库管理系统:元数据库及元数据管理部件:元数据库用来存储由定义部件生成的关于源数据、目标数据、提取规则、转换规则以及源数据与数据仓库之间的映射信息等。
数据转换部件:该部件把数据从源数据中提取出来,依定义部件的规则将不同数据格式的源数据转换成数据仓库的数据格式并装载进数据仓库。
数据集成部件:该部件根据定义部件的规则、统一各源数据的编码规则,并净化数据,根据元数据中定义的数据组织形式对数据进行汇总、聚合计算。
数据仓库管理部件:它主要用于维护数据仓库中的数据,备份、恢复数据以及管理数据的安全权限问题。
数据仓库前端工具集:查询/报表工具:以图形化方式和报表方式显示数据,帮助了解数据的结构、关系以及动态性。
OLAP工具:通过对信息的多种可能的观察形式进行快速、一致和交互性的存取,便于用户对数据进行深入的分析和观察。
数据挖掘工具:从大量数据中挖掘出具有规律性的知识,以及数据之间的内在联系。
前端开发工具:提供用户编程接口,便于在现有系统的基础上进行二次开发,增强系统的伸缩性。
数据仓库:在数据仓库系统中,数据仓库是一个数据存储集合,它的存储形式通常有多维数据库,关系型数据库及其他存储方式。
(6)什么是星型模型?(7)元数据的概念。
元数据:是用来描述数据的数据。
它描述和定位数据组件、它们的起源及它们在数据仓库进程中的活动;关于数据和操作的相关描述(输入、计算和输出)。
元数据可用文件存在元数据库中。
元数据反映数据仓库中的数据项是从哪个特定的数据源填充的,经过哪些转换、集成过程。
(8)数据仓库中的粒度概念。
对数据仓库中的数据综合程度高低的一个度量,它既影响数据仓库中的数据量的多少,也影响数据仓库所能回答询问的种类。
粒度越小,综合程度越低,回答查询的种类越多;粒度越高,综合程度越高,查询的效率也越高。
在数据仓库中可将小粒度的数据存储在低速存储器上;大粒度的数据存储在高速存储器上。
(9)什么是数据集市?与数据仓库的区别是什么?数据仓库是企业级的,能为整个企业各部门的运行提供决策支持手段。
而数据集市(Data Mart )是部门级别的,一般只能为某个局部范围内的管理人员服务,也称为部门级的数据仓库。
数据集市有两种:独立的数据集市和从属的数据集市。
数据集市不是数据仓库数据集市并非小的数据仓库多个数据集市集合并不构成数据仓库第3章在线分析处理(1)OLAP、ROLAP的概念。
定义1 :OLAP(联机分析处理)是针对特定问题的联机数据访问和分析。
通过对信息(维数据)的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。
定义2 :OLAP(联机分析处理) 是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。
(OLAP委员会的定义) OLAP的目标是满足决策支持或多维环境特定的查询和报表需求,它的技术核心是“维”这个概念,因此OLAP也可以说是多维数据分析工具的集合。
ROLAP的概念:(2)简述OLAP的基本操作。
切片和切块、钻取、旋转第4章数据挖掘原理(1)什么是数据挖据?从大量的、不完全的、有噪声的、模糊的、随即的数据中提取正确的、有用的、未知的、综合的、以及用户感兴趣的知识并用于决策支持的过程。
(课本)从数据中提取正确的、有用的、未知的和综合的信息并用它进行决策的过程。
(PPT)(2)简述数据挖掘的作用。
(3)数据挖据流程的国际标准CRISP-DM。
1996年提出的行业无关、应用无关的数据挖掘过程标准—Cross Industry Standard Process for Data Mining(CRISP-DM)。
这个标准把挖掘过程分为六个阶段:定义业务问题(business understanding)、数据理解(data understanding)、数据预处理(data preparation)、数据建模(data modeling)、模型评估(evaluation)和部署(deployment)。
(4)数据预处理方法及内容。
数据清理处理内容:格式标准化异常数据清除错误纠正重复数据的清除第5章分类和预测、关联规则(1)什么是分类?分类就是通过分析训练集(决策表)中的数据,为每个类别做出准确的描述或建立分析模型或挖掘出分类规则,然后用这个分类规则对其它数据对象进行分类。
(2)什么是决策树?简述其分类的基本原理。
(3)什么是聚类?简述K均值聚类算法的基本原理。
聚类就是把整个数据分成不同的组,并使组与组之间的差距尽可大,组内数据的差异尽可能小。
给定k,从n个对象中任意选择k个对象作为初始聚类中心;repeat计算每个对象与聚类中心的距离,把它们划到不同的簇;重新计算每个簇的聚类中心;until 聚类中心不再发生变化(4)什么是关联规则挖掘?其主要应用有哪些?简述其基本原理?关联规则挖掘:在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联结构。
应用:购物篮分析、交叉销售、产品目录设计、聚集和分类等。
基本原理:(5)什么是回归分析?简述回归分析的基本步骤。
分析一个变量与其他一个(或几个)变量之间的相关关系的统计方法就称为回归分析。
1.确定因变量和影响因素(自变量)。
2.绘制散点图,观察变量的大致关系。
3.求回归系数,并建立回归模型。
4.检验回归模型。
5.进行预测。
(6)什么是遗传算法、神经网络?简述其基本原理。
第6章数据挖掘应用(1)数据挖掘在CRM中的主要应用是什么?客户关系管理(CRM)Customer identificationCRM begins with customer identification. This phase involves targeting the population who are most likely to become customers or most profitable to the company.It also involves analyzing customers who are being lost to the competition and how they can be won back.Elements for customer identification include target customer analysis and customer segmentation.Customer attractionOrganizations can direct effort and resources into attracting the target customer segments. Direct marketing is a promotion process which motivates customers to place orders through various channels.direct mail or couponCustomer retentionCentral concern for CRM.Customer satisfaction is the essential condition for retaining customers.Elements of customer retention include one-to-one marketing, loyalty programs and complaints management.One-to-one marketing refers to personalized marketing campaigns which are supported by analyzing, detecting and predicting changes in customer behaviors.Loyalty programs involve campaigns or supporting activities which aim at maintaining a long term relationship with customers. Churn analysis, credit scoring, service quality or satisfaction form part of loyalty programs.Customer developmentElements of customer development include customer lifetime value analysis, up/cross selling and market basket analysis.Customer lifetime value analysis is defined as the prediction of the total net income a company can expect from a customer. Up/Cross selling refers to promotion activities which aim at augmenting the number of associated or closely related services that a customer uses within a firm.Market basket analysis aims at maximizing the customer transaction intensity and value by revealing regularities in the purchase behaviour of customers.(2)什么是个性化电子商务推荐?Personalization is defined as “the ability to provide content and services tailored to individuals based on knowledge about their preferences and behavior” or “the use of technology and customer information to tailor electronic commerce interactions between a business and each individual customer”(3)简述运用到个性化电子商务推荐系统中的数据挖掘技术。