商务智能复习
商务智能复习文档
商务智能:Business Intelligence-由数据仓库(或数据集市)、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的、以辅助企业决策为目的一类技术及其应用-工业界-商务智能可以被看作是一类技术或工具,利用它们可以对大量的数据进行收集、管理、分析和挖掘,以改善业务决策水平,增强企业的竞争力-学术界-商务智能是一套理论、方法和应用,通过它们可以快速地发现海量数据中隐含的各种知识,有效地解决企业面临的管理和决策问题,支持企业的战略实施。
商务智能指收集、转换、分析和发布数据的过程,目的是为了更好的决策。
商务智能是指将数据转化为知识的过程。
它包括捕获和分析信息,交流信息,以及利用这些信息开发市场。
商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升商务绩效,增强综合竞争力的智慧和能力。
Business Intelligence is a process of turning data into knowledge and knowledge into action for business gain—Data Warehouse Institute商务智能是指透过资料的萃取、整合及分析,支持决策过程的技术和商业处理流程,其目的是为了使使用者能在决策的时候,尽可能得到更好的协助。
商务智能是运用数据仓库、在线分析和数据挖掘技术来处理和分析数据的技术,它允许用户查询和分析数据库,进而得出影响商业活动的关键因素,最终帮助用户做出更好、更合理的决策。
商务智能是通过利用多个数据源的信息以及应用经验和假设,来促进对企业动态性的准确理解,以便提高企业决策能力的一组概念、方法和过程的集合。
商务智能是通过获取与各个主题相关的高质量和有意义的信息来帮助人们分析信息、得出结论、形成假设的过程。
商务智能是融合了先进信息技术与创新管理理念的结合体,集成企业内外数据,进行加工并从中提取能够创造商业价值的知识,面向企业战略并服务于管理层、业务层,指导企业经营决策,提升企业竞争力。
商务智能复习题.doc
二、判断题(本题共10道小题,每小题1分,共10分)(F ) 4.独立的数据集市架构的优点是企业内数据一致,不会产生信息孤岛。
(F ) 6.企业风险分析是通过对企业的经营成本进行综合评价,拟定一个企业成本的临界值。
(T ) &在BI中,DW是前提和基础,负责统一数据规则的处理和存储。
(F ) 9.客户服务管理是对客户意见或投诉以及售前、售中、售后服务进行管理。
(F ) 10.平衡计分卡共包括三个层面,分别是财务层面、客户层面、内部业务流程层面。
(F ) 12.在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。
(F ) 13. OLAP是用来协助企业对响应事件或事务的日常商务活动进行处理。
(F ) 16. C4.5决策树算法是国际上最早、最有影响力的决策树算法,(T ) 17.平衡计分卡是从财务、客户、内部运营、学习与成长四个角度,将组织的战略落实为可操作的衡量指标和目标值的一种新型绩效管理体系。
(F ) 1&客户服务管理是对客户意见或投诉以及售前、售中、售后服务进行管理。
(F ) 19.企业绩效管理的目的在于进一步加强成本的事前控制,同时有助于通过盈亏分析,辅助产品科学的报价。
(T )等深分箱法使每个箱子的记录个数相同。
(F )数据仓库“粒度”越细,记录数越少。
F记录树越多,范围越广泛(F )回归分析通常用于挖掘关联规则。
(T )孤立点在数据挖掘时总是被视为异常、无用数据而丢弃。
34.决策树方法特别适合于处理数值型数据。
(F )数据立方体是广义知识发现的方法和技术之一。
(F )可信度是对关联规则的准确度的衡量。
(T )可视化技术对于分析的数据类型通常不是专用性的。
(T ) OLAP技术侧重于把数据库中的数据进行分析、转换成辅助决策信息,是继数据库技术发展之后迅猛发展起来的一种新技术。
(F)关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则(F )Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。
复习范围商务智能
一、选择题(5道,10分) 二、判断题(10道,10分) 三、名词解释(4道,20分)商务智能 数据仓库 数据挖掘 绩效管理企业经营分析系统. 平衡计分卡 数据规范化 ROLAP 决策树四、简答题(5道,30分)1. 简述数据、信息和知识之间的关系。
2. 画出商务智能的系统架构图,实现其功能的三大技术是什么?3. 实现商务智能的四个阶段是什么?4. 何谓数据仓库?为什么要建立数据仓库?5. 简述OLAP 与数据挖掘的区别和联系。
6. 简述OLAP 的基本操作有哪些?7. 简述数据挖掘从技术角度的定义和含义。
8. 何谓数据挖掘?它有哪些方面的功能?9. 在数据挖掘之前为什么要对原始数据进行预处理? 10. 简述构造智能CRM 系统的完整步骤。
11. 简述智能CRM 系统的特点。
12. 影响客户流失的因素有哪些?13. 简述客户流失模型的建立和应用过程。
14. 简述K-近邻分类法的基本思想。
15. 主成分分析法的基本思想是什么?16. 什么是决策树?ID3算法的步骤是什么? 17. 简述K-近邻分类法的基本思想。
18. 关联规则挖掘能发现什么知识?简述关联规则挖掘的基本步骤。
19. 什么是绩效管理?目的是什么?20. 什么是平衡计分卡?设计平衡计分卡的目的是什么? 五、计算题(10分)给定如下要进行聚类的元组:{3,5,11,13,4,21,31,12,26},假设分为2类,即K 1=2,初始时用前两个数值作为类的均值:m=3 和 m=5。
假设给定如下元组:{3,5,11,13,4,21,31,12,26}已分为两类:K1={3,4,5,110,12,13} 和 K2={21,31,26},应用K-近邻法判断元组x=16属于哪一类?设K=3,写出判断过程。
T )X ,X ,X (X 321=的协方差矩阵⎪⎪⎪⎭⎫ ⎝⎛--=200052021A 的特征值和特征向量分别为:)0,924.0,383.0(e 83.5T11-==,λ,)1,0,0(e 00.2T 22==,λ,)0,383.0,924.0(e 17.0T33==,λ,求X 的主成分,计算其贡献率。
商务智能复习题
一、选择题(本题共5道小题,每小题2分,共10分)1. 数据仓库是随着时间变化(de),下面(de)描述不正确(de)是 ( C ).A. 数据仓库随时间(de)变化不断增加新(de)数据内容B. 捕捉到(de)新数据会覆盖原来(de)快照C. 数据仓库随事件变化不断删去旧(de)数据内容D. 数据仓库中包含大量(de)综合数据,这些综合数据会随着时间(de)变化不断地进行重新综合2. 有关数据仓库(de)开发特点,不正确(de)描述是( B ).A. 数据仓库使用(de)需求在开发初期就要明确B. 数据仓库开发要从数据出发C. 数据仓库(de)开发是一个不断循环(de)过程,是启发式(de)开发D. 在数据仓库环境中,并不存在操作型环境中所固定(de)和较确切(de)处理流,数据仓库中数据分析和处理更灵活,且没有固定(de)模式3. 在有关数据仓库测试,下列说法不正确(de)是 ( D ).A. 在完成数据仓库(de)实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统测试.B. 当数据仓库(de)每个单独组件完成后,就需要对他们进行单元测试.C. 系统(de)集成测试需要对数据仓库(de)所有组件进行大量(de)功能测试和回归测试.D. 在测试之前没必要制定详细(de)测试计划.4. 关于基本数据(de)元数据是指 ( D ).A. 基本元数据与数据源、数据仓库、数据集市和应用程序等结构相关(de)信息B. 基本元数据包括与企业相关(de)管理方面(de)数据和信息C. 基本元数据包括日志文件和简历执行处理(de)时序调度信息D. 基本元数据包括关于装载和更新处理,分析处理以及管理方面(de)信息6. 下面关于数据粒度(de)描述不正确(de)是 ( C ).A. 粒度是指数据仓库小数据单元(de)详细程度和级别B. 数据越详细,粒度就越小,级别也就越高C. 数据综合度越高,粒度也就越大,级别也就越高D. 粒度(de)具体划分将直接影响数据仓库中(de)数据量以及查询质量6. 关于OLAP(de)特性,下面正确(de)是:( D )(1)快速性 (2)可分析性 (3)多维性 (4)信息性 (5)共享性A. (1) (2) (3)B. (2) (3) (4)C. (1) (2) (3) (4)D. (1) (2) (3) (4) (5)7. 关于OLAP和OLTP(de)区别描述,不正确(de)是: ( C )A. OLAP主要是关于如何理解聚集(de)大量不同(de)数据,它与OTAP应用程序不同.B. 与OLAP应用程序不同,OLTP应用程序包含大量相对简单(de)事务.C. OLAP(de)特点在于事务量大,但事务内容比较简单且重复率高.D. OLAP是以数据仓库为基础(de),但其最终数据来源与OLTP一样均来自底层(de)数据库系统,两者面对(de)用户是相同(de).8. 关于OLAP和OLTP(de)说法,下列不正确(de)是: ( A )A. OLAP事务量大,但事务内容比较简单且重复率高B. OLAP(de)最终数据来源与OLTP不一样C. OLTP面对(de)是决策人员和高层管理人员D. OLTP以应用为核心,是应用驱动(de)9. OLAP技术(de)核心是( D ).A. 在线性B. 对用户(de)快速响应C. 互操作性D. 多维分析10.某超市研究销售纪录数据后发现,买啤酒(de)人很大概率也会购买尿布,这种属于数据挖掘(de)哪类问题 ( A )A. 关联规则B. 聚类C. 分类D. 自然语言处理11. 分析型CRM(de)( C )功能可以让CRM对所进行(de)销售活动相关信息进行存储和管理,将客户所发生(de)交易与互动事件转化为有意义、高获利(de)销售商机.A. 促销管理B. 个性化和标准化C. 客户分析和建模D. 客户沟通12. 运用关键绩效指标法设计组织关键绩效指标依次经过以下几个步骤( A ).A. 确定关键成功领域、确定关键绩效要素、确定关键绩效指标B. 计划目标、实施目标、评价结果、反馈C. 确定目标、比较目标、收集分析数据、系统学习与改进、评价和提高D. 确定长期整体目标、确定短期目标13.什么是KDD ( A )A. 知识发现B. 领域知识发现C. 文档知识发现D. 动态知识发现14. 呼叫中心是一种基于( D )(de)一种新(de)综合信息服务系统.A IT技术B CTI技术C WEB技术D CRM技术15. 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤(de)任务 (C)A. 频繁模式挖掘B. 分类和预测C. 数据预处理D. 数据流挖掘16. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签(de)数据与带其他标签(de)数据相分离 ( B )A. 分类B. 聚类C. 关联分析D. 隐马尔可夫链17. 使用交互式(de)和可视化(de)技术,对数据进行探索属于数据挖掘(de)哪一类任务(A)A. 探索性数据分析B. 建模描述C. 预测建模D. 寻找模式和规则18. 为数据(de)总体分布建模,把多维空间划分成组等问题属于数据挖掘(de)哪一类任务( B)A. 探索性数据分析B. 建模描述C. 预测建模D. 寻找模式和规则19. 建立一个模型,通过这个模型根据已知(de)变量值来预测其他某个变量值属于数据挖掘(de)哪一类任务 ( C )A. 根据内容检索B. 建模描述C. 预测建模D. 寻找模式和规则20. 用户有一种感兴趣(de)模式并且希望在数据集中找到相似(de)模式,属于数据挖掘哪一类任务 ( A )A. 根据内容检索B. 建模描述C. 预测建模D. 寻找模式和规则21.下面哪种不属于数据预处理(de)方法 ( D )A. 变量代换B. 离散化C. 聚集D. 估计遗漏值22.下面哪个不属于数据(de)属性类型( D ).A. 标称B. 序数C. 区间D. 相异23. 在上题中,属于定量(de)属性类型是( C ).A. 标称B. 序数C. 区间D. 相异24. 只有非零值才重要(de)二元属性被称作( C ).A. 计数属性B. 离散属性C. 非对称(de)二元属性D. 对称属性25. 以下哪种方法不属于特征选择(de)标准方法 ( D ).A. 嵌入B. 过滤C. 包装D. 抽样26.下面不属于创建新属性(de)相关方法(de)是( C ).A. 特征提取B. 特征修改C. 映射数据到新(de)空间D. 特征构造27. 下面哪个属于映射数据到新(de)空间(de)方法 ( A )A. 傅立叶变换B. 特征加权C. 渐进抽样D. 维归约28. 企业所建立(de)预测模型(de)好坏取决于模型在( A )上(de)表现效果.A. 得分集B. 训练集C. 测试集D. 评价集29. 客户在经济活动中具有多重身份,下面哪一种不是其身份之一( C ).A. 行为身份B. 所有权身份C. 学习身份D. 决策身份30. 下列四条描述中,正确(de)一条是( B ).A. 企业实施数据挖掘,必须要有数据仓库.B. 企业要实施数据挖掘最好(de)方式是请编外专家.C. 企业购买现成数据挖掘模型(de)一个先决条件是:该企业(de)产品、客户、市场定位和所买来(de)现成模型设计之初(de)假设相吻合.D. 在建模(de)时侯,增益最高(de)模型就是最好(de)模型.31. 数据挖掘算法以( D )形式来组织数据.A. 行B. 列C. 记录D. 表格32. 企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确(de)是( B ).A. 数据越多越好.B. 尽可能多(de)适合(de)数据.C. 得分集数据是建模集数据(de)一部分.D. 以上三条都正确.33. K—均值类别侦测要求输入(de)数据类型必须是( B ).A. 整型B. 数值型C. 字符型D. 逻辑型34. 在决策树和累计增益图(de)关系转化过程图中,决策树上某一页节点(de)增益与累计增益图上(de)( D )相对应.A. 线段长度B. 线段斜率C. 相对应(de)线段长度D. 相对应(de)线段斜率35. 企业为提升每个客户(de)价值,应实现( C )最优化.A. 促销活动B. 预算最优化C. 客户最优化D. 三者都不是36. 数据挖掘(de)经典案例“啤酒与尿布试验”最主要是应用了( C )数据挖掘方法.A. 分类B. 预测C. 组合或关联法则D. 聚类37. 企业成功实施数据挖掘, 需要以下( B )知识或技术.A. 预先(de)规划B. 对商业文体(de)理解C. 综合商业知识和技能D. 都需要38. 下列哪个不是专门用于可视化时间空间数据(de)技术( B ).A. 等高线图B. 饼图C. 曲面图D. 矢量场图39. 在抽样方法中,当合适(de)样本容量很难确定时,可以使用(de)抽样方法是 ( D ).A. 有放回(de)简单随机抽样B. 无放回(de)简单随机抽样C. 分层抽样D. 渐进抽样40. 设X={1,2,3}是频繁项集,则可由X产生( C )个关联规则.A. 4B. 5C. 6D. 741. 概念分层图是( B )图.A. 无向无环B. 有向无环C. 有向有环D. 无向有环42. 以下哪些算法是分类算法( B ).A. DBSCANB. C4.5C. K-MeanD. EM43. 以下哪些分类方法可以较好地避免样本(de)不平衡问题( A ).A. KNNB. SVMC. BayesD. 神经网络44. 以下关于人工神经网络(ANN)(de)描述错误(de)有 ( A ).A. 神经网络对训练数据中(de)噪声非常鲁棒B. 可以处理冗余特征C. 训练ANN是一个很耗时(de)过程D. 至少含有一个隐藏层(de)多层神经网络45. 通过聚集多个分类器(de)预测来提高分类准确率(de)技术称为 ( A ) .A. 组合(ensemble)B. 聚集(aggregate)C. 合并(combination)D. 投票(voting)46. 简单地将数据对象集划分成不重叠(de)子集,使得每个数据对象恰在一个子集中,这种聚类类型称作( B ).A. 层次聚类B. 划分聚类C. 非互斥聚类D. 模糊聚类47. 在基本K均值算法里,当邻近度函数采用( A )(de)时候,合适(de)质心是簇中各点(de)中位数.A. 曼哈顿距离B. 平方欧几里德距离C. 余弦距离D. Bregman散度48.( C )是一个观测值,它与其他观测值(de)差别如此之大,以至于怀疑它是由不同(de)机制产生(de).A. 边界点B. 质心C. 离群点D. 核心点48. 检测一元正态分布中(de)离群点,属于异常检测中(de)基于( A )(de)离群点检测.A. 统计方法B. 邻近度C. 密度D. 聚类技术49. DBSCAN在最坏情况下(de)时间复杂度是( B ).A. O(m)B. O(m2)C. O(log m)D. O(mlog m)50. 关于K均值和DBSCAN(de)比较,以下说法不正确(de)是( A ).A. K均值丢弃被它识别为噪声(de)对象,而DBSCAN一般聚类所有对象.B. K均值使用簇(de)基于原型(de)概念,而DBSCAN使用基于密度(de)概念.C. K均值很难处理非球形(de)簇和不同大小(de)簇,DBSCAN可以处理不同大小和不同形状(de)簇.D. K均值可以发现不是明显分离(de)簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠(de)簇.51. 使用交互式(de)和可视化(de)技术,对数据进行探索属于数据挖掘(de)哪一类任务( A )A. 探索性数据分析B. 建模描述C. 预测建模D. 寻找模式和规则52.下面哪种不属于数据预处理(de)方法 ( D )A变量代换 B离散化 C 聚集 D 估计遗漏值二、判断题(本题共10道小题,每小题1分,共10分)( T )1.商务智能指收集、转换、分析和发布数据(de)过程,目(de)是为了更好(de)决策.( F )2.数据分析是整合企业原始数据(de)第一步,包括数据抽取、转换和装载三个过程.( T )3.维是人们观察数据(de)特定角度,是考虑问题时(de)一类属性.( F )4.独立(de)数据集市架构(de)优点是企业内数据一致,不会产生信息孤岛.( T )5. 星型模型(de)核心是事实表,事实表把各种不同(de)维表连接起来.( F )6.企业风险分析是通过对企业(de)经营成本进行综合评价,拟定一个企业成本(de)临界值.( T )7.衡量客户忠诚(de)唯一尺度就是客户是否重复或持久地购买企业(de)产品或者服务.( T )8.在BI中,DW是前提和基础,负责统一数据规则(de)处理和存储.( F )9.客户服务管理是对客户意见或投诉以及售前、售中、售后服务进行管理.( F )10. 平衡计分卡共包括三个层面,分别是财务层面、客户层面、内部业务流程层面.( T )11.数据挖掘(de)主要任务是从数据中发现潜在(de)规则,从而能更好(de)完成描述数据、预测数据等任务.( F )12.在聚类分析当中,簇内(de)相似性越大,簇间(de)差别越大,聚类(de)效果就越差.( F )13.OLAP是用来协助企业对响应事件或事务(de)日常商务活动进行处理.( T )14.数据仓库是面向主题(de)、集成(de)、稳定(de)、随时间变化(de)数据集合,用以支持管理决策(de)过程.( T )15. 数据预处理是整合企业原始数据(de)第一步,包括数据抽取、转换和装载三个过程.( F )16.C4.5决策树算法是国际上最早、最有影响力(de)决策树算法,( T )17.平衡计分卡是从财务、客户、内部运营、学习与成长四个角度,将组织(de)战略落实为可操作(de)衡量指标和目标值(de)一种新型绩效管理体系.( F )18.客户服务管理是对客户意见或投诉以及售前、售中、售后服务进行管理.( F )19. 企业绩效管理(de)目(de)在于进一步加强成本(de)事前控制,同时有助于通过盈亏分析,辅助产品科学(de)报价.20. 数据仓库(de)数据量越大,其应用价值也越大.F21. 啤酒与尿布(de)故事是聚类分析(de)典型实例.F22. 等深分箱法使每个箱子(de)记录个数相同.T23. 数据仓库“粒度”越细,记录数越少.F24. 数据立方体由3维构成,Z轴表示事实数据.F25. 决策树方法通常用于关联规则挖掘.F26. ID3算法是决策树方法(de)早期代表.T27. C4.5是一种典型(de)关联规则挖掘算法.F28. 回归分析通常用于挖掘关联规则.F29. 人工神经网络特别适合解决多参数大复杂度问题.T30. 概念关系分析是文本挖掘所独有(de).F31. 可信度是对关联规则(de)准确度(de)衡量.F32. 孤立点在数据挖掘时总是被视为异常、无用数据而丢弃.T33. SQL Server 2005不提供关联规则挖掘算法.F34. 决策树方法特别适合于处理数值型数据.F35. 数据仓库(de)数据为历史数据,从来不需要更新.T36. 数据立方体是广义知识发现(de)方法和技术之一.F37. 数据立方体(de)其中一维用于记录事实数据.T38. 数据挖掘(de)目标不在于数据采集策略,而在于对于已经存在(de)数据进行模式(de)发掘.( T )39. 图挖掘技术在社会网络分析中扮演了重要(de)角色.( T )40. 模式为对数据集(de)全局性总结,它对整个测量空间(de)每一点做出描述;模型则对变量变化空间(de)一个有限区域做出描述.( F )41. 寻找模式和规则主要是对数据进行干扰,使其符合某种规则以及模式.( F )42. 离群点可以是合法(de)数据对象或者值. ( T )43. 离散属性总是具有有限个值. ( F )44. 噪声和伪像是数据错误这一相同表述(de)两种叫法. ( F )45. 用于分类(de)离散化方法之间(de)根本区别在于是否使用类信息. ( T )46. 特征提取技术并不依赖于特定(de)领域. ( F )47. 可信度是对关联规则(de)准确度(de)衡量.F48. 定量属性可以是整数值或者是连续值. ( T )49. 可视化技术对于分析(de)数据类型通常不是专用性(de). ( T )50. DSS主要是基于数据仓库、联机数据分析和数据挖掘技术(de)应用.( F )51. OLAP技术侧重于把数据库中(de)数据进行分析、转换成辅助决策信息,是继数据库技术发展之后迅猛发展起来(de)一种新技术. ( T )52. 商业智能系统与一般交易系统之间在系统设计上(de)主要区别在于:后者把结构强加于商务之上,一旦系统设计完毕,其程序和规则不会轻易改变;而前者则是一个学习型系统,能自动适应商务不断变化(de)要求. ( T )53. 数据仓库中间层OLAP服务器只能采用关系型OLAP. ( F )54.数据仓库系统(de)组成部分包括数据仓库、仓库管理、数据抽取、分析工具等四个部分. ( F )55.Web数据挖掘是通过数据库仲(de)一些属性来预测另一个属性,它在验证用户提出(de)假设过程中提取信息.( F )56. 关联规则挖掘过程是发现满足最小支持度(de)所有项集代表(de)规则.( F )57. 聚类(clustering)是这样(de)过程:它找出描述并区分数据类或概念(de)模型(或函数),以便能够使用模型预测类标记未知(de)对象类. ( F )58. 分类和回归都可用于预测,分类(de)输出是离散(de)类别值,而回归(de)输出是连续数值.( T )59. 对于SVM分类算法,待分样本集中(de)大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响. ( T )60. Bayes法是一种在已知后验概率与类条件概率(de)情况下(de)模式分类方法,待分样本(de)分类结果取决于各类域中样本(de)全体. ( F )三、名词解释(本题共4道小题,每小题5分,共20分)1.商务智能商务智能是融合了先进信息技术与创新管理理念(de)结合体,集成企业内外数据,进行加工并从中提取能够创造商业价值(de)知识,面向企业战略并服务于管理层、业务层,指导企业经营决策,提升企业竞争力.2.数据仓库数据仓库是面向主题(de)、集成(de)、稳定(de)、随时间变化(de)数据集合,用以支持管理决策(de)过程.3. 数据集成数据集成是在逻辑上或物理上把不相同来源、格式、特点(de)数据有机地整合,从而为企业提供全面(de)数据共享.4. OLAP(联机分析处理)OLAP是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来(de)、能够真正为用户所理解(de)、并真实反映企业维特性(de)信息进行快速、一致、交互地存取,从而获得对数据(de)更深入了解(de)一类软件技术.5. 数据挖掘数据挖掘是从大量(de)、不完全(de)、有噪声(de)、模糊(de)、随机(de)数据中提取正确(de)、有用(de)、未知(de)、综合(de)以及人们感兴趣(de)知识并用于决策支持(de)过程.6. 孤立点:指数据库中包含(de)一些与数据(de)一般行为或模型不一致(de)异常数据.7. 数据规范化:指将数据按比例缩放(如更换大单位),使之落入一个特定(de)区域(如0-1)以提高数据挖掘效率(de)方法.规范化(de)常用方法有:最大-最小规范化、零-均值规范化、小数定标规范化.8. 聚类:是将物理或抽象对象(de)集合分组成为多个类或簇(cluster)(de)过程,使得在同一个簇中(de)对象之间具有较高(de)相似度,而不同簇中(de)对象差别较大.9. ROLAP:是基于关系数据库存储方式(de),在这种结构中,多维数据被映像成二维关系表,通常采用星型或雪花型架构,由一个事实表和多个维度表构成.10. 数据归约:缩小数据(de)取值范围,使其更适合于数据挖掘算法(de)需要,并且能够得到和原始数据相同(de)分析结果.11. 预测型知识:是根据时间序列型数据,由历史(de)和当前(de)数据去推测未来(de)数据,也可以认为是以时间为关键属性(de)关联知识.12. 决策树:是用样本(de)属性作为结点,用属性(de)取值作为分支(de)树结构.它是分类规则挖掘(de)典型方法,可用于对新样本进行分类.13. 遗传算法:是一种优化搜索算法,它首先产生一个初始可行解群体,然后对这个群体通过模拟生物进化(de)选择、交叉、变异等遗传操作遗传到下一代群体,并最终达到全局最优.14. 知识管理:知识管理就是对一个企业集体(de)知识与技能(de)捕获,是为增强组织(de)绩效而创造、获取和使用知识(de)过程(知识(de)创造、储存、分享、应用和更新). 15. Web挖掘:Web挖掘是从大量Web文档(de)集合C中发现隐含(de)、有用(de)模式P(de)过程:C→P .四、简答题(本题共5道小题,每小题6分,共30分)1.实现商务智能(de)四个阶段是什么答:实现商务智能(de)四个阶段是数据预处理、建立数据仓库、数据分析及数据展现.(2分)数据预处理是整合企业原始数据(de)第一步,包括数据抽取、转换和装载三个过程; (1分)数据仓库则是处理海量数据(de)基础; (1分)数据分析是体现系统智能(de)关键,一般采用OLAP和DM两大技术.(1分)数据展现则主要保障系统分析结果(de)可视化.(1分)2. 数据库系统(de)局限性①数据库适于存储高度结构化(de)日常事务细节数据.决策分析型数据是多维性,分析内容复杂.②在决策分析环境中,如果事务处理(de)细节数据量太大一方面会严重影响分析效率,另一方面这些细节数据会分散决策者(de)注意力.③当事务型处理环境和分析型处理环境在同一个数据库系统中,事务型处理对数据(de)存取操作频率高,操作处理(de)时间短,而分析型处理可能需要连续运行几个小时,从而消耗大量(de)系统资源.④决策型分析数据(de)数据量大,这些数据有来自企业内部(de),也有来自企业外部(de).来自企业外部(de)数据又可能来自不同(de)数据库系统,在分析时如果直接对这些数据操作会造成分析(de)混乱.对于外部数据中(de)一些非结构化数据,数据库系统常常是无能为力.3.数据仓库与数据集市(de)区别是什么数据仓库收集了关于整个组织(de)主题信息,因此是企业范围(de).对于数据仓库,通常使用星座模式,因为它能对多个相关(de)主题建模;(3分)数据集市是数据仓库(de)一个部门子集,它针对选定(de)主题,因此是部门范围(de).对于数据集市,流行星型或雪花模式,因为它们都适合对单个主题建模.(3分)4. OLAP(de)特点①快速性Fast:用户对OLAP(de)快速反应能力有很高(de)要求.②可分析性Analysis:OLAP系统应能处理与应用有关(de)任何逻辑分析和统计分析.③多维性Multidimensional:多维性是OLAP(de)关键属性.系统必须提供对数据(de)多维视图和分析,包括对层次维和多重层次维(de)完全支持.④信息性Information:OLAP系统应能及时获得信息,并且管理大容量信息.5.简述OLAP(de)基本操作有哪些答:OLAP(de)基本操作有:1. 切片和切块(Slice and Dice):在多维数据结构中,按二维进行切片,按三维进行切块,可得到所需要(de)数据.(2分)2. 钻取(Drill) :钻取包含向下钻取(Drill-down)和向上钻取(Drill-up)/上卷(Roll-up)操作,钻取(de)深度与维所划分(de)层次相对应.(2分)3. 旋转(Rotate)/旋转(Pivot):通过旋转可以得到不同视角(de)数据.(2分)6.简述OLAP 与数据挖掘(de)区别和联系.答:OLAP 侧重于与用户(de)交互、快速(de)响应速度及提供数据(de)多维视图,而数据挖掘则注重自动发现隐藏在数据中(de)模式和有用信息,尽管允许用户指导这一过程.(3分)OLAP (de)分析结果可以给数据挖掘提供分析信息作为挖掘(de)依据,数据挖掘可以拓展OLAP 分析(de)深度,可以发现OLAP 所不能发现(de)更为复杂、细致(de)信息.(3分)7.何谓数据挖掘它有哪些方面(de)功能从大量(de)、不完全(de)、有噪声(de)、模糊(de)、随机(de)数据中,提取隐含在其中(de)、人们事先不知道(de)、但又是潜在有用(de)信息和知识(de)过程称为数据挖掘.相关(de)名称有知识发现、数据分析、数据融合、决策支持等.数据挖掘(de)功能包括:概念描述、关联分析、分类与预测、聚类分析、趋势分析、孤立点分析以及偏差分析等.(3分)8.在数据挖掘之前为什么要对原始数据进行预处理原始业务数据来自多个数据库或数据仓库,它们(de)结构和规则可能是不同(de),这将导致原始数据非常(de)杂乱、不可用,即使在同一个数据库中,也可能存在重复(de)和不完整(de)数据信息,为了使这些数据能够符合数据挖掘(de)要求,提高效率和得到清晰(de)结果,必须进行数据(de)预处理.为数据挖掘算法提供完整、干净、准确、有针对性(de)数据,减少算法(de)计算量,提高挖掘效率和准确程度.9.简述数据预处理方法和内容.数据清洗:包括填充空缺值,识别孤立点,去掉噪声和无关数据.数据集成:将多个数据源中(de)数据结合起来存放在一个一致(de)数据存储中.需要注意不同数据源(de)数据匹配问题、数值冲突问题和冗余问题等.数据变换:将原始数据转换成为适合数据挖掘(de)形式.包括对数据(de)汇总、聚集、概化、规范化,还可能需要进行属性(de)重构.数据归约:缩小数据(de)取值范围,使其更适合于数据挖掘算法(de)需要,并且能够得到和原始数据相同(de)分析结果.10. 数据挖掘(de)六种常用算法和技术分别是什么①聚类分析;②分类分析;③关联分析;④序列模式挖掘;⑤回归分析;⑥时间序列分析.11. 数据挖掘中(de)数据需要采用哪些格式数据挖掘中(de)数据需要采用以下格式:①所有数据应该在一个表格/数据库视图中②每一行对应于与业务问题相关(de)一个案例③忽略具有单一值/几乎单一值(de)列④忽略所有行(de)值都不同(de)列⑤删除所有同义列⑥对于预测模型,目标列必须是可识别(de)12.简述K-近邻分类法(de)基本思想.答:基本思想:K-近邻分类是基于类比学习(de),每个样本代表d维空间(de)一个点.(3分)。
《商务智能方法与技术》复习资料
商务智能方法与技术》课程复习资料、客观部分:(判断、不定项选择)一)、判断部分★ 考核知识点: 商务智能系统附1.1.1 (考核知识点解释):商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升各方面商务绩效,增强综合竞争力的智慧和能力。
商务智能不是通常的业务处理。
它的目标是如何更快、更容易地做更好的决卒策。
IBM商务智能解决方案远远不只是数据和技术的组合,BI帮助用户获得正确的数据,发现它的价值,并共享价值。
★ 考核知识点: 知识概念附1.1.2 (考核知识点解释):知识就是对信息进行的提炼、比较、挖掘、分析、概括、判断和推论。
知识分为事实性知识和经验知识。
事实性知识是人类对于客观事物和现象的认识结果。
经验知识多事一种隐性知识,是存储在人们大脑中的经历、经验、技巧、体会和感悟等尚未公开的知识。
隐性知识和显性知识之间是可以相互转化的。
★考核知识点: 元数据附1.1.3 (考核知识点解释):元数据管理包括对开发、管理数据仓库时所用的技术元数据和支持业务人员的业务元数据进行管理,它对数据仓库的设计和维护具有重要的作用。
数据仓库的所有数据都要通过元数据来管理和控制。
元数据描述关于源数据的说明,包括源数据的来源、源数据的名称、源数据的定义、源数据的创建时间等对源数据进行管理所需要的信息。
源数据的来源说明源数据是从哪个系统、哪个历史数据、哪个办公数据、哪个Web 页、哪个外部系统抽取而来。
源数据说明源数据在数据仓库的作用、用途、数据类型和长度等。
元数据:是用来描述数据的数据。
它描述和定位数据组件、它们的起源及它们在数据仓库进程中的活动;关于数据和操作的相关描述( 输入、计算和输出) 。
元数据可用文件存在元数据库中。
元数据反映数据仓库中的数据项是从哪个特定的数据源填充的,经过哪些转换、集成过程。
商务智能复习的题目
一、选择题〔此题共5道小题,每一小题2分,共10分〕1. 数据仓库是随着时间变化的,下面的描述不正确的答案是( C )。
A. 数据仓库随时间的变化不断增加新的数据内容B. 捕捉到的新数据会覆盖原来的快照C. 数据仓库随事件变化不断删去旧的数据内容D. 数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进展重新综合2. 有关数据仓库的开发特点,不正确的描述是( B )。
A. 数据仓库使用的需求在开发初期就要明确B. 数据仓库开发要从数据出发C. 数据仓库的开发是一个不断循环的过程,是启发式的开发D. 在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式3. 在有关数据仓库测试,如下说法不正确的答案是( D )。
A. 在完成数据仓库的实施过程中,需要对数据仓库进展各种测试。
测试工作中要包括单元测试和系统测试。
B. 当数据仓库的每个单独组件完成后,就需要对他们进展单元测试。
C. 系统的集成测试需要对数据仓库的所有组件进展大量的功能测试和回归测试。
D. 在测试之前没必要制定详细的测试计划。
4. 关于根本数据的元数据是指( D )。
A. 根本元数据与数据源、数据仓库、数据集市和应用程序等结构相关的信息B. 根本元数据包括与企业相关的管理方面的数据和信息C. 根本元数据包括日志文件和简历执行处理的时序调度信息D. 根本元数据包括关于装载和更新处理,分析处理以与管理方面的信息6. 下面关于数据粒度的描述不正确的答案是( C )。
A. 粒度是指数据仓库小数据单元的详细程度和级别B. 数据越详细,粒度就越小,级别也就越高C. 数据综合度越高,粒度也就越大,级别也就越高D. 粒度的具体划分将直接影响数据仓库中的数据量以与查询质量6. 关于OLAP的特性,下面正确的答案是:( D )(1)快速性(2)可分析性(3)多维性(4)信息性(5)共享性A. (1) (2) (3)B. (2) (3) (4)C. (1) (2) (3) (4)D. (1) (2) (3) (4) (5)7. 关于OLAP和OLTP的区别描述,不正确的答案是:( C )A. OLAP主要是关于如何理解聚集的大量不同的数据,它与OTAP应用程序不同。
商务智能复习资料
商务智能复习资料第一章商务智能概述1、4C(1)信息技术是指获取、传递、处理和存储、以及利用信息的技术。
(2)4C内容:感测技术(是信息的采集技术,对应于人的感觉器官);通讯技术(是信息的传递技术,对应于人的神经系统);计算机技术(是信息的处理和存储技术,对应于人的思维器官);控制技术(是信息的使用技术,对应于人的执行器官)。
(3)信息技术工具:信息处理技术和通信技术是最重要的两种。
2、定义商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累积商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升个方面商务绩效,增强综合竞争力的智慧和能力。
3、商务智能的基本功能:个性化的信息分析;预测;辅助决策。
5、商务智能的作用:理解业务;衡量绩效;改善关系;创造获利机会。
6、商务智能的体系结构:是指通过识别和理解数据在系统中的流动过程和数据在企业中的应用过程来提供商务智能系统的主框架。
7、BI与交易系统的关系:系统设计的区别数据类型的区别8、数据、信息、知识、智能之间的关系(1)数据:孤立的客观事实、文字、符号,适合保存、传递和处理。
TO知识:是知识的表现形式,是知识的来源。
TO信息:数据的价值通过其携带的信息表现。
(2)信息:人们对数据进行系统的采集、组织、整理、分析的结果,目的是使数据结构化、有序化。
TO数据:信息是数据的含义,是对数据的解释。
TO知识:信息是知识的表现形式。
(3)知识:是人们对自认识而总结出来的规律、经验。
第二章数据仓库导论1、什么是数据仓库数据仓库是面向主题的、集成的、稳定的,不同时间的数据集合,用于支持经营管理中决策制定过程。
2、数据仓库的特点:面向主题;集成;稳定;随时间而变化;数据量大;软硬件要求高。
3、数据仓库与传统数据库的区别4、OLTP与OLAP的区别5、数据仓库的用户包括(1)信息使用者的数据仓库应用:以一种可以预测的、重复的方式使用。
商务智能复习题精编版
商务智能复习题精编版 MQS system office room 【MQS16H-TTMS2A-MQSS8Q8-MQSH16898】一、选择题(本题共5道小题,每小题2分,共10分)1.数据仓库是随着时间变化的,下面的描述不正确的是(C)。
A.数据仓库随时间的变化不断增加新的数据内容B.捕捉到的新数据会覆盖原来的快照C.数据仓库随事件变化不断删去旧的数据内容D.数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合2.有关数据仓库的开发特点,不正确的描述是(B)。
A.数据仓库使用的需求在开发初期就要明确B.数据仓库开发要从数据出发C.数据仓库的开发是一个不断循环的过程,是启发式的开发D.在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式3.在有关数据仓库测试,下列说法不正确的是(D)。
A.在完成数据仓库的实施过程中,需要对数据仓库进行各种测试。
测试工作中要包括单元测试和系统测试。
B.当数据仓库的每个单独组件完成后,就需要对他们进行单元测试。
C.系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试。
D.在测试之前没必要制定详细的测试计划。
4.关于基本数据的元数据是指(D)。
A.基本元数据与数据源、数据仓库、数据集市和应用程序等结构相关的信息B.基本元数据包括与企业相关的管理方面的数据和信息C.基本元数据包括日志文件和简历执行处理的时序调度信息D.基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息6.下面关于数据粒度的描述不正确的是(C)。
A.粒度是指数据仓库小数据单元的详细程度和级别B.数据越详细,粒度就越小,级别也就越高C.数据综合度越高,粒度也就越大,级别也就越高D.粒度的具体划分将直接影响数据仓库中的数据量以及查询质量6.关于OLAP的特性,下面正确的是:(D)(1)快速性(2)可分析性(3)多维性(4)信息性(5)共享性A.(1)(2)(3)B.(2)(3)(4)C.(1)(2)(3)(4)D.(1)(2)(3)(4)(5)7.关于OLAP和OLTP的区别描述,不正确的是:(C)主要是关于如何理解聚集的大量不同的数据,它与OTAP应用程序不同。
商务智能复习题讲课稿
商务智能复习题讲课稿商务智能复习题一、选择题(本题共5道小题,每小题2分,共10分)1. 数据仓库是随着时间变化的,下面的描述不正确的是 ( C )。
A. 数据仓库随时间的变化不断增加新的数据内容B. 捕捉到的新数据会覆盖原来的快照C. 数据仓库随事件变化不断删去旧的数据内容D. 数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合2. 有关数据仓库的开发特点,不正确的描述是( B )。
A. 数据仓库使用的需求在开发初期就要明确B. 数据仓库开发要从数据出发C. 数据仓库的开发是一个不断循环的过程,是启发式的开发D. 在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式3. 在有关数据仓库测试,下列说法不正确的是 ( D )。
A. 在完成数据仓库的实施过程中,需要对数据仓库进行各种测试。
测试工作中要包括单元测试和系统测试。
B. 当数据仓库的每个单独组件完成后,就需要对他们进行单元测试。
C. 系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试。
D. 在测试之前没必要制定详细的测试计划。
4. 关于基本数据的元数据是指 ( D )。
A. 基本元数据与数据源、数据仓库、数据集市和应用程序等结构相关的信息B. 基本元数据包括与企业相关的管理方面的数据和信息C. 基本元数据包括日志文件和简历执行处理的时序调度信息D. 基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息6. 下面关于数据粒度的描述不正确的是 ( C )。
A. 粒度是指数据仓库小数据单元的详细程度和级别B. 数据越详细,粒度就越小,级别也就越高C. 数据综合度越高,粒度也就越大,级别也就越高D. 粒度的具体划分将直接影响数据仓库中的数据量以及查询质量6. 关于OLAP的特性,下面正确的是:( D )(1)快速性 (2)可分析性 (3)多维性 (4)信息性 (5)共享性A. (1) (2) (3)B. (2) (3) (4)C. (1) (2) (3) (4)D. (1) (2) (3) (4) (5)7. 关于OLAP和OLTP的区别描述,不正确的是: ( C )A. OLAP主要是关于如何理解聚集的大量不同的数据,它与OTAP 应用程序不同。
《商务智能》复习题及答案
《商务智能》复习题及答案1、把数据报表从一年展开成四个季度的操作是(C )A、上卷B、旋转C、下钻D、切片2、在多维数据集中,对某一个维度上的数据进行选择一维成员,其他维度没有变化的操作是( D)A、切块B、旋转C、下钻D、切片3、一个多维数组表示为:(维1,维2,维3,维4,变量),这是一个(B )维结构。
A、3B、4C、5D、64、一次购买行为的发起需要有:购买者、商家、商品、购买时间、供应商和订单金额。
如果设计星型模型,请问有几个维度(C )A、3B、4C、5D、65、在进行ETL时,应该在(C )里进行。
A、ODSB、数据仓库C、数据准备区D、源数据6、(多选题)此大数据带来的变革有(ABD ).A、思维变革B、商业变革C、购物变革D、管理变革7、自然演化式体系结构的问题有(ACD )。
(多选)A、数据可信性B、无法进行数据处理C、生产率问题D、无法将数据转化为信息8、数据立方体是指(C ).A、三维数据集B、三维以上的数据集C、三维和三维以上的数据集D、四维数据集'9、戈登·未尔提出在今后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度,每(D )左右可以翻一番。
A、1个月B、6个月C、12个月D、18个月10、大数据时代的核心价值是(B)A.数据收集B.数据分析C.数据挖掘D.数据可视化11、大数据的来源包括( ABCD).A.互联网数据B.传感器数据C.实时数据D.探测数据11、好友的QQ突然发来一个网站链接要求投票,最合理的做法是( C)A.因为是其好反信总,直接打开使接投票B.不参与任何投票C.可能是好友aq被盗,可能是恶意筑接。
先通过予机跟朋友确认链技按无异常,考虑是否投票D.把好友加入黑名单12、关于大数据特点,错误的是(C )A、数据量大B、数据类型多C.数据价值密度高D.数据处理速度快13、Hadop是基于(B )语言的数据分析框架。
A. C++B. JavaC. RD. C#14.Maphedue的主导思想是(C )A.集成化B.一体化C.分而治之D.综合化15.下列与大数据密切相关的技术是(B)A.蓝牙B.云计算C.博穿论D.WiFi16.大数据的数据类型包括结构化数据、非结构化数据和(A ).A.半结构化数据B.无结构化数据C.关系数据库数D.文本数据和WEe数报17.数据仓库中的数据(ABCD )A.集成的B.可以变化的C.面向主题的D.不易丢失的18.数据仓库是随着时间变化的。
商务智能题库整理
商务智能题库整理商务智能--复习提纲⼀.选择题(第⼀次作业)1.数据仓库是随着时间变化的,下⾯的描述不正确的是AA.数据仓库随时间变化不断删去旧的数据内容B.捕捉到的新数据会覆盖原来的数据C.数据仓库随时间的变化不断增加新的数据内容D.数据仓库中包含⼤量的综合数据,这些综合数据会随着时间的变化不断地进⾏重新综合2. OLAP在辅助决策时,基于⽤户建⽴的⼀系列假设驱动,通过OLAP来证实或者推翻这些假设是个()的过程CA集成B转换C演绎D归纳3.不同操作型系统之间的数据⼀般是相互独⽴、异构的。
⽽数据仓库中的数据是对分散的数据进⾏抽取、清理、转换和汇总后得到的,这样就保证了数据仓库的数据关于整个企业的()DA时变性B⾮易失性C差异性D⼀致性4.如下图所⽰操作是OLAP分析的哪种操作( D )A切⽚B旋转C下钻D上钻5.数据⽴⽅体中的数据单元格是⼀个数值函数,该函数可以对数据⽴⽅体求值,如下哪个函数可以⽤来对数据⽴⽅体进⾏度量()CA.substring()B.rand()C.sum()D.trunc()6.关于数据仓库数据的时变性,如下描述不正确的是DA操作型系统存储的是当前数据,⽽数据仓库中的数据是历史数据B数据仓库中的数据是按照时间顺序追加的,它们都带有时间属性C数据仓库的数据时限⼀般要远远长于操作型数据的数据时限D数据仓库对响应时间要求不严格,处理时间从⼏秒到⼏分钟,有时甚⾄⼏⼩时7.数据仓库是⾯向主题的,逻辑意义上每⼀个商业主题都对应与企业决策包含的分析对象,⼀家保险公司的数据仓库的主题可能包含哪些BA顾客储蓄账B顾客、账户、索赔C顾客保险⾦额D顾客账单8.假如警察要得到某犯罪嫌疑⼈在指定时间段的通话记录最有可能在( C )系统中获得A决策⽀持系统B电信营业账务系统C电信数据仓库系统D元数据管理系统9.下⾯关于数据粒度的描述不正确的是BA数据综合度越⾼,粒度也就越⼤,级别也就越⾼B数据越详细,粒度就越⼩,级别也就越⾼C粒度是指数据仓库⼩数据单元的详细程度和级别D粒度的具体划分将直接影响数据仓库中的数据量以及查询质量10.数据仓库并⾮只是数据的简单累积,⽽是要经过⼀系列的处理过程,即ETL,ETL过程包括哪些CA数据操作、数据挖掘、数据转义B数据存储、数据维护、数据分析C数据抽取、数据转换、数据装载D数据定义、数据建模、数据管理11.企业要建⽴预测模型,需准备建模数据集,以下四条描述建模数据集正确的A A尽可能多的适合的数据B得分集数据是建模集数据的⼀部分C数据越多越好D以上三条都正确12.关于基本数据的元数据是指DA基本元数据与数据源、数据仓库、数据集市和应⽤程序等结构相关的信息B基本元数据包括⽇志⽂件和简历执⾏处理的时序调度信息C基本元数据包括与企业相关的管理⽅⾯的数据和信息D基本元数据包括关于装载和更新处理,分析处理以及管理⽅⾯的信息13.数据⽴⽅体中的数据单元格中的数据可以通过如下哪些函数获得?AA分布聚集函数count()、sum()、min()、max()和代数聚集函数avg()、stddev() B分析函数C分布聚集函数count()、sum()、min()、max()D聚集函数avg()、stddev()14.关于OLAP和OLTP的说法,下列不正确的是BA.OLTP以应⽤为核⼼,是应⽤驱动的B.OLAP事务量⼤,但事务内容⽐较简单且重复率⾼C.OLAP的最终数据来源与OLTP不⼀样D.OLTP⾯对的是决策⼈员和⾼层管理⼈员15.数据挖掘是通过()的⽅式在海量数据中主动找寻模型,⾃动发掘隐藏在数据中的价值信息,OLAP分析结果为挖掘提供分析依据。
《商务智能》考试复习内容-(含答案)
《商务智能》考试复习内容-(含答案)闭卷考试,时间120分钟,五种题型:选择题(10分)、判断题(10分)、名词解释题(30分)、简答题(30分)、论述题(20分)第1章商务智能基本知识(1)商务智能的概念、价值、驱动⼒。
概念:商务智能是企业利⽤现代信息技术收集、管理和分析结构化和⾮结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策⽔平,采取有效的商务⾏动,完善各种商务流程,提升各⽅⾯商务绩效,增强综合竞争⼒的智慧和能⼒-王茁专著《三位⼀体的商务智能》.商务智能解决⽅案远远不只是数据和技术的组合,帮助⽤户获得正确的数据,发现它的价值,并共享价值。
价值:() .⽀持各级决策基于事实和商业管理的(科学)的预测当前和未来的业务情况下获得历史业务数据的智能分析。
恰当准确客观及时驱动⼒:在商务智能背后有⼀些商业驱动⼒,例如:增加收⼊,减少费⽤和更有效地竞争的需求。
管理和模拟当前商业环境复杂性的需求。
减少费⽤和利⽤已有公司业务信息的需求。
(2)商务智能系统的功能、主要⼯具。
功能:在商务智能背后有⼀些商业驱动⼒,例如:增加收⼊,减少费⽤和更有效地竞争的需求。
管理和模拟当前商业环境复杂性的需求。
减少费⽤和利⽤已有公司业务信息的需求。
主要⼯具:第2章商务智能核⼼技术(1)商务智能系统的架构如何?(2)什么是数据仓库?数据仓库⽤来保存从多个数据库或其它信息源选取的数据, 并为上层应⽤提供统⼀⽤户接⼝,完成数据查询和分析。
⽀持整个企业范围的主要业务来建⽴的,主要特点是,包含⼤量⾯向整个企业的综合信息及导出信息。
数据仓库是作为服务基础的分析型,⽤来存放⼤容量的只读数据,为制定决策提供所需要的信息。
数据仓库是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的、⾯向主题及不可更新的数据集合。
以1992年W H 出版《》为标志,数据仓库发展速度很快。
W H 被誉为数据仓库之⽗。
W H 对数据仓库所下的定义:数据仓库是⾯向主题的、集成的、稳定的、随时间变化的数据集合,⽤以⽀持管理决策的过程。
商务智能课程知识点总结
商务智能课程知识点总结一、商务智能概念和基础知识1. 商务智能的概念和意义商务智能是指利用技术与工具,帮助企业收集、管理和分析大量数据,为企业决策和业务活动提供支持的过程。
商务智能系统能够帮助企业管理层更好地了解当前的业务运营情况,并根据这些情况做出更科学、更合理的决策。
2. 商务智能的发展历史商务智能技术的发展历史可以追溯到20世纪70年代,当时主要是数据库管理系统和决策支持系统的发展,逐渐演变成商务智能的综合技术体系。
随着互联网和大数据技术的迅猛发展,商务智能技术不断完善和创新,为企业提供了更全面的决策支持。
3. 商务智能的基本概念及原理商务智能的基本原理是建立在数据收集、数据管理、数据分析和决策支持的技术基础上。
商务智能系统通过数据仓库技术整合源数据,并通过数据挖掘、数据分析等技术提供有益的信息,并辅助企业决策。
4. 商务智能的组成和体系结构商务智能系统通常由数据仓库、数据挖掘、联机分析处理(OLAP)、报表和查询工具等组成。
这些组成部分通过数据整合、处理和分析,为企业提供各种层次的决策支持与信息服务。
二、商务智能技术与工具1. 数据仓库技术数据仓库是商务智能系统的核心,是用于存储和管理大量数据的集中式数据存储系统。
数据仓库技术利用ETL(提取、转换、加载)等工具从不同的数据库和数据源中提取数据,并将其集成为一种标准格式,以支持系统的分析和决策。
2. 数据挖掘技术数据挖掘技术旨在从大规模的数据中发现潜在的模式和规律。
通过数据挖掘技术,商务智能系统能够发现数据之间的联系、趋势和规律,从而提供更准确、更有效的决策支持。
3. OLAP技术联机分析处理(OLAP)技术是用于多维数据分析的工具和方法。
OLAP技术可以帮助用户从不同的角度和层次对数据进行分析和查询,有效地支持企业管理层对业务情况的理解与决策。
4. 报表和查询工具商务智能系统通常还包括报表和查询工具,用于帮助用户从数据仓库中获取有用的信息。
商务智能1复习
数据仓库结构体系
♠ 数据仓库用来保存从多个数据库或其它信息源选
取的数据,并为上层应用提供统一用户接口,完成 数据查询和分析。
♠ 数据仓库是为支持整个企业范围的主要业务来建
立的,主要特点是:包含大量面向整个企业的综合 信息及导出信息。
♠ 作为一种数据环境必要功能包括:
☆ 数据收集 ☆ 数据存储 ☆ 数据传递
数据挖掘 借助数据库技术,使用统计分析的数学方法以及人工智能的算 技术 法,从海量数据中提取隐含的、有用的知识,挖掘数据背后隐 藏的规律和模式
第二章 数据仓库
• 决策的制定需要关于当前运作、趋势和变化的明 确、可靠的信息,而数据往往是分散于不同的操 作系统下,所以管理者常常是至多基于部分信息 来做出所谓的决策。数据仓库通过访问、整合、 组织关键业务数据使其一致、可靠、及时和可 用,排除了障碍,使得数据实现了随时随地地取 用。
联机分析 根据用户的要求设计多维模型,生成井存储多维数据结构,以 处理 便在响应查询时能尽快找到满足条件的数据;通过OLAP可以全 方位、多层次地考察数据
前端分析 提供简单易用的图形化界面给管理人员或一般用户,由他们自 展示 有选择要分析的数据、定义分析角度和需要显示的结果。该部 分往往与多维分析工具配合,作为多维分析服务器的前台界面
• (3)使用按箱中值平滑对以上数据进行平滑,箱 的深度是3。
进行分箱: 箱1:11,15,16 箱2:22,22,25 箱3:32,35,35 箱4:46,52,70 (1)箱1平均值为 (11+15+16)/3=14 箱2的平均值为 (22+22+25)/3=23 箱3的平均值为 (32+35+35)/3=34 箱4的平均值为 (46+52+70)/3=56
商务智能复习材料
商务智能(Business Intelligence,简称BI):商务智能不是通常的业务处理。
它的目标是如何更快、更容易地做更好的决策。
BI将信息转换为知识。
商业智能是在正确的时间将正确的信息交给正确的用户以支持决策过程的应用。
商务智能系统优点:1商业智能系统不仅支持最新的IT 技术,同时也提供了打包的应用解决方案。
2商业智能系统着眼于终端用户对业务数据的访问和业务数据的传送,它同时为信息提供者和信息消费者提供了支持。
3商业智能系统支持对所有格式商务信息的访问,而不仅仅是那些存储在数据仓库中的信息。
在商业智能背后有一些商业驱动力,如:增加收入,减少费用和更有效地竞争的需求;管理和模拟当前商业环境复杂性的需求;减少IT费用和利用已有公司业务信息的需求。
数据仓库解决方案的缺点:1、许多数据仓库解决方案共同的一个缺点就是系统的开发者总是专注于软件技术,而不是商业解决方案。
因此,尽管他们所提供的产品能够很好地构建和访问数据仓库,但这些产品实施起来相当复杂。
2、数据仓库解决方案的另一个问题是:人们仍然过多地关心如何建立数据仓库,而不是如何对它进行访问。
操作型数据库是面向细节数据的数据库,用于满足公司内的非常复杂的处理。
在数据库中,数据高度范式化,从而避免了数据冗余。
OLAP(联机分析处理)是针对特定问题的联机数据访问和分析。
通过对信息(这些信息已经从原始的数据进行了转换,以反映用户所能理解的企业的真实的“维”)的很多可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。
维(Dimension):维是人们观察数据的特定角度。
时间维,地理维。
描述时间维时,可以从日期、月份、季度、年等不同层次来描述,那么日期、月份、季度、年等就是时间维的层次;同样,城市、地区、国家就构成了一个地理维的多个层次。
维的一个取值就称为该维的一个维成员。
如果一个维是多层次的,那么该维的维成员就是不同维层次的取值的组合。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
商务智能复习商务智能第第1 章商务智能概述1.1 商业决策需要商务智能一、数据、信息和知识1、数据:符号、事实和数字信息:有用的数据关系:信息是经过某种加工处理后的数据,是反映客观事物规律的一些数据。
数据是信息的载体, 信息是对数据的解释。
知识:对信息内容进行提炼、比较、挖掘、分析、概括、判断和推论。
2、决策离不开信息、知识①决策需要信息,更离不开知识;知识更多地表现为经验__学习的结晶;学习的过程是不断地对信息加工处理;信息的收集、加工、传输与利用贯穿着决策各阶段的工作过程。
②信息已成为企业经营中重要性仅次于人才的第二大要素。
③决策=信息+经验+冒险④商务智能是对企业信息的科学管理。
3、商务智能支持商业决策商务智能如何创造知识和价值1.2 商务智能简介商务智能这一术语1996年由Gartner 公司的分析师Howard Dresner首次提出,他提出商务智能描述了一系列的概念和方法,通过应用基于事实的支持系统来辅助商业决策的制定。
一、商务智能概念商务智能是整合了先进信息技术与创新管理理念的结合体,集成了企业内外的数据,进行加工并从中提取能够创造商业价值的信息,面向企业战略并服务于管理层、业务层,指导企业经营决策,提升企业竞争力,涉及企业战略、管理思想、业务整合和技术体系等层面,促进信息到知识再到利润的转变,从而实现更好的绩效。
①先进信息技术:商务智能是多项技术的综合应用;②集成了企业内外的数据,进行加工并从中提取能够创造商业价值的信息:商务智能的层次;③企业战略:商务智能服务于企业战略;④管理层、业务层:商务智能用户多样性;⑤更好的绩效:商务智能提升企业绩效。
二、商务智能的价值1、在商务智能背后有一些商业驱动力,如:①增加收入,减少费用和更有效地竞争的需求。
②管理和模拟当前商业环境复杂性的需求。
③减少IT 费用和利用已有公司业务信息的需求。
2、商务智能的价值①制定合适的市场营销策略;②改善顾客智能;③经营成本与收入分析;④提高风险管理能力;⑤改善业务洞察力;⑥提高市场响应能力。
1.3 商务智能系统的功能①数据集成:数据是决策分析的基础;②信息呈现:商务智能的初步功能;③经营分析:运营指标、运营业绩和财务分析;④战略决策支持:合理的投资组合。
1.4 商务智能应用领域①银行:美国银行家协会(ABA)预测数据仓库和数据挖掘技术在美国商业银行的应用增长率是14.9%。
分析客户使用分销渠道的情况和分销渠道的容量;建立利润评测模型;客户关系优化;风险控制等②电子商务:网上商品推荐;个性化网页;自适应网站… ③生物制药、基因研究:DNA 序列查询和匹配;识别基因序列的共发生性… ④电信:欺诈甄别;客户流失… ⑤保险、零售…… ⑥政府部门、教育机构、医疗机构和公用事业等。
利用商务智能的企业现在已越来越多,遍及各行各业。
第第13 章商务智能发展一、商务智能的发展事务处理系统TPS→管理信息系统MIS→主管信息系统EIS→决策支持系统DSS→智能决策支持系统IDSS 二、商务智能应用趋势①更成熟的数据分析和展现技术;②从战略型的BI 到操作型或者实时型的BI;③关注绩效、关注价值、关注数据质量。
三、商务智能在中国的发展商务智能在中国的发展尚处于起步阶段,大部分企业对商务智能仍然缺乏必要的了解。
国、内外商务智能软件企业的实施和应用水平有很大的差距,目前国外有一些企业已进入多维分析和数据挖掘阶段,而国内商务智能的发展只是近几年的事情,商务智能应用的范围和程度都与国外企业有很大差距。
绝大多数实施商务智能的企业的应用水平停留在基本的数据整合阶段和简单的统计分析阶段,真正实现深度数据分析的项目很少。
四、中国商务智能应用存在的问题①起步较晚:国内管理者想要利用商务智能解决缺乏有效信息支持决策的管理模式和操作准则越来越体现出缺乏理性的缺点。
因此国内企业管理者试图通过商务智能解决上述问题,但这种需求比国外发达国家滞后了。
②差距拉大:目前国内各行业商务智能的发展水平仍是参差不齐,商务智能在行业内也存在差距,不同规模的企业应用商务智能的差距也在拉大。
③普及有待时日:技术、观念和管理水平的相对落后,商务智能的普及还需要较长时间④供应商有待成长五、商务智能动态1、商务智能发展的特点①实时;②标准化;③嵌入式商务智能;④移动商务智能;⑤大众化趋势;⑥供应商的动向;⑦易用性。
2、2012 年商业智能的6 大预测①内存中的分析;②可视化发掘;③大数据;④移动商业智能;⑤云商业智能;⑥社交,协作的商业智能。
第第2 章商务智能系统架构 2.1 商务智能系统组成1、体系结构(Architecture):体系结构是指一整套的规则和结构,为一个系统或产品的整体设计提供主框架。
2、商务智能的体系结构一个商务智能的体系结构是通过识别和理解数据在系统中的流动过程和数据在企业中的应用过程来提供商业智能系统应用的主框架。
商务智能系统构架(见书P27)3、商务智能系统的组成①数据源与数据提取;②数据仓库;③访问工具;④决策支持工具;⑤商务智能应用;⑥系统管理;⑦元数据管理。
2.2 数据集成数据集成是在逻辑上或物理上把不相同来源、格式、特点的数据有机地整合,从而为企业提供全面的数据共享。
目的:运用一定的技术手段把分布在异构系统中的数据按一定的规则组织成一个整体,使用户能有效地对其进行共享、分析,因此数据集成是构建数据仓库的基础。
1、数据集成的常用方法①数据联邦;②基于中间件模型;③数据仓库;④主数据管理2、主数据管理与数据仓库的关系①联系:二者相辅相成,都是减少数据冗余和不一致性的跨部门集中式系统,都依赖ETL、元数据管理等技术保证数据质量。
数据仓库系统的分析结果可以输入到主数据管理系统中。
②区别:主数据管理是为呼叫中心、电子商务和CRM 等业务系统提供联机服务,数据仓库面向分析型的应用;主数据管理涉及的数据量相对较小,在运行中对主数据的集成实时性要求比数据仓库高。
3、主数据管理与ODS 的关系实时性要求具有共性,但主数据管理系统不储存ODS 系统的交易数据。
第第3 章数据仓库3.1 从数据库到数据仓库1、企业数据处理分为:事务型处理和分析型处理2、事务型处理①即操作型处理,是指对数据库的联机操作处理OLTP。
事务型处理是用来协助企业对响应事件或事务的日常商务活动进行处理。
②它是事件驱动、面向应用的,通常是对一个或一组记录的增、删、改以及简单查询等(大量、简单、重复和例行性)。
③在事务型处理环境中,数据库要求能支持日常事务中的大量事务,用户对数据的存取操作频率高而每次操作处理的时间短。
3、分析型处理①分析型处理:用于管理人员的决策分析,例如DSS、EIS 和多维分析等。
它帮助决策者分析数据以察看趋向、判断问题。
②分析型处理经常要访问大量的历史数据,支持复杂的查询。
③分析型处理过程中经常用到外部数据,这部分数据不是由事务型处理系统产生的,而是来自于其他外部数据源。
4、事务型处理数据和分析型处理数据的区别(见书P36)5、数据库系统的局限性①数据库适于存储高度结构化的日常事务细节数据。
决策分析型数据是多维性,分析内容复杂。
②在决策分析环境中,如果事务处理的细节数据量太大一方面会严重影响分析效率,另一方面这些细节数据会分散决策者的注意力。
③当事务型处理环境和分析型处理环境在同一个数据库系统中,事务型处理对数据的存取操作频率高,操作处理的时间短,而分析型处理可能需要连续运行几个小时,从而消耗大量的系统资源。
④决策型分析数据的数据量大,这些数据有来自企业内部的,也有来自企业外部的。
来自企业外部的数据又可能来自不同的数据库系统,在分析时如果直接对这些数据操作会造成分析的混乱。
对于外部数据中的一些非结构化数据,数据库系统常常是无能为力。
6、多库系统的限制①可用性:源站点或通信网络故障将导致系统瘫痪, 源站点不能通过网络在线联入多库系统。
②响应速度:全局查询多级转换和通信传输, 延迟和低层效率影响响应速度。
③系统性能:总体性能取决于源站点中性能最低的系统, 影响系统性能的发挥; ④系统开销:每次查询要启动多个局部系统, 通信和运行开销大。
3.2 数据仓库1、数据仓库的发展①1981 年NCR 公司为Wal Mart 建立了第一个数据仓库。
②1988 年IBM 公司的研究员Barry Devlin 和Paul Murphy 创造性的提出了一个新术语¡ª¡ª数据仓库③1991 年Bill Inmon 正式出版《Building the Data 、Warehouse》,第一次给出了数据仓库的清晰定义和操作性极强的指导意见④1993 年拉尔夫.金博尔出版了《The Data Warehouse Toolkit》,在具体构建方法上提出不同意见⑤1996 年加拿大的IDC 公司调查了62 家实现了数据仓库的欧美企业,结果表明:数据仓库为企业提供了巨大的收益。
2、数据仓库(Data Warehouse) ①含义:数据仓库用来保存从多个数据库或其它信息源选取的数据, 并为上层应用提供统一用户接口,完成数据查询和分析。
支持整个企业范围的主要业务来建立的,主要特点是,包含大量面向整个企业的综合信息及导出信息。
②Bill Inmon 对数据仓库所下的定义:数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用以支持管理决策的过程。
3、数据仓库的技术要求①复杂分析的高性能体现:涉及大量数据的聚集、综合等,在进行复杂查询时经常会使用多表的联接、累计、分类、排序等操作。
②对提取出来的数据进行集成:数据仓库中的数据是从多个应用领域中提取出来的,在不同的应用领域和不同的数据库系统中都有不同的结构和形式,所以如何对数据进行集成也是构建数据仓库的一个重要方面。
③对进行高层决策的最终用户的界面支持:提供各种分析应用工具。
4、数据仓库结构3.7 数据仓库模型1、概念模型设计①概念模型用来表达信息世界中的信息结构,通常人们利用概念模型定义实际的数据需求。
②概念模型最常用的表示方法是实体-关系法(E-R 法),E-R 图将现实世界表示成信息世界,便于向计算机的表示形式进行转化。
③目前的数据仓库实际上是通过主题分析表示概念模型,每个主题用若干维和度量表示。
维度是人们观察世界的特定角度,度量是确定与维度分析有关的数值信息。
2、逻辑模型设计①主要工作:a 分析主题域进行概念模型到逻辑模型的转换;b 确定粒度层次划分;c 确定数据分割策略;d关系模式定义;e 定义记录系统。
3、数据仓库常用的两种基本逻辑模型:①星型模型:星型模型的核心是事实表,事实表把各种不同的维表连接起来。
②雪花模型:雪花模型是星型模型的扩展,某些维表中的数据可以进一步分解到附加的表中。