商务智能复习题
商务智能复习的题目
商务智能复习的题目一、选择题(本题共5道小题,每小题2分,共10分)1、数据仓库就是随着时间变化得,下面得描述不正确得就是( C )。
A、数据仓库随时间得变化不断增加新得数据内容B、捕捉到得新数据会覆盖原来得快照C、数据仓库随事件变化不断删去旧得数据内容D、数据仓库中包含大量得综合数据,这些综合数据会随着时间得变化不断地进行重新综合2、有关数据仓库得开发特点,不正确得描述就是( B )。
A、数据仓库使用得需求在开发初期就要明确B、数据仓库开发要从数据出发C、数据仓库得开发就是一个不断循环得过程,就是启发式得开发D、在数据仓库环境中,并不存在操作型环境中所固定得与较确切得处理流,数据仓库中数据分析与处理更灵活,且没有固定得模式3、在有关数据仓库测试,下列说法不正确得就是 ( D )。
A、在完成数据仓库得实施过程中,需要对数据仓库进行各种测试。
测试工作中要包括单元测试与系统测试。
B、当数据仓库得每个单独组件完成后,就需要对她们进行单元测试。
C、系统得集成测试需要对数据仓库得所有组件进行大量得功能测试与回归测试。
D、在测试之前没必要制定详细得测试计划。
4、关于基本数据得元数据就是指 ( D )。
A、基本元数据与数据源、数据仓库、数据集市与应用程序等结构相关得信息B、基本元数据包括与企业相关得管理方面得数据与信息C、基本元数据包括日志文件与简历执行处理得时序调度信息D、基本元数据包括关于装载与更新处理,分析处理以及管理方面得信息6、下面关于数据粒度得描述不正确得就是 ( C )。
A、粒度就是指数据仓库小数据单元得详细程度与级别B、数据越详细,粒度就越小,级别也就越高C、数据综合度越高,粒度也就越大,级别也就越高D、粒度得具体划分将直接影响数据仓库中得数据量以及查询质量6、关于OLAP得特性,下面正确得就是:( D )(1)快速性 (2)可分析性 (3)多维性 (4)信息性 (5)共享性A、 (1) (2) (3)B、 (2) (3) (4)C、 (1) (2) (3) (4)D、 (1) (2) (3) (4) (5)7、关于OLAP与OLTP得区别描述,不正确得就是: ( C )A、OLAP主要就是关于如何理解聚集得大量不同得数据,它与OTAP应用程序不同。
商务智能复习题.doc
二、判断题(本题共10道小题,每小题1分,共10分)(F ) 4.独立的数据集市架构的优点是企业内数据一致,不会产生信息孤岛。
(F ) 6.企业风险分析是通过对企业的经营成本进行综合评价,拟定一个企业成本的临界值。
(T ) &在BI中,DW是前提和基础,负责统一数据规则的处理和存储。
(F ) 9.客户服务管理是对客户意见或投诉以及售前、售中、售后服务进行管理。
(F ) 10.平衡计分卡共包括三个层面,分别是财务层面、客户层面、内部业务流程层面。
(F ) 12.在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。
(F ) 13. OLAP是用来协助企业对响应事件或事务的日常商务活动进行处理。
(F ) 16. C4.5决策树算法是国际上最早、最有影响力的决策树算法,(T ) 17.平衡计分卡是从财务、客户、内部运营、学习与成长四个角度,将组织的战略落实为可操作的衡量指标和目标值的一种新型绩效管理体系。
(F ) 1&客户服务管理是对客户意见或投诉以及售前、售中、售后服务进行管理。
(F ) 19.企业绩效管理的目的在于进一步加强成本的事前控制,同时有助于通过盈亏分析,辅助产品科学的报价。
(T )等深分箱法使每个箱子的记录个数相同。
(F )数据仓库“粒度”越细,记录数越少。
F记录树越多,范围越广泛(F )回归分析通常用于挖掘关联规则。
(T )孤立点在数据挖掘时总是被视为异常、无用数据而丢弃。
34.决策树方法特别适合于处理数值型数据。
(F )数据立方体是广义知识发现的方法和技术之一。
(F )可信度是对关联规则的准确度的衡量。
(T )可视化技术对于分析的数据类型通常不是专用性的。
(T ) OLAP技术侧重于把数据库中的数据进行分析、转换成辅助决策信息,是继数据库技术发展之后迅猛发展起来的一种新技术。
(F)关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则(F )Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。
复习范围商务智能
一、选择题(5道,10分) 二、判断题(10道,10分) 三、名词解释(4道,20分)商务智能 数据仓库 数据挖掘 绩效管理企业经营分析系统. 平衡计分卡 数据规范化 ROLAP 决策树四、简答题(5道,30分)1. 简述数据、信息和知识之间的关系。
2. 画出商务智能的系统架构图,实现其功能的三大技术是什么?3. 实现商务智能的四个阶段是什么?4. 何谓数据仓库?为什么要建立数据仓库?5. 简述OLAP 与数据挖掘的区别和联系。
6. 简述OLAP 的基本操作有哪些?7. 简述数据挖掘从技术角度的定义和含义。
8. 何谓数据挖掘?它有哪些方面的功能?9. 在数据挖掘之前为什么要对原始数据进行预处理? 10. 简述构造智能CRM 系统的完整步骤。
11. 简述智能CRM 系统的特点。
12. 影响客户流失的因素有哪些?13. 简述客户流失模型的建立和应用过程。
14. 简述K-近邻分类法的基本思想。
15. 主成分分析法的基本思想是什么?16. 什么是决策树?ID3算法的步骤是什么? 17. 简述K-近邻分类法的基本思想。
18. 关联规则挖掘能发现什么知识?简述关联规则挖掘的基本步骤。
19. 什么是绩效管理?目的是什么?20. 什么是平衡计分卡?设计平衡计分卡的目的是什么? 五、计算题(10分)给定如下要进行聚类的元组:{3,5,11,13,4,21,31,12,26},假设分为2类,即K 1=2,初始时用前两个数值作为类的均值:m=3 和 m=5。
假设给定如下元组:{3,5,11,13,4,21,31,12,26}已分为两类:K1={3,4,5,110,12,13} 和 K2={21,31,26},应用K-近邻法判断元组x=16属于哪一类?设K=3,写出判断过程。
T )X ,X ,X (X 321=的协方差矩阵⎪⎪⎪⎭⎫ ⎝⎛--=200052021A 的特征值和特征向量分别为:)0,924.0,383.0(e 83.5T11-==,λ,)1,0,0(e 00.2T 22==,λ,)0,383.0,924.0(e 17.0T33==,λ,求X 的主成分,计算其贡献率。
《商务智能》复习题及答案
《商务智能》复习题及答案1、把数据报表从一年展开成四个季度的操作是(C )A、上卷B、旋转C、下钻D、切片2、在多维数据集中,对某一个维度上的数据进行选择一维成员,其他维度没有变化的操作是( D)A、切块B、旋转C、下钻D、切片3、一个多维数组表示为:(维1,维2,维3,维4,变量),这是一个(B )维结构。
A、3B、4C、5D、64、一次购买行为的发起需要有:购买者、商家、商品、购买时间、供应商和订单金额。
如果设计星型模型,请问有几个维度(C )A、3B、4C、5D、65、在进行ETL时,应该在(C )里进行。
A、ODSB、数据仓库C、数据准备区D、源数据6、(多选题)此大数据带来的变革有(ABD ).A、思维变革B、商业变革C、购物变革D、管理变革7、自然演化式体系结构的问题有(ACD )。
(多选)A、数据可信性B、无法进行数据处理C、生产率问题D、无法将数据转化为信息8、数据立方体是指(C ).A、三维数据集B、三维以上的数据集C、三维和三维以上的数据集D、四维数据集'9、戈登·未尔提出在今后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度,每(D )左右可以翻一番。
A、1个月B、6个月C、12个月D、18个月10、大数据时代的核心价值是(B)A.数据收集B.数据分析C.数据挖掘D.数据可视化11、大数据的来源包括( ABCD).A.互联网数据B.传感器数据C.实时数据D.探测数据11、好友的QQ突然发来一个网站链接要求投票,最合理的做法是( C)A.因为是其好反信总,直接打开使接投票B.不参与任何投票C.可能是好友aq被盗,可能是恶意筑接。
先通过予机跟朋友确认链技按无异常,考虑是否投票D.把好友加入黑名单12、关于大数据特点,错误的是(C )A、数据量大B、数据类型多C.数据价值密度高D.数据处理速度快13、Hadop是基于(B )语言的数据分析框架。
A. C++B. JavaC. RD. C#14.Maphedue的主导思想是(C )A.集成化B.一体化C.分而治之D.综合化15.下列与大数据密切相关的技术是(B)A.蓝牙B.云计算C.博穿论D.WiFi16.大数据的数据类型包括结构化数据、非结构化数据和(A ).A.半结构化数据B.无结构化数据C.关系数据库数D.文本数据和WEe数报17.数据仓库中的数据(ABCD )A.集成的B.可以变化的C.面向主题的D.不易丢失的18.数据仓库是随着时间变化的。
商务智能复习题
一、选择题(本题共5道小题,每小题2分,共10分)1. 数据仓库是随着时间变化(de),下面(de)描述不正确(de)是 ( C ).A. 数据仓库随时间(de)变化不断增加新(de)数据内容B. 捕捉到(de)新数据会覆盖原来(de)快照C. 数据仓库随事件变化不断删去旧(de)数据内容D. 数据仓库中包含大量(de)综合数据,这些综合数据会随着时间(de)变化不断地进行重新综合2. 有关数据仓库(de)开发特点,不正确(de)描述是( B ).A. 数据仓库使用(de)需求在开发初期就要明确B. 数据仓库开发要从数据出发C. 数据仓库(de)开发是一个不断循环(de)过程,是启发式(de)开发D. 在数据仓库环境中,并不存在操作型环境中所固定(de)和较确切(de)处理流,数据仓库中数据分析和处理更灵活,且没有固定(de)模式3. 在有关数据仓库测试,下列说法不正确(de)是 ( D ).A. 在完成数据仓库(de)实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统测试.B. 当数据仓库(de)每个单独组件完成后,就需要对他们进行单元测试.C. 系统(de)集成测试需要对数据仓库(de)所有组件进行大量(de)功能测试和回归测试.D. 在测试之前没必要制定详细(de)测试计划.4. 关于基本数据(de)元数据是指 ( D ).A. 基本元数据与数据源、数据仓库、数据集市和应用程序等结构相关(de)信息B. 基本元数据包括与企业相关(de)管理方面(de)数据和信息C. 基本元数据包括日志文件和简历执行处理(de)时序调度信息D. 基本元数据包括关于装载和更新处理,分析处理以及管理方面(de)信息6. 下面关于数据粒度(de)描述不正确(de)是 ( C ).A. 粒度是指数据仓库小数据单元(de)详细程度和级别B. 数据越详细,粒度就越小,级别也就越高C. 数据综合度越高,粒度也就越大,级别也就越高D. 粒度(de)具体划分将直接影响数据仓库中(de)数据量以及查询质量6. 关于OLAP(de)特性,下面正确(de)是:( D )(1)快速性 (2)可分析性 (3)多维性 (4)信息性 (5)共享性A. (1) (2) (3)B. (2) (3) (4)C. (1) (2) (3) (4)D. (1) (2) (3) (4) (5)7. 关于OLAP和OLTP(de)区别描述,不正确(de)是: ( C )A. OLAP主要是关于如何理解聚集(de)大量不同(de)数据,它与OTAP应用程序不同.B. 与OLAP应用程序不同,OLTP应用程序包含大量相对简单(de)事务.C. OLAP(de)特点在于事务量大,但事务内容比较简单且重复率高.D. OLAP是以数据仓库为基础(de),但其最终数据来源与OLTP一样均来自底层(de)数据库系统,两者面对(de)用户是相同(de).8. 关于OLAP和OLTP(de)说法,下列不正确(de)是: ( A )A. OLAP事务量大,但事务内容比较简单且重复率高B. OLAP(de)最终数据来源与OLTP不一样C. OLTP面对(de)是决策人员和高层管理人员D. OLTP以应用为核心,是应用驱动(de)9. OLAP技术(de)核心是( D ).A. 在线性B. 对用户(de)快速响应C. 互操作性D. 多维分析10.某超市研究销售纪录数据后发现,买啤酒(de)人很大概率也会购买尿布,这种属于数据挖掘(de)哪类问题 ( A )A. 关联规则B. 聚类C. 分类D. 自然语言处理11. 分析型CRM(de)( C )功能可以让CRM对所进行(de)销售活动相关信息进行存储和管理,将客户所发生(de)交易与互动事件转化为有意义、高获利(de)销售商机.A. 促销管理B. 个性化和标准化C. 客户分析和建模D. 客户沟通12. 运用关键绩效指标法设计组织关键绩效指标依次经过以下几个步骤( A ).A. 确定关键成功领域、确定关键绩效要素、确定关键绩效指标B. 计划目标、实施目标、评价结果、反馈C. 确定目标、比较目标、收集分析数据、系统学习与改进、评价和提高D. 确定长期整体目标、确定短期目标13.什么是KDD ( A )A. 知识发现B. 领域知识发现C. 文档知识发现D. 动态知识发现14. 呼叫中心是一种基于( D )(de)一种新(de)综合信息服务系统.A IT技术B CTI技术C WEB技术D CRM技术15. 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤(de)任务 (C)A. 频繁模式挖掘B. 分类和预测C. 数据预处理D. 数据流挖掘16. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签(de)数据与带其他标签(de)数据相分离 ( B )A. 分类B. 聚类C. 关联分析D. 隐马尔可夫链17. 使用交互式(de)和可视化(de)技术,对数据进行探索属于数据挖掘(de)哪一类任务(A)A. 探索性数据分析B. 建模描述C. 预测建模D. 寻找模式和规则18. 为数据(de)总体分布建模,把多维空间划分成组等问题属于数据挖掘(de)哪一类任务( B)A. 探索性数据分析B. 建模描述C. 预测建模D. 寻找模式和规则19. 建立一个模型,通过这个模型根据已知(de)变量值来预测其他某个变量值属于数据挖掘(de)哪一类任务 ( C )A. 根据内容检索B. 建模描述C. 预测建模D. 寻找模式和规则20. 用户有一种感兴趣(de)模式并且希望在数据集中找到相似(de)模式,属于数据挖掘哪一类任务 ( A )A. 根据内容检索B. 建模描述C. 预测建模D. 寻找模式和规则21.下面哪种不属于数据预处理(de)方法 ( D )A. 变量代换B. 离散化C. 聚集D. 估计遗漏值22.下面哪个不属于数据(de)属性类型( D ).A. 标称B. 序数C. 区间D. 相异23. 在上题中,属于定量(de)属性类型是( C ).A. 标称B. 序数C. 区间D. 相异24. 只有非零值才重要(de)二元属性被称作( C ).A. 计数属性B. 离散属性C. 非对称(de)二元属性D. 对称属性25. 以下哪种方法不属于特征选择(de)标准方法 ( D ).A. 嵌入B. 过滤C. 包装D. 抽样26.下面不属于创建新属性(de)相关方法(de)是( C ).A. 特征提取B. 特征修改C. 映射数据到新(de)空间D. 特征构造27. 下面哪个属于映射数据到新(de)空间(de)方法 ( A )A. 傅立叶变换B. 特征加权C. 渐进抽样D. 维归约28. 企业所建立(de)预测模型(de)好坏取决于模型在( A )上(de)表现效果.A. 得分集B. 训练集C. 测试集D. 评价集29. 客户在经济活动中具有多重身份,下面哪一种不是其身份之一( C ).A. 行为身份B. 所有权身份C. 学习身份D. 决策身份30. 下列四条描述中,正确(de)一条是( B ).A. 企业实施数据挖掘,必须要有数据仓库.B. 企业要实施数据挖掘最好(de)方式是请编外专家.C. 企业购买现成数据挖掘模型(de)一个先决条件是:该企业(de)产品、客户、市场定位和所买来(de)现成模型设计之初(de)假设相吻合.D. 在建模(de)时侯,增益最高(de)模型就是最好(de)模型.31. 数据挖掘算法以( D )形式来组织数据.A. 行B. 列C. 记录D. 表格32. 企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确(de)是( B ).A. 数据越多越好.B. 尽可能多(de)适合(de)数据.C. 得分集数据是建模集数据(de)一部分.D. 以上三条都正确.33. K—均值类别侦测要求输入(de)数据类型必须是( B ).A. 整型B. 数值型C. 字符型D. 逻辑型34. 在决策树和累计增益图(de)关系转化过程图中,决策树上某一页节点(de)增益与累计增益图上(de)( D )相对应.A. 线段长度B. 线段斜率C. 相对应(de)线段长度D. 相对应(de)线段斜率35. 企业为提升每个客户(de)价值,应实现( C )最优化.A. 促销活动B. 预算最优化C. 客户最优化D. 三者都不是36. 数据挖掘(de)经典案例“啤酒与尿布试验”最主要是应用了( C )数据挖掘方法.A. 分类B. 预测C. 组合或关联法则D. 聚类37. 企业成功实施数据挖掘, 需要以下( B )知识或技术.A. 预先(de)规划B. 对商业文体(de)理解C. 综合商业知识和技能D. 都需要38. 下列哪个不是专门用于可视化时间空间数据(de)技术( B ).A. 等高线图B. 饼图C. 曲面图D. 矢量场图39. 在抽样方法中,当合适(de)样本容量很难确定时,可以使用(de)抽样方法是 ( D ).A. 有放回(de)简单随机抽样B. 无放回(de)简单随机抽样C. 分层抽样D. 渐进抽样40. 设X={1,2,3}是频繁项集,则可由X产生( C )个关联规则.A. 4B. 5C. 6D. 741. 概念分层图是( B )图.A. 无向无环B. 有向无环C. 有向有环D. 无向有环42. 以下哪些算法是分类算法( B ).A. DBSCANB. C4.5C. K-MeanD. EM43. 以下哪些分类方法可以较好地避免样本(de)不平衡问题( A ).A. KNNB. SVMC. BayesD. 神经网络44. 以下关于人工神经网络(ANN)(de)描述错误(de)有 ( A ).A. 神经网络对训练数据中(de)噪声非常鲁棒B. 可以处理冗余特征C. 训练ANN是一个很耗时(de)过程D. 至少含有一个隐藏层(de)多层神经网络45. 通过聚集多个分类器(de)预测来提高分类准确率(de)技术称为 ( A ) .A. 组合(ensemble)B. 聚集(aggregate)C. 合并(combination)D. 投票(voting)46. 简单地将数据对象集划分成不重叠(de)子集,使得每个数据对象恰在一个子集中,这种聚类类型称作( B ).A. 层次聚类B. 划分聚类C. 非互斥聚类D. 模糊聚类47. 在基本K均值算法里,当邻近度函数采用( A )(de)时候,合适(de)质心是簇中各点(de)中位数.A. 曼哈顿距离B. 平方欧几里德距离C. 余弦距离D. Bregman散度48.( C )是一个观测值,它与其他观测值(de)差别如此之大,以至于怀疑它是由不同(de)机制产生(de).A. 边界点B. 质心C. 离群点D. 核心点48. 检测一元正态分布中(de)离群点,属于异常检测中(de)基于( A )(de)离群点检测.A. 统计方法B. 邻近度C. 密度D. 聚类技术49. DBSCAN在最坏情况下(de)时间复杂度是( B ).A. O(m)B. O(m2)C. O(log m)D. O(mlog m)50. 关于K均值和DBSCAN(de)比较,以下说法不正确(de)是( A ).A. K均值丢弃被它识别为噪声(de)对象,而DBSCAN一般聚类所有对象.B. K均值使用簇(de)基于原型(de)概念,而DBSCAN使用基于密度(de)概念.C. K均值很难处理非球形(de)簇和不同大小(de)簇,DBSCAN可以处理不同大小和不同形状(de)簇.D. K均值可以发现不是明显分离(de)簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠(de)簇.51. 使用交互式(de)和可视化(de)技术,对数据进行探索属于数据挖掘(de)哪一类任务( A )A. 探索性数据分析B. 建模描述C. 预测建模D. 寻找模式和规则52.下面哪种不属于数据预处理(de)方法 ( D )A变量代换 B离散化 C 聚集 D 估计遗漏值二、判断题(本题共10道小题,每小题1分,共10分)( T )1.商务智能指收集、转换、分析和发布数据(de)过程,目(de)是为了更好(de)决策.( F )2.数据分析是整合企业原始数据(de)第一步,包括数据抽取、转换和装载三个过程.( T )3.维是人们观察数据(de)特定角度,是考虑问题时(de)一类属性.( F )4.独立(de)数据集市架构(de)优点是企业内数据一致,不会产生信息孤岛.( T )5. 星型模型(de)核心是事实表,事实表把各种不同(de)维表连接起来.( F )6.企业风险分析是通过对企业(de)经营成本进行综合评价,拟定一个企业成本(de)临界值.( T )7.衡量客户忠诚(de)唯一尺度就是客户是否重复或持久地购买企业(de)产品或者服务.( T )8.在BI中,DW是前提和基础,负责统一数据规则(de)处理和存储.( F )9.客户服务管理是对客户意见或投诉以及售前、售中、售后服务进行管理.( F )10. 平衡计分卡共包括三个层面,分别是财务层面、客户层面、内部业务流程层面.( T )11.数据挖掘(de)主要任务是从数据中发现潜在(de)规则,从而能更好(de)完成描述数据、预测数据等任务.( F )12.在聚类分析当中,簇内(de)相似性越大,簇间(de)差别越大,聚类(de)效果就越差.( F )13.OLAP是用来协助企业对响应事件或事务(de)日常商务活动进行处理.( T )14.数据仓库是面向主题(de)、集成(de)、稳定(de)、随时间变化(de)数据集合,用以支持管理决策(de)过程.( T )15. 数据预处理是整合企业原始数据(de)第一步,包括数据抽取、转换和装载三个过程.( F )16.C4.5决策树算法是国际上最早、最有影响力(de)决策树算法,( T )17.平衡计分卡是从财务、客户、内部运营、学习与成长四个角度,将组织(de)战略落实为可操作(de)衡量指标和目标值(de)一种新型绩效管理体系.( F )18.客户服务管理是对客户意见或投诉以及售前、售中、售后服务进行管理.( F )19. 企业绩效管理(de)目(de)在于进一步加强成本(de)事前控制,同时有助于通过盈亏分析,辅助产品科学(de)报价.20. 数据仓库(de)数据量越大,其应用价值也越大.F21. 啤酒与尿布(de)故事是聚类分析(de)典型实例.F22. 等深分箱法使每个箱子(de)记录个数相同.T23. 数据仓库“粒度”越细,记录数越少.F24. 数据立方体由3维构成,Z轴表示事实数据.F25. 决策树方法通常用于关联规则挖掘.F26. ID3算法是决策树方法(de)早期代表.T27. C4.5是一种典型(de)关联规则挖掘算法.F28. 回归分析通常用于挖掘关联规则.F29. 人工神经网络特别适合解决多参数大复杂度问题.T30. 概念关系分析是文本挖掘所独有(de).F31. 可信度是对关联规则(de)准确度(de)衡量.F32. 孤立点在数据挖掘时总是被视为异常、无用数据而丢弃.T33. SQL Server 2005不提供关联规则挖掘算法.F34. 决策树方法特别适合于处理数值型数据.F35. 数据仓库(de)数据为历史数据,从来不需要更新.T36. 数据立方体是广义知识发现(de)方法和技术之一.F37. 数据立方体(de)其中一维用于记录事实数据.T38. 数据挖掘(de)目标不在于数据采集策略,而在于对于已经存在(de)数据进行模式(de)发掘.( T )39. 图挖掘技术在社会网络分析中扮演了重要(de)角色.( T )40. 模式为对数据集(de)全局性总结,它对整个测量空间(de)每一点做出描述;模型则对变量变化空间(de)一个有限区域做出描述.( F )41. 寻找模式和规则主要是对数据进行干扰,使其符合某种规则以及模式.( F )42. 离群点可以是合法(de)数据对象或者值. ( T )43. 离散属性总是具有有限个值. ( F )44. 噪声和伪像是数据错误这一相同表述(de)两种叫法. ( F )45. 用于分类(de)离散化方法之间(de)根本区别在于是否使用类信息. ( T )46. 特征提取技术并不依赖于特定(de)领域. ( F )47. 可信度是对关联规则(de)准确度(de)衡量.F48. 定量属性可以是整数值或者是连续值. ( T )49. 可视化技术对于分析(de)数据类型通常不是专用性(de). ( T )50. DSS主要是基于数据仓库、联机数据分析和数据挖掘技术(de)应用.( F )51. OLAP技术侧重于把数据库中(de)数据进行分析、转换成辅助决策信息,是继数据库技术发展之后迅猛发展起来(de)一种新技术. ( T )52. 商业智能系统与一般交易系统之间在系统设计上(de)主要区别在于:后者把结构强加于商务之上,一旦系统设计完毕,其程序和规则不会轻易改变;而前者则是一个学习型系统,能自动适应商务不断变化(de)要求. ( T )53. 数据仓库中间层OLAP服务器只能采用关系型OLAP. ( F )54.数据仓库系统(de)组成部分包括数据仓库、仓库管理、数据抽取、分析工具等四个部分. ( F )55.Web数据挖掘是通过数据库仲(de)一些属性来预测另一个属性,它在验证用户提出(de)假设过程中提取信息.( F )56. 关联规则挖掘过程是发现满足最小支持度(de)所有项集代表(de)规则.( F )57. 聚类(clustering)是这样(de)过程:它找出描述并区分数据类或概念(de)模型(或函数),以便能够使用模型预测类标记未知(de)对象类. ( F )58. 分类和回归都可用于预测,分类(de)输出是离散(de)类别值,而回归(de)输出是连续数值.( T )59. 对于SVM分类算法,待分样本集中(de)大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响. ( T )60. Bayes法是一种在已知后验概率与类条件概率(de)情况下(de)模式分类方法,待分样本(de)分类结果取决于各类域中样本(de)全体. ( F )三、名词解释(本题共4道小题,每小题5分,共20分)1.商务智能商务智能是融合了先进信息技术与创新管理理念(de)结合体,集成企业内外数据,进行加工并从中提取能够创造商业价值(de)知识,面向企业战略并服务于管理层、业务层,指导企业经营决策,提升企业竞争力.2.数据仓库数据仓库是面向主题(de)、集成(de)、稳定(de)、随时间变化(de)数据集合,用以支持管理决策(de)过程.3. 数据集成数据集成是在逻辑上或物理上把不相同来源、格式、特点(de)数据有机地整合,从而为企业提供全面(de)数据共享.4. OLAP(联机分析处理)OLAP是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来(de)、能够真正为用户所理解(de)、并真实反映企业维特性(de)信息进行快速、一致、交互地存取,从而获得对数据(de)更深入了解(de)一类软件技术.5. 数据挖掘数据挖掘是从大量(de)、不完全(de)、有噪声(de)、模糊(de)、随机(de)数据中提取正确(de)、有用(de)、未知(de)、综合(de)以及人们感兴趣(de)知识并用于决策支持(de)过程.6. 孤立点:指数据库中包含(de)一些与数据(de)一般行为或模型不一致(de)异常数据.7. 数据规范化:指将数据按比例缩放(如更换大单位),使之落入一个特定(de)区域(如0-1)以提高数据挖掘效率(de)方法.规范化(de)常用方法有:最大-最小规范化、零-均值规范化、小数定标规范化.8. 聚类:是将物理或抽象对象(de)集合分组成为多个类或簇(cluster)(de)过程,使得在同一个簇中(de)对象之间具有较高(de)相似度,而不同簇中(de)对象差别较大.9. ROLAP:是基于关系数据库存储方式(de),在这种结构中,多维数据被映像成二维关系表,通常采用星型或雪花型架构,由一个事实表和多个维度表构成.10. 数据归约:缩小数据(de)取值范围,使其更适合于数据挖掘算法(de)需要,并且能够得到和原始数据相同(de)分析结果.11. 预测型知识:是根据时间序列型数据,由历史(de)和当前(de)数据去推测未来(de)数据,也可以认为是以时间为关键属性(de)关联知识.12. 决策树:是用样本(de)属性作为结点,用属性(de)取值作为分支(de)树结构.它是分类规则挖掘(de)典型方法,可用于对新样本进行分类.13. 遗传算法:是一种优化搜索算法,它首先产生一个初始可行解群体,然后对这个群体通过模拟生物进化(de)选择、交叉、变异等遗传操作遗传到下一代群体,并最终达到全局最优.14. 知识管理:知识管理就是对一个企业集体(de)知识与技能(de)捕获,是为增强组织(de)绩效而创造、获取和使用知识(de)过程(知识(de)创造、储存、分享、应用和更新). 15. Web挖掘:Web挖掘是从大量Web文档(de)集合C中发现隐含(de)、有用(de)模式P(de)过程:C→P .四、简答题(本题共5道小题,每小题6分,共30分)1.实现商务智能(de)四个阶段是什么答:实现商务智能(de)四个阶段是数据预处理、建立数据仓库、数据分析及数据展现.(2分)数据预处理是整合企业原始数据(de)第一步,包括数据抽取、转换和装载三个过程; (1分)数据仓库则是处理海量数据(de)基础; (1分)数据分析是体现系统智能(de)关键,一般采用OLAP和DM两大技术.(1分)数据展现则主要保障系统分析结果(de)可视化.(1分)2. 数据库系统(de)局限性①数据库适于存储高度结构化(de)日常事务细节数据.决策分析型数据是多维性,分析内容复杂.②在决策分析环境中,如果事务处理(de)细节数据量太大一方面会严重影响分析效率,另一方面这些细节数据会分散决策者(de)注意力.③当事务型处理环境和分析型处理环境在同一个数据库系统中,事务型处理对数据(de)存取操作频率高,操作处理(de)时间短,而分析型处理可能需要连续运行几个小时,从而消耗大量(de)系统资源.④决策型分析数据(de)数据量大,这些数据有来自企业内部(de),也有来自企业外部(de).来自企业外部(de)数据又可能来自不同(de)数据库系统,在分析时如果直接对这些数据操作会造成分析(de)混乱.对于外部数据中(de)一些非结构化数据,数据库系统常常是无能为力.3.数据仓库与数据集市(de)区别是什么数据仓库收集了关于整个组织(de)主题信息,因此是企业范围(de).对于数据仓库,通常使用星座模式,因为它能对多个相关(de)主题建模;(3分)数据集市是数据仓库(de)一个部门子集,它针对选定(de)主题,因此是部门范围(de).对于数据集市,流行星型或雪花模式,因为它们都适合对单个主题建模.(3分)4. OLAP(de)特点①快速性Fast:用户对OLAP(de)快速反应能力有很高(de)要求.②可分析性Analysis:OLAP系统应能处理与应用有关(de)任何逻辑分析和统计分析.③多维性Multidimensional:多维性是OLAP(de)关键属性.系统必须提供对数据(de)多维视图和分析,包括对层次维和多重层次维(de)完全支持.④信息性Information:OLAP系统应能及时获得信息,并且管理大容量信息.5.简述OLAP(de)基本操作有哪些答:OLAP(de)基本操作有:1. 切片和切块(Slice and Dice):在多维数据结构中,按二维进行切片,按三维进行切块,可得到所需要(de)数据.(2分)2. 钻取(Drill) :钻取包含向下钻取(Drill-down)和向上钻取(Drill-up)/上卷(Roll-up)操作,钻取(de)深度与维所划分(de)层次相对应.(2分)3. 旋转(Rotate)/旋转(Pivot):通过旋转可以得到不同视角(de)数据.(2分)6.简述OLAP 与数据挖掘(de)区别和联系.答:OLAP 侧重于与用户(de)交互、快速(de)响应速度及提供数据(de)多维视图,而数据挖掘则注重自动发现隐藏在数据中(de)模式和有用信息,尽管允许用户指导这一过程.(3分)OLAP (de)分析结果可以给数据挖掘提供分析信息作为挖掘(de)依据,数据挖掘可以拓展OLAP 分析(de)深度,可以发现OLAP 所不能发现(de)更为复杂、细致(de)信息.(3分)7.何谓数据挖掘它有哪些方面(de)功能从大量(de)、不完全(de)、有噪声(de)、模糊(de)、随机(de)数据中,提取隐含在其中(de)、人们事先不知道(de)、但又是潜在有用(de)信息和知识(de)过程称为数据挖掘.相关(de)名称有知识发现、数据分析、数据融合、决策支持等.数据挖掘(de)功能包括:概念描述、关联分析、分类与预测、聚类分析、趋势分析、孤立点分析以及偏差分析等.(3分)8.在数据挖掘之前为什么要对原始数据进行预处理原始业务数据来自多个数据库或数据仓库,它们(de)结构和规则可能是不同(de),这将导致原始数据非常(de)杂乱、不可用,即使在同一个数据库中,也可能存在重复(de)和不完整(de)数据信息,为了使这些数据能够符合数据挖掘(de)要求,提高效率和得到清晰(de)结果,必须进行数据(de)预处理.为数据挖掘算法提供完整、干净、准确、有针对性(de)数据,减少算法(de)计算量,提高挖掘效率和准确程度.9.简述数据预处理方法和内容.数据清洗:包括填充空缺值,识别孤立点,去掉噪声和无关数据.数据集成:将多个数据源中(de)数据结合起来存放在一个一致(de)数据存储中.需要注意不同数据源(de)数据匹配问题、数值冲突问题和冗余问题等.数据变换:将原始数据转换成为适合数据挖掘(de)形式.包括对数据(de)汇总、聚集、概化、规范化,还可能需要进行属性(de)重构.数据归约:缩小数据(de)取值范围,使其更适合于数据挖掘算法(de)需要,并且能够得到和原始数据相同(de)分析结果.10. 数据挖掘(de)六种常用算法和技术分别是什么①聚类分析;②分类分析;③关联分析;④序列模式挖掘;⑤回归分析;⑥时间序列分析.11. 数据挖掘中(de)数据需要采用哪些格式数据挖掘中(de)数据需要采用以下格式:①所有数据应该在一个表格/数据库视图中②每一行对应于与业务问题相关(de)一个案例③忽略具有单一值/几乎单一值(de)列④忽略所有行(de)值都不同(de)列⑤删除所有同义列⑥对于预测模型,目标列必须是可识别(de)12.简述K-近邻分类法(de)基本思想.答:基本思想:K-近邻分类是基于类比学习(de),每个样本代表d维空间(de)一个点.(3分)。
商务智商测试题答案(3篇)
第1篇一、选择题1. 以下哪个选项不是衡量企业竞争力的指标?A. 市场份额B. 营业收入C. 研发投入D. 政府扶持答案:D解析:政府扶持并不是衡量企业竞争力的指标,而是企业外部环境的一部分。
2. 以下哪个选项不属于企业核心竞争力?A. 知识产权B. 管理团队C. 产业链地位D. 员工福利答案:D解析:员工福利是企业人力资源管理的一部分,并不直接构成企业的核心竞争力。
3. 以下哪个选项不是企业战略规划的核心内容?A. 市场定位B. 产品规划C. 财务预算D. 人力资源规划答案:C解析:财务预算是企业战略规划的一部分,但不是核心内容。
4. 以下哪个选项不是企业战略实施的关键环节?A. 资源配置B. 组织架构调整C. 市场推广D. 产品研发答案:B解析:组织架构调整是企业战略实施的一部分,但不是关键环节。
5. 以下哪个选项不是企业战略风险?A. 市场风险B. 竞争风险C. 政策风险D. 技术风险答案:D解析:技术风险是企业战略风险的一部分,但不是唯一的风险。
二、判断题1. 企业核心竞争力是企业获得竞争优势的根本来源。
(√)2. 企业战略规划的核心内容是产品规划。
(×)3. 企业战略实施的关键环节是资源配置。
(√)4. 企业战略风险主要包括市场风险、竞争风险和政策风险。
(√)5. 企业战略规划应具备前瞻性、可行性和动态调整性。
(√)三、简答题1. 简述企业核心竞争力的构成要素。
答案:企业核心竞争力主要包括以下构成要素:(1)知识产权:包括专利、商标、著作权等。
(2)品牌价值:企业品牌在市场中的知名度和美誉度。
(3)管理团队:具有丰富经验和专业能力的管理团队。
(4)产业链地位:企业在产业链中的地位和影响力。
(5)技术创新:企业在技术研发方面的实力和成果。
2. 简述企业战略规划的实施步骤。
答案:企业战略规划的实施步骤主要包括以下步骤:(1)明确战略目标:确定企业未来发展的方向和目标。
(2)制定战略方案:根据战略目标,制定具体的实施方案。
商业智能系统考试试题
商业智能系统考试试题一、选择题(共50分)1. 商业智能系统是指通过技术手段解决商业问题、支持商业决策的一套系统和工具。
下面哪个不属于商业智能系统的关键组成部分?A. 数据仓库B. 数据分析C. 数据可视化D. 数据备份2. 在商业智能系统中,下面哪个工具可以用来将数据从多个来源整合到一个统一的数据仓库中?A. ETL工具B. OLAP工具C. 数据可视化工具D. 决策支持系统3. 商业智能系统的数据分析功能可以帮助企业进行哪些方面的工作?A. 销售预测B. 成本控制C. 客户关系管理D. 所有选项都正确4. 商业智能系统可以通过可视化方式呈现数据分析结果,下面哪个不属于常用的数据可视化工具?A. 折线图B. 柱状图C. 饼图D. 行列式图5. 商业智能系统的决策支持功能能够帮助企业进行哪些方面的工作?A. 市场定位B. 产品设计C. 供应链管理D. 所有选项都正确二、填空题(共30分)1. 商业智能系统的主要目标是提供有用的_____________,帮助企业做出更明智的决策。
2. 商业智能系统通过_____________、_____________和_____________等技术手段来实现数据分析。
3. 在商业智能系统中,数据仓库一般包括_____________、_____________和_____________等组成部分。
4. 在商业智能系统中,通过_____________和_____________等工具可以将数据可视化呈现。
5. 商业智能系统的决策支持功能可以通过_____________、_____________和_____________等方式来实现。
三、简答题(共20分)1. 请简要描述商业智能系统的应用场景,并举例说明。
2. 商业智能系统的技术架构包括哪些主要组成部分?请简要介绍每个组成部分的作用。
四、论述题(共50分)请就商业智能系统在企业决策中的作用发表你的观点,并提供相关案例或数据支持。
商务智能考试题目
商务智能考试题(共五个大题,每题20分)1、商务智能应用技术?功能组成?一般认为数据仓库、OLAP和数据挖掘技术是商业智能的三大组成部分数据仓库是存放为分析目的而收集的数据的数据库。
数据挖掘是从数据抽取正确的、有用的、以前未知的及可理解的信息,并使用该信息做商业决策的过程。
OLAP(联机分析处理)是针对特定问题的联机数据访问和分析。
通过对信息(这些信息已经从原始的数据进行了转换,以反映用户所能理解的企业的真实的“维”)的很多可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。
商业智能系统主要包括数据预处理、建立数据仓库、数据分析及数据展现四个主要阶段。
数据预处理是整合企业原始数据的第一步,它包括数据的抽取、转换和装载三个过程。
建立数据仓库则是处理海量数据的基础。
数据分析是体现系统智能的关键,一般采用联机分析处理和数据挖掘两大技术。
在海量数据和分析手段增多的情况下,数据展现则主要保障系统分析结果的可视化。
2、“商业智能是一种解决方案”这句话怎么理解?为什么商业智能没有“专业出版的教材”?(1)商务智能(Business Intelligence,简称BI):商务智能不是通常的业务处理。
它的目标是如何更快、更容易地做更好的决策。
BI将信息转换为知识。
商业智能是在正确的时间将正确的信息交给正确的用户以支持决策过程的应用。
目前,商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。
为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。
因此,从技术层面上讲,商业智能不是什么新技术,它只是数据仓库、OLAP和数据挖掘等技术的综合运用。
为此,把商业智能看成是一种解决方案应该比较恰当。
(2)3、商业智能(BI)与CRM,ERP,CIMS,等系统的异同和关联?4、商业智能系统的应用过程(步骤)?为什么说商业智能的步骤一般是“循环(迭代)”的?5、IBM说“商业智能之客户直销分析”应用商业智能中的什么技术?分析这些技术?。
商业智能考试试题及答案
商业智能考试试题及答案1. 多选题:商业智能的定义是什么?A. 利用数据和分析方法来提供有益的商业见解和指导B. 利用计算机技术来提高商业决策的质量和效率C. 利用互联网技术来推动企业的数字化转型D. 利用人工智能算法来优化商业流程答案:A和B2. 判断题:商业智能的目标是帮助企业做出更明智的商业决策。
答案:正确3. 单选题:以下哪项不是商业智能的关键组成部分?A. 数据仓库B. 数据可视化C. 数据挖掘D. 业务流程管理答案:D4. 填空题:商业智能的四个基本功能包括__________________。
答案:报表和查询、数据分析、数据挖掘、数据可视化5. 简答题:请解释商业智能的数据可视化功能及其重要性。
答案:数据可视化是商业智能的关键功能之一,它将数据以图表、图形等形式展示出来,使得用户可以直观地理解和分析数据。
通过数据可视化,决策者可以更快地发现数据中的模式和趋势,更准确地评估业务绩效,并做出更明智的决策。
数据可视化不仅可以提高决策速度和准确性,还能增强数据沟通的效果,帮助不具备专业数据分析能力的人员也能理解和利用数据。
6. 解答题:请简要描述商业智能的实施过程和关键要素。
答案:商业智能的实施过程包括以下几个关键步骤:1) 需求分析:明确商业智能的应用目标和需求,确定所需要分析的数据内容和指标。
2) 数据准备:收集、整理和清洗数据,建立数据仓库或数据湖,并确保数据的质量和完整性。
3) 数据建模:根据需求,设计和构建数据模型,包拟定数据分析方法和算法。
4) 可视化设计:选择合适的数据可视化工具和技术,设计直观、易于理解的数据可视化界面。
5) 实施和测试:部署商业智能系统,对系统进行测试和调优,确保系统的稳定性和性能。
6) 培训和推广:培训用户和决策者使用商业智能系统,推广系统在企业中的应用和效果。
关键要素包括:明确的需求、高质量的数据、合适的数据模型和算法、直观的可视化界面、稳定可靠的系统性能,以及用户培训和推广。
数据库与商务智能考试
数据库与商务智能考试(答案见尾页)一、选择题1. 数据库系统的基本组成部分包括哪些?A. 关系模型B. 数据库管理系统(DBMS)C. 数据仓库D. 以上都是2. 关系模型的主要概念是什么?A. 实体-关系模型B. 对象关系模型C. 面向对象模型D. 以上都不是3. 数据库事务的特性中,ACID代表什么?A. 原子性、一致性、隔离性、持久性B. 原子性、可恢复性、一致性、隔离性C. 原子性、一致性、隔离性、持久性D. 原子性、可恢复性、一致性、持久性4. 以下哪个选项是数据仓库的特征?A. 集成性B. 非易失性C. 分布性D. 以上都是5. 商务智能(BI)的主要应用领域包括哪些?A. 数据分析B. 数据挖掘C. 数据可视化D. 以上都是6. 数据库性能优化通常涉及哪些方面?A. 索引优化B. 查询优化C. 硬件选择D. 以上都是7. 在数据库系统中,如何保证数据的安全性和完整性?A. 使用强密码策略B. 定期备份数据C. 实施访问控制D. 以上都是8. 数据库复制在商务智能中的应用主要目的是什么?A. 提高数据可用性B. 提高数据一致性C. 提供数据备份功能D. 提高数据访问速度9. 以下哪个选项是数据库管理系统的核心功能?A. 数据定义B. 数据查询C. 数据更新D. 数据安全10. 在数据库系统中,如何实现数据的标准化?A. 将数据分解为更小的单元B. 将数据组织到不同的表格中C. 将数据按照特定的规则进行转换D. 将数据按照特定的规则进行分组11. 数据库系统工程师的主要职责包括哪些?A. 设计和构建数据库管理系统B. 编写和维护数据库应用程序C. 管理和优化数据库性能D. 提供数据分析和商业智能解决方案12. 关系数据库中的基本概念是什么?A. 数据库、关系、元组、属性B. 数据库、关系、元组、列C. 数据库、关系、元组、属性、主键D. 数据库、关系、元组、属性、外键13. 以下哪个选项是关系数据库中常用的数据类型?A. 整数B. 浮点数C. 字符串D. 布尔值14. 在数据库设计中,哪一个阶段负责定义和描述数据的结构?A. 需求分析B. 概念设计C. 逻辑设计D. 物理设计15. 数据库管理系统(DBMS)的主要组成部分包括?A. 存储器管理B. 查询处理器C. 事务管理D. 数据定义语言(DDL)16. 以下哪个术语描述了数据库中数据的逻辑结构?A. 存储方式B. 逻辑结构C. 物理结构D. 结构式17. 在数据库系统中,哪一个概念用于定义数据之间的关系?A. 表格B. 结构式C. 关系模型D. 实体-关系模型18. 以下哪个选项是数据库性能优化的一个关键因素?A. 硬件资源B. 软件配置C. 数据库设计D. 查询负载19. 在数据库系统中,哪一个技术用于存储和管理数据?A. 文件系统B. 数据库管理系统(DBMS)C. 对象关系映射(ORM)D. 数据仓库20. 以下哪个选项提供了数据库系统的安全机制?A. 访问控制列表(ACL)B. 数据加密C. 审计和日志记录D. 数据备份和恢复21. 关系型数据库与非关系型数据库的主要区别是什么?A. 数据存储结构B. 数据处理速度C. 适用场景D. 所需硬件资源22. 数据仓库中需要进行数据清洗和预处理的原因是什么?A. 提高数据质量B. 增加存储空间C. 减少数据处理量D. 降低错误率23. 在数据库设计中,E-R图(实体-关系图)通常用于表示什么?A. 数据流B. 实体之间的关系C. 数据库模式D. 数据库结构24. 以下哪个选项是数据库事务的ACID特性之一?A. 原子性B. 一致性C. 隔离性D. 持久性25. 数据库索引的目的是什么?A. 加速查询速度B. 减少数据冗余C. 保证数据完整性D. 方便数据备份26. 在数据库系统中,什么是触发器?A. 一种数据库对象,用于执行特定的操作B. 一种数据库约束,用于限制用户操作C. 一种数据库触发器,用于自动执行某些操作D. 以上都不是27. 数据库备份策略通常包括哪些方面?A. 备份类型(全备、增量备份等)B. 备份频率C. 备份介质(磁带、光盘等)D. 备份数据的保留策略28. 在数据库性能优化中,如何提高查询响应时间?A. 添加合适的索引B. 改变数据库引擎C. 优化SQL查询语句D. 增加数据库硬件资源29. 数据库系统故障可能导致的数据丢失情况包括(多选)?A. 事务崩溃B. 磁盘损坏C. 网络问题D. 错误的数据库配置30. 在数据库设计中,什么是第一范式?它如何帮助简化数据库设计?A. 第一范式要求表中的每一列都是原子的,即不可分割的B. 第一范式要求表中的每一列都是唯一的C. 第一范式要求表中的每一行都是唯一的D. 第一范式要求表中的每一行都必须完全相同31. 什么是数据库索引?它有哪些优点?A. 提高查询性能B. 减少数据冗余C. 加速数据排序和分组D. 支持事务处理32. 数据库备份和恢复策略对于业务连续性至关重要。
智慧商务复习题
智慧商务复习题一、单选题1.电子商务=Web+IT。
这一概念率先由( D )提出。
A.美国政府B.联合国国际贸易法委员会C.世界贸易组织D.IBM2.B2B是指( B )A.企业与消费者之间的电子商务B.企业与企业间的电子商务C.企业与政府之间的电子商务D.企业内部电子商务3.电子商务服务与传统服务的差别不包括( A )A.电子商务服务过程涉及通信技术和雇员B.顾客有同样的满意度质量要求C.在传统服务过程中,顾客可以通过所有的感觉器官来感受服务D.传统服务受限于时间和距离4.电子商务的( D )机制替代了传统柜台的营业员。
A.客服B.售后C.评价D.商品详情5.智慧商务的最显著特点是( A )A.智慧商务以顾客为中心B.智慧商务平台是电子商务平台的延伸C.智慧商务平台是电子商务平台的扩展D.智慧商务以信息为依托实现整体化营销模式6.( B )是数据分工具最基本的要求A.数据挖掘B.数据可视化C.预测性分析D.语文引擎7.商品和服务之间最基本的区别是( C )A.服务是全天候的B.服务是可追溯的C.服务是无形的D.商品是有形的8.根据在每次交易过程是否有第三方参与分类,电子支付系统可以分为( A )。
A.在线电子支付系统、离线在线电子支付系统B.大额支付电子支付系统、小额支付电子支付系统、微支付电子支付系统C.电子现金、支付系统、电子信用卡支付系统、电子支票支付系统D.网上支付、电话支付、移动支付9.质量标准差距是指( C )A.管理者对期望质量的感觉不明确B.在服务生产和交易过程中员工的行为不符合质量标准C.服务质量标准与管理者对质量期望的认识不一致D.营销沟通行为所做出的承诺与实际提供的服务不一致10.( D )可能产生积极结果。
A.营销沟通的差距B.服务交易差距C.管理者认识的差距D.感知服务质量差距11.由于没有两个完全一样的员工,也没有两个完全一样的顾客,那么就没有两种完全一致的服务,这体现了服务的什么特性?( B )A.无形性 B.异质性 C.生产与消费的同步性 D.易逝性12.网络营销就是( B )A.营销的网络化B.利用Internet等电子手段进行的营销活动C.在网上销售产品D.在网上宣传本企业的产品13.常用的搜索引擎营销方法有( A )A.关键词和相关性B.关键词和网站C.关键词和类目D.关键词和相关网页14.( A )是通过一套合理有效的积分制度引导并刺激用户主动进行宣传,是建立在有意于用户基础之上的营销模式。
商务智能复习题讲课稿
商务智能复习题讲课稿商务智能复习题一、选择题(本题共5道小题,每小题2分,共10分)1. 数据仓库是随着时间变化的,下面的描述不正确的是 ( C )。
A. 数据仓库随时间的变化不断增加新的数据内容B. 捕捉到的新数据会覆盖原来的快照C. 数据仓库随事件变化不断删去旧的数据内容D. 数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合2. 有关数据仓库的开发特点,不正确的描述是( B )。
A. 数据仓库使用的需求在开发初期就要明确B. 数据仓库开发要从数据出发C. 数据仓库的开发是一个不断循环的过程,是启发式的开发D. 在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式3. 在有关数据仓库测试,下列说法不正确的是 ( D )。
A. 在完成数据仓库的实施过程中,需要对数据仓库进行各种测试。
测试工作中要包括单元测试和系统测试。
B. 当数据仓库的每个单独组件完成后,就需要对他们进行单元测试。
C. 系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试。
D. 在测试之前没必要制定详细的测试计划。
4. 关于基本数据的元数据是指 ( D )。
A. 基本元数据与数据源、数据仓库、数据集市和应用程序等结构相关的信息B. 基本元数据包括与企业相关的管理方面的数据和信息C. 基本元数据包括日志文件和简历执行处理的时序调度信息D. 基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息6. 下面关于数据粒度的描述不正确的是 ( C )。
A. 粒度是指数据仓库小数据单元的详细程度和级别B. 数据越详细,粒度就越小,级别也就越高C. 数据综合度越高,粒度也就越大,级别也就越高D. 粒度的具体划分将直接影响数据仓库中的数据量以及查询质量6. 关于OLAP的特性,下面正确的是:( D )(1)快速性 (2)可分析性 (3)多维性 (4)信息性 (5)共享性A. (1) (2) (3)B. (2) (3) (4)C. (1) (2) (3) (4)D. (1) (2) (3) (4) (5)7. 关于OLAP和OLTP的区别描述,不正确的是: ( C )A. OLAP主要是关于如何理解聚集的大量不同的数据,它与OTAP 应用程序不同。
商务智能题库整理
商务智能--复习提纲一.选择题(第一次作业)1.数据仓库是随着时间变化的,下面的描述不正确的是AA.数据仓库随时间变化不断删去旧的数据内容B.捕捉到的新数据会覆盖原来的数据C.数据仓库随时间的变化不断增加新的数据内容D.数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合2 . OLAP在辅助决策时,基于用户建立的一系列假设驱动,通过OLAP来证实或者推翻这些假设是个()的过程CA集成B转换C演绎D归纳3 .不同操作型系统之间的数据一般是相互独立、异构的。
而数据仓库中的数据是对分散的数据进行抽取、清理、转换和汇总后得到的,这样就保证了数据仓库的数据关于整个企业的()DA时变性B非易失性C差异性D 一致性4 .如下图所示操作是OLAP 分析的哪种操作(D )A切片B旋转C下钻D上钻5 .数据立方体中的数据单元格是一个数值函数,该函数可以对数据立方体求值,如下哪个函数可以用来对数据立方体进行度量( )CA.substring()B.rand()C.sum()D.trunc()6 .关于数据仓库数据的时变性,如下描述不正确的是DA操作型系统存储的是当前数据,而数据仓库中的数据是历史数据B数据仓库中的数据是按照时间顺序追加的,它们都带有时间属性C数据仓库的数据时限一般要远远长于操作型数据的数据时限D数据仓库对响应时间要求不严格,处理时间从几秒到几分钟,有时甚至几小时7.数据仓库是面向主题的,逻辑意义上每一个商业主题都对应与企业决策包含的分析对象,一家保险公司的数据仓库的主题可能包含哪些BA顾客储蓄账B顾客、账户、索赔C顾客保险金额D顾客账单8 .假如警察要得到某犯罪嫌疑人在指定时间段的通话记录最有可能在(C )系统中获得A决策支持系统B电信营业账务系统C电信数据仓库系统D元数据管理系统9 .下面关于数据粒度的描述不正确的是BA数据综合度越高,粒度也就越大,级别也就越高B数据越详细,粒度就越小,级别也就越高C粒度是指数据仓库小数据单元的详细程度和级别D粒度的具体划分将直接影响数据仓库中的数据量以及查询质量10 .数据仓库并非只是数据的简单累积,而是要经过一系列的处理过程,即ETL,ETL过程包括哪些CA数据操作、数据挖掘、数据转义B数据存储、数据维护、数据分析C数据抽取、数据转换、数据装载D数据定义、数据建模、数据管理11 .企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的AA尽可能多的适合的数据B得分集数据是建模集数据的一部分C数据越多越好D以上三条都正确12 .关于基本数据的元数据是指DA基本元数据与数据源、数据仓库、数据集市和应用程序等结构相关的信息B基本元数据包括日志文件和简历执行处理的时序调度信息C基本元数据包括与企业相关的管理方面的数据和信息D基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息13 .数据立方体中的数据单元格中的数据可以通过如下哪些函数获得?AA 分布聚集函数count()、sum()、min()、max()和代数聚集函数avg()、stddev() B分析函数C 分布聚集函数count()、sum()、min()、max()D 聚集函数avg()、stddev()14 .关于OLAP和OLTP的说法,下列不正确的是BA . OLTP以应用为核心,是应用驱动的B . OLAP事务量大,但事务内容比较简单且重复率高C . OLAP的最终数据来源与OLTP不一样D . OLTP面对的是决策人员和高层管理人员15 .数据挖掘是通过( )的方式在海量数据中主动找寻模型,自动发掘隐藏在数据中的价值信息,OLAP分析结果为挖掘提供分析依据。
《商务智能》复习题及答案
《商务智能》复习题及答案1、把数据报表从一年展开成四个季度的操作是(C )A、上卷B、旋转C、下钻D、切片2、在多维数据集中,对某一个维度上的数据进行选择一维成员,其他维度没有变化的操作是( D)A、切块B、旋转C、下钻D、切片3、一个多维数组表示为:(维1,维2,维3,维4,变量),这是一个(B )维结构。
A、3B、4C、5D、64、一次购买行为的发起需要有:购买者、商家、商品、购买时间、供应商和订单金额。
如果设计星型模型,请问有几个维度(C )A、3B、4C、5D、65、在进行ETL时,应该在(C )里进行。
A、ODSB、数据仓库C、数据准备区D、源数据6、(多选题)此大数据带来的变革有(ABD ).A、思维变革B、商业变革C、购物变革D、管理变革7、自然演化式体系结构的问题有(ACD )。
(多选)A、数据可信性B、无法进行数据处理C、生产率问题D、无法将数据转化为信息8、数据立方体是指(C ).A、三维数据集B、三维以上的数据集C、三维和三维以上的数据集D、四维数据集'9、戈登·未尔提出在今后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度,每(D )左右可以翻一番。
A、1个月B、6个月C、12个月D、18个月10、大数据时代的核心价值是(B)A.数据收集B.数据分析C.数据挖掘D.数据可视化11、大数据的来源包括( ABCD).A.互联网数据B.传感器数据C.实时数据D.探测数据11、好友的QQ突然发来一个网站链接要求投票,最合理的做法是( C)A.因为是其好反信总,直接打开使接投票B.不参与任何投票C.可能是好友aq被盗,可能是恶意筑接。
先通过予机跟朋友确认链技按无异常,考虑是否投票D.把好友加入黑名单12、关于大数据特点,错误的是(C )A、数据量大B、数据类型多C.数据价值密度高D.数据处理速度快13、Hadop是基于(B )语言的数据分析框架。
A. C++B. JavaC. RD. C#14.Maphedue的主导思想是(C )A.集成化B.一体化C.分而治之D.综合化15.下列与大数据密切相关的技术是(B)A.蓝牙B.云计算C.博穿论D.WiFi16.大数据的数据类型包括结构化数据、非结构化数据和(A ).A.半结构化数据B.无结构化数据C.关系数据库数D.文本数据和WEe数报17.数据仓库中的数据(ABCD )A.集成的B.可以变化的C.面向主题的D.不易丢失的18.数据仓库是随着时间变化的。
智能商业试题答案及解析
智能商业试题答案及解析一、单项选择题1. 智能商业的核心是(B)。
A. 人工智能B. 数据智能C. 机器学习D. 大数据解析:智能商业的核心是数据智能,即通过数据的收集、分析和应用,实现商业决策的智能化。
2. 智能商业的三大支柱不包括(D)。
A. 云计算B. 大数据C. 人工智能D. 物联网解析:智能商业的三大支柱包括云计算、大数据和人工智能。
物联网虽然与智能商业有关联,但不是其核心支柱。
3. 下列哪项不是智能商业的优势(A)?A. 降低成本B. 提高效率C. 增强客户体验D. 减少创新解析:智能商业的优势包括降低成本、提高效率和增强客户体验。
减少创新并不是智能商业的优势。
4. 智能商业在零售行业的应用不包括(C)。
A. 个性化推荐B. 库存管理C. 产品制造D. 客户服务解析:智能商业在零售行业的应用包括个性化推荐、库存管理和客户服务。
产品制造不属于零售行业的范畴。
5. 智能商业对企业的影响不包括(D)。
A. 改变商业模式B. 优化决策过程C. 提升客户满意度D. 减少员工数量解析:智能商业对企业的影响包括改变商业模式、优化决策过程和提升客户满意度。
减少员工数量并不是智能商业的直接影响。
二、多项选择题1. 智能商业的关键要素包括(ABCD)。
A. 数据B. 算法C. 技术D. 人才解析:智能商业的关键要素包括数据、算法、技术和人才。
这些要素共同构成了智能商业的基础。
2. 智能商业在金融行业的应用包括(ABD)。
A. 风险管理B. 欺诈检测C. 产品制造D. 客户服务解析:智能商业在金融行业的应用包括风险管理和欺诈检测。
产品制造不属于金融行业的范畴。
3. 智能商业对企业运营的影响包括(ABC)。
A. 提高运营效率B. 降低运营成本C. 优化资源配置D. 增加员工数量解析:智能商业对企业运营的影响包括提高运营效率、降低运营成本和优化资源配置。
增加员工数量并不是智能商业的影响。
三、判断题1. 智能商业的发展完全依赖于人工智能技术。
商务智能方法与应用试题及答案
商务智能方法与应用试题及答案单选题1、什么是商务智能产生的驱动力()A、将企业内部的数据转换为利润B、商务智能也制定企业决策C、商务智能可帮助企业收集信息D、商务智能可将数据转换为信息,将信息转换为知识,进而支持企业进行决策2、淘宝的“猜你喜欢”功能是商务智能产生的什么原因的具体应用()A、急切的分析型需求B、企业的精细化管理需要商务智能C、知识产品化D、数据中蕴含的知识可以帮助企业进行优化升级3、智能化企业具有快速吸收新想法的能力、适应新情况的能力有效解决问题的能力、调用适当资源的能力、有效积累经验和知识的能力,其中适应新情况的能力有效解决问题的能力指的是什么()A、即企业在日常活动中,应具备快速接收新想法、新事物的能力,不能因循守旧,与时俱进才能把握市场动态,跟上时代的步伐B、即企业在面对不在了解、不熟悉等新领域出现的问题时,需要迅速适应新状况,并解决问题的能力C、即企业在面对任何一项工作的时候不能不合理的安排资源D、即在公司做任何一项工作的过程中,都会遇到各种各样的问题,在面对问题和解决问题的过程中就是积累经验和知识的过程4、数据是企业最重要的信息化资产,那么数据、知识、信息、决策之间的关系是如何递进的()A、数据产生为知识,知识转变为信息,信息支持决策B、数据产生为信息,知识转变为知识,知识支持决策C、数据产生为知识,知识支持决策,决策转变为信息D、数据产生为信息,信息支持决策,决策转变为知识5、商务智能是由业务层、技术层、()、组织层和战略层5个层面自下而上构成的层次机构A、运营层B、管理层C、功能层D、决策层6、商务智能的层次结构中,其中将企业ERP、CRM、SCM等企业系统数据集成在一次的层次结构属于()A、业务层B、技术层C、组织层D、战略层7、商务智能实施方案过程中是集数据采集、数据预处理、数据挖掘、数据可视化等关键技术与一体的,一般整个数据处理的过程中,占据整个处理过程花费80%左右时间的为()A、数据预处理B、数据挖掘C、数据集成D、数据可视化8、在数据集成的过程当中,一个数据源中的顾客编号为customer_id,另一个数据源中的顾客编号为cust_number,在两个数据源进行整合的过程中,如何识别customer_id和cust_number是同一属性,涉及到的数据集成中的()A、模式集成B、对象匹配和实体识别C、冗余和相关性分析D、数据冲突的监测和处理9、以下哪个选项不是数据仓库与操作型数据库的区别()A、操作型数据库的数据组织面向事务处理任务;数据仓库中的数据是按照一定的主题域进行组织。
数据库与商业智能(BI)考试
数据库与商业智能(BI)考试(答案见尾页)一、选择题1. 数据库系统工程师的主要职责包括哪些?A. 设计和构建数据库管理系统B. 编写和维护数据库应用程序C. 提供数据存储和检索服务D. 管理数据库系统的性能和安全2. 以下哪个选项是关系数据库管理系统(RDBMS)的核心特性之一?A. 非结构化数据存储B. 关系模型数据结构C. 高并发读写能力D. 自动数据备份和恢复3. 商业智能(BI)是什么?A. 一种数据分析工具B. 一种数据库管理系统C. 一种数据仓库D. 一种商业策略4. 在数据库系统中,什么是索引?A. 用于数据排序的一种数据结构B. 用于快速查询数据的一种数据结构C. 用于数据完整性和安全性的一种技术D. 用于数据存储的一种硬件设备5. 数据库事务的四个基本特性(ACID)分别是什么?A. 原子性、一致性、隔离性、持久性B. 一致性、隔离性、持久性、可用性C. 原子性、一致性、隔离性、可用性D. 原子性、一致性、隔离性、持久性6. 以下哪个数据库类型支持事务处理?A. 关系型数据库B. 非关系型数据库C. 数据仓库D. 并行数据库7. 在商业智能(BI)中,哪种图表类型通常用于展示时间序列数据?A. 条形图B. 折线图C. 水平柱状图D. 饼图8. 数据库管理系统(DBMS)和非关系型数据库(NoSQL)之间的主要区别是什么?A. 数据模型B. 事务处理能力C. 查询语言D. 存储结构9. 在数据库设计中,什么是规范化?A. 一种用于减少数据冗余的技术B. 一种用于确保数据一致性的技术C. 一种用于描述数据在磁盘上如何存储的技术D. 一种用于提高数据访问速度的技术10. 在商业智能(BI)项目中,数据清洗和预处理的目的是什么?A. 为了确保数据的准确性B. 为了优化数据存储C. 为了提高数据可视化效果D. 为了确保数据的安全性11. 在数据库设计中,以下哪个阶段是用来确保数据结构与业务需求相匹配的?A. 需求分析B. 概念设计C. 逻辑设计D. 物理设计12. 商业智能(BI)工具的主要功能是什么?A. 数据挖掘和分析B. 数据清洗和验证C. 数据转换和加载D. 数据可视化13. 数据库事务处理的主要特点包括哪些?A. 原子性B. 一致性C. 隔离性D. 持久性14. 数据库备份策略的选择应考虑哪些因素?A. 数据的重要性B. 数据的备份频率C. 系统的恢复时间目标(RTO)D. 数据的备份类型15. 关系型数据库与非关系型数据库的主要区别是什么?A. 数据模型B. 事务处理能力C. 扩展性D. 存储方式16. 在数据库系统中,索引的作用是什么?A. 提高查询速度B. 减少数据冗余C. 支持事务处理D. 增强数据安全性17. 数据库管理员(DBA)在数据库系统中的角色是什么?A. 系统开发人员B. 数据库设计者C. 数据库维护者D. 数据库管理者18. 数据仓库中的数据通常分为哪几个层次?A. 银行账户层B. 业务层C. 报表层D. 数据层19. 数据挖掘中常用的技术有哪些?A. 分类B. 聚类C. 关联规则学习D. 回归分析20. 在商业智能(BI)项目中,如何确保数据的质量和分析的准确性?A. 对数据进行清洗和预处理B. 使用可靠的数据源C. 定期进行数据审核和验证D. 使用高级的分析工具21. 数据库系统的发展历程可以分为几个阶段?A. 人工管理阶段B. 文件系统阶段C. 数据库系统阶段D. 面向对象的数据库阶段22. 数据库系统工程师在面试过程中可能会展现出以下心态:A. 焦虑和不安B. 自我怀疑C. 对未来的期待D. 对技术的渴望23. 数据仓库中的数据组织结构通常遵循哪种模式?A. 星型模型B. 网状模型C. 链型模型D. 分层模型24. 在商业智能(BI)应用中,数据清洗和预处理的主要目的是什么?A. 提高数据质量B. 减少数据冗余C. 增强数据一致性D. 提升数据处理效率25. 数据挖掘中,以下哪个技术不是用来发现数据中的隐藏模式和趋势的?A. 分类B. 聚类C. 回归D. 预测26. 在数据库系统中,索引的主要作用是什么?A. 加速查询操作B. 增加数据冗余C. 保证数据完整性D. 支持事务处理27. 数据库管理系统(DBMS)的体系结构通常包含哪几个层次?A. 应用层B. 业务逻辑层C. 数据访问层D. 数据存储层28. 在商业智能(BI)项目中,数据集成通常涉及哪些步骤?A. 数据抽取B. 数据转换C. 数据清洗D. 数据加载29. 在数据库设计中,规范化是为了解决数据冗余、插入异常、删除异常和更新异常等问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
商务智能复习题This model paper was revised by the Standardization Office on December 10, 2020一、选择题(本题共5道小题,每小题2分,共10分)1. 数据仓库是随着时间变化的,下面的描述不正确的是 ( C )。
A. 数据仓库随时间的变化不断增加新的数据内容B. 捕捉到的新数据会覆盖原来的快照C. 数据仓库随事件变化不断删去旧的数据内容D. 数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合2. 有关数据仓库的开发特点,不正确的描述是( B )。
A. 数据仓库使用的需求在开发初期就要明确B. 数据仓库开发要从数据出发C. 数据仓库的开发是一个不断循环的过程,是启发式的开发D. 在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式3. 在有关数据仓库测试,下列说法不正确的是 ( D )。
A. 在完成数据仓库的实施过程中,需要对数据仓库进行各种测试。
测试工作中要包括单元测试和系统测试。
B. 当数据仓库的每个单独组件完成后,就需要对他们进行单元测试。
C. 系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试。
D. 在测试之前没必要制定详细的测试计划。
4. 关于基本数据的元数据是指 ( D )。
A. 基本元数据与数据源、数据仓库、数据集市和应用程序等结构相关的信息B. 基本元数据包括与企业相关的管理方面的数据和信息C. 基本元数据包括日志文件和简历执行处理的时序调度信息D. 基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息6. 下面关于数据粒度的描述不正确的是 ( C )。
A. 粒度是指数据仓库小数据单元的详细程度和级别B. 数据越详细,粒度就越小,级别也就越高C. 数据综合度越高,粒度也就越大,级别也就越高D. 粒度的具体划分将直接影响数据仓库中的数据量以及查询质量6. 关于OLAP的特性,下面正确的是:( D )(1)快速性 (2)可分析性 (3)多维性 (4)信息性 (5)共享性A. (1) (2) (3)B. (2) (3)(4)C. (1) (2) (3) (4)D. (1) (2) (3) (4) (5)7. 关于OLAP和OLTP的区别描述,不正确的是: ( C )A. OLAP主要是关于如何理解聚集的大量不同的数据,它与OTAP应用程序不同。
B. 与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务.C. OLAP的特点在于事务量大,但事务内容比较简单且重复率高.D. OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的。
8. 关于OLAP和OLTP的说法,下列不正确的是: ( A )A. OLAP事务量大,但事务内容比较简单且重复率高B. OLAP的最终数据来源与OLTP不一样C. OLTP面对的是决策人员和高层管理人员D. OLTP以应用为核心,是应用驱动的9. OLAP技术的核心是( D )。
A. 在线性B. 对用户的快速响应C. 互操作性D. 多维分析10.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题( A )A. 关联规则B. 聚类C. 分类D. 自然语言处理11. 分析型CRM的( C )功能可以让CRM对所进行的销售活动相关信息进行存储和管理,将客户所发生的交易与互动事件转化为有意义、高获利的销售商机。
A. 促销管理B. 个性化和标准化C. 客户分析和建模D. 客户沟通12. 运用关键绩效指标法设计组织关键绩效指标依次经过以下几个步骤( A )。
A. 确定关键成功领域、确定关键绩效要素、确定关键绩效指标B. 计划目标、实施目标、评价结果、反馈C. 确定目标、比较目标、收集分析数据、系统学习与改进、评价和提高D. 确定长期整体目标、确定短期目标13.什么是KDD ( A )A. 知识发现B. 领域知识发现C. 文档知识发现D. 动态知识发现14. 呼叫中心是一种基于( D )的一种新的综合信息服务系统。
A IT技术B CTI技术C WEB技术D CRM技术15. 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务(C )A. 频繁模式挖掘B. 分类和预测C. 数据预处理D. 数据流挖掘16. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离( B )A. 分类B. 聚类C. 关联分析D. 隐马尔可夫链17. 使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务(A)A. 探索性数据分析B. 建模描述C. 预测建模D. 寻找模式和规则18. 为数据的总体分布建模,把多维空间划分成组等问题属于数据挖掘的哪一类任务(B)A. 探索性数据分析B. 建模描述C. 预测建模D. 寻找模式和规则19. 建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务( C )A. 根据内容检索B. 建模描述C. 预测建模D. 寻找模式和规则20. 用户有一种感兴趣的模式并且希望在数据集中找到相似的模式,属于数据挖掘哪一类任务( A )A. 根据内容检索B. 建模描述C. 预测建模D. 寻找模式和规则21.下面哪种不属于数据预处理的方法 ( D )A. 变量代换B. 离散化C. 聚集D. 估计遗漏值22.下面哪个不属于数据的属性类型( D )。
A. 标称B. 序数C. 区间D. 相异23. 在上题中,属于定量的属性类型是( C )。
A. 标称B. 序数C. 区间D. 相异24. 只有非零值才重要的二元属性被称作( C )。
A. 计数属性B. 离散属性C. 非对称的二元属性D. 对称属性25. 以下哪种方法不属于特征选择的标准方法 ( D )。
A. 嵌入B. 过滤C. 包装D. 抽样26.下面不属于创建新属性的相关方法的是( C )。
A. 特征提取B. 特征修改C. 映射数据到新的空间D. 特征构造27. 下面哪个属于映射数据到新的空间的方法 ( A )A. 傅立叶变换B. 特征加权C. 渐进抽样D. 维归约28. 企业所建立的预测模型的好坏取决于模型在( A )上的表现效果。
A. 得分集B. 训练集C. 测试集D. 评价集29. 客户在经济活动中具有多重身份,下面哪一种不是其身份之一( C )。
A. 行为身份B. 所有权身份C. 学习身份D. 决策身份30. 下列四条描述中,正确的一条是( B )。
A. 企业实施数据挖掘,必须要有数据仓库。
B. 企业要实施数据挖掘最好的方式是请编外专家。
C. 企业购买现成数据挖掘模型的一个先决条件是:该企业的产品、客户、市场定位和所买来的现成模型设计之初的假设相吻合。
D. 在建模的时侯,增益最高的模型就是最好的模型。
31. 数据挖掘算法以( D )形式来组织数据。
A. 行B. 列C. 记录D. 表格32. 企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的是( B )。
A. 数据越多越好。
B. 尽可能多的适合的数据。
C. 得分集数据是建模集数据的一部分。
D. 以上三条都正确。
33. K—均值类别侦测要求输入的数据类型必须是( B )。
A. 整型B. 数值型C. 字符型D. 逻辑型34. 在决策树和累计增益图的关系转化过程图中,决策树上某一页节点的增益与累计增益图上的( D )相对应。
A. 线段长度B. 线段斜率C. 相对应的线段长度D. 相对应的线段斜率35. 企业为提升每个客户的价值,应实现( C )最优化。
A. 促销活动B. 预算最优化C. 客户最优化D. 三者都不是36. 数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了( C )数据挖掘方法。
A. 分类B. 预测C. 组合或关联法则D. 聚类37. 企业成功实施数据挖掘,需要以下( B )知识或技术。
A. 预先的规划B. 对商业文体的理解C. 综合商业知识和技能D. 都需要38. 下列哪个不是专门用于可视化时间空间数据的技术( B )。
A. 等高线图B. 饼图C. 曲面图D. 矢量场图39. 在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是 ( D )。
A. 有放回的简单随机抽样B. 无放回的简单随机抽样C. 分层抽样D. 渐进抽样40. 设X={1,2,3}是频繁项集,则可由X产生( C )个关联规则。
A. 4B. 5C. 6D. 741. 概念分层图是( B )图。
A. 无向无环B. 有向无环C. 有向有环D. 无向有环42. 以下哪些算法是分类算法( B )。
A. DBSCANB. C4.5C. K-MeanD. EM43. 以下哪些分类方法可以较好地避免样本的不平衡问题( A )。
A. KNNB. SVMC. BayesD. 神经网络44. 以下关于人工神经网络(ANN)的描述错误的有 ( A )。
A. 神经网络对训练数据中的噪声非常鲁棒B. 可以处理冗余特征C. 训练ANN是一个很耗时的过程D. 至少含有一个隐藏层的多层神经网络45. 通过聚集多个分类器的预测来提高分类准确率的技术称为 ( A ) 。
A. 组合(ensemble)B. 聚集(aggregate)C. 合并(combination)D. 投票(voting)46. 简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作( B )。
A. 层次聚类B. 划分聚类C. 非互斥聚类D. 模糊聚类47. 在基本K均值算法里,当邻近度函数采用( A )的时候,合适的质心是簇中各点的中位数。
A. 曼哈顿距离B. 平方欧几里德距离C. 余弦距离D. Bregman散度48.( C )是一个观测值,它与其他观测值的差别如此之大,以至于怀疑它是由不同的机制产生的。
A. 边界点B. 质心C. 离群点D. 核心点48. 检测一元正态分布中的离群点,属于异常检测中的基于( A )的离群点检测。
A. 统计方法B. 邻近度C. 密度D. 聚类技术49. DBSCAN在最坏情况下的时间复杂度是( B )。
A. O(m)B. O(m2)C. O(log m)D. O(m*log m)50. 关于K均值和DBSCAN的比较,以下说法不正确的是( A )。
A. K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象。
B. K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念。
C. K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇。