商务智能考试重点题型不看后悔

合集下载

商务智能复习的题目

商务智能复习的题目

商务智能复习的题目一、选择题(本题共5道小题,每小题2分,共10分)1、数据仓库就是随着时间变化得,下面得描述不正确得就是( C )。

A、数据仓库随时间得变化不断增加新得数据内容B、捕捉到得新数据会覆盖原来得快照C、数据仓库随事件变化不断删去旧得数据内容D、数据仓库中包含大量得综合数据,这些综合数据会随着时间得变化不断地进行重新综合2、有关数据仓库得开发特点,不正确得描述就是( B )。

A、数据仓库使用得需求在开发初期就要明确B、数据仓库开发要从数据出发C、数据仓库得开发就是一个不断循环得过程,就是启发式得开发D、在数据仓库环境中,并不存在操作型环境中所固定得与较确切得处理流,数据仓库中数据分析与处理更灵活,且没有固定得模式3、在有关数据仓库测试,下列说法不正确得就是 ( D )。

A、在完成数据仓库得实施过程中,需要对数据仓库进行各种测试。

测试工作中要包括单元测试与系统测试。

B、当数据仓库得每个单独组件完成后,就需要对她们进行单元测试。

C、系统得集成测试需要对数据仓库得所有组件进行大量得功能测试与回归测试。

D、在测试之前没必要制定详细得测试计划。

4、关于基本数据得元数据就是指 ( D )。

A、基本元数据与数据源、数据仓库、数据集市与应用程序等结构相关得信息B、基本元数据包括与企业相关得管理方面得数据与信息C、基本元数据包括日志文件与简历执行处理得时序调度信息D、基本元数据包括关于装载与更新处理,分析处理以及管理方面得信息6、下面关于数据粒度得描述不正确得就是 ( C )。

A、粒度就是指数据仓库小数据单元得详细程度与级别B、数据越详细,粒度就越小,级别也就越高C、数据综合度越高,粒度也就越大,级别也就越高D、粒度得具体划分将直接影响数据仓库中得数据量以及查询质量6、关于OLAP得特性,下面正确得就是:( D )(1)快速性 (2)可分析性 (3)多维性 (4)信息性 (5)共享性A、 (1) (2) (3)B、 (2) (3) (4)C、 (1) (2) (3) (4)D、 (1) (2) (3) (4) (5)7、关于OLAP与OLTP得区别描述,不正确得就是: ( C )A、OLAP主要就是关于如何理解聚集得大量不同得数据,它与OTAP应用程序不同。

商务智能复习题.doc

商务智能复习题.doc

二、判断题(本题共10道小题,每小题1分,共10分)(F ) 4.独立的数据集市架构的优点是企业内数据一致,不会产生信息孤岛。

(F ) 6.企业风险分析是通过对企业的经营成本进行综合评价,拟定一个企业成本的临界值。

(T ) &在BI中,DW是前提和基础,负责统一数据规则的处理和存储。

(F ) 9.客户服务管理是对客户意见或投诉以及售前、售中、售后服务进行管理。

(F ) 10.平衡计分卡共包括三个层面,分别是财务层面、客户层面、内部业务流程层面。

(F ) 12.在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。

(F ) 13. OLAP是用来协助企业对响应事件或事务的日常商务活动进行处理。

(F ) 16. C4.5决策树算法是国际上最早、最有影响力的决策树算法,(T ) 17.平衡计分卡是从财务、客户、内部运营、学习与成长四个角度,将组织的战略落实为可操作的衡量指标和目标值的一种新型绩效管理体系。

(F ) 1&客户服务管理是对客户意见或投诉以及售前、售中、售后服务进行管理。

(F ) 19.企业绩效管理的目的在于进一步加强成本的事前控制,同时有助于通过盈亏分析,辅助产品科学的报价。

(T )等深分箱法使每个箱子的记录个数相同。

(F )数据仓库“粒度”越细,记录数越少。

F记录树越多,范围越广泛(F )回归分析通常用于挖掘关联规则。

(T )孤立点在数据挖掘时总是被视为异常、无用数据而丢弃。

34.决策树方法特别适合于处理数值型数据。

(F )数据立方体是广义知识发现的方法和技术之一。

(F )可信度是对关联规则的准确度的衡量。

(T )可视化技术对于分析的数据类型通常不是专用性的。

(T ) OLAP技术侧重于把数据库中的数据进行分析、转换成辅助决策信息,是继数据库技术发展之后迅猛发展起来的一种新技术。

(F)关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则(F )Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。

复习范围商务智能

复习范围商务智能

一、选择题(5道,10分) 二、判断题(10道,10分) 三、名词解释(4道,20分)商务智能 数据仓库 数据挖掘 绩效管理企业经营分析系统. 平衡计分卡 数据规范化 ROLAP 决策树四、简答题(5道,30分)1. 简述数据、信息和知识之间的关系。

2. 画出商务智能的系统架构图,实现其功能的三大技术是什么?3. 实现商务智能的四个阶段是什么?4. 何谓数据仓库?为什么要建立数据仓库?5. 简述OLAP 与数据挖掘的区别和联系。

6. 简述OLAP 的基本操作有哪些?7. 简述数据挖掘从技术角度的定义和含义。

8. 何谓数据挖掘?它有哪些方面的功能?9. 在数据挖掘之前为什么要对原始数据进行预处理? 10. 简述构造智能CRM 系统的完整步骤。

11. 简述智能CRM 系统的特点。

12. 影响客户流失的因素有哪些?13. 简述客户流失模型的建立和应用过程。

14. 简述K-近邻分类法的基本思想。

15. 主成分分析法的基本思想是什么?16. 什么是决策树?ID3算法的步骤是什么? 17. 简述K-近邻分类法的基本思想。

18. 关联规则挖掘能发现什么知识?简述关联规则挖掘的基本步骤。

19. 什么是绩效管理?目的是什么?20. 什么是平衡计分卡?设计平衡计分卡的目的是什么? 五、计算题(10分)给定如下要进行聚类的元组:{3,5,11,13,4,21,31,12,26},假设分为2类,即K 1=2,初始时用前两个数值作为类的均值:m=3 和 m=5。

假设给定如下元组:{3,5,11,13,4,21,31,12,26}已分为两类:K1={3,4,5,110,12,13} 和 K2={21,31,26},应用K-近邻法判断元组x=16属于哪一类?设K=3,写出判断过程。

T )X ,X ,X (X 321=的协方差矩阵⎪⎪⎪⎭⎫ ⎝⎛--=200052021A 的特征值和特征向量分别为:)0,924.0,383.0(e 83.5T11-==,λ,)1,0,0(e 00.2T 22==,λ,)0,383.0,924.0(e 17.0T33==,λ,求X 的主成分,计算其贡献率。

商务智能重点(大概整理)

商务智能重点(大概整理)

题型:选择10*1分,单选10*1分,填空8*1分,计算4*9分,问答4*9分。

一、商务智能概述1.数据数据是可以记录、通信和能识别的符号,它通过有意义的组合来表达现实世界中的某种实体(具体对象、事件、状态或活动)的特征。

商务智能技术可以分析结构化数据、半结构化数据以及非结构化数据、静态的历史数据和动态数据流等各种类型的数据。

2.3.BI定义定义一:Business Intelligence is a process of turning data into knowledge and knowledge into action for business gain. (Data Warehouse Institute)标准定义:商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升各方面商务绩效,增强综合竞争力的智慧和能力。

4.商务智能的结构(1)商务智能的结构主要由两部分组成:数据仓库环境分析环境(2)商务智能主要由三种技术构成:数据仓库(Data Warehouse)联机分析处理(On-line Analysis,OLAP)数据挖掘(Data Mining)在三大技术支柱中,数据仓库是商务智能的基础。

联机分析处理(OLAP)是以海量数据为基础的复杂分析技术。

数据挖掘(Data Mining)是从海量数据中,提取隐含在其中的、人们事先不知道的但又可能有用的信息和知识的过程。

二、决策支持系统1.结构化:数据结构字段含义确定、清晰。

典型的如数据库中的表结构半结构化:具有一定结构,但语义不够确定典型的如HTML网页,有些字段是确定的(title),有些不确定(table) 非结构化:杂乱无章的数据,很难按照一个概念去进行抽取,无规律性2.DSS的产生背景电子数据处理——EDP(Electronic Data Processing)管理信息系统——MIS(Management Information Systems)决策支持系统——DSS(Decision Support Systems)(70年代中期提出)3.DSS的定义决策支持系统(DSS)是以管理科学,运筹学,控制论和行为科学为基础,以计算机技术,仿真技术和信息技术为手段,针对半结构化和非结构化的决策问题,支持决策活动的具有智能作用的人机系统.3.DSS 的构造DSS的构造研究主要解决DSS的组成问题,即组成DSS的部件。

商务智能题目

商务智能题目

1. B2B电子商务对交易成本的影响的实证分析2. B2B电子商务框架结构.3. BtoB电子商务的主要技术.4. EDI在电子商务中的应用与安全5. PDA在移动电子商务中的应用6. PKI构建安全电子商务的基石7. XCBL及其在2BB电子商务中的应用8. XML技术和电子商务的发展9. 把电子商务引入图书营销.10. 产地证电子签证与贸易链电子商务11. 从电子商务走向电子业务.12. 从范式的转变看证券电子商务13. 戴着锁链跳舞──发展电子商务的法律环境.14. 电子商务课税研究的国际动向与借鉴15. 电子商务的发展对第三产业结构的影响.16. 电子商务时代网络营销的变迁17. 电子商务的发展创新与环境构筑18. 电子商务的相关问题与对策分析19. 电子商务安全协议的特征及企业对策20. 电子商务的安全机制与体系结构模型21. 电子商务环境下的敏捷制造研究22. 电子商务犯罪初论23. 电子商务的风险及其安全管理24. 电子商务环境下审计的必要性和特殊性25. 电子商务环境下物流企业经营战略分析26. 电子商务时代和信息时代的供应链管理与物流配送27. 电子商务环境下物流业发展对策探讨28. 电子商务时代的物流配送思考29. 电子商务对企业的影响与对策30. 电子商务对商品价格的影响31. 电子商务对渠道的影响32. 电子商务模式分析及展望33. 电子商务环境下的供应链管理34. 电子商务对工业企业的影响.35. 电子商务时代的新型市场结构36. 电子商务对现代企业管理的影响.37. 电子商务的交易费用基础和发展障碍38. 电子商务的安全性和SET技术.39. 电子商务时代对会计假设的影响40. 电子商务对会计的挑战与影响41. 试论企业电子商务的风险控制42. 试论电子商务与高新技术产业发展战略43. 数字双签名及其在电子商务中的应用.44. 网络经济时代下的传统企业电子商务化45. 电子商务发展的现状、难题及对策分析46. 电子商务的发展.47. 电子商务发展中的问题与对策48. 电子商务发展的税收政策研究49. 汽车企业电子商务实施浅析50. 西部地区发展电子商务的途径.51. 西安杨森的电子商务站点案例研究52. 香港中小企业电子商务应用现状.53. 新经济时代中国电子商务的现状及发展前景54. 医疗器械电子商务的实施方案55. 医药企业内部信息化与外部电子商务56. 移动电子商务的发展与支持技术研究57. 以工作流系统和电子商务技术构建企业数码平台58. 用企业级Java计算方案构建B2B电子商务软件平台.59. 政府商务和网络经济的法律激励和管制.60. 中国电子商务发展之路探索61. 中国电子商务的量化分析及对策62. 中国加入WTO的电子商务发展对策63. 中国企业如何走向电子商务时代64. 中国实施B-C电子商务的问题与对策65. 中小企业开展电子商务赢利模式的探讨66. 中小企业怎样实施电子商务.67. 电子商务对国际税收管辖权的挑战.。

商业智能系统考试试题

商业智能系统考试试题

商业智能系统考试试题一、选择题(共50分)1. 商业智能系统是指通过技术手段解决商业问题、支持商业决策的一套系统和工具。

下面哪个不属于商业智能系统的关键组成部分?A. 数据仓库B. 数据分析C. 数据可视化D. 数据备份2. 在商业智能系统中,下面哪个工具可以用来将数据从多个来源整合到一个统一的数据仓库中?A. ETL工具B. OLAP工具C. 数据可视化工具D. 决策支持系统3. 商业智能系统的数据分析功能可以帮助企业进行哪些方面的工作?A. 销售预测B. 成本控制C. 客户关系管理D. 所有选项都正确4. 商业智能系统可以通过可视化方式呈现数据分析结果,下面哪个不属于常用的数据可视化工具?A. 折线图B. 柱状图C. 饼图D. 行列式图5. 商业智能系统的决策支持功能能够帮助企业进行哪些方面的工作?A. 市场定位B. 产品设计C. 供应链管理D. 所有选项都正确二、填空题(共30分)1. 商业智能系统的主要目标是提供有用的_____________,帮助企业做出更明智的决策。

2. 商业智能系统通过_____________、_____________和_____________等技术手段来实现数据分析。

3. 在商业智能系统中,数据仓库一般包括_____________、_____________和_____________等组成部分。

4. 在商业智能系统中,通过_____________和_____________等工具可以将数据可视化呈现。

5. 商业智能系统的决策支持功能可以通过_____________、_____________和_____________等方式来实现。

三、简答题(共20分)1. 请简要描述商业智能系统的应用场景,并举例说明。

2. 商业智能系统的技术架构包括哪些主要组成部分?请简要介绍每个组成部分的作用。

四、论述题(共50分)请就商业智能系统在企业决策中的作用发表你的观点,并提供相关案例或数据支持。

商务智能的考试重点

商务智能的考试重点

1.商务智能的基本概念(简答)对工业界来说,商务智能是一类技术或工具,利用他们可以对大量的数据进行收集、管理、分析和挖掘,以改善业务决策水平,增强企业竞争力。

对学术界来说,商务智能是一套理论、方法、和应用,通过他们可以快速的发现海量数据中隐含的各种知识,有效的解决企业面临的管理和决策问题,支持企业的战略实施。

2.商务智能系统的开发过程3.在线分析处理和在线事务处理(简答)4.决策支持系统的系统架构(1)模型库管理系统主要用于管理决策所需的各种模型,例如财务、统计、预测以及管理等方面的定量模型,利用这些模型可以进行问题分析。

用户利用该系统可以方便快捷的构建和操纵模型。

系统提供对模型的分类、删除、复制等维护功能,可以将已有模型进行合并,以及对模型的执行情况进行跟踪、分析和评价,如对变量进行敏感度分析等。

(2)知识库管理系统提供知识的表示、存储和管理功能,用于支持定量模型无法解决的决策过程,帮助用户建立、应用和管理描述性、过程性和推理性知识。

(3)对话产生与管理系统主要负责用户与系统之间的交互。

接受用户的输入,能够与数据库管理系统、模型库管理系统和知识库管理系统进行交互,以各种形式将结果返回给用户,提供图形用户界面以及可视化功能。

6.回归:回归方法中最常用的是线性回归,包括一元线性回归、多元线性回归以及非线性回归。

线性回归方法不仅用于预测,也可以用作解释模型,以探寻变量之间的关系。

另外还有回归树和模型树等模型。

7.回归系数的显著性检验:回归系数的显著性检验可以采用t检验。

对于每个回归系数bi(i=1,2,....k),显著性检验的两个假设分别为H0:bi=0和H1:bi≠0。

若bi=0说明自变量xi的变化对因变量没有线性影响,即变量xi对因变量的影响不显著。

为每个回归系数b i 构造变量tbi如式所示:式中cii是对矩阵C=(X T X)-1的对角线上的第i个值。

给定显著性水平α,查自由度为(n-k-1)的t分布表,得到tα(n-k-1),若t bi>t α(n-k-1),则拒绝假设H0,即回归系数b i显著。

商务智能考试题目

商务智能考试题目

商务智能考试题(共五个大题,每题20分)1、商务智能应用技术?功能组成?一般认为数据仓库、OLAP和数据挖掘技术是商业智能的三大组成部分数据仓库是存放为分析目的而收集的数据的数据库。

数据挖掘是从数据抽取正确的、有用的、以前未知的及可理解的信息,并使用该信息做商业决策的过程。

OLAP(联机分析处理)是针对特定问题的联机数据访问和分析。

通过对信息(这些信息已经从原始的数据进行了转换,以反映用户所能理解的企业的真实的“维”)的很多可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。

商业智能系统主要包括数据预处理、建立数据仓库、数据分析及数据展现四个主要阶段。

数据预处理是整合企业原始数据的第一步,它包括数据的抽取、转换和装载三个过程。

建立数据仓库则是处理海量数据的基础。

数据分析是体现系统智能的关键,一般采用联机分析处理和数据挖掘两大技术。

在海量数据和分析手段增多的情况下,数据展现则主要保障系统分析结果的可视化。

2、“商业智能是一种解决方案”这句话怎么理解?为什么商业智能没有“专业出版的教材”?(1)商务智能(Business Intelligence,简称BI):商务智能不是通常的业务处理。

它的目标是如何更快、更容易地做更好的决策。

BI将信息转换为知识。

商业智能是在正确的时间将正确的信息交给正确的用户以支持决策过程的应用。

目前,商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。

为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。

因此,从技术层面上讲,商业智能不是什么新技术,它只是数据仓库、OLAP和数据挖掘等技术的综合运用。

为此,把商业智能看成是一种解决方案应该比较恰当。

(2)3、商业智能(BI)与CRM,ERP,CIMS,等系统的异同和关联?4、商业智能系统的应用过程(步骤)?为什么说商业智能的步骤一般是“循环(迭代)”的?5、IBM说“商业智能之客户直销分析”应用商业智能中的什么技术?分析这些技术?。

商业智能考试试题及答案

商业智能考试试题及答案

商业智能考试试题及答案1. 多选题:商业智能的定义是什么?A. 利用数据和分析方法来提供有益的商业见解和指导B. 利用计算机技术来提高商业决策的质量和效率C. 利用互联网技术来推动企业的数字化转型D. 利用人工智能算法来优化商业流程答案:A和B2. 判断题:商业智能的目标是帮助企业做出更明智的商业决策。

答案:正确3. 单选题:以下哪项不是商业智能的关键组成部分?A. 数据仓库B. 数据可视化C. 数据挖掘D. 业务流程管理答案:D4. 填空题:商业智能的四个基本功能包括__________________。

答案:报表和查询、数据分析、数据挖掘、数据可视化5. 简答题:请解释商业智能的数据可视化功能及其重要性。

答案:数据可视化是商业智能的关键功能之一,它将数据以图表、图形等形式展示出来,使得用户可以直观地理解和分析数据。

通过数据可视化,决策者可以更快地发现数据中的模式和趋势,更准确地评估业务绩效,并做出更明智的决策。

数据可视化不仅可以提高决策速度和准确性,还能增强数据沟通的效果,帮助不具备专业数据分析能力的人员也能理解和利用数据。

6. 解答题:请简要描述商业智能的实施过程和关键要素。

答案:商业智能的实施过程包括以下几个关键步骤:1) 需求分析:明确商业智能的应用目标和需求,确定所需要分析的数据内容和指标。

2) 数据准备:收集、整理和清洗数据,建立数据仓库或数据湖,并确保数据的质量和完整性。

3) 数据建模:根据需求,设计和构建数据模型,包拟定数据分析方法和算法。

4) 可视化设计:选择合适的数据可视化工具和技术,设计直观、易于理解的数据可视化界面。

5) 实施和测试:部署商业智能系统,对系统进行测试和调优,确保系统的稳定性和性能。

6) 培训和推广:培训用户和决策者使用商业智能系统,推广系统在企业中的应用和效果。

关键要素包括:明确的需求、高质量的数据、合适的数据模型和算法、直观的可视化界面、稳定可靠的系统性能,以及用户培训和推广。

数据库与商务智能考试

数据库与商务智能考试

数据库与商务智能考试(答案见尾页)一、选择题1. 数据库系统的基本组成部分包括哪些?A. 关系模型B. 数据库管理系统(DBMS)C. 数据仓库D. 以上都是2. 关系模型的主要概念是什么?A. 实体-关系模型B. 对象关系模型C. 面向对象模型D. 以上都不是3. 数据库事务的特性中,ACID代表什么?A. 原子性、一致性、隔离性、持久性B. 原子性、可恢复性、一致性、隔离性C. 原子性、一致性、隔离性、持久性D. 原子性、可恢复性、一致性、持久性4. 以下哪个选项是数据仓库的特征?A. 集成性B. 非易失性C. 分布性D. 以上都是5. 商务智能(BI)的主要应用领域包括哪些?A. 数据分析B. 数据挖掘C. 数据可视化D. 以上都是6. 数据库性能优化通常涉及哪些方面?A. 索引优化B. 查询优化C. 硬件选择D. 以上都是7. 在数据库系统中,如何保证数据的安全性和完整性?A. 使用强密码策略B. 定期备份数据C. 实施访问控制D. 以上都是8. 数据库复制在商务智能中的应用主要目的是什么?A. 提高数据可用性B. 提高数据一致性C. 提供数据备份功能D. 提高数据访问速度9. 以下哪个选项是数据库管理系统的核心功能?A. 数据定义B. 数据查询C. 数据更新D. 数据安全10. 在数据库系统中,如何实现数据的标准化?A. 将数据分解为更小的单元B. 将数据组织到不同的表格中C. 将数据按照特定的规则进行转换D. 将数据按照特定的规则进行分组11. 数据库系统工程师的主要职责包括哪些?A. 设计和构建数据库管理系统B. 编写和维护数据库应用程序C. 管理和优化数据库性能D. 提供数据分析和商业智能解决方案12. 关系数据库中的基本概念是什么?A. 数据库、关系、元组、属性B. 数据库、关系、元组、列C. 数据库、关系、元组、属性、主键D. 数据库、关系、元组、属性、外键13. 以下哪个选项是关系数据库中常用的数据类型?A. 整数B. 浮点数C. 字符串D. 布尔值14. 在数据库设计中,哪一个阶段负责定义和描述数据的结构?A. 需求分析B. 概念设计C. 逻辑设计D. 物理设计15. 数据库管理系统(DBMS)的主要组成部分包括?A. 存储器管理B. 查询处理器C. 事务管理D. 数据定义语言(DDL)16. 以下哪个术语描述了数据库中数据的逻辑结构?A. 存储方式B. 逻辑结构C. 物理结构D. 结构式17. 在数据库系统中,哪一个概念用于定义数据之间的关系?A. 表格B. 结构式C. 关系模型D. 实体-关系模型18. 以下哪个选项是数据库性能优化的一个关键因素?A. 硬件资源B. 软件配置C. 数据库设计D. 查询负载19. 在数据库系统中,哪一个技术用于存储和管理数据?A. 文件系统B. 数据库管理系统(DBMS)C. 对象关系映射(ORM)D. 数据仓库20. 以下哪个选项提供了数据库系统的安全机制?A. 访问控制列表(ACL)B. 数据加密C. 审计和日志记录D. 数据备份和恢复21. 关系型数据库与非关系型数据库的主要区别是什么?A. 数据存储结构B. 数据处理速度C. 适用场景D. 所需硬件资源22. 数据仓库中需要进行数据清洗和预处理的原因是什么?A. 提高数据质量B. 增加存储空间C. 减少数据处理量D. 降低错误率23. 在数据库设计中,E-R图(实体-关系图)通常用于表示什么?A. 数据流B. 实体之间的关系C. 数据库模式D. 数据库结构24. 以下哪个选项是数据库事务的ACID特性之一?A. 原子性B. 一致性C. 隔离性D. 持久性25. 数据库索引的目的是什么?A. 加速查询速度B. 减少数据冗余C. 保证数据完整性D. 方便数据备份26. 在数据库系统中,什么是触发器?A. 一种数据库对象,用于执行特定的操作B. 一种数据库约束,用于限制用户操作C. 一种数据库触发器,用于自动执行某些操作D. 以上都不是27. 数据库备份策略通常包括哪些方面?A. 备份类型(全备、增量备份等)B. 备份频率C. 备份介质(磁带、光盘等)D. 备份数据的保留策略28. 在数据库性能优化中,如何提高查询响应时间?A. 添加合适的索引B. 改变数据库引擎C. 优化SQL查询语句D. 增加数据库硬件资源29. 数据库系统故障可能导致的数据丢失情况包括(多选)?A. 事务崩溃B. 磁盘损坏C. 网络问题D. 错误的数据库配置30. 在数据库设计中,什么是第一范式?它如何帮助简化数据库设计?A. 第一范式要求表中的每一列都是原子的,即不可分割的B. 第一范式要求表中的每一列都是唯一的C. 第一范式要求表中的每一行都是唯一的D. 第一范式要求表中的每一行都必须完全相同31. 什么是数据库索引?它有哪些优点?A. 提高查询性能B. 减少数据冗余C. 加速数据排序和分组D. 支持事务处理32. 数据库备份和恢复策略对于业务连续性至关重要。

《商务智能方法与技术》复习资料

《商务智能方法与技术》复习资料

商务智能方法与技术》课程复习资料、客观部分:(判断、不定项选择)一)、判断部分★ 考核知识点: 商务智能系统附1.1.1 (考核知识点解释):商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升各方面商务绩效,增强综合竞争力的智慧和能力。

商务智能不是通常的业务处理。

它的目标是如何更快、更容易地做更好的决卒策。

IBM商务智能解决方案远远不只是数据和技术的组合,BI帮助用户获得正确的数据,发现它的价值,并共享价值。

★ 考核知识点: 知识概念附1.1.2 (考核知识点解释):知识就是对信息进行的提炼、比较、挖掘、分析、概括、判断和推论。

知识分为事实性知识和经验知识。

事实性知识是人类对于客观事物和现象的认识结果。

经验知识多事一种隐性知识,是存储在人们大脑中的经历、经验、技巧、体会和感悟等尚未公开的知识。

隐性知识和显性知识之间是可以相互转化的。

★考核知识点: 元数据附1.1.3 (考核知识点解释):元数据管理包括对开发、管理数据仓库时所用的技术元数据和支持业务人员的业务元数据进行管理,它对数据仓库的设计和维护具有重要的作用。

数据仓库的所有数据都要通过元数据来管理和控制。

元数据描述关于源数据的说明,包括源数据的来源、源数据的名称、源数据的定义、源数据的创建时间等对源数据进行管理所需要的信息。

源数据的来源说明源数据是从哪个系统、哪个历史数据、哪个办公数据、哪个Web 页、哪个外部系统抽取而来。

源数据说明源数据在数据仓库的作用、用途、数据类型和长度等。

元数据:是用来描述数据的数据。

它描述和定位数据组件、它们的起源及它们在数据仓库进程中的活动;关于数据和操作的相关描述( 输入、计算和输出) 。

元数据可用文件存在元数据库中。

元数据反映数据仓库中的数据项是从哪个特定的数据源填充的,经过哪些转换、集成过程。

商务智能方法与应用试题和答案

商务智能方法与应用试题和答案

商务智能方法与应用试题和答案一、判断题:1、(对)OLAP的目标:是满足决策支持或多维环境特定的查询和报表需求2、(错)星型模型规范化数据,消除冗余,其业务层级和维度都将存储在数据模型之中。

3、(对)星型模型加载维度表,不需要再维度之间添加附属模型,ETL就相对简单,而且9、可以实现高度的并行化。

4、(对)雪花模型在维度表、事实表之间的连接很多,因此性能方面会比较低。

5、(对)雪花模型数据模型的业务层级是由一个不同维度表主键-外键的关系来代表的。

二、多选题。

1、(A、B、C、D)OLAP特性包括:A.快速性B.可分析性C.多维性D.信息性2、(AB)构造多维数据的方法有:A.超立方结构B.多立方结构C.平面结构3、(ABD)关于OLTP与OLAP的区别,说法正确的是:A.前者是细节性数据,后者是综合性和提炼性数据B.前者是当前值数据,后者是历史数据C.前者不可更新但周期性刷新,后者可更新D.前者一次处理的数据量小,后者一次处理的数据量大4、(ABCD)关于星型模型的说法中错误的是:A.规范化数据,消除冗余,其业务层级和维度都将存储在数据模型之中。

B.数据模型的业务层级是由一个不同维度表主键-外键的关系来代表的。

C.雪花模型在维度表、事实表之间的连接很多,因此性能方面会比较低。

D.雪花模型加载数据集市,ETL操作在设计上更加复杂,而且由于附属模型的限制,不能并行化。

5、(ABCD)关于雪花模型的说法中正确的是:A.规范化数据,消除冗余,其业务层级和维度都将存储在数据模型之中。

B.数据模型的业务层级是由一个不同维度表主键-外键的关系来代表的。

C.雪花模型在维度表、事实表之间的连接很多,因此性能方面会比较低。

D.雪花模型加载数据集市,ETL操作在设计上更加复杂,而且由于附属模型的限制,不能并行化。

三、单选题:1、(C)关于OLAP和数据挖掘的描述错误:A.OLAP是数据汇总/聚集工具,帮助简化数据分析B.数据挖掘要求能够自动的发现隐藏在海量数据中的有用信息和有价值的知识C.数据挖过程不包含数据描述和数据建模D.数据挖掘工具的目标是尽可能自动处理2、(B)关于OLTP的特性,说法错误的是:A.可更新B.一次处理的数据量大C.面向应用,事务驱动D.面向操作人员,支持日常操作3、(D)关于OLTP的特性,说法错误的是:A.不可更新,但周期性刷新B.一次处理的数据量大C.面向分析,分析驱动D.面向操作人员,支持日常操作8、(D)关于星型模型的特性,说法错误的是:A.反规范化数据,业务层级不会通过维度之间的参照完整性来部署。

商务智能题库整理

商务智能题库整理

商务智能题库整理商务智能--复习提纲⼀.选择题(第⼀次作业)1.数据仓库是随着时间变化的,下⾯的描述不正确的是AA.数据仓库随时间变化不断删去旧的数据内容B.捕捉到的新数据会覆盖原来的数据C.数据仓库随时间的变化不断增加新的数据内容D.数据仓库中包含⼤量的综合数据,这些综合数据会随着时间的变化不断地进⾏重新综合2. OLAP在辅助决策时,基于⽤户建⽴的⼀系列假设驱动,通过OLAP来证实或者推翻这些假设是个()的过程CA集成B转换C演绎D归纳3.不同操作型系统之间的数据⼀般是相互独⽴、异构的。

⽽数据仓库中的数据是对分散的数据进⾏抽取、清理、转换和汇总后得到的,这样就保证了数据仓库的数据关于整个企业的()DA时变性B⾮易失性C差异性D⼀致性4.如下图所⽰操作是OLAP分析的哪种操作( D )A切⽚B旋转C下钻D上钻5.数据⽴⽅体中的数据单元格是⼀个数值函数,该函数可以对数据⽴⽅体求值,如下哪个函数可以⽤来对数据⽴⽅体进⾏度量()CA.substring()B.rand()C.sum()D.trunc()6.关于数据仓库数据的时变性,如下描述不正确的是DA操作型系统存储的是当前数据,⽽数据仓库中的数据是历史数据B数据仓库中的数据是按照时间顺序追加的,它们都带有时间属性C数据仓库的数据时限⼀般要远远长于操作型数据的数据时限D数据仓库对响应时间要求不严格,处理时间从⼏秒到⼏分钟,有时甚⾄⼏⼩时7.数据仓库是⾯向主题的,逻辑意义上每⼀个商业主题都对应与企业决策包含的分析对象,⼀家保险公司的数据仓库的主题可能包含哪些BA顾客储蓄账B顾客、账户、索赔C顾客保险⾦额D顾客账单8.假如警察要得到某犯罪嫌疑⼈在指定时间段的通话记录最有可能在( C )系统中获得A决策⽀持系统B电信营业账务系统C电信数据仓库系统D元数据管理系统9.下⾯关于数据粒度的描述不正确的是BA数据综合度越⾼,粒度也就越⼤,级别也就越⾼B数据越详细,粒度就越⼩,级别也就越⾼C粒度是指数据仓库⼩数据单元的详细程度和级别D粒度的具体划分将直接影响数据仓库中的数据量以及查询质量10.数据仓库并⾮只是数据的简单累积,⽽是要经过⼀系列的处理过程,即ETL,ETL过程包括哪些CA数据操作、数据挖掘、数据转义B数据存储、数据维护、数据分析C数据抽取、数据转换、数据装载D数据定义、数据建模、数据管理11.企业要建⽴预测模型,需准备建模数据集,以下四条描述建模数据集正确的A A尽可能多的适合的数据B得分集数据是建模集数据的⼀部分C数据越多越好D以上三条都正确12.关于基本数据的元数据是指DA基本元数据与数据源、数据仓库、数据集市和应⽤程序等结构相关的信息B基本元数据包括⽇志⽂件和简历执⾏处理的时序调度信息C基本元数据包括与企业相关的管理⽅⾯的数据和信息D基本元数据包括关于装载和更新处理,分析处理以及管理⽅⾯的信息13.数据⽴⽅体中的数据单元格中的数据可以通过如下哪些函数获得?AA分布聚集函数count()、sum()、min()、max()和代数聚集函数avg()、stddev() B分析函数C分布聚集函数count()、sum()、min()、max()D聚集函数avg()、stddev()14.关于OLAP和OLTP的说法,下列不正确的是BA.OLTP以应⽤为核⼼,是应⽤驱动的B.OLAP事务量⼤,但事务内容⽐较简单且重复率⾼C.OLAP的最终数据来源与OLTP不⼀样D.OLTP⾯对的是决策⼈员和⾼层管理⼈员15.数据挖掘是通过()的⽅式在海量数据中主动找寻模型,⾃动发掘隐藏在数据中的价值信息,OLAP分析结果为挖掘提供分析依据。

《商务智能》考试复习内容-(含答案)

《商务智能》考试复习内容-(含答案)

《商务智能》考试复习内容-(含答案)闭卷考试,时间120分钟,五种题型:选择题(10分)、判断题(10分)、名词解释题(30分)、简答题(30分)、论述题(20分)第1章商务智能基本知识(1)商务智能的概念、价值、驱动⼒。

概念:商务智能是企业利⽤现代信息技术收集、管理和分析结构化和⾮结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策⽔平,采取有效的商务⾏动,完善各种商务流程,提升各⽅⾯商务绩效,增强综合竞争⼒的智慧和能⼒-王茁专著《三位⼀体的商务智能》.商务智能解决⽅案远远不只是数据和技术的组合,帮助⽤户获得正确的数据,发现它的价值,并共享价值。

价值:() .⽀持各级决策基于事实和商业管理的(科学)的预测当前和未来的业务情况下获得历史业务数据的智能分析。

恰当准确客观及时驱动⼒:在商务智能背后有⼀些商业驱动⼒,例如:增加收⼊,减少费⽤和更有效地竞争的需求。

管理和模拟当前商业环境复杂性的需求。

减少费⽤和利⽤已有公司业务信息的需求。

(2)商务智能系统的功能、主要⼯具。

功能:在商务智能背后有⼀些商业驱动⼒,例如:增加收⼊,减少费⽤和更有效地竞争的需求。

管理和模拟当前商业环境复杂性的需求。

减少费⽤和利⽤已有公司业务信息的需求。

主要⼯具:第2章商务智能核⼼技术(1)商务智能系统的架构如何?(2)什么是数据仓库?数据仓库⽤来保存从多个数据库或其它信息源选取的数据, 并为上层应⽤提供统⼀⽤户接⼝,完成数据查询和分析。

⽀持整个企业范围的主要业务来建⽴的,主要特点是,包含⼤量⾯向整个企业的综合信息及导出信息。

数据仓库是作为服务基础的分析型,⽤来存放⼤容量的只读数据,为制定决策提供所需要的信息。

数据仓库是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的、⾯向主题及不可更新的数据集合。

以1992年W H 出版《》为标志,数据仓库发展速度很快。

W H 被誉为数据仓库之⽗。

W H 对数据仓库所下的定义:数据仓库是⾯向主题的、集成的、稳定的、随时间变化的数据集合,⽤以⽀持管理决策的过程。

商务智能期末考试整理

商务智能期末考试整理

第一讲商务智能概述(综合论述题)1学习本课程的原因:现代管理需要基于计算机的方法让决策更有有效性企业需要有智能A:在分析型商务智能软件的帮助下,用户可以建立统一的企业数据仓库平台,并收集,访问,分析每个商业领域的数据,同时,数据库技术的进步,服务器性能的提升以与分析软件算法的优化,是的访问大型数据库处理海量信息变得更加容易便捷。

B:商务智能可以提供个性化服务,以满足不同用户的需求,智能搜索可以给决策者以很好的数据分析。

2与本专业的关联性: 信息技术迅速发展的今天,电子商务已在国民经济中显现出极其重要的作用。

伴随着服务形态在全球扩张,市场需求多样化,社会网络的广泛建立等社会经济巨大变革;数据量正以每年翻倍的速度扩增,然而数据源分散,异构数据库难以整合,数据接口复杂等问题严重,导致大量数据中真正能被利用来分析和运用的数据不足10%。

如何将数据有效转化为决策者所需要的信息,提升电子商务整体应用水平,已经成为政府,企业界和软件开发界关注的一个研究方向。

(BI发展趋势:绩效管理,产品模块的集成,结构化和非结构化数据,数据质量,预测分析,客户定制化。

)根据商务智能的主要技术,以与电子商务的移动,虚拟性,个性化,社会性等新型特征,把商务智能同电子商务基础性规律结合起来,完善商务节点的数据挖掘,抽取,转化集成和应用。

提升电子商务中的智能搜索,精度营销,比较购物,供应链、配送优化等现实需求。

描述商务智能融合技术在电子商务中的应用展望。

3商务智能在电子商务中的典型应用(1)数据挖掘的应用:挖掘主要是挖掘出有潜力价值数据的信息拘束,主要应用在情报分析,数据库营销,识别用户消费行为,客户流失分析,划分客户群体等相关应用。

(沃尔玛超市尿布与啤酒的销售)(2)智能搜索的应用:人们运用关键词进行搜索返还的结果信息之间缺乏有效的关联,不仅增加了用户筛选结果信息的时间,而且也为用户查找有效信息增加了复杂的。

更重要的是传统搜索系统基于信息共享平台设计,缺乏有效的权限管理策略和安全机制,无法有效的保证资讯信息合法使用。

《商务智能》复习题及答案

《商务智能》复习题及答案

《商务智能》复习题及答案《商务智能》复习题及答案1、把数据报表从一年展开成四个季度的操作是(C )A、上卷B、旋转C、下钻D、切片2、在多维数据集中,对某一个维度上的数据进行选择一维成员,其他维度没有变化的操作是( D)A、切块B、旋转C、下钻D、切片3、一个多维数组表示为:(维1,维2,维3,维4,变量),这是一个(B )维结构。

A、3B、4C、5D、64、一次购买行为的发起需要有:购买者、商家、商品、购买时间、供应商和订单金额。

如果设计星型模型,请问有几个维度(C )A、3B、4C、5D、65、在进行ETL时,应该在(C )里进行。

A、ODSB、数据仓库C、数据准备区6、(多选题)此大数据带来的变革有(ABD ).A、思维变革B、商业变革C、购物变革D、管理变革7、自然演化式体系结构的问题有(ACD )。

(多选)A、数据可信性B、无法进行数据处理C、生产率问题D、无法将数据转化为信息8、数据立方体是指(C ).A、三维数据集B、三维以上的数据集C、三维和三维以上的数据集D、四维数据集'9、戈登·未尔提出在今后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度,每(D )左右可以翻一番。

A、1个月B、6个月C、12个月D、18个月10、大数据时代的核心价值是(B)A.数据收集B.数据分析C.数据挖掘D.数据可视化11、大数据的来源包括( ABCD).A.互联网数据B.传感器数据D.探测数据11、好友的QQ突然发来一个网站链接要求投票,最合理的做法是( C)A.因为是其好反信总,直接打开使接投票B.不参与任何投票C.可能是好友aq被盗,可能是恶意筑接。

先通过予机跟朋友确认链技按无异常,考虑是否投票D.把好友加入黑名单12、关于大数据特点,错误的是(C )A、数据量大B、数据类型多C.数据价值密度高D.数据处理速度快13、Hadop是基于(B )语言的数据分析框架。

A. C++B. JavaC. RD. C#14.Maphedue的主导思想是(C )A.集成化B.一体化C.分而治之D.综合化15.下列与大数据密切相关的技术是(B)A.蓝牙B.云计算C.博穿论D.WiFi16.大数据的数据类型包括结构化数据、非结构化数据和(A ).A.半结构化数据B.无结构化数据C.关系数据库数D.文本数据和WEe数报17.数据仓库中的数据(ABCD )A.集成的B.可以变化的C.面向主题的D.不易丢失的18.数据仓库是随着时间变化的。

商业智能应用招聘试题

商业智能应用招聘试题

商业智能应用招聘试题随着信息技术的快速发展和商业竞争的加剧,越来越多的企业开始关注商业智能应用的发展,以提升企业决策的精确性和效率。

商业智能应用已成为许多企业追求竞争优势的重要手段。

然而,在商业智能领域寻找适合的人才却变得异常困难。

为此,我们制定了以下试题,以筛选并招聘到具备商业智能应用能力的人才。

一、数据分析与挖掘1. 什么是商业智能应用中的数据分析和挖掘?请描述其主要目的和方法。

2. 在数据分析过程中,如何选择适当的统计方法和模型?3. 商业智能应用中的数据清洗和预处理对于数据分析有何重要意义?请列举几个常用的数据清洗方法。

4. 请列举几个常用的数据挖掘算法,并简要介绍其原理和适用场景。

5. 商业智能应用中常用的数据可视化工具有哪些?请列举几个,并说明其特点和应用场景。

二、商业智能平台与工具1. 请介绍一种商业智能平台,包括该平台的主要功能和特点。

2. 商业智能应用中常用的数据仓库架构有哪些?请比较它们的优缺点。

3. 商业智能应用中的ETL过程是什么?请解释其含义并描述其主要步骤。

4. 商业智能应用中常用的报表工具有哪些?请列举几个,并说明其特点和应用场景。

5. 请描述一种商业智能应用中常见的数据挖掘流程,包括数据获取、数据预处理、特征选择、模型训练和评估等步骤。

三、商业智能应用案例请选择一个你熟悉的行业,描述下面两个商业智能应用案例:1. 基于商业智能应用的市场分析与竞争策略制定。

2. 基于商业智能应用的销售预测与需求管理。

请分别描述这两个案例的实施目标、数据分析方法和可行性评估等内容。

四、商业智能应用能力评估请简要回答以下问题,并解释你的回答:1. 你在商业智能应用领域的工作经验和技能有哪些?2. 你在商业智能应用中使用过哪些数据分析工具和编程语言?3. 你能够独立完成商业智能应用的数据挖掘和数据可视化任务吗?请举例说明。

4. 你了解商业智能应用中的常用数据统计方法和模型吗?请简要介绍你对其中一种方法或模型的理解和应用经验。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、数据库逻辑模型设计
2、OLAP操作
3、K-means算法
序号属性1 属性2
1 1 1
2 2 1
3 1 2
4 2 2
5 4 3
6 5 3
7 4 4
8 5 4
根据所给的数据通过对其实施k-means (设n=8,k=2),,其主要执行执行步骤:
第一次迭代:假定随机选择的两个对象,如序号1和序号3当作初始点,分别找到离两点最近的对象,并产生两个簇{1,2}和{3,4,5,6,7,8}。

对于产生的簇分别计算平均值,得到平均值点。

对于{1,2},平均值点为(1.5,1);对于{3,4,5,6,7,8},均值点为(3.5,3)。

第二次迭代:通过平均值调整对象的所在的簇,重新聚类,即将所有点按离平均值点(1.5,1)、(3.5,1)最近的原则重新分配。

得到两个新的簇:{1,2,3,4}和{5,6,7,8}。

重新计算簇平均值点,得到新的平均值点为(1.5,1.5)和(4.5,3.5)。

第三次迭代:将所有点按离平均值点(1.5,1.5)和(4.5,3.5)最近的原则重新分配,调整对象,簇仍然为{1,2,3,4}和{5,6,7,8},发现没有出现重新分配,而且准则函数收敛,程序结束。

迭代次数平均值平均值产生的新簇新平均值新平均值(簇1)(簇2)(簇1)(簇2)
1 (1,1)(1,2){1,2},{3,4,5,6,7,8} (1.5,1)(3.5,3)
2 (1.5,1)(3.5,3) {1,2,3,4},{5,6,7,8} (1.5,1.5)(4.5,3.5)
3 (1.5,1.5)(4.5,3.5){1,2,3,4},{5,6,7,8} (1.5,1.5)(4.5,3.5)
4、K-mode算法
k-modes算法不断更新modes,使得所有对象与其最近modes的相异度总和最小:首先计算每一簇在某一属性值的对象所占百分数。

然后,取每个簇中频率最大的一个属性值作为类模式Q。

分别对每个属性进行上述计算,最后得到类模式Q,即初始聚类中心。

k-modes算法与k-means的步骤类似:
①预先定义好k类,确定各个类的初始类模式Q。

②根据类模式Q把每个对象赋给最近邻的类,然后更新类模式Q。

③不断重复②,直到不再发生变化为止。

迭代次数平均值平均值产生的新簇新平均值新平均值(簇1)(簇2)(簇1)(簇2)
1 (1,1,1,1,2) (2,2,2,1,3){1,4,8}、{2,3,5,6,7} (1,1,1,1,1) (2,2,2,3,3)
2 (1,1,1,1,1) (2,2,2,3,3) {1,4,8}、{2,3,5,6,7} (1,1,1,1,1) (2,2,2,3,3)
5、K最近邻算法
姓名性别身高(米) 类别
Kristina 女 1.6 矮
Jim 男 2 高
Maggie 女 1.9 中等
Martha 女 1.88 中等
Stephanie 女 1.7 矮
Bob 男 1.85 中等
Kathy 女 1.6 矮
Dave 男 1.7 矮
Worth 男 2.2 高
Steven 男 2.1 高
Debbie 女 1.8 中等
Todd 男 1.95 中等
Kim 女 1.9 中等
Amy 女 1.8 中等
Wynette 女 1.75 中等
K=5,对<Pat,女,1.6>分类。

•对T前K=5个记录,N={<Kristina,女,1.6>、< Jim,男,2>、< Maggie,女,
1.9>、< Martha,女,1.88>和< Stephanie,女,1.7>}。

•对第6个记录d=< Bob,男,1.85>,得到N={<Kristina,女,1.6>、< Bob,男,
1.85>、< Maggie,女,1.9>、< Martha,女,1.88>和< Stephanie,女,1.7>}。

•对第7个记录d=< Kathy,女,1.6>,得到N={<Kristina,女,1.6>、< Bob,男,1.85>、< Kathy,女,1.6>、< Martha,女,1.88>和< Stephanie,女,1.7>}。

•对第8个记录d=< Dave,男,1.7>,得到N={<Kristina,女,1.6>、< Bob,男,1.85> 、< Kathy,女,1.6>、< Dave,男,1.7>和< Stephanie,女,1.7>}。

•对第9和10个记录,没变化。

•对第11个记录d=< Debbie,女,1.8>,得到N ={<Kristina,女,1.6>、< Debbie,女,1.8>、< Kathy,女,1.6>、< Dave,男,1.7>和< Stephanie,女,1.7>}。

•对第12到14个记录,没变化。

•对第15个记录d=< Wynette,女,1.75>,得到N ={<Kristina,女,1.6>,< Wynette,女,1.75> 、< Kathy,女,1.6>、< Dave,男,1.7>和< Stephanie,女,
1.7>}。

在这五项中,四个属于矮个、一个属于中等。

最终KNN方法认为Pat为矮个。

对于去年退税否 婚姻状况=婚姻中 可征税收入
(,,120K) X===
7、P(X|逃税=否) = P(去年退税=否|逃税=否)
⨯ P(婚姻中| 逃税=否)
⨯ P(收入=120K| 逃税=否)
= 4/7 ⨯ 4/7 ⨯ 0.0072 = 0.0024
8、P(X|逃税=是) = P(去年退税=否| 逃税=是)
⨯ P(婚姻中| 逃税=是)
⨯ P(收入=120K| 逃税=是)
= 1 ⨯ 0 ⨯ 1.2 ⨯ 10-9 = 0
9、因为:P(X|否)P(否) > P(X|是)P(是)
10、所以:P(否|X) > P(是|X)
=> 逃税= 否
11、Apriori算法
若项目集X的支持度大于或等于用户指定的最小支持度(minsupport),则项目集X称为频繁项目集(或大项目集),否则项目集X为非频繁项目集(或小项目集)。

若关联规则X->Y的支持度和置信度分别大于或等于用户指定的最小支持率minsupport和最小置信度minconfidence,则称关联规则X->Y为强关联规则,否则称关联规则X->Y为弱关联规则。

频繁项集的任何子集也一定是频繁的
对于A-->C:confidence = support({A 、C})/support({A})
经过计算有:
{3,5}->{2},置信度为:100%
{2,5}->{3},置信度为:66.7%
{2,3}->{5},置信度为:100%
假设最小置信度为80%,
{2,5}->{3}不是强关联规则,
则{2}->{3,5}和{5}->{2,3}也不是强关联规则。

{3}->{2,5}置信度为66.7%也不是
相同方法验证L2中每一个频繁项集对应关联规则是否是强关联规则。

{1}->{3} 100%
{3}->{1} 66.7%
{2}->{3}66.7%
{3}->{2}66.7%
{2}->{5}100%
{5}->{2}100%
{3}->{5}66.7%
{5}->{3}66.7%
所以强关联规则有{1}->{3} {2}->{5} {5}->{2} {3,5}->{2} {2,3}->{5}。

相关文档
最新文档