基于数据挖掘的决策支持系统

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于数据挖掘的决策支持系统

学号:2009370185 姓名:吴萌摘要:近年来,数据挖掘技术在市场分析预测、客户分析预测方面得到了广泛的应用,本文首先介绍了数据挖掘的定义、目的、一般过程及与此相关的一些技术。然后论述了决策支持系统的定义及发展层次,最后阐述了如何搭建一个基于数据挖掘的决策支持系统。

1、数据挖掘

1.1数据挖掘概述

数据挖掘是从大型数据库或数据仓库中发现并提取隐藏在其中的信息或知识的过程,即从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中具有潜在利用价值的信息和知识的过程。其目的是帮助分析人员寻找数据间潜在的关联,发现忽略的要素,而这些信息对预测趋势和决策行为是十分有用的。所以它属于决策支持系统的范畴。数据挖掘的一般过程如图1所示。

1.2数据挖掘的任务

根据发现知识的不同,数据的任务可以分为以下几类:

①关联规则分析:其目的是发现隐藏在数据间的相互关系。这就是数据挖掘中比较成熟的问题。②特征规则分析:从数据中提取出关于这些数据的特征式,用以表达该数据集的总体特征。区分规则分析发现或提取数据的某些特征,使之与对比数据区分开来。③分类分析:先为每个记录赋予一个标记,即按标记分类记录,然后检测这些标记的纪录,描述出这些记录的特征。④聚类分析:从数据中得出一组聚类规则,将数据分成若干类。⑤预测:通过对数据的分析处理,估计一组数据中某些丢失数据的可能值或数据集合中某些属性值的分布情况。⑥变化和偏差分析:探测现有数据与历史纪录或标准之间的显著变化和偏离,从而获得有用的知识。

1.3数据挖掘的特点及分类

数据挖掘的特点:①处理的数据规模十分巨大,一般为GB级,甚至TB级;②由于用户不能形成精确的查询要求,因此需要靠数据挖掘技术来寻找其可能感兴趣的东西;③在某些应用中,要求数据挖掘对数据的迅速变化做出迅速响应,以提供决策支持信息。数据挖掘既要发现潜在规则,还要管理和维护规则。而规则是动态的,当前的规则只能反映当前状态的数据特征,随着数据的不断加入,规则需要随之更新;④数据挖掘中规则的发现基于统计规律,发现的规则不必适合

于所有数据,而且当达到某一阙值时,便认为有此规则。因此,利用数据挖掘技术可能会发现大量规则。

1.4数据挖掘的方法和常用技术

数据挖掘需要其他多种技术的支持,才能挖掘出令用户满意的结果。具体来说,有以下几种主要的数据挖掘方法。

决策树方法:利用树形结构来表示决策集合,这些决策集合通过对数据集的分类产生规则。

规则归类法:通过统计方法归纳、提取有价值的f-then规则。

神经网络方法:从结构上模拟生物神经网络,以模型和学习规则为基础,建立三大类多种神经网络模型:前馈式网络、反馈式网络、自组织网络。

遗传算法:模拟生物进化过程的算法,由繁殖(选择)、交叉(重组)、变异(突变)三个基本算子组成。为了应用遗传算法,需要将数据挖掘任务表达为一种搜索问题,从而发挥遗传算法的优化搜索能力。

K最邻近技术:这种技术通过K个最与之相近的历史记录的组合来辨别新的纪录。它可以作为聚类、偏差分析等挖掘任务。

可视化技术:将信息模式、数据的关联或趋势等以直观的图形方式表示,决策者可以通过可视化技术交互地分析数据关系可视化数据分析拓宽了传统的图表功能,使用户对数据的剖析更清楚。

2、决策支持系统

2.1决策支持系统概述

决策支持系统(DSS)就是能够利用数据和模型来帮助决策者解决非结构问题的高度灵活的、人机交互的计算机信息系统,是专门为高层管理人员服务的一种信息系统。

2.2 决策支持系统的体系结构

DSS的概念结构由会话系统、控制系统、运行及操作系统、数据库系统、模型库系统、规则库系统和用户共同构成。最简单和实用的三库DSS逻辑结构如图2所示。

2.3 基于数据仓库的决策支持系统体系结构

将数据仓库和OLAP技术、DM技术引入DSS,提出基于数据仓库的DSS体系结构框,系统主要由三部分组成,第一部分是模型库、方法库、知识库和数据仓库及相应的管理系统;第二部分是OLAP和DM单元。第三部分是问题综合处理单元,其结构框如图3所示。

2.4 DSS的分析方法

DSS应满足决策支持系统的要求和达到DSS的性能指标,由于DSS 的特殊性,对DSS的系统分析通常采用一种基于决策过程基本活动的方法,是决策者进行表达(R)、操作(O)、存储辅助(M)和控制(C)的方法,其基本思路是建立起的要求与性能之间的关系,并力求减少它们之间的差异。ROMC分析方法正式建立在用户目标的基础上的,它主要从以下几点进行分析。

1>表达(Representation):提供表达式以帮助决策者将问题概念化,以便于处理和交流;

2>操作(Operation):提供这些表达式进行分析和运算的某些操作方法;

3>存储辅助(Memory aid):表达与加工的存储支持;

4>控制机制(Control mechanism):提供处理和使用整体系统的控制

机制。

首先识别的决策支持过程的基本活动,其次分析每一基本活动的组成部分:表达(R)、操作(O)、存储辅助(M)和控制(C),然后集成这些部分建立一个专用DSS。在交付使用时,设计者将继续沿着这四个方面的追踪系统和用户,不断地扩展和修改基本部件,直到用户最终满意为止。

3 、基于数据挖掘的决策支持系统的建立

3.1 在决策支持系统中应用数据挖掘技术

数据挖掘是指从大量数据中发现潜在的、有价值的及未知的关系、模式和趋势,并以易被理解的方式表示出来。在DSS中通过进行数据挖掘用以发现数据之间的复杂联系对决策的影响。在数据仓库基础上挖掘的知识通常以图表、可视化、类自然语言等形式表示出来,但挖掘的知识并不都是有意义的,必须进行评价、筛选和验证,把有意义的知识放到知识库中,随着时间的推移将积累更多的知识,知识库中的知识包括总结性知识、关联性知识、分类模型知识等等,这些知识通过相应挖掘算法得到,常用的挖掘技术和方法包括:决策树方法、神经网络方法、粗糙集方法、遗传算法、模糊论方法、统计分析方法、概念树方法、公示发现等。

3.2 决策支持系统的发展—基于数据仓库的决策支持系统

数据仓库是支持管理决策过程的、面向主题的、集成的、稳定的、不同时间的数据集合。主题是数据归类的标准,每个主题对应一个客观分析领域,它可为辅助决策集成多个部门不同系统的大量数据。数

相关文档
最新文档