第十二章 数据仓库与数据挖掘的发展
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
传统决策支持系统是以模型和知识为决策 资源,通过模型的计算和知识推理为实际决策 问题辅助决策。
新决策支持系统与传统决策支持系统在本 质上是不一样的,也就是说不能用新决策支持 系统来代替传统决策支持系统。为了更有效地 辅助决策,应该将新决策支持系统和传统决策 支持系统结合起来。
3. 综合决策支持系统结构
12.2.1 可拓学基本原理
可拓学的理论和方法,具体来说就是通 过可拓变换与可拓知识来改变问题的目 的或条件,去解决矛盾问题。可拓学是 我国学者蔡文教授提出的原创性理论和 方法。
可拓学的详细内容参见《可拓逻辑初步》 等书。
1.可拓学的基础信息
可拓学将客观世界的物、事、关系表示为物元、
事元、关系元,把它们统称为基元,它们是可拓学的
1. 新决策支持系统与传统决策支持系统的比较
(1)新决策支持系统中数据挖掘获取的知识与传统决策 支持系统的知识推理中的知识是不相同的。
(2)新决策支持系统中没有充分利用模型和模型组合来 辅助决策。
(3)决策支持系统的技术还没有完全成熟。 传统决策支持系统和新决策支持系统结合起来,
一方面可以相互促进、互相结合,对已成熟的技术可 以先结合起来,逐步扩展到后成熟的技术。
12.1.1 从管理科学到决策支持系统
2. 决策支持系统 管理科学与运筹学是运用模型辅助决策,
体现在单模型辅助决策上,模型所需要的数据 在计算机中以文件形式存储。
对多模型辅助决策问题,在决策支持系统 出现之前是靠人来实现模型间的联合和协调。
决策支持系统的出现是要解决由计算机自 动组织和协调多模型的运行和数据库中大量数 据的存取和处理,达到更高层次的辅助决策能 力。
决策支持系统的综合部件(问题综
合与交互系统)是由网络上的客户机来 完成,即在客户机上编制DSS控制程序, 由它来调用或者组合模型服务器上的模 型,完成模型计算;知识服务器上的知 识,完成知识推理以及数据仓库的综合 信息查询,或用历史数据进行预测。这 样,就形成了网络环境的综合决策支持 系统。
网络环境的综合决策支持系统结构
知识推理是建立从初始概念到中间概念, 最后到目标概念的推理链。
知识部件由知识库、知识库管理系统和推 理机三者组成。
智能决策支持系统结构
用户 问题综合与交互系统
模型库管理系统
数据库管理系统
知识库 管理系统
推理机
模型库
知识库
数据库
智能决策支持系统的特点是以 模型计算和知识推理的方式辅助决 策。我们称它为传统决策支持系统。
2. 新决策支持系统与传统决策支持系统的结合
将传统决策支持系统和新决策支持系统结 合起来的决策支持系统称为综合决策支持系统 (SDSS) 。
数据仓库与联机分析处理和数据挖掘三者 结合起来辅助决策能力有极大的提高,它们应 用于实际决策问题而形成的决策支持系统是一 种新型决策支持系统。
2. 新决策支持系统与传统决策支持系统的结合
2.网络环境的综合决策支持系统
网络上的数据库服务器,使数据库系统从单一的 本地服务上升为网络上的远程服务,而且能对远地 多个用户的不同客户机,同时并发的提供服务。
数据仓库也是以服务器形式在网络上提供共享、 并发服务。
数据库和数据仓库都是数据资源。同样,将模型 资源和知识资源也以服务器的形式在网络上为远地 的客户机提供并发和共享的模型服务和知识服务。
数据仓库与联机分析处理和数据挖掘三者 结合起来辅助决策能力有极大的提高,它们应 用于实际决策问题而形成的决策支持系统是一 种新型决策支持系统。
新决策支持系统的典型特点是从数据 中获取辅助决策信息和知识。它们以数 据仓库中的大量数据为对象,数据仓库 本身能提供综合信息和预测信息;联机 分析处理提供多维数据分析信息;数据 挖掘提供所获取信息和知识,共同为实 际决策问题辅助决策。
3. 智能决策支持系统 智能决策支持系统(IDSS)是决策支持
系统(DSS)与人工智能(AI)技术相结合的 系统。
人工智能技术融入决策支持系统后,使 DSS在模型技术与数据处理技术的基础上,增 加了知识推理技术, 使DSS的定量分析和AI的 定性分析结合起来,提高辅助决策和支持决策 的能力。
在决策支持系统中加入知识部件(知识库、 知识库管理系统与推理机)后,形成了智能决 策支持系统。
把数据仓库(DW)、联机分析处理 (OLAP)、数据挖掘(DM)、模型库 (MB)、数据库(DB)、知识库(KB)结 合起来形成的综合决策支持系统是更高级形式 的决策支持系统。
它们集成的综合决策支持系统(SDSS), 将相互补充和依赖,发挥各自的辅助决策优势, 实现更有效的辅助决策。
3. 综合决策支持系统结构
u1 u2 u3 u4
打
支配对象 施动对象
时间 地点
球 小明 下午 球场
1.可拓学的基础信息
(3)关系元
关系元表示为:是关系s、特征A及量值W的三元组。
s Q (s, A,W )
a1 a2 a3 a4
w1 w2 w3 w4
借贷
前项 后项 程度 维系方式
蕴涵式: 可扩式:
→ (N1, c1, v1)
(N2 ,c2 ,v2 )
∧ (N1, c1, v1)
(N2 ,c2 ,v2 )
可拓学的传导原理表示为变换蕴含式,它 是变化的知识:
简写为:
Tu Tv
5. 关联函数
可拓学引入关联函数将矛盾问题进行量化处理,称 它为量化知识。关联函数公式:
其中
Tu v
可拓变换T包括:置换、增加、删减、扩大、 缩小等。
置换变换: T( A ) A'
增加变换: T( A ) A A1
删减变换:
T( A ) A A1
扩缩变换: T( A) A
3.可拓信息
可拓信息是解决矛盾问题的信息。可拓学的基 元(物元、事元、关系元)是可拓信息的基础 信息。可拓学的变换是变化信息,通过变换才 能变矛盾问题为不矛盾问题。
1.管理科学 管理科学(MS)的传统名字叫运筹学(OR) 。
管理科学是对管理问题用定量分析方法,建立数 学模型,通过求解计算,达到辅助管理决策的一门学 科。
管理科学是用数学模型方法研究经济、国防等部 门在环境的约束条件下,合理调配人力、物力、财力 等资源,通过模型的有效运算,来预测发展趋势,制 定行动规划或优选可行方案。
可拓信息=基元(基础信息)+可拓变换(变化信息)
4.可拓学的基础知识
可拓学的基础知识为拓展式,包括:发 散式、相关式、可扩式、蕴含式等。
发散式: ┫ ,
(N1, c1, v1 )
(N1, c1 , vi )
i 1,2,3 n
相关式: ∽
(N1, c1, v1 )
(N2 ,c2 ,v2 )
将传统决策支持系统和新决策支持系统结 合起来的决策支持系统称为综合决策支持系统 (SDSS) 。
数据仓库与联机分析处理和数据挖掘三者 结合起来辅助决策能力有极大的提高,它们应 用于实际决策问题而形成的决策支持系统是一 种新型决策支持系统。
2. 新决策支持系统与传统决策支持系统的结合
将传统决策支持系统和新决策支持系统结 合起来的决策支持系统称为综合决策支持系统 (SDSS) 。
基础信息。
(1)物元 物元表示为:是物N、特征c及取值v的三元组。
N c1 v1 工件 长度 30cm
R
(N, c, v)
wk.baidu.com
c2
v2
直径
6cm
c3 v3
重量 2kg
1.可拓学的基础信息
(2)事元
事元表示为:是动词d、特征b及取值u的三元组。
d I (d,b,u)
b1 b2 b3 b4
综合决策支持系统的三个主体
(1)模型库系统和数据库系统结合的主体。该主体完成 多模型的组合与大量共享数据的处理,是利用模型资 源辅助决策的;
(2)数据仓库系统与联机分析处理(OLAP)结合的主 体。该主体完成对数据仓库中数据的综合、预测和多 维数据分析,是利用数据资源辅助决策的;
(3)知识库系统(知识库、推理机和知识库管理系统) 与数据挖掘结合的主体。该主体完成知识推理,是利 用知识资源辅助决策的。
我们把基于数据仓库的决策支持系统称为新决策支 持系统 。
基于数据仓库的决策支持系统结构
决策用户
数据挖掘 数据库
决策信息 知识 综合信息 分析信息
联机分析处理
综合数据 基本数据 历史数据
元数据 数据仓库
1. 新决策支持系统与传统决策支持系统的比较
新决策支持系统和传统决策支持系统 几乎没有什么共同之处,它们是从不同 的角度发展起来,辅助决策的方式也不 相同。由于两者不是覆盖关系,也就不 存在相互代替的问题,而是相互补充和 相互结合的问题。
公司A 银行B 100万元 合同
2.可拓变换
解决矛盾问题的工具是可拓变换。通过可拓变换,使 求知问题中不可知问题变为可知问题,使求行问题中 不可行问题转化为可行问题,使假命题变为真命题, 即通过可拓变换变矛盾问题为不矛盾问题。
可拓变换是把一个对象变为另一个对象,即可拓变换T 将基元u变成基元v,表示为:
12.1.2 基于数据仓库的决策支持系 统与传统决策支持系统的结合
数据仓库是为辅助决策而建立的。数据仓库所提供 的辅助决策信息是大量数据的综合信息与预测信息。
数据仓库(DW)和联机分析处理(OLAP)及数据 挖掘(DM)结合的决策支持系统,是以数据仓库为基 础的,我们称为基于数据仓库的决策支持系统。
可拓知识=拓展式(基础知识) +变换蕴含式(变 化知识) +关联函数(量化知识)
12.2.2 从数据挖掘到可拓数据挖掘
第12章
数据仓库与数据挖掘的发展
目录
12.1 综合决策支持系统 12.2 可拓数据挖掘
12.1 综合决策支持系统
12.1.1 从管理科学到决策支持系统
12.1.2 基于数据仓库的决策支持系统与 传统决策支持系统的结合
12.1.3 综合决策支持系统发展趋势
12.1.1 从管理科学到决策支持系统
k(x) = (x, X0)
D(x, X0, X )
X0=<a,b>,k(x)>0 是正域区间,即量变区间, X=<c,d>,k(x)<0 是负域区间,即质变区间。
6. 可拓知识
可拓学的拓展式是可拓知识的基础知识; 可拓学的传导原理的变换蕴含式是变化知识。 可拓学引入关联函数将矛盾问题进行量化处理, 称它为量化知识。 它们共同构成了可拓知识
决策支持系统的特点就是增加了模 型库和模型库管理系统,它把众多的模 型有效地组织和存储起来,并且建立了 模型库和数据库的有机结合。这种有机 结合适应人机交互功能,自然促使新型 系统的出现,即决策支持系统的出现。
决策支持系统结构
用户
人机交互及问题综合系统 (综合部件)
模型库管理系统
数据库管理系统
模型库
12.1.1 从管理科学到决策支持系统
2. 决策支持系统 管理科学与运筹学是运用模型辅助决策,
体现在单模型辅助决策上,模型所需要的数据 在计算机中以文件形式存储。
对多模型辅助决策问题,在决策支持系统 出现之前是靠人来实现模型间的联合和协调。
决策支持系统(DSS)的出现是要解决由 计算机自动组织和协调多模型的运行和数据库 中大量数据的存取和处理,达到更高层次的辅 助决策能力。
数据库
多模型组合的自动运行为改变方案中的模 型和数据带来了方便。在系统方案中采用不同 的模型或数据的组合将形成不同的方案,故决 策支持系统为解决半结构化问题(部分由计算 机完成,部分由人来完成的问题)成为可能。
DSS语言应是两类语言(数值计算语言和 数据库语言)的综合。
12.1.1 从管理科学到决策支持系统
客户i
客户j
客户k
网络 环境
数据库服务器
(DBS)
数据仓库服务 (DWS)
模型服务器 (MS)
知识服务器 (KS)
联机分析与数据挖掘服务器 (ODS)
12.2 可拓数据挖掘
12.2.1 可拓学基本原理 12.2.2 从数据挖掘到可拓数据挖掘 12.2.3 可拓数据挖掘理论 12.2.4 可拓数据挖掘实例
12.1.3 综合决策支持系统发展趋势
1. 综合决策支持系统的兴起 数据仓库提供综合信息和预测信息辅
助决策,未明确提出利用模型的问题。
现在,数据仓库在逐步增加各种模型, 来提高辅助决策效果。即:数据仓库和 模型库结合。
以客户为中心的银行数据仓库使用模型:
1. 分销渠道的分析模型 2. 客户利润贡献度模型 3. 客户关系(信用)优化模型 4. 风险评估模型