粗糙集属性决策表约简算法研究

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

粗糙集属性决策表约简算法研究

薛楠,刘守荣

中国农业大学工学院,北京(100083)

E-mail :xue_nan@

摘 要:本论文通过对无决策属性的粗糙集决策表的研究,按照粗糙集最小决策算法的原则,提出一种新的核属性算法和最小决策算法。实验验证,基于以上两种算法开发出的程序简单易懂,并且源代码少,能广泛适用于所有无决策属性的粗糙集决策表模型分析。

关键词:粗糙集;决策属性表;核属性算法;最小决策算法

中图分类号:TP301

0. 引言

粗糙集理论是一种新的处理模糊和不确定性知识的数学工具,其主要思想就是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。目前粗糙集理论已被成功的应用于机器学习、决策分析、过程控制、模式识别与数据挖掘等领域。[1][2]现实中经常遇到含有大量信息的决策表,人工计算耗时耗力。本文通过对粗糙集核属性和最小决策算法的公式的研究,提出一种新的核属性算法和最小决策算法。通过编程验证,该算法能够更简捷明了的计算核属性并得出最小决策表,能够广泛适用于所有无条件属性和决策属性的粗糙集决策表模型分析。

1. 粗糙集核属性算法

1.1 粗糙集基本理论

定理1设U ≠∅是我们感兴趣的对象组成的有限集合,称为论域。任何子集X U ⊆称

为U 中的一个概念和范畴。U 上的一族划分成为关于U 的一个知识库(knowledge base )

。 定理2设R 是U 上的一个等价关系,U /R 表示R 的所有等价类(或者U 上的分类)构成的集合,[]R x 表示包含元素x U ∈的R 等价类。一个知识库就是一个关系系统

(,)K U R =,其中设U ≠∅是非空有限集合,称为论域,R 是U 上的一个等价关系。[3]

定理3若P R ⊆,且P ≠∅,则P ∩(P 中所有等价关系的交集)也是一个等价关系,称为P 上的不可区分(indiscernibility)关系,记为ind(P ),且有:

[][]()ind P R R P

x x ∈=∩

1.2 知识约简

知识约简是粗糙集理论的核心内容之一。知识库中的知识(属性)并不是同等重要的,甚至其中某些知识是冗余的。知识约简就是在保持知识库分类能力不变的条件下,删除其中

不想管或不重要的知识。[4]知识约简中有两个基本概念:约简(reduct )和核(core )

。 定理1令R 为一族等价关系,R R ∈,如果ind(R )=ind(R -{R}),则称R 为R 中不必要的;

否则称R 为R 中必要的;

如果每一个R R ∈都为R 中必要的,则称为R 为独立的;否则称R 为依赖的。

定理2设Q P ⊆。如果Q 是独立的,且ind(Q )=ind(P ),则称Q 为P 的一个约简。P 中所有必要关系组成的集合称为P 的核。记做core (P ).

1.3 决策表

知识表达系统称为信息系统,通常用(,)S U A =来表达,其中U 为对象的非空有限集合,称为论域;A 为属性的非空有限集合。

决策表示一种特殊的知识表达系统。决策确定规则定义如下:

:()()ij i j r des X des Y →,j i Y X ∩≠∅,

规则的确定性因子(,)||/||,0(,)i j j i i i j X Y Y X X X Y µµ=∩<≤1。

当(,)i j X Y µ=1时,ij r 是确定的;当0(,)1i j X Y µ<<时,ij r 是不确定的。

1.4 粗糙集核属性算法研究

设(,)U A 是一个信息系统,12||{,,}U U u u u = 。使用指针i 指向当前的输入对象i u ;s 纪录已经找到的s 个类12,,,s V V V ;j 取值1,2,,s ,用来检验当前的输入对象i u 是否有()()j i a V a u =。

图1给出了核属性算法流程框图。

图1 核属性算法流程框图

Fig.1 Process diagram of core attribute algorithm

应用该算法通过并行方式可以计算信息系统(,)U A 的核属性。对应核属性集合CORE(A), 应用最小决策算法可以计算决策表最小决策表。

2. 最小决策算法

设CORE(A)为信息系统的核属性集合,[],R ()U CO E A 是指包含核属性的信息系统。设X d 所有过剩条件属性值的决策规则,条件属性集C 的等价类[]c x 中任何最少属性a 的等价

类[]a x 的交集⊆相应的决策类[]D x 中,

则由此得到的最小条件属性a 组成的相应于X d 的新决策规则'x d 是X d 的一个决策规则约简。

图2给出了最小决策算法流程框图。

图2 最小决策算法流程框图

Fig.2 Process diagram of minimum decision algorithm

3. 结论

以上两种算法可以通过多种编程工具实现,可以实现所有无决策属性的粗糙集决策表模型分析。对于包含条件属性和决策属性的决策表,也能相应的进行核属性运算和最小决策属性运算。通过C#和Visual C++等编程工具实现算法,具有程序简洁明了,源代码少,易于运算等优点。

参考文献

[1]张文修.粗糙集理论与方法.北京:科学出版社,2003

[2]Pawlak Z. Rough sets and Fuzzy sets. Fuzzy sets and Systems.17(1895):99-102

[3] Pawlak Z .Rough Set Communications of the ACM,38(1995):89-95

[4]刘清.Rough Set及Rough推理.北京:科学出版社,2001

The study on the algorithm of reduction of decision attribute

system of the rough set

Xue Nan, Liu Shourong

College of Engineering ,China Agricultural University, Beijing (100083)

Abstract

This paper discussed the rough set system without the decision attribute. According to the principle of the minimum decision algorithm of the rough set, a new core attribute algorithm and minimum algorithm were proposed. The program based on the new algorithm has less source code and the validity and feasibility of the program was demonstrated by the experiments. The program can be suitable for all the models of the rough set system without the decision attribute.

Keywords:rough set; decision attribute system; core attribute algorithm; minimum decision algorithm

相关文档
最新文档