基于变精度粗糙集理论的知识约简方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

 2004年1月系统工程理论与实践第1期 文章编号:100026788(2004)0120076207

基于变精度粗糙集理论的知识约简方法

米据生1,2,吴伟志1,张文修1

(1.西安交通大学理学院信息与系统科学研究所,陕西西安710049;2.河北师范大学数学与信息科学学院,河北石家庄050016)

摘要: 基于变精度粗糙集理论与包含度理论,引入了不协调目标信息系统的上、下分布约简的概念,并

讨论了它们之间的关系.上(下)分布约简是保持每个决策类的上(下)近似不变的最小属性集,由约简系

统产生的命题规则与由原系统产生的命题规则是相容的,即约简不会改变由对象所产生的规则的决策

结果.通过对这两种知识约简的等价刻画,得到了上、下分布知识约简的判定定理和可辨识属性矩阵,

从而提供了不协调目标信息系统知识约简的新方法.

关键词: 变精度粗糙集;知识约简;信息系统;协调集

中图分类号: T P18 文献标识码: A

Know ledge R educts Based on V ariab le P recisi on Rough Set T heo ry M I J u2sheng1,2,W U W ei2zh i1,ZHAN G W en2x iu1

(1.In stitu te fo r Info rm ati on and System Sciences,Facu lty of Science,X i’an J iao tong U n iversity,X i’an710049,Ch ina;2. Co llege of M athem ath is and Info rm ati on Science,H ebei N o rm al U n iversity,Sh ijiazhuang050016,Ch ina)

Abstract: T he m ain ob jective of the paper is to in troduce som e new concep ts of know ledge reducti on

based on variab le p recisi on rough set theo ry such as upper distribu ti on reducti on and low er distribu ti on

reducti on.T he decisi on ru les derived from the distribu ti on con sisten t set are compatib le w ith the ones

derived from o riginal system.T heir equ ivalen t defin iti on s are studied.T he relati on sh i p s among alterna2

tive reducts in incon sisten t info rm ati on system s are discu ssed.T he judgem en t theo rem s and discern ib ili2

ty m atrixes w ith respect to upper and low er reducti on s are ob tained.So one can calcu lates the reducts

by the discern ib ility fo rm u las.T hese resu lts are m ean ingfu l bo th in the theo ry and in app licati on s.

Key words: variab le p recisi on rough set;info rm ati on system;know ledge reducti on;con sisten t set

知识发现是人工智能的核心问题之一,它是从信息系统中识别正确、新颖、有潜在应用价值并最终可为人们所理解的模式的方法.粗糙集理论提供了知识发现的一种数学方法.由于这一理论的广泛应用,它越来越引起国际学术界的关注.

知识约简是知识发现的重要课题,因而也是粗糙集理论的核心问题之一.目前,信息系统的知识约简大多是在Paw lak粗糙集模型下进行的[1-7].Paw lak粗糙集模型的一个局限性是它所处理的分类必须是完全正确的或肯定的,因而它的分类是精确的,亦即只考虑完全“包含”与“不包含”,而没有某种程度上的“包含”与“属于”.Paw lak粗糙集模型的另一个局限性是它所处理的对象是已知的,且从模型中得到的结论仅适用于这些对象.但在实际应用中,往往需要把从小规模对象集中得到的结论应用于大规模对象集上去.Paw lak粗糙集模型的这些局限性限制了它的应用.近年来,许多学者从多方面推广了这一模型. Ziarko于1993年提出了变精度粗糙集模型.在这个模型中,给定一个阈值,当对象所在的等价类在某种程度上包含于集合X中时,就认为这个对象属于X.这一推广在应用上是非常重要的,因为在实际问题

收稿日期:2002211218

资助项目:国家自然科学基金(10271039);973项目(2002CB312206)

作者简介:张文修(1940-),男,教授,博士生导师,中国数学会常务理事.研究方向:应用概率论,人工智能的数学基础等;米据生(1966-),男,副教授,博士生.研究方向:人工智能的数学基础,粗糙集与随机集;吴伟志(1964-),男,副教授,博士生.研究方向:人工智能的数学基础,粗糙集与随机集

中绝对的包含有时是不必要的.基于变精度粗糙集理论,文[8-11]给出并研究了不协调信息系统的Β下近似约简.Β下近似约简保持有决策的对象总数不变,但所产生的决策规则与原信息系统产生的规则有可能冲突.因此,这种约简定义不太适合实际需要,并且也没有文献从理论上给出这种知识约简的具体操作方法.为此,在文[12]中,我们利用可辨识属性矩阵给出并研究了不协调目标信息系统的几种知识约简方法.

本文提出变精度粗糙集模型上两种知识约简的新概念,即Β上、下分布约简.它们分别是保持每个决策类的Β上、下近似不变的属性集,并且与全部属性集A 产生相容的命题规则.同时给出了Β上分布约简与Β下分布约简的判定定理和相应的可辨识属性矩阵,从而得到了变精度粗糙集模型上知识约简的新方法.这为不协调目标信息系统的知识约简提供了理论依据与算法.

1 变精度粗糙集模型

变精度粗糙集模型[8]是Paw lak 粗糙集模型[1]的推广.先给出有关概念和术语.

定义1.1 设(U ,A ∪D ,f )是目标信息系统,其中,U 是有限对象集合,U ={x 1,…,x n };A 是有限条件属性集,A ={a 1,…,a p };D 是有限目标属性集,D ={d 1,…,d q },A ∩D = .f 是描述,f :U ×(A ∪

B )→V ,V =∪c ∈A ∪D

V c ,V c 是c 的有限值域

.对于任意B ΑA ∪D ,记

R B ={(x ,y ):f (x ,c )=f (y ,c ),c ∈B }

则R B 是U 上的等价关系,称为由B 决定的不可区分关系.它产生的上的U 分划记为:U R B ={[x ]B :x ∈U }

其中[x ]B ={y :(x ,y )∈R B }是x 关于B 的等价类.ΠX ΑU ,记

R B (X )={x ∈U :[x ]B ΑX }=∪{[x ]B :[x ]B ΑX }

R B (X )={x ∈U :[x ]B ∩X ≠ }=∪{[x ]B :[x ]B ∩X ≠ }

则R B (X )与R B (X )分别称为x 关于B 的下近似和上近似.X 的下近似是按着知识B 肯定属于X 的对象全体,而上近似是按着知识B 可能属于X 的对象全体.显然

R B ΑX ΑR B (X ),R B (X )ΑR B ∪{a }(X ), R B (X )ΒR B ∪{a }(X )这说明:增加属性会减少对象是否属于X 的不确定程度.称(U ,R A ,R A ,R A )为Paw lak 粗糙集模型.

对Β∈(0.5,1],记

R Β

B (X )={x ∈U :D (X [x ]B )ΕΒ}=∪{[x ]B :D (X [x ]B )ΕΒ}R Β

B (X )={x ∈U :D (X [x ]B )>1-

Β}=∪{[x ]B :D (X [x ]B )>1-Β}则分别称R ΒB (X )与R ΒB (X )为X 关于B 的Β下近似和Β上近似.称(U ,R A ,R ΒB ,R ΒB

)(B ΑA )为变精度粗糙集模型[8].其中D 为U 的幂集P (U )={X :X ΑU }上的包含度.为方便起见,本文中取D (X Y )= X ∩Y

Y

,若 Y ≠0;D (X Y )=1,若 Y =0.其中 Y 表示Y 中的元素个数.则D (X Y )+D (X c

Y )= X ∩Y Y

=1

这时R ΒB (X )与R ΒB (X )满足对偶性质:R ΒB (X )=~R ΒB (~X ).

当Β=1时,R ΒB

(X )=R B (X )且R Β

B (X )=R B (X ).因此,变精度粗糙集模型是Paw lak 粗糙集模型的推广.

为叙述简单,以下设D ={d },V d ={1,2,…,r },D j ={x ∈U ,f (d ,x )=j }.则U R D ={[x ]D :x ∈U }

={D 1,…,D r }.容易证明[8],R ΒB 与R Β

B 具有以下性质:

1)R ΒB

(D i )∩R ΒB (D j )= ,(i ≠j );2)∪r

j =1R ΒB

(D j )Α∪r

j =1R Β

B (D j )ΑU ,等号未必成立;3)R ΒB (D i )∩R Β

B (D j )= 一般不成立.

7

7第1期基于变精度粗糙集理论的知识约简方法

相关文档
最新文档