不一致决策表规则提取的粗糙集方法
基于粗糙集的不一致决策表约简算法
于不一致决策表的特殊性导致常用的求核和约简算 法 不可用 。针对不 一致 决策 表 的约简 学者们 已提 出
很 多 改进方 法 。
d ( )=c a r d ( { y , D)l Y∈ [ i ] 。 } , 最 p d ( )
的值由一个集合的基数决定 , 这个集合的元素是和 对象 在 i n d ( C )下是 等价 的不 同对 象对 应 的决策
粗糙集理论 的信息定义 中, 某个条件属性是否 能够 约去 , 主要 取 决 于 约去 该 属 性 后 是否 使 决 策 表 的信 息熵 发生 改变 。王 国胤教 授对 粗糙集 的 代数 定
义 和信息 定义 下 的属性 核 的求 解 问题进 行深 入地 探
决策表的相容部分。A S k o w r o n于 1 9 9 2年给出区分 讨 , 分析 了两种观点下计算核属性 的一致性和 矩阵( 差别矩 阵) 的概念 , 将 区分矩阵应用到属性约 差异性 , 设计了信息熵定义下的核属性的求解方法 , 简的求解上 , 他定义 的区分矩阵 M = { m } 的任一 步 骤如 下 : 矩 阵项 m 为: 第一 步 : 令C o r e ( C )=西;
第1 5卷 第 4期
重 庆科 技学 院学报 ( 自然 科学 版 )
2 0 1 3年 8月
基 于粗 糙 集 的不 一 致 决 策表 约 简 算 法
文 0娟 唐 玄
( 蚌埠学院计算机科学与技术 系, 安徽 蚌埠 2 3 3 0 0 0 )
摘 要: 对传统 的区分矩阵法进行分析 , 提 出一种基 于等价类 的约 简算法 。该算法 的主要思想是将 不相容决策 表通
一
果满足 日 ( D f C )<日 ( D I C一 { r } ), 则将 r 并入 C o r e中 , 即C o r e ( C ):C o r e ( C) u{ r } ; 第三步 : 算法结束 , C o r e ( c ) 为所求。 在实际应用 中发现 , 利用信息熵算法处理不一 致 决策 表 时也 不 完 全 准 确 。胡 小 华 、 叶东 毅 以及 王 国胤三位学者的方法 , 在计算不一致性决策表 的核 属性 时都 有 各 自的局 限性 , 并 不是 完全 正 确 的 , 产 生 局 限性 的原 因在 于决 策表 的不 一致 性 。
基于粗糙集理论的规则提取算法
班级: 学号:
姓名:主要内容:来自1、前言 2、规则提取算法2.1 算法的思想
2.2 算法过程
3、结论
前言
粗糙集理论是一种刻画模糊的、不完整性和不 确定性的数学工具。它的主要思想是是在保持分 类能力不变的前提下,通过属性约简和值约简, 导出决策规则。但在目前研究的粗糙约简算法中, 大多都比较关注属性的约简,把求得最佳属性约 简作为设计目标。但在很多的实际应用中,有时 我们并不是特别关注属性约简,而只关心求得用 户所需的决策规则。所以才提出基于粗糙集理论 的规则提取算法。
规则提取算法
算法的思想如下:
算法过程如下:
结论
本算法适用于一致性决策表和不一致性决策表,在不 求核值表的情况下,从约简后的决策表中通过隶属度函数, 直接得到各规则的最少条件属性集,获得决策表的所有决 策规则。另外,在该算法得到的所有规则中,只要将对应 同一分类结果的冗余规则去掉,可以提取出各个属性约简 下的决策规则。不足之处在于由于本算法的迭代次数较多, 使得时间复杂性比普通的规则提取算法要高。
粗糙集理论的使用方法与步骤详解
粗糙集理论的使用方法与步骤详解引言:粗糙集理论是一种用来处理不确定性和模糊性问题的数学工具,它在数据分析和决策支持系统中得到了广泛的应用。
本文将详细介绍粗糙集理论的使用方法与步骤,帮助读者更好地理解和应用这一理论。
一、粗糙集理论概述粗糙集理论是由波兰学者Pawlak于1982年提出的,它是一种基于近似和粗糙程度的数学理论。
粗糙集理论的核心思想是通过对属性间的关系进行分析,识别出数据集中的重要特征和规律。
它主要包括近似集、正域、决策表等概念。
二、粗糙集理论的使用方法1. 数据预处理在使用粗糙集理论之前,首先需要对原始数据进行预处理。
这包括数据清洗、数据变换和数据归一化等步骤,以确保数据的准确性和一致性。
2. 构建决策表决策表是粗糙集理论中的重要概念,它由属性和决策构成。
构建决策表时,需要确定属性集和决策集,并将其表示为一个矩阵。
属性集包括原始数据中的各个属性,而决策集则是属性的决策结果。
3. 确定正域正域是指满足某一条件的样本集合,它是粗糙集理论中的关键概念。
通过对决策表进行分析,可以确定正域,即满足给定条件的样本集合。
正域的确定可以通过计算属性的约简度或者使用启发式算法等方法。
4. 近似集的计算近似集是粗糙集理论中的核心概念,它是指属性集在正域中的近似表示。
通过计算属性集在正域中的近似集,可以确定属性之间的关系和重要程度。
近似集的计算可以使用不同的算法,如基于粒计算、基于覆盖算法等。
5. 属性约简属性约简是粗糙集理论中的一个重要问题,它是指从属性集中选择出最小的子集,保持属性集在正域中的近似表示不变。
属性约简的目标是减少属性集的复杂性,提高数据分析和决策的效率。
属性约简可以通过计算属性的重要度、使用启发式算法或者遗传算法等方法实现。
6. 决策规则的提取决策规则是粗糙集理论中的重要结果,它是从决策表中提取出来的一组条件和决策的组合。
决策规则可以帮助我们理解数据集中的规律和特征,从而做出更好的决策。
数据分析知识:如何进行数据分析的粗糙集方法
数据分析知识:如何进行数据分析的粗糙集方法随着大数据时代的到来,数据分析成为了企业发展的重要一环。
然而,未经处理的原始数据往往含有大量噪音和冗余信息,这使得数据分析变得极为困难。
为了解决数据分析中的这些问题,人们常常使用基于粗糙集理论的数据分析方法。
1.粗糙集理论粗糙集理论起源于1982年波兰数学家Pawlak的论文《使用近似概念代替集合的代价》。
它是一种描述不确定性知识的数学工具,能够通过“近似概念”来解释元素之间的关系。
粗糙集理论将数据分为决策属性和条件属性两个部分。
其中,决策属性是需要预测或决策的属性,而非决策属性是用来描述数据对象的一些特征的属性,相当于是可能对决策属性产生影响的因素。
因此,利用粗糙集理论可以筛选出对决策属性最有影响的条件属性,从而对数据进行深入的分析。
2.粗糙集方法使用粗糙集方法可以分为以下几个步骤:(1)特征选取。
选择适当的特征对数据进行筛选和提取,以提高特征的关联性和效用性。
(2)分级建立概念相似度视图。
根据特征进行数据分类,并建立概念相似度视图。
相似度度量方法有欧氏距离法、曼哈顿距离法、余弦相似度法等。
(3)计算近似概念。
根据相似度视图,对目标数据进行分类,计算每个分类子集的下近似概念和上近似概念。
(4)筛选条件属性。
根据牺牲精度和保存置信度的原则,对条件属性进行筛选。
(5)数据分析。
将筛选得到的条件属性用来分析数据特点和规律。
3.粗糙集方法的优势粗糙集方法具有以下几点优势:(1)不需要对数据进行预处理。
与其他方法相比,粗糙集方法不需要对数据进行预处理,可以直接用原始数据进行分析。
(2)能处理不确定性的数据。
由于决策属性是不确定的,粗糙集方法可以适用于处理不确定性较大的数据。
(3)适用于小数据集。
粗糙集方法不需要对大数据进行处理,适合于处理小数据集。
(4)易于理解和实现。
由于粗糙集方法基于概念,因此易于理解和实现。
4.粗糙集方法的应用粗糙集方法可以应用于多个领域,如金融、医学、机器学习等。
一种基于Rough集的不一致和不完全决策表处理方法
c r ( c I 口 =c( } ad { c( ) f ) )
— — — — 一
若 P =l则称个体 与个体 a , 完全匹配.若 P =0 则个体 与个体 a 。 , 完全不匹配. 定义 23 在 决策 表 中有相 同的条 件属性 值 但 却 有 不 同 的决 策属 性 值 的那 些 个 体 组 成 的 序列 , 为 冲 [ 称 突个体序列. 定义 33 设 S=( , , , , y [ u A c D)对 x∈U 个体 有若干条件属性值 c( )c( , , , ) ……, ( ) c 和若干
关键词 : o g ; R uh集 决策表 ; 缺失值 ; 数据补全 中图分类号 : P 1 T 31 文献标识码 : A 文章编 号 :04— 3 2 20 ) 6一 O 4一 4 10 8 3 (0 7 O O 2 o
在现 实世 界 中很多 数据 是不 完全 的 , 丢失 的 , 观测 不 到 的 , 隐藏 的或是 录入 过 程 中发生 错误 的数 据 , 利 而 用 R g 理论 能有效 处 理 这种 不 完 备 性 , 全 缺 失 的 数 据 , 现 新 的 规则 , 好 地 为 决 策 者 提 供 决 策 依 u o h集 补 发 更 据 口 】本 文 主要研 究 了对 含有 缺失值 及不 一致 数据 决策 表 的处理 方法 , . 所提 出的方法 在 填充 缺失 数据 时 不
从 决策 表 中删 除 ;
}
} 假设 经 过 以上循 环后 决 策表 T变 为 T / R tn e a(c nl } u of{ ) }
维普资讯
利用粗糙集理论进行决策规则的生成方法
利用粗糙集理论进行决策规则的生成方法决策是人们在面对复杂问题时做出的选择,而决策规则则是指导我们做出决策的准则。
在现实生活中,我们经常需要面对各种各样的决策问题,如何找到合适的决策规则成为了一个重要的问题。
粗糙集理论为我们提供了一种有效的方法,可以帮助我们生成决策规则。
粗糙集理论是由波兰学者Pawlak于1982年提出的一种数学工具,它通过将数据集划分为不同的等价类,来描述和处理不确定性和不完备性的问题。
在决策问题中,我们经常需要根据一些已知的条件来推断未知的结果,而这些条件往往是模糊的或不完全的。
粗糙集理论可以帮助我们处理这种不确定性,从而生成决策规则。
粗糙集理论的核心思想是基于近似和粗糙的概念。
它通过将数据集中的元素划分为不同的等价类,来描述不同元素之间的相似性和差异性。
在生成决策规则时,我们首先需要确定一个决策属性,即我们希望预测或决策的结果。
然后,根据已知的条件属性,我们将数据集中的元素划分为不同的等价类。
在划分过程中,我们可以使用不同的度量方法来评估元素之间的相似性,如相对增量、精确度等。
在划分完成后,我们可以根据等价类中的元素特征来生成决策规则。
决策规则可以表达为“如果条件属性满足某些条件,则决策属性为某个值”。
通过分析等价类中元素的特征,我们可以确定条件属性的取值范围,并将其转化为决策规则。
决策规则的生成过程可以通过计算等价类中元素的频率和覆盖度来实现。
在生成决策规则时,我们还可以使用属性约简的方法来提高决策规则的质量。
属性约简是指从所有的条件属性中选择出最重要的属性,以减少决策规则的数量和复杂度。
通过属性约简,我们可以提高决策规则的可解释性和泛化能力。
利用粗糙集理论进行决策规则的生成方法可以应用于各种领域和问题。
例如,在医学诊断中,我们可以根据患者的症状和检查结果来生成决策规则,以辅助医生做出正确的诊断。
在金融风险评估中,我们可以根据客户的财务状况和信用记录来生成决策规则,以评估其还款能力和信用风险。
粗糙集理论的常见使用方法介绍
粗糙集理论的常见使用方法介绍粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它在数据挖掘、模式识别和人工智能等领域得到了广泛的应用。
本文将介绍粗糙集理论的常见使用方法,包括近似集的构建、属性约简和决策规则的提取。
一、近似集的构建近似集是粗糙集理论的核心概念之一,它用于描述数据集中的不确定性信息。
在实际应用中,我们通常需要根据给定的数据集构建近似集。
构建近似集的方法有多种,其中最常见的是基于属性约简的方法。
首先,我们需要将原始数据集进行离散化处理,将连续属性转换为离散属性。
然后,根据数据集中的属性之间的关系构建一个属性关系矩阵。
属性关系矩阵中的每个元素表示两个属性之间的关系强度,可以使用不同的度量方法来计算。
接下来,我们可以根据属性关系矩阵来构建近似集,其中每个近似集表示一个属性的约简。
二、属性约简属性约简是粗糙集理论中的一个重要问题,它用于减少数据集中的冗余属性,提高数据挖掘和模式识别的效率。
属性约简的目标是找到一个最小的属性子集,使得该子集能够保持数据集中的信息完整性。
属性约简的方法有多种,其中最常用的是基于启发式算法的方法。
启发式算法通过迭代搜索的方式,逐步减少属性集合的大小,直到找到一个最小的属性子集。
常见的启发式算法包括遗传算法、模拟退火算法和粒子群优化算法等。
三、决策规则的提取决策规则是粗糙集理论的另一个重要应用,它用于从数据集中提取出具有决策能力的规则。
决策规则的提取可以帮助我们理解数据集中的规律和模式,从而做出准确的决策。
决策规则的提取方法有多种,其中最常用的是基于属性约简的方法。
首先,我们可以根据属性约简的结果,将数据集划分为多个等价类。
然后,对每个等价类进行进一步分析,提取出具有决策能力的规则。
最后,通过对规则进行评估和选择,得到最终的决策规则集合。
四、案例分析为了更好地理解粗糙集理论的应用方法,我们可以通过一个案例来进行分析。
假设我们有一个销售数据集,其中包含了客户的属性信息和购买的产品信息。
不相容决策系统中获取规则的粗糙集方法
1 知 识 表 示 系统 与粗 糙 集
为 了实现 数 据处 理 的智 能 化 , 需要 利 用符 号表 达知识 . 知识 表示 系 统 的基 本 组成 是 研 究 对象 的 集 合, 关于 这些 对象 的知识可 以通过 对象 的属性 ( 本 基 特征 ) 属性 值来描 述 。 和 定义 1 称 S:{ A. 为 知识表示 系统 , U, V} 其 中 u 为论 域 , 是一 非空有 限集 , U l 1z , 即 z , 2…,
第1 7卷
‘
d( z )=i }
I ∈u ・
T 且 2 获 取 规 则 '
… ~ ’
其 中 P{ , r d) 表示集 合 1 …, ( }
的幂 集 。显
由于 不相容数 据和 相 容数据 同样 影响着最终 的
规则集 . 以本文 提 出一 种在 不 相 容决 策 系统 中获 所 取规 则 的方 法。
给 出例子 予以说 明 。 关键 词 : 数据挖掘 ; 粗糙 集 ; 则获 取 规 中圈分 类号 : F 0 22 文献标识 码 : A 有时 . 们需 要 发 现数 据库 中某属 性 与其 他 某 我 些 属性 的关 系 , 时, 些属性 集合 就组成一个 决 策 这 这
系统。
定义 2 令 S:1 A. 为一知识表 示 系统 , u. V} B _ 定义 B不 可分辨 关 系 L D( 为 :N B) C A. N B) L D(
=
和 不精确 信 息的新方法 。它 的一个 重 要特点是 不需
要预先给 定 问题 的某些 特 征 或 属性 的数 量 描述 . 如
l cUl , , u, d}V}d为决策 属性 。
收 稿 日期 :0 10 .0 2 0 J91 第一作者简丹 : 安利平 ( 1) 男, 1 . , 天津大学臂理学院博士生. 研究方向为管理决策与系统设计。
Rough集规则知识获取研究中的不一致性问题_王国胤
文章编号:10045694(2000)03001606Rough 集规则知识获取研究中的不一致性问题王国胤 刘 锋 吴 渝 聂 能(重庆邮电学院计算机科学与技术研究所,重庆400065)摘 要 讨论数据挖掘问题,即从原始数据中构造决策规则。
重点考虑不一致情况下的规则知识获取问题,即从包含不一致信息的数据中获取得到缺省规则,并研究在不一致条件下的决策规则选择策略,使之能够在不完全、不一致的条件下进行推理。
同时将在Sko wr on 缺省规则获取算法的基础上,根据对不一致性的分析,提出从包含不一致信息的决策表中获取缺省规则,并能够对任意待识样本进行处理的方法。
关键词 R ough 集;知识获取;数据挖掘;不一致性中图法分类号 T P 18 文献标识码:AThe Inconsistency in Rough Set Based Rule GenerationWANG Guo -y in LIU Feng WU Yu NIE Neng(I nstitute of Comp uter S cience and T echnology ,Chong qing Univ ersity of Posts and T elecommunications ,Chongqing 400065)Abstract A s the amount o f infor matio n in the wo r ld is steadily increasing ,ther e is a g r ow -ing demand fo r t ools for analy zing the info rm atio n.In this paper t he a ut ho rs inv estig ate the pr oblem o f data mining ,that is ,constr ucting decision r ules fr om a set of primitive input da-ta.T he ma in contentio n o f the pr esent wo rk is t ha t ther e is a need fo r gener ating decision rules and r ea so ning in inco nsistency.Pr opo sitio nal default r ules ar e gener ated in t his paper.Based on the default rule genera tio n m et hod of Sko wr on and the inconsistency analy sis,the author s pr esent a metho d fo r default r ule g enerat ion fr o m a decisio n table and its reaso ning method.A new st rata gem fo r choo sing the mo st suitable rule fro m a set o f co nflict ing r ules is dev eloped.A ny unseen sample can be pro cessed with the r ules gener ated with this method.Key words r oug h set ;kno w ledge acquisitio n ;data mining ;inco nsistency0 引 言a随著信息的不断增长,对信息分析工具的要求也越来越高,人们希望自动地从数据中获取其潜在的依赖模型。
第八章 粗糙集决策方法
第3 第 3页 页
本讲内容
《决策理论与方法》
粗糙集理论的基本概念 完备决策系统的粗糙决策分析方法 不完备决策系统的粗糙决策分析方法 基于优势关系的粗糙决策分析方法 基于扩展优势关系的粗糙决策分析方法
第4 第 4页 页
8.1粗糙集理论的基本概念
《决策理论与方法》
8.1.1知识与知识表示
(5) X Y R( X ) R(Y ),
(6)
R( X ) R(Y )
R( X ) R( X ), R( X ) R( X ) R(R( X )) R(R( X )) R( X )
(7) R(R( X )) R(R( X )) R( X ),
X粗糙集的概念可以用下面的示意图来表示:
U / c1
2 1 4 5 6 3 7 2 8 1 4 7 2 5 8 3 6
3
1
2
3
4
8
5
6
6
7
1
4
2
8
3
5
7
1
4
5
2
8
3
7
6
第9 第 9页 页
R
《决策理论与方法》
8.1.2近似与粗糙集
设 X U , R 为U 上的等价关系,当 X 能表示为某 些基本范畴并时,称是 R 可定义集;否则称 X 是 R 不可定义集。 R 可定义集是论域的子集,它可在知识 库中精确地定义,而 R 不可定义集不能在这个知识
POSC ( D) POSC a ( D)
S (U , C D,V , f ), 若
则称属性 a 为 C 中 D 可省略,否则
属性 a 为
不完备故障决策表中规则获取和优化的粗糙集方法
不完备故障决策表中规则获取和优化的粗糙集方法
雷文平;陈磊;韩捷;李志农
【期刊名称】《煤矿机械》
【年(卷),期】2006(27)10
【摘要】针对故障诊断知识库中经常出现故障征兆不完整现象,利用改进的粗糙集模型结合区分矩阵和区分函数直接从决策表中提取完整的规则集,并利用概率粗糙集模型指定了各规则的可信度和覆盖度,提高了规则的通用性。
结合旋转机械故障诊断的实例表明该方法的有效性和适用性。
【总页数】3页(P190-192)
【关键词】故障诊断;不完备决策表;规则获取;可信度;覆盖度
【作者】雷文平;陈磊;韩捷;李志农
【作者单位】郑州大学机械工程学院
【正文语种】中文
【中图分类】TP182
【相关文献】
1.一种基于粗糙集理论的最优故障诊断规则获取方法 [J], 张光轶;苏艳琴;孟凡娜
2.从不完备数据中获取诊断规则的粗糙集方法 [J], 黄文涛;王伟杰;赵学增;代礼周
3.一种从海量不完备决策表中抽取规则的方法 [J], 王树锋;吴耿锋;潘建国
4.不完备决策表的扩展差别矩阵规则获取方法 [J], 王帅;徐章艳;王炜;舒文豪
5.基于粗糙集理论的故障诊断规则获取方法研究 [J], 周庆敏;李永生;殷晨波;陆金桂
因版权原因,仅展示原文概要,查看原文内容请购买。
决策理论与方法教学--粗糙集决策
的
的等价类。
U
U
个知
上 识
的
一
族划分称K为
(U
,
R的),一个
知U
识
库
。一
库就R是一U个系统,记为
其中 为非
空有限
集, 为 上的一簇等价关系。
▪ 2. 知识的表示
知识的表示通过知识表达系统来完成。知识表
达
S
S (U , A,V , f ),
决策规则 称为CD 基本决策规则。
定义8.1.18 当且仅当对于(C, D) 中任何CD一
决
策规,则 ,
CD
CD
法中的
蕴含
S
时,则 决策算
决策规则 。
是 中相容的,否则是不相容的
定义8.1.19 如果一个决策表中所有的决策规则都 是相
容的,则决策表是相容的,否则是不相容的。
… then…”的决策规则,当条件能唯一确定决策 时,
等价关系 定R(义X )两 个Y 子U集/ R:Y X
R(X ) Y U / R Y X
XR
R
分别称它们为 的 下近似和 上近似。
下近似和上近似也可以用下面的等式表达:
R(X ) x U [x]R X , R(X ) x U [x]R X
BN R ( X ) R( X ) R( X ), POSR ( X ) R( X ), NEGR (X ) U R(X )
POSCc2(D) x1, x2 , x3 , x4 POSC (D)
POSCc3(D) POSC (D)
POSCc1,c2(D) x1, x4 POSC (D)
基于粗糙集的不一致信息系统规则获取方法
A Method of Rule Induction Based on Rough Set
Theory in Inconsistent Information System
作者: 菅利荣 达庆利 陈伟达
作者机构: 东南大学经济管理学院,南京,210096
出版物刊名: 中国管理科学
页码: 91-95页
主题词: 粗糙集 变精度粗糙集 信息系统 概率规则获取
摘要:本文提出了一种基于粗糙集的既能学习决策性分类规则也能学习非决策性分类规则的方法,目的是获得更一般、更可靠的分类规则,并设计了相应的算法.算法的基本思想是允许用户在学习分类过程中指定三个参数:最小的支持度、分类规则必须满足的一致度、覆盖度,据此推导出满足参数要求的规则.最后将该方法应用于一个算例中,提取了满足给定参数阈值的规则.该方法在处理噪音数据及大型数据库分析等方面具有较强功能.。
不完备信息系统的粗糙集决策规则获取方法
不完备信息系统的粗糙集决策规则获取方法【摘要】传统的粗糙集理论运用上下近似关系,获取属性约简集的方法,但对于处理信息系统中某些属性未知的情况时则无法描述,因此可以采用不确定决策的方法获取决策规则。
对于协调的不完备信息系统,文中证明了计算约简集的方法和条件;对于不协调的不完备信息系统,文中通过寻优的方法得到了缩减的完备决策信息系统,从而获得决策规则。
【关键词】不完备信息系统粗糙集协调决策规则Abstract:The traditional rough set theory in the use of approximate relationships up and downget attribute set Fangfa reduction system for processing information in the case of certain properties of unknown O'clock is impossible to describe,so you can access using the uncertainty method of decision making Guize.For the coordination of incomplete information systems,paper reduction set to prove the calculation methods and conditions;for incompatible incomplete information systems,the paper obtained through the optimization of the reduction of the complete decision-making information systems to gain decision-making rules.Keywords:incomplete information system rough set coordination decision rules1 引言智能信息处理是当前信息科学理论和应用研究中的一个热点领域。
不一致决策表规则提取的粗糙集方法
不一致决策表规则提取的粗糙集方法吕跃进;陶多秀;张沅【期刊名称】《计算机工程》【年(卷),期】2011(037)008【摘要】针对不一致决策系统中的规则提取问题,提出一种协调规则提取算法.在粗糙集背景下粒计算描述的基础上,由对象所在的条件信息粒与目标概念的包含度定义对象关于目标概念的隶属度,扩展传统的粗糙近似.给出不一致获取协调规则的算法描述及其时间复杂度.对比分析及说明性算例验证了该算法的有效性和可行性.%Focusing on rule extraction from the inconsistent decision table, the paper reports a new rule induction method of this kind which can handles noise effectively.Based on the granularity computing description in the context of rough set, the membership degree of an object to a target concept is defined by the inclusion degree between condition information granule and the target concept, thus the traditional rough approximation is extended.The effective algorithm which can induct consistent rules from noisy data is given, as well as its time complexity analysis, compared with other existing algorithms.An illustrative example is presented as a guide for future application of this method.【总页数】3页(P155-157)【作者】吕跃进;陶多秀;张沅【作者单位】广西大学数学与信息科学学院,南宁,530004;广西大学电气工程学院,南宁,530004;广西大学电气工程学院,南宁,530004【正文语种】中文【中图分类】N945【相关文献】1.一种基于特征矩阵的一致决策表的规则提取方法 [J], 刘先花;胡雪丹2.改进的不完备决策表最优规则提取方法 [J], 纪怀猛3.不一致决策表各种属性约简的不一致性分析与转化 [J], 黄国顺;刘云生4.基于粗糙集的不一致决策表约简算法 [J], 刘娟;唐玄5.不一致决策表中规则提取的矩阵算法 [J], 黄兵;周献中因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息粒与 目标概念 的包含度定义对象关于 目标概念 的隶属度 , 扩展传统 的粗糙近似 。 给出不一致获取 协调规则的算法描述 及其 时问复杂度 。 对比分析及说 明性 算例验证 了该算法 的有效性和可行性 。
关健诃 :粒计算 ;信息粒 ; 粗糙集 ;不一致决策表 ;规则提取
Ro h S tM e ho 0 nc nsse c so Ta eRul t a to ug e t d f rI o it ntDe ii n bl eEx r c i n
其 中 , idP 是 一 个 等 价 关 系 , 在 u 上 形 成 一 个 划 分 n ()
U/ dP ,简写成 U P。 i () n /
定义 3 设 S=( A V 厂 是一个信息系统 ,v A, , , , ) P
称 【] 等 价 关 系 P 决 定 的 X的等 价 类 : 为
计
算
机
工
程
21 0 1年 4月 2 日 0
( G(
一 ‘
() 至 ) :
‘ ∑f ( f )
定义 5 给定一个 决策 表 S,定义从 X到 l的决策规 ,
则为 :
r:e i _ e( ) d sX) ÷d sY .YNX ≠
根据上面 的定义 ,有 :若 j 息粒 IG ()C G ( , 信 I ex l e ) I l 则可从中提取分类规则 I G ()- y,其可信度为 : I I+ I 1
一
其中 ,i () n P 的等价类称为知识 J d p的基 本集 。在决策系统 中 依 据条件属性 或决策属性 的不可分辨关系对样本进行 划分 出 的等价类分别称为条件类和决策类 。 定义 4 ̄下、上近似)设 X U ,集合 关于等价关系 1( J
P 的下 近 似 和 上 近 似 分别 定义 为 :
I] xP={' ) ∈U ( ) P} I , ∈
粒计算是一种看待客观世界 的世界观和方法论 ,也是信 息 处 理 的一 种新 颖 的软 计 算 方 法 ,现 已成 为 人 工 智 能 、 知识 发现领域研究的热点之一 。信息粒是指人类在处理大量复杂 信 息 问 题 时 ,由于 能 力 有 限 ,需 要 把 这 些 大 量 的 复 杂信 息按 其各 自特征和性能划分成若干个较简单的信息块 ,其 中的每 个信息块就被认 为是一个粒 。粒化是粒计算 的基本概念之 j 而粗糙集 中的划分即根据等价 关系对论域进行 的划分 , 其实质就是一种粒化 , 且得到 的粒之 间是独立、 互不相交 的 。 】
1 概 述
基 于粗 糙 集 的分 类 规 则 提 取 是 机 器 学 习的 一 个热 点 研 究
系 统 , 中 ,U ={ u 一 “ } 对 象 的 非 空有 限集 ,称 为 论 其 u, , 为
域 ; A {I∈ } = n A 为属性 的非空有限集 ; V n =Uv 为全体属
畦 A
规则的可信 度反 映了满足规则前件 的实例 中有多少可以 划分到规则后件表示 的决策类 中。覆盖信度则表示 :对于规
输入 不一致决策系统 S ( , U , , ) = u C D V _ 厂
输出 协调规则集 R L
Se l 初始化 R , ,:I/ C 为待 考察 的条 tp L= C =c t / 记
id( =f y ∈UxUI a∈P,( ) () n P) (, ) V 口 = J
考虑覆盖度 的规则获取方法 。大 多数 方法都是针对一致决 J
策 表 的 ,没 有涉 及 不 一 致 对 象 的处 理 。 针对 不一 致决 策 情 况
的决策表 ,文献【】 4通过定义分配约简、分布约简和最 大分布 约简的决策矩 阵并 比较与条件属性 矩阵的关系来得到信息 系
c n e ti d fn d b h n l so e r e b t e o d to n o a i n g a u e a d t e t r e o c p , hu h r d t n l o g p r x ma i n i o c p s e e y t e i c u i n d g e e we n c n ii n i f r to r n l n h a g t n e t t st e ta ii a u h a p o i t s i m c o r o e t n e Th fe t e a g r h wh c a l n u t o sse t l sfom o s a a i i e , swe l sist x e d d. e e c i l o i m ih c r i d c n it n e r v t c u r n iy d t sg v n a l a t i o me c mp e i n l ss c mp r d wi l x t a a y i, o y ae t h o h re i t g a g rt ms An il sr tv x mp e i p e e td a u d o u u e a p ia i n o i eh d. t e x si l o ih . l ta i ee a n u l s r s n e sa g i ef rf t r p lc t ft sm t o o h
L VYu -i T ej . AO o xu . n Du .i ZHANGYu n a
f . olg f te t s n f r t nS in e ; . o l eo lcr a n ie r g Gu n x U ies y Na nn 3 0 4 Chn ) a C l e h mai dI o mai ce c s b C l g f e t c l gn e n , a g i n v ri , n ig5 0 0 , ia e o Ma ca n o e E i E i t
称为信息 函数 。 定义 1中的 A=CUD ;C表示条件属性集 ; D表示 决
策 属性集 。若 D= ,则信息 系统 为一 般的信 息系 统 ;若 D≠ ,则该信息系统为决策信息系统 ,对应决策表。 定义 2 设 S是一个信息系统 ,v A,定义 P上的不 P
可 区分 关 系 为 :
[ ywod ]ga ua o uig ifr ainga ueru hstic nie t eiint l; l x at n Ke r s rn lr mp t ;no t rn l;o g e;n o s tn cs ber eet ci c n m o s d o a u r o D0I 1.9 9 .s. 0 —4 82 1.80 3 : 03 6 /i n1 03 2 0 0 .5 js 0 1
/ 属性 集 ,记 t 迭 代 次数 。 I 件 为
则后件代表 的决策类 y而言有多少实例是 由该规则覆盖的。 规则的可信 度和覆盖度通常用来作为规则的有效性度量 ,应
E t cinf m Ic nie t ei o a l, R I D )H : xr t o o s t cs nTbe A E N T  ̄ 下 a o r n sn D i
定义 6 规则 X_ ,的可信度和覆盖度分别定义为 : ÷, C ( y =l /Xl FX ) nY, X I C vX_ y =l o ( ÷ 、 XNYIYl / i
统 的所 有 分 配 规 则 、 分布 规 则 和 最 大 分 布 规 则 ,但 该 方 法 需
要进行较多 的矩阵运算 ,时间和空 间复杂度高 ,不能适用于 决策表很大或对 时间有较严格要求的情形。文献【】 出一种 5提 通 过投 影得到缺省规则的算法 ,但该 方法并不完 备,因为导
出 的规 则 之 间 有 冲突 ( 盾 ) 矛 。
收藕 日期 :2 1~92 0 00 —4
2 基本概念
定 义 1 ’形 式 化 地称 四元 组 S=( A V , 是 一 个 信 息 u, , , )
沅 ,硕士研究生
E— i d 20 6 . m mal x 2 @13c :t o
l6 5
X ={ l n X ≠ } xeU 【 】
其 中,dsX) ds ) e( ,e( 分别为条件类和决策类的描述 , Y 称之为
规 则 的 前 件 和后 件 。规 则 也可 简 记 为 X _ Y。 ÷
C F=【1 P I I lI P ) lG () / lG ( … I I n l 32 不一致决策表的规则提取算法 . 不 一 致 决 策 表 的 规 则 提 取 算 法 ( g rh fr R l Al i m o ue ot
第3 7卷 第 8期
V0 . 1 37
・
计
算
ቤተ መጻሕፍቲ ባይዱ
机
工
程
2 1 年 4月 01
Ap i 01 rl 2 1
NO8 .
Compu e gi e rng t rEn n e i
人 工智 能及识 别技 术 ・
文章编号: 0 32( 1 o—05_ 3 l0_ 48 01 8 _ _ 2 ) 15 0 .
文 献标识码: A
中 圈分类号: 95 N4
不 一 致 决 策 表 规 则提 取 的粗 糙 集 方 法
吕跃进 ,陶多秀 ,张 沅
( 广西大学 a 数学与信息科 学学 院;b 电气工程学 院,南宁 5 0 0 ) . . 304 摘 要: 针对不一致决策系统中的规则提取问题 , 出一种协 调规 则提取 算法 。在粗糙集背景下粒计算描述的基础上 ,由对 象所在 的条件 提
[ sr c]F c s go l xrcinf m teic nie t e io be tep pr eotaD w rl dcinmeh do i kn i a Ab tat o ui nr ee t t r o s tn cs nt l, ae p r e uei ut to fhs idwhc cl n u a o o h n s d i a h r s n o t h l h n ls os f ciey B sdo ega ua t o uigd sr t ni tec ne t f o g e, eme esi ereo nojc t at gt ade i e et l. ae nt rn l ycmp t ec pi o t uhstt mb r pdge f beto re n e v h i r n i o nh xor h h a a