基于模糊粗糙集的一种知识获取方法
基于模糊—粗糙集模型的一种归纳学习方法
基 于 模 糊 一 糙 集 模 型 的 一 种 归 纳 学 习 方 法 粗
石 峰 娄 臻 亮 张 永 清 陆 金 桂 , , ,
( . 海 交通 大学 塑 性 成 形 工 程 系 , 1上 上海 2 0 3 ;2 南 京 化 工 大 学 计 算 中 心 , 京 2 0 0 ) 000 . 南 1 0 9
方 法 的有 效性 .
关 键 词 : 糊 集 ;粗 糙 集 ;模 糊 相 似 关 系 ;决 策 表 ;归 纳 学 习 模
中 图 分 类 号 : 8 TP 1 文 献 标 识 码 :A
n c i e Lear i g Appr du tv nn oac h Bas z y Rou ed on Fu z — gh SetM ode
SH I Fe ng 。 LOU e lang 。 ZH AN G ng— i 。 L Ji gui Zh n—i Yo q ng n— 。
( . p . o a tct r i g En .,S a g a io o g U n v 1 De t fPls iiy Fo m n g h n h iJa t n i .,S a g a 0 0 0,Chia; h n h i2 0 3 n
e d. Com p r d o he a e t t de ii t e a gort c son r e l ihm , i c n t a ge r t l s c as iiaton ul s nd t e ne a e e s l s fc i r e a h ge r t d ne a e r e e m or om pa t Fi aly,a xa pl ul s ar ec c. n l n e m e was il s r e nd p ove ha he a lu t at d a r s t t t ppr a h i f e tve. o c se f ci Key wor ds:f z e ;r uz y s t ough s t uz y s m ia i y r l ton;de i i a e;i duc i e l a ni g e ;f z i l rt e a i c s on t bl n tv e r n
一种基于Rough集获取规则知识的增量式学习方法
维普资讯
一
种基于 R u h集获取规则知识 的 og 增量式学 习方法
黄治 国 ,王加 阳 ,罗 安
( 南大学 信 息科 学与 工程 学院 , 沙 4 0 8 ) 中 长 10 3
E ma l h a g hg o 0 1 o c n - i: u n z iu 2 0 @tm.o
I c e e t l Le r i g M e h d Ba e n Ro g e o n r m n a a nn t o s d o u h S tf r
Ac u rn ls Kn wl d e q ii g Ru e o e g
HUANG h - u W ANG i- a g, Z i g o, Ja y n LUO An
i s me a p cs u h s r ls c u t o h r ls e , aa e r h n ,o e a t c u a y f te u e s t x e i n ai n n o set s c a u e o n f l e u e s td t n i i g f r c s c a c r c o h r l s e .应 用 于规 则 归 纳 系 统 , 出 了一 种 基 于粗 糙 集 获取 规 则知 识 库 的 增 量 式 学 习方 法 , 够 有 效 处 将 og 提 能
基于粗糙集理论的知识发现与推理技术研究
基于粗糙集理论的知识发现与推理技术研究随着信息技术的飞速发展,我们所接触到的数据越来越庞大,如何从这些数据中提取出有价值的信息,成为了信息学界的一个重要研究方向。
其中,基于粗糙集理论的知识发现与推理技术,成为了近年来研究的热点之一。
本文将对该领域的研究现状和前沿做一个总结和介绍。
一、粗糙集理论粗糙集理论是Polkowski和Skowron于1982年提出的,是一种从不完备和模糊的数据中提取知识的方法。
其主要思想是在给定的数据集中寻找属性间的约简,以建立一个简化后的数据模型,用来代表原始数据的识别需求。
粗糙集理论的应用广泛,在数据挖掘、模式识别、决策分析等领域都有重要应用。
粗糙集理论的关键概念包括:等价类、下近似集和上近似集等,这些概念的具体解释和使用在不同的应用场景下各有侧重。
二、基于粗糙集理论的知识发现基于粗糙集理论的知识发现是指从粗糙集的等价类中发现存在的规律、模式和特征。
这些规律和模式则可以进一步用于分类、聚类和数据降维等,从而在更广泛的应用中得到具体的应用。
在知识发现的过程中,粗糙集理论可以用在数据特征选择和数据分类等场景下。
以特征选择为例,基于粗糙集理论可以解决多特征冗余的问题。
对于每个特征,可以计算它对分类结果的影响程度,从而保留对分类结果有较大影响的特征,使特征的维度不至于过高,在减少计算复杂度的同时,尽可能保证分类准确率。
三、基于粗糙集理论的知识推理基于粗糙集理论的知识推理是指根据已知的规则和模式,对新数据进行分类或预测等,以逐渐完善数据模型。
知识推理可以采用分类规则、决策树等多种方式来实现,而采用粗糙集理论的知识推理方式,通常使用下近似集和上近似集等概念来进行分类。
在基于粗糙集理论的知识推理中,一般存在两种方式:一种是确定性知识推理,另一种是不确定性知识推理。
其中确定性知识推理通常采用约简算法,用于对数据进行二元分类,而不确定性知识推理则涉及模糊分类和模糊决策等模糊理论中的概念。
获取知识的一种新方法——粗糙集(Rough Set)
获取知识的一种新方法——粗糙集(Rough Set)
董彩凤;王天宇
【期刊名称】《热能动力工程》
【年(卷),期】2002(17)4
【摘要】旋转机械故障诊断的一个困难问题是诊断规则的获取。
提出获取知识的一种方法———粗糙集 (RS) ,RS能自动地从旋转机械的大量信息中有效地获取诊断知识 ,并能减少误诊与漏诊现象。
【总页数】3页(P402-404)
【关键词】故障诊断;旋转机械;粗糙集;故障诊断
【作者】董彩凤;王天宇
【作者单位】哈尔滨工业大学航天学院
【正文语种】中文
【中图分类】TH133;O211
【相关文献】
1.基于粗糙集(Rough Set)理论的数据挖掘(KDD)过程及其实现 [J], 杨宝华;钱远军;胡学钢
2.基于Rough Set理论的摩擦学诊断知识获取系统 [J], 王金涛;景敏卿;谢友柏
3.基于粗糙集(Rough Set)的数据挖掘技术研究 [J], 张国权
4.一种基于Rough集获取规则知识的增量式学习方法 [J], 黄治国;王加阳;罗安
5.基于粗糙集(Rough set)的数据挖掘及其实现 [J], 赵连胜;杜清晏;等
因版权原因,仅展示原文概要,查看原文内容请购买。
基于粗糙集的不完备信息系统知识获取方法
A s a tR u hs t h oyi f s iv ne r mp t if m t n ss m; t a ee t d d i od r Opo esi o l e b t c : o g e r r e t f r et s ;tn d o e h e no a i t o r o y e i hst b xe e r e rcs n mp t o n n t c e
smmai stek o l g cusi toseie rn a pe fr t ns ̄ea bsd∞ ruhst h r. ute sac u r e nw e eaq itnmeh d s f o' lei omai t s a z h d io xt o i n t n d o yn e o g e y F r r eerh e to h r
V0 3 N . 1 .o4 .
De . o 6 c2 0
文章编号 :62 7 1 {060 — 05 0 17 — 0 02 0 )4 0 0 — 4
基 于粗 糙 集 的不 完 备信 息 系统 知 识 获取 方 法
李仲生 , 张在美
(. 1邵阳学院 信息与电气工程系, 湖南 邵阳 420 1. 2002湖南大学 计算机与通信学院, 湖南 长沙 408 ) 102
ifr t n sse .n ti a e rtn rd c h ai n wl g f o g e h oy n lz v rl x e d dmo ds n h n nomai y tm I hsp p rwef s t ueteb sck o e e u hs t e r ,a ayes ea t e d ,a dte o i io d or t e e n
基于模糊集和粗糙集联系度的商务决策系统
En ie rn n piain , 0 7 4 ( 2) 2 4 2 7 gn e i g a d Ap l t s2 0 , 3 3 : 1 - 1 . c o
Ab t a t Ro g s t h o a d f zy es h oy a b s d o e e r h mp e ie a d i c mpe e rb e i i fr t n sr c : u h es e r n u z s t t y t e r c n e u e t r s a c i rc s n n o lt p o lms n no mai o s s ms h s p p r a pi s d g e f c n e t n i e s p i a ay e o o g e s t e o. e eai n hp b t e o g — e r e y t . i a e p l e r e o o n c i n s t a r n lz d t r u h s t h o Th r lt s i ewe n r u h d g e e T e o o o o n ci n a d c r i a o o g o r p e p rx mai n i e n tae . o c mb n u z s t wi o g es p i a ay f c n e t n a d n l f ru h lwe/ p r a p o i t s d mo srt dT o i e f z y es t r u h s t a r n l- o u o h ss a n w y te i v l a in p r a h i p o o e .h r s l h ws h s i , e s n h t e a u t a p o c s r p s dT e e u t o ti meh d i u t v l a l i k o e g d s o e fr c o s to s q i e au b e n n wld e ic v r o y
基于粗糙集的故障诊断特征提取
基于粗糙集的故障诊断特征提取【导言】故障诊断在各个领域中扮演着重要的角色。
精确而及时的故障诊断可以帮助我们解决问题并提高设备和系统的可靠性。
然而,随着技术的不断发展和系统规模的增大,故障诊断的复杂性也在增加。
针对这一问题,基于粗糙集的故障诊断特征提取方法应运而生,为故障诊断研究带来了新的突破。
【正文】1. 粗糙集理论简介粗糙集理论由波兰学者Zdzisław Pawlak于1982年提出,被广泛应用于模糊、不确定和决策论问题。
该理论基于粗糙集、决策规则和等价类的概念,提供了一种处理不完全和不确切信息的方法。
在故障诊断中,粗糙集理论能够帮助我们从数据中提取有用的特征,以用于定位和分析故障。
2. 故障诊断特征提取的挑战在故障诊断中,我们往往需要从大量的数据中提取出包含故障信息的有用特征。
然而,由于数据的复杂性和多样性,特征提取变得非常具有挑战性。
基于粗糙集的故障诊断特征提取方法通过采用近似与精确度的概念,能够从数据中挖掘出具有较高可区分度的特征。
3. 基于粗糙集的故障诊断特征提取方法基于粗糙集的故障诊断特征提取方法主要包括数据预处理、特征选择和模型构建三个步骤。
3.1 数据预处理数据预处理是故障诊断特征提取的第一步。
在这个步骤中,我们需要对原始数据进行质量控制、噪声去除和数据格式转换等操作,以提高数据的可靠性和可用性。
3.2 特征选择特征选择是故障诊断特征提取的核心步骤。
在这个步骤中,我们需要根据数据的性质和目标需求,选择并提取出最具有代表性和判别性的特征。
基于粗糙集的特征选择方法基于精确度和纯度的概念,通过计算每个特征的重要性指标,从而实现特征的筛选和排序。
3.3 模型构建模型构建是故障诊断特征提取的最后一步。
在这个步骤中,我们需要基于已选择的特征构建故障诊断模型。
常用的模型包括决策树、神经网络和支持向量机等。
通过将特征与相应的故障类别进行关联,我们可以实现故障的诊断和定位。
4. 基于粗糙集的故障诊断特征提取方法的优势基于粗糙集的故障诊断特征提取方法具有以下几个优势:4.1 应对不完备和不确定的数据粗糙集理论能够处理不完备和不确定的数据,使得故障诊断在现实环境中更具鲁棒性和适应性。
如何利用粗糙集理论构建知识发现系统
如何利用粗糙集理论构建知识发现系统在当今信息爆炸的时代,人们面临着海量的数据和信息,如何从中挖掘出有价值的知识成为了一个重要的问题。
粗糙集理论作为一种有效的数据挖掘和知识发现方法,已经被广泛应用于各个领域。
本文将探讨如何利用粗糙集理论构建知识发现系统。
首先,我们需要了解粗糙集理论的基本概念和原理。
粗糙集理论是由波兰学者Zdzisław Pawlak于1982年提出的,它是一种处理不完备和不确定信息的方法。
粗糙集理论的核心思想是通过对数据进行粗糙化和近似处理,找出数据之间的关联和规律。
在粗糙集理论中,属性约简是一个重要的概念,它可以帮助我们从大量的属性中找出最具代表性和区分性的属性,从而简化数据分析过程。
基于粗糙集理论,我们可以构建一个知识发现系统。
这个系统可以包括以下几个模块:数据预处理、属性约简、知识提取和知识表示。
首先,数据预处理模块负责对原始数据进行清洗、去噪和归一化处理,以保证数据的质量和一致性。
接下来,属性约简模块通过粗糙集理论中的属性约简算法,从大量的属性中选择出最具代表性和区分性的属性,减少数据维度和冗余信息。
然后,知识提取模块将根据约简后的属性和数据之间的关联关系,挖掘出隐藏在数据中的知识和规律。
最后,知识表示模块将提取到的知识以可视化的方式展示出来,方便用户理解和应用。
在构建知识发现系统的过程中,我们还需要考虑一些关键问题。
首先是数据的选择和采集问题。
我们需要选择合适的数据集,并进行有效的数据采集和整理,以保证数据的全面性和准确性。
其次是算法的选择和优化问题。
粗糙集理论中有多种属性约简算法,我们需要根据具体的应用场景选择合适的算法,并进行算法的优化和改进,以提高系统的性能和效果。
最后是系统的应用和评估问题。
我们需要将构建好的知识发现系统应用到实际问题中,并对系统的性能和效果进行评估和改进。
除了构建知识发现系统,粗糙集理论还可以与其他数据挖掘和机器学习方法相结合,进一步提高知识发现的效果和精度。
一种基于粗糙集理论的最优故障诊断规则获取方法
Se4恢复 T’ t p 中全部条件属性值都被标 为“ ” ? 的原值 。 Se5恢 复 T’ tp 条件属性为“ ” ” ? 的原值 。 ? 或“ 中“ ” Se6逐条检查所有包含符号“ ” t p ? 的记录如果仅 由未被标 记 的属性 值 即可得 出不发 生 冲突 的决策 则将 符 号 “ ” 为 ?改
“ ” ,
否则将“ ” ? 改为原来的属性值。
Se7首先删 除重复记 录, t p 再假设新 的信 息系统存在某两
条记录之间部分条件属性 相同 , 而对于不相等 的属性 , 在一条 记录中表示 为具体的值 、 在另一条记 录 中被标 为“ ” 。针对
l 基 于信息 标记 的 改进属 性值 约 简算 法
摘 要 : 了获取最优故 障诊 断规则 , 出一种基于信息标记 的改进属 性值 约简 算法, 为 给 以及针对规则的冗余、 矛盾、 从属等方面 的规 则检 测方法 , 并应用 于某 型航空电子设备故障诊断 中进行最优诊断规则获取 , 结果表明诊 断有效 。 关键 词 : 粗糙集理论 ;故障诊断 ;规则 提取方法 ;航电设备 中图分 类号 : P 8 , 2 T 11 V 4 文献标志码 : B
On p i a a l d a n ssr l b an me h d b s d o o g e st e r eo t m lf u t i g o i u e o t i t o a e n r u h s t h o y
一种基于粗糙集理论的分类规则提取算法
Ro g e e r u h S t Th o y
S iM ig u Zh u Ch n l h n h i o a ge
(ntue o rf i nel e c , ime nvri , i n 3 0 ) Is tt fA t ca Itlgn e X a n U ies y X a 6 0 5 i i l i i t me 1 ( o ue ce c e at e to im n U i ri , i n 3 0 ) C mp t S ine D p r n fX a e nv s y X a 6 0 5 r m e t me 1
347367xml知识管理统一可扩展易于统一规范存储便于分类管理基于元数据的快速细化搜索直接发布简单容易共享其他管理方法复杂可扩展性差统一规范存储困难难于分类管理全文搜索效率低发布方式复杂不易共享一般文档结构存储分类搜索发布共享异构系统传递基于xml的知识管理与其他知识管理的比较165
维普资讯
分特征和必要特征。在此基础上 , 结合“ 简” 约 方法和“ 焦” 聚 机制 , 出了一种新的分类规则提 取算法。使用该算法 , 提 能从
分 类信 息 系统 中提 取 出明 确 的 分 类 规 则 。 些规 则 不仅 包含 了分 类信 息 系 统 中类 的 某 些潜 在 的 充 分 特 征 和 必要 特征 , 这 而 且 比传 统 的 归纳 法 所 提 取 的 规 则 更 能 反 映 专 家 的 “ 焦” 维 方 式 。 最 后 给 出 了运 用 该 算 法 的 示例 。 聚 思 关 键 词 知 识 获 取 规 则提 取 粗糙 集 机 器 学 习 数 据挖 掘
t i u tae te p p s d a g r h o l sr t h r o e lo t m. l o i Ke wo d y r s:k o e g c u st n, ls e ta t n, u h s t ma h n e r i g d t n n n wld e a q i i r e x r ci r g e , c ie la n n , aa mi i g io u o o
一种基于粗糙—模糊集理论的知识获取方法
一种基于粗糙—模糊集理论的知识获取方法作者:蔡虹叶水生张永来源:《电脑知识与技术·学术交流》2008年第23期摘要:该文提出了一种基于粗糙-模糊集理论的知识获取方法,该方法将粗糙集理论与模糊集理论相结合,先利用模糊集理论对决策表的连续属性进行模糊化,通过构建模糊相似矩阵进而划分论域;再利用粗糙模糊集理论进行属性约简,从而获取决策规则。
最后,通过实例验证了该方法的有效性和实用性。
关键词:粗糙集;模糊集;属性约简;知识获取中图分类号:TP393文献标识码:A文章编号:1009-3044(2008)23-1029-03Knowledge Acquisition Approach Based on Rough-Fuzzy SetsCAI Hong, YE Shui-sheng, ZHANG Yong(Nanchang Hang Kong University, School of Computing, Nanchang 330063, China)Abstract: This article presents an approach of knowledge acquisition based on rough and fuzzy sets, which combines features of rough sets and fuzzy sets. The continuous attributes in the decision table are fuzzified with fuzzy membership functions. The domain partition is accomplished after establishing fuzzy similarity matrix. Attributes reduction can be obtained using rough-fuzzy sets, and then decision rules can be acquired. At last, an example is illustrated and proves the approach is effective and practical.Key words: rough sets; fuzzy sets; attributes reduction; knowledge acquisition粗糙集理论是一种处理不完整和不确定信息的有效数学工具,它具有知识获取完全由数据驱动,不需额外信息的优点。
基于粗集的模糊属性值信息系统的知识获取
基于粗集 的模糊属 性值信 息 系统 的知识获取
邱 卫州 5 0 9 ) 10 0
摘 要 文 章研 究 了一 类属 性取 模 糊 值 的 不 完备 信 息 系统 的知 识 获取 方 法 。 先 给 出 了信 息 系统 的一 种 表 示 方 法 . 首 同时
1 引 言
随 着 社 会 各行 业 拥 有 数 据 的 E益 增 长 .分 析 这 些 数 据 、 l 发 现 隐含 在 其 中 的有 用 模 式 的 要求 显得 越 来 越 重 要 。 迫切 需 要 开 发 实 用 的 智 能 的数 据 分 析 技 术 。 集理 论就 是 一 种 有 效 的 数据 粗 处 理 和 知识 挖 掘 的 工 具 . 不 仅 在 理 论 上 . 且 在 诸 如 决 策 分 它 而 析 、 器 学 习 、 识 发 现 、 场 研 究 、 突 分 析 等 领 域 得 到广 泛 机 知 市 冲 的研 究 和应 用 。经 典 的 P a k粗 集理 论 对 完 备 信 息 系统 的 处 l aw 理 是 相 当有 效 的 . 对 不 完 备 知 识 、 别 是 对 模 糊 属 性 值 的信 而 特 息 系统 则 缺 乏 有效 的处 理 能 力 。 然 而 由于 各 种 原 因 , 实 中人 现 们 所 面 对 的 、 要 处 理 的 信 息 大 部 分 是 不 精 确 的 、 至 是 被 污 需 甚 染 的 . 据 集 中 的属 性 值 往 往 存 在 着 不 精 确 或 不 确 定 性 。 如 数 例 数 据 不 一 致 或 数 据遗 失 , 或者 原 始 数 据 本 身 就 是 一 种语 言值 的 模糊表示。 因此 有 必 要将 传 统 的粗 集 理 论 自然 有 效 地 扩 展 到 了 模 糊 领 域 . 模 糊 集 和 粗 糙 集理 论 有 机 地 融 合 在一 起 。 将 本 文 研 究 一 类 属性 取 模 糊 值 的非 完备 信 息 系 统 . 先 给 出 首 了关 于 这 类 系 统 的 一种 表 示 方 法 。 同 时采 用 模 糊 集 思 想 。 造 构 了关 于 这 类 信 息 系 统 的模 糊 不 可 分 辨关 系 。 在此 基 础 上 研 究 了 它 的知 识 获 取 算 法 . 以一个 实例 说 明 了这 个 算法 的有 效 性 。 并
一种基于信息熵的模糊粗糙集知识获取方法
D p r n fA tm t n Tigu nvr t,e ig 10 8 ,hn e a meto u a o ,s h aU i sy B in 0 4 C ia t o i n ei j 0
E- i: l 0 @mal . i g u . u c mal y y 1 i t n h a e .n ss d
t n ss m h s t b t vle r uz.it . e ato acl efz n i en it vle e en ojc n e c t i yt w oe ar ue a s a fzy r l t uhr cl a uz ids ri ly ausb t e bet i ah a o e t i u e Fs y h s ut y c bi w s -
a d u c r i n omai n I ti a e h u h r r p s n n p — a e k o e g c u st n a p o c o a d e n o ma n n e a n i fr t . h s p p r t e a t o p o o e a e  ̄o y b s d n wld e a q ii o p r a h t h n l if r — t o n s i
u e o a q ie r l s i al , y a x mp e t e a p o c s v rf d t e r a o a l n f ci e s d t c u r u e . n l b n e a l ,h p r a h i e i o b e s n b e a d ef t . F y i e e v
相似关 系构造模糊等价 关系, 然后根 据模糊等价 关 系建 立属性集的信 息熵表示 , 继而使 用基 于信息熵的决策表属性约 简算法获取 规 则。最后 , 通过一个 实例 , 分析说 明了这种算法的合理有效性 。 关键词 : 模糊粗糙集 ; 模糊相似度 量; 模糊 等价 关 系; 信息熵 D :0 7 8 .s.02 8 3 .0 8 30 8 文章编号 :0 2 8 3 (0 8 2 — 0 9 0 文献标识码 : 中图分类 号:P 8 OI 1. 7 /i n10 — 3 1 0 . .1 3 js 2 2 1 0- 3 1 2 0 )3 0 5 — 3 A T 1
基于广义模糊集、粗糙集的医学图像三维区域提取
2008 6月 年
西 北 工 业 大 学 学 报
J u n l fNo t we tr ltc nc lUnv riy o r a rh se nPoy e h ia iest o
J n ue
2 0 08
第2卷第3 6 期
式 中 , < M ≤ ( 一 X ) 2 M 为 可调参数 , 0 z /, z
和 Xt 分别 是 图像象 素值 的最 大 值 和最 小值 , 难 不
证 明 P = ( i, 户, )∈ [ 1 1 。 j k 一 , ] 公式 ( )为本文所 选 2
的 B O, 中 r ( , ) t ( ,/ ) GF 其 ∈ 0 1 , ∈ 0 r 2 为可调参 数 。
集、 粗糙 集 的三 维 区域提取 方法 , 以解决 医 学图像 的对 比度 低 , 织边缘 难 以区分 的 问题 。 用双 线 组 使
性 广 义模 糊 增强 算子 对 三维 医学 图像 增 强 , 用粗糙 集理 论将基 于 多种信 息 的粗糙描 述 进行 综合 , 运
实现对 感兴趣 区域 的三 维提 取 。实验证 明 , 这是 一种 可对 三维 感兴趣 区域提 取 的有 效方 法 。
Vo. 1 26 No.3
基 于 广 义 模 糊 集 、 糙 集 的 粗 医 学 图像 三 维 区域 提 取
陈 世 浩 ,王 毅 ,郝 重 阳
( 北 工 业 大学 电 子 与 信 息 工 程 研究 所 , 西 西 安 70 7 ) 西 陕 1 0 2
摘 要 : 文章 通 过研 究直 接从 三 维 医 学 图像 中提 取 感 兴趣 区域 的 问题 , 出 了一 种 基 于广 义模 糊 提
利 用 B O 对 E 度 增 强 的 广 义 模 糊 空 间再 变 换 回 GF 匕
基于模糊相似矩阵与粗糙集的规则获取
[ 键 词] 粗糙 集 ; 价 关 系 ; 糊 相似 矩 阵 ; 则获取 关 等 模 规 [ 章 编 号 ] 1 7 — 0 7 2 0 ) 1 0 2 ~ 5 [ 图 分 类 号 ] O 1 9 [ 献 标 识 码 ] A 文 6 22 2 ( 0 8 0 — 0 60 中 5 文
定 义 33 一个 决策 表是 一个 信息 表达 系统 ^一< , , , , — C U D, 一 , 属性 集 [ ] s 厂> A Cn D A是 合, 子集 c 和 D 分别称 为条 件属性 集 和决策 属性 集 , ≠ . 简记 为 : 策 表 ( ) D 可 决 , .
收 稿 日期 : 0 7 O — 7 2 0一 71
作者 简 介 : 冯
源 (9 2) 女 , 1 7 一 , 山西 太 原人 , 士 , 原师 范学 院数 学 系 讲 师 , 要 从 事 人 工 智 能 的 研 究 硕 太 主
维普资讯
第 1 期
冯
源 : 于 模 糊 相 似 矩 阵 与粗 糙 集 的 规则 获 取 基 表 1 表 决策
Ta l 1 : e d cs0 a l be Th e ii n t b e
C
U
2 7
2 )提取 确定 的规则 有 :
C2 0则 D — L; —
C1 1且 C — 0则 D = L; — 2 = =
C1 1且 C — 2则 D — S — 2 .
C1
一
个 决策 表 中的结果 属 性是 唯一 的 , 为单 一决 策 ; 时是 不 唯一 的 , 为多决 策 . 称 有 称
定 义 43 公式 一 B的逻 辑含 义称 为决 策规 则 , [ ] A称为 规则 的前 件 , B称 为规 则 的后件 , 它们 表 达一种 因果 关系 . 中 , 式 中所包 含 的原 子公 式 中只有 决 策表 中 的条件 属 性 , 中所 包含 的原 子公 式 中 只有决 其 公 B 策表 中 的决 策 属性 . 1 4 基 于粗 糙 集 的规 则获 取 .
基于粗糙集理论的数据挖掘及其应用研究
基于粗糙集理论的数据挖掘及其应用研究数据挖掘是一种非常重要的数据分析技术,它可以通过挖掘数据中隐藏的规律和模式,帮助人们更好地了解数据,并做出更加准确的预测和决策。
在数据挖掘中,粗糙集理论是一种非常常用的方法,使用它进行数据分析能够帮助人们从海量的数据中获取有用的信息。
本文将介绍粗糙集理论的基本概念和原理,并探讨其在数据挖掘中的应用。
一、粗糙集理论的基本概念和原理粗糙集理论最早由波兰数学家Pawelhehe在1982年提出,它是一种处理不确定和不完备的数据的数学方法。
其基本思想是,将数据集划分为若干个粗略的等价类,每个等价类中所含的元素在某些条件下是可区分的,在某些条件下是不可区分的。
其中,可区分的条件被称为决策属性,不可区分的条件被称为条件属性。
在粗糙集理论中,条件属性的属性值可能是未知的,因此称为不确定属性,而数据集中不确定属性的取值可被描述为一个区间。
在粗糙集理论中,主要包括粗糙集近似、知识约简、属性约简等方法。
其中,粗糙集近似是将数据集根据条件属性的取值划分成若干等价类,而知识约简和属性约简是通过减少条件属性和决策属性的数量来简化决策规则和数据集。
二、粗糙集理论在数据挖掘中的应用粗糙集理论在数据挖掘中的应用非常广泛。
它可以用于分类、聚类、关联规则挖掘等领域。
下面将分别介绍它们的应用。
1.分类分类是数据挖掘中最常见的任务之一。
粗糙集分类算法是一种基于决策表的分类方法,它可以通过减少属性和规则来简化决策表,从而得到更为精简的决策规则。
这种方法通过将数据集划分为若干等价类,然后根据条件属性和决策属性的关系推导出一系列决策规则。
通过这些决策规则,可以将新的数据划分到不同的决策类别中去。
2.聚类聚类是将数据集划分为若干个相似的群体,使得同一群的数据之间具有更高的相似度,而不同群之间的相似度则更低。
粗糙集聚类算法将数据集划分为若干个等价类,从而得到聚类结果。
该算法通过划分条件属性的取值相同的数据,然后对每个等价类中的数据进行聚类分析,从而得到最终的聚类结果。
使用粗糙集理论进行知识发现与知识提取的步骤详解
使用粗糙集理论进行知识发现与知识提取的步骤详解知识发现和知识提取是在大数据时代中变得越来越重要的任务。
粗糙集理论是一种基于不完备和不确定信息的数据分析方法,它可以帮助我们从大量数据中发现隐藏的模式和规律。
本文将详细介绍使用粗糙集理论进行知识发现和知识提取的步骤。
第一步:数据预处理在进行知识发现和知识提取之前,我们需要对原始数据进行预处理。
这包括数据清洗、数据集成、数据转换和数据规约等步骤。
数据清洗是指去除数据中的噪声和异常值,确保数据的质量。
数据集成是将来自不同数据源的数据进行整合,以便进行后续的分析。
数据转换是将数据从一个形式转换为另一个形式,例如将文本数据转换为数值数据。
数据规约是减少数据集的规模,以提高计算效率。
第二步:属性约简属性约简是粗糙集理论中的一个重要步骤,它可以帮助我们减少数据集的属性数量,提高数据分析的效率。
属性约简的目标是找到一个最小的属性子集,该子集能够保持数据集的分类能力。
在属性约简过程中,我们需要计算每个属性的重要性,并选择那些重要性高的属性。
第三步:决策规则提取决策规则是从数据中提取出来的一种知识表示形式,它可以帮助我们理解数据中的模式和规律。
在粗糙集理论中,决策规则是基于条件属性和决策属性之间的关系来描述的。
决策规则提取的目标是从数据中找到一组具有高准确性和高可解释性的决策规则。
在决策规则提取过程中,我们需要使用属性约简的结果,并应用一些启发式算法来搜索最优的决策规则。
第四步:知识评估知识评估是对从数据中提取出来的知识进行评估和验证的过程。
在知识评估过程中,我们需要使用一些评估指标来衡量决策规则的准确性和可解释性。
常用的评估指标包括支持度、置信度和准确率等。
通过知识评估,我们可以判断提取出来的知识是否具有实际应用的价值。
第五步:知识应用知识应用是将从数据中提取出来的知识应用于实际问题的过程。
在知识应用过程中,我们需要将提取出来的决策规则转化为可以使用的形式,并将其应用于实际的决策制定中。
一种基于模糊决策表的知识获取方法
一种基于模糊决策表的知识获取方法
欧阳为民;舒坚
【期刊名称】《安徽大学学报:自然科学版》
【年(卷),期】1997(021)001
【摘要】本文描述了一种基于模糊逻辑的决策表方法,该方法可用于构造知识库。
【总页数】8页(P52-59)
【作者】欧阳为民;舒坚
【作者单位】安徽大学计算中心;安徽大学计算中心
【正文语种】中文
【中图分类】TP18
【相关文献】
1.基于粗集理论的决策表知识获取方法研究 [J], 冯林;刘照鹏;黄志伟
2.基于直觉模糊粗糙集的一种知识获取方法 [J], 樊雷;雷英杰
3.一种基于信息熵的模糊粗糙集知识获取方法 [J], 阳琳谮;温明;卓晴;王文渊
4.基于模糊粗糙集的一种知识获取方法 [J], 印勇;孙如英
5.基于粗糙集理论偏序决策表知识获取方法研究 [J], 席慎思;洪晓光;孔磊;衣升起因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2006年5月重庆大学学报(自然科学版)May2006第29卷第5期Journal of Chongqing University(Natural Science Editi on)Vol.29 No.5 文章编号:1000-582X(2006)05-0108-04基于模糊粗糙集的一种知识获取方法3印 勇,孙如英(重庆大学通信工程学院,重庆 400030)摘 要:将粗糙集理论与模糊集理论相结合,提出了一种基于模糊粗糙集的知识获取方法.该方法利用模糊集理论对决策表中连续属性进行模糊化;通过定义模糊等价类得到模糊粗糙近似空间的上、下近似,从而获取决策规则.实例验证了此方法的有效性.关键词:模糊粗糙集;决策表;属性约简;知识获取中图分类号:TP182文献标识码:A 粗糙集理论是一种研究不精确、不确定知识的数学工具.粗糙集方法具有以下几个优点:不需要给出额外信息;简化输入信息的表达空间;算法简单,易于操作[1].由于粗糙集处理的对象是类似二维关系表的信息表,信息表中连续属性是普遍存在的,但是粗糙集的数学基础是集合论,直接处理连续属性的能力非常有限,因此连续属性的离散化是制约粗糙集理论实用化的难点.模糊集可以用来表示集合中子类边界的模糊性,是由隶属度函数来刻画的.因此将模糊集和粗糙集相结合构成模糊粗糙集可以更好地描述信息系统[2].笔者将模糊集与粗糙集相结合,提出了一种基于模糊粗糙集的知识获取方法,以一个实例说明了此方法的有效性.1 模糊粗糙集及属性约简算法在粗糙集中,条件属性和决策属性都是清晰的,属性对应的是等价关系,约简处理时,对象属性值必须是经过离散化的.而在模糊粗糙集中,由于引入了模糊集合理论,条件属性和决策属性都可以是模糊的,属性对应的是相似关系,属性约简中,对象属性值可以保持原样而无须进行离散化,粗糙集离散化后的每个符号表示对应于模糊粗糙集合中单个属性下的一个模糊等价类,相应地,离散化过程也就被属性模糊化过程所代替.1.1 基本概念定义1 一个决策表系统S=<U,A,V,f>为一个信息知识表达系统,其中U≠Φ为论域;A=C∪D,C 和D分别为条件和决策属性集,且C∩D=<;V为属性的值域集,V=∪Va,a:A,V a为a属性的值域;f为信息函数,f:U×A→V,对Πx:U,a:A,存在(f(x,a):Va.定义2 如果满足如下条件:自反性 μR(u,u)=1,Πμu:U对称性 μR(u,v)=μR(v,u),Πu,v:U则称模糊关系R∈F(u×u)为上的模糊相似关系.1.2 属性模糊化在模糊粗糙集的应用中,模糊等价类的划分是必须考虑的问题.在粗糙集中,属性对应的等价类是普通集合,而在模糊粗糙集中,属性对应的等价类是模糊集,因此,往往把属性的等价类划分过程称为属性模糊化过程.在粗糙集中,每个对象属于且仅属于一个等价类,在模糊粗糙集中,每个对象可以属于多个模糊等价类.模糊等价类既可以保留同一子区间内属性值的差异性,又能体现相邻子区间内的属性值之间的过渡性.对于决策表中任一连续属性,根据其值域的大小和属性值的分布,可以把模糊化为k个语义变量.每个语义变量具有如图1所示的隶属度函数,其中u(x)为隶属度,x为属性值.k个模糊划分的中心mi可由Ko2 honen网络自组织映射算法确定[3].为保证模糊划分的完备性,2个相邻隶属度函数相交处的函数值取为0.5[4].用上述方法求出的是单个属性的模糊等价类,为3收稿日期:2005-11-13基金项目:重庆市应用基础研究项目(6976)作者简介:印勇(1963-),男,重庆市人,重庆大学副教授,博士,主要从事智能信息处理和图像处理方面的研究.图1 隶属度函数了进行属性约简,需要求复合属性(属性集合)的模糊等价类.粗糙集中,复合属性对论域的划分可以表示为U /A = (U /a |a :A ),(1)其中U /a 是属性a 对论域划分形成的等价类集合; 算子定义为:A B ={X ∩Y ∶ΠX :A t ,ΠY :B ,X ∩Y ≠<,(2)若A ={a 1,a 2,…a n },则式(1)可以写成U /A ={X 1i 1∩X 2i 2,∩…∩X n in |x 1,:U /a 1,X 2i 2:U /a 2,…X i in :U /a n }.(3)用<F 2,F 2,F 3…F n >表示式(2)中U /A 的等价类F 1∩F 2∩…∩F n ,根据公式(A ∩B )(X )=A (X )∩B (X )=m in {A (X ),B (X )},(4)得到对象x :U 对该等价类的隶属度为:μ<F 1F 2f i ...>(X )=m in (μF 1(x ),μF 2(x ),…,μF n (x )},(5)为简单起见,上式用Zadeh 定义的m in 运算表示了模糊交运算[5].1.3 模糊粗糙集的上下近似集及属性依赖性分析 在模糊粗糙集中,每个等价类都是模糊的,它的上、下近似可以定义如下:μpx (F 1)=inf x max {1-μF i (x ),μX (x )},Πi,μpx (F 1)=sup x m in {μF i (x ),μX (x )},Πi,(6)其中F i 是一个模糊等价类.μx (x )是对象属于U 上的任意模糊集合X 的程度.对于F :U |C 的模糊正域定义为:μpos c (f i )=sup x ∈U |Cm in {μxF i (x ),μpos c (F i )},(7)其中X 是决策属性C 的模糊等价类.x :U 对模糊正域的隶属度为:μpos c (x )=sup F i ∈U |Cm in {μF i (x ),μpos c (F i )},(8)根据模糊正域的定义,可以求出模糊粗糙集条件下决策属性对条件属性集合的依赖度:r c (D )=|U POS e (x )||U |=ΣXU U PO S c (x )|U |,(9)1.4 基于模糊粗糙集的属性约简算法属性约简是指在保持决策表分类或决策能力不变的前提下,删除冗余属性[6].可利用下面的定义来表示.定义3 设C 和D 分别是决策表的条件属性集合和决策属性集合,对于C 的子集C ′,若满足1)γC (D )=γC ′(D );2)从C ′中删除任何属性a 后都有γC ′-(a )=γC ′(D );则称C ′是C 的相对于决策属性D 的一个约简.根据上述定义设计下面的属性约简算法.首先取一个空集R,依次把那些使γR (D )得的增量达到最大的属性添加到集合R 中来,直到γR (D )达到最大.输出决策表一个最小属性约简.算法流程图如图2.图2 属性约简算法流程图2 一种模糊粗糙集知识获取算法根据上面的模糊粗糙集模型,提出一种知识获取算法,其算法步骤如下:1)采用三角隶属度函数对连续属性进行模糊化,得到每个属性的模糊等价类;2)根据上述属性约简算法计算决策表的属性约简,删除冗余属性,得到条件属性最小简化;3)对每个实例求其属性值的值核,并删除多余的901第29卷第5期 印 勇,等:基于模糊粗糙集的一种知识获取方法属性值,得到其最小属性值简化;4)删除决策表中重复实例,归纳出决策规则.3 实例分析为了证明此算法的有效性,选择如表1所示的信息系统,此系统有4个条件属性{晴朗度指数(a 1),温度指数(a 2),湿度指数(a 3),风况指数(a 4)}取值均在[0,1]之间,一个决策属性{d}.表1 一个信息系统No a 1a 2a 3a 4d10.800.900.900.30020.750.850.880.50130.500.950.750.20140.200.600.800.20150.150.950.500160.250.300.550.60070.450.200.550.65180.780.700.850.10090.900.400.450.401100.200.650.400.450110.950.550.600.551120.500.550.800.601130.600.900.600.201140.100.450.850.50 首先,对{a 1,a 2,a 3,a 4}4个连续属性进行模糊化,构造如图3所示的三角隶属度函数.图3 模糊隶属度函数根据最大隶属度原则,可以确定样本属于哪个类,即可以得到这2个连续属性对论域的模糊划分:U /a 1={{4,5,6,10,14},{3,7,12,13},{1,2,8,9,11}},U /a 2={{6,7},{4,9,10,11,12,14},{1,2,3,5,8,13}},U /a 3={{5,6,7,9,10,11,13},{1,2,3,4,8,12,14}},U /a 4={{1,3,4,5,8,13},{2,6,7,9,10,11,12,14}};利用约简算法进行属性约简,经计算得到,γ{a 1,a 2,a 3,a 4}(d )=γ{a 1,,a 4}(d )=0.702381,结果表明属性a 2,a 3对于决策属性d 是冗余的.然后,对决策表进行属性值的约简,消去每条决策规则中属性的冗余值,得到决策规则的一种最小解并提取出决策规则如下:1)I f 0.75<a 1<0.95,and 0<a 4<0.3,then d =0;2)I f 0.1<a 1<0.25,and 0.4<a 4<0.65,then d =0;3)I f f 0<a 4<0.3,then d =1;4)I f 0.45<a 1<0.6,and0.4<a 4<0.65,then d =1;5)I f 0.75<a 1<0.95,and0.4<a 4<0.65,then d =1.4 结 论笔者将模糊集和粗糙集相结合,提出了一种基于模糊粗糙集的知识获取方法.该方法利用模糊理论对决策表的连续属性进行模糊化,可以避免直接离散化带来的一些不足,而且对于边界不清晰的连续属性,可以更为符合实际问题的表示.通过定义模糊等价类得到模糊粗糙近似空间的上、下近似,构造基于模糊粗糙集的属性约简算法,避开了离散化过程,可以减少信息损失.为解决粗糙集中连续属性的规则获取问题提供了一个有效的方法.参考文献:[1] 曾黄麟.粗集理论及其应用[M ].重庆:重庆大学出版社,1996.[2] 陈奇南,梁洪俊.模糊集和粗糙集[J ].计算机工程,2002,28(8):138-140.[3] K OHONE N T.28(8)Self -organizati on and ass ociativeme mory [M ].Berlin:Sp inger,1988.[4] 武妍,施鸿宝.一种保证隶属度函数完备性和模糊集合语义一致性的学习方法[J ].Journal of Computer Research &Devel opment,1999,39(9):1080-1085.[5] 汪培庄.模糊集合论及其应用[M ].上海:上海科学技术出版社,1983.[6] R I CHARD JE NSE N ,Q I A NG SHE N.Semantics 2PreservingD i m ensi onahity Reducti on Rough and Fuzzy 2Rough 2Based App r oaches[J ].I EEE Transacti ons on Knowledge and Data Eng ineering,2004,16(12):1457-1471.011重庆大学学报(自然科学版) 2006年Knowledge Acquisiti on Approach Based on Fuzzy 2rough SetYI N Yo ng,SUN R u 2yi ng(College of Communicati on Engineering,Chongqing University,Chongqing 400030,China )Abstract:A ne w method of knowledge acquisiti on based on fuzzy -r ough set is p r oposed .The continuous attributes in the decisi on table are fuzzified with the fuzzy me mbershi p functi ons .Lower and upper app r oxi m ati on of fuzzy -r ough set are obtained by defining fuzzy equivalence relati on .According t o the m the decisi on rules are acquired .A t last,an ex 2a mp le is illustrated and p r oves that the app r oach is effective .Key words:fuzzy 2r ough set;decisi on table;attribute reducti on;knowledge acquisiti on(编辑 张小强)(上接第107页)I nfluence of Popul ati on Si ze on Characteristi cof WaterDe mand i n S mall TownsJ I Fa ng 2yi ng1,2,ZEN G Yao 2,Y AO Yua n 2,L I U Tao2(1.Key Laborat ory of the Three Gorges Reservoir Regi on ’s Eco -Envir onment Under the State M inistry of Educati on;2.College of U rban Constructi on and Envir onment engineering,Chongqing University,Chongqing 400030,China )Abstract:D ifferent populati on size is differentin consu mp ti on of water res ources,different t own scale have effect on water de mand t o a great extent .So studying on influence of populati on size on characteristic of water using is i m portant t o reveal characteristic of water consump ti on .This paper makes s mall t own int o three grades as large,medium ,s mall 2sized,accord 2ing t o t ownshi p populati on of s mall t own,chooses typ ical t own t o investigate,and receives water de mand level of typ ical t o wn thr ough statisticcalculati on .A ls o,t o study the relati onshi p bet w een populati on size and the change of water con 2sump ti on by anal ogis m ,and suggestthat coefficient of daily variati on is fr om 1.75t o 1.95,while hourly variati on is fr om 2.0t o 2.4,and higher as populati on size is s maller .Key words:s mall t own;populati on size;characteristic of water de mand(编辑 姚 飞)111第29卷第5期 印 勇,等:基于模糊粗糙集的一种知识获取方法。