4第四讲基于包含度的决策表约简

合集下载

基于属性重要性的决策表属性约简算法

ＡｎＡｌｏｉｈｍｆＡｔｒｂｔｄｃｉｎｏｃｓｖｂｅｇｒｔｏｔｉｕｅＲｅｕｔｏｆＤｅｉｉｅＴａｌ
ＢａｅｎＡｔｒｂｕｅＩｐｒａｅｓｄｏｔｉｔｍｏｔｎｃ
ＹＡＮＧｅｇｆ一ＨＵｎＣｈｎ —ｕ，，ＳＬａ
（．ｉｅｓｔｆｅｔｎｃＳｉａｄＴｅｈ．Ｃｈｎｄ１０４，ｉａ１Ｕｎｖｒｉｏｃｒｉｃ．ｎｃｎ，ｅｇｕ６０５Ｃｈｎ；ｙＥｌｏ
２．Ｈｅｉｉｅｉ，ｈｇｅ３００Ｃｉ）ｘｖｒｔＺａｙ４０，ｈｎＵｎｓｙｎ７ａ
Ｋｅｒｓｒｕｈｓｔｔｒｂｔｍｐｒａｃ；ａｔｉｕｅｒｄｃｉｎｙｗｏｄ：ｏｇｅ；ａｔｉｕｅｉｏｔｎｅｔｒｂｔｅｕｔｏ
Ｏ引言
粗糙集理论是由波兰科学家Ｐｗａａｌｋ在１８提出９２年的一种数学理论 … ，理论主要用于数据分析，其对不该尤精确和不确定的数据进行分析。近年来，已被广泛应用它到人工智能、式识别和数据挖掘等方面。属性约简是粗模糙集理论中的一个重要的课题，一般说来，识库中的知知
准则，通过逐步缩减来求取约简。同时给出了该算法的时间复杂度分析，例验证了所提出算法的有效性和实用性。并举关键词：集；重要性；性约简粗糙属性属
中图分类号：ＰＯ．Ｔ３１６文献标识码：Ａ文章编号：６３２Ｘ２０）１０６ — ２１７ —６９（０６ｌ — ０２０

决策表决策值的简化

决策表决策值的简化
李小霞;陈绵云
【期刊名称】《中国石油大学学报（自然科学版）》
【年(卷),期】2004(028)004
【摘要】首先定义了决策规则决策属性的简化,并以此为基础定义了决策表决策值的简化,旨在研究决策表条件值简化的对偶问题,即在保持决策表条件属性集不变的前提下它的条件属性集和决策属性集之间的最简函数关系.在这些定义的基础上,给出了决策规则决策属性简化的表达式和决策表决策值简化的表达式.
【总页数】3页(P138-140)
【作者】李小霞;陈绵云
【作者单位】中山大学计算机科学系,广东广州,510275;华中科技大学控制科学与工程系,湖北武汉,430074;华中科技大学控制科学与工程系,湖北武汉,430074【正文语种】中文
【中图分类】TP18
【相关文献】
1.区间值决策表的决策风险最小化属性约简 [J], 徐菲菲
2.用属性单值表示的决策表简化算法及属性核计算 [J], 李淑智;徐光华;华成
3.新简化决策表的研究 [J], 王希雷;王磊;马永军
4.对决策表和简化决策表的研究 [J], 王希雷;苏静
5.粗集决策表与决策表简化的可信度比较 [J], 王德松;舒兰
因版权原因，仅展示原文概要，查看原文内容请购买。

基于包含度的不一致决策表约简新方法

ＳｉＸＵＪｕｃｅｇＭＡａ — ｕｎＵＮＬｎ，ｉ— ｈｎ，Ｙｕｎｙａ
河南师范大学计算机与信息技术学院，河南新乡４３０５０７
ＣｏｌｇｆＣｏｕｔｒ＆Ｉｆｒｔｏｃｏｏｙ，ｎａｒａＵｎｉｅｓｔＸｉｘａｇ，ｎｎｎ４５３０７，ｎｌｅｅｏｍｐｅｎｏｍａｉｎＴｅｈｎｌｇＨｅｎＮｏｍｌｖｒｉｙ，ｎｉｎＨｅａ０Ｃｈｉａ
ｃｅｃｎｘｏｅｔｌａｎｉｔｅｓｅｆｄｃｓｎｔｂｓｔｅｊｄｍｎｈｏｅｉｒｓｅｔｔｄｓｂｔｎｒｄｃｏｓｏ — ｒｓｅｔｅｐｎｎｉｌｇｗｔｈｉｏｅｉｏａｌ，ｕｇｅｔｔｅｒｍｗｔｅｐｃｏｉｒｕｉｅｕｔｎｉｂａｏｈｚｉｅｈｈｔｉｏｉ
维普资讯
１６２０，３２）６０７４（４
ＣｍｕｅｎｎｅｎｎｐｌａｏｓｏｐｔｒＥ￣ｅｄｇａｄＡｐｉｔｎ计算机工程与应用ｃｉ
基于包含度的不一致决策表约筒新方法
孙林，久成，徐马媛媛
分析表明，新的属性重要性是一种更有效的启发式信息，方法时间复杂度较低，该有助于搜索最小或次优约简。关键词：粗糙集理论；不一致决策表；知识约简；包含度文章编号：０２８３（０７２ — １６０文献标识码：中图分类号：Ｐ８１０ — ３１２０）４０６ — ３ＡＴ１
ｗｔｅａａｉｏｓｔｔｂｅｔｆｒｉｃｎｉｅｔｏｊｃｓａｅｉｉｃｎｅｆａｔｂｔｓｄｆｅｉｎｏｓｔｔｄｃｉｎｉｓｐｒｔｇｃｎｉｅｏｊｃｓｏｍｎｏｓｔｎｂｅｔ，ｎｗｓｎｆａｃｏｔｕｅｅｎｄｎｃｎｉｅｅｉｏｈｎｓｎｓｇｉｉｒｉｉｉｓｎｓ

决策表的一种知识约简与规则获取方法

收稿日期:2006-02-28作者简介:孙胜(1978-),男,湖北黄冈人,博士研究生,研究方向为现代数据库理论与技术及系统实现;导师:王元珍,教授,博士生导师,主要研究方向为现代数据库理论及实现技术。

决策表的一种知识约简与规则获取方法孙胜1,2(1.华中科技大学计算机学院,湖北武汉430074;2.黄石理工学院计算机学院,湖北黄石435003)摘要:粗糙集理论是一种新型的数据挖掘和决策分析方法,利用粗糙集理论进行决策表的知识约简与决策规则挖掘已经成为研究热点。

文中介绍了粗糙集的基本理论,在此基础上运用该理论对从决策表中获取最小规则进行了研究,提出了决策表约简的启发式方法,并通过一个具体实例详细说明了决策规则获取过程,实例分析表明了其有效性。

关键词:粗糙集;决策表;决策规则;属性约简中图分类号:T P311.131 文献标识码:A 文章编号:1673-629X(2006)09-0035-03Knowledge Reduction and Rule Acquirement Method in Decision TableSUN Sheng 1,2(1.Schoo l of Computer Science,Huazhong U niv ersity of Science and T echnolog y,Wuhan 430074,China;2.School of Computer Science,Huangshi Institute of T echnolog y,Huangshi 435003,China)Abstract:Rough set theory is a new data mining and decision analysis method.Knowledge reduction and decision rule mining in decision table by using rough set theory has become a research hotspot.T he article introduces basic con cepts in rough set theory first.M inimal dec-i sion rule acquirement in deci sion table based on rough set theory i s researched.A heuristic approach for rule reduction is put forward,and the procedure of decisi on rule acquirem ent is i lluminated using an example.T he instance analysis show s its validity.Key words:rough set;deci sion table;decision rule;attribute reduction0 引言粗糙集理论是由波兰科学家Z.Paw lak 教授于1982年提出的一种研究不精确、不确定性知识的数学工具[1,2]。

aai09粗糙集高级人工智能史忠植

2019/11/12
高级人工智能史忠植
7
研究现状分析
史忠植. 知识发现. 北京: 清华大学出版社, 2002 刘清. Rough Set及Rough推理. 北京: 科学出版社,
2001 张文修等. Rough Set理论与方法. 北京: 科学出版社,
2001 王国胤, Rough Set理论与知识获取. 西安: 西安交通大
学出版社, 2001 曾黄麟. 粗集理论及其应用(修订版). 重庆: 重庆大学
出版社, 1998
2019/11/12
高级人工智能史忠植
8
研究现状分析
2001年5月在重庆召开了“第1届中国Rough集与软计算学术研讨会”，邀请了创始人Z. Pawlak教授做大会报告；
2002年10月在苏州第2届
IND IS (B) {( x, x') U 2 | a B, a(x) a(x')}
where INDIS (B) is called the B-indiscernibility relation.
• If (x, x') INDIS (B), then objects x and x’ are indiscernible from each other by attributes from B.
2019/11/12
高级人工智能史忠植
11
二、知识分类
设PR，且P ，P中所有等价关系的交集称为P上的一种难区分关系(indiscernbility relation)
（或称难区分关系），记作IND(P)，即
[x]IND(p)= I [x]R
RP
注意，IND(P)也是等价关系且是唯一的。

一种基于约简树的决策表属性约简方法

系统分类能力不变的前提下，通过知识约简，出问题的决导
（如果和是公式，ｌ，，，２）￣．＾Ｖ一都是Ｊ３
公式。
（）３只有按（）（）１、２所组成的式子是公式。定义３．一个对象 ∈Ｕ满足Ｓ＝（，中的公式，Ａ）记
由上面的条件我们有：
１粗糙集理论”
定义１一个信息系统Ｓ．可以表示为Ｓ＝＜ＵＡｅ＞，，，，ｆ
ＢＩＹｎ—ｈｉＷＡａ—ｙＡｕｕＮＧＨｕ
本文首先给出了约简树的定义，出了采用宽度优先的策略构造约简树，构造约简树的过程中。某提在把个结点处决策规则是否一致作为在该结点处是否可以继续构造子树的条件．该结点是否已经出现过把作为剪枝条件，并把相对核作为构违约简树的一个重要的终止条件。随后研究了约简树的性质，到了找基于约简树的决策表的极小属性集。最后分析了该方法在最好和最坏情况下的时间复杂度。实例分析
维普资讯
■■攘木与僵一亿
一
种基于约简树的决策表属性约简方法
白运会王化雨
ＡｎＡｔｉｕｅＲｅｕｔｎＡｐｒａｈｆｒＤｅｉｉｎＴｂｅＢｓｄｏｄｃｉｎＴｅｔｂｔｄｃｉｐｏｃｏｃｓｏａｌａｅｎＲｅｕｔｎｔｅｃａａｔｒｆｈｄｃｉｎｔｅｒｅｅｒｈｄａｄｔｅｍｉｉｌｔｂｔｅｕｔｎｅｕｔｒｅｏｄｔｅｈｈｒｃｅｓｏｅｒｕｔｒｅｗｅｅｒｓａｃｅｎｈｎｍａａｔｕｅｒｄｃｉｔｅｏｉｒｏ

基于包含度的决策表属性约简算法的研究

区分矩阵对于不相容决策表来说是错误的［它不一定能正确６１，求出核属性集；次求出多个约简后，实际应用中一般不去其在比较各个约简的优劣：后在合取范式转化为析取范式的过程最也是相当复杂的。献ｌｌｆ的算法巾求核属性集时用到的区文４给ｌｌ分矩阵对于不相容决策表也是错误的：者在求出核属性集再后，约简中的非核属性时以非核属性在区分矩阵巾的出现次求数为标准，没有理论依据，这很难给出严格的数学证明；外它另
维普资讯
基于包含度的决策表属性约简算法的研究
孙士保１秦克云，２
（西南交通大学理学院，成都６０３）１０１（河南科技大学电子信息工程学院，南洛阳４１０）河７０３
Ｅ— ｉ：ｈｂｏｕ＠１３ｃｒｍａｌｓｉａｓｎ６ｏｅｆｌｕａｉｔ．ｉａｌ．ｔｒｄｃｓｅａｌｓｏＩｄｔｂｓｓａｄｈｅｕｔｈｗｔａｏｒｃｍｐｅｅｒｅａｄｈｓｐｗｒｕｓｂｌｙＦｎｌｉｅｕｔｘｍｐｅｆＵＣａａａｅｎｔｅｒｓｌｓｏｈｔｉｙｓｉｃｎｇｔｂｔｒｅｆｃｓｔａｅｅｔｆｔ．ｅｅ
ＳｉｎｅａｄＴｃｎｌｙＬｏａｇＨｅａ７３ｃｅｃｎｅｈｏｇ，ｕｙｎ，ｎｎ４０）ｏ１０

决策表的最近近似约简

效．
２信息系统与决策表
定义１称（，为信息系统，其中己是有限对象集合，即Ｕ＝｛。：… ）Ａ是有限属性集，即，Ｆ），，，；Ａ＝｛。：…ａ｝Ｆ是ｕ与Ａ的关系集，即Ｆ＝｛：，，ｍ；Ｕ，）其中ｋ，ａ的有限值域．ｋ
３决策表的近似约简
为了刻画边界的不确定性对属性约简的影响，我们给出如下定义：
定义２设，，）ＡＦ为信息系统，对于集合ＸＵ，称为集合的
Ｒ＝｛］ ∈Ｕ）Ａ【：，
收稿日期：２０．１３０８０．２
作者简介：赵雪芬（９３），宁夏大学新华学院助教，研究统计与人工智能的数学基础．１８一，女学基金项目：教育部科学技术研究重点项目（ｏ２６５，宁夏自然科学基金资助项目（０１）Ｎ０１９）ＮＺ５６
ｌｌ
＝Ｒ
ｕＡ＝／＝４，，ｐ．／ｕ｛ …Ａ）
为Ａ确定的不可区分关系在上产生的分划．对于集合ＸＵ，当（＝）Ｘ＝ａＸ）ＢＤ（Ｒ（或Ｎ）＝２（ｊ
时，称为Ａ一精确集；当ｇ（ ≠ （或ＢＤ（）瓦）Ｎ）≠ 时，称为Ａ一粗糙集，它的不确定性是由边界
维普资讯
第３４卷第３期
Ｊ
ｏｕｍａｆＳｔｗｅｔＵｎｉｅｉｙｆｒＮａｉｎａｌｉＮａｕａｌｉｃｔｏｎｌｏｏｕｈｓｖｒｓｔｏｔｏｉｅｔｒ１ｅｎｅＥｄｉｉｔｓＳｃ

决策表的一种知识约简与规则获取方法

成为研究热点。文中介绍了粗糙集的基本理论，此基础上运用该理论对从决策表中获取最小规则进行了研究，出了决在提策表约简的启发式方法，通过一个具体实例详细说明了决策规则获取过程，例分析表明了其有效性。并实关键词：糙集；策表；规则；性约简粗决决策属
能在缺少关于数据的先验知识的情况下，仅以对数据的仅
ｌ有关的粗糙集概念
现实世界中的信息，在粗糙集理论中用决策表的形式
给出。面先简要介绍一下文中主要用到的Ｒｕｈ基本下ｏｇ集
Ｋｅｒｓｒｕｈｓｔｄｉｉｎｔｂｅ；ｅｉｉｎｒｌ；ｔｒｂｔｅｕｔｎｙｗｏｄ：ｇ；ｅｓａｌｄｃｓｏｕｅａｔｕｅｒｃｉｏｅｃｏｉｄｏ
Ｏ引言
粗糙集理论是由波兰科学家ＺＰｗａ．ａｌｋ教授于１８９２
ＳＵＮｈｎＳｅｇ，
（、ｈｏｏｏｕｅｃｎｅＨｕｚｏｇＵｎｖｒｔｆｉｃｎｅｈｏｇ，ｈｎ４０７，ｈｎ；１Ｓｏｌｆｍｐｔｒｉｃ，ａｈｎｉｓｙｏｅｅａｄＴｃｎｌｙＷｕａ３０４ＣｉｃＣＳｅｅｉｃＳｎｏａ
孙胜２，
（．中科技大学计算机学院，１华湖北武汉４０７；３０４
２黄石理工学院计算机学院，，湖北黄石４５０）３０３
摘要：糙集理论是一种新型的数据挖掘和决策分析方法，粗糙集理论进行决策表的知识约简与决策规则挖掘已经粗利用

人工智能原理及其应用(王万森)第3版-课后习题答案

机终端进行会话。

测试开始后，由测试主持人向被测试对象提出各种具有智能性的问题，但不能询问测试者的物理特征。

被测试对象在回答问题时,都应尽量使测试者相信自己是“人”，而另一位是”机器”。

在这个前提下，要求测试主持人区分这两个被测试对象中哪个是人，哪个是机器。

如果无论如何更换测试主持人和被测试对象的人，测试主持人总能分辨出人和机器的概率都小于50%，则认为该机器具有了智能。

1.5人工智能的发展经历了哪几个阶段？解：孕育期，形成期，知识应用期，从学派分立走向综合，智能科学技术学科的兴起1.6人工智能研究的基本内容有哪些？解：与脑科学与认知科学的交叉研究智能模拟的方法和技术研究1.7人工智能有哪几个主要学派？各自的特点是什么？解：符号主义：又称为逻辑主义、心理学派或计算机学派，是基于物理符号系统假设和有限合理性原理的人工智能学派。

符号主义认为人工智能起源于数理逻辑，人类认知（智能）的基本元素是符号，认知过程是符号表示上的一种运算。

联结主义：又称为仿生学派或生理学派，是基于神经网络及网络间的联结机制与学习算法的人工智能学派。

联结主义认为人工智能起源于仿生学，特别是人脑模型的研究。

行为主义：又称进化主义或控制论学派，是基于控制论和“感知-动作”控制系统的人工智能学派。

行为主义认为人工智能起源于控制论，提出智能取决于感知和行为，取决于对外界复杂环境的适应，而不是表示和推理。

1.8人工智能有哪些主要研究和应用领域？其中哪些是新的研究热点？解：机器思维:推理、搜索、规划机器学习：符号学习、联结学习、知识发现和数据挖掘机器感知：机器视觉、模式识别、自然语言理解机器行为：智能控制、智能制造计算智能：神经计算、进化计算、模糊计算分布智能智能系统：专家系统、智能决策支持系统人工心理与人工情感研究热点：智能机器人、智能检索、智能游戏等。

1.9 人工智能未来发展有哪些值得思考和关注的重要问题？解：多学科交叉研究分布智能与社会智能研究集成智能研究智能网络研究认知计算与情感计算研究智能系统与智能服务第2章确定性知识系统参考答案2.1 什么是知识？有哪几种主要的知识分类方法？解：知识是人们在改造客观世界的实践中积累起来的认识和经验；知识是对信息进行智能性加工中形成的对客观世界规律性的认识。

基于包含程度的属性重要性定义

Ｓｃ（ｃＤ）一（． ‘ ｌＤＣ）＝（ｇｃＤ）
ｃ关于Ｄ的重要性定义为
特别地，Ｃ当：｛｝时，性口∈ Ｃ关于Ｄ的重要性定义为口属ＳＣ（）＝ｃＤ）一ｙ｝Ｄ） ’ ｌＤａ（ｇｃ（，其中ｃＤ）＝ｌＯｃＤ）ＩＵｌ（Ｓ（Ｐ／ｌ＿
纪军，：等基于包含程度的属性重要性定义
６７５
立的，则称Ｃ是Ｃ相对Ｄ的属性约简，Ｃ为代数约简，为ｒｄＣ＝Ｃ，有属性约简的交集称为属性称记ｅ（）所核，为ｃｒ（）记ｏｅＣ．定义７令ｃ和Ｄ分别为条件属性集和决策属性集，属性子集ｃ
相对于Ｄ是不必要的，否则称口在ｃ中相对于Ｄ是必要的，果ｃ如定义６给定决策表Ｓ＝（，ＵＣＵＤ，
收稿日期：０９１—２２０ —０１
Ｃ中任意属性相对于Ｄ都是必要的，
，Ｃ对Ｃ，如果ＰＳ，Ｄ）＝ＰＳ（Ｏ（ＯｃＤ）且ｃ相对于Ｄ是独
了基于该定义下的属性最佳约简方法，最后结合实例说明该方法的有效性．
关键词：属性约简；属性重要性；包含程度
中图分类号：ＰｌＴ８
文献标识码：Ａ
２纪８代由Ｐｗａ０世Ｏ年ａห้องสมุดไป่ตู้ｋ等人提出的粗糙集理论．是处理数据的新方法，它目前在信息检索、数据挖掘、文本分类、模式识别等许多领域得到了广泛的运用．在粗糙集理论中，知识约简是一个核心内容，谓知所识约简，就是在保持知识库的分类能力不变的条件下，除知识库中不相关或不重要的冗余知识］一般来删．

基于包含度的不完备序信息系统属性约简的一种算法

ｌ
Ｄ（（）ＡＢ）＝八Ｄ］／ｘ］）ＡＡ／（）（ＡＩ一
定理２１设Ｌ＝（，是一个不完备序信．Ａ）息系统，ＢＡ，则＝当且仅当，于是
Ｄ（Ａ）ＡＢ）Ａ（／（）＝１．
证明（）当
文献标识码：Ａ
０引言
粗糙集理论是波兰数学家ＺＰｗａ．ａｌｋ于１８９２年提出的一种处理和分析不精确、不协调、完备、不
不完备信息系统的信息熵、粗糙熵及知识粒度等不
确定度量；夺谦等人从信息论的角度，于互信苗基
ＣＯ等人在优势关系下定义了基于分类质量的属性
上，出了一种基于包含度的属性约简算法；提最后，过实例分析表明，算法能得到不完备序信通该
息系统的一个约简．
１不完备序信息系统
定义１１形式上，四元组Ｌ＝（Ａ，．Ｕ，
一
是
个信息系统，中表示对象的非空有限集合，其
＝ｕ。是属性口的值域表示Ｕ× ＋的一Ａ．
称为论域；表示属性的非空有限集合；ＡＶ个信息函数，它为每个对象的每个属性赋予一个信息值，即任意的口∈Ａ，￡Ｕ，）∈ ．常也口通用Ｌ＝（，）ｕＡ代替Ｌ＝（，，ＵＡＶＪ．在一个信息系统中，如果在某个属性值域上建立了偏序关系，则称这个属性为一个标准．当所有的属性都为标准时，该信息系统称为序信息系统

基于决策规则的属性约简算法

２粗糙集基本概念竹
定义１设Ｓ（，，，）一＝ＵＡｆ为信息系其中：是Ｖ统，对象的空有限合，＝ｘ，）Ａ非集Ｕ｛， …，；是１，）
属性集合；Ｖ＝Ｕ，是属性ａ的值域；ｆ：ＵｘＡ
’ ’
是一个信息函数，它为每个对象的每个属性赋
ＨＩＤＢＹ￣，Ｎ（），Ｎ（｛ｌＵｙＤＢｘ）ＹＩｊ
为方便起见，在不产生混淆的情况下用代替ＩＤ（１ＮＢ．
定义３设Ｓ（，，，）＝ＵＡＶｆ是一个决策表，ＡＣＤＣ，＝，Ｄ＝其中ｃＵＮ为条件屙ｆ生集，Ｄ为决策属
・通讯作者：李相朋（９３）男，１６一，教授，研究方向：信息系统与知识发现
第２４卷第６期
２年１月０１１２
武
汉
纺
织
大
学
学
报
Ｖ＿．４ＮＯ６０２．１
Ｄｅｃ．２０１１
ＪＵＲＮＡＬＯＯＦＷＵＨＡＮＴＥＸＴＩＵＮＩＬＥＶＥＲＳＩＴＹ
基于决策规则的属性约简算法
廖倩，李相朋
ａＥＡ ’ ’
予一个信息值，即Ｖ ∈ ，∈ ，（，）ＶｘＵａＡｆ ∈ ａ。若Ａ可以分为条件属性集Ｃ和决策属性集Ｄ，即
Ａ＝ＣＵＣＮ，则称该信息系统为决策系统决策表。决策表分为一致决策表和不一致决策表，本文Ｄ，Ｄ＝
讨论一致决策表。
０－Ｘｉｙ）时，，不确定的规则。显然，－Ｘｉ，＜］（，，＜１是ｔ￣．ｙ，则是确定规则。本文讨论一致决策表，它ｃ生成的决策规则都是确定性规则。

第四章属性值约简(决策规则约简)

第四章属性值约简（决策规则约简）§1 属性值约简属性约简分两类，一类是信息表约简，一类是决策表约简。

信息系统S ={U ,A }的约简，是对整个属性集A 进行约简，要求利用最少属性的属性集能提供与原属性集A 同样多的信息，在此若A a ∈是冗余属性，则是将a 去掉后则A -{a }与A 具有同样的分类能力，即有下面相同的等价类族：{}A U a A U =-若{}a A -是独立的，即{}a A -中任意去掉一个属性，都将改变其分类能力，则{}a A -就是A 的一个约简。

A 的约简是A 中独立的子集P 并且P 与A 具有同样的分类能力，而{}P A -中的属性对P 来说都是冗余属性。

信息表的特点是属性集A 不再划分为条件属性集和决策属性集。

对于决策表()D C A U T ==,来说，约简的情况不同，它不是针对整个属性集A 进行的，约简的只是条件属性集。

决策表的约简分两部分：第一步：属性集约简若果C P ⊆，满足P 是关于决策属性集D 独立的，并且()()D Pos D Pos C P =，则P 是C 的D 约简。

C 中的所有D 约简的交()D RED C 称为C 的核，记作()C Core D 。

第二步：属性值约简设()D C U T ,=是一致性决策表，C P ⊆是C 的D 约简。

值约简是针对相对约简P 而言的，或说属性值约简是对决策表上每一条决策规则来说的。

关于决策规则中属性值约简，下面例题提供了属性值约简的理论依据。

决策表上一条决策规则的条件属性值可以被约去，当且仅当约去该属性值后，仍然保持该条规则的一致性，即不出现与该条规则不一致的规则。

约简算法的步骤为：1 约简属性集；2 约简决策规则，即属性值约简；3 从算法中消去所有过剩决策规则。

关于决策表的属性约简和决策规则的属性值约简，看下面例子。

例1 简化给定决策表，其中{}d c b a C ,,,=为条件属性集，{}e D =为决策属性集算法步骤：第一步：约简属性集：从决策表中，将属性A 中的属性逐个移去，每移去一个属性立刻检查其决策表，如果决策表中的所有决策规则不出现新的不一致，则该属性是可以被约去的，否则，该属性不能被约去，称这种方法为属性约简的数据分析法。

第四章属性值约简(决策规则约简)

第四章属性值约简（决策规则约简）§1 属性值约简属性约简分两类，一类是信息表约简，一类是决策表约简。

信息系统S={U,A}的约简，是对整个属性集A进行约简，要求利用最少属性的属性集能提供与原属性集A同样多的信息，在此若是冗余属性，则是将a 去掉后则A-{a}与A具有同样的分类能力，即有下面相同的等价类族：若是独立的，即中任意去掉一个属性，都将改变其分类能力，则就是A的一个约简。

A的约简是A中独立的子集P并且P与A具有同样的分类能力，而中的属性对P来说都是冗余属性。

信息表的特点是属性集不再划分为条件属性集和决策属性集。

对于决策表来说，约简的情况不同，它不是针对整个属性集A进行的，约简的只是条件属性集。

决策表的约简分两部分：第一步：属性集约简若果，满足P是关于决策属性集D独立的，并且，则P是C的D约简。

C中的所有D约简的交称为C的核，记作。

第二步：属性值约简设是一致性决策表，是C的D约简。

值约简是针对相对约简而言的，或说属性值约简是对决策表上每一条决策规则来说的。

关于决策规则中属性值约简，下面例题提供了属性值约简的理论依据。

决策表上一条决策规则的条件属性值可以被约去，当且仅当约去该属性值后，仍然保持该条规则的一致性，即不出现与该条规则不一致的规则。

约简算法的步骤为：1 约简属性集；2 约简决策规则，即属性值约简；3 从算法中消去所有过剩决策规则。

关于决策表的属性约简和决策规则的属性值约简，看下面例子。

例1 简化给定决策表，其中为条件属性集，为决策属性集第一步：约简属性集：从决策表中，将属性A中的属性逐个移去，每移去一个属性立刻检查其决策表，如果决策表中的所有决策规则不出现新的不一致，则该属性是可以被约去的，否则，该属性不能被约去，称这种方法为属性约简的数据分析法。

解法1：从条件属性集中移去c列后，决策表不出现新的不一致，所以c列可约去；从中移去a或移去b，或移去d后，决策表中都出现新的不一致，故a,b,d都不能移去，即a,b,d都是C的D核属性。

一种基于知识量的约简算法

一种基于知识量的约简算法
张海云;梁吉业;梁春华
【期刊名称】《小型微型计算机系统》
【年(卷),期】2007(28)11
【摘要】提出一种新的属性约简算法,该算法基于粗糙集理论认为知识是区分事物的能力的观点,对知识进行了新的量化,并以量化后的区分能力作为启发式信息进行约简,提高了约简效率,理论分析与实例证明该算法是有效的.
【总页数】4页(P1968-1971)
【作者】张海云;梁吉业;梁春华
【作者单位】计算智能与中文信息处理省部共建教育部重点实验室,山西,太
原,030006;山西大学,计算机与信息技术学院,山西,太原,030006;计算智能与中文信息处理省部共建教育部重点实验室,山西,太原,030006;山西大学,计算机与信息技术学院,山西,太原,030006;山西大学,计算机与信息技术学院,山西,太原,030006;山西省财政税务专科学校,经济信息系,山西,太原,030024
【正文语种】中文
【中图分类】TP18
【相关文献】
1.基于知识量的决策表约简算法 [J], 梁春华;张海云
2.一种基于知识粒度的启发式属性约简算法 [J], 马福民;张腾飞
3.一种基于知识粒度单调性的属性约简算法 [J], 王晓宇;徐章艳;张伟
4.一种基于知识颗粒的高效完备属性约简算法 [J], 赵洁;肖南峰
5.一种基于知识粒度的决策系统属性约简算法 [J], 廖洪建
因版权原因，仅展示原文概要，查看原文内容请购买。

基于近似分类质量的决策表属性约简算法

舒
兰２
成都６０５）１０４
７４０；２电子科技大学应用数学学院，３００．四川
要：文章提出了一种基于近似分类质量的决策表属性约简算法，该原算法以空集作为初始属性约
简，逐步增加使近似分类质量增加最大的属性，直至约简的近似分类质量等于所有条件属性的近似分类质量
非空有限论域，Ａ＝ＣＵＤ，Ｃ和Ｄ分别为条件属性集和决策属性集，Ｄ≠ ，且ＣｎＤ≠ ，对于每个子集和不
旦）量）（（（，）Ｅ证明。・。
（）．
Ｅ・【】【】 ’ ￡・
收稿日期：２０．１１０１．８５
１）初始化：Ｇ（＝０Ｄ）
【ｋｎ ≠
‘ ．．
∈Ｂ（），Ｅ（故）
（）．
２／）Ｄ＝｛ｙ，ｙ）／，２ …，刖Ｒ＝｛，，｝Ｘ …，
３）ｆｒｉｏｍｏｔ＝ｌ
性质２２给定决策表Ｓ＝（Ａ，．Ｕ，）其中为非空有限论域，Ａ＝ＣＵＤ，ｃ分别为条件属性集和决策属性集，和Ｄ
∈ （）．
者已提出了各种启发式属性约简算法．如文提出的基
于互信息量的知识约简算法：文提出的基于差别矩阵和差别函数的逻辑化简求法．但这些算法计算都较复杂．
定义２阁设集合簇＝，：，）＝）．２（．，Ｕ是 …
ｌ引言
分明关系，的上近似和下近似分别可以由的基本集定义如下，
粗糙集理论是波兰科学家Ｐｗｌｋ在１８ａａ９２年提出的一

基于知识量的决策表约简算法

础上，设计了一种基于知识量的约简算法，实例分析表明该算法能够有效得到决策表的约简。
关键字：粗糙集理论；属性约简；知识量；相对知识量
中图分类号：Ｔ３１６Ｐ０．
文献标识码：Ａ
文章编号：１７ —１１（０７０—２４０６１８５２０）２０１—４
ＤｅｉｉｎＴａｌｄｃｉｎＡｌｏｉｈＢｓｄｏｏｅｇａｔｔｃｓｏｂｅＲｅｕｔｏｇｒｔｍａｅｎＫｎｗｌｄｅＱｕｎｉｙ
ＬｌＡＮＧｕ — ｕｔａｌＣｈｎｈａｅ，
粗糙集理论＿是１８１９２年由Ｚａａ．Ｐｗｌｋ提出的一种处理不确定性知识和模糊数据的分析工具。
有限集合，｛。口，，）：ＵＡ一口，。 … 口；
ａ ∈ Ａｉ。
；是属
‘
性口的值域；示Ｕ×Ａ— Ｖ是一个信息函数，ｆ表
属性Ｐ决定的划分Ｕ／Ｐ＝｛，，，Ｘ。Ｘ。 … Ｘ），则属性Ｐ具有的知识量Ｋ（Ｐ）定义为：
属性，从而得到约简中的条件属性对决策属性的
决策规则。
Ｋ（Ｐ）
∑ ＩｆＩｘｕ—ｘＩ
定理１Ｓ一（［设４Ｕ，Ａ）是一个信息系统，
维普资讯
ＪＳｔ．ｌＡＮＸＩＡＧＲＩＵＮＩＣ．Ｖ．（ｔｒｌＳｃｅｃＮａｕａｉｎｅＥｄｉｉｎ）ｔｏ

决策表约简方法的关系

粗糙集理论是一种新的处理模糊性和不确定性知识的数学工具［引ｈ。自１８９２年由波兰学者Ｐｗｌｋａａ［］
首次提出以来，经过２０多年的研究与发展，已经在理论和实际应用上取得了长足的发展，别是２纪特Ｏ世
第３期
钟玉田等：策表约简方法的关系决
定义３ＡＡ称为决策表Ｓ的一个正域协调集，果ｐｓ（＝ｐＳＴｄ）称Ａ为的一个正域如ｏ）ＯＡ（；
Ａ（）｛＝Ｘ∈Ｕｚｘ）Ｉ］［，Ａ（一（Ｘ） ∈ＵｌｘＡＩ］ｎＸ≠ ｝。
定义２［对于任意ＡＡｄ的正域ｐｓ（定义为：，ｏ）
ｐｓ（＝ＵｏＡ）＝（。＝Ｘ）
Ｘ∈ Ｕ／ｄ
集，保持近似分类精度与近似分类质量不变。另外，且信息系统的约简问题可以转化为相容决策表的约简。关键词：粗糙集；策表；决知识约简；协调集
中图分类号：１ＴＰ８
文献标识码：Ａ
文章编号：０１６０（０８Ｏ— １００１０ —６０２０）３０１—４
论域；是条件属性集；为决策属性；Ａ一
…
ＵＶ，属性ｎ的值域；ＵＸ（Ｖ是厂：ＡＴＵｔ））一称为
信息函数，它为每个对象的每个属性赋予一个信息值。以下假设Ｓ一（ＡＴＵ｛，厂是一个决策表，于ＡＡＡ决定了论域Ｕ上的一个等价关系Ｕ，ｄ）Ｖ，）对，ｉｄＡ）称为由Ａ确定的不可区分关系，义为（）ｎ（当且仅当：于任意口ｎ（，定ｚ， ∈ｉｄＡ）对 ∈Ａ，ｘ，）ｆ（口一厂（，ｊ，ｎ。我们用］）表示对象ｚ在此等价关系之下的等价类，Ｕ／表示所有这些等价类构成的集合。对于用Ａ任意ＡＡＸ∈ ，在Ａ之下的下近似集Ａ（与上近似集（分别定义为：丁，Ｘ＿）Ｘ）

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

称布尔合取范式 2
A ( x ) A ( y )

2 ( x, y ) 、 3
A ( x ) A ( y )

3 ( x, y)
分别为决策表 S 的最大分布区分函数和分配区分函数。
定理设 S (U , A {d},V , f ) 为决策表。（1） 2 的极小析取范式的所有合取子式恰为 A 的所有最大分布约简。（2） 3 的极小析取范式的所有合取子式恰为 A 的所有分配约简。
A (4) (0,1).
故分布区分矩阵为
1 2 3 4 5 1 2 {a, b, c, e} {a, b} {c, e} 3 4 {a, b, c} {c} {a, b} {c, e} {c} 5 6 {a, b} {c, e} {c}
qr
其中
B ( x) {D j D j [ x]B } 1 r B RB ( D j ) U j 1
D( D j [ x]B ) D j [ x] B [ x] B
是 [ x]B 包含于D j 的程度.
B ( x) A ( x) ,则称B是分布协定义: （1）若对于任意 x U ，调集。极小的分布协调集称为分布约简。 B ( x) A ( x) ，则称B是最大分布协调集。 (2)若对于任意 x U ，极小的最大分布协调集称为最大分布约简。 ( x) ( x) ，则称B是分配协调集。极 (3)若对于任意 x U ，小的分配协调集称为分配约简。 (4)若 B A ，则B称是近似协调集。极小的近似协调集称为近似约简。
第四讲: 基于包含度的决策表约简
1 约简的概念
对于决策表
U d
S (U , A {d},V , f )
,设
B A
, x U ,记
{D1 , D2 ,, Dr },
B ( x) ( D( D1 [ x]B ), D( D2 [ x]B ),, D( Dr [ x]B ))
B ( x) {D j D( D j [ x]B ) max D( Dq [ x]B )}
B A
性质
定理: B为分配协调集当且仅当：B为近似协调集。
B为分配约简当且仅当：B为近似约简。
2 约简方法
定理设 S (U , A {d},V , f ) 是决策表且 B A 。（1） B 是分布协调集的充分必要条件为：对于任意 x, y U ，若
A ( x) A ( y) ，则 [ x]B [ y]B .
U {C , C , C , C } ，其中 C {1}, C {2}, C {3,5,6}, C {4}. 1 2 3 4 1 2 3 4 A
考虑分布约简。
A (1) (1, 0) ， A (2) (0,1) ， A (3) A (5) A (6) ( 2 3 , 13 ) ，
（2） B 是最大分布协调集的充分必要条件为：对于任意 x, y U ，若 A ( x) A ( y) ，则 [ x]B [ y]B , y U ，若 A ( x) A ( y) ，则 [ x]B [ y]B .
对于决策表 S (U , A {d},V , f ) ， x, y U ，令
{a A; f ( x, a) f ( y, a)}; A ( x) A ( y) 。 1 ( x, y) ; A ( x) A ( y)
定理设 S (U , A {d},V , f ) 是决策表且 B A 。则 B 是分布协调集的充分必要条件为：若 1 ( x, y) ，则 B 1 ( x, y) .
{a A; f ( x, a) f ( y, a)}; A ( x) A ( y) ， 2 ( x, y) ; A ( x) A ( y) {a A; f ( x, a) f ( y, a)}; A ( x) A ( y) 3 ( x, y) . ; A ( x) A ( y)
例考虑下面的决策表。
U
1 2 3 4 5 6
a
1 0 0 0 0 0
b
0 1 1 1 1 1
c
0 1 0 1 0 0
e
0 1 0 0 0 0
d
1 2 2 2 1 1
其中 a, b, c, e 为条件属性， d 为决策属性。则 U
d
{D1 , D2 } ，其中 D1 {1,5,6} ， D2 {2,3,4}.
称布尔合取范式 1
A ( x ) A ( y )
1 ( x, y)
为决策表 S 的分布区分函数。定理 6.3.5 决策表 S (U , A {d},V , f ) 的分布区分函数的极小析取范式的所有合取子式恰为 A 的所有分布约简。
类似地，对于任意 x, y U ，令
6
分布区分函数为
1 (a b c e) (a b) (a b c) (c e) c
(a c) (b c)
故 A 的分布约简为 {a, c} 与 {b, c}.

4第四讲 基于包含度的决策表约简

基于属性重要性的决策表属性约简算法

决策表决策值的简化

基于包含度的不一致决策表约简新方法

决策表的一种知识约简与规则获取方法

aai09粗糙集高级人工智能史忠植

一种基于约简树的决策表属性约简方法

基于包含度的决策表属性约简算法的研究

决策表的最近近似约简

决策表的一种知识约简与规则获取方法

人工智能原理及其应用(王万森)第3版-课后习题答案

基于包含程度的属性重要性定义

基于包含度的不完备序信息系统属性约简的一种算法

基于决策规则的属性约简算法

第四章 属性值约简(决策规则约简)

第四章 属性值约简(决策规则约简)

一种基于知识量的约简算法

基于近似分类质量的决策表属性约简算法

基于知识量的决策表约简算法

决策表约简方法的关系

4第四讲基于包含度的决策表约简

第四章属性值约简(决策规则约简)

第四章属性值约简(决策规则约简)