4第四讲 基于包含度的决策表约简

合集下载

基于属性重要性的决策表属性约简算法

基于属性重要性的决策表属性约简算法

An Alo ihm fAtrb t d c in o c sv b e g rt o t i u eRe u to fDe iie Ta l
Ba e n Atr bu e I p r a e s d o t i t m o t nc
YANG e g f 一 HU n Ch n —u ,,S La
( . iest f e t ncS ia dTeh . Ch n d 1 0 4, ia 1 Unv ri o cr i c.n c n , e g u 6 0 5 Chn ; y El o
2 .Hei ie i , h g e 30 0 C i ) x vr t Z a y 4 0 , hn Un s y n 7 a
Ke r s r u h st trb t mp ra c ;atiuerd cin ywo d :o g e ;atiuei o tn e trb t e u to
O 引 言
粗糙 集理论 是 由 波兰 科 学 家 P wa al k在 18 提 出 92年 的一种 数学理论 … , 理论 主要 用于 数据 分 析 , 其对 不 该 尤 精确 和不 确定 的数据进 行分 析 。近 年来 , 已被广泛 应用 它 到人 工智 能 、 式识 别和 数据挖掘 等方 面 。属 性约简 是粗 模 糙集 理论 中 的一个重 要 的课题 , 一般 说来 , 识库 中 的 知 知
准则 , 通过逐 步缩 减来求 取约简 。 同时给 出了该算 法 的时 间复杂 度分 析 , 例 验证 了所提 出算法 的有效 性 和实用 性。 并举 关键 词 : 集 ; 重要 性 ; 性约 简 粗糙 属性 属
中 图分 类号 :P O . T 3 16 文 献标识 码 : A 文章编号 :63 2 X 20 )1 0 6 — 2 17 —69 (06 l — 02 0

决策表决策值的简化

决策表决策值的简化

决策表决策值的简化
李小霞;陈绵云
【期刊名称】《中国石油大学学报(自然科学版)》
【年(卷),期】2004(028)004
【摘要】首先定义了决策规则决策属性的简化,并以此为基础定义了决策表决策值的简化,旨在研究决策表条件值简化的对偶问题,即在保持决策表条件属性集不变的前提下它的条件属性集和决策属性集之间的最简函数关系.在这些定义的基础上,给出了决策规则决策属性简化的表达式和决策表决策值简化的表达式.
【总页数】3页(P138-140)
【作者】李小霞;陈绵云
【作者单位】中山大学计算机科学系,广东广州,510275;华中科技大学控制科学与工程系,湖北武汉,430074;华中科技大学控制科学与工程系,湖北武汉,430074【正文语种】中文
【中图分类】TP18
【相关文献】
1.区间值决策表的决策风险最小化属性约简 [J], 徐菲菲
2.用属性单值表示的决策表简化算法及属性核计算 [J], 李淑智;徐光华;华成
3.新简化决策表的研究 [J], 王希雷;王磊;马永军
4.对决策表和简化决策表的研究 [J], 王希雷;苏静
5.粗集决策表与决策表简化的可信度比较 [J], 王德松;舒兰
因版权原因,仅展示原文概要,查看原文内容请购买。

基于包含度的不一致决策表约简新方法

基于包含度的不一致决策表约简新方法
S i XU Ju c e g MA a — u n UN Ln, i— h n , Yu n y a
河南师范大学 计算机 与信息技 术学院 , 河南 新乡 4 30 50 7
Colg f Co utr & I f r to c o o y, na r a Unie st Xix a g, nn n 453 07, n le e o mp e n o ma in Te hn lg He n No m l v riy, n i n He a 0 Chia
cec n x o e t l a n i te s e f d cs n tb ste jd m n h oe i rse t t ds b t n rd c o s o — rse t e p n ni l g w t h i o e i o a l , u g e t te rm w t ep c o i r ui e u t n i b a o h z i e h h t i o i
维普资讯
16 2 0 ,32 ) 6 0 74 (4
C m ue n n e n n p l a os o p trE  ̄ ed g ad A pi t n 计算机工程 与应用 ci
基于包 含度的不一致决策表约筒新 方法
孙 林 , 久成 , 徐 马媛媛
分析表明 , 新的属性重要性是一种 更有效的启发式信 息, 方法时间复杂度较低 , 该 有助于搜 索最小或 次优约简。 关键词 : 粗糙集理论 ; 不一致决 策表 ; 知识约简 ; 包含度 文章编号:0 2 8 3 (0 72 — 16 0 文献标 识码: 中图分类号:P 8 10 — 3 12 0 )4 0 6 — 3 A T 1
wt eaai os t t bet fr icni etojcsa e i icne fatbt s d f e i no s t td c in i sprt g cnie ojcs om no s tn bet, nw s nfa c o t ue e nd n cni e eio h n sn s g i i r i i i sn s

决策表的一种知识约简与规则获取方法

决策表的一种知识约简与规则获取方法

收稿日期:2006-02-28作者简介:孙 胜(1978-),男,湖北黄冈人,博士研究生,研究方向为现代数据库理论与技术及系统实现;导师:王元珍,教授,博士生导师,主要研究方向为现代数据库理论及实现技术。

决策表的一种知识约简与规则获取方法孙 胜1,2(1.华中科技大学计算机学院,湖北武汉430074;2.黄石理工学院计算机学院,湖北黄石435003)摘 要:粗糙集理论是一种新型的数据挖掘和决策分析方法,利用粗糙集理论进行决策表的知识约简与决策规则挖掘已经成为研究热点。

文中介绍了粗糙集的基本理论,在此基础上运用该理论对从决策表中获取最小规则进行了研究,提出了决策表约简的启发式方法,并通过一个具体实例详细说明了决策规则获取过程,实例分析表明了其有效性。

关键词:粗糙集;决策表;决策规则;属性约简中图分类号:T P311.131 文献标识码:A 文章编号:1673-629X(2006)09-0035-03Knowledge Reduction and Rule Acquirement Method in Decision TableSUN Sheng 1,2(1.Schoo l of Computer Science,Huazhong U niv ersity of Science and T echnolog y,Wuhan 430074,China;2.School of Computer Science,Huangshi Institute of T echnolog y,Huangshi 435003,China)Abstract:Rough set theory is a new data mining and decision analysis method.Knowledge reduction and decision rule mining in decision table by using rough set theory has become a research hotspot.T he article introduces basic con cepts in rough set theory first.M inimal dec-i sion rule acquirement in deci sion table based on rough set theory i s researched.A heuristic approach for rule reduction is put forward,and the procedure of decisi on rule acquirem ent is i lluminated using an example.T he instance analysis show s its validity.Key words:rough set;deci sion table;decision rule;attribute reduction0 引 言粗糙集理论是由波兰科学家Z.Paw lak 教授于1982年提出的一种研究不精确、不确定性知识的数学工具[1,2]。

aai09粗糙集高级人工智能史忠植

aai09粗糙集高级人工智能史忠植

2019/11/12
高级人工智能 史忠植
7
研究现状分析
史忠植. 知识发现. 北京: 清华大学出版社, 2002 刘清. Rough Set及Rough推理. 北京: 科学出版社,
2001 张文修等. Rough Set理论与方法. 北京: 科学出版社,
2001 王国胤, Rough Set理论与知识获取. 西安: 西安交通大
学出版社, 2001 曾黄麟. 粗集理论及其应用(修订版). 重庆: 重庆大学
出版社, 1998
2019/11/12
高级人工智能 史忠植
8
研究现状分析
2001年5月在重庆召开了“第1届中国Rough集与软计 算学术研讨会”,邀请了创始人Z. Pawlak教授做大 会报告;
2002年10月在苏州 第2届
IND IS (B) {( x, x') U 2 | a B, a(x) a(x')}
where INDIS (B) is called the B-indiscernibility relation.
• If (x, x') INDIS (B), then objects x and x’ are indiscernible from each other by attributes from B.
2019/11/12
高级人工智能 史忠植
11
二、 知识分类
设PR,且P ,P中所有等价关系的交集称为P上 的一种难区分关系(indiscernbility relation)
(或称难区分关系),记作IND(P),即
[x]IND(p)= I [x]R
RP
注意,IND(P)也是等价关系且是唯一的。

一种基于约简树的决策表属性约简方法

一种基于约简树的决策表属性约简方法
系统分类能力不变 的前 提下 , 通过 知识 约简 , 出问题 的决 导
( 如果 和 是公式 ,l , , , 2 )  ̄. ^ V 一 都是 J 3
公 式。
() 3 只有按 ( ) ( ) 1 、2 所组成的式子是公式。 定义 3 .一个对象 ∈U满足 S=( , 中的公式 , A) 记
由上面的条件我们有 :
1 粗糙集理论”
定义 1 一个信息系统 S . 可以表示为 S =<UA e >, ,,, f
B IY n—h i WA a—y A u u NG Hu
本 文首先给 出了约简树 的定义, 出了采 用宽度 优先 的策略构 造约 简树 , 构造约 简树 的过程 中。 某 提 在 把 个结点处决策规 则是 否一致作 为在该结点 处是 否可 以继 续构造子 树的条件 . 该结点是 否 已经 出现 过 把 作 为剪枝 条件 , 并把相 对核作 为构违约简树 的一个 重要的终止条件。 随后研 究 了约 简树的性质 , 到 了 找 基 于约简树 的决策表 的极 小属性集。最后分析 了该方法在最好和最坏情 况下的时间复杂度。 实例 分析
维普资讯
■■攘木 与僵一亿

种 基 于 约简 树 的决 策表 属 性 约简 方 法
白运 会 王 化 雨
An At iueRe u t n Ap ra h frDe iinT b eB s d o d cin T e t b t d ci p o c o cso a l a e n Re u t ntec aa tr f h d cinte r ee rh d a dtemii l t b t e u t n e u t re o dte h h rceso er u t reweersac e n h nma at uerd ci t e o i r o

基于包含度的决策表属性约简算法的研究

基于包含度的决策表属性约简算法的研究

区 分 矩 阵 对 于 不 相 容 决 策 表 来 说 是 错 误 的[ 它 不 一 定 能 正 确 6 1 , 求 出核 属 性 集 ; 次 求 出 多 个 约 简 后 , 实 际 应用 中 一 般 不 去 其 在 比较 各个 约 简 的优 劣 : 后在 合 取 范 式 转 化 为析 取 范 式 的 过 程 最 也 是 相 当复 杂 的 。 献 ll f 的算 法 巾求 核 属 性 集 时 用 到 的 区 文 4给 l l 分 矩 阵 对 于 不 相 容 决 策 表 也 是 错 误 的 : 者 在 求 出 核 属 性 集 再 后 , 约简 中 的非 核 属 性 时 以非 核 属 性 在 区分 矩 阵 巾 的 出 现 次 求 数 为标 准 , 没 有 理 论 依 据 , 这 很难 给 出 严格 的数 学证 明 ; 外 它 另
维普资讯
基于包含度的决策表属性约简算法的研究
孙 士保 1 秦克 云 , 2
( 西南 交通 大 学理 学院 , 成都 6 03 ) 10 1 ( 河南科技 大学 电子信息 工程 学院 , 南洛 阳 4 10 ) 河 7 03
E— i:hb ou @ 1 3c r mals ia s n 6o e f l u a i t. i al .t r d c s e a l s o I d t b s s a d h e u t h w t a o r c mp e e r e a d h s p w ru s b l y F n l i e u t x mp e f UC a a a e n te r s l s o h t i y s i c n g t b t r ef cs t a e et f t . e e
S in e ad T c n l y L oa gHe a 7 3 ce c n eh o g ,u y n , n n 4 0 ) o 1 0

决策表的最近近似约简

决策表的最近近似约简
效.
2 信 息系统 与决策表
定 义 1 称 ( , 为 信 息 系 统 ,其 中 己 是 有 限 对 象 集 合 ,即 U={。 :… ) A是 有 限 属 性 集 ,即 , F) , , , ; A={。 :…a } F是 u与 A的关 系集 ,即 F={ : , , m ; U , )其 中 k , a 的有 限值 域 . k
3 决 策表的近似约简
为了刻画边界的不确定性对属性约简的影响, 我们给 出如下定义 :
定义 2 设 ,, ) A F 为信息系统, 对于集合 X U, 称 为集合 的
R ={ ] ∈U) A 【 : ,
收 稿 日期 :2 0 . 1 3 0 80 . 2
作者简介: 赵雪芬 (93 ) ,宁夏大学新华学院助教 ,研究统 计 与人工智能的数学基础. 18 一 ,女 学 基金项 目:教育 部科学技术研 究重点项 目 ( o2 6 5 ,宁夏 自然科学基金资助项 目 ( 0 1 ) N 0 19) NZ 5 6
l l
= R
u A= / = 4, , p . / u { …A )
为 A确定的不可区分关系在 上产生 的分划. 对于集合 X U, 当 ( = ) X= aX) B D ( R ( 或 N )=2 ( j
时, 称 为 A 一 精确集;当g ( ≠ ( 或 B D ( ) 瓦 ) N )≠ 时, 称 为 A 一 粗糙集, 它的不确定性是 由边界
维普资讯
第3 4卷第 3期

o um a fS t w e tUni e iyf rN ai nal i Na u al i c ton lo ou h s v rs t o to i e t r 1 en eEdii t s Sc

决策表的一种知识约简与规则获取方法

决策表的一种知识约简与规则获取方法

成为研 究 热点 。文 中介 绍 了粗糙 集 的基本 理论 , 此基础 上运 用该 理论 对从 决策 表 中获取 最小 规则 进 行 了研 究 , 出了决 在 提 策 表约简 的启 发式 方法 , 通过 一个具 体实 例详 细说 明 了决 策规则 获取 过 程 , 例分析 表 明 了其有 效 性 。 并 实 关键 词 : 糙集 ; 策 表 ; 规则 ; 性约 简 粗 决 决策 属
能在 缺少关 于数 据 的先验 知 识的情 况下 , 仅 以对 数据 的 仅
l 有 关 的粗糙 集概 念
现实世界 中的信息 , 在粗糙集理论中用决策表的形式
给 出 。 面先 简要介绍 一 下文 中主要 用 到 的 R u h 基本 下 og 集
Ke r s r u h st d iin tbe; eiin r l; trb t e u t n ywo d : g ; e s a l d cso ue at uer ci o e c o i d o
O 引 言
粗糙集 理论 是 由 波 兰 科 学 家 Z Pwa .a l k教授 于 18 92
S UN h n S e g,
( 、 ho o o ue c neHuzogUnvr t f i c n eh o g , hn4 0 7 , hn ; 1S o l f mp tr i c, ahn i s yo e eadT cn l y Wu a 3 0 4 C i c C Se ei c S n o a
孙 胜 2 ,
( . 中科技 大学 计算机学院, 1华 湖北 武汉 4 07 ; 30 4
2 黄石理工学院 计算机 学院, , 湖北 黄石 45 0 ) 30 3
摘 要 : 糙集 理论 是 一种新 型 的数据 挖掘 和决 策 分析方 法 , 粗糙 集理论 进 行决策 表 的知 识约 简 与决 策 规则 挖 掘 已经 粗 利用

人工智能原理及其应用(王万森)第3版-课后习题答案

人工智能原理及其应用(王万森)第3版-课后习题答案

机终端进行会话。

测试开始后,由测试主持人向被测试对象提出各种具有智能性的问题,但不能询问测试者的物理特征。

被测试对象在回答问题时,都应尽量使测试者相信自己是“人”,而另一位是”机器”。

在这个前提下,要求测试主持人区分这两个被测试对象中哪个是人,哪个是机器。

如果无论如何更换测试主持人和被测试对象的人,测试主持人总能分辨出人和机器的概率都小于50%,则认为该机器具有了智能。

1.5人工智能的发展经历了哪几个阶段?解:孕育期,形成期,知识应用期,从学派分立走向综合,智能科学技术学科的兴起1.6人工智能研究的基本内容有哪些?解:与脑科学与认知科学的交叉研究智能模拟的方法和技术研究1.7人工智能有哪几个主要学派?各自的特点是什么?解:符号主义:又称为逻辑主义、心理学派或计算机学派,是基于物理符号系统假设和有限合理性原理的人工智能学派。

符号主义认为人工智能起源于数理逻辑,人类认知(智能)的基本元素是符号,认知过程是符号表示上的一种运算。

联结主义:又称为仿生学派或生理学派,是基于神经网络及网络间的联结机制与学习算法的人工智能学派。

联结主义认为人工智能起源于仿生学,特别是人脑模型的研究。

行为主义:又称进化主义或控制论学派,是基于控制论和“感知-动作”控制系统的人工智能学派。

行为主义认为人工智能起源于控制论,提出智能取决于感知和行为,取决于对外界复杂环境的适应,而不是表示和推理。

1.8人工智能有哪些主要研究和应用领域?其中哪些是新的研究热点?解:机器思维:推理、搜索、规划机器学习:符号学习、联结学习、知识发现和数据挖掘机器感知:机器视觉、模式识别、自然语言理解机器行为:智能控制、智能制造计算智能:神经计算、进化计算、模糊计算分布智能智能系统:专家系统、智能决策支持系统人工心理与人工情感研究热点:智能机器人、智能检索、智能游戏等。

1.9 人工智能未来发展有哪些值得思考和关注的重要问题?解:多学科交叉研究分布智能与社会智能研究集成智能研究智能网络研究认知计算与情感计算研究智能系统与智能服务第2章确定性知识系统参考答案2.1 什么是知识?有哪几种主要的知识分类方法?解:知识是人们在改造客观世界的实践中积累起来的认识和经验;知识是对信息进行智能性加工中形成的对客观世界规律性的认识。

基于包含程度的属性重要性定义

基于包含程度的属性重要性定义
S c( c D)一 ( . ‘ l D C )= ( g c D)
c关 于 D的重 要性 定 义为
特别地 , C 当 : { }时 , 性 口∈ C关 于 D 的重 要性定 义 为 口 属 S C( ) = c D)一y } D) ’ lDa ( g c ( , 其 中 c D)=l O cD)I Ul ( S( P /l _
纪 军 , : 等 基于包含程度 的属性 重要性 定义
67 5
立的, 则称 C 是 C相 对 D 的属性 约简 , C 为代数 约 简 , 为 rd C =C , 有 属性 约简 的交集 称 为属性 称 记 e( ) 所 核 , 为 c r( ) 记 oe C . 定 义 7 令 c和 D 分别 为条 件属性 集 和决策 属性 集 , 属性 子集 c
相对 于 D是 不必要 的 , 否则称 口在 c 中相对 于 D是 必要 的 , 果 c 如 定义 6 给定 决策 表 S = ( , U C UD,
收稿 日期 :09 1—2 2 0 —01
C中任 意属性相 对 于 D都是 必要 的 ,
, C 对 C, 如果 P S,D)=P S ( O ( O cD)且 c 相对 于 D是 独
了基于该定义下的属性最佳约简方法 , 最后结合实例说 明该方法 的有效性.
关键 词 : 属性约简; 属性重要性; 包含程度
中图分 类号 :Pl T 8
文献标 识码 : A
2 纪 8 代 由 Pwa 0世 O年 aห้องสมุดไป่ตู้k等人 提 出的粗糙 集理论 . 是处 理数据 的新 方法 , 它 目前在 信 息检索 、 数据挖 掘、 文本 分类 、 模式 识别 等许 多领 域得 到 了广 泛 的运用 . 在粗 糙 集理 论 中, 知识 约简 是 一个 核 心 内容 , 谓 知 所 识 约简 , 就是 在保 持知识 库 的分类 能力 不变 的条件 下 , 除知识 库 中不 相关 或 不 重要 的冗 余 知识 ]一 般来 删 .

基于包含度的不完备序信息系统属性约简的一种算法

基于包含度的不完备序信息系统属性约简的一种算法

D( ( )A B )=八D ] / x] ) AA /( ) ( A I 一
定 理 2 1 设 L =( , 是一个 不完 备序信 . A) 息 系 统 ,B A,则 = 当 且 仅 当 , 于是
D( A) A B) A( / ( )= 1 .
证 明 ( )当
文献标 识码 : A
0 引 言
粗 糙集 理 论 是波 兰数 学 家 Z Pwa . a lk于 18 92 年提 出 的一 种处理 和分 析不精 确 、 不协 调 、 完备 、 不
不完备信息系统的信息熵 、 粗糙熵及知识粒度等不
确定 度量 ; 夺谦 等人 从信 息论 的角 度 , 于互 信 苗 基
C O等人在 优势关 系下 定 义 了基 于分类 质量 的属 性
上 , 出了一 种基于包含度 的属性约简算法 ; 提 最 后 , 过实 例分 析表 明 , 算法 能 得 到不完 备序 信 通 该
息 系统 的一个 约简 .
1 不 完 备 序 信 息 系统
定 义 11 形 式上 ,四元 组 L=( A, . U,


个信息系统 , 中 表示对象 的非空有限集合, 其
=u。 是属性 口的值域 表示 U× + 的一 A.
称 为 论 域 ; 表 示 属 性 的 非 空 有 限 集 合 ; A V 个信息函数 , 它为每个对象的每个属性赋予一个信 息值 , 即任意 的 口∈A, £U ,)∈ . 常也 口 通 用 L=( ,) u A 代替 L=( , , UA V J . 在一个信息系统 中, 如果在某个属性值域上 建立了偏序关系 , 则称这个属性为一个标准.当所 有的属性都为标准时 , 该信息系统称为序信息系统

基于决策规则的属性约简算法

基于决策规则的属性约简算法

2 粗糙 集基本概 念 竹
定义 1 设S (,,,) 一 =UA f 为 信息系 其中: 是 V 统, 对象的 空有限 合, = x, ) A 非 集 U {, …, ; 是 1, )
属性集合 ;V= U , 是属性 a的值域 ;f: Ux A
’ ’
是一个信息函数 , 它为每个对象的每个属性赋
HIDB Y  ̄ ,N () , N ( {l Uy DBx ) Y I j
为方便起见 ,在不产生混淆的情况下用 代替 ID(1 N B.
定义 3 设S (,,,) = UAVf 是一个决策表,A C D C , = , D= 其中c U N 为条件屙f 生 集,D为决策属
・ 通讯作者 : 李相朋 ( 9 3 ) 男 , 16 一 , 教授,研究方向: 信息系统与知识发现
第2 4卷 第 6期
2 年 1 月 01 1 2








V_ .4 NO 6 0 2 . 1
D ec. 20 11
J U RN A L O OF W U H AN TEX TI UN I LE VER SI TY
基 于决策规则 的属性约简算法
廖 倩, 李相 朋
a EA ’ ’
予一个信 息值 ,即 V ∈ ,∈ , (,) V x U a Af ∈ a。若 A可 以分 为条件属性集 C和决 策属性集 D ,即
A=CU CN ,则称该信息系统为决策系统决策表 。决策表分为一致决策表和不一致决策表 ,本文 D, D=
讨 论一 致决 策 表 。
0 -Xiy) 时 , , 不确 定 的规则 。显 然 ,- Xi , <]( ,, <1 是 t  ̄ . y ,则 是确 定规 则 。本 文讨 论一 致决 策表 ,它 c 生成 的决 策规 则都 是确 定性 规则 。

第四章 属性值约简(决策规则约简)

第四章  属性值约简(决策规则约简)

第四章 属性值约简(决策规则约简)§1 属性值约简属性约简分两类,一类是信息表约简,一类是决策表约简。

信息系统S ={U ,A }的约简,是对整个属性集A 进行约简,要求利用最少属性的属性集能提供与原属性集A 同样多的信息,在此若A a ∈是冗余属性,则是将a 去掉后则A -{a }与A 具有同样的分类能力,即有下面相同的等价类族:{}A U a A U =-若{}a A -是独立的,即{}a A -中任意去掉一个属性,都将改变其分类能力,则{}a A -就是A 的一个约简。

A 的约简是A 中独立的子集P 并且P 与A 具有同样的分类能力,而{}P A -中的属性对P 来说都是冗余属性。

信息表的特点是属性集A 不再划分为条件属性集和决策属性集。

对于决策表()D C A U T ==,来说,约简的情况不同,它不是针对整个属性集A 进行的,约简的只是条件属性集。

决策表的约简分两部分: 第一步:属性集约简若果C P ⊆,满足P 是关于决策属性集D 独立的,并且()()D Pos D Pos C P =,则P 是C 的D 约简。

C 中的所有D 约简的交()D RED C 称为C 的核,记作()C Core D 。

第二步:属性值约简设()D C U T ,=是一致性决策表,C P ⊆是C 的D 约简。

值约简是针对相对约简P 而言的,或说属性值约简是对决策表上每一条决策规则来说的。

关于决策规则中属性值约简,下面例题提供了属性值约简的理论依据。

决策表上一条决策规则的条件属性值可以被约去,当且仅当约去该属性值后,仍然保持该条规则的一致性,即不出现与该条规则不一致的规则。

约简算法的步骤为:1 约简属性集;2 约简决策规则,即属性值约简;3 从算法中消去所有过剩决策规则。

关于决策表的属性约简和决策规则的属性值约简,看下面例子。

例1 简化给定决策表,其中{}d c b a C ,,,=为条件属性集,{}e D =为决策属性集算法步骤:第一步:约简属性集:从决策表中,将属性A 中的属性逐个移去,每移去一个属性立刻检查其决策表,如果决策表中的所有决策规则不出现新的不一致,则该属性是可以被约去的,否则,该属性不能被约去,称这种方法为属性约简的数据分析法。

第四章 属性值约简(决策规则约简)

第四章  属性值约简(决策规则约简)

第四章属性值约简(决策规则约简)§1 属性值约简属性约简分两类,一类是信息表约简,一类是决策表约简。

信息系统S={U,A}的约简,是对整个属性集A进行约简,要求利用最少属性的属性集能提供与原属性集A同样多的信息,在此若是冗余属性,则是将a 去掉后则A-{a}与A具有同样的分类能力,即有下面相同的等价类族:若是独立的,即中任意去掉一个属性,都将改变其分类能力,则就是A的一个约简。

A的约简是A中独立的子集P并且P与A具有同样的分类能力,而中的属性对P来说都是冗余属性。

信息表的特点是属性集不再划分为条件属性集和决策属性集。

对于决策表来说,约简的情况不同,它不是针对整个属性集A进行的,约简的只是条件属性集。

决策表的约简分两部分:第一步:属性集约简若果,满足P是关于决策属性集D独立的,并且,则P是C的D约简。

C中的所有D约简的交称为C的核,记作。

第二步:属性值约简设是一致性决策表,是C的D约简。

值约简是针对相对约简而言的,或说属性值约简是对决策表上每一条决策规则来说的。

关于决策规则中属性值约简,下面例题提供了属性值约简的理论依据。

决策表上一条决策规则的条件属性值可以被约去,当且仅当约去该属性值后,仍然保持该条规则的一致性,即不出现与该条规则不一致的规则。

约简算法的步骤为:1 约简属性集;2 约简决策规则,即属性值约简;3 从算法中消去所有过剩决策规则。

关于决策表的属性约简和决策规则的属性值约简,看下面例子。

例1 简化给定决策表,其中为条件属性集,为决策属性集第一步:约简属性集:从决策表中,将属性A中的属性逐个移去,每移去一个属性立刻检查其决策表,如果决策表中的所有决策规则不出现新的不一致,则该属性是可以被约去的,否则,该属性不能被约去,称这种方法为属性约简的数据分析法。

解法1:从条件属性集中移去c列后,决策表不出现新的不一致,所以c列可约去;从中移去a或移去b,或移去d后,决策表中都出现新的不一致,故a,b,d都不能移去,即a,b,d都是C的D核属性。

一种基于知识量的约简算法

一种基于知识量的约简算法

一种基于知识量的约简算法
张海云;梁吉业;梁春华
【期刊名称】《小型微型计算机系统》
【年(卷),期】2007(28)11
【摘要】提出一种新的属性约简算法,该算法基于粗糙集理论认为知识是区分事物的能力的观点,对知识进行了新的量化,并以量化后的区分能力作为启发式信息进行约简,提高了约简效率,理论分析与实例证明该算法是有效的.
【总页数】4页(P1968-1971)
【作者】张海云;梁吉业;梁春华
【作者单位】计算智能与中文信息处理省部共建教育部重点实验室,山西,太
原,030006;山西大学,计算机与信息技术学院,山西,太原,030006;计算智能与中文信息处理省部共建教育部重点实验室,山西,太原,030006;山西大学,计算机与信息技术学院,山西,太原,030006;山西大学,计算机与信息技术学院,山西,太原,030006;山西省财政税务专科学校,经济信息系,山西,太原,030024
【正文语种】中文
【中图分类】TP18
【相关文献】
1.基于知识量的决策表约简算法 [J], 梁春华;张海云
2.一种基于知识粒度的启发式属性约简算法 [J], 马福民;张腾飞
3.一种基于知识粒度单调性的属性约简算法 [J], 王晓宇;徐章艳;张伟
4.一种基于知识颗粒的高效完备属性约简算法 [J], 赵洁;肖南峰
5.一种基于知识粒度的决策系统属性约简算法 [J], 廖洪建
因版权原因,仅展示原文概要,查看原文内容请购买。

基于近似分类质量的决策表属性约简算法

基于近似分类质量的决策表属性约简算法


兰 2
成都 605 ) 104
740 ;2 电子科技大学应用数学学院 , 300 . 四川
要 :文章提 出 了一种基 于近似 分 类质 量 的决 策表属 性 约 简算 法 ,该 原 算 法 以空 集作 为初 始属 性 约
简 ,逐 步增加使 近似 分类质量 增加最 大的属 性 ,直 至约 简的近似分 类质 量等 于所有 条件属 性 的近 似分 类质 量
非空有限论域,A=CUD,C 和D分别为条件属性 集和决策 属性集,D≠ ,且CnD≠ ,对 于每 个子集 和 不
旦 ) 量 ) ( ( ( , ) E 证明 。 ・ 。
() .
E ・【】 【】 ’ £ ・
收稿 日期:2 0 . 11 0 1.8 5
1 )初始化 :G( =0 D)
【kn ≠
‘ . .
∈B( ), E( 故 )
() .
2 / ) D={ y, y) / ,2 …,刖 R={ , , } X …,
3) f ri om o t =l
性 质 22 给 定决策表 S=( A , . U, ) 其中 为 非 空 有 限 论域 ,A=CU D,c 分别为条件属性集和决策属性集 , 和D
∈ ( ) .
者 已提 出了各种启 发式属性约简算法 .如文 提 出 的 基
于互信息量 的知识约简算法 :文 提 出的基 于差 别矩 阵 和差别 函数的逻辑化 简求法 .但这些算法计算都较复杂 .
定义2阁 设集合簇 = ,: , ) = ) . 2 (. , U 是 …
l 引 言
分 明关系 , 的上近似和下近似分别可 以由 的基本 集定 义如下,
粗 糙集理 论是波 兰科学家 P wlk在18 a a 9 2年提 出的一

基于知识量的决策表约简算法

基于知识量的决策表约简算法

础 上 , 设 计 了一 种 基 于知 识 量 的 约 简 算 法 , 实例 分 析 表 明 该 算 法 能 够 有 效 得 到 决 策表 的 约 简 。
关 键 字 :粗 糙 集 理 论 ;属 性 约 简 ; 知 识 量 ;相 对 知 识 量
中 图 分 类 号 :T 3 1 6 P 0 .
文 献标 识 码 :A
文 章 编 号 :1 7 —1 1 (0 7 0—2 40 6 18 5 2 0 ) 20 1—4
De iin Ta l d cin Alo ih B sd o o e g a tt cso b eRe u to g rt m a e n Kn wld eQu n i y
Ll ANG u — u tal Ch n h a e ,
粗糙集 理论 _ 是 1 8 1 9 2年 由 Z a a .P wl k提 出 的一种 处 理不 确定 性知 识 和模糊 数 据 的分析 工具 。
有 限集 合 , { 。口 , , ) : U A一 口 , 。 … 口 ;
a ∈ A i 。
; 是属

性口 的值 域 ; 示 U×A— V 是 一 个 信 息 函数 , f表
属 性 P决定 的划 分 U/ P= { , , , X。 X。 … X ), 则属 性 P具 有 的知识 量 K ( P)定义 为 :
属 性 ,从 而得 到 约简 中 的条 件 属 性 对 决 策 属性 的
决策 规则 。
K( P)
∑ I f I x u—x I
定 理 1 S一 ( [设 4 U,A) 是 一 个 信 息 系 统 ,
维普资讯
J St . lANXIAGRI UNI C. V.( t r lSce c Na u a in eEdiin) to

决策表约简方法的关系

决策表约简方法的关系

粗糙 集理 论是 一种 新 的处理 模 糊性 和不 确定 性 知识 的数学 工具 [引 h 。自 18 92年 由波 兰学 者 P wlk a a [ ]
首次 提 出 以来 , 经过 2 0多 年 的研 究与 发 展 , 已经 在理 论 和 实 际应 用上 取 得 了长 足 的 发展 , 别 是 2 纪 特 O世
第 3 期
钟玉 田等 : 策表约 简方 法的关系 决
定 义 3 A A 称 为决 策表 S 的一 个正 域 协 调 集 , 果 p s ( =p ST d) 称 A 为 的 一个 正域 如 o ) O A ( ;
A( ) { = X∈U z x) I ] [ , A( 一 ( X) ∈Ulx A I ] nX≠ } 。
定义 2 [ 对于 任 意 A A d的 正 域 p s ( 定 义 为 : , o )
p s( = U o A )= ( 。 = X)
X∈ U/ d
集 , 保持 近似 分类精度与近似分 类质量不变 。另外 , 且 信息 系统 的约简问题可 以转化 为相容决 策表的约简 。 关键词 : 粗糙集 ; 策表 ; 决 知识 约简 ; 协调集
中图分类号 : 1 TP 8
文献标识码 : A
文章编号 :0 16 0 (0 8 O— 1 00 1 0 —6 0 2 0 ) 30 1—4
论 域 ; 是 条 件属 性 集 ; 为 决 策属 性 ; A 一

U V , 属性 n的值 域 ; UX ( V 是 厂: ATU t ) )一 称为
信 息 函数 , 它为 每个 对象 的 每个属 性 赋予 一个 信 息值 。 以 下假 设 S一 ( ATU{ , 厂 是 一个 决 策 表 , 于 A A A决 定 了论 域 U 上 的一 个 等 价 关 系 U, d)V, ) 对 , id A) 称 为 由 A 确定 的不可 区分关 系 , 义为 ( ) n ( 当且 仅 当 : 于 任 意 口 n( , 定 z, ∈id A) 对 ∈A, x, ) f( 口 一厂( , j , n 。我们用 ] ) 表 示对 象 z在 此 等价关 系之下 的 等价类 , U/ 表 示所 有这 些 等价 类构 成 的集 合 。对 于 用 A 任意 A A X∈ , 在 A 之 下 的下近 似集 A( 与上 近似 集 ( 分 别定 义 为 : 丁, X _ ) X)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
称布尔合取范式 2
A ( x ) A ( y )

2 ( x, y ) 、 3
A ( x ) A ( y )

3 ( x, y)
分别为决策表 S 的最大分布区分函数和分配区分函数。
定理 设 S (U , A {d},V , f ) 为决策表。 (1) 2 的极小析取范式的所有合取子式恰为 A 的所有最大分布约简。 (2) 3 的极小析取范式的所有合取子式恰为 A 的所有分配约简。
A (4) (0,1).
故分布区分矩阵为
1 2 3 4 5 1 2 {a, b, c, e} {a, b} {c, e} 3 4 {a, b, c} {c} {a, b} {c, e} {c} 5 6 {a, b} {c, e} {c}
qr
其中
B ( x) {D j D j [ x]B } 1 r B RB ( D j ) U j 1
D( D j [ x]B ) D j [ x] B [ x] B
是 [ x]B 包含于D j 的程度.
B ( x) A ( x) ,则称B是分布协 定义: (1)若对于任意 x U , 调集。极小的分布协调集称为分布约简。 B ( x) A ( x) ,则称B是最大分布协调集。 (2)若对于任意 x U , 极小的最大分布协调集称为最大分布约简。 ( x) ( x) ,则称B是分配协调集。极 (3)若对于任意 x U , 小的分配协调集称为分配约简。 (4)若 B A ,则B称是近似协调集。极小的近似协调集称 为近似约简。
第四讲: 基于包含度的决策表约简
1 约简的概念
对于决策表
U d
S (U , A {d},V , f )
,设
B A
, x U ,记
{D1 , D2 ,, Dr },
B ( x) ( D( D1 [ x]B ), D( D2 [ x]B ),, D( Dr [ x]B ))
B ( x) {D j D( D j [ x]B ) max D( Dq [ x]B )}
B A
性质
定理: B为分配协调集当且仅当:B为近似协调集。
B为分配约简当且仅当:B为近似约简。
2 约简方法
定理 设 S (U , A {d},V , f ) 是决策表且 B A 。 (1) B 是分布协调集的充分必要条件为:对于任意 x, y U ,若
A ( x) A ( y) ,则 [ x]B [ y]B .
U {C , C , C , C } ,其中 C {1}, C {2}, C {3,5,6}, C {4}. 1 2 3 4 1 2 3 4 A
考虑分布约简。
A (1) (1, 0) , A (2) (0,1) , A (3) A (5) A (6) ( 2 3 , 13 ) ,
(2) B 是最大分布协调集的充分必要条件为:对于任意 x, y U , 若 A ( x) A ( y) ,则 [ x]B [ y]B , y U , 若 A ( x) A ( y) ,则 [ x]B [ y]B .
对于决策表 S (U , A {d},V , f ) , x, y U ,令
{a A; f ( x, a) f ( y, a)}; A ( x) A ( y) 。 1 ( x, y) ; A ( x) A ( y)
定理 设 S (U , A {d},V , f ) 是决策表且 B A 。则 B 是分布协调集的 充分必要条件为:若 1 ( x, y) ,则 B 1 ( x, y) .
{a A; f ( x, a) f ( y, a)}; A ( x) A ( y) , 2 ( x, y) ; A ( x) A ( y) {a A; f ( x, a) f ( y, a)}; A ( x) A ( y) 3 ( x, y) . ; A ( x) A ( y)
例 考虑下面的决策表。
U
1 2 3 4 5 6
a
1 0 0 0 0 0
b
0 1 1 1 1 1
c
0 1 0 1 0 0
e
0 1 0 0 0 0
d
1 2 2 2 1 1
其 中 a, b, c, e 为 条 件 属 性 , d 为 决 策 属 性 。 则 U
d
{D1 , D2 } , 其 中 D1 {1,5,6} , D2 {2,3,4}.
称布尔合取范式 1
A ( x ) A ( y )
1 ( x, y)
为决策表 S 的分布区分函数。 定理 6.3.5 决策表 S (U , A {d},V , f ) 的分布区分函数的 极小析取范式的所有合取子式恰为 A 的所有分布约简。
类似地,对于任意 x, y U ,令
6
分布区分函数为
1 (a b c e) (a b) (a b c) (c e) c
(a c) (b c)
故 A 的分布约简为 {a, c} 与 {b, c}.
相关文档
最新文档