第八章 决策表值约简

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第八章信息表值约简

值约简是在属性约简的基础上对决策表的进一步简化。本章将就决策表的值约简问题进行系统分析,并介绍几种主要的值约简算法。

8.1 决策表值约简概述

在第7章中,我们介绍了决策信息表的属性约简,通过属性约简,可以将决策表中对决策分类不必要的属性省略,从而实现决策表的简化,这有利于从决策表中分析发现对决策分类起作用的属性。但是,属性约简只是在一定程度上去掉了决策表中的冗余属性,但是还没有充分去掉决策表中的冗余信息。

例如,在表7.3-1所示的关于气象信息的决策表表的属性约简结果中,如果在条件Outlook=Sunny∧Temperature=Hot下,决策属性的取值肯定是N,而无需考虑条件属性Windy的取值是True还是False。

显然,这个属性约简结果,对于决策分类来说,仍然包含冗余信息。根据第四章中介绍的决策规则,我们不能够直接从该表中得到满意的决策规则。这就是说我们还需要进一步对决策表进行处理,得到更加简化的决策表,这就是我们本章将要讨论的决策表值约简问题。

与属性约简中的属性核一样,值约简中也可以定义相应的值核。

决策表S=(U,C,D,V,f),对于任意的x∈U,用d x表示决策规则,即

d x:des([x]C)⇒des([x]D),d x(a)=a(x),a∈C⋃D,

且d x|C、d x|D分别称为d x的条件和决策。

定义8.1-1 考虑一个相容知识表达系统S,对决策规则d x有[x]C⊆[x]D。若∀r∈C,有[x]C-{r}⊄[x]D,则r为d x的核值属性,r为d x中不可省略的;若[x]C-{r}⊆[x]D,则r不是d x的核值属性,r为d x中可省略的。

8.2 决策表值约简算法

8.2.1 一般值约简算法

对于一个经过属性约简而得到的决策表,我们可以对应其中的每一个样本形成一条决策规则。因此,我们可以将决策表中的样本用规则来表示,这样,约简后的决策表,实际上就是一个规则集合。对于这个规则集合,我们可以利用如下算法来进行简化:

对于规则集合中的每条规则

对于该规则中的任意条件属性

如果去掉该条件属性,该规则不和规则集中的其它规则

冲突,则可以从该规则中去掉该条件属性;

经过这样处理得到的规则集合中的所有规则都不含有冗余条件属性,也就是说,规则的条件属性数目已经被尽可能减少了。但是,这个算法的实现有很多任意性,比如,由于处理规则的顺序不同,或者处理规则中条件属性的顺序不同,我们都可以得到不同的值约简结果,得到的规则集合就会有所不同。因此,我们往往需要一些启发式知识来指导这一过程的进行。

8.2.2 归纳值约简算法

我们在7.3.3一节中对归纳属性约简进行了介绍,这里对归纳值约简加以讨论。

由核值的定义,求得每个规则d x的核值属性,就可形成决策表的条件属性核值表。但是,这样做的工作量太大。为了介绍归纳值约简算法,先看如下命题。

命题8.2-1 对相容知识表达系统S=(U,C,D,V,f),则以属性a为核值属性的决策规则集合为

core(a)={d x|x∈(U-pos C-{a}(D))}。

证明:∀a∈C,令B=pos C-{a}(D)。对∀x∈U-B,如果规则d x:des([x]C-{a}) ⇒des([x]D)为不相容决策规则,则必存在一决策规则d x’,使得d x’|(C-{a}) =d x|(C-{a}),而d x’|D≠d x|D,即x’∈[x]C-{a},但x’∉[x]D,因此[x]C-{a}⊄[x]D。

所以a 为决策规则d x 的核值属性,即core(a)={d x |x ∈(U-pos C-{a}(D))}。

根据上述命题,可以方便地求取任意条件属性a 的core(a),从而得到决策表的条件属性核值表。

在此基础上,我们来计算决策规则属性值的简化。

令U/D={y 1,y 2,⋯,y n }表示论域U 上由决策属性划分的决策类集,对每一个决策等价类,定义决策规则类DRC 为

DRC(y)={d x :des([x]C )⇒des([x]D )|x ∈U 且[x]C ⊆y},∀y ∈U/D 。

求解知识表达系统决策表的最小决策算法,可通过分别求解各个决策类的最小决策算法来实现。各决策类的最小决策算法则通过删除决策规则类中决策规则的冗余属性值及冗余规则来实现。

用core(y),∀y ∈U/D 表示决策类y 的核值属性集,core(d x )表示决策规则d x 的核值属性集,则有

core(y)⊆C ,core(d x ) ⊆C ,且

)

()()(y DRC d x

x d

core y core ∈=

下面给出求取决策类y 的最小决策算法步骤: 1)任取d x ∈DRC(y); 2)如

y

x x d core ⊆)(][,则输出决策规则

d x :)()(]/[)()(),]([)]([x x d cor

e D d core x y DRC y DRC x des x des =⇒,转9);

其中,)(]/[)()(x d core x y DRC y DRC =表示从DRC(y)中删除规则d x ’:des([x ’]C )⇒des([x ’]D ),这里,x ’∈)(][x d core x 。

3)令A 1=c o r e (y)-c o r e (d x ),A 2=C -c o r e (y),在测度函数 w(a)=|pos C-{a}(D)|/|U|下对A 1、A 2中元素排序,得有序集OA 1、OA 2,则有序集OA=OA 1⋃OA 2且|OA|=m ,OA 的m 个有序幂子集分别为T 1(OA),T 2(OA),⋯,T m (OA),相应的元素个数为n 1,n 2,⋯,n m 。 4)j=1; 5)i=1;

相关文档
最新文档