第二讲 决策表的正域约简

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

( x, y) 时,有 B ( x, y) .
证明 必要性:设 x, y U 且 ( x, y) 。于是 ( x, y) 成立。 (1) 若 x posA (d ) 且 y posA (d ) , 则 x posB (d ) 且 y posB (d ) , 故 x B([ x]d ) ,y B([ y]d ) , 即 [ x]B [ x]d , [ y]B [ y]d , 故 [ x]B [ y]B , [ x]B [ y]B , 于 是 x [ y]B , 即 存 在 a B 使
a (b c) (a b) (a c)
c
0 0 0 0 1 1
d
1 0 1 0 0 1
其中 a, b, c 为条件属性, d 为决策属性。
U
ind ( A)
{{1},{2,3},{4},{5},{6}}
U
ind (d )
{{1,3, 6},{2, 4,5}}
区分矩阵为
1 1 2 {a} 2 3 4 5 6
posA (d ) {1, 4,5,6}
定理 决策表 S (U , A {d},V , f ) 的区分函数
( x, y )
x , yU
的极小析取范式的所有合取子式恰为 A 的所有 d 约简。
例子
例 7.3.1 考虑下面的决策表。
U
1 2 3 4 5 6
a
2 1 1 0 1 2
b
2 2 2 0 0 0
{4}: ( 头痛,否 ) ( 肌肉痛,是 ) ( 体温,正常 ) ( 流感,否 ) ;
{7,9}: ( 头痛,否 ) ( 肌肉痛,是 ) ( 体温,很高 ) ( 流感,是 ) ;
2 {5,6,8}: ( 头痛,否 ) ( 肌肉痛,否 ) ( 体温,高 ) ( 流感,是 ) ;可信度为 ; 3 1 {5,6,8}: ( 头痛,否 ) ( 肌肉痛,否 ) ( 体温,高 ) ( 流感,否 ) ;可信度为 。 3
对于任意 x, y U ,令 ( x, y) 表示下列条件:
x posA (d ) y posA (d ) ,

x posA (d ) y posA (d ) ,

x, y posA (d ) ( x, y) ind (d ) 。
且令 ( x, y) 为如下集合: 若 ( x, y) 成立,则
red ( A) {{R1, R2},{R1, R3}} , core( A) {R1}.
定义 一个决策表是一个四元组 S (U , A {d},V , f ) ,其中 U , A,V , f 的 意义同定义 1, d 称为决策属性。 例 一个关于病例的决策表如下: 病例 1 2 3 4 5 6 7 8 9 头痛 是 是 是 否 否 否 否 否 否 肌肉痛 是 是 是 是 否 否 是 否 是 体温 正常 高 很高 正常 高 高 很高 高 很高 流感 否 否 是 否 是 是 是 否 是
例 设 S (U , A,V , f ) 为一个信息系统,其中 U {xi ;1 i 8} , A {R1 , R2 , R3} 且
U U U
R1 R2 R3
{{x1 , x4 , x5},{x2 , x8},{x3},{x6 , x7 }} , {{x1 , x3 , x5},{x2 , x4 , x7 , x8},{x6}} , {{x1 , x5},{x2 , x7 , x8},{x3 , x4},{x6}}.
第二讲: 信息系统知识约简
1 信息系统的约简
定义: 设 S (U , A,V , f ) 是信息系统, B A , a B 。 称 a 为 B 中不必要属性,如果 ind ( B) ind ( B {a}) 。 否则称 a 为 B 中必要属性。若对于任意 a B , a 为 B 必要的, 则称 B 为独立的;否则称 B 为依赖的。

( y, z ) 不 成 立 , 则 由 y A([ x]d ) posA (d ) 可 得 z posA (d ) 且 ( y, z) ind (d ) , 故
z [ y]d [ x]d .
若② ( y, z ) ind ( A) ,则 z [ y]A [ x]d . 于是,我们证明了 [ y]B [ x]d ,即 y B([ x]d ) 。故 A([ x]d ) B([ x]d ).
经过计算可得:
U
ind ( A)
{{x1 , x5},{x2 , x8},{x3},{x4 },{x6},{x7 }} ,
U U
ind ({R2 , R3}) ind ({R1 , R3})
{{x1 , x5},{x2 , x7 , x8},{x3},{x4},{x6}} , U ind ({R1 , R2 }) U ind ( A) .
区分函数为
3 {a} 4 {a, b} {a, b} {a, b} 5 {a, b, c} {b, c} {b, c} 6 {a, b, c} {a, b, c} {a, c} {a}
a (a b) (a b c) (b c) (a c)
f ( x, a) f ( y, a) , B ( x, y) .
(2)若 x posA (d ) 且 y posA (d ) ,类似可证 B ( x, y) . (3) 若 x, y posA (d ) 且 ( x, y) ind (d ) , 则 x posB (d ) 可得 [ x]B [ x]d , 因 y [ x]d , 故 y [ x]B 。 类似于(1) ,可以证明 B ( x, y) .
故 x Y ,从而 [ x]B Y ,即 x B(Y ) ,于是有
x B( Z ) posB (d ), x A( X ) posA (d ),
Z U d
此与 posA (d ) posB (d ) 矛盾。
定理 设 S (U , A {d},V , f ) 是决策表且 B A 。 则 posB (d ) posA (d ) 当且仅当:对于任意 x, y U ,
由此决策表可以得到如下决策规则:
{1}: ( 头痛,是 ) ( 肌肉痛,是 ) ( 体温,正常 ) ( 流感,否 ) ; {2}: ( 头痛,是 ) ( 肌肉痛,是 ) ( 体温,高 ) ( 流感,否 ) ;
{3}: ( 头痛,是 ) ( 肌肉痛,是 ) ( 体温,很高 ) ( 流感,是 ) ;
d
, A( X ) B( X ).
d
,源自文库
A( X ) {x [ x] A X }, B( X ) {x [ x]B X },
因 [ x]A [ x]B ,故 B( X ) A( X ). 若存在 x U ,使 x B( X ) 且
x A( X ) ,则 [ x]A X ,故 x X . 对于任意 Y U d , Y X ,有 Y X ,
其中,前五条是确定性规则,后两条是近似规则。
2 决策表的正域约简
设 S (U , A {d},V , f ) 是决策表,其中 A 为条件属性集合,
d 为决策属性。若 B A 满足 posB (d ) posA (d ) ,
则称 B 是 S 的一个正域协调集;极小的(关于集合包含关系) 正域协调集称为 S 的正域约简,也称为 A 的正域约简。

充分性:需要证明对于任意 x U , B([ x]d ) A([ x]d ). 事实上, B([ x]d ) A([ x]d ) 显然成立。 有① ( y, z ) 不成立,或② ( y, z ) ind ( A) 。 若① 设 y A([ x]d ) ,则 [ y]A [ x]d 。对于任意 z [ y]B ,有 B ( y, z) ,故 ( y, z) 。于是
( x, y )
x , yU
区分函数是一个布尔逻辑公式,其中元素为布尔变量。
定理 设 S (U , A {d},V , f ) 是决策表且 B A 。则 posA (d ) posB (d ) 当且仅当:对于任意 X U 证明 充分性是显然的。 必要性:设 posA (d ) posB (d ) ,对于任意 X U
对于依赖的属性集合,其中包含有冗余关系,可以对其进行约简。 定义:设 S (U , A,V , f ) 是信息系统, B A 。若 B 为独立的 且 ind ( A) ind ( B) ,则称 B 为 A 的一个约简。 A 的所有约简构成的 集合记为 red ( A) , A 的核 core( A) red ( A).
于是, R1 是 S 中的一个必要知识; R2 是 S 中的一个不必要知识,去掉 R2 之后,由 {R1 , R3} 形成的论 域 划 分 与 A 形 成 的 划 分 相 同 , {R1 , R3} 是 A 的 一 个 约 简 。 同理 , {R1 , R2 } 也 是 A 的 一 个 约 简 。即
( x, y) {a A; f ( x, a) f ( y, a)} ; 若 ( x, y) 不成立,则 ( x, y) .
对于任意条件属性 a A ,指定一个布尔变量 (仍记为 a )与之对应。设 U n ,决策表 S 的区分矩阵 是一个 n n 矩阵,其中的元素为 ( x, y) 。 S 的区分函数定义为:
相关文档
最新文档