基于模糊决策树的模糊推理模型
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的规则目前结论集的可信度范围是 eu*{ emin ,emax }… ②;同理 f 的范围 fu*{fmin ,fmax}…
③。两式有交集的必要条件是:fu*fmax ≥eu*emin …④。只有满足这个条件,通过 f 的规则
所推出的结论可信度有可能大于 e 的结论可信度,因此需要遍历经过 f 的分支。这样可以在 交互最少的情况下,不至于漏掉可能的结论。
规则库
事实库
结论库
前提条件有<0.5 规则分入此类 属性值隶属度<0.5 的事实
×
前提条件有回答不确定的
属性值回答不确定
‘近似推理’得到的结论
规则子集中除以上两项余下的 回答的隶属度>=0.5
真实隶属度满足阈值得到的结论
4 实验示例与数据
对 UCI 数据库[8]中的 Pima Indians Diabetes Database 为源数据,通过的 feature-maps 算法[4]进行模糊化,使用三角隶属函数。在单调下降学习率为 0.5 时,每个属性的基本语义 值为 2 时,结果如表 3:
与叶子外的任何节点,回答了不确定,将进行此推理。它包含两方面的内容:1,属性所含
各属性值隶属度被置为 0.5,放入不确定事实库集合;2,推理中使用了不确定事实进行结论
的计算。除此以外应设置栈保存规则 1 要求访问的节点;保存 FDT 推理部分匹配值大于λ的
未搜索分支。
表 2 黑板部分内容的细分
弃用 不确定 良好
对FDT的研究主要在机器学习领域,其研究成果应用广泛,如在电网中电压崩溃的分析 [2]、探伤检验的应用[3]、供电中欺诈行为的辨别等。FDT生成算法有多种如: Fuzzy ID3算法 及改进…①、 Min-Ambiguity算法[4]…②、按属性重要性的程度创建FDT[5]…③、整合模糊集 合理论和熵的方法[6]等。上述①、②、③都是归纳学习中的启发式算法,其中②的易理解性 好,③分类准确率优,①的适用性最好[5]。②是一种基于不确定性减少的启发式模糊决策树 生成算法,主要思想是利用属性的不同语义值对分类的影响,计算每个属性在不同情况下的 分类不确定性G,选择值最小的属性作为根或者扩展节点[4]。分类不确定性G是指由模糊证据
Root
0.8
0.9 0.6
A
B
C
0.7
0.7 0.8
D
E
0.8 0.9 0.6
F 0.8 0.9
HI
J
KL
CF:0.7 0.6 0.9
0.95 0.6 0.8
图 1:推理规则 1(例,λ=0.5)
节点 Min{CF} Max{CF} 节点 Min{CF} Max{CF}
A 0.6 0.7 G 叶子 叶子
下一步是在搜索空间上的推理或称搜索。因为要较少交互次数所以必须使用启发式搜 索。启发式应与模糊推理的特点相结合。
3 问题的解决的方法
3.1 建立模糊决策树推理模型的算法
如引言中所述,本文将构造 FTD 推理模型(参见图 3)。使交互次数尽量少的前提是通过 大量的示例学习以后,按模糊环境中分类不确定性 G 的减少量对属性动态排序,提出问题- 交互,在多数情况下最容易直接命中有解的规则。构造算法如下:
-4-
http://www.paper.edu.cn
属性 0
属性 1
表 3 前 5 条记录模糊化后的结果
属性 2 属性 3 属性 4 属性 5 属性 6
属性 7
结论
T00 T01 T10 T011 T20 T21 T30 T31 T40 T41 T50 T51 T60 T61 T70 T71 C1 C2
1 引言
智能呼叫中心是将呼叫中心与人工智能特别是专家系统相结合,向呼叫中心用户提供专 家级服务以提高呼叫中心服务质量,同时降低呼叫中心坐席代表的工作强度[1]。传统电话对 语音通信能够提供较好的支持,通过电话访问专家系统不失为一项好的选择,但这里需要解 决人机交互不便、并行推理、模糊事实输入等一系列问题。由于初始事实集为空,减少推理 过程中的人机交互次数必须设计一个高效的推理算法,采用决策树推理是一个有效的手段。
B 0.6 0.95 H
..
..
C 叶子 叶子 I
..
..
D 0.6 0.7 J
..
..
E 0.9 0.9 K
..
..
F 0.6 0.95 L
..
..
按最大隶属度选定的主推理路径:(Root,B,F,L),结论可信度:0.48;B 点的相邻节
-3-
http://www.paper.edu.cn
点 C 为叶子,C 处备选结论可信度为 0.48;F 的相邻节点 E:0.7>0.8*(0.6/0.9),应遍历 E
规则优先处理。
3.5 推理机中黑板设计的关键技术
为了便于实现以上的推理规则,模糊专家系统相应的黑板(综合数据库)关键设计如下:
我们将黑板中的规则库,事实库,结论库作进一步的细分。如表 2 所示。在推理过程中,每
个直接规则子集中规则分为 3 种集合:弃用规则、不确定规则、良好规则;公用的事实库也
分为 3 种集合;结论只有两种。其中‘近似推理’的含意是由于在决策树的推理部分,除根
推理规则 1:相邻节点 f 为非叶子节点时,当 fu≥eu * (emin / fmax),其中 fu、eu>
λ,则 f 需要访问;f 为叶子节点时,推出的结论为备选结论。
例:按规则 1 求模糊决策树(图 1)的结论可信度,其中边上的值为模糊子集的隶属度,
字母仅标识节点。节点信息表如表 1。
表 1:节点信息表
由图 1,推理时在每个节点选择隶属度最大且大于阈值的分支向下扩展,直到遇到直接 规则集节点,启动产生式推理。这个推理过程存在遗漏可信度最大的结论的问题。这是因为 由概念所引起的模糊性导致了推理的不确定性,提问的回答可能以不同的程度隶属于多个语 义,综合式①,单单一个启发信息(隶属度)不能保证一定得到可信度最大的结论,即隶属度 最大不意味着结论可信度一定最大。
-2-
http://www.paper.edu.cn
则结论的可信度 CF=min(δmatch(A,A'), δmatch(B,B')…)*CFi ,其中δmatch(A,A')表 示 事 实 A’ 与 A 的 匹 配 度 。 由 隶 属 度 和 匹 配 度 的 概 念 [7] , 可 以 有
CF=min( µ A (u) , µ B (u) …)*CFi= µmin (u) *CFi …①,其中μ(u)表示隶属度。 3.3 搜索中关于可能遗漏局部最优解的讨论
0.19 0.81 0 1 0 1 0.38 0.62 1 0 0 1 0.48 0.52 0.07 0.93 0.2 0.8
1 0 1 0 0.49 0.51 0.64 0.36 1 0 0.84 0.16 0.93 0.07 0.81 0.19 0.8 0.2
0 1 0 1 0.67 0.33 1 0 1 0 1 0 0.41 0.59 0.77 0.23 0.2 0.8
发式信息指导搜索。启发信息实际是值的区间,启发的结果是最优解路径的一种可能性。
3.4 其他推理问题讨论
推理中,再使用如下的推理规则,使推理能够处理回答小于阈值的情况与回答“不确定”
的情况。推理规则 2:搜索 FDT 时,如果当前已知的证据匹配值最小值小于λ,则返回上层
节点,检查是否还有匹配值大于λ的分支,有则搜索,否则返回,直到检查到根。如果没有
-1-
http://www.paper.edu.cn
所引起的分类结果的不确定性,其概念、公式参见文献[4]。
2 使用状态空间表达问题
状态空间是人工智能领域中一种基本的问题求解技术,特点直观,缺点是对复杂问题表 达困难。对于一个专家知识库,将其化为直接规则集,简化逻辑后,可以采用状态空间来表 达问题。以产生式表示的知识为例:去掉产生式的中结论,生成直接前提由多个基本事实逻 辑“与”推出结论的规则,如果前提条件为多个逻辑“与”表达式的“或”关系,则分解成 多条规则,最后形成直接规则集 DR。在前件中出现的属性,其所有语义都作为状态中的一 个状态元素,初始状态元素全部为 0;所有规则前件各语义得到满足的状态作为目标态。这 样可以借用状态空间的思想来解决问题。每交互/提问一个问题,状态就转换到下一个,直 至目标态。直接规则集涉及的状态空间作为搜索空间,缩小了问题空间的数量。
1,将规则集转变为直接规则集。即从规则中去除中间结论;并将前提含”OR”的规则 从”OR”处分开,形成多条仅含”AND”的规则。
2,如果未进行学习,先用 FDT 算法-Min-Ambiguity 算法生成 FDT。 3,将叶子换为直接规则集节点,并将第一步得到的直接规则按照各前提属性语义值为 1 的清晰示例(可以作为模糊示例的特例)分配到直接规则集 N 中。对于未能完全匹配的规 则,分两种情况,一种是前提对于分支都匹配,但有余项(前提的一部分)长于分支,称为 未匹配完;一种是与分支有不匹配项,称不匹配。对未匹配完的,仍分入该分支的规则子集; 对不匹配的,先标记。 4,从树的直接规则集开始,如果直接规则集为空,则删除此分支。 5,仅在根节点添加不确定分支及直接规则集节点,将第三步标记的规则全部分入。
分支,其备选结论可信度 0.54;K 相邻 L 且为叶子,K 处结论可信:0.76。所以如果只选一
个结论则为 K 处结论。由例子可以看出:1 在本文使用的模糊规则表示形式下,每次按最大
匹配/隶属关系的推理路径并不能保证结论最优,这恰恰体现出模糊推理与传统推理的不同
之处,多备选结论。2,这里的搜索方法把对结论的评价计算与搜索相结合,并作为一种启
在文献[1]中提出了智能呼叫中心的体系结构以及将产生式规则转换成决策树的算法, 采用的产生式是确定型的,而实际情况是大部分的知识是模糊的不确定的,人类专家通常都 是采用模糊的专家知识解决实际问题,因此本项研究的一个基本工作是将模糊的产生式推理 规则转换成 FDT 推理模型以及建立相应的模糊推理控制机制。
3.2 结论可信度计算模型
要推理,首先得根据模型的特点确定推理结论可信度的计算方法。本文讨论时采用如下 的规则形式:IF A and B and … then Ci CFi,λ 。其中 A,B,…是属性语义项或称模糊 子集;CFi 表示规则的可信度, λ阈值。当证据是 A',B',…且证据置信度最小值大于λ时,
找到这样的分支,则转到根下的“不确定”分支,启动规则子集的推理。推理规则 3:当返
回信息为“不确定”时,首先以隶属度 0.5 给对应属性的所有语义值赋值,保存不确定事实,
标记规则为不确定规则,检查上层节点是否有其他匹配值大于λ的分支未搜索,有则转到其
他分支,若无,则启用根下“不确定”分支的规则子集进行推理,以前件不含不确定事实的
Байду номын сангаас
1 0 1 0 0.49 0.51 0.9 0.1 0.91 0.09 0.6 0.4 1 0 1 0 0.8 0.2
1 0 0 1 1 0 0.38 0.62 0.82 0.18 0 1 0 1 0.73 0.27 0.2 0.8
T00、T01 表示属性 0 的两个语义,其他类推;C1、C2 代表两个结论(在分类学习中表 示两个类别)。注意表 3 中结论是清晰的,为了构造模糊学习示例即分类结果也模糊的示例, 将 0 以 0.2 置换,1 由 0.8 置换,并不影响分类的结果。假设已有领域知识如下:
http://www.paper.edu.cn
基于模糊决策树的模糊推理模型
丁达志 1 周宽久 2
1 大连理工大学软件学院,大连(116024) 2 大连理工大学管理学院,大连(116024)
email:ddz163@163.com
摘要: 通过呼叫中心访问模糊专家系统需尽可能少地与用户交互并保证正确推理,本文在 研究几个著名模糊生成树算法的基础上,提出了一种应用于呼叫中心的基于模糊决策树的推 理模型及其相应的模糊推理机制。整个求解过程基于状态空间的思想。在研究模糊产生式规 则集转化为模糊决策树时,针对存在大量示例的情况,给出了基于分类不确定性概念-G 的 一种转化算法。在推理过程中使用了一种启发式搜索技术。最后实例验证模型和推理机制, 结论有效,且推理过程清晰。 关键字:模糊专家系统,模糊决策树(FDT),启发式搜索,模糊推理,状态空间
问题转化为:沿着分支推理提问时,在选定最大隶属分支后,如何才能判断相邻的语义 分支是否需要搜索。由于生成 FDT 以后,对任意一个非叶子节点 e,包含它的所有直接规则
的可信度是可以知道的,这样可以得到一个范围以{ CFmin, CFmax }表示。若从根到 e 的所有
语义值的最小隶属度为 eu,可信度范围{ emin ,emax };相邻非叶子节点以 f 标识。则经过 e