基于因果图的一种知识获取方法_王洪春
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基金项目:国家高等学校博士点专项基金(99061116),重庆市科技攻关项目(5990)资助。收稿日期:2004-12-14
第23卷 第3期
计 算 机 仿 真
2006年3月
文章编号:1006-9348(2006)03-0126-03
基于因果图的一种知识获取方法
王洪春
1,2
(1.重庆大学自动化学院,重庆400030;2.重庆师范大学数学与计算机科学学院,重庆400047)
摘要:产生式规则和因果图是知识表示的两种方法,鉴于产生式规则在表达知识和推理方面的缺陷或不足,因此寻找一种能更好地表达知识和推理的方法非常必要,而因果图具有表达知识直观,推理灵活、方便等特点。论文根据模糊式产生式规则与因果图,以及合成式模糊产生式规则与含与门、或门的因果图的对应关系,给出了将模糊产生式规则集表示的知识转换成更紧凑、直观因果图表示的方法和过程,相应的也得到了一个因果图知识的获取方法,并给了一个其转换的实例。关键词:因果图;模糊式产生式规则;知识表示中图分类号:TP18 文献标识码:A
A M ethod of Knowledge Acqu isiti on Ba sed on Caus a lity D i a gram
WANG Hong -chun
1,2
(1.College of Aut omati on,Chongqing University,Chongqing 400030,China;
2.Dep t .ofM athe matics and Computer Science,Chongqing Nor mal University,Chongqing 400047,China )ABSTRACT:Pr oducti on rule and Causality D iagra m are t w o methods for rep resenting knowledge .Because using p r o 2ducti on rule t o rep resent knowledge and reas on has many shortages,it is necessary t o find a method that can rep resent knowledge and reas on better than p r oducti on rule .The Causality D iagra m takes on characteristic such as intui 2ti onal knowledge rep resentati on,flexible reas oning and convenience .I n this paper,according t o the relati onshi p be 2t w een p r oducti on rule and Causality D iagra m,a method is p r oposed t o convert the p r oducti on rule set int o Causality D iagra m,a method of knowledge acquisiti on based on Causality D iagra m,is discussed and an examp le f or this con 2versi on is KE YWO RD S:Causality diagra m;Fuzzy p r oducti on rule;Knowledge rep resentati on
1 引言
多年来,人工智能(A I )研究的主要课题是知识表示、知识获取方法、机器学习和人机界面接口。机器学习是系统自身性能提高的主要手段,人机界面是系统大众化的关键途径。而知识表示和知识获取方法一直是A I 应用领域———专家系统的重要研究内容。它的首要要求是能准确地表达人类知识。如何有效地获取和实现合适计算机处理的知识表示方法,各国学者进行了大量研究,先后提出了不少有价值的方法。但是目前的知识表示方法都有一定缺陷,仍然不能适合各类专家系统的需要,因为在专家系统中处理的信息常常是不精确的、模糊的或者是不完备的,人们易于根据领域知识,归纳总结出知识的确定性因果关系的描述,却难于获得不确定知识的描述,这是由于不确定知识如证据、结论的可信度不易获取。
1994年张勤教授提出的动态因果图
[1]
(以下简称因果图)是一种基于概率论的图形化的知识表达推理方法,是一
种不确定推理方法,它采用图形表示因果关系,结点表示事件或变量,有向边表示因果关系,并用连接强度来表示因果关系的强度。这种图形化知识表示方式非常直观、自然,便
于表达显性的知识,便于专家给定知识[1]
。
目前,基于规则的产生式系统是实现专家系统的一种流行方法。构成产生式系统的规则称为产生式规则。产生式规则描述前提和结论之间的一种因果关系,而因果图采用图形直观表示因果关系,因此可以把这种用规则描述的知识转换为用图形直观描述的知识,这既可以使知识的表达更直观,更方便,表达力更强,增加知识的表达方式,也能扩大因果图的应用范围,本文打算讨论产生式规则和因果图的关系,并对产生式规则集用因果图表示或将产生式规则集转换成因果图进行探讨。
2 产生式规则与因果图
2.1 产生式规则
产生式规则是借助条件语句I F -THE N 表示知识的方法,它的一般表示形式为:
I F <前提>THE N <结论>
—
621—
产生式规则是人工智能中应用最多的一种知识表示模式,许多成功的专家系统都是用产生式规则来表示知识的。例如费根鲍姆等人研制的化学分子结构专家系统DE N2 DRAL、肖特里菲等人研制的诊断和治疗细菌感染性疾病的专家系统MYC I N等。这是由于产生式规则表示法具有以下优点:①自然性;②模块性;③有效性;④清晰性。但传统的产生式规则表示法也有以下不足之处[2]:①推理效率低下:采用传统的产生式规则表示法的因其推理过程是靠一系列的“匹配———冲突解决———执行操作”过程循环实现的,而且在每个推理周期,都要不断地对全部规则的条件部分进行搜索和模式匹配,从原理上讲,这种做法必然会降低推理效率,
而且随着规则数量的增加,效率低的缺点会越来越突出,甚至会出现组合爆炸问题。②不直观:数据库中存放的是一条条相互独立的规则,相互之间的关系很难通过直观的方式查看。③缺乏灵活性:对复杂、大型以及动态概念不能很好地表示,结构往往需要事先以手工编码的方式确定,而且往往是固定的,不能动态的修改;对于真实的应用环境的全部问题的描述代价太大且很难保证能顺利实施。
2.2 因果图
因果图是一种利用图形直观表示事物因果关系的知识表示方式,因果图可以形式化表示为:
C=,且S=
其中符号含义如下:
C-因果图模型
S-因果图结构
X-中间事件,或中间事件变量,用来表示任何有原因的事件。在图形上以至少含有一条输入边,可以不含或含有1至多条输出边的圆圈节点表示。
B-基本事件,或基本事件变量,用来表示任何没有原因或不追究其原因的事件,并且它至少为一个中间事件的原因。显然由于任何一个基本事件都不可能是另一基本事件的原因,基本事件之间相互独立。在图形上以不含有任何输入边但至少含有一条输出边的方框节点表示。
G-逻辑门,它把输入变量通过逻辑运算组合成输出变量,输入变量到输出变量的映射间既可以是简单的与、或关系,也可以是复杂的逻辑表达式。图形上以至少含有两条输入边和一条及以上输出边的门节点表示。
P-连接事件,或连接事件变量,它表示父节点事件(原因)导致子节点事件(结果)发生的事件,当父节点事件发生并且该连接事件发生时,子节点事件必定发生。从数值上其概率表示父节点与子节点间的因果强度,但作为一个事件,它与父节点事件相互独立。可见连接事件之间相互独立,而且连接事件与基本事件之间也相互独立。图形上表示为从基本事件、中间事件或逻辑门出发,始终指向中间事件的一条有向弧,指向同一个中间事件的所有连接事件是“或”关系A-参数,包括基本事件的先验概率、连接事件的连接概率等。
如图1所示为一个典型因果图示例。
模型在推理前要求因果结构及所有参数已知。在图中未有任何标记的连接事件,表示当源事件发生的时候,目的事件一定发生,即该事件发生的概率为1。
在故障诊断应用中,通常可以将基本事件看成是故障,将中间事件看成是现象和参数,比如温度计、压力表的读数等。在构造因果图时,构造故障同现象和参数之间的因果关
图1 典型因果网
系;在推理时,则根据现象和参数确定故障发生的概率。
由上所述,因果图在表达上没有要求拓扑结构必须为有向无环图,而允许出现有向环(如图1所示的回路X3-P34 -X4-P43-X3),因此能够表达反馈等问题。因果图在给定事件之间的因果关系时,一方面采用了连接事件的概念,连接事件仅与其相连的父节点事件和子节点事件相关,其数量只随原因的增加而线性增加,每增加一个原因只需增加一个连接事件;另一方面连接概率表示的是因果强度而不是条件概率,能与专家知识相吻合;再一方面引入了逻辑门的概念,可以图形化表示原因之间的逻辑关系,因此能较为方便地给定事件之间的因果关系。
因果图具有以下特点:
1)完全基于概率论,有良好的理论基础。
2)能够处理因果环路结构。因为因果图表达的是用事件概率描述的领域随机变量间的因果关系,在其中蕴涵了一种联合概率分布,这样它对图形的拓扑结构没有限制(不要求通常使用的DAG图)。
3)采用直接因果强度而不是条件概率,避免了在给定知识时知识间的相关性问题。这与领域专家头脑中的知识结构相对应,便于专家知识获取。
4)引入了动态特性,能根据在线收到的信息动态变换因果图形结构,使之更符合当前时刻的客观实际。
5)具有灵活的推理方式,既能由因到果:Pr{X|Causes},也可由果到因:Pr{X|Conse w uence},还可因果混合:Pr{X| Causes&Consequence}。
总的来讲,该方法可以更有效地模拟客观世界,得到更加准确的推理结论。同时,因果图模型也是可能性传播图模型和故障影响传播图模型的基础,具有重要的工业应用价值,如在线故障诊断。
3 产生式规则与因果图的转换
传统的产生式规则可表示为:A->B或IF A THEN B
其中A是规则的前提,亦可称为前件、条件、前提条件;B 是规则的结论或操作,亦可称为后件。
由于规则的前提往往表示的是模糊知识或不精确或不确定知识,具有模糊性或不确定性或不肯定性,同时规则本身也具有一定的可信度或不肯定性,则可以把传统的产生式规则表示为模糊产生式规则:
IF A(α)THEN B w ith(β)
其中α和β分别表示前提A和规则的可信度或不精确或不确定的可能程度,称为前提和规则为真的概率。α、β在0到
—
7
2
1
—