定性推理经典方法的数学结构分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

定性推理经典方法的数学结构分析

杨正瓴1

1天津大学电气与自动化工程学院(300072)

E-mail(zlyang@)

摘要:在简单回顾了定性推理的目标和特征的基础上,从代数结构、信息复杂性等方面分析了现存的6个代表性定性推理理论。从代数结构上看,它们或大约在环的水平,或大约接近于域。从复杂性看,有的以一阶逻辑为演算核心,有的大约以实数域作为核心。从求解效率看,最坏情况大都倾向于到指数界,平均情况时好时坏,常在多项式界。最后,提出“一般的几何曲线”层次的演算体系是定性推理的最高数学抽象。

关键词:定性推理;数学结构;复杂性;环;域;人工智能

1. 引言---- AI中定性推理的目标和特征概述

人工智能(AI)中的定性推理研究起因于力图将专家及常人解决常识问题的能力的计算机化。Williams等人认为,定性推理的核心是“发展关于科学家、工程师以及常人的下述的核心技能的计算理论,即他们的假设、验证、预言、创造、优化、诊断和维修物理机构的能力[1]p2”。这是一个关于定性推理的从外部功能的描述。定性推理的5个直接的起因为:常识性知识的使用与表示;某些领域的问题,精确定量的信息是不可能或不必要的,需要进行的是定性行为的分析和预测;在启发式专家系统中,不同领域和不同任务的知识转换时遇到的困难,需要定性方法;某些情况下系统的动态行为,或时态推理的需要;寻找系统的因果关系。

众所周知,如果一个问题能找到精确的数量化方法并且求解不太难的话,人们通常不会采用定性方法。如在物理学中用微分方程来描述物理系统。但由于“大多数从实际问题抽象出来的微分方程的通解不能用初等函数的积分来表示”[2] p60,因此现代意义上的定量是不能实现。实际上,客观世界中大量的问题的微分方程模型就是这样的。19世纪末H. 庞加莱和A. M. 李亚谱诺夫开始发展较为系统的“常微分方程的定性方法”[2]p60。可是对于复杂的非线性问题,这种属于传统数学的“定性方法”仅能得到很少的一些性质[3]p70,不足以实用化。于是,在20世纪70年代,在AI中蓬勃发展起了AI中的“定性方法”,其目的在于解决实际中的各种复杂问题。这些问题的基本特征是:人类“可解”,但现有数学“不可解”。从定量到定性方法的一个大致关系如下图1所示。

图1 从定量到定性:对于常识和复杂问题的表达,定量方法

能力太弱,能力以箭头方向加强

- 1 -

现存定性推理的目的是通过对系统的结构、行为和功能的描述,寻找它们之间的关系和因果性,并且力图弄清人类的常识推理。现存定性推理与传统定量方法的主要区别有:度量尺度不同:定性推理是量空间的离散度量;传统方法是实空间的连续度量。

描述问题的模型不同:前者使用定性约束定性进程等定性模型;后者使用微分方程代数方程等精确定量模型。

仿真过程和结果的差异:前者使用局部传播得到系统的定性行为描述、预测和解释;后者是方程求解力图得到精确的数量解。

推理能力不同:前者使用局部传播得到系统的定性行为描述、预测和解释,给出因果性关系;后者不具备明显的因果能力,因果性隐含在解的数值之中。[4]

当今国际AI界对定性推理是很重视的。《Artificial Intelligence》在1984、1991年分别出过2个专辑。1993年又有大量篇幅用在定性推理的展望上,如文献[18, 23, 24]以及其它一些我们没有列出的该辑的文献。

2. 现存的AI中的定性推理的主要代表性方法的代数结构

2.1 现存的代表性定性推理理论

公认的定性推理的三大基本方法是:Kuipers的定性模拟QSIM[5],Forbus的定性进程方法[6],de Kleer的透视法(定性方程)法[7]。另外一些有特色的工作有Williams的定性定量结合研究[8],H. A. Simon关于定性推理数学本质的研究[9]。一些其它的方法,除了是对上述几类工作的发展外,还有Simon的定性因果法,Yip的定性动力学分析方法,Weld的复合透视法,Ishida关于相平面中的线性系统的定性行为的研究,Wong对于优先关系和单调关系的研究,Davis、Reiter、de Kleer等人的定性故障诊断的研究[10 - 17],Nilson对定性运动学的研究,等等[4],不一而论。

2.2 现存的AI中的定性推理的主要代表性方法的代数结构

我们评论的方法是,估计各种理论的代数结构的水平、理论的复杂性水平及求解的效率三个方面。结论是:(1) 从代数结构上看,它们或大约在环的水平[5, 6, 18],或大约接近于域[8]。

(2) 从复杂性看,有的以一阶逻辑为演算核心[6, 19],有的大约以实数域作为核心[8]。(3) 从求解效率看,最坏情况大都倾向于到指数界,(因为有些理论的推理结果的数目就是类似指数方式的[5, 20])。平均情况时好时坏,常在多项式界。

2.2.1 定性模拟QSIM

Kuipers的[5]是原始文献。这个方法是近年来最受重视的方法。许多工作都是对[5]的扩充和完善而来的[21 - 27]。12年的历史证明,单纯定性推理会引起较大的不确定性或不真实解[5, 12, 27],加入定量运算[22]或定性化的定量运算[21, 27]可以弥补其不足。

[5]中QSIM的数学结构为

(1)初始元素:由实函数抽象来的定性函数,通常按实函数的单调性区间逐段描述。(2)演算关系:由通常意义下的+、−、×、/,并结合一定的逻辑演算。

(3)推理规则:类似(高于)一阶逻辑,大体相当于(高于)环。

- 2 -

就其本义,是要解决分段单调曲线间的代数演算。其代数结构大体在(高于)环的水平。演算复杂性大约类似一阶逻辑。计算时间最坏情况倾向于到指数界,因为推理结果的数目最多为指数形式的。

其改进的代表工作,[20]引入了高阶导数;[21]加强了求解结果的精确性(加入曲线的二次导数即曲率的信息);[22]中加入定量方法,形成混合结构,使其除了保持原有的能力外,还能进行量化推理及稳定性分析等。[27]提出半定量微分方程法,它使用“定性的、单调函数限制”下的“数值区间、函数行为描述”,来进行推理。这些工作都增加了计算复杂性,基本数学结构没有重大变化:都达不到域具有的良好性质。

2.2.2定性过程QP

Forbus的原始论文为[6]。由于对复杂情况的处理不很成功,后继工作不多[28]。

QP的数学结构为

(1)初始元素:逻辑变量(类似二值逻辑)、实数。

(2)演算关系:一阶谓词逻辑,并结合一些很弱的已逻辑化的数量演算关系。

(3)推理规则:类似一阶逻辑,大体相当于环。

就其本义,是要机械化(独立机构假设)人的定性推理能力,但由于其过分接近于一阶逻辑的一种扩充,导致表示能力过弱(参见Gödel不完全性定理[29]及Chaitin的离散公理系统的信息量研究[30, 31])。其代数结构大体在环的水平。计算时间最坏情况倾向于到指数界,因为推理过程的太逻辑化。由于过分排斥定量信息,对于复杂系统尚未看到明显的应用前景,因而后继工作不多[28]。

2.2.3透视法(定性方程法)

J. de Kleer在[7]中建立了以汇流(confluences)为核心思想的,主要用于微分方程的定性化及其求解的方法。其基本方法是把单调区间上的实数变量定性化,即分成几个定性值加以表达,并将原方程定性(变化方向)化形成“定性方程”。后继工作不多[32]。

透视法的数学结构为

(1)初始元素:定性变量,可取有限个定性值。类似于多值逻辑中的变量。

(2)演算关系:定性加法、乘法等。实质上是变量的变化方向的判断,显然有时得不到有意义的判断。如对于定性加法,两个定性变量的取值一个为正,另一个为负时。

(3)推理规则:类似于整数环。

就其本义,是把原实数轴分成几个区间(类似多值逻辑化),然后进行整个系统中的变量的变化推断(类似多值逻辑演算)。其代数结构大体在环的水平。计算时间最坏情况倾向于到指数界,因为推理过程及其结果的数目的组合状态较多。相比定性过程QP(二值逻辑)而言,表达能力要强得多。内在原因见Chaitin的离散公理系统的信息量研究[30, 31]。

2.2.4定性定量推理的“结合”(合并)

Williams的获奖论文[8]比较成功地进行了定性定量推理的“合并”。它把定量(实数域)和定性(接近一个域)合并在一起,具有较高的理论价值,十分有助于看透定性推理的

- 3 -

相关文档
最新文档