知识工程

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对“知识工程”概念的一些理解

对于知识的研究与探索一直是人类追求的目标,几千年来的情况都是这样的:哲学家研究有关知识的一般特性与规律,而自然科学家孜孜不倦地猎取具体的知识。20世纪中叶以后,这种研究格局发生了变化。由于知识在人类文明中所起的作用越来越大,不仅是哲学家、逻辑学家和心理学家,而且计算机科学家也在认真地研究知识的一般特性与规律。这是因为人类已经进入了信息化社会,而且正在向知识化社会前进。人类对知识的掌握很大程度上体现为这些汪洋大海般的知识是能够通过计算机和计算机网络操作和使用的。计算机科学家的任务是要研究处理各种复杂知识的理论与方法。

知识工程学是一门新兴的学科,至今只有约十年的历史。知识工程学是从知识的本源上来探讨知识的产生和使用,进而建造有效的知识系统。它的目的在于使人们有效地掌握、存取、传播和应用知识,提高认识自然和改造自然的能力。知识工程学也有人称之为应用人工智能。

一、知识工程学的发展史

1977年第五届国际人工智能联合会议上,美国斯坦福大学(Stanford University)计算机系教授费哥巴姆作了关于“人工智能的技艺”(The Art of Artificial Intelligence)的讲演,提出“知识工程”这一名称,由此出现了知识工程学,并在近年来获得迅速的发展。知识工程学的发展从时间上划分大体上经历3个时期:

1. 大约从1965至1974年MYCIN时期。

人工智能(AI)的研究表明,专家之所以成为专家,主要在于他们拥有大量的专门知识,特别是长时期地从实践中总结和积累的经验技能知识。因此1965年费哥巴姆教授与其它科学家合作,研制出DENDRAL专家系统。这是一种推断分子结构的计算机程序,该系统贮存有非常丰富的化学知识,它所解决问题的能力达到专家水平,甚至在某些方面超过同行化专家的能力,其中包括它的设计者。DENDRAL系统标志着“专家系统”的诞生。

2. 从1975至1980年为实验性系统时期。

70年代中期MYCIN专家系统研制成功,这是一种用医学诊断与治疗感染性疾病计算机程序的“专家系统”。MYCIN专家系统是规范性计算机专家系统的代表,许多其它专家系统都是在MYCIN专家系统的基础上研制而成的。MYCIN 系统不但具有较高的性能,而且具有解释功能和知识获取功能,可以用英语与用户对话,回答用户担出的问题,还可以在专家指导下学习医疗知识,该系统还使用了知识库的概念和不精确推理技术。MYCIN系统对计算机专家系统的理论和实践,都有较大的贡献。

3.1980年以来为知识工程的“产品”在产业部门开始应用的时期。

知识工程的研究,目前在美国开展得较为活跃和深入,并且主要集中在斯坦福大学。知识工程学的研究涉及有关知识的概念。所谓知识是指人类在改造现实世界的实践中所获得的认识和经验的总和。知识有各种类型,知识工程中所讲议化的主要是关于实践活动中积累起来的带有经验启发性的知识

二、知识工程的基本概念

1. 数据。

定义为客观事物的属性、数量、位置及其相互关系等的抽象表示。而且要特别强调这些属性、数量、位置及其相互关系等都可能是模糊的。如“20岁左右”、“大约20”、“很年轻”、“不太高”、“点A与点B靠得很近”等等词语中虽包含着数量,但这些数量是模糊的。此外,因为任何一张图(精确的或模糊的)都在某种意义上可认为是表示一些对象之间的某种关系,所以在知识处理中也可以把它认为是一种数据。由此可见在知识处理中数据的范围是很广的。但是,不管什么样的数据,它只表示一种数量及关系概念,具体涵义是没有的。

2. 信息。

定义为“数据所表示的涵义(或称数据的语义)”。因此也可以说信息是对数据的解释,是加载在数据之上的涵义。所以反过来可称“数据是信息的载体”。如“5”在一种具体场合可以解释为“5个苹果”,而在另一种特定场合又可以解释成“5种思想”、“5个X”等。对模糊的数据也一样,例如“20左右”这个模糊数,既可能代表年龄“20岁左右”,也可代表日期“20日前后”等。可见信息是带具体涵义的数据。

3. 知识。

以各种方式把一个或多个信息关联在一起的信息结构。如果把“不与任何其他信息关联”也认为是一种特殊的关联方式(不关联),则单个的信息也可以认为是知识的特例,我们称之为“原子事实”。例如“天很阴且闪电频繁”,“天要下雨”等都是一些孤立的信息或“原子事实”。然而,如果把这两个信息用“如果,则”这种因果关系联系起来就成了一条知识:如果“天很阴且闪电频繁”则“天要下雨”(多半如此)。以上陈述中的“频繁”、“多半如此”等都表示一些模糊概念。

4. 智力。

指运用知识解决问题的能力。知识可以存储在书本里,或计算机的磁盘和磁带中等,它是一种静止的死东西。它本身并不会再生知识。然而智力却是一种动态概念。“智力”与“知识”有着密切的关系,但“知识”与“运用知识的能力”是两个不同的概念。

5. 智能。

指知识的集合与智力的综合(或总和),是静态的知识和动态的智力综合所体现的一种能力。

6. 知识库和知识处理器。

知识库是指经过分类组织存放在计算机中的“知识的一个集合”。知识处理器(俗称推理机)是指智力在计算机上的一种具体实现机制。一般专家系统中都具有一个存放知识的知识库和一个运用知识的推理机,因此按这种定义就可认为专家系统是一个具有某种智能的系统。

三、知识工程学的研究内容

其研究内容主要包括知识的获取、知识的表示以及知识的运用和处理等三大方面。

1、知识的获取。

在建立一个具体的专家系统时,人们往往要花很多人力和财力在知识获取上,它被公认为是知识处理的一个“瓶颈”。知识获取要研究的主要问题包括:

对专家或书本知识的理解、认识、选择、抽取、汇集、分类和组织的方法;从已有的知识和实例中产生新知识,包括从外界学习新知识的机理和方法;检查或保持已获取知识集合的一致性(或无矛盾性)和完全性约束的方法;尽量保证已获取的知识集合无冗余的方法。知识获取分主动式或被动式两大类。主动式知识获取是知识处理系统根据领域专家给出的数据与资料利用诸如归纳程序之类软件工具直接自动获取或产生知识,并装入知识库中。所以也称知识的直接获取。而被动式知识获取往往是间接通过一个中介人(知识工程师或用户)并采用知识编辑器之类的工具,把知识传授给知识处理系统,所以亦称知识的间接获取。按知识处理系统获取知识的工作方式,可以分成交互式和自主式(或非交互式)两种。交互式知识获取在获取过程中要不断与人进行交互,或提供解释,或要求输入信息,或提问求答,或请求验证等等。交互式的知识获取,对用户或知识工程师有较大的透明度和控制能力,比较适合于从专家大脑中获取知识。自主式知识获取则在获取过程中完全由知识处理系统自主完成,例如输入的是一段讲话,一本书或资料,输出的便是从中抽取出来的知识。这里即便不考虑诸如语声识别,文字识别,自然语言理解和认知科学等方面的许多难题,解决起来仍是十分困难的。按知识获取的策略或机理,可分为:死记硬背式(或称机械照搬式)获取;条件反射式知识获取;教学式(或传授式)知识获取;演绎式知识获取;归纳式知识获取;解释式知识获取;猜想证实式知识获取;反馈修正式知识获取;类比和联想式知识获取;外延式知识获取等。

2、知识的表示。

要将知识告诉计算机或在其间进行传递,必须将知识以某种形式逻辑地表示出来,并最终编码到计算机中去,这就是所谓的知识的表示问题。不同的知识需要用不同的形式和方法来表示。它既应能表示事物间结构关系的静态知识,又应能表示如何对事物进行各种处理的动态知识;它既要能表示各种各样的客观存在着事实,又要能表示各种客观规律和处理规则;它既要能表示各种精确的、确定的和完全的知识,还应能表示更加复杂的、模糊的、不确定的和不完全的知识。因此一个问题能否有合适的知识表示方法往往成为知识处理(解题)成败的关键。而且知识表示的好坏对知识处理的效率和应用范围影响很大,对知识获取和学习机制的研究也有直接的影响。知识表示的方法很多,例如,谓词逻辑表示,关系表示(或称特性表表示),框架表示,产生式表示,规则表示,语义网表示,与或图表示,过程表示,Petri网表示,H网表示,面向对象表示,以及包含以上多种方法的混合或集成表示等。这些表示方法各适用于表示各种不同的知识,从而被用于各种应用领域。对于“知识面”很窄的专家系统一类的应用,往往可以根据领域知识的特点,从中选择一种或若干种表示方法就可以解决问题。但是为了开发具有较宽领域知识的系统,例如多专家系统的聚合系统(或称协同式专家系统)和分布式多功能知识处理系统等,仅用互不相干的知识表示方法便难以适应要求。

3、知识的运用和处理。

为了让已有的知识产生各种效益(包括社会、经济、政治、军事和科学等方面的效益),使它对外部世界产生影响和作用,必须研究如何运用知识的问题。运用知识来设计机器、建造水坝、推断未来、探索未知、管理社会,乃至运用知识来作曲、绘画或写文章等都是用知识来解决问题和改造世界的活动。显然,知识处理学不能研究这些具体运用知识的过程或方法,而是要研究在上述各种具体的知识运用中都可能用到的一些方法(或模式)。它们主要包括推理、搜索、知

相关文档
最新文档