第五章知识获取技术

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章知识获取技术
学习是人类智能产生的核心问题。

人的聪明就在于学习,人不是单纯的死记硬背学习,被动的获取知识,更多的是不断总结经验教训、纠正错误,完善自己,不断适应环境变化的需要。

人的学习是动态的获取知识并在获取知识的过程中,有所发现、有所发明、有所创造,人的学习是与认识论密切相联系的。

人工智能不仅要研究让机器具有解题的本领,还应重点研究使机器具有自学习的能力,使机器也能不断的积累经验、总结教训、纠正错误、完善性能、适应环境变化的需要,还能有所发现、有所发明。

这也成为人工智能和智能控制的主要内容。

特别是七十年代以来,由于以人工智能为基础的知识工程的发展,形成了人工智能的三大中心问题:知识表示(Represent),知识应用(Utieigation)与知识获取(Acquisition)。

知识获取解决了机器知识的来源与补充。

凡是先进而完备的人工智能系统必须具备有学习能力,原则机器只能按照人的“逻辑”或“传授”的原始知识死板地行动。

而不能适应环境变化与事物发展的需要。

第一节知识获取的概念和途径
一、知识获取的基本概念
1、知识获取的定义
“知识获取”(Knowledge Acquisition)是人工智能和知识工程的基本技术之一,它解决在人工智能和知识工程系统中、机器(计算机或智能机)如何获取知识的问题。

这可以有两种定义:
(1)狭义获取知识:指人们通过系统设计、程序编制和人机交互使机器获得知识,即通过人工移植的方法,将所要的知识存储到机器中,称为“人工移植获取知识”。

例如:专家系统原始基本知识的获取是知识工程师利用知识表达技术建立知识库。

(2)广义知识获取:除了人为的获取知识外,机器还可以自动或半自动地获取知识。

例如:借助模式识别利用“机器视觉”或“机器感觉”,机器直接感知从外界来的信息,通过加工,对知识库进行增、删、修改、扩充、更新和完善,达到知识获取的目的。

又如:系统在调试或运行的过程中,不断对外界所来的信息进行识别,通过机器学习进行知识的积累。

2、知识获取分类:
人工智能是用于模仿、延伸和扩展人的智能,所以,机器所需获取的知识类似与人类所需的知识,可以按各种不同的方式进行分类:
(1)常规分类方式:
这种分类方式常以知识的属性和范畴来划分方向。

●感性和理性知识
●经验与理论知识
●常识与专门知识
●定性与定量知识
●专业与基础知识
(2)专用分类方式:
在人工智能和知识工程中,通常为了知识的表达、存储和推理的方便,以及系统设计的需要,也对知识进行分类。

如:
●按知识的用途分类:叙述性、过程性和控制性知识
●按知识层次分类:浅层(经验或感性知识)和深层知识(理论或理性知
识)
●按知识等级分类:元级知识(知识的知识或本领知识),非元级知识(非
本原知识由元级知识引申过来的知识)内舍和外延。

●按知识的形式分类:文学知识、图象知识、书面知识、口头知识(口语)。

二、知识获取的主要途径
在人工智能和知识工程系统中,一般来说机器获取知识的途径不外有三条:
1、人工移植:
即依靠人工智能系统的设计师、知识工程师、程序编制人员、专家或用户通过系统设计、程序编制及人机交互辅助工具,把人的知识内容直接用程序“编辑”后存入到计算机的知识库中,使机器获取知识。

这就要求系统不许具备特殊的知识编辑系统。

根据移植的环境不同,又分为:
(1)静态移植:在系统设计过程中,使系统所要的先验知识直接通过知识表达、程序编制、存储到知识库中去。

(2)动态移植:在系统运行过程中通过人机交互系统或辅助知识获取工具,对机器知识库进行人工的增删、修改、扩充和更新使系统获取所需的动态知识。

2、机器学习:
所谓“机器学习”,是人工智能系统在运行过程中,机器通过学习来获取知识进行知识积累,对知识库进行更改,即用自然语言把知识“传授”给计算机。

一般来讲,机器学习的方法有两种:
(1)示教式学习:由人作为示教者和监督者,给出评价标准或判断标准,并对学习过程进行指导的学习。

(2)自学式学习:在机器学习过程中,不要人作为为示教者或监督者,而由系统本身监督器实现监督功能。

并提供评价标准和判断标准。

通过反馈进行工作效果检验。

3、机器感知:
所谓“机器感知”,是人工智能系统在调试或运行过程中,通过机器视觉、机器听觉、机器触觉等外部途径,直接感知外界的信息,向自然界学习,以获取感性或理性知识。

这是一种高层次理想的学习过程。

在机器视觉与听觉中,都要用模式识别、自然语言理解等方法和技术。

第二节机器学习的概念和类型
一、学习和学习系统的概念
1、学习:
什么是“学习”?“学习”是一个通俗的、广泛应用的概念,在不同学科的不同发展阶段往往有不同的含义。

神经学家巴浦洛夫很早就把学习看成是“条件反射的形成过程”。

控制论奠基人维纳把对学习定义相当广泛,甚至包括生物的个体变异与发育过程。

他认为学习是“系统自我完善的过程”。

自从人工智能发展成为一门学科以后,多数人工智能学者倾向于把学习看成是一种心理过程,看成是行为的变化。

心理学家对学习的定义是:“学习是系统积累经验以改变其性能的过程”。

随着人工智能工作的深入发展,到七十年代“学习”逐渐被理解为“知识结构的改进,因为机器视觉、专家系统以及语言理解系统的知识往往被表现成各种句法结构或语义网络的组织形式。

这种结构或网络在学习过程中不断地被补充完善。


七十年代后期,由于知识工程、专家咨询系统的发展,把“学习”看成是“知识的获得、积累与改进”。

因为专家系统的专门知识大量地被表示为可读规则的集合,这些知识需要不断地获取、组织与扩充。

八十年代初出现了把学习看成是技能的获取与改进,着多半是由于智能机器人取得的某些成就所促成的。

技能也是某种知识,这种知识主要是通过实践形成的。

同时也出现了把学习看成是“理论形成过程”(包括假说形成与定律形成)的观点,这时也出现了一些成为科研人员助手的发现系统,于是学习又被理解为“事物规律的发现过程”。

2、学习体统:
在七十年代初,人们对学习系统的定义各不相同。

后来,为了统一起见,提出了一个“标准”的定义:“如果任何系统,只要它能够从某个过程或环境的未来特征中学到有关信息,并且能以学到的信息作为经验用于未来的估计、分类、决案或控制以便改进系统的性能,那么这就是学习系统。

”为了使学习系统与自适应自组织系统有所区别,从控制论的角度提出了一个比较“封闭”的定义:“一个系统,若在它的环境发生变化后的时间T内,相对于性能函数P的响应是令人满足的,就可以认为是学习系统”。

在人工智能发展的前期,学习系统基本上是按上述概念进行研究和设计的,他主要用于模式分类与自适应控制等过程实践,所以一般称为自适应学习系统(Adaptive Learning System)。

我国有些人工智能学者认为:从人工智能的角度来看,上述定义只是重复了逐步改善性能这一点。

实际上现代人工智能系统是知识库与环境这两个部分的相互作用。

因此,他主张“二元论”的学习系统的定义,即“学习系统”是在与环境的相互作用中,不断使知识(库)完善的过程。

换言之,只要系统能够从周围的信息中获得未知的知识就可以算是学习系统而学到的有用知识必然会导致性能的逐步改进,这是不言而喻的。

这种学习系统可以称之为智能学习系统(Intelligence Learning System),以区别于以往的自适应学习系统。

凡是有关概念形成、归纳、推理、文法推断、假说猜想、科学发现等人工智能系统的内容,都可以纳入学习系统的范畴。

实际上,这几年来的有关学习系统的研究工作已与上述内容结合越来越紧密,有的已成为学习系统的重要组成部分。

因此可见,完整的人工智能系统应该是具有学习能力的系统,这一点已确认无疑的了。

二、机器学习系统的类型:
1、按学习能力分类:
这是自适应学习系统的传统分类方法。

学习能力主要标志在于对外界监督指导或教师的依赖程度,它把学习系统分为两类:
(1)有监督的学习系统——示教式学习系统
需要人作为教师,进行示教、监督和训练,在学习结束后才能投入工作。

也称为“离线”学习系统。

(2)无监督的学习系统——自学式学习系统
不需要人监督或示教,机器本身在运行过程中自动获取知识,用评价标准代替人为监督环节,或称“在线”学习系统。

由上可见,有无监督的分类法不是很严格。

七十年代仍有人用此分类法,但多指自适应学习系统。

随着智能学习系统的不断发展,有必要采用如下的分类法。

2 、按知识水平与学习方法分类:
知识水平指特殊事物到一般规律的知识层次。

学习方法指逻辑的思维推理方法。

它把学习方法分为四类,且这些方法成为智能学习系统的主要分类基础。

(1)机械学习系统:(Rete Learning System)这种系统在训练时只用简单的奖惩原则把特殊的知识教给计算机。

这是从特殊到特殊的学习过程。

例如老鼠走迷宫和博弈对局。

机械学习与单纯的记忆不同,它是通过反复学习评价后把知识存入知识库的。

(2)指导学习系统:(Advice-taking)训练站只给机器以一般而笼统的指示或建议,机器必须把指示或建议具体化为可以工作的细节知识或特殊规律。

这是从一般到特殊的学习过程。

在学习过程中要反复评价这些规则,以填补细节。

指导学习系统要有领悟能力,不能只是“照葫芦画瓢”。

(3)示例学习系统:(Learning from examples)它是学习系统中用的最多的类型。

它从许多事例或作为训练集的样本中得出事物的特征或规律性知识。

这种学习称之为概括。

它是从特殊到一般的学习过程。

它有指导推广和“举一反三”的功能。

示例学习的最高形式是“发现系统”,它通过学习所获得的知识可成为高度概括化的“定律”。

(4)类比或模仿:(Learning by Analogy)它用类比推理的学习方法,先由特殊事例概括出一般规律,即类比关系或转换规则,然后再由一般关系换成特殊事例或行动。

在上述分类学习系统中,事例学习系统的学习能力较强,它能概括以致发现新知识,知识库占用存储少,但应用时推理时间长,而机械学习系统则相反。

类比学习系统介于其间。

指导学习系统需要有优良的“导师”。

3、按学习事物的性质分类
(1)概念学习系统:概念学习又分为单概念与多概念学习两种。

所谓单概念指可以明确划分正反事例的概念,如判断事物的真假或是否等,而多概念多因素集合的概念,如疾病诊断。

(2)过程学习系统:学习掌握过程性知识,例如:解题步骤、机器行动计划、语言的句法分析与结构模式的文法推断等。

过程学习往往需要把总目标化为分目标。

4、按知识表示法分类
学习系统要求知识的表达方式便于修改扩充,以便使知识库不断完善。

根据知识表达方式可以把学习系统分为两大类:
(1)数值学习系统:用数值表达知识,概率值、权系数等。

数值是“隐式”知识的主要表达方式,主要用于模式识别、自动控制以及博弈等。

(2)符号学习系统:非数值学习系统。

这种系统要求知识表达方式都为“显式”。

常用的表达方式有特征向量,一阶逻辑和产生式等。

特征向量用于不考虑内部结构的事物,据此符号学习系统又分为:
A、结构学习系统:它要求知识表达方式为描述性结构,如符号串、判断树、语义网络。

B、产生式学习系统:它适合于过程规则的表达,也可以用于概念性知识,由于产生式学习系统便于规则的“产生”或修改,所以它是目前主要的学习系统。

第三节机器学习系统的原理与结构
一、机器学习系统的原理:
机器学习系统是根据人工智能的学习原理与方法,应用知识表达和知识存储、知识推理等技术,设计和构成的具有知识获取功能,并能逐步改善其性能的系统,称之为“人工智能学习系统”。

机器学习系统可以采取示教式或自学式,进行离线或在线学习。

在学习过程中可采用强记、指导、示例、类比等各种方法,进行奖惩式、演绎式、归纳式、联想式学习,并根据所采用的学习方法,设计系统的学习环节。

为了能够获取知识,改善性能,在机器学习系统中应用拥有知识库并且要求知识库具有增删、修改、扩充或更新的功能。

在示例式学习系统中,还需要有相应的人机接口,以便机器向示教处学习,获取知识信息。

示教式通常为离线学习,即不联机(Off-line)。

自学式通常为在线学习,即学习系统与其工作对象或环境是直接联机(On-line)。

二、学习系统的一般结构:
学习系统的具体结构往往因具体任务的不同而有所不同。

但是可以根据学习的一般特征提出一个统一的模式作为一般结构。

如图所示:
图中有两个主要部分:环境(EV)与知识库(K.B.)这两部分分别代表外界信息来源与知识(信息学习成果),它们通过工作环节(W.E.)与学习环节(L.E.)相互作用。

而这两个环节分别对知识信息与外界信息进行处理。

环境、知识库、学习环节与工作环节构成了学习系统必要的组成部分,缺少其中任一部分都不能构成学
习系统。

此外,在工作环节与学习环节之间必须有反馈,这是学习系统的重要特征。

另外,还有两个重要而非必需的信息处理环节,即简单环节(SV)与选例环节(LS),这两个环节的工作通常是有人作为教师或教练员来完成的。

各个环节的功能如下:环境(Environment):它不是一般意义的环境,而是指系统的外置信息来源。

它可以指系统的工作对象,也可以包括工作对象或客观事物的外界条件。

如在博弈系统中,环境就是变化繁多的棋向和对手;在科学实验分析中,环境就是各种因素和数据。

知识库(Knowledge Base):它用来存储或记忆系统通过学习所获取的各种知识。

根据其稳定程度,知识库可分为两部分:长期记忆(LTM)与中期记忆(HTM)。

长期记忆的知识是稳定不变的,它是学习系统必备的知识背景,在学习不能改变的基本知识与范畴。

如:事物的基本定律、公理、定理等,这种知识是先验的知识,不是靠学习获得的。

中期记忆内容是相对稳定的,也就是一般定义下的知识,它包括各种具体事物的规律,如各种专业知识或规则的集合,这种知识是可以通过学习改变的。

还有一种短期记忆(STM),也就是上述的总体数据库。

它不仅用来反映环境信息的变化,也可以存储学习过程中的中途信息。

它不属于知识库的范畴,而是调用知识的状态或条件。

工作环节(Working Element):又称允许环节(Performance)或决策执行环节。

它利用知识库的知识作出决定或行为以完成各种工作。

例如:模式分类、定理证明、智能检索、机器人行动计划。

如果工作环节使环境发生了变化,就形成了在线学习。

学习环节(Leaning Element):它是学习系统的核心它的任务就是对环境信息进行搜索、控制和逻辑“思维”(如比较、抽象、概括、综合、推理等)以产生、修改与补充知识。

它是智能系统的智能发生器。

监督环节(Supervisor):它相当于学习系统的“教师”或“训练者”。

它的作用有:1、对工作环节的决策或行动效果进检验或评价,以指导学习环节的工作。

因此,它必须具有评价、检验标准,如模式分类的分类标准或格式、控制系统的目标函数等。

2、指导选例环节的工作。

选例环节(Instance Selection):选例就是从环境中选出有典型意义的事例或样本作为机器的学习对象,以提高学习效率,加快学习系统的收敛速度。

所以选例是否合适对学习系统是十分重要的。

上图所示的结构不仅适用于具有启发式学习程
序的学习系统,而且对脑模型的学习机制也有重要的意义,因为大脑的联想推理部分相当于工作环节,而记忆部分则相当于知识库。

如果学习系统能通过学习形成知识与技能、那就成为智能学习系统。

第四节常用的学习系统介绍
一、相关产生式学习系统
1、相关产生式的概念
通常的产生式是由“条件——动作”对的形式组成的,其产生式的左部(条件)和右部(动作)是无关的,即不存在共同项。

相关产生式(Relational Production)则是“前状态——后状态”对的形式,在其左部与右部之间存在相关项,即共项。

例如:在机器人的行动规划系统中,积木搬运规则UNSTACK(卸)的相关产生式如下:
前态(左部)后态(右部)
(clear x) (clear x )
(on x,y ) (ontable x)
(on table y) (clear y)
(on table y)
可见前态与后态之间存在共项(clear x),其共项性表示为:
[(clear x)](on x,y) (on table x)(clear y)
进一步记为一般式:
2、相关产生式学习方法:
在相关产生式学习系统中,采用归纳式学习方法。

从许多状态变换的事例中进行由特殊到一般的归纳,概括出行动规则的相关产生式。

相关产生式学习系统的结构相应于一般学习系统的结构对应部分:
●知识库:用相关产生式表达知识的规则集,包括特殊和一般的规则。

●学习环节:进行概括和归纳的“一般化”环节,通过示例训练由特殊到一
般的推理。

●选例环节:选取状态变换示例组成的示例集,作为学习系统的训练集。

●工作环节:对于积木边界而言,工作环节为机器人。

●监督环节:示教人或监督员
●环境:积木边界。

相关产生式学习系统的学习过程,即进行概括和归纳的“一般化”过程。

其“一般归纳化”定理与定义参书P91~92。

二、条件空间筛选学习系统
1、示例空间学习:
对于复杂事物的学习过程,上述相关产生式系统存在一些困难。

因为由搜索方法产生产生式是逐步获得的。

有时可能出现前后矛盾现象,后面生成的产生式不符合前面的事例,因而往往需要返回追踪,重新搜索,效率较底。

所谓“条件空间”(Version Space),或称“文本空间”,就是列出所有可能的产生式的集合空间,在学习过程中,用训练集的正、反事例,去匹配条例空间的产生式集合,消除不符合时间事例的产生式,留下所需要的与实际事例不矛盾的产生式。

称为“条例空间筛选法”。

这样可以避免前后矛盾,不必返回追踪。

条例空间筛选法的学习过程,是从两端逐步匹配,删除其中较普遍的特殊条件的筛选过程,这是通过正反例的事例训练。

不能压缩条例空间的双向推理过程。

2、结构归纳学习系统:
结构归纳学习是通过对输入的结构描述事例的学习,寻求描述一类事物概念的最精确的概括,这个过程即为“归纳”。

结构归纳学习需要考虑以下几个问题:
(1)结构的描述:可以采用不同的关于事物的结构化描述方法。

如产生式规则、层次结构、语义网络等。

描述归纳学习要处理的事件以及归纳的结论。

(2)描述类型:“归纳”可看成是对于描述空间的搜索,因而必须给该搜索目标,提供关于目标的结构描述的判据。

判别目标的类型有:“特性描述”,“区分描述”,“分类描述”。

(3)概括规则:归纳学习的目的是寻求表达一类事物的最精确的概括,即从一些特殊的事例中抽象出一类事物的共性。

概括规则是指实现这种“由个别到一般”的转换规则。

(4)构造性规则:构造性规则过程将改变关于问题的结构描述空间。

可以用所
谓“构造性归纳规则”来说明构造性归纳方法,它时间上是一种归纳推理的程序系统。

1、控制策略控制策略分为“自底向上”(数据驱动)“自顶向下”(目标驱动)
和“混合方式”三种
结构归纳学习方法是反复运用概括规则和县定规则、寻求关于及物概念的“MSC-概括”(最精确的概括)的过程。

该算法一般包括一个“概括过程”和一个“限制过程”。

概括过程:指运用概括规则、从输入事物的个体实例中抽象出一般性的过程。

限定过程:当一个相关项可能使关于以了事物的结构描述范围扩大时,就必须使用限定规则加以限定。

四、类比识别——简单的学习方式:
1、类比原理
婴儿生下后逐渐地认识自己的父母、日常用品、汽车、飞机等等。

这种学习方式称为类比识别(感性认识到一般认识)。

它的学习机制如何,如何用计算机实现这一功能。

为下例所示:若向图形A,B,C,1,2,3,4,5中哪一个是正三角形?
这个问题涉及到下面两个子问题:什么样的图形称为正三角形;如何从上面八个图形中识别出正三角形。

有关第一个问题的知识属于第一层知识;第二个字问题的知识属于第二层知识。

如何就得正三角形的定义呢?那只有通过父母和老师的教育,通过时间、并经自己的抽象思维逐步形成。

如何识别正三角形呢?那就是用类比的方法,把上面给出的八个几何图形和自己头脑中的正三角形的模式逐个进行比较。

这个问题比较简单,对如下问题:
设有图A 变换到图B为已知:现欲从图1~图5中找出一个图X来,使得图C 变换到图X的规则与图A 变换到图B的规则相匹配。

图A 和图B的自图是圆点、
半圆和长方形,而图C和图1~图5的图是圆点和三角形,两类子图不一样。

但是,我们可以一目了然地找出图1所求的X:因为图A变到图B的规则是其子图圆点被删除了。

而图C变到图1的规则也是子图圆点被删除了。

人匹配的时候靠一双眼睛,机器不一样,目前能实用的还只能以语句描述图形,用语句表达每个图中各子图之间的关系。

表达图形是如何进行变换的。

为了说明方便,我们称图A变到图B时,图A为源图,图B为终图用表示这种变换,有三部分组成:源图的描述终图的描述源图中各子图如何变换终图的子图例如:现有二幅图形。

试看如何描述它们,其中X为源图,Y为终图。

这两幅图形的三个部分描述如下:
n在m的内部
n的比例变化1:1
旋转0度
并不是所有图形都有三个部分描述,有的只需要二个部分描述,如在图3中A→B,试在图形1,2,3中找出一幅土,使得e→w与A→B匹配
现列出三个部分的规则:
规则部分1 部分2 部分3
A→B 1在m上面 1在m左面
C→1 x在y上面 y在x上面。

相关文档
最新文档