领域知识的获取方法

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据挖掘与知识发现的基本原理与方法,并进一步论述知识
获取在智能信息系统中的应用。
6.1.1 知识获取定义
所谓知识获取,就是模拟人类学习知识的基本过程,从
信息源中抽取出所需知识,并将其转换成可被计算机程序利
用的表示形式。具体说,知识获取就是获得事实、规则及模 式的集合,并把它们转换为符合计算机知识表示的形式。信
6.1.3 知识获取方法
知识系统可用多种方法从多种信息源获取知识。如通过 与专家会谈、观察专家的问题求解过程、利用智能编辑系统、 应用机器学习中的归纳程序、使用文本理解系统等方式,获 取人类专家的知识或将其转换成所需要的形式,也可以从经 验数据、实例、出版物、数据库以及网络信息源中获取各种 知识。一般来说,按照知识获取的自动化程度,可以将知识 获取划分为非自动知识获取和自动知识获取两类基本方式。
知识获取的基本任务: (通过分析人类学习知识的基本过程)
(1)知识抽取。所谓知识抽取是指把蕴含于信息源中的 知识经过识别、理解、筛选、归纳等过程抽取出来,并存储 于知识库中。 (2)知识建模。知识建模即构建知识模型的过程。构建
知识模型的过程可以分为若干个阶段,其中主要的三个阶段
是:知识识别、知识规范说明和知识精化。 (3)知识转换。所谓知识转换是指把知识由一种表示形 式变换为另一种表示形式。如将从专家及文献资料那里抽取 的知识转换为产生式规则、框架等知识表示模式。
实现自动知识获取的主要方法:
(1)自然语言理解 自然语言理解方式主要借助于自然语言处理技术,针对 文本类型的信息源,通过语法、语义分析,推导文本内容属 性,抽取与领域相关的语义实体及其关系,实现知识获取。 从本质上说,虽然自然语言理解是最理想的自动知识获取方
法,但由于自然语言处理中多项难点技术(如抽词技术、切
据中识别事物对象的特征。 (3)机器学习 机器学习是系统利用各种学习方法来获取知识,是一种 高级的全自动化的知识获取方法。机器学习还具有从运行实 践中学习的能力,能纠正可能存在的错误,产生新的知识, 从而不断进行知识库的积累、修改和扩充。
(二)自动知识获取方式
手工获取知识建立知识库是一件相当困难且费时费力的 工作,已构成知识工程的瓶颈。为了解决这个难题,人们尝 试运用各种理论和方法实现知识的自动化获取。 所谓自动知识获取是指系统采用相关的知识获取方法, 直接从信息源“学习”相关的基础知识,以及从系统自身的 运行实践中总结、归纳出新知识,不断自我完善,建立起性 能优良的知识库。其工作方式如图所示。
分词技术、短语识别技术等)尚未得到有效解决,因此,给 基于自然语言理解的知识自动获取利用带来一定困难。
实现自动知识获取的主要方法:
(2)模式识别 基于模式识别的知识获取方法主要针对多媒体信息源 (如图片、语音波形、符号等),采用统计方法等对事物或
现象进行描述、辨认、分类和解释,从经数字化处理后的数
第6章 知识获取
本章主要内容
(1)知识获取的定义和基本原理; (2)主要的知识获取方法,包括:机器学习、数据挖掘与 知识发现; (3)知识获取在智能信息系统中的应用,包括领域知识的 获取、专家知识的获取、用户知识的获取等。
6.1 知识获取概述
知识获取是人工智能和知识工程的核心技术。知识获取
和知识表示是建立、完善和扩展知识库的基础,是利用知识 进行推理求解问题的前提。智能信息系统中知识的质量和数 量直接影响其系统性能,知识获取成为智能信息系统开发的 关键。本章在概述知识获取的基础上,重点讨论机器学习、
器进行编辑输入。
(2)知识编辑器 知识编辑器是一种用于知识编辑和输入的软件,一般采 用交互工作方式,其主要功能是: ①将获取的知识转换成计算机可表示的内部形式,并输 入知识库。 ②检测知识的错误,包括内容错误和语法错误,例如, 知识的正确性、完整性和一致性等。并报告错误性质、原因பைடு நூலகம்与部位,以便进行修正。
知识获取的基本任务(续)
(4)知识存储。用适当方式表示知识,并经编辑、编译 后存入知识库。 (5)知识检测。为保证知识库中知识的一致性、完整性, 需要做好对知识的检测。 (6)知识库的重组。当系统经过一段时间运行后,由于
对知识库进行了多次的增、删、改,知识库的结构必然会发
生一些变化,需要对知识库中的知识重新进行组织。
息源主要是人类专家、书本、数据库和网络信息源等。
与信息收集的区别: 信息收集实现信息源浅层内容的获取; 知识获取实现信息源深层知识的获取。
6.1.2 知识获取的基本任务
这里通过类比人类学习知识的过程考察知识获取的基本任务。 人类学习知识的过程如下图所示。首先,了解基本的领域知识和 分析解决问题的方法,即对现有知识的固化记忆;然后,不断在 大量的实践活动中进行学习,即对实践数据进行分析、综合,并 从实践中总结经验,形成新知识;随后,将新知识与其已有的知 识进行融合,逐步精炼、完善和积累知识。
实例:专家系统MYCIN的知识获取
非自动方式是知识库系统建造中用得较普遍的一种知识获取方 式。早期专家系统都是运用这种方式建造的,如DENDRAL、 MYCIN等。其中,专家系统MYCIN是最具代表性的一个,它用产 生式规则作为表示知识的模式,用LISP语言表示规则。其知识获 取步骤如下: (1)知识工程师获取专家的知识,用英语描述后输入系统; (2)系统将其翻译为LISP语言的表示形式,然后再用英语的 描述形式显示出来,供知识工程师或领域专家检查; (3)如有错误,则由知识工程师与领域专家协商修改,再重 复(1)和(2)的工作,直到被确认正确为止; (4)对于新规则,则需检查它与知识库中知识的一致性,有 错则修改; (5)将正确的规则送入知识库。
(一)非自动知识获取方式
在非自动的知识获取方式中,知识获取分两步进行,首先由知 识工程师从相应信息源获取知识;然后再由知识工程师通过某种
知识编辑软件将知识输入知识库。其工作方式如下图所示。
(1)知识工程师 知识工程师既懂得如何与领域专家打交道,能从领域专家及 有关文献中获得知识系统所需要的知识,又熟悉知识处理技术。 其主要任务是:获取知识系统所需要的原始知识;对其进行分析、 归纳、整理、升华,用自然语言描述之;然后由领域专家审查; 把最后确定的知识内容用知识表示语言表示出来,通过知识编辑
相关文档
最新文档