知识获取
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学习系统的基本类型
什么是学习
学习是一种综合性的心理活动,它与记忆、 思维、知觉、感觉等多种心理活动密切联系; 西蒙 :“学习“系统积累经验,改善性能的 过程”; 明斯基 :“学习是我们头脑里有用知识的变 化”; 维纳:“学习是系统自我完善的过程”; 巴甫洛夫“学习是条件反射的形成过程”。
学习的基本概念
学习是一个知识和能力的增长过程。其内 在行为是知识获取(获得知识、积累经验 、发现规律,新知识结构的建立和改进等 );其外部表现是能力的改善(改进性能 、适应环境、实现自我完善等),使其变 得更快、更精确、更健全;学习是技巧的 获得,是理论的形成,是假设的验证,是 演绎的推理。
知识获取的理论基础是机器学习.指一个系统能不断改 进自身性能的过程,它包括: (1)系统能够解决更多的问题; (2)系统能够提供更精确的答案; (3)系统能够以更低的代价获取知识.
环境
学习环节
知识库
执行
返回
3.1 环境
环境是系统获取知识的信息来源,包括工作对象或客体所处的外 界条件。环境提供的信息水平确定了系统必须产生的假设类型。 系统中的环境包括工作对象和外界条件。比如在医疗系统中,环 境就是病人当前的症状、物化检验的报告和病历等信息;在模式 识别中,环境就是待识别的图形或景物;在控制系统中,环境就 是受控的设备或生产流程。 环境提供给系统的信息水平和质量对于学习系统有很大的影响。 信息的水平是指信息的一般性程度,也就是适用范围的广泛性。 高水平的信息往往比较抽象,适用面更广泛,而低水平的信息往 往比较具体,只适用于个别问题。如果环境提供较抽象的高水平 信息,学习环节就要补充遗漏的细节,以便执行环节能用于具体 情况。如果环境提供较具体的低水平信息,即在特殊情况执行任 务的实例,学习环境就要由此归纳出规则,以便用于完成更广的 任务。信息质量对学习难度有明显的影响。例如,若施教者向系 统提供准确的示教例子,而且提供例子的次序也有利于学习,则 容易进行归纳。若示教例子中有干扰,或示例的次序不合理,则 难以归纳。
机械学习(记忆学习)的设计要考虑三个问题:存储结构、 稳定性和记忆与计算的权衡。 1.存储结构 只有读取所用时间少于重新计算所用时间时,机械学习 (记忆学习)才有实用价值。为了快速读取存储的内容,就要 合理组织存储结构。在数据结构和数据库等领域已经详尽研究 了排序、检索和杂凑方法等有关问题。 2.环境稳定性 使用机械学习(记忆学习)时,总是认为保存的信息以后 仍然有效。如果环境变化快,保存的信息就会失效而不能再使 用。例如记忆的50年代汽车修理费用不能用来估计80年代汽车 修理费用。解决方法是随时监视环境的变化,不断更新保存的 信息。
返回
3.2
知识库
知识库用于存储和积累知识,根据记忆的稳定程度,库 中的知识可以划分为: (1)长期记忆知识 具有稳定性,如基本概念,定理,公理和规则等. (2)中期记忆知识 可通过学习改变的知识 (3)短期知识 环境变化的信息和数据,学习的中间结果等. 知识库中知识表示的形式必须具有易表示性、易推理 性、可修改性和可扩充性。
执行函数 输出模式
过程:执行元素每解决一个问题,系统就记住这个问题和 它的解,以后一旦再遇到此类问题,系统就不必重新进行 计算,而可以直接找出原来的解去使用。可以把执行元素 抽象地比作一个函数f,该函数在得到环境的输入模式( x1,x2,…,xn)后,计算并输出模式(y1,y2,…,yk) ,则机械学习系统就是要简单地把这一输入输出模式对: [(x1,x2,…,xn),(y1,y2,…,yk)]存放在知识库 中,当以后再需要计算f(x1,x2,…,xn)时,系统执行 元素就可以直接从存储器中把(y1,y2,…,yk)检索出 来,而不需要再重新进行计算。
返回
2.知识获取的概念
知识获取是确定知识范围,采集和加工编辑知识的过 程。它是构造知识库的基础。 采集知识主要从专家那里采集与被求解问题有关的知 识,专家知识包括专业知识和求解问题的方法和步骤的 知识. 加工编辑知识要使知识规格化、系统化,使知识库便 于管理,包括如下方面: (1)问题的关系符号化,选择合适的知识表达方法; (2)建立知识库的编辑系统,可修改、删除、更新和调 整知识库的内容; (3)检验知识库的完整性和无矛盾性。 返回
非自动方式是专家系统建造中用得较为普遍的一种知识获取模 式。在非自动获取模式中,知识工程师起着关键的作用。其主要任 务是: ①与领域专家进行交谈,阅读有关的文献,获取专家系统所需 要的原始知识。 ②对已获得的原始知识进行分析、归纳、整理,形成用自然语 言描述的知识条款,然后返回给领域专家检查。
③ 把确定的知识条款用知识表示方法表示出来,用 知识编辑器进行编辑输入。 知识编辑器是一种用于知识输人的软件,通常是在建 造专家系统时根据实际需要编制的。 一般来说,知识编辑器应具有如下主要功能: ①把用某种模式或语言表示的知识转换成计算机可表 示的内部形式并输入到知识库中。 ②检测输入知识库中的知识的语法错误。 ③检测知识的一致性,报告产生错误的原因,以便进 行改正。
自动知识获取方式
自然语言理解。主要借助于自然语言处理技术,针对 文本类型的信息源,通过语法、语义分析,推导文本内 容属性,抽取与领域相关的语义实体及其关系,实现知 识获取。 模式识别。主要针对多媒体信息源(如图片、语音波 形、符号等),采用统计方法等对事物或现象进行描述 、辨认、分类和解释,从经数字化处理后的数据中识别 事物对象的特征。 机器学习。利用各种学习方法来获取知识,是一种高 级的全自动化的知识获取方法。 数据挖掘与知识发现。基于数据挖掘的知识获取是近 几年发展起来的新方法,它主要针对结构化的数据库, 采用统计学习等定量化分析方法,发现大量数据之间所 存在的关联。
③具有从运行实践中学习的能力。在知识库初步建成投入使用后,随着 应用向纵深发展,知识库的不完善性就会逐渐暴露出来。此时知识的自动获 取系统应不断地总结经验教训,从运行实践中学习,产生新的知识,纠正可 能存在的错误,不断进行知识库的自我完善。 总之,在自动知识获取系统中,原来需要知识工程师做的都由系统取代了 ,并且还要做更好的工作。自动获取知识的过程如图所示。
按照知识获取的自动化程度,可以将知 识获取划分为非自动知识获取和自动知识 获取两类基本方式。
非自动知识获取
非自动知识获取
非自动知识获取也称为人工移植。在这种方式中,知识 获取分两步进行,首先由知识工程师从领域专家或有关 的科技文献那里获取知识,然后再由知识工程师用某种 知识编辑器输入到知识库中,其工作方式如图所示。
返 回本节
3、学习系统的基本类型
关于学习,不同领域的专家持不同的观点。神经学家、 心理学家、控制论学者、人工智能研究者、实践操作 人员、理论工作者都有不同的定义,其中Simon的观点 也许是最完整,他把学习定义为“一个系统能不断改 进自身性能的过程”,下图是费根鲍姆等根据这个定 义提出的学习系统模型。
非自动知识获取方式
知识获取步骤 在非自动的知识获取方式中,知识获 取分两步进行,首先由知识工程师从相应信息源获取知 识;然后再由知识工程师通过某种知识编辑软件将知识 输入到知识库中。 特点 非自动方式是知识库系统建造中用得较普遍的 一种知识获取方式。 不足 采用这种方式建立知识库是一件相当困难且费 时费力的工作,已构成知识工程的瓶颈。
返回
3.3 学习环节
它是学习系统的核心。它的任务就是对环境信息进行 搜索、控制和逻辑思维,如比较、抽象、概括、综合、 推理等,以产生、修改与补充知识。它是智能系统的 知识产生器。
Baidu Nhomakorabea 3.4
工作环节
工作环节是整个学习系统的焦点,因为学习单元试图 改进的正是执行单元的动作。有关工作环节的三个主 要问题是:复杂性,反馈和透明性。 复杂性:当执行的任务很复杂,同时知识库很大时, 综合新规则和诊断错误规则的问题变得非常复杂。 反馈:所有的学习系统都必须通过某种方式评价学习 单元提出来的假设。
返回
1.机器学习发展的三个阶段 机器学习是指机器(计算机或智能机) 模拟人类直接从知识源(专家、资料) 或自身的实践中获取知识
第一阶段:研究集中在修正自身以适应环境自组织系统上;
第二阶段:70年代初期,由于Winston有影响的论文的发表,研究者
接受了如下观点,即学习是一个复杂而又困难的过程,自然也就不 能指望学习系统以完全没有任何知识为起点去学习高水平的概念。 第三阶段:目前正在进行中,目标是为专家系统获取知识.
返回
2.机器学习的主要研究类型
基础研究:发展各种理论,探讨所有可能的学习方法 及算法,比较人类学习与机器学习的异同和联系,寻 找适合机器学习的最好学习方法; 模拟:从模拟人类学习过程出发,建立认识生理学模 型与认识心理学模型,深入研究学习过程的各个环节 和特征; 应用:研制各种机器学习系统,使其能自动获取知识, 自动总结经验,自行完善性能,自动适应环境变化。
3.知识获取的本质
获得事实、规则及模式的集合; 信息源主要是人类专家、书本、数据库和网络 信息源等;然后把它们转换为符合计算机知识 表示的形式。
4.知识获取的基本任务
(1)基本目标 为智能系统建立健全、完善、有效的知识库 (2)基本任务 包括知识抽取、知识建模、知识转换、知识输入、知识检测以及知识 库的重组这几个方面: — 知识抽取。把蕴含于信息源中的知识经过识别、理解、筛选、归 纳等过程抽取出来,并存储于知识库中 — 知识建模。构建知识模型,主要包括三个阶段:知识识别、知识 规范说明和知识精化。 — 知识转换。把知识由一种表示形式变换为另一种表示形式。 — 知识存储。把用适当模式表示的知识经编辑、编译送入知识库。 — 知识检测。为保证知识库的正确性,需要做好对知识的检测。 — 知识库的重组。对知识库中的知识重新进行组织,以提高系统的 运行效率。
5.知识获取方法
知识获取有如下方法: (1)心理学方法:即场记法,这是基于个人结构理 论的多重表格法,用来提供场景、激发记忆和联 想. (2)人工智能方法:机器学习法. (3)软件工程方法:知识分析法. (4)基于领域模型的方法:获取分类型知识. (5)基于案例的方法:获取规划和设计知识.
自动知识获取
自动知识获取
所谓自动知识获取是指系统具有获取知识的能力。它不仅可以直接 与领域专家对话,从专家提供的原始信息中学习到专家系统所需的知 识,而且还能从系统自身的运行实践中总结、归纳出新的知识,发现 知识中可能存在的错误,不断自我完善,建立起性能优良、知识完善 的知识库。 为达到这一目的,它至少应具备以下能力: ①具有识别语言、文字、图像的能力。专家系统中知识主要来源 于领域专家以及有关的科技文献资料、图像等。为了实现知识的自动 获取,就必须使系统能与领域专家直接对话,能阅读有关的科技资料 。这就要求系统应具有识别语言、文字和图像的能力。只有这样,它 才能直接获 得专家系统所需的原始知识,为知识库的建立奠定基础。 ②具有理解、分析、归纳的能力。领域专家提供的知识通常是处 理具体问题的实例,不能直接用于知识库。为了将它变为知识库中的 知识,必须在理解的基础上进行分析、归纳、提炼、综合,从中抽取 出专家系统的所需的知识并放入知识库中。在非自动知识获取中,这 一工作是由知识工程师完成的,而在自动知识获取中,是由系统取代 知识工程师完成的。
知识的获取
知识是信息的一种形式
知识:对信息收集、分析、处理和优化 而形成的“制品”,是结构信息的一种 形式。智能控制的知识和经验源于信息 ,又可能被加工处理为新的信息,如指 令、决策方案和计划等,用于控制系统 或装置的活动。
知识的获取概述
1.获取的知识类型
对于构造专家系统,它需要获取的知识大 致可以归纳为专业知识和元知识两大类. 进一步可以划分为七个方面:事实知识、 规则知识、判定树知识、概念知识、控 制知识、原理性知识和关于知识的可靠 性的知识。
返回
4.学习系统的分类
按所使用的学习方法分类: (1)机械式学习 (2)指导式学习 (3)示例学习 (4)类比学习 (5)解释学习
机械式学习
简单的机械式学习模型
(x1,x2,…,xn) 输入模式
f
存储
(y1,y2,…,yk)
[(x1,x2,…,xn), (y1,y2,…,yk)] 输入输出模式对