简单动物识别系统的知识表示
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•简单动物识别系统的知识表示
• 1. 实验目的
•理解产生式知识表示方法,能够用选定的编程语言设计产生式系统的规则库和综合数据库。
• 2. 实验环境
•在微型计算机上,选一种编程语言。
• 3. 实验要求
•(1) 以动物识别系统的产生式规则为例。
•(2) 用选定的编程语言建造知识库和综合数据库,并能对它们进行增加、删除和修改操作。
•学习任务
•通过网络搜索,以“专家系统的作用”为主题进行调查。搜集各种应用专家系统的实例,分析其用途,并根据不同的用途进行分类。
•请上网查找专家系统的相关资料,从不同的角度追溯专家系统的发展史。
•作品结果:把上面两个任务结果,形成一个WORD文档。其中对专家系统的用途分类形成一个表格。
•用Intermodeller设计一个小型的专家系
MYCIN是一个通过提供咨询服务来帮助普通内科医生诊治细菌感染性疾病的专家系统,其于1972年开始研制,74年基本完成,并投入实际应用。MYCIN的取名来自多种治疗药物的公共后缀,如clindamycin、erythromycin、kanamycin等。如果说能推测有机化合物分子结构的DENDRAL是世界上第一个有重要实用价值的专家系统,那末MYCIN则是最有影响力的专家系统。围绕着MYCIN的各种研究工作一直沿续了10年,对于推动知识工程以及专家系统学科的建立和发展具有重要影响。可以说,早期的专家系统,尤其是医疗诊断和咨询型专家系统,许多都参照了MYCIN系统的技术,如知识表示、不确定推理、推理解释、知识获取等。
MYCIN也设计为典型的产生式系统,由规则库、综合数据库和控制系统三个部分组成;只是基于规则的推理采用逆向方式,即从问题求解
的目标出发,搜寻原始证据对于目标成立的支持,并传递和计算推理的不确定性。从KB系统的组成来看,规则库就是MYCIN的知识库,综合数据库和控制系统联合形成推理机。其中,综合数据库用以保存问题求解的原始证据(初始状态)和中间结果。由于当时尚未出现视窗技术,用户界面只提供基于文本(text)的问答过程和结果显示。
MYCIN系统采用INTERLISP(人工智能程序设计语言LISP的一种版本)编程,运行于DEC PDP-10的操作系统TENEX下,MYCIN系统的执行代码有50KB,规则库占据16KB,系统的咨询服务(包括提供解释)平均每次20分钟。
本章首先介绍知识库的结构,然后讨论推理机的设计,再阐述支持MYCIN应用的各种设施,最后介绍通过抽取MYCIN骨架而产生的专家系统工具EMYCIN。
4.3.1.知识库的构造
MYCIN的知识库以前提-动作型产生式规则来表示诊断和治疗细菌感染性疾病的专家级医学知识,以实现专家级诊断和治疗能力。规则的表示结构以BNF范式描述如下:
<规则> := RULE <规则号>
PREMISE ($AND {<条件>}+)
ACTION {<动作>}+
<条件> := <简单条件> |($OR {<简单条件>}+)
其中,简单条件以MYCIN提供的4类简单函数来表示。最常用的函数是SAME,其BNF范式描述如下:
(SAME <对象> <属性> <值>)
在推理机对规则进行解释执行时,SAME函数指示推理机请求用户证实该对象是否有该属性值(当属性值是原始观测数据时),或经由逆向推理证实该属性值。这里证实的程度以所谓的可信度(CF-Certainty Factor)来指示。CF的取值范围是[-1,+1],-1表示假,+1表示真,0指示无法确定真假的程度,其它值或多或少指示真假的程度。CF可以由用户在回答关于证实的请求时直接给出,或由逆向推理产生。
规则中的动作也以简单函数表示,最常用的是CONCLUDE,其将对象的属性值作为推理结论加进综合数据库,并记载推理结论的实际可信度。CONCLUDE 函数的BNF范式描述如下:
(CONCLUDE <对象> <属性> <值> TALLY <结论CF>)
其中,TALLY用于存放规则前提的CF(计算方式请参阅7.2.2节)。结论CF意指规则本身的可靠(可相信)程度,即在规则前提CF为1(真)的情况下,结论为真的可能程度。实际上MYCIN知识库收集的大多数规则均是启发式关联知识,取自医疗专家多年积累的经验,不保证完全正确,所以引入结论可信度是十分必要的。结论CF的取值范围也是[-1,+1],其与规则前提在推理中使用时的实际CF相乘,即可得到规则结论的实际CF(参阅7.2.2节)。例如,TALLY当前值为0.8,而结论CF为0.4,则结论的实际CF为0.32。
MYCIN系统建立的初期就以上述格式表示和收集了200多条规则于知识库,其中047号规则表示如下:
RULE 047
PREMISE ($AND (SAME CNTXT SITE BLOOD)
(NOTDEFINITE CNTXT IDENT)
(SAME CNTXT STAIN GRAMNEG)
(SAME CNTXT MORPH ROD)
(SAME CNTXT BURN T))
ACTION (CONCLUDE CNTXT IDENT PSEUDOMONAS TALLY 0.4)
该规则的英语形式(已翻译为汉语)如下:
规则047
如果:1)培养物取自血液,且 2)病原体的身份未鉴别,且 3)病原体的染色是革兰氏阴性,且
4)病原体的形态为杆状,且
5)病人被烧伤;
那么:该病原体的身份应鉴别为假单胞细菌,且可信度为0.4。 其中,CNTXT意指推理过程中需考察的相应对象,作为综合数据库的主要内容,MYCIN系统称其为上下文,并区分为10类。上述规则中已涉及到三类:病人(PERSON), 从病人身上提取的培养物(CURCULS),从培养物中分离出的病原体(CURORGS)。另外还有给病人使用的抗生药物和治疗手术等。每一类上下文对象都有其特有的属性(也称临床参数),属性又可按其取值特性区分为单值型(只可取单一值)、多值型、可问型(可通过向用户询问来取值)、可导型(可基于规则推导出值)等。对象、属性和值构成所谓的关联三元组,由于属性名隶属于特别类