石油勘探开发领域本体的构建方法研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
石油勘探开发领域本体的构建方法研究
摘要:石油勘探开发领域中涉及的专业有20多个,由于各专业之间的信息术语不统一,给应用集成和信息共享带来了很大的麻烦,而采用本体构建理论可以有效的解决这一问题。在了解和分析石油勘探开发业务特点的基础上,本体论提出了一套构建石油领域本体petro-onto的方法,建立了相应的顶层本体框架,提出了以数据模型和业务模型为参照体系的自动捕获本体的方法。目前,在油田信息集成中petro-onto得到了广泛应用。
关键词:石油勘探领域本体构建
石油勘探开发领域包括勘探、采油等二十多个专业,这些专业在相互协同的基础上囊括了勘探与开发的全部业务流程。由于各专业之间缺乏统一的信息标准,要实现跨专业信息共享和应用集成就会面临着很多问题。要解决上述问题,需要采用统一的方法来对油田领域知识进行描述,这是目前为止最为有效的途径。目前,在医学、电子政务、图书情报、军事等领域已开展了构建领域本体等方面的研究,但在石油勘探开发领域,只对个别专业进行了局部领域本体的研究。因此,对石油勘探开发领域本体的构建方法进行研究具有十分重要的现实意义。
一、领域本体的概念
本体理论主要研究特定领域知识的对象分类、属性及对象之间的关系,在描述领域知识的时候为其提供术语。在信息技术领域,本体具有明确化、形式化、概念化和共享性的特点。其目标则是为了
捕获领域内的知识,对领域内共同认可的词汇进行确认,并从形式化模式上给出明确定义。而石油勘探开发领域本体则主要描述石油勘探开发领域中各种知识的概念及这些概念之间的相互联系、领域活动和该领域的特性和规律,简称petro-onto。而实现油田多学科信息和知识集成是petro-onto的目的,主要有以下几个方面的作用:明确各专业术语及相互关系的同时使其形式化;在人与人、人与机器之间实现共享;实现该领域知识的复用。由于各自学科领域及具体工程的情况不一样,构建本体的方法也各不相同,目前在知识本体构建方面尚没有一套标准的方法。构建领域本体的用用方法主要有:tove法、kactus法、methontology法、idef5法、sensus 法、骨架法、和七步法等。
二、 petro-onto的构建方法
1.确定需求
石油勘探与开发是油田企业的核心业务,petro-onto以捕获石油勘探开发领域知识为目的,为实现信息共享及应用集成服务。因此,构建petro-onto应满足以下两个方面的需求:业务和信息需求。业务需求主要围绕勘探、测井、钻井、录井、采油等核心业务开展工作,在建模过程中,进行业务梳理的目的是为了实现跨专业领域知识的标准化。在信息需求方面,则主要围绕油田企业信息共享和应用集成的需要进行建模。国内外的石油勘探开发领域建立了包括专业数据库和应用软件在内的信息系统,而构建petro-onto可为信息系统之间实现数据自动交换和集成提供帮助。
2.建立框架
建立petro-onto的框架主要是指建立petro-onto的顶层本体以及概念分类体系。
3.确定参照体系
在长期的信息化建设中,石油勘探开发领域已开发了大量的应用软件,同时也建立了大量的业务及数据模型,这些信息系统已包含了主要的领域知识,可以之作为参照源模型,经过分析和处理之后,自动构建petro-onto。
4.进行规范化定义
从参照体系中捕获的本体往往只是—个较为粗糙的本体模型,因此需要对其进行进一步的定义,使其更为精确和规范。在对本体模型进行规范化定义时,需要借助于本体建模工具的支持,在对捕获的概念进行相应的分析和设计之后,应用本体描述语言来描述本体,形成具体的本体文件。在构建petro-onto的过程中,一开始获取的概念多达20000多个,对本体模型中的类进行规范之后可减少到3000个以下,而个体概念在2000个左右。
三、基于参照体系的本体自动构建
1.基于业务模理的慨念抽取
1.1划分业务
因为石油勘探开发过程涉及到很多专业,所以建立业务模型时必须依赖各专业领域内的专家,依靠他们的专业知识进行建模。由于这些专业的知识和业务存在着相互重叠的情况,因此,合理划分专
业、确定建模单元是非常必要的。通常情况下,划分业务就是对整个业务过程进行分解,这种划分的逻辑性很强,与基于业务的组织机构存在着一定的差异。在业务划分过程中,单一业务的子活动不重叠和不遗漏业务是其基本原则。所以,相对于特定应用建立的业务模型来说,这个更为全面。
1.2对业务活动进行规范化描述
为了规范描述结果,可以对参与活动的角色、时间、地点、方式、作用对象、所使用的资源进行定义,以此来描述活动与活动、活动与组织机构以及活动与对象之间的关系。由于每一项内容填写的概念很少,业务人员的工作量不大,可直接由计算提取名称并进行转换。与基于流程的业务模型相比,企业非it业务人员进行业务描述时候应选择基于模板的业务活动的规范化描述,他们不需要了解整个流程,也不需要掌握专门的工具,只要描述好自己的工作即可。
2.基于数据模型的领域概念抽取
从业务模型中可难以获得对象与特性、对象与对象之间的关系,而从数据模型中就可以获得。数据模型是蕴涵领域知识的重要载体。国际上发布的ppdm及国内的各种数据模型均为关系数据模型,有文献提出了使用关系数据库模型映射成本体结构的方法,转换规则包括关系映射、关联映射、属性映射以及约束映射。由于这种方法要求数据模型满足3nf,但在具体应用中关系数据模型往往难以难以这样的要求。即使数据模型可以满足3nf的要求,但在语义上仍然会存在间接依赖的关系。因此,要精确提取本体概念,需要仔
细分析数据项的语义。可采用数据元的语义描述方法来分析数据项的语义。数据元是通过定义、表示、标识及允许值等属性描述的数据单元,在特定的语义环境中它被认为是不能再分的最小数据单位。在信息系统中数据元是描述数据的标准术语。通常情况下,—个数据元只有—个特性词,—个特性词被—个对象词限定,但反过来却不是如此。正是由于对象词之间的限定关系才使数据项与主键之间得以建立相应的依赖关系。通过分析数据项的语义,可以提取出对象词、特性词及相互之间的关系,然后将其加入到领域本体中。
四、总结
国内外针对石油勘探开发领域本体的研究才刚刚起步,石油勘探开发领域本体是油田数据集成、智能化信息搜索、企业知识管理等方面应用与研究的基础。与其它领域相比,石油勘探开发领域的信息化建设也有属于自己的特点。结合这些特点,本文对石油勘探开发领域本体的构建方法进行了研究,也介绍了petro-onto的框架结构及自动获取本体慨念的方法。目前,petro-onto已在中石化、中石油等企业的信息搜索、数据集成及标准化等方面得到了应用。参考文献
[1]文必龙,张莉石油勘探开发领域本体的构建方法研究计算机工程与应用,2009(34).
[2]邓小亚石油领域本体库的构建研究电子设计工程,2011(20).
[3]袁国铭,陈殊聪,辛盈,邓小亚本体构建理论在石油领域的应用研究计算机技术与自动化,2011(3).