计算机基础与数值模拟
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据库技术和数值模拟在材料领域的
应用现状
摘要:数据库中的知识发现技术是80年代末被人正式提出的,它对满足日益增长的人工智能处理数据的要求和克服传统专家系统的困难提供了光明的前景。介绍了该技术的最新发展及其在材料专家系统中的实现与应用。针对计算机模拟技术在材料科学中所起的重要作用,合介绍了它的研究范畴和技术类型,列举了计算机模拟技术在研究材料的合成和制备、组成和结构、性能测试和分析中的若干应用实例,展示了计算机模拟在材料科学中的应用前景。关键词:计算机;数据库;数值模拟;材料科学
随着计算机技术与材料科学的发展,研究者已经不满足于仅仅用实验的手段来研制新型材料和提高现有材料的性能。除了实验和理论外,计算机已经成为解决材料科学中实际问题的第3个重要组成部分。数据库为人们提供了保存信息的有力工具。但是可供查询的数据越来越多。要作的统计分析工作也日趋繁重。人们迫切希望借助机器的帮助从繁重的日常事务中解脱出来,更希望借助机器延伸自己的智能,提高对大量信息的分析处理能力。采用模拟技术进行材料研究的优势在于它不但能够模拟各类实验过程,了解材料的内部微观性质及其宏观力学行为,并且在没有实际备制出这些新材料前就能预测它们的性能,为设计出优异性能的新型结构材料提供强有力的理论指导。材料科学研究中的模拟“实验”比实物实验更高效、经济、灵活,并且在实验很困难或不能进行的场合仍可进行模拟“实验”,特别是在对微观状态与过程的了解方面,模拟“实验”更有其独特性甚至有不可替代的作用。本文主要介绍数据库中的知识发现技术和计算机数值模拟在材料领域中的应用。
1、数据库知识发现技术在材料工程专家系统中的应用
数据库的知识发现技术[1]KDD(Know-ledge Diseovery in Databases)是80年代末在国际上兴起的,为满足人们对数据处理人工智能化要求而开发的新兴技术,同时也为解决传统的专家系统难以克服的困难提供了较好的新途径。KDD技术应用于专家系统时,应该说是一种以强调归纳逻辑推理为特色和以自适应寻找规律为目标的知识库系统构造方法。
1.1基于KDD技术研制专家系统的特色
以往的专家系统采用的是基于以演绎逻辑为主的技术策略,而KDD的研究方法在本质上是以归纳逻辑为主。KDD技术强调从个别到一般,从感性到理性的知识抽象过程。以往的专家系统在类似技术诊断的领域内应用比较成功,而在构造/综合及预测类领域应用的进展不尽人意,没有采用以归纳为主的技术策略是重要的原因之一。由于KDD技术主要实施于关系数据库,根据其方法设计的专家系统可称为关系型专家系统。这类专家系统以表格的形式建立知识库,因此具有广泛的适用性。其知识的获取较少需要知识工程师的介入,领域专家只需按照表格的要求逐行逐列地填入数据即可。KDD技术的研究人员认为,在定量基础上的定性归纳也能深刻地反映问题的本质,并且能用少量的代价传递足够的信息,对复杂的事物做出高效率的判断和推理。根据KDD技术建立的专家系统推理机一旦完成,专家系统知识库的更新和维护就变得异常容易。以往的专家系统由于采用演绎逻辑的技术策略,随着知识库的迅速膨胀,演绎过程也变得极其复
杂和困难。基于KDD技术建立的专家系统采用了归纳为主的技术策略,较好地避开了对所有的知识信息进行复杂演绎的困难。从材料设计用户的角度来看,KDD系统发现知识最有用的几类模式抽取如下:
1)发现元素之间的相关关系。数据相关关系是数据库中存在的一类重要的可被发现的知识信息。如果一个元素的值能够用另一个元素的值来预测,就称二者之间存在相关关系。此处所说的元素可以是一个单纯的因子,也可以是一个域,或者是域间的一种关系。在合金设计中,在保证某种性能的前提下,以一种元素取代另一种元素,或以一组元素组合取代另一组元素组合是常有的事。
2)类别判识。KDD技术能够将数据库中的大量记录划分成一系列子类,这种子类按照用户的要求以某种意义划分之后,可以直接为用户的某一用途服务。另外,类别判识也为其他模式抽取算法提供有用的信息。
3)异常情况的识别。发现特例是创造发明的重要前提,数据库中反映的异常情况在数据分析中常常是极有价值的,对异常情况的识别和处理能力是智能型专家系统的重要标。
1.2关系型专家系统的实现
关系型专家系统中采用的KDD技术是机器学习、专家系统、统计学、模糊学等多种学科交叉的领域。为了进一步解释此类关系型专家系统的结构,在此我们先介绍一个抽象的系统模型来进行讨论。KDD系统具有下面几方面功能[2]。
1)开放的用户输入领城知识库。领域专家应该是领域知识的主要来源,正是由于领域专家的直接介入才使得KDD专家系统具有更广泛的应用价值。最初由领域专家填入数据库的是原始数据词典,而在终端用户不断使用的过程中,专家系统接收到大量的领域信息,KDD系统则将这些信息归纳验证成新的领域知识,并不断地用其充实领域知识库。目前这方面的工作尚不完善,也可以说是一个有待解决的难题。
2)自动获取知识的控制模块。KDD系统的主要特色之一是具有自动获取知识的功能,这种功能主要由控制模块提供。控制模块的工作是根据系统中已有的领域知识和用户的输入信息控制知识的发现过程。这一过程包括定位、模式抽取和评估。在任务比较固定的条件下,控制器的功能可以由一组不变的操作序列完成;但如果系统的知识发现不限干某一个方面,而是针对数据库整体的,控制器就比较复杂,其功能的执行需要用户更多地参与。
3)与通用数据库的接口。多数关系数据库提供支持标准数据库查询语言SQL,由于SQL从对数据库进行随机查询到数据库的管理和程序设计几乎无所不能。因此KDD系统可以充分利用或充分借用SQL语言的能力。
4) 定位模块。该模块的功能是根据用户的要求,在大量数据中抽取与特定任务相关的数据,或在保证所抽取的数据能够覆盖整个发现空间的前提下进行随机抽样模式抽取的算法KDD系统的核心。模式指数据库中元素之间的某种关系。其算法可以包括一些机器学习和统计分析的算法。
评估:评估模块的功能是对抽取模式给予一个相对的衡量值,以量化反映用户兴趣的程度,然后根据这些值的大小按次序将抽取的模式提供给用户。这里主要应用的是统计学原理。一般可以图表和色彩的形式给出评估结果,以使结果的表述更加生动自然,同时有助于启发用户向更深的层次想象和分析。
2、计算机模拟技术在材料科学中的应用