基于FCA的本体映射算法
FCA与本体的结合研究
这样得到<A,R>的 关系图如右图所示
再求得cov (A ) = {<1, 2><1, 3><1, 5> <2, 6><2,10><3, 6> <3, 15><5, 10><5, 15><6, 30><10, 30> <15, 30>},按规则得到 Hasse图,如右图。
1.2 FCA的基本理论—基本定义
FCA与本体的结合
仇鹏 20611042
大连理工大学系统工程研究所 知识管理
引言
本体在知识管理、人工智能、信息检索、 软件工程、语义网等研究领域得到广泛应 用,发挥着重要的作用 由于手工构建费时费力,本体的自动半自 动构建已成为热门研究领域 常用的用于本体构建的技术方法有基于词 典、基于文本聚类、基于关联规则、基于 知识库等方法
利用FCA进行本体合并流程
2.3 FCA在本体导航中的应用
一个很好的应用——概念E-mail管理器。 它由Cole和Stumme在2000年提出。不再 采用传统的树状结构和文件管理系统来管 理信件,而使用简单的本体存储信件 Email作为对象,属性是关键词,以此构成 概念格。多继承和多实例的结构允许用户 沿概念格的不同路径都可以检索到同一 Email
由于作者在此方方面的研究不够深入,准 备也比较仓促,不足之处,请大家多指正。
谢谢!
附1:FFCA定义
Given a fuzzy formal context K=(G, M, I) and a confidence threshold T, we define A∗= {m ∈ M |∀g ∈ A: μ(g, m) ≥ T} for A ⊆ G and B∗={g ∈ G |∀m ∈ B: μ(g,m) ≥ T} for B ⊆ M. A fuzzy formal concept (or fuzzy concept) of a fuzzy formal context (G, M, with a confidence threshold T is a pair (Af =ϕ(A), B) where A ⊆ G, B ⊆ M, A∗ = B and B∗ = A. Each object g ∈ ϕ(A) has a membership μg defined as
fassis 相似计算 大规模计算
fassis 相似计算大规模计算大规模计算是指通过对大量数据进行处理和分析,以获取有用信息的一种计算方式。
随着互联网和信息技术的发展,大规模计算正在成为各个领域的重要工具。
在这篇文章中,我们将以fassis相似计算为切入点,探讨大规模计算的应用和意义。
让我们来了解一下fassis相似计算。
fassis相似计算是一种基于图像和视频内容的计算方法,通过对图像和视频进行特征提取和匹配,来判断它们之间的相似度。
这种计算方式可以广泛应用于图像搜索、视频监控、人脸识别等领域。
在大规模计算中,fassis相似计算起到了重要的作用。
大规模计算的应用非常广泛。
在金融领域,大规模计算可以用来进行风险评估和投资决策。
通过对大量的金融数据进行分析和计算,可以快速准确地评估风险,并提供决策支持。
在医疗领域,大规模计算可以用来进行疾病诊断和治疗方案设计。
通过对大规模的医学数据进行分析和计算,可以帮助医生更好地理解疾病的发展规律,提供更准确的诊断和治疗方案。
在交通领域,大规模计算可以用来进行交通流量预测和交通优化。
通过对大量的交通数据进行分析和计算,可以帮助交通管理部门更好地规划路网,提高交通效率。
在电商领域,大规模计算可以用来进行用户行为分析和个性化推荐。
通过对大量的用户数据进行分析和计算,可以帮助电商平台更好地理解用户需求,提供更精准的推荐服务。
大规模计算的意义在于它可以帮助我们更好地理解和利用大数据。
随着互联网和物联网技术的发展,我们正处在一个数据爆炸的时代,每天都会产生大量的数据。
这些数据蕴含着重要的信息,但如果不经过计算和分析,这些信息将无法被发现和利用。
大规模计算通过对大数据进行处理和分析,可以帮助我们从海量的数据中提取有用的信息,为决策和创新提供支持。
同时,大规模计算还可以帮助我们发现数据之间的关联和规律,从而更好地理解和解决实际问题。
然而,大规模计算也面临着一些挑战和问题。
首先,由于数据量庞大,大规模计算需要强大的计算资源和高效的算法。
本体的自动构建方法
本体的自动构建方法解峥;王盼卿;彭成【摘要】The method of information integration based on ontology is the most effective way to solve the semantic heterogeneity,but the traditional ontology construction requires a ot ofmanpower material resources. With the help of artificial intelligence technology and ealizeautomatic build of ontology, such as WordNet knowledge base will save a lot of social costs, will be the focus of the present and future aspects of building ontology research. In this paper, the mainstream in the world today paper summarizes the method of building ontology automatically, it is concluded that the future main direction of ontology automatic building technology.%基于本体的信息集成方法是解决语义异构的最有效途径,但是传统的本体构建需要大量的人力物力。
借助人工智能技术和WordNet等知识库实现本体的自动构建,将节省大量的社会成本,将是现在以及未来的本体构建方面研究的重点。
文中对当今世界上主流的本体自动构建方法进行归纳总结,得出未来本体自动构建技术的主要发展方向。
基于语义信息内容的FCA概念相似度计算方法
优先出版 计 算 机 应 用 研 究 第32卷--------------------------------基金项目:国家科技支撑计划项目(2012BAH08B02);河南省科技攻关项目(082400420250,112300410008);河南省教育厅科学技术研究重点项目(13A520508);河南师范大学博士科研启动基金项目(qd12107)作者简介:黄宏涛(1980-),男,河南漯河人,副教授,博士,主要研究方向为问答系统、模型检测(huanght@);程清杰(1990-),女,河南安阳人,硕士研究生,主要研究方向为数据挖掘;万庆生(1975-),男,黑龙江哈尔滨人,博士研究生,主要研究方向为问答系统、数据挖掘;黄少滨(1965-),男,黑龙江哈尔滨人,博士,教授,博导,主要研究方向为数据挖掘、模型检测.基于语义信息内容的FCA 概念相似度计算方法黄宏涛1,程清杰1,万庆生2,黄少滨2(1.河南师范大学 河南省高校教育信息工程技术研究中心,河南 新乡 453007;2.哈尔滨工程大学 计算机科学与技术学院,哈尔滨 150001)摘 要:基于概率信息内容的FCA 概念相似度计算方法依赖于语料库中概念的频次信息,这种方法仅使用出现概率作为信息内容度量指标计算FCA 概念相似度,其计算结果的准确率不高。
针对上述问题提出一种基于语义信息内容的FCA概念相似度计算方法,该方法利用本体中概念间的上下位语义关系度量信息内容,以进一步提高概念一般/具体程度的度量精度;然后在本体派生的ISA 层次结构上计算语义信息内容相似度,从而避免基于概率信息内容的方法对语料库的依赖;最后把语义信息内容相似度作为度量FCA 概念相似度的依据,并给出了通过构造带权二部图提高相似度计算效率的方法。
实验结果表明使用基于语义信息内容的方法能够在不牺牲时间性能的前提下有效提高FCA 概念相似度计算结果的准确率。
关键词:FCA 概念相似度;信息内容;概率;语义;层次结构中图分类号:TP391.1 文献标志码:AFCA concept similarity computation based on semantic information contentHUANG Hong-tao 1, CHENG Qing-jie 1, WAN Qing-sheng 2, HUANG Shao-bin 2(1. Engineering Research Center of Henan provincial Universities for Education Information, Henan Normal University,Xinxiang Henan 453007, China; 2. College of Computer Science & Technology, Harbin Engineering University, Harbin 150001,China)Abstract: The FCA concept similarity computation method based on probability information content relies on the frequency ofconcepts in corpus, this method takes only the occurrence probability as information content metric to compute FCA conceptsimilarity, which makes the accuracy of computing results is not high. In order to improve the accuracy of probability basedmethod, this paper proposes a semantic information content based FCA concept similarity computation method, it utilizes thesuperordinate and subordinate semantic relationship of concepts to measure information content, which improves the accuracyof the generic and specific degree of concepts. Then it computes the semantic information content similarity on ISA hierarchyderived from ontology, which avoids the dependence of probability information content method on corpus; Finally, this methodtakes semantic information content as a measure to compute the FCA concept similarity, and introduces a weighted bipartitegraph construction method to improve the efficiency of similarity computation. Experimental results show that this semanticinformation content based FCA concept similarity computation method improves the accuracy of probability information contentbased method effectively without sacrificing time performance.Key Words: FCA concept similarity; Information content; Probability; Semantic; Hierarchy0 引言 形式概念分析(Formal Concept Analysis ,FCA )是一种数据分析的有效工具,是人工智能领域研究人员关注的焦点之一,目前在信息检索、数据挖掘、软件工程等领域有着广泛的应用。
基于RFCA的概念相似度计算方法
Kewo d F y rs CA ,Ro h s t g u1 引言
随着本体应用 的增 多 , 如何 解决异 构本体 间 的互 操作 已 成为一个棘手 的问题_ 。本体映射能很好地解决本体异构 问 1 ] 题, 是发现两个相 同领域 本体 的 概念 之间 的相关 性 ( 映射关 系) 的过程 , 是本 体 间概念 和关 系取 得一 致性 的一个规 范说 明。本体映射也是本体 结盟 、 本体集 成 、 体合并 、 体 翻译 本 本 等的技术基础[ 4。 2 3  ̄ 本体一般可理解为 概念 、 属性 和关 系 的集合 。属 性 即概 念的属性 , 关系即概念间的关系 。因此 , 本体映射 的核心 内容
维普资讯
计算机科学 2 0 Vo. 4 o5 0 7 13 N .
基 于 R C 的概 念 相 似 度 计 算 方 法 ) FA
曹泽 文 陆 昌辉 张维 明 邓 苏
( 国防科学技术大学信 息系统与管理 学院 长沙 40 7 ) 10 3
摘 要 本文主要 针对基于 F A 的概念相似度计算模 型不能计算 非形式概念之 间的相似度 问题 , C 引入粗糙 集理论 ,
分析基于 F A 的概念相似度计算过程及存 在的问题 , 出了 C 给 F A中等价关系 的定义 , C 最后 提出了基 于 I 的概念相似 t 飓
度计算模型 , 出了模 型计算 实例 。 给
者可 以进一步分成 : 几何( em tc模型 、 ( r s I a G ei o r) 转换 T a f T — no n t n 1 型、 i a) o 模 特征( etr1 型 、 F aua) 模 基于结 盟( l n n-ae ) ag met s i b d 的模 型等 。几何模型是在 维空 间计算实体特征 向量之 间的
基于FCA的本体映射算法
…
、
C n之 间 存 在 的 n元 关 系 R。 一般 地 , 体 中 概 念 之 间 本
至少 存 在 以下 3类 二 元 关 系 : 承关 系 、 继 聚合 关 系 、 联 关 关
系 , 念 和 概 念 中 属 性 之 间 的 关 系 也 是 一 种 关 系 , 为 属 概 称 性关系 。
输” 外 , 包括货源信 息 、 源信息 、 路 信息 、 询 、 等 还 车 线 查 运 输 过 程 等 等 。本 体 中 的这 些 概 念 通 常 按 照 一 定 的 关 系形
成 一 种 层 次结 构 。例 如 , 照 “ u caso” 系 , 体 中 的 按 s b ls f关 本
概 念形 成一 个 分 类 层 次 结 构 。在 复 杂 的本 体 中 , 念 还 包 概
I 为 领域 内概 念 实 例 的 集 合 。其 中 , I c为 概念 实 : :— 例 到 所 属 相 应 概 念 的 映射 , 念 的 实 例 具 有所 属 概 念 定 义 概
的属 性 。
2 本 体 的基 本 构 成 3 基 于 F A 的本 体 映 射 算 法 的 实 现 C
从 知 识 程 的研 究 角 度 , 我们 可 以把 本 体 表 示 为 如 下
A : 念 或 者 概 念 之 间 的 关 系 所 满 足 的 公 理 , 一 些 概 是
永 真式 。例 如 : 品 的储 存 量 肯 定 不 会 超 过仓 库 的最 大 容 物
量 数
之 间相 互 关 系 的 明 确 定 义 。本 体 既 包 括 一 个 领 域 内 的 知
识 也包 括 各 种 领 域 之 间 的知 识 。
基于关系数据库的军事训练本体自动构建模型
c o n c e p t a n a l y s i s( FCA) me t h o d i s a d o p t e d t O e x p a n d t h e o n t o l o g y mo d e 1 .Fi n a l l y,t h e mi l i t a r y
i n t he da t a ba s e a r e a n a l yz e d.The me t a ห้องสมุดไป่ตู้ a t a ma p pi ng i s us e d f o r t h e on t o l og y mo de 1 .Th e f o r ma l
理 论与 探 索
基 于关 系数 据 库 的 军 事 训 练本 体 自动构 建模 型
冯 波 郝 文 宁 宋 杰 杨 剑 占栋 辉
( 解放 军理工 大 学指挥信 息系统 学院 南京 2 1 0 0 0 7 )
摘 要 : 针 对 军事 训练本 体人 工构 建 出现 的耗 时、 费力和 易 出现倾 向性 错误 等 问题 , 提 出了一 种基 于关 系数 据库 的 军事训 练本体 自动 构建模 型 。 该模 型 以关 系数据 库为研 究对 象 , 分析 了数据 库 中元
t r a i ni n g on t o l og y wi t h a bu nd a n t s e ma nt i c i nf or ma t i on i s c on s t r u c t e d.Th e s i mul a t i o n e x pe r i me nt s ho ws t ha t mi l i t a r y t r a i n i ng o n t ol o g y c o ns t r uc t e d b y t he mo d e l h a s a c l e a r hi e r a r c hy a n d a n e x— pl i e i t s e ma nt i c r e l a t i o n,a n d i s c o ns i s t e nt wi t h c o gn i t i o n,t hu s i mp r o vi n g t h e qu a l i t y o f t h e o nt o l —
基于FCA的本体映射算法
基于FCA的本体映射算法作者:孙娅彬来源:《软件导刊》2011年第10期摘要:针对物流机构存在的异构问题,利用信息共享建立一个基于FCA的语义本体原型,其中包括数据服务、本体、元数据等等。
对集中典型的本体映射方法进行分析,根据FCA算法从概念格中获得对应本体,提高本体信息的查询速度、查全率和查询正确率。
关键词:本体;FCA;映射;概念格中图分类号:TP312 文献标识码:A 文章编号:1672-7800(2011)10-0064-作者简介:孙娅彬(1976-),女,山东济南人,硕士,山东英才学院讲师,研究方向为决策支持理论与系统分析。
1 本体的基本概念本体论(Ontology)的概念最初起源于哲学领域,它在哲学中的定义为“对世界上客观存在物的系统地描述,即存在论”,是对客观存在的一个系统的解释或说明,关心的是客观现实的抽象本质。
从内涵上来看,不同研究者对于本体的认识是统一的,本体的概念有下面4层含义:(1)概念化(conceptualization)。
通过抽象出客观世界中一些现象(Phenomenon)的相关概念而得到的模型,其表示的含义独立于具体的环境状态,是一个概念体系,又称为概念模型。
(2)形式化(formal)。
有精确的数学描述,本体具有计算机可读性。
(3)明确化(explicit)。
概念与概念之间的联系及使用这些概念的约束都被明确定义。
(4)共享(share)。
本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集,它所针对的是团体而不是个体。
总之,本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇之间相互关系的明确定义。
本体既包括一个领域内的知识也包括各种领域之间的知识。
2 本体的基本构成从知识工程的研究角度,我们可以把本体表示为如下形式:定义:(本体结构)本体的逻辑结构可以看成一个五元组:,作为本体的核心结构,在具体应用中,五元组的组织如下:C:本体中的概念。
基于矩阵形式运算的本体融合算法研究
1.1 课题研究的背景和意义........................................................................................................................... 1 1.2 国内外研究现状 ....................................................................................................................................... 4 1.3 论文主要工作和研究成果....................................................................................................................... 8 1.4 论文结构安排 ........................................................................................................................................... 9
At last, the model and algorithms are applied in agricultural domain, two different agricultural ontologies are merged into one new agricultural ontology. It provides an efficient theory, method and technology to build, share and reuse agricultural ontology.
重映射算法-概述说明以及解释
重映射算法-概述说明以及解释1.引言1.1 概述重映射算法是一种在计算机科学领域中常见的算法,其主要目的是将一个数据集从一个空间映射到另一个空间。
这种算法在图形学、机器学习、计算机视觉等领域中有着广泛的应用。
通过重映射算法,我们可以更好地理解数据之间的关系,发现其中的规律,并进行更精确的预测和分析。
本文将详细介绍重映射算法的定义、应用领域以及优势,希望能为读者提供全面的信息和启发。
1.2 文章结构文章结构部分的内容应该包括对整篇文章的框架和组成部分进行介绍,以便读者能够更好地了解文章的内容和结构。
在这篇关于重映射算法的文章中,文章结构部分的内容可以包括以下内容:1. 引言部分:介绍文章的背景和引入重映射算法的重要性。
2. 正文部分:详细介绍重映射算法的定义、应用领域和优势。
3. 结论部分:总结文章的主要内容,展望重映射算法的未来发展方向,并给出一些结束语。
通过这样的文章结构,读者可以清晰地了解文章的内容和逻辑结构,帮助他们更好地理解和吸收文章中所介绍的内容。
1.3 目的重映射算法作为一种重要的计算方法,在科学研究、工程设计和数据处理等领域中具有广泛的应用。
本文旨在深入探讨重映射算法的定义、应用领域和优势,希望通过对其相关概念和原理的讲解,帮助读者更好地理解和应用这一算法。
同时,通过对比分析不同重映射算法的特点和优势,以期为读者在实际问题中选择合适的算法提供参考。
通过本文的阐述,希望能够引起更多人对重映射算法的关注,促进其在实际应用中的进一步发展和完善。
2.正文2.1 重映射算法的定义重映射算法是一种计算机科学领域的算法,其主要作用是将一个数据集合映射到另一个数据集合中。
在这个过程中,算法会根据一定的规则和条件对原始数据进行处理,然后生成一个新的映射结果。
重映射算法可以应用于不同的领域,包括数据处理、图像处理、信号处理等。
通过这种算法,我们可以实现数据的转换、重建和优化,从而提高数据处理的效率和质量。
一种基于FCA的面向关系数据库的本体学习方法
一种基于FCA的面向关系数据库的本体学习方法欧阳纯萍;胡长军;李扬;刘振宇【期刊名称】《计算机科学》【年(卷),期】2011(38)12【摘要】从已有的数据模型中进行语义提取,经过一定的规则映射生成本体的过程称为本体学习.关系数据库模型是当前数据的存取与组织的主要模型,从中学习得到本体,一直是本体工程领域研究的热点之一.利用手工定义的E-R模型到本体的映射规则来完成本体的构建,是国内外大部分学者采用的方法.但这样获得的本体概念层次关系主观依赖性强,不利于本体的实际应用.为了能更加客观地获取数据之间的概念层次关系与语义信息,提出了一种基于FCA(形式概念分析)从关系数据库进行本体学习的方法.该方法既保持了关系数据表中原有的数据语义关系,又发挥了FCA自动提取语义信息的特点,提高了最终本体生成的质量,有利于在具体的领域应用中使用本体.最后结合材料服役安全数据库的数据信息,演示了运用所提出的方法学习得到领域本体的过程.%Ontology learning is a process, which extracts semantic information from the existing data model and generates ontology using a set of predefined mapping rules. Relational database is the main model of data access and management, and extracting ontology from relational database is one of the research hotspots in ontology engineering field. A common method adopted by the domestic and foreign scholars is that ontology is constructed by using mapping rules between E-R model and ontology elements. But this method is subjective and it goes against the application of ontology. To address this issue,an approach of ontologylearning from relational database based on formal concept analysis was proposed, which could obtain the hierarchical relation of concept and semantic relation of data objectively. The proposed method not only keeps the semantic information of relational data tables,but also shows the advantage of FCA in automatic extraction of semantic information. Thus the quality of final ontology is improved and the application field of ontology is extended. A case study of the proposed method combined with materials service safety database was also presented.【总页数】5页(P167-171)【作者】欧阳纯萍;胡长军;李扬;刘振宇【作者单位】北京科技大学信息工程学院北京100083;南华大学计算机科学与技术学院衡阳421001;北京科技大学信息工程学院北京100083;北京科技大学信息工程学院北京100083;北京科技大学信息工程学院北京100083【正文语种】中文【中图分类】TP391【相关文献】1.一种基于FCA的本体优化算法 [J], 田宏;闫瑞海2.一种基于ORM的OWL本体与关系数据库映射模型 [J], 羊海潮3.基于两层向量空间模型和模糊FCA本体学习方法 [J], 邢军;韩敏4.基于FCA本体合并方法的知识本体复用技术 [J], 陈军;沈明玉5.基于P-集合和FCA的中文领域本体学习方法 [J], 侯丽鑫;郑山红;赵辉;董亚则;彭馨仪因版权原因,仅展示原文概要,查看原文内容请购买。
基于两层向量空间模型和模糊FCA本体学习方法
基于两层向量空间模型和模糊FCA本体学习方法邢军;韩敏【期刊名称】《计算机研究与发展》【年(卷),期】2009(046)003【摘要】本体是WWW进化为语义Web版本的瓶颈,手工构造本体费时费力,本体学习技术使得在文本中自动构造本体成为可能,但存在通用性差和准确性低等问题.提出以面向对象思想的分析方法为基础,把传统的单层文本向量空间模型(VSM)改进为2层向量空问模型(double vector space model,D-VSM),该模型不仅具有属性特性,而且还具有很强的关系特性.在此模型的基础上,引入模糊形式概念分析(fuzzy formal concept analysis,FFCA)本体学习技术.该技术充分考虑D-VSM模型中的数据分布特点,较好地解决本体学习通用性、本体关系获取等问题.基于上述方法实现一个本体学习工具,为本体的(半)自动构造提供有力的支持.【总页数】9页(P443-451)【作者】邢军;韩敏【作者单位】大连理工大学电子与信息工程学院,大连,116024;大连工业大学信息科学与工程学院,大连,116034;大连理工大学电子与信息工程学院,大连,116024【正文语种】中文【中图分类】TP182【相关文献】1.一种基于FCA的面向关系数据库的本体学习方法 [J], 欧阳纯萍;胡长军;李扬;刘振宇2.一种基于向量空间模型的模糊本体映射方法 [J], ZHANG Ling-yu;CHEN Shu-xin;ZHANG Guang-da;LV Hong-zhu3.一种基于模糊形式概念分析的模糊本体学习方法 [J], 马迪;李冠宇4.基于FCA本体合并方法的知识本体复用技术 [J], 陈军;沈明玉5.基于P-集合和FCA的中文领域本体学习方法 [J], 侯丽鑫;郑山红;赵辉;董亚则;彭馨仪因版权原因,仅展示原文概要,查看原文内容请购买。
基于FCA的概念相似度计算方法
基于FCA的概念相似度计算方法
曹泽文;钱杰;张维明;邓苏
【期刊名称】《模糊系统与数学》
【年(卷),期】2008(22)1
【摘要】针对传统基于特征的概念相似度计算方法准确性不高的问题,提出了基于FCA的概念相似度计算方法。
该方法利用辞典形成两个本体特征之间的偏序关系,建立形式背景;以此为基础形成概念格。
引入新的基于概念格的相似度计算模型,以概念格的不可约下确界元素作为相似度计算的依据。
实验结果证明该方法提高了概念匹配的准确率。
【总页数】8页(P155-162)
【关键词】FCA;概念相似度;本体
【作者】曹泽文;钱杰;张维明;邓苏
【作者单位】国防科学技术大学信息系统与管理学院
【正文语种】中文
【中图分类】TP18
【相关文献】
1.基于FCA的领域问句相似度计算方法 [J], 万庆生;黄少滨;刘刚;陆路
2.基于限界传递相似度图的FCA概念相似度计算方法 [J], 黄宏涛;吴忠良;万庆生;黄少滨
3.基于语义信息内容的FCA概念相似度计算方法 [J], 黄宏涛;程清杰;万庆生;黄少
滨
4.一种基于FCA的概念相似度算法 [J], 林智超;朱国进
5.基于属性相似度在概念格的概念相似度计算方法 [J], 裴梧延;张琳
因版权原因,仅展示原文概要,查看原文内容请购买。
基于排序学习方法的本体映射算法
基于排序学习方法的本体映射算法
高炜;兰美辉
【期刊名称】《微电子学与计算机》
【年(卷),期】2011(28)9
【摘要】本体映射作为实现多本体间相互操作的重要手段,已广泛应用于诸多科学领域.根据本体自身的结构设计边权值函数和函数,利用排序算法将多本体图映射成实直线,通过比较两概念对应实数间的差值或排名的接近程度判断它们的相似程度,由此得到对应的本体映射.实验表明,该算法有较高的效率.
【总页数】3页(P59-61)
【关键词】本体映射;排序;铰接亏损函数
【作者】高炜;兰美辉
【作者单位】云南师范大学信息学院;曲靖师范学院计算机科学与工程学院
【正文语种】中文
【中图分类】TP391.3
【相关文献】
1.基于映射排序方法的子域映射算法 [J], 杨宪泽
2.基于本体分割的本体映射算法 [J], 李志明;李善平;杨朝晖;林欣
3.基于k-部排序学习方法的本体映射算法 [J], 兰美辉;高炜
4.基于节点连通性排序的虚拟网络映射算法 [J], 刘少楠; 李玲; 苑迎; 蒋国佳; 王聪;
吕艳霞
5.基于两次优先级排序的虚拟网络映射算法 [J], 朱国晖; 张茵; 刘秀霞; 孙天骜因版权原因,仅展示原文概要,查看原文内容请购买。
本体映射中一种改进的概念相似度计算方法
本体映射中一种改进的概念相似度计算方法
聂规划;左秀然;陈冬林
【期刊名称】《计算机应用》
【年(卷),期】2008(28)6
【摘要】本体映射是实现不同本体之间共享和交流的基础性工作.目前本体映射方法研究的重点主要集中在以自动化或半自动化方式实现映射和提高概念相似度计算的精度.本体映射的关键是不同本体概念间相似度的计算,单一的概念相似度计算方法往往不利于提高相似度的精度.针对以上不足提出了一种改进的概念相似度计算方法,并对其进行详细的描述,其中属性语义相似度计算方法改进了现有的基于属性计算语义相似度的方法,综合了数据类型属性和对象类型属性的语义相似度.经实例验证该方法有效且具有较高的精度.
【总页数】3页(P1563-1565)
【作者】聂规划;左秀然;陈冬林
【作者单位】武汉理工大学,经济学院,武汉,430070;武汉理工大学,管理学院,武汉,430070;武汉理工大学,经济学院,武汉,430070
【正文语种】中文
【中图分类】TP18
【相关文献】
1.一种改进的基于本体概念相似度计算方法研究 [J], 刘影;陈立;宋自林;董庆超;陈兴华;朱卫星;何继贤
2.本体匹配中一种综合概念相似度计算方法的研究 [J],
3.本体映射中一种综合的概念相似度计算方法 [J], 徐茜;彭进业;李展
4.本体映射过程中概念相似度计算方法的改进 [J], 谷志锋;刘勇;郭跟成
5.一种改进的基于加权模型的概念相似度计算方法 [J], 刘欣荣;阳光
因版权原因,仅展示原文概要,查看原文内容请购买。
基于Stacking方法的多策略本体映射
基于Stacking方法的多策略本体映射
夏红科;郑雪峰;胡祥
【期刊名称】《计算机应用研究》
【年(卷),期】2009(026)010
【摘要】将概念相似度的计算问题看做分类问题,提出一种基于Stacking方法的多策略本体映射框架;利用Stacking方法组合多种概念相似度算法,进而提出基于Widrow-Hoff理论的元数据分类算法LMSMC.该框架中,第0层分类器使用各种概念相似度算法对源本体进行分类,第1层分类器使用LMSMC算法对元数据进行分类,从而实现组合多种算法的本体映射.实验表明该方法比单独使用相似度算法在查全率、查准率上均有所提高.
【总页数】4页(P3653-3656)
【作者】夏红科;郑雪峰;胡祥
【作者单位】北京科技大学,信息工程学院,北京,100083;北京信息科技大学,计算机学院,北京,100192;北京科技大学,信息工程学院,北京,100083;北京邮电大学,计算机科学与技术学院,北京,100876;华北电力大学,计算机科学与技术学院,北京,102206【正文语种】中文
【中图分类】TP182
【相关文献】
1.改进的多策略本体映射方法 [J], 李凯;李万龙;郑山红;张亚凤
2.一种自适应的多策略本体映射方法 [J], 孙煜飞;马良荔;周润芝
3.基于概念相似度计算的多策略本体映射方法 [J], 郁书好;苏守宝;刘仁金
4.一种高效的多策略本体映射方法 [J], 姚晓明;王锋;林兰芬;朱晓伟;谢非
5.一种高效的多策略本体映射方法 [J], 姚晓明;王锋;林兰芬;朱晓伟;谢非;
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于FCA的本体映射算法摘要:针对物流机构存在的异构问题,利用信息共享建立一个基于FCA的语义本体原型,其中包括数据服务、本体、元数据等等。
对集中典型的本体映射方法进行分析,根据FCA算法从概念格中获得对应本体,提高本体信息的查询速度、查全率和查询正确率。
关键词:本体;FCA;映射;概念格1 本体的基本概念本体论(Ontology)的概念最初起源于哲学领域,它在哲学中的定义为“对世界上客观存在物的系统地描述,即存在论”,是对客观存在的一个系统的解释或说明,关心的是客观现实的抽象本质。
从内涵上来看,不同研究者对于本体的认识是统一的,本体的概念有下面4层含义:(1)概念化(conceptualization)。
通过抽象出客观世界中一些现象(Phenomenon)的相关概念而得到的模型,其表示的含义独立于具体的环境状态,是一个概念体系,又称为概念模型。
(2)形式化(formal)。
有精确的数学描述,本体具有计算机可读性。
(3)明确化(explicit)。
概念与概念之间的联系及使用这些概念的约束都被明确定义。
(4)共享(share)。
本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集,它所针对的是团体而不是个体。
总之,本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇之间相互关系的明确定义。
本体既包括一个领域内的知识也包括各种领域之间的知识。
2 本体的基本构成从知识工程的研究角度,我们可以把本体表示为如下形式:定义:(本体结构)本体的逻辑结构可以看成一个五元组:O::={C,R,F,A,I},作为本体的核心结构,在具体应用中,五元组的组织如下:C:本体中的概念。
本体中的概念是广义上的概念,它除了包括一般意义上的概念如“物流”、“物流管理”、“运输”等外,还包括货源信息、车源信息、线路信息、查询、运输过程等等。
本体中的这些概念通常按照一定的关系形成一种层次结构。
例如,按照“subclass-of”关系,本体中的概念形成一个分类层次结构。
在复杂的本体中,概念还包括更详细的描述,如概念的定义、性质等描述。
R:概念之间的关系,表示概念之间的一类关联。
如概念之间的“subclass-of”关系、“part-of”关系等。
一般情况下,可以用关系R:C-1×C-2×…×Cn表示概念C-1、C-2、…、Cn之间存在的n元关系R。
一般地,本体中概念之间至少存在以下3类二元关系:继承关系、聚合关系、关联关系,概念和概念中属性之间的关系也是一种关系,称为属性关系。
F:函数。
是一种特殊的关系,其中第n个元素Cn相对于前面n-1个元素是唯一确定的。
函数可以用如下形式表示,F:C-1×C-2×...×Cn-1→Cn。
例如:物流运输中的交通工具、重量是可以唯一的计算运输价格的标准。
A:概念或者概念之间的关系所满足的公理,是一些永真式。
例如:物品的储存量肯定不会超过仓库的最大容量数I:为领域内概念实例的集合。
其中,∮:I→C为概念实例到所属相应概念的映射,概念的实例具有所属概念定义的属性。
3 基于FCA的本体映射算法的实现3.1 FCA体系框架构建本体的关键问题是先确定研究的领域,在领域中找到概念以及概念间的关系,最重要的是先找到所有已知的概念和寻找所有隐含在概念及概念间的关系,而FCA就是能够从给定数据中提取出所有的隐含概念以及概念之间的关系,形成概念模型即概念格,并用符号形式化的方式表现出来,因此,可以采用自下而上的本体建模方式构建FCA体系框架。
如图1所示。
基于FCA 的本体构建步骤如下:①利用自然语言理解技术对收集来的纯文本进行预处理,把本体O-1、O-2和文件集合D作为输入数据,其中文档的概念包含在本体中,从文档中抽取实例,作为返回结果,以正式上下文的形式显示出当前文档中的本体概念,从而形成正式上下文K-1和K-2;②利用概率统计方法,找出关键概念词汇,运用FCA技术使用概念格对本体O-1、O-2进行本体映射;③从概念格转换成相应的本体,可以用概念格中的属性和关系集合R-1、R-2来表示本体概念,获取最终的概念映射。
定义1:一个核心的知识本体O可以表述为一个四元组(C,is-a,R,﹠),其中C是is-a中使用的术语定义的集合,二元偏序关系is-a C ×C,R是概念关系的集合,功能函数&:R→C和分派C上的每个关系队列。
定义2:一个正式上下文(Formal Context)可以由一个三元组K=(G,M,I)表示,其中G是对象的集合,M是对象属性的集合,I G×M是表示G和M之间的二元关系。
(g,m)∈I表示“对象g拥有属性m”。
假设所有的集合都是有限的,尤其是G和M。
由于A G,定义A′:={m∈M|g∈A:(g,m)∈I};由于B M,定义B:={g∈G|m∈B:(g,m)∈I}一个正式概念(Formal Concept )是一对(A,B),其中A G,B M,A′=B,B′=A A代表概念的广度,B代表概念的深度。
子概念-父概念关系表示为(A-1,B-1)≤(A-2,B-2): A-1A-2(等价于B-1B-2)K遵循偏序关系,就可形成一个完全的格子,称为K的概念格,由B-{(k)}表示。
3.2 FCA—Mapping算法FCA 由Wille 于1982 年首先提出的用于概念的发现、排序和显示,所有的概念连同它们之间的泛化、例化关系构成一个概念格。
数学原理FCA的核心是用概念格来表示相关概念之间的继承问题。
(1)语言学上的处理、生成被剪切的概念格和从概念格中获得的相应本体,这三部分构成了FCA算法。
以物流领域的为例,不同的本体来源于WWW上所公布的物流信息本体库。
这是FCA-Mapping的第一步,为每个本体Oi,i∈{1,2}生成正式上下文K-i:=(G-i,M-i,I-i)D被作为对象集合(G-i=D),并且概念集合被作为属性集合(M-i:=C-i)了树,因此生成二元关系Ii就较为困难。
无论文档g是否包含实例m, 关系(g, m)∈Ii都将成立。
(2)生成被剪切的概念格。
这是FCA-Mapping算法的第二步,把两个正式上下文K1和K2作为输入,并把被剪切的概念格作为输出,以便用于下一步的输入。
首先把两个正式上下文融合成一个新的正式上下文K,作从K 中获得被剪切的概念格。
在融合两个正式上下文之前,不得不区分属性集合,因为C1和C2可能含有相同的概念。
令:M′-i:{(m,i)|m∈M}当i∈{1,2}被剪切的概念格可以表示为B[TXX-]-p(K):={(A,B)∈B[TXX-](K)|m∈M:({m}′,{m}″)≤(A,B)}2描述了图1中所举例子的被剪切的概念格。
它由六个正式概念和两个被剪切的概念组成。
被剪切的概念格的计算是用算法TITANIC完成的。
相对于其他的计算概念格的算法,TITANIC有着不可或缺的优势,它可以通过最小生成器来计算出正式概念。
最小生成器是能够生成给定的正式概念的最小属性集。
例如:对于所有的X K且X≠K,当且仅当(K′,K″)=(A,B)和(X′,X″)≠(A,B)同时成立,则K M是正式概念(A,B)的最小生成器。
在应用中,最小生成器有两个用途是它可以表明正式概念在另外的本体中是否会发生映射。
一个概念的势≥2时,它才可能发生映射。
被剪切的概念格如图2所示。
3.3 从概念格中获得对应本体在没有人干预的一般情况下,完全自动地实现本体之间的映射,是很困难的事情。
因为本体内的一些潜在的语义关系并没有以形式化的方式显式地表示出来,必须由人借助已有的知识和经验才能识别出这些信息。
因而,本体映射所用到的匹配方法应该提供一个可能匹配的候选结果列表,然后由人来决定是接受、是拒绝,还是需要改变后再接受。
在此过程中,人还能加入一些系统没有发现的映射关系。
前面提到只有当概念的势≥2时,概念才有可能发生映射。
例如图2中的两个正式概念:最小生成器{ Transportation _1}和{ Logistics information _2}就形成了映射关系。
还有另一种情况,如图2中最小生成器{ Articlel name _1},{ Articlel name _2}和{Inventory_2},它的势虽然是3,但它包括同一本体中的两个概念。
这意味着文档集并没有提供足够的细节来区分这两个概念。
这种情况下,只能用更大的文档集来重新区分这两个概念,即叠代进行本过程。
4 结束语本文主要通过FCA技术进行本体的构建和映射方法,利用FCA生成被剪切的概念格,从概念格中获得对应的本体,实现本体之间的映射查询,提高本体信息的查询速度、查全率和查询正确率。
但是,当数据库中的对象、属性较多时,概念格的相似度算法出现一定难度,所以FCA的概念相似度也是重点研究方向。
参考文献:[1] 邓志鸿,唐世渭,张铭.Ontology研究综述[J].北京大学学报(自然科学版),2002(5).[2] FENSEL.D.The semantic Web and its languages[J].IEEEComputer Society,2000(6).[3] 梁晓涛.基于语义Web的本体映射[C].中国优秀博硕士学位论文全文数据库,2006.[4] GUARINO N,GIARETTA Ontology and Knowledge Bases:Towards a Terminological Clarification[M].In NMars(Ed),Towards very Large Knowledge Bases,ISO Press,1995.[5] 吴昊,邢桂芬.基于本体的信息集成技术研究[J].计算机应用,2005(2).[6] 李景.主要本体构建工具比较研究[J].情报理论与实践,2006(1).[7] 吴振新.RSS元数据在门户网站建设中的应用[J].现代图书情报技术,2004(10).[8] 张瑞玲,白桂梅,徐红升,等.基于FCA的本体构建与合并[J].微电子学与计算机,2008(7).[9] 曹泽文,钱杰,张维明,等.基于FCA的概念相似度计算方法[J].模糊系统与数学,2008(2).。