大数据背景下知识融合研究综述
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本文通过对当前知识融合领域的相关文献期刊进行分析, 并分别从知识融合的理论结构、融合算法、学科或领域间的交 互应用等方面进行归纳总结,并对知识融合的未来发展提出了 展望,以期为知识服务的相关研究提供一些借鉴和参考。
1、知识融合的研究概况
我们在中国知网数据库中,限定主题词为“知识融合”进 行模糊检索,结果得到文献总数5732篇。再对检索结果进行可 视化计量分析。由此得到图1的知识融合共现图谱。
上述观点主要是对知识融合的内涵进行归纳总结,此外还 有对知识融合的体系构架的描述,例如著名的KRAFT理论,此 理论的重点在于描述知识融合相关元素和它们之间的关系以及 各元素之间的相互作用等。A.Nikolov等人提出了知识融合系统 KnoFuss,该系统提供了面向子任务的方法,而且可以从中选择 更为正确的方法。 Nhomakorabea66
A.Preece关注知识融合过程中的三个要素,即如何去定位知 识,提取知识,对知识进行转换。最后再对获取到的结果进行 融合利用,解决实际问题。而另一位学者A.Smirnov则认为“知 识融合的目标是产生新的知识,将松耦合来源的知识集成,从 而构成一个合成资源,用来弥补不完全的知识[2]”,该观点与 A.Preece所提观点又有所不同,体现在知识融合的结果不同, 前者是为了弥补不足的知识,后者则是着重于解决问题。
知识融合是一门交叉学科,它通过对多元异构的分布式知 识进行组织提取,以知识需求作为最终目的对知识进行转化融 合等过程,从而获取高效、高价值的新知识。自20世纪90年代 以后知识融合概念进入学术界以来,国内外的众多学者对知识 融合问题开展了多方面的研究,综合现阶段的知识融合领域相 关文献,可以发现当前的研究重点主要在融合算法和体系建设 两方面。知识融合的相关文献在不断的增长,但还未有一个相 对全面的的研究综述和系统归纳。
图1 知识融合共现图谱 通过图1的共现图谱,我们可以发现大数据,知识服务,知 识融合,知识表示这四个主题之间联系密切。知识融合作为知识 管理的主要内容,已经成为知识管理中极其重要的一个环节,对 于实现知识的有效利用有着重要作用。而数据到信息再到知识这 一过程则体现了前三者之间的相互依存关系,缺一不可。 在关键词分布中,我们可以发现在本主题中用知识融合做 关键词的文献所占比重高居所有结果中的第二位,这说明知识 融合已经是融合领域特别是知识学科的一大研究热点。再从学 科分布情况来看,知识融合涉及到的学科众多,分布广泛,在 教育学和图书情报学领域研究较多,也同样是这两个学科的研 究热点之一。
3、知识融合的关键技术
3.1 融合算法 在知识融合的过程中,如何运用相关技术对知识进行提取 整合是极其重要的一步。在语义规则方面,E.Gregoire在逻辑 规则中引入一种新的语义规则来融合异源知识,这种方式在于 处理相互冲突或不完整的信息,并减少对于融合公式的遗漏。 在贝叶斯网络方面,E.Santos将数学概率模型作为贝叶斯理论 的基础,从而提出融合算法。这主要有三个过程,即概率获 取、融合处理和最佳决策。D-S理论又被称为证据组合理论,它 是对贝叶斯论的进一步发展,结果可以直接表示为“不知道” 或“不确定”。今天学界广泛使用的理论是由Dempester所提 出的并做了进一步完善。该理论通过获取不同结果间的信任函 数,再根据所提供的组合规则将所得函数融合,最后来判断组 合后的函数,以此来确定最优决策。模糊集理论建立在证据理 论知识基础上,进一步放宽了概率论方法的限制条件。模糊集 理论的方法可以处理不精确的知识,对开放网络知识的评估非 常有效。 此外,在国内的关键技术研究中扩展到了交叉学科。例 如,缑锦提出基于遗传算法的知识融合算法;蒋黎黎等提出基 于粒度计算理论的知识融合模型。由此可见,国内对于知识融 合算法更为具体和广泛,也有了一定程度的综合运用,但主要 还停留在理论层面,并未进行更为深层的发掘。 3.2 框架与模型 国内学者徐赐军、李爱平等提出了基于本体的知识融合框 架,有利于控制知识融合结果的规模,提高了知识的语义相关 性和准确度。其中涵盖了如何构造元知识集、确定测度指标、 设计算法和反馈处理等核心功能。此外,林海伦、王元卓等以 开放知识网络OpenKN作为网络大数据知识统一表示和计算的 框架,总结了面向大数据背景的知识融合框架模式[3]。该框架 自下而上包含数据收集、知识获取和知识融合功能。 通过上述分析,我们发现建立一个合适高效的知识融合 框架有利于管理知识融合的结果,提高知识的语义相关性,除 此之外还能通过相关的评价方法获取更为精准的知识,从而构
2、知识融合的理论发展
在大数据背景下,知识的内容和来源极其丰富多样,多元 化的知识具有更加广泛的深度,也因此更难以利用处理。但通 过知识融合的相关理论方法却可以对其进行提取和利用,从而 构建一个更为完整且可信度更高的知识体系,而提升知识服务 的整体质量。但因为各学科对这一新兴概念的解释存在着不同 的立场,含有一定的学科特色,所以到目前为止,学术界对知 识融合这一概念并没有形成一个相对统一的定义或解释。
通过以上分析,虽然各个学者对于知识融合有着不同的看 法和出发点,但其本质都是一样的,都是为了使知识最大化程 度利用。据此,我们认为,知识融合就是在大数据背景下,从 异构数据源出发,运用语义规则等相关技术,对知识进行获取 和转换以得到其中的相关关系,并由此创造出新知识,用以解 决知识服务所面临的各种问题。
大数据背景下知识融合研究综述
文/高国伟 梁力琛 李永先 郭琪
摘要:网络大数据中包含着海量的知识资源,这些资源在 知识服务的过程中发挥着极其重要的作用。如何从多源异构的 海量数据中准确地提取知识并加以有效利用成为当前知识服务 的热点问题。本文以当前大数据背景下知识融合研究现状为出 发点,对当前知识融合领域内的相关文献资料进行分析,从传 统的知识融合的理论结构、关键技术、学科或领域间的交互运 用入手,归纳并总结知识融合的理论方法与框架模型,从而探 讨大数据环境背景下的知识融合研究的新进展以及对未来做出 展望,同时在此基础上进行评述,以期为该领域更为深入的发 展提供参考。
关键词:大数据;知识融合;知识服务
伴随着互联网技术的不断普及和创新,大数据时代逐渐 走进我们的视野。大数据不仅是一种实用性很强的分析工具, 而且也是一种重要的思维方式。但大数据为我们带来许多积极 影响的同时也面临着众多亟待解决的问题。在大数据背景下, 知识库的容量不断被丰富,如何让所得知识得到最大化利用就 成为了现阶段知识学科需要面对的头等问题。为了突破这个难 点,相关知识领域的专家学者提出了“知识融合”这一概念并 对其进行了深度研究。不断地促进和发展相关理论与技术,从 而达到解决问题的目标。
国外学者A.Preece认为知识融合“是从多种异构源中定 位并获取知识且对所获知识进行转换的过程,从而可以将这种 结果运用于相关知识问题的求解。[1]”在这个结论中我们发现
★基金项目:1.辽宁省社会科学规划基金项目(L16BTQ006)面向大数据的知识元方法与知识融合体系研究。 2.辽宁省教育科学“十三五”规划立项课题(JG17DB295)大数据环境下新兴专业知识融合与创新研究。
1、知识融合的研究概况
我们在中国知网数据库中,限定主题词为“知识融合”进 行模糊检索,结果得到文献总数5732篇。再对检索结果进行可 视化计量分析。由此得到图1的知识融合共现图谱。
上述观点主要是对知识融合的内涵进行归纳总结,此外还 有对知识融合的体系构架的描述,例如著名的KRAFT理论,此 理论的重点在于描述知识融合相关元素和它们之间的关系以及 各元素之间的相互作用等。A.Nikolov等人提出了知识融合系统 KnoFuss,该系统提供了面向子任务的方法,而且可以从中选择 更为正确的方法。 Nhomakorabea66
A.Preece关注知识融合过程中的三个要素,即如何去定位知 识,提取知识,对知识进行转换。最后再对获取到的结果进行 融合利用,解决实际问题。而另一位学者A.Smirnov则认为“知 识融合的目标是产生新的知识,将松耦合来源的知识集成,从 而构成一个合成资源,用来弥补不完全的知识[2]”,该观点与 A.Preece所提观点又有所不同,体现在知识融合的结果不同, 前者是为了弥补不足的知识,后者则是着重于解决问题。
知识融合是一门交叉学科,它通过对多元异构的分布式知 识进行组织提取,以知识需求作为最终目的对知识进行转化融 合等过程,从而获取高效、高价值的新知识。自20世纪90年代 以后知识融合概念进入学术界以来,国内外的众多学者对知识 融合问题开展了多方面的研究,综合现阶段的知识融合领域相 关文献,可以发现当前的研究重点主要在融合算法和体系建设 两方面。知识融合的相关文献在不断的增长,但还未有一个相 对全面的的研究综述和系统归纳。
图1 知识融合共现图谱 通过图1的共现图谱,我们可以发现大数据,知识服务,知 识融合,知识表示这四个主题之间联系密切。知识融合作为知识 管理的主要内容,已经成为知识管理中极其重要的一个环节,对 于实现知识的有效利用有着重要作用。而数据到信息再到知识这 一过程则体现了前三者之间的相互依存关系,缺一不可。 在关键词分布中,我们可以发现在本主题中用知识融合做 关键词的文献所占比重高居所有结果中的第二位,这说明知识 融合已经是融合领域特别是知识学科的一大研究热点。再从学 科分布情况来看,知识融合涉及到的学科众多,分布广泛,在 教育学和图书情报学领域研究较多,也同样是这两个学科的研 究热点之一。
3、知识融合的关键技术
3.1 融合算法 在知识融合的过程中,如何运用相关技术对知识进行提取 整合是极其重要的一步。在语义规则方面,E.Gregoire在逻辑 规则中引入一种新的语义规则来融合异源知识,这种方式在于 处理相互冲突或不完整的信息,并减少对于融合公式的遗漏。 在贝叶斯网络方面,E.Santos将数学概率模型作为贝叶斯理论 的基础,从而提出融合算法。这主要有三个过程,即概率获 取、融合处理和最佳决策。D-S理论又被称为证据组合理论,它 是对贝叶斯论的进一步发展,结果可以直接表示为“不知道” 或“不确定”。今天学界广泛使用的理论是由Dempester所提 出的并做了进一步完善。该理论通过获取不同结果间的信任函 数,再根据所提供的组合规则将所得函数融合,最后来判断组 合后的函数,以此来确定最优决策。模糊集理论建立在证据理 论知识基础上,进一步放宽了概率论方法的限制条件。模糊集 理论的方法可以处理不精确的知识,对开放网络知识的评估非 常有效。 此外,在国内的关键技术研究中扩展到了交叉学科。例 如,缑锦提出基于遗传算法的知识融合算法;蒋黎黎等提出基 于粒度计算理论的知识融合模型。由此可见,国内对于知识融 合算法更为具体和广泛,也有了一定程度的综合运用,但主要 还停留在理论层面,并未进行更为深层的发掘。 3.2 框架与模型 国内学者徐赐军、李爱平等提出了基于本体的知识融合框 架,有利于控制知识融合结果的规模,提高了知识的语义相关 性和准确度。其中涵盖了如何构造元知识集、确定测度指标、 设计算法和反馈处理等核心功能。此外,林海伦、王元卓等以 开放知识网络OpenKN作为网络大数据知识统一表示和计算的 框架,总结了面向大数据背景的知识融合框架模式[3]。该框架 自下而上包含数据收集、知识获取和知识融合功能。 通过上述分析,我们发现建立一个合适高效的知识融合 框架有利于管理知识融合的结果,提高知识的语义相关性,除 此之外还能通过相关的评价方法获取更为精准的知识,从而构
2、知识融合的理论发展
在大数据背景下,知识的内容和来源极其丰富多样,多元 化的知识具有更加广泛的深度,也因此更难以利用处理。但通 过知识融合的相关理论方法却可以对其进行提取和利用,从而 构建一个更为完整且可信度更高的知识体系,而提升知识服务 的整体质量。但因为各学科对这一新兴概念的解释存在着不同 的立场,含有一定的学科特色,所以到目前为止,学术界对知 识融合这一概念并没有形成一个相对统一的定义或解释。
通过以上分析,虽然各个学者对于知识融合有着不同的看 法和出发点,但其本质都是一样的,都是为了使知识最大化程 度利用。据此,我们认为,知识融合就是在大数据背景下,从 异构数据源出发,运用语义规则等相关技术,对知识进行获取 和转换以得到其中的相关关系,并由此创造出新知识,用以解 决知识服务所面临的各种问题。
大数据背景下知识融合研究综述
文/高国伟 梁力琛 李永先 郭琪
摘要:网络大数据中包含着海量的知识资源,这些资源在 知识服务的过程中发挥着极其重要的作用。如何从多源异构的 海量数据中准确地提取知识并加以有效利用成为当前知识服务 的热点问题。本文以当前大数据背景下知识融合研究现状为出 发点,对当前知识融合领域内的相关文献资料进行分析,从传 统的知识融合的理论结构、关键技术、学科或领域间的交互运 用入手,归纳并总结知识融合的理论方法与框架模型,从而探 讨大数据环境背景下的知识融合研究的新进展以及对未来做出 展望,同时在此基础上进行评述,以期为该领域更为深入的发 展提供参考。
关键词:大数据;知识融合;知识服务
伴随着互联网技术的不断普及和创新,大数据时代逐渐 走进我们的视野。大数据不仅是一种实用性很强的分析工具, 而且也是一种重要的思维方式。但大数据为我们带来许多积极 影响的同时也面临着众多亟待解决的问题。在大数据背景下, 知识库的容量不断被丰富,如何让所得知识得到最大化利用就 成为了现阶段知识学科需要面对的头等问题。为了突破这个难 点,相关知识领域的专家学者提出了“知识融合”这一概念并 对其进行了深度研究。不断地促进和发展相关理论与技术,从 而达到解决问题的目标。
国外学者A.Preece认为知识融合“是从多种异构源中定 位并获取知识且对所获知识进行转换的过程,从而可以将这种 结果运用于相关知识问题的求解。[1]”在这个结论中我们发现
★基金项目:1.辽宁省社会科学规划基金项目(L16BTQ006)面向大数据的知识元方法与知识融合体系研究。 2.辽宁省教育科学“十三五”规划立项课题(JG17DB295)大数据环境下新兴专业知识融合与创新研究。