国内知识图谱研究综述与评估20042010年

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

国内知识图谱研究综述与评估:2004-2010年

*

汤建民/余丰民

2012-9-21 10:11:12 来源:《情报资料工作》2012年01期【英文标题】Review and Evaluation of Knowledge Mapping Research in China: 2004-2010

【作者简介】汤建民,男,1967年生,浙江树人大学科学计量学研究中心主任、教授,杭州310015;余丰民,1976年生,浙江树人大学图书馆副研究馆员,杭州310015

【内容提要】文章综合运用词频统计、共词分析及可视化技术等文献计量方法,分析了国内知识图谱研究的整体现状,包括论文的总量分布、发表期刊分布、作者分布、机构分布、基金资助分布及论文研究热点等,并综合归纳了论文研究的主要内容。在此基础上,对该研究领域的现状和存在的问题进行了综述和评估,并提出了相应的对策。

This paper combines word frequency analysis, co-word analysis and visualization to demonstrate the general situation of knowledge mapping study in China. The authors discuss the distribution of papers, published journals, authors, organizations and funds as well as the focus of the existing papers and sum up main contents of the study. On this basis, the paper reviews and evaluates the status of the research and its existing problems, puts forward relevant counter-measures.

【关键词】知识图谱/文献计量/可视化/词频统计/共词分析mapping of knowledge/bibliometric/visualization/word frequency

statistics/co-words analysis

1、研究目的和意义

知识图谱(Mapping of Knowledge)是显示科学知识的发展进程与结构关系的一种图形[1],是当今科学计量学、信息计量学、文献计量学以及情报计量学等学科共同关注的前沿学术领域之一。由于知识图谱方法能较直观地解读人类知识,有利于隐性知识的挖掘,目前已被广泛应用于人文社会科学与自然科学领域。

有关知识图谱的由来,陈悦博士和刘则渊教授认为,科学知识图谱的产生同绘图学和地图学有一定关系[1]。据有关文献介绍,早在20世纪70年代,美国国家基金会就出版了关于科学基金的地理分布报告,这被认为是国外最早研究知识地图的文献之一[1]。此后,知识地图在大量基于数据库的绘制工具推动下,突破了仅描述知识地理分布的局限,逐渐发展成为内涵更加丰富的知识图谱。2003年,美国科学院组织的“知识图谱测绘”(Mapping Knowledge Domains)大会的召开则标志着专家们对知识图谱绘制开始了大规模的深入研究。在该会议上,来自不同领域的专家发表了20多篇学术论文,介绍了有关知识图谱的最新研究成果[1]。自此以后,知识图谱领域的学术研究逐渐兴起。

在国内(大陆地区),大连理工大学是较早地(约2004年)从科学计量学的视角引进“科学知识图谱”方法的研究机构,他们在此领域已经开展了大量研究并取得了较为丰富的成果,为推动国内该领域的研究做出了很大的贡献[2]。在他们的影响下,国内参与该领域研究的人员和研究机构、发表的论文和应用的

领域越来越多,呈现出日益繁荣的局面。但是,由于国内开展这方面研究的时间不长,误用、错用、盲目使用等情况也时有出现,并已经引起有关学者的一些疑问和忧虑[3]。我们认为,基于近年知识图谱领域的已有研究,分析其现状、明确其问题、考察其趋势、提出其对策,即对该领域的已有研究进行一次“科学学”视角的回顾性、反思性考察研究已经提上日程。

通过查阅文献,我们发现,除了任红娟、张志强已经对国外知识图谱的研究状况进行了文献计量分析[4],以及廖胜姣[5]、秦长江[6]、梁秀娟[7]等对国内知识图谱方法的研究作了一些定性为主的综述外,到目前为止,还没有文献对国内知识图谱领域的所有研究论文进行过系统的、定量为主的综述,特别是没有对2009年,2010年的相关文献进行过综述和评估,而这两年又恰是国内发表知识图谱论文数量激增、最能反映国内目前研究水平的一个时间段。鉴于此,本文拟为弥补此缺憾而作。本文研究的主要内容是:国内知识图谱领域的研究总体上达到什么样的程度,主要的研究机构有哪些,主要的研究学者有哪些,近年的研究热点是什么,存在的问题主要有哪些,今后的发展趋势怎样等,以期对该领域相关研究工作的进一步开展能有所帮助。

2、研究方法与数据收集

学术期刊作为科研成果的重要发布渠道,是科研工作者的首选,因此本文选择国内收录期刊较全的数据库——CNKI中国学术期刊网络出版总库作为数据源。

为尽量收齐样本,本文确立了“先粗后精、先大后小”的取样策略。具体方法是:先选择“知识图谱”、“知识地图”、“可视化”和“社会网络分析”等

作为检索词,以“篇名或关键词”为途径分别进行检索,检索时间为2004-2010年,共检索出6641条记录(检索时间:2011年2月20日),输出的题录字段有“篇名、作者、作者单位、关键词、基金项目、摘要、刊名、发表年、第一作者”共9项。由于绝大多数论文并非属于文献(科学)计量学知识图谱研究领域,为此又对这些论文进行严格的人工筛选,最后确认264篇论文作为本文文献计量研究的数据样本。

本文研究的主要方法是:先用词频统计以及基于共词分析的可视化知识图谱等文献计量方法研究论文的产出结构和研究热点,然后通过逐篇阅读重要论文,运用内容分析法来分析论文的主题、内容、方法和研究进展等,最后归纳分析得出结论。

3、论文产出结构分析

论文总量分布

对264篇论文的年度分布统计表明,最早的相关论文是2004年由中山大学信息管理系胡利勇和陈定权发表在《情报杂志》第11期的《引文分析可视化研究》。该文认为,引文网络可以通过聚类的分析方法,用直观的网络图形式显示出来。很明显,文中的“网络图”便是后来称为科学知识图谱的一种。2005年,该领域论文共有6篇,其中大连理工大学的陈悦和刘则渊合著的《悄然兴起的科学知识图谱》一文在国内首次使用了“科学知识图谱”一词。2006年以后,论文数量有较快的增长,到2010年已达到年发文百篇以上的规模(因CNKI数据录入有滞后现象,实际数量应该超过100篇)。

相关文档
最新文档