科学知识图谱在学科评价中的应用研究[开题报告]

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(2011届)

本科毕业论文(设计)

开题报告

题目:科学知识图谱在学科评价中的应用研究学院:商学院

专业:信息管理与信息系统

班级:

学号:

姓名:

指导教师:

开题日期:

一、选题的背景、意义

1.该选题的历史背景及国内外现状

科学知识图谱,是将传统的文献计量方法与现代的文本挖掘和复杂网络、数学、统计学、计算机科学方法以及可视化技术等有机地整合在一起的一种综合分析科学发展的知识发现方法。从20世纪 50年代至今,科学知识图谱的研究已经有几十年的历史。

(1)引文分析理论的发展促进了科学知识图谱的兴起。20世纪60年代,加菲尔德(Eugene Garfield)创办科学引文索引 (SCI)。1965年,普赖斯以SCI为数据来源,发表了一篇科学计量学的杰作《科学论文的网络》。在这篇论文中,普赖斯第一次提出并界定了“研究前沿”的概念。到了20世纪70、80年代,匈牙利的三位学者T.布劳温 (Tibur Braun)、W.格伦采尔 (Wolfgang Glanze1)和A.舒伯特 (Andres Schubert)以SCI数据库为基础,出版了《科学计量学指标》,这实际上是世界科学地图和科学知识图谱的雏形。

(2)复杂网络系统和社会网络分析的兴起丰富了引文分析理论与方法。美国社会心理学家斯坦利·米尔格兰姆(Stanley Milligram)于1967年通过社会网络人际关系的“六度分隔”试验发现了著名的“小世界”现象。90年代中期,比利时情报计量学专家埃格赫 (Leo Egghe)和鲁索 (Ronald Rousseau)合作出版了《情报计量学引论》,促进了科学知识图谱的产生。进入21世纪,社会网络分析的探索与应用向纵深发展,风靡全球。

(3)信息可视化为科学知识图谱提供了强大的技术支持。1999年陈超美出版了该领域的第一部学术专著《信息可视化与虚拟环境》,R.斯宾塞 (Robert Spence)2000年出版了《信息可视化》之后相关研究如雨后春笋般涌现。

总体来讲,无论是企业还是科研领域,我国对知识图谱的关注滞后于国外。相比国外知识图谱的研究状况,我国起步稍晚,但是也取得了一些成绩。国内在知识图谱的应用方面缺少理论上的实证分析,主要是将知识图谱作为一个工具,应用于各个领域,而且相对于国外,应用研究还比较薄弱。目前而言,国内知识图谱研究中存在主要困难和问题如下:

(1)研究手段和方法的严重滞后

国内近几年有关知识图谱的研究也有一些,如大连理工大学的刘则渊教授带领的团队进行了科学计量学、管理学人机工程学学科以及国内所有工程领域研究前沿的知识图谱构建;武汉大学的马费成、刘青林、社科院的蒋颖等也对国内外知识管理、数字资源管理、战略管理、文献计量学等领域进行了共词图谱的绘制;南京大学的邓三鸿、浙江大学的潘有能等初步建立了图书情报学科的学科知识地图;金莹以CSSCI 数据粗略构建了我国社会科学的学

科知识地图;中科院、中信所的研究人员也进行了研究。但几乎所有的研究都是采用传统的多元统计分析方法(因子分析、多维尺度分析和聚类分析),最先进的就是使用了Pajek软件。截止2008年5月,国内文献分别仅有一篇使用了PFNET算法另一篇运用了最新的商用软件Thomson Data Analyzer对人类基因组领域进行共词图谱绘制的实例。

(2)研究层次低

对一些比较先进的技术(算法、软件)更多的都是理论上的探讨和介绍,国内对HistCite、CitespaceII、PFNET、SOM、潜在语义分析和最小生成树算法都有零星的介绍,但很少进行实际的试验研究。这可能与相关软件获取比较困难、有些是商用软件,研究经费缺乏等有关。

(3)研究对象范围过窄

目前国内知识图谱构建研究的领域都是范围很窄的某一学科方向的国际化研究,数据来源一般都选自SCI、SSCI等大型英文引文数据库,很少一部分选自中国的引文数据,而文献报道国内开发成功的两个共现系统却没有任何实证研究的报道,这些都阻碍了知识图谱这一先进方法在国内的发展。这一现象产生的原因是中国目前已有的引文数据库系统提供的检索入口和数据套录功能很有限,用户很难获取大量的原始数据,从而影响了研究的积极性。2.国内外应用技术及发展趋势

科学知识图谱有极为广泛的应用,在科技决策、技术预见及关键技术选择中的应用可概括为以下方面:①应用于识别学科研究前沿,分析学科进展及发展趋势;②确定研究的热点课题、技术方法、学科分布和应用领域及发展趋势;③考察特定领域内科学研究主题的变迁,预测技术发展趋势,实现技术跟踪的可视化;④分析学科或领域内不同研究者的相互关系,以及学科或领域之间的交互关系;⑤测度当前研究的影响,提供突发技术的早期预警,对技术发展的优先性进行排序;⑥分析学科或领域内的核心作者群,分析某国或某机构的科研水平与地位。另外,科学知识图谱用作科学管理的工具,可以被用来评价期刊、科学家、机构或社团在研究中的角色;确定期刊与期刊之间、期刊和研究领域之间的关系;测度当前研究的影响;向社会提供有关重要的、新的交叉学科关系的早期预警;认定进展突然加速的研究领域以及确定导致重大科学进步的进展次序。可见,科学知识图谱具有很强的预见性和前瞻性,这与技术预见的理念和假设不谋而合,将科学知识图谱的方法与技术预见相结合有其理论依据。

科学知识图谱的应用离不开引文分析和可视化技术。近年来,随着计算机技术的迅猛发展及应用,引文分析和可视化领域都取得了长足的进步,许多新的技术被广泛应用于文献、

专利、基因图和其他信息类型的可视化分析,产生了许多新的研究成果,为科学知识图谱的绘制提供了新的、可靠的理论、方法和技术支持。其中最引人注目的是数据可视化、信息可视化和引文分析可视化及其应用研究。将引文分析可视化和科学知识图谱的重要应用前景展现在人们眼前,倍受信息管理界、科学界和科研管理界的关注和青睐。

二、研究的基本内容与拟解决的主要问题

1.主要内容:

(1)科学知识图谱的起源及发展:通过网络调查、文献分析,了解科学知识图谱的有关概念、工作原理,所使用的基本参数及含义,以及科学知识图谱的起源、当前的发展。

(2)当前科学知识图谱的主要研究内容:分析国内外经典的科学知识图谱资料,对科学知识图谱的研究内容、数据格式要求、研究角度、研究工具、不同角度所揭示的不同含义等进行研究。

(3)科学知识图谱应用于学科评价的实例分析:查找中文文献,特别是具体的案例分析,研究在中文领域内科学知识图谱在学科评价中的应用与发展。

(4)总结:对前期的研究进行分析总结,提出当前国内研究中科学知识图谱用于学科评价时的优点与不足,提出进一步研究应注意的事项等。

2.拟解决的主要问题:

了解科学知识图谱基本定义、工作原理、应用情况,对科学知识图谱的研究内容、研究角度、研究工具、不同角度所揭示的不同含义等进行研究,并能将科学知识图谱应用于学科评价的实例进行分析。

三、研究的方法与技术路线、研究难点,预期达到的目标

1.研究方法及技术路线

科学知识图谱是可视化显示知识资源及其关联的一种图形,可以绘制、挖掘、分析和显示知识间的相互关系,在组织内创造知识共享的环境,从而最终达到促进知识交流和研究深入的目的。研究发现,科学引文与被引文之间往往有着学科内容上的联系。通过引文聚类分析,特别是从引文间的网状关系进行研究,能够探明有关学科之间的亲缘关系和结构,划定某学科的作者集体,分析推测学科间的交叉、渗透和衍生趋势,还能对某一学科的产生背景、发展概貌、突破性成就、相互渗透和今后发展方向进行分析,从而揭示科学的动态结构

相关文档
最新文档