基于引用内容的引文评价分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于引用内容的引文评价分析1)
刘盛博丁堃
(大连理工大学 WISELab,大连 116023)
摘要:本文提出一种基于引文内容的引文评价分析方法,引文的引用内容可以提供一篇引文被引用的详细
信息,包括了这篇引文为什么被引用,在哪些方面被引用以及具体的引用价值,同时,一篇引文在一篇文
献中被引次数可以体现出这篇引文的被引质量,这些引用内容信息在引文评价分析中具有重要意义。本文
从引用性质和引文质量两个角度介绍引用内容在引文评价中的应用。
关键词:引用内容分析;引文评价;引用质量;引用性质
中图分类号:G353
文献标识码:A
Citation Evaluation Analysis based on Citation Context
Liu Shengbo, Ding Kun
(WISELab, Dalian University of Technology, Dalian 116023) Abstract We propose a citation evaluation analysis method based on citation context. Citation context of a reference may provide the detailed cited information about a citation, including cited reasons, cited aspects and cited values. Meanwhile, the citation frequency of a reference in one paper could reflect the citation quality of the reference. These citation contexts could provide important information for citation evaluation. In this paper, we introduce the application of the citation context from two angles, the quality of the citation and the nature of the citation. Keywords Citation context analysis ,Citation evaluation,Citation quality, Citation nature
1 引言
科学计量学家Zunde在1971年指出,引文分析主要有三方面的应用,1)对科学家、出版物和科研机构进行定性与定量评价;2)探析科学技术演化历程;3)情报信息查找与检索[1]。但使用引文分析对论文进行评价时,人们通常只从论文的被引频次角度来分析,最简单的方法是采用论文的总被引频次来评价,而影响因子[2]和H指数[3]方法也是基于文献的被引次数来评价。在引文评价研究中,我国较多学者都对引用频次评价方法进行了改进,纪雪梅等人[4]采用社会网络分析方法中的Bonacich权力指数来对引文进行评价,通过这个指标来判定同一期刊发表文献的质量和影响力。宋歌[5]也提出将社会网络分析方法应用于引文评价,从引文网络的构成、性质、内涵和元认识的角度论证社会网络分析方法在引文分析中的适用性,进而改进传统的引文评价方法,补充评价指标。王向阳和马军[6]借鉴了PageRank
作者简介:刘盛博,男,1983年生,大连理工大学科学学与科技管理专业博士研究生,研究方向为:知识计量。E-mail:liushengbo1121@。
丁堃,女,1962年生,大连理工大学人文社会科学学院教授,研究方向为:学科知识管理与创新管理。
1本文得到国家自然科学基金(61272370),高等学校学科点专项科研基金(博导类)(20110041110034)
的资助。
算法,在对引文评价时考虑了引文的发表机构、作者权威性、被引频次和发表时间等因素。王凌峰和张泽玺[7]提出Hi指标对引文网络中的单篇引文进行评价,首先对引文网络进行层次划分,其次采用变异系数法对不同层次中的引文进行赋值,最后得到单篇引文的评价分值。虽然这些方法都从不同角度揭示了引文的价值,但主要还是通过引文的被引频次和引文在引文网络中的作用来评价,都没有深入到引文的引用内容。所谓引用内容指的是文献中引用参考文献的句子。例如,句子“This comparison is made using BLASTX [18]”就是参考文献[18]的引用内容,人们也可以把这个句子前后的句子也作为引用内容。
White[8]指出引用内容主要有三个方面的应用,分别是对引文进行分类、对引用内容分析和引用动机识别。引用内容信息包括了一篇引文在施引文献中被引用的位置、在一篇施引文献中被引的次数以及作者是如何引用这篇引文的。这些信息都可以直接用于引文评价分析。
Anderson[9]在2010年利用引用内容,分析了组织学习领域中Walsh和Ungson发表的一篇经典文章,分析结果包括了这篇文章中具体的哪些知识被人们引用了,哪些知识对以后研究具有重大影响以及哪些知识被人们所批判,这些分析结果都是对这篇经典文献的综合评价,而这些评价结果往往不能通过引用频次来揭示。我国学者也从定性角度提出采用引用内容来对引文进行评价,王岚[10]和赵青[11]都基于引用内容,调查分析了文学学科中引文的引用性质和引用深度,其中引用性质包括正面引用、中性引用和负面引用,引用深度包括深度引用、中度引用和浅度引用。陈晓丽[12]提出采用引文力度和引文深度角度对引文进行评价,其中引文力度指标主要通过分析引用内容来获取,引用深度指标是根据引文表面被引次数来决定的,所谓表面被引次数指的是一篇引文在同一文献中被反复引用的次数。引文表面被引次数实际上也是需要深入文献内容才可以获取的,它所揭示的是一篇引文与施引文献的相关程度,本文将其作为一个引文质量评价指标来研究。
虽然人们已经知道引文的引用内容可以提供与引文最直接、最相关的信息,它在引文评价中具有重要价值,但很少有人直接应用这个信息来评价引文价值。其中一个重要原因是数据库不够完善,人们很难获得一篇引文的所有引用内容。早期对引文内容研究主要采用手工方式来抽取引用内容相关信息,例如O' Connor [13, 14]在做引用内容研究时,通过手工抽取出引用内容中的单个词来对其进行研究。近些年来,有些数据库中提供了全文信息,例如CiteSeer和PubMed Central,为引用内容研究提供良好的数据基础。本文将以PubMed Central 数据库中的全文数据为基础,研究引用内容在引文评价中的而应用。
在自然科学领域,一些评价体系已经对引文数据提出了要求。如国家自然科学奖评价指标中明确规定“主要学术思想和观点被他人认可的情况是指他人在正式发表的科学论文、专著、教材中正面引用完成人提出的学术思想、观点、方法,或被有关实验、实践所证实的情况[15]”;教育部高等学校科学技术奖评价指标体系中的“高等学校自然科学奖评价指标”直接将指标定义为“论文被他人正面引用的情况”,并以“正面引用,不含负面引用和自引”,