多维视域下高水平论文特征分析——以生命科学领域为例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多维视域下高水平论文特征分析
——以生命科学领域为例
倪四秀亓永康
(江苏师范大学图书馆,江苏徐州221116)
[摘要]高水平论文是在学术交流活动中产生高学术影响力的研究成果,通过对高水平论文特征及影响力分析揭示研究热点与趋势,能更好地服务于科研实践。
选取ESI的生命科学领域高水平论文,采用文献计量、统计分析、对比分析等方法,从宏观层面整体解读生命科学领域高水平论文发文特征,从微观角度剖析解读高水平论文被引特征与合作特征。
生命科学领域的高水平论文数量呈指数增长,表明生命科学研究持续升温;美国在生命科学研究中占有绝对优势,中国正逐步缩小差距;论文的开放获取和基金资助与高水平论文取得高学术影响力之间存在正向关联;广泛的国际合作在科研活动中是普遍存在的,中国在合作网络中占有重要地位。
[关键词]ESI高水平论文生命科学引文特征合作网络
[分类号]G252.8
1引言
学术论文作为科学研究正式交流最主要的介
质,在科学研究与科学交流中扮演着不可替代的
角色。
高水平论文是指具有重要学术价值,一定
程度上反映某一研究领域的前沿与热点的学术论
文。
本研究中高水平论文包括ESI数据库中近十
年内各学科每年论文被引次数居前1%的高被引
论文,以及近两年内以每两个月为单位被引次数
居前0.1%的热点论文[1]。
目前,有关学术论文特征及其影响力的研究
受到各界学者的广泛关注。
Garfield[2]在1955年提
出通过论文的被引频次衡量论文的影响力,Kos⁃mulski[3]对论文被引频次与引用文献做对比分析,将论文被引频次大于其参考文献数的论文定义为
成功论文;Bornmann L.等[4]通过对科学家引证行为
的研究表达了对被引频次的质疑,发现论文引证
行为受多方面因素的影响。
Xiaojun Wan等[5]研究
证实了参考文献的重要性,提出了引用强度概念
以衡量学术论文参考文献的影响力。
Shao,W[6]指出学术论文影响力的评价是科研管理的重要内
容,建立综合的学术论文影响力评价体系,才能客
观、直接地实现影响力评价社会性和动态性。
在国内,主要针对SCIENCE、NATURE等最顶
级期刊刊载论文,采用文献计量方法,从期刊[7]、研
究领域[8]、研究机构[9]等维度对顶级期刊论文刊载
和引用的特征进行深入分析。
梁帅等[10]以我国F5000论文为对象,从关键词维度,综合分析了优秀论文在创新、内容等方面的特征;周晓英等[11]针
对我国图书馆学和情报学最高被引的100篇论文
的内部与外部特征进行对比分析;刘武英等[12]以编
辑出版类核心期刊为对象,揭示了零被引论文与
期刊的H指数、影响因子之间的密切相关性。
生命科学已经发展成为21世纪最活跃的学科
之一,成为自然科学的前沿学科[13]。
SCIENCE评选
的十大突破中过半数与生命科学研究直接相关[14],
被誉为“科学界奥斯卡”的“科学突破奖”将生命科
学设为三大突破奖之一。
李克强总理对“2018世
界生命科学大会”作出重要批示,强调“要深入交
流、凝聚共识、加强协作,推动生命科学研究和技
术创新取得更多突破”[15]。
当前在顶级期刊中也刊载有多篇关于生命科学研究方法的突破[16]与生命科学领域研究最新进展[17]的成果,有学者从文献计量学视角研究了生命科学领域论文特征,发现了该研究领域的论文开放获取比率最高[18],也有学者以生命科学为样本基于B-SFA对基金资助做分析[19]。
笔者以生命科学为例,从发文特征、引文特征、合作特征等多维视角,分析高水平论文的传统影响力产生与分布特征,以便为进一步增强该领域研究成果影响力提供依据。
2研究路径
笔者以ESI数据库的高水平论文为数据源,在ESI数据库中检索限定学科为生命科学领域所包含的4个学科:生物与生化、环境/生态学、微生物学、分子生物与遗传学,得到2008年1月1日至2018年8月31日的生命科学领域Top Papers(高水平论文)共计19125篇,筛选去除没有DOI信息的文献数据,得到有效数据19080条;以19080条文献DOI号分别在Web of Science核心合集中匹配到相应的文献,检索匹配得到其中19057条文献的标题、作者、来源期刊、DOI、文献类型、语种、出版日期、被引次数、最近180天使用次数、2013年至今使用次数、页数、引用文献数、研究方向、WOS类别并导出。
此即为本课题研究的基础数据,在此基础上基于发文信息、被引频次、合作网络3个视域展开对生命科学领域高水平论文特征的综合评价分析。
3基于发文信息的高水平论文特征分析3.1增长趋势
图1显示了本课题研究样本论文(19057篇)的发表时间和学科大类,发现2008年至2018年生命科学领域的高水平论文中关于生物与生化的研究论文数量最多,其次是环境与生态。
为了验证研究时段内论文数量的变化趋势,对历年论文数量做趋势线拟合分析,趋势线公式为:y=1311.6e0.0503x,R2=0.9834,拟合度极高,表明生命科学领域高水平论文在2008-2018年的时段内论文数量分布呈明显的指数型增长态势。
可以预见,在学术界与社会日益关注下,在理论基础不断完善与研究技术不断革新的背景下,关于生命科学领域的研究会进一步升温,论文数量会保持高速增长,
高水平论文的数量与质量也会不断提高。
图1生命科学领域高水平论文数量分布3.2来源归属维度
选取19057篇生命科学领域高水平论文的来源(国家)地区信息,默认第一作者的第一归属单位所在的地区为其来源地区,发现除38篇论文的国家信息空缺外,其余19019篇论文归属于113个国家(地区),其中25个国家(地区)仅有1篇论文,23个国家(地区)的论文数量超过100篇,且此23个国家(地区)所拥有的高水平论文占据了全球的93.22%。
从论文数量看,美国以5748篇论文占据了全球生命科学领域高水平论文的30%以上,居第1位,领先优势较大;中国1675篇论文居第3位,与美国尚存在不小差距,但是在国际上已占有重要地位。
从论文篇均被引频次看,23个国家(地区)中最高的是日本,达到了498.33;发文量最高的美国篇均被引次数为336.79,也处于较高水平;中国的论文篇均被引次数为168.84,在23个国家中最低,与发达国家还有较大差距,中国近年来在生命科学领域的研究中取得了巨大进步,高被引论文数量显著提升,已经与发达国家处于同样的位置,但是在论文质量层面还是存在较大的差距,在量
变的同时还需致力于质的提升。
选取论文的来源机构指标,并统计论文的第一作者所属的第一单位,除38篇论文信息缺失外共得到19019条机构信息,统计得到3523个机构,超过发文量均值(不少于6篇)的机构有522个。
表1中列出了生命科学领域高水平论文发文量150篇以上的12个机构发文情况。
从整体看,论文的分布较为集中,前100位的机构论文量占据总数超过一半,前22位的机构中有13个来自美国,美国的科研机构在生命科学领域的研究中有极高的影响力。
中国科学院以277篇论文位居第4位,国内论文数量较多的机构还有清华大学(39篇)、北京师范大学(37篇)、复旦大学(37篇)等高等学校。
从机构性质看,各个国家的国家研究院都具有较高的影响力;而美国的机构中私立大学和公共组织在生命科学领域的研究中起到了主导作用,特别是私立研究型大学,依托美国开放的学术环境与雄厚的科研和资金实力,与世界各国的高校、组织开展了广泛的合作,取得了丰硕成果;中国科学院作为中国最高层次的研究机构,代表了中国在生命科学领域最权威的影响力,众多高校还需充分发挥各自学科资源优势,实现优势互补、合作共赢。
4基于被引频次的高水平论文特征分析4.1文献类型维度
笔者提取19057篇论文的文献类型信息,发现生命科学领域高水平论文主要为3种文献形式:研究型论文、综述类论文、会议论文,3种类型的论文在2008年-2018年间的数量分布以及论文篇均被引频次如表2所示。
从论文数量上看,2008年至2018年生命科学领域高水平论文的主要形式为研究型论文,达到了13156篇,占总数的超过69%,会议论文仅124篇,综述类论文为5777篇,与研究型论文构成了高水平的主体;研究型论文的年份分布与论文总体分布保持一致,论文数量随发表时间的变迁而增长。
从论文被引频次看,总体上研究型论文和综述类论文的篇均被引频次接近,且均与论文发表时间成正比;综述类论文在发表的最近两年被引频次要高于研究型论文,综述类论文大都以简洁概括性的语言对某一问题做系统阐述,在论文发
表1生命科学领域高水平论文机构分布
1 2 3 4 5 6 7 8 9 10 11 12
研究机构
哈佛大学
霍华德·休斯医学研究所
国家科学研究院
中国科学院
国立卫生研究院
康奈尔大学
哥伦比亚大学
奥胡斯大学
马克斯·普朗克学会
杜克大学
苏黎世联邦理工学院
欧洲分子生物实验室
所属地
美国
美国
法国
中国
美国
美国
美国
丹麦
德国
美国
瑞士
法国
机构性质
私立大学
公共组织
国家研究院
国家研究院
国家研究院
私立大学
私立大学
公立大学
公共组织
私立大学
公立大学
国家研究院
论文数量(篇)
964
561
412
277
259
221
197
180
174
169
168
161
篇均被引频次
417.38
394.79
305.83
288.28
437.93
306.91
284.52
300.44
390.67
356.74
256.92
413.61
表的最初阶段受到了广泛关注,但是综述类论文的被引存在明显的时效性特征;2016年之前发表的研究型论文在总体上被引频次高于综述类论文,且领先幅度与论文发表时间成正比,研究型论文的被引更具有厚积薄发的持续性。
4.2开放获取维度
互联网的发展与普及催生了传统学术资源传播方式的变革,开放获取论文以其免费获取、质量高、无限制使用的特点成为学术知识传承创新和交流发布的主体和新趋势[20],开放获取扩展了论文的获取渠道,无疑会增加论文被阅读与利用的机会,开放获取对论文的被引次数乃至论文的传统学术影响力是否有影响还需进一步验证。
提取19057篇生命科学领域高水平论文的开放获取信息,得到如表3所示的开放获取与论文被引频次,表中统计了2008—2018年历年的开放获取与非开放获取论文数量、最大被引频次、篇均被引频次和开放获取论文比重。
从横向看,高水平论文中共有11817篇论文为开放获取论文,超过总数的62%,非开放获取论文为7240篇,生命科学领域的高水平研究成果更多地被开放获取期刊所收录;历年开放获取论文的篇均被引频次均高于非开放获取论文,开放获取论文不论在被引数量还
是被引质量上都高于非开放获取论文,开放获取
对论文的被引用具有积极作用。
从纵向看,除2018年外,历年论文开放获取比
重均超过50%,2018年开放获取比重受论文数据
只采集到前8个月的影响较低(37.36%),但是在近3年论文开放获取比重明显呈下降趋势,非开放获取论文的数量也有明显增加,或因开放获取期刊
通常会收取高额的费用且为了利益盲目扩张论文
发表数量,导致期刊质量下降,众多有价值的实验
研究转投了传统非开放获取高质量期刊,对开放
获取期刊形成了不小的冲击。
4.3基金资助维度
科学基金是最基本的科研资助方式[21],随着研
发经费支出的迅速增长,科学基金在论文产出过
程中的地位日益突出[22]。
为了验证基金资助对生
命科学领域高水平论文的被引频次是否有影响,
提取了19057篇高水平论文的基金资助信息,发现
有16653篇论文至少有1条基金资助信息,超过总
数的87%,生命科学领域高水平论文大部分取得
了高质量的基金资助。
统计论文的基金资助数量
并计算对应基金资助数量下论文的篇均被引频
次,制得基金资助与论文被引频次关系图(如图2所示)。
图2基金资助对论文被引频次影响图2中纵轴表示论文的基金资助数量,0-13逐条排列,13以上区间排列,横轴表示对应基金资助条数的高水平论文数量和篇均被引频次。
可以发现,有2404篇论文没有基金资助信息,默认为这2404篇论文没有取得基金资助,但是这些论文也取得了篇均被引342.01次的高被引水平;取得一项基金资助的论文数量最高,达到3430篇,论文数量随论文取得的基金资助数量的减少而增加,半数论文得到了不多于3项基金资助。
5
基于合作网络的高水平论文特征
分析
笔者提取19057篇高水平论文的作者和所属
国家(地区)信息,统计每篇论文对应的作者数和国家数,得到了如表4所示的生命科学领域高水平论文作者合作与国家(地区)合作情况分布表,默认单篇论文的作者数大于1为合作论文,单篇论文所属国家(地区)数大于1为国际合作论文。
表4
生命科学领域高水平论文合作分布
作者数量
123456789
10大于10论文数量(篇)802
2624230317821566127611649127756695180所属国家(地区)数量
123456789
10大于10
论文数量(篇)103974560180076038127217112210079
377从论文的作者合作看,19057篇论文中除去4篇没有明确的作者信息,共有18251篇论文的作者
数量大于1,即合作论文占总数的95%以上,可见在生命科学领域的研究中多学者、多团队的协同合作是攻破科研难题取得高影响力的重要条件;802篇由单一作者完成的论文能够入围高水平论文行列突出了作者高水平的研究能力,其中有368篇论文归属于美国;作者数为两人或3人的论文数
量最高,占合作论文总数的27%,作者数量大于10人的论文有5180篇。
从论文的国家(地区)合作看,除去没有明确国家信息的38篇论文,有10397篇论文由单一国家(地区)所独有,占总数的约54%,国际合作在生命科学领域的研究中没有凸显;在国际合作论文中,有4560篇论文由两个国家共同完成,可见少数国家间形成的稳定的合作模式在生命科学领域的研究中比较普遍;在中国的1675篇高水平论文中有948篇为国际合作论文,国际合作比例达到56%,中国学者在生命科学领域的研究会更乐于寻求与国际上其他国家的合作,其中中国与美国学者合作完成的论文686篇,在所有国家中是最高的;而美国的国际合作论文仅11篇,而国内多作者合作论文高达5369篇,占总数的93.4%,美国学者在生命科学的研究中更倾向于寻求本国其他机构学者的合作,这与美国众多私立研究型大学、民间科研组织所拥有的强大科研实力是密不可分的。
统计论文的来源国家(地区)信息,以生命科学领域的4个研究学科为划分依据,分别构建了4个学科的国家(地区)合作矩阵,并利用VOSviewer 软件绘制如图3所示的合作网络图谱。
图3中的4个合作网络图谱展示了生命科学领域4个学科各国家(地区)合作发表论文的情况,每一个节点代表一个国家(地区),节点之间的连线代表各国家(地区)之间合作的强度,合作越为紧密则连线越粗。
可以发现,4个合作网络图谱之间存在较大差别。
分子生物与遗传学和环境/生态学两个学科的合作网络密度明显较高,各节点之间的连线更多,体现了各国家(地区)在这两个学科的科学研究中存在更为广泛的紧密合作,也催生了更多的国际合作的科研论文。
4个合作网络中美国都是最大的一个节点,与世界各国的联系也最为密切,在分子生物与遗传学中美国、英格兰、德国、中国、加拿大构成了合作核心,环境/生态学中美国、澳大利亚、英格兰、德国、中国、法国构成了合作核心,生物与生化中美国、德国、英格兰、法国、中国、瑞士构成了合作核心,微生物学中美国、英格兰、德国、法国、荷兰构成了合作核心。
中国在4个学科的合作网络中处于紧密合作的核心位置,与美国的合作最为密切。
为了更清晰地展现中国在生命科学领域高水平论文合作网络中的位置,抽取全部论文的国家(地区)信息,构建生命科学领域全网络合作矩阵,
并得到全网络
图3生命科学领域四学科高水平论文合作网络图谱(阈值=10)
合作图谱,截取如图4所示的中国在生命科学领域
中的合作网络图谱。
图4生命科学领域高水平论文合作网络图谱
(中国)
由合作网络图谱可以发现,紫色的最大节点代表中国,同为紫色节点的国家(地区)构成同一个聚类,这一聚类包括了中国、韩国、沙特阿拉伯、日本、新加坡、马来西亚、巴基斯坦以及中国香港地区和台湾地区,均分布于亚洲,可见在生命科学领域的论文合作中地缘因素与科研合作有较大关联,同处一个区域的国家(地区)更容易产生合作的可能。
在知识图谱中与中国所代表节点连线最粗的是美国,同时也是整个网络中的最大节点,英格兰、德国、法国、荷兰、澳大利亚、加拿大、瑞典、西班牙是最主要的合作对象,也与这些国家(地区)共同构成了生命科学领域高水平论文合作网络中的核心。
6结论
笔者以生命科学为案例,从发文信息、被引频次、合作网络3个视域对高水平论文发文特征、引用特征、合作特征进行分析发现:
(1)发文特征方面,高水平论文数量呈明显的指数型增长态势,关于生命科学的研究持续升温,高水平论文的数量与质量不断提高;美国在生命科学领域的研究占有先导地位,领先优势巨大,中国论文数量位居前列,但是论文被引频次与主要国家相比还有不小差距;美国各种性质的研究机
构凭综合学术环境、资金支持与科研实力优势取得了丰硕成果,无论是论文数量还是质量均具有高水平;生物医药等与人类健康密切相关的学科研究越来越受到科学界的关注,取得了极高的影响力。
(2)引用特征方面,生命科学领域的高水平论文被引处于极高水平,综述类论文因对研究热点前沿的追踪与概述,在论文发表的最初阶段受到了广泛关注,取得了极高的学术影响力;开放获取论文不论在被引数量还是被引质量上都高于非开放获取论文,开放获取对论文的被引用具有积极作用;基金资助论文的数量明显高于非基金资助
论文,绝大多数的高水平论文都取得了足够的基金项目的资金支持。
(3)合作特征方面,在生命科学领域的研究中多学者、多团队的协同合作是攻破科研难题取得高影响力的重要条件,美国拥有的强大学术影响力是各国开展国际合作的首选对象;生命科学领域4个学科的高水平论文合作网络中美国都是最重要的合作对象,各合作网络均产生了多个国家(地区)构成的紧密合作核心团体,中国在合作网络中占有重要地位,影响力逐步提升。
(4)笔者通过揭示生命科学领域高水平论文的特征,明确当前我国生命科学领域研究与发展的方向,并通过中国与世界主要国家的对比,为中国生命科学领域研究找寻新的突破路径。
参考文献:
[1]
Citation Thresholds.[EB/OL].[2019-06-25].https :///Thresholds Action.ac⁃tion.
[2]
Garfield ,E.Citation Indexes for Science :A
New Dimension in Documentation through As⁃sociation of Ideas[J].Science ,1955(3159):108-111.
[3]
Kosmulski M.Successful papers :A new idea in evaluation of scientific output[J].Journal of In⁃
formetrics ,2011(3):481-485.
[4]Bornmann L,Daniel H.What do citation counts measure?A review of studies on citing behavior [J].Journal of Documentation,2008(1):45-80.
[5]Wan X,Liu F.Are all literature citations equal⁃ly important?Automatic citation strength estima⁃tion and its applications[J].Journal of the Asso⁃ciation for Information Science and Technology,2014(9):1929-1938.
[6]Shao,W.Innovative University Management:
Dynamic Model Design of the Evaluation Sys⁃
tem of Academic Papers’Influence[C].2011
INTERNATIONAL CONFERENCE ON EDU⁃
CATION SCIENCE AND MANAGEMENT EN⁃
GINEERING,Beijing,2011:00-103. [7]赵蓉英,全薇.中国学者在世界顶级期刊的发
文分析——基于2000-2015年Cell、Nature和Science的载文统计分析[J].情报杂志,2016
(10):95-99.
[8]刘兵红,张惠荣,汪红武.基于ESI数学学科的
数据对比分析及对学科建设的思考——以武
汉大学数学学科为例[J].图书情报知识,2017
(1):114-122.
[9]陈淑云,杜慰纯,秦小燕.中美“常春藤”高校
学科对比分析——基于高水平论文的计量学
分析[J].图书情报工作,2011(8):44-48,78. [10]梁帅,高继平.基于F5000论文评审意见的优
秀论文特征识别[J].科学学研究,2017(3):
331-337.
[11]周晓英,等.图书馆学情报学高影响力论文
特征及所反映的学科差异分析[J].中国图书
馆学报,2012(4):99-109.
[12]刘武英,张薇,刘影梅.学术期刊中的零被引
论文特征分析——以编辑出版类核心期刊为
例[J].中国科技期刊研究,2015(9):987-991.
[13]施一公.生命科学,21世纪最活跃的学科[N].
光明日报,2014-05-22(006). [14]Science’s2018Breakthrough of the Year.[EB/
OL].[2019-06-25].http:///
breakthrough2018/.
[15]李克强对2018世界生命科学大会作出重要
批示.中华人民共和国中央人民政府.[EB/
OL].[2019-06-27]http:///xinwen/
2018-10/27/content_5335005.html. [16]Bada J L,Lazcano ler revealed new ways
to study the origins of life[J].Nature,2002
(6880):475.
[17]Comfort N.Gene Jockeys:Life Science and
the Rise of Biotech Enterprise[J].Nature,2014
(7495):176-177.
[18]Jamali,H.R.&Nabavi,M.Open access and
sources of full-text articles in Google Scholar
in different subject fields.[J].Scientometrics,
2015(3):1635-1651.
[19]Mutz R,Bornmann L,Daniel H D.Are there
any frontiers of research performance?Effi⁃
ciency measurement of funded research proj⁃
ects with the Bayesian stochastic frontier anal⁃
ysis for count data[J].Journal of Informetrics,
2017(3):613-628.
[20]杨思洛,袁庆莉,韩雷.中美发表的国际开放
获取期刊论文影响比较研究[J].中国图书馆
学报,2017(1):67-88.
[21]戚尔鹏,叶鹰.基础学科论文的基金资助引
用优势研究[J].大学图书馆学报,2015(6):
11-16.
[22]Wang X W,Liu D,Ding K,et al.Science fund⁃
ing and research output,a study on10coun⁃
tries[J].Scientometrics,2012(2):591-599.
倪四秀女,1974年生。
硕士,馆员。
研究方向:用户信息服务。
亓永康男,1993年生。
硕士,助理馆员。
研究方向:信息计量与科学评价。
(收稿日期:2020-11-03;责编:徐向东。
)。