国际大数据研究论文的计量分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

每篇有关大数据的论文由近 3 名学者共同创作完成。 较高 的合作度和合作率反映出国际大数据研究领域的学者们注 重合作,取长补短,充分发挥了集体智慧,形成了对研究
— 130 —
2013 年 9 月 第 33 卷第 9 期
现代情报
Journal of Modern Information
Sep. ,2013 Vol. 33 No. 9
国际大数据研究文献合作情况统计表 5人 13 6 人及以上 21 全部著者数 509 全部篇数 171 合作度 2. 88 合作率( % ) 58. 5
根据表 2 的统计数据可知,国际大数据研究的论文中 合著论文共计 100 篇,占全部论文数的 58. 5% ,说明超过 一半的论文都是由学者合作完成的 。合作度 2. 88 表明平均
分析,从而把握国际大数据领域的研究现状与热点,以供 国内学者参考借鉴。
研究成果比较零散,数量较少,除 2006 年有 3 篇外,其余 年份均在 2 篇或以下。第二时期是从 2008 年至今,是快速 增长期。2008 年 的 文 献 量 突 然 增 长 到 11 篇,究 其 原 因, 是因为 2008 年 9 月 《Nature 》 杂志开设 了 “大 数 据 ” 专 刊,发表了 10 篇有关大数据研究的文章,从大数据的技 术、发展方向以及对人类的挑战等多个角度介绍了大数据 的相关问题。这 10 篇文献也被后来的文章多次引用,揭开 了国际上研究大数据热潮的序幕 。2012 年文献量达到历史 性的 84 篇,是第一时期文献量最多的 2006 年的近 30 倍。 这与 2011 年麦肯锡研究中心发布的大数据研究报告以及 2012 年初奥巴马发布的大数据倡议息息相关 。 由于数据库 的收录具有滞后性以及检索时间是 4 月份,2013 年的数据 不全,却已经有 29 篇文献,可以预测未来几年国际大数据 研究还会继续保持快速增长的趋势 。
收稿日期: 2013 - 06 - 20 作者简介: 薛 辰 ( 1990 - ) ,男,研究生,研究方向: 数字信息资源管理,网络信息资源与信息检索,发表论文 1 篇。
— 129 —
2013 年 9 月 第 33 卷第 9 期
国际大数据研究论文的计量分析
Sep. ,2013 Vol. 33 No. 9
[2 ]
到每一个独立存在的个人,都将成为大数据时代的贡献者 和受益者。那么,大数据究竟是什么? 维基百科将大数据 解释为 “是指无法在一定时间内用通常的软件工具进行捕
[3 ] 获、管理的数据集合 ” 。 关于数据量究竟要达到多少才
可以被称之为大数据,目前尚无统一说法。 一般认为,大 ,即 2 40 。大数据之 “大 ” , 数据的数量级应该是 “太字节 ” ,更多的意义在于,人们可 并不仅仅在于其 “容量之大 ” 以 “分析和使用” 的数据在大量增加,通过这些数据的交 换、整合和分析,人类可以发现新的知识,创造新的价值,
2013 年 9 月 第 33 卷第 9 期
现代情报
Journal of Modern Information
Sep. ,2013 Vol. 33 No. 9
·信息计量学研究与应用·
国际大数据研究论文的计量分析
薛 辰
( 南京大学信息管理学院,江苏 南京 210093 )
〔摘 要〕 本文利用 Web of Science 数据库,对国际大数据研究领域的文献进行收集,分别按照论文的年代、著者、国别与
问题进行合作攻关的习惯,这无疑能促进今后研究的进一 步发展。在合著论文中,两人合作是最常见的形式,值得 注意的是,6 人以上合著论文的篇数也有 21 篇,这种大规 模的合著论文现象在国内是十分罕见的,也反映了国际上 学者的合作意识之强,合作规模之大。 在有关大数据的文献中,一共有著者 492 位,其中发 文数不小于 2 篇的有 12 位著者,如表 3 所示。 由洛特卡定
[4 ] ” 、“大科技 ” 、“大利润” 和 “大发展” 。 带来 “大知识
目前国内学者中,杨绎以国内文献为研究基础,以关 键词分析为主要方法,对目前国内期刊和报纸上有关 “大 数据” 的文献进行了研究
[5 ]
。韩芳芳等以 CNKI 为数据源,
从文献、作者、关键词 3 个角度分析我国大数据领域的相 关文献。笔者认为很有必要对国际大数据领域文的献进行
[Hale Waihona Puke ]研究领域的发展轨迹,揭示其发展的总体趋势 。 将在数据 库中检索得到的论文按照年度进行归类,如表 1 所示。 从表 1 可以看出,国际大数据研究可以分为两个时期: 第一时期从 1974 - 2007 年,是起步探索时期。这一时期的
。国际大数据研究论文的合著情况
表2 独立著者( 篇) 71 2人 33 3人 19 4人 14
信息计量学研究与应用国际大数据研究论文的计量分析薛辰南京大学信息管理学院江苏南京210093摘要本文利用webofscience数据库对国际大数据研究领域的文献进行收集分别按照论文的年代著者国别与机构进行统计分析并利用spss软件对文献的高频关键词进行聚类分析和多维尺度分析利用ucinet软件予以可视化呈现总结了国际大数据研究的现状与热点以期对国内大数据的研究提供有益的参考和借鉴
[7 ]
。共词分析法研究的是某一学科领域中当前的
学术文献所集中关注的主题,很适合于分析某一学科的研 究热点和知识结构
[8 ]

2. 2
著者分析
本文在衡量国际上有关大数据研究论文的合著情况中,
2 2. 1
文献计量分析 年代分析
通过对文献发表时间的分析,可以勾勒出国际大数据
, “合作 引入了 “合作度” 和 “合作率 ” 两个指标。 其中 度” 是指某学科学术期刊在一个确定的时间里每篇论文的 , “合作率 ” 是指某学科学术期刊在一定时期 平均作者数 内合著论文占全部论文总数的比例 。 合作度和合作率共同 反映了一种期刊论文作者合作智能发挥程度,数值越高, 合作智能发挥越充分 如表 2 所示。
表1 年份 1974 1993 1994 1998 1999 2002 2003 2004 2005 篇数( 篇) 1 1 1 1 1 1 2 2 0 国际大数据研究文献年份统计表 比例( % ) 0. 59 0. 59 0. 59 0. 59 0. 59 0. 59 1. 17 1. 17 0. 00 年份 2006 2007 2008 2009 2010 2011 2012 2013 合计 篇数( 篇) 3 1 11 6 5 22 84 29 171 比例( % ) 1. 75 0. 59 6. 43 3. 51 2. 92 12. 87 49. 12 16. 96 100. 00
1
数据来源与研究方法
Web of Science ( 简称 WOS) 是美国汤姆森集团开发的
产品,是大型综合性、 多学科期刊引文索引数据库 。 WOS 收录了世界上经过同行专家评审的有影响力的文献,选用 WOS 作为数据源进行研究可以保证研究资料的权威性 。 本 文选取 WOS 数据库下 3 个子 库 Science Citation Index Expanded ( SCI - EXPANDED,科学引文索引扩展版) 、 Social Sciences Citation Index ( SSCI,社会科学引文索引) 、Arts & Humanities Citation Index ( A&HCI,人 文 艺 术 科 学 引 文 索 ,数据库更新日期为 2013 年 4 月 引) ,检索年限为 “ 所有年份” 5 日,以 “big data” 为检索词进行 “主题” 检索,共检得 171 篇大数据领域的相关文献 (检索日期: 2013 年 4 月 10 日)。 本文借助 SPSS 19. 0 软件,采用共词分析法对国际大 数据的研究热点进行分析 。 共词分析法 ( Co - term Analysis) 最早是在 20 世纪 70 年代中后期由法国文献计量学家 提出的,其思想来源于文献计量学中的引文耦合与共被引 的概念。共词分析法的基本原理是,统计一组词 ( 关键词 或者主题词) 两两在同一篇文献中出现的次数,以此作为 基础进行聚类分析,从而得出这些词语之前的亲疏远近的 关系,进而分析出这些词语所代表的学科或者主题的结构 变化情况
机构进行统计分析,并利用 SPSS 软件对文献的高频关键词进行聚类分析和多维尺度分析,利用 Ucinet 软件予以可视化呈现, 总 结了国际大数据研究的现状与热点 ,以期对国内大数据的研究提供有益的参考和借鉴。 〔关键词〕 大数据; 共词分析法; 聚类分析; 多维尺度分析; 可视化
DOI:10. 3969 / j. issn. 1008 - 0821. 2013. 09. 026 〔中图分类号〕 TP391 ; G250. 252 〔文献标识码〕 A 〔文章编号〕 1008 - 0821 ( 2013 ) 09 - 0129 - 06
表4 国际大数据研究国家 / 地区分布统计表 ( 发文数不小于 4 篇) 国家 美 英 德 国 国 国 篇数 78 17 15 8 8 7 7 比例( % ) 45. 61 9. 94 8. 77 4. 68 4. 68 4. 09 4. 09 国家 法 国 篇数 6 5 5 4 4 4 比例( % ) 3. 51 2. 92 2. 92 2. 34 2. 34 2. 34
A Bibliometrical Analysis on International Big Data Research
Xue Chen ( School of Information Management,Nanjing University,Nanjing 210093 ,China)
〔Abstract〕 This paper retrieved international literatures on big data from Web of Science. A statistical analysis including chronological distribution,country and institution was conducted. By the use of SPSS and UCINET software,this paper gave a co - word analysis of the international literatures on big data,this paper concluded the status and hotspots of big data research,so as to provide a reference for future research in China. 〔Key words〕 big data; co - word analysis; cluster analysis; ALSCAL analysis; visualization 2011 年 5 月,麦肯锡全球研究院 ( McKinsey Global Institute) 发布了研究报告 《大数据: 创新、竞争和生产力的 下一个前沿领域》 ( Big data,The next frontier for innovation, competition,and productivity )[1] 。2012 年 1 月 在 瑞 士 达 沃 , “大数据 ” 是讨论的主题之一, 斯举行的世界经济论坛上 论坛上发布的题为 《大数据,大影响 》 ( Big Data, Big Impact) 的报告中提出 ,“数据已经成为一种新的经济资产类 别,就像货币或黄金一样。 ” 2012 年 3 月 29 日,美国政 府在白宫网站上发布了 《大数据研究和发展倡议 》 ( Big Data Research and Development Initiative ) ,该倡议涉及联邦 政府的 6 个部门,这些部门承诺将投资超过两亿美元,来大 力推动和改善大数据的提取、存储、分析、共享和可视化。 无论是美国政府的倡议,麦肯锡的研究报告,还是世 界经济论坛的议题,都预示着人们,大数据时代已经到来。 大数据正在撬动全世界的神经,大到一个国家、 企业,小
2 律的公式 f( x) = f ( 1 ) / x ( 其中 f ( x ) 为写了 x 篇论文的著
2. 3
国家地区及机构分析
本文所分析的 171 篇论文一共来自 41 个国家和地区,
具体情况见表 4 所示。 我国的文献量排名第六,居亚洲第 一。我国的 7 篇文献分别来自中科院 ( 4 篇) 、 哈工大、 中 国气象局以及兰州大学 。 除了表中所列国家和地区,新加坡、 比利时、 芬兰等 也都取得了一定的成就 。 虽然这些国家目前的文献积累量 都还不大,但这也从侧面说明了大数据研究已经日益成为 一个世界范围内的研究课题,众多国家的学者都在关注这 一领域。
相关文档
最新文档