文献计量的一种新统计方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
所占比例 49. 87 8. 65 6. 81 6. 35 1. 12 4. 56 3. 99 2. 12 1. 79 2. 26 0. 59 0. 94 1. 77 1. 71 0. 29 0. 77 0. 80 0. 31 0. 75 0. 56 0. 21 0. 45 0. 21 0. 19 0. 23 0. 37 0. 30 0. 16 0. 13 0. 13 0. 19 0. 10 0. 05 0. 06 0. 10 0. 04 0. 14 0. 09 0. 07 0. 04 0. 06 0. 02 0. 06 0. 02 0. 03 0. 01 0. 03 0. 03 0. 01 0. 02 100. 0
应
作者简介 : 张德存 ( 1960- ) , 男 , 辽宁朝阳人 , 湖州师范学院经贸系副教 授 , 主要从事产业经济学和统计学的研究 .
390
Байду номын сангаас
情
报
科
学
23卷
数据采集方法来看, 有文摘法、载文法、借阅法、 复制法和引文法等。从数据统计和处理方法来看, 有百分比累积法、加权平均数法、逻辑和法、模糊 数学法和灰色关联分析法等。用引文法评价期刊又 可采用多种指标, 如被引频次、平均引文率、影响 因子、即年指标、自引率和自被引率指标等。 目前, 将被引频次和影响因子作为评价期刊学 术水平的指标之一已为人们所接受。被引频次一般 是指以一定数量的统计源 ( 来源期刊 ) 为基础而统 计的特定对象被来源期刊所引用的总次数。在统计 期刊被引频次时 可以 根据需要加上 一些条件限 制。统 计条件主要有 三个, 即时 域、学科 和统计 源。 时域是指统计的年限, 一般最低年限 , 也是最 常用的年限为一年 , 亦可做若干年的累计统计。年 限的长短可根据需要灵活选定。以学科范围为统计 条件, 实际上就是在时域条件的基础上再加以学科 范围的限制。同一个统计对象, 有学科限制的统计 结果必然要小于无学科限制的统计结果。以统计源 范围作为先决条件 , 一般是特殊用户出于特殊需要 专门指定统计源范围而附加的条件。统计源数量的 多少直接影响到期刊被引频次的大小。 同一种期刊在统计源相同 , 统计条件不同时, 其被引频次是不同的。以 ∀化学学报# 为例, 都是 用 1995 年中国科学引文数据库的数据作为统计源, 该刊在中国科学引文数据库公布的 ∀百名表 # 中, 其被引频次是 607 次, 在中国科学引文数据库用引 文累积百分比的方法编制的 ∀中国科 技核心期刊 表# 中是 538 次, 在影响因子中的被引频次是 121 次。第一个数字是指 ∀化学学报# 历年刊载的论文 在 1995 年被引用 的总次数; 第二个数字是指 ∀化 学学报# 历年刊载的论文被 1995 年化学类的论文 所引用的总次数 , 607 次与 538 次的差反映的是跨 学科引用情况, 也就是其他学科的论文引用 ∀化学 学报# 的次数; 第三个数字是指 ∀化学学报# 1993 ~ 1994 年刊载的论文在 1995 年被引用的次数 [ 4] 。 总之 , 同一个统计对象 , 因统计条件的不同, 被引频次会有所不同, 在应用被引频次指标时 , 应 该首先搞清楚统计源、统计方法和统计条件, 搞清 楚期刊引证与被引证的关系。 1996 年 , 国际刊物 ∀科学计量学# ( Scientomet
391
国家 ( 地区 ) 美 英 日 德 法 国 国 本 国 国
论文数 878866 210528 205323 164355 152520 124631 108282 72315 53893 51164 48661 41577 40764 30911 27172 24530 21276 19776 19243 16116 14458 14413 13237 12744 12736 11804 10954 8586 7908 7772 7518 7510 6331 6168 5796 4706 4636 4285 4082 3323 3278 3267 3209 2315 1677 1442 1351 1304 1257 1106 2601794
[ 1、 2]
。布氏取分区数为 3, 测得 a= 5。以
应用
地球物理学 为例 , 核心区有 9 种期刊 , 相关区有 47 种期刊, 离散区 有 113 种期刊。核 心区内的期 刊只占总期刊数的 3 2% , 这少数信息密度大、载 文量多的期刊称为核心期刊 [ 3] , 布拉德福相关论文 分布曲线, 见图 1。
A New Method of Statistics of Documents
ZHANG De - cun
( Economic and Trading Department , Huzhou Teachers Colleye, Huzhou 313000, China)
Abstract: Statistical methods of traditional documents are all passive, whether on the method or design in in dex. Those calculat ion is made after the conclusion, which lack a kinds of market plans and prediction of docu ment. This essay is to study what kind of documents will be welcome by readers by the combinative analytic method in order to provide arguments for the planning and prediction of documental market . Key words: statistics of documents; combination analysis; imit at ion of documents 用地球物理 和 润滑 两个学科的载文量后 , 发
收稿日期 : 2004- 03- 08 基金基目 : 教育部基地 重大项目 ( 02JAJD910001)
现了学科文献分布规律: 对某一学科而言 , 将科 学期刊按其刊载该学科论文的数量, 以递减顺序排 列时 , 都可以划分出对该学科最有贡献的核心区, 以及论文数量与之相等的相继的几个区。这时核心 区与相继各区的期刊数量成 1: a: a2 !!的关系 。 后人 将此 规律 称之为 : 布拉德 福文 献分 散定 律
所占比例 33. 78 8. 09 7. 89 6. 32 5. 86 4. 79 4. 16 2. 78 2. 07 1. 97 1. 87 1. 60 1. 57 1. 19 1. 04 0. 94 0. 82 0. 76 0. 74 0. 62 0. 56 0. 55 0. 51 0. 49 0. 49 0. 45 0. 42 0. 33 0. 30 0. 39 0. 29 0. 29 0. 24 0. 24 0. 22 0. 18 0. 18 0. 16 0. 16 0. 13 0. 13 0. 13 0. 12 0. 09 0. 06 0. 06 0. 05 0. 05 0. 05 0. 04 100. 00
第23卷第 3期 2005 年 3月
情
报 科
学
Vol. 23, No. 3 March, 2005
文献计量的一种新统计方法
张德存
( 湖州师范学院 经贸系, 浙江 湖州 313000)
摘
要 : 传统文献统计的方法 , 不论在方法上还是在指标体系的设计上都是被动的 , 都是对已经形
成的结论的事后计量 , 缺乏一种文献市场策划和文献市场预测的计量 , 本文利用结合分析方法研究 具有哪些属性的文献最能够受到读者的欢迎? 从而为文献市场策划和预测提供依据 。 关键词 : 文献计量; 结合分析 ; 文献模拟 中图分类号 : G350 文献标识码: A 文章编号 : 1007 7634 ( 2005) 03 0389 07
位次 1 2 3 4 12 5 6 8 9 7 17 13 10 11 23 15 14 21 16 18 26 19 25 27 24 20 22 28 30 31 32 33 40 39 34 41 29 35 36 42 37 47 38 46 43 50 44 45 49 48
实际引证率 5. 12 3. 71 2. 99 3. 49 0. 66 3. 30 3. 32 2. 65 3. 00 3. 99 1. 09 2. 05 3. 91 4. 99 0. 97 2. 84 3. 38 1. 40 3. 52 3. 12 1. 30 2. 84 1. 45 1. 36 1. 65 2. 83 2. 47 1. 71 1. 48 1. 47 1. 24 1. 23 0. 72 0. 82 1. 55 0. 84 2. 78 1. 82 1. 56 1. 04 1. 74 0. 64 1. 62 0. 92 1. 57 0. 78 1. 71 1. 76 1. 02 1. 25 3. 47
[ 5]
rics) 上发表了著名文献计量学家布朗 ( Braun W) 等人的文章。该文以 1989- 1993 年间 ∀科学引文 索引 ( SCI) # 收录的论文为依据, 通过计算机处理
对期刊进行评价 , 其方法是多种多样的。从
3期
文献计量的一种新统计方法
表 1 50 个国家 ( 地区 ) 的各项文 献计量指标
位次 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
引文数 4503074 781406 614501 572885 100799 411483 360021 191347 161589 204323 52841 85119 159467 154126 26374 69662 71868 27783 67770 50222 18813 40929 19149 17358 20976 33377 27068 14717 11714 11404 9358 9240 4527 5046 8995 3942 12895 7817 6362 3460 5720 2087 5198 2140 2630 1131 2307 2293 1285 1383 9028888
1 文献计量的统计指标和统计方 法概述
文献计量就是通过定量方法来研究科学文献 增长、分布、衰老等客观规律的。这有助于图书馆 管理员充分利用有限的资金征订相对重要的刊物 ; 有助于科研人员了解相关专业期刊的状况, 并选择 阅读和投稿的期刊; 有助于期刊编辑分析特定期刊 的学术地位、读者群的分布、 与其他期刊间的关系 , 等等 ; 有助于科研人员分析、 追踪热点研究领域、 判 断科学发展的宏观态势、 进行科研绩效评估等。 1934 年, 布拉德福 ( Bradford) , 在统计了
图 2 引用累积曲线
图 1 布拉德福相 关论文分布曲线
[4]
1967 年 , 联合国教科文组织的一篇文章指出 : 从物理学和化学领域的重要文摘杂志中发现了一 条规律, 它们所列出的或编成文摘的 75% 的论文 , 仅来自它们所收摘的全部期刊的 10% 。 1969 年 , 高夫曼 ( W Goffman 美 ) 、莫利斯 通 过统计分析, 证实按期刊流通量数据的分布近似服 从布拉德福文献分散规律 , 存在核心期刊效应[ 6] 。 1971 年 , 加菲 尔德 ( Garfield, ∀科 学引文 索 引# ( SCI) 的创始人 ) , 在统计了 2000 种期刊中的 100 万篇参考文献后发现, 24% 的被引频高的文章 出自 25 种期刊, 50% 的出自 152 种期刊 , 75% 出 自 767 种期刊, 而其余的被引文章则散布在数量大 得多的期刊中。证明了被引文章在期刊上的分布也 有一个较为集中的核心区与广为分散的相关区。国 际著名学者普赖斯先生曾认为 , 科学论文一般在其 发表后一二年即可达到其被引用的峰值阶段。受此 判断的影响 , 加菲尔德先生在 1972 年提出了影响 因子这一评价期刊 的重要指标。美国科学信 息所 ( ISI) 在计算 ∀SCI# 来源期刊的影响因子时将引文 年度规定为回溯两年 [ 6] 。