信息计量学课件10_第6章

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Βιβλιοθήκη Baidu
19
☆“布-齐-洛分布”的机理分析 (II)
‚布-齐-洛分布‛中的‚Source‛和‚Item‛:
Source 布拉德福分布 齐普夫分布 洛特卡分布 期刊(n) 词汇(r) 作者( f(x))
Item 文献数(R(n)) 词频(f(r)) 论文数(x)
20
☆“布-齐-洛分布”的机理分析 (III)
产的频率分布”(The Frequency Distribution of Scientific Productivity)一文,首次提出了“洛特卡 定律”。
“科学生产率
(Scientific Productivity) ”:亦称作“作 者生产率(Author Productivity)”,指“科学工作者在

经济学中的‚帕列托法则‛(the Pareto Principle )



其他名称:
‚帕列托法则‛、‚帕列托定律‛、‚80/20定律‛、 ‚最省力法则‛、‚不平衡法则‛……
23
presentation
1 分组完成,分工明确。 2 PPT+书面报告 3 时间控制以10-12分钟为宜 4 案例分析,理论介绍,必须有自己的观点或呈 现方式。

6.2.1 洛特卡定律的原始形式(II)
“检验发现,生产2篇文章的作者大约是生产1篇文章
作者数的1/4,生产3篇文章的作者大约是生产1文章 作者的1/9......;且生产1篇文章的作者数是全体作 者的60%左右”。 ([美]洛特卡,1926)
核心思想:“发表x篇文章的作者数量”是“发表1篇

定量表达式的一致性



都是在一个简单的函数范围内一个变量与另一个变 量相关联; 都是采取将观察值以及所涉及的主体进行特殊排列 而得到一相关模型; 都可以归结为反映某种主体与其所表现的特征之间 的数量对应关系。
18
4.4.1 布拉德福定律的应用对象 (回顾)
基本含义:(布鲁克斯公式) n:期刊按载文量递减顺序排列的等级序号,即期刊累积数; R(n):对应于前n种期刊的相关论文累积数 扩展: n:‚图书、期刊‛的等级序号; R(n):借阅次数; n:‚借阅者‛的等级序号; R(n):借阅次数; n:‚图书、期刊‛的等级序号; R(n):被引次数; n:‚作者‛的等级序号; R(n):被引次数; n:‚出版社‛的等级序号; R(n):专著数量; …… 再扩展:(布鲁克斯,1977年) n:Source(发生源、来源……) R(n):Item(项目、产物……)
22
☆“布-齐-洛分布”的机理分析 (V)
三. 其他领域的‚布-齐-洛分布‛ 实例:

社会学中的‚马太效应‛(the Matthew Effect)

“凡有的人,还要加给他,使其有余;没有的人,连他所有的 也要剥夺过来。‛( 《马太福音》 ) 1968年, R.Merton提出 1897年, Vilfredo Pareto提出 ‚在原因和结果、投入和产出以及努力和报酬之间本来就是 不平衡的,典型的模式显示,80%的产出,来自于20%的投 入‛( ‚80/20法则‛)
3
科学生产率
1.信息劳动中的生产关系信息 作者队伍的增长是与文献增长规律一致的,它 深刻地揭示出洛特卡定律与信息生产的关系; 揭示出劳动力在信息劳动中的地位,人仍然是 生产中的决定因素。
4
2.信息产品价值的分配情况。 a 在生产过程中已转移的那部分信息产品的价值,是由 劳动者占有,占有得多,消费得多,就能够多转化。
24
6
6.2.1 洛特卡定律的原始形式(I)
洛特卡定律:
y(x) = y(1) / x2
x:发表论文数量; y(x):某领域中发表了x篇论文的作者数量;

y(1):等于在该领域中发表了1篇论文的作者数量
广义洛特卡定律:
f(x) = C / x2
x:发表论文数量; f(x):某领域中发表了x篇论文的作者数量占作者总数的 比例; C:等于在该领域中发表了1篇论文的作者数量占作者总 C ≈ 60.79% 数的比例,即C=f(1)。 7
14
定义回顾
布拉德福定律:也称文献分散定律。是由英国
文献学家布拉德福1934 年首先提出。它是定量 描述科学论文在相关期刊中集中——分散状况 的一个规律。经过后来的许多研究者的修正和 研究,发展成为著名的文献分布理论。 布氏定律 的文字描述为‚如果将科学期刊按其 刊载某个学科领域的论文数量以递减顺序排列 起 来,就可以在所有这些期刊中区分出载文量 最多的‘核心’区和包含着与核心区同等 数量 论文的随后几个区,这时核心区和后继各区中 所含的期刊数成 1:a:a 2 …… 的关系 ( a>1 )。‛
文章作者数量”的1/x2;(倒平方定律,the inverse square law)
8
6.2.2 广义洛特卡定律
1986年,M.L.Pao ,对“洛特卡定律”进行
修正,提出了“广义洛特卡定律”的表达式:
f(x) = C / xn
x:发表论文数量; f(x):某领域中发表了x篇论文的作者数量占作者总数 的比例; C:等于在该领域中发表了1篇论文的作者数量占作者 总数的比例,即C=f(1);
b 劳动者为自己知识结构的完善以适应生产需要所创
造的价值,是通过劳动者的学习,即从信息产品的吸 收过程而获得的。因而反映在生产的信息产品越多,
它吸收的信息产品就越多。
c 劳动者为社会的信息交流而创造的价值。
5
6.2 洛特卡定律的基本内容
6.2.1 洛特卡定律的原始形式 6.2.2 广义洛特卡定律
21
☆“布-齐-洛分布”的机理分析 (IV)
二. ‚布-齐-洛分布‛的理论解释

人类行为的目的性与竞争原则

人类行为出现和选择的结果并不具有随机性,而更多地受其目的 的控制。 一个人在解决面临的问题时,将尽量使自己付出的‚力‛最小。

最省力法则(the Principle of Least Effort)
16
定义回顾
洛特卡定律:是由美国的统计学家、情报学家
洛特卡研究出来的 描述科学论文作者动态的最 早的量化规律。提出了定量描述科学生产率的 平方反比分布规律,又被称为‚倒平方定律‛。 其经典公式为:
f(x) = C / x2
17
☆“布-齐-洛分布”的机理分析(I)
一. ‚布拉德福-齐普夫-洛特卡分布‛的一致性

3.
掌握科学论文的作者队伍

通过对科学论文作者结构的统计和计量分析,可以了 解科学活动的特点,掌握科学发展的规律,预测学科 发展趋势的前景,从而合理地组织科研队伍,加快科 学发展的速度。 13
6 洛特卡定律
6.1 洛特卡定律的形成 6.2 洛特卡定律的基本内容 6.3 洛特卡定律的应用 附:☆ “布-齐-洛分布”的机理分析
信息计量学
—— 第六章 洛特卡定律
郑 重
zhengzhg@mail.sysu.edu.cn
6.1 洛特卡定律的形成
研究对象:科学工作者的“生产能力”
“洛特卡定律”
——“科学工作者”与“科学论文 产量”之间的数学规律”
1926年,[美] Alfred James Lotka,发表“科学生
一. ‚布拉德福-齐普夫-洛特卡分布‛的一致性

定量表达式的一致性



都是在一个简单的函数范围内一个变量与另一个变 量相关联; 都是采取将观察值以及所涉及的主体进行特殊排列 而得到一相关模型; 都可以归结为反映某种主体与其所表现的特征之间 的数量对应关系。

共性:反映了某种特定的‚Item‛在‚Source‛中 的‚集中与分散‛规律。(负幂函数)

12
6.3 洛特卡定律的应用(II)

主要应用:
1.
反映科技劳动成果状况

利用洛特卡定律可以考察在某一学科领域内,科研人 员一定时期内以科学文献形式出现的科研成果状况。 通过研究科学论文作者分布态势,可以改善科学劳动 组织、增加科研成果、提高劳动生产率,进而改善劳 动规模的组织架构。
2.
科学估计劳动规模


成功产生成功的原则(the success-breeds-success principle)

‚一篇经常被引用的论文比一篇很少被引用的论文更容易再次被 引用;一个发表过许多论文的作者比一个很少发表论文的作者更 容易再次发表论文;一种经常讨论某一课题的期刊比一种很少讨 论这一课题的期刊更容易再次回到这个课题。‛(Price,1965)

n:参数,在特定的学科领域是一常数,在不同的学 科领域有波动,一般在1.2~3.5之间变化。
9
洛特卡定律是在一种特定时间情况下,由一般
规则导致的理论模式,或者说是“马太效应” 这种灰色事件的一种白化状态。 问题在于:为了人们认识客观事物的需要,而 进行的白化是否最大限度地帮助人们的认识活 动。正是这种最大限度,激励人们不断地发展 已有的理论。
科学研究上所表现出来的能力和工作效果,通常用 其在一定时期内所发表的科学论文数量来衡量”。
2
在经济领域里,劳动生产率是指劳动者的生产效果或
能力,通常是用劳动者在单位劳动时间内所生产的产 品数量计算;或是用单位产品所消耗的劳动量来衡量
的。
“科学生产率” 是针对科研人员的科学论文著作的生
产量而言的,其目的和基本内容是:揭示作者与文献 数量之间的关系,描述科学生产率分布的规律。
15
定义回顾
齐普夫定律:是由美国语言学家齐普夫于 1935
年研究发现的关于文献中的词频分布规律。其 具体表述如下:如果将一篇达到一定长度的文 章中的词按其出现频率递减排序,根据频率高 低编上相应的等顺序号,如果用 f 表示词在文 章中出现的频率,用 r 表示词的 等级序号,则 有: fr = c (c 为常数 )
10
洛特卡定律是一种静态的表述,而实际上“马
太效应”是一种动态的过程,文献发展是动态 的。上面指出的洛特卡定律的缺陷就主要是动 态描述方面的欠缺。
11
6.3 洛特卡定律的应用(I)
应用领域:
信息管理领域
编制索引、信息检索、信息服务等
其他领域
社会学、人才学、科学学、科学评价、科技预测
相关文档
最新文档