文献计量学分解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
25 / 12
洛特卡定律的局限性
LOTKA 定律是有局限性的,平方反比率是科学 生产率一般的理论估计,不是一个精确的统计分布, 它是对 CA 中收录的物理、化学两个领域十年间著 者(姓氏以A A 、B B 开头)抽样研究结果的推广。 后来的学者沿着这个思路进行的研究,有些数据符 合这个规律,有些则不符合。 总而言之,只有统计时间区间足够长,统计数 据充分才严格符合该定律。
10 / 12
区域分析
布拉德福定律的区域分析:如果将科学期刊按其登 载某个学科的论文数量的大小,以减序排序,那么 可以把期刊分为专门面向这个学科的核心区、相关 区、非相关区,3个区的论文数量相等,此时核心区、 相关区、非相关区期刊数量之比为:1∶a∶a² ,a 为 布拉德福常数。 核心区:所发表的论文来自数量不多但是效率最高 的期刊 相关区:数量较多的中等效率的期刊 非相关区:数量众多但效率最低的期刊
文献计量学已经不仅仅停留在以篇、册、本为单位 的文献单元的计量上,而开始深入到文献的内部知识单元 和文献的相关信息进行计量研究,如题目、关键词、词频、 知识项、引文信息、著者、出版者、日期、语言、格式等 都已成为计量的对象。
5 / 12
随着计算机的普及,研究者开始利用计算机进行文献计量 工作。通过建立系统化、规范化的数据来源体系和原始数据 的获取渠道,利用计算机等现代化方法和手段进行数据处理 和分析研究。
11 / 12
图像分析
此外,布拉德福还对收集的数据进行图像分析:取 上述等级排列的期刊数量的对数㏒为横坐标,以相 应的论文累计数R(n)为纵坐标进行图像描述,就得 到了布拉德福分散曲线。
12 / 12
发展
自从布拉德福定律产生,很多学者对其进行了关注。 英国 情报学家维克利最早把布氏定律推广到更一般 的情形,指出分布图形由曲线和直线两部分组成, 且布拉德福定律不只是局限于划分3个区,而同样适 用于3个区以上的情形,即与选区区域的数量无关, 但分区不同,比例系数则要相应地变化。
15 / 12
应用
1、指导期刊采购工作 确定“核心期刊”,为期刊选订提供依据 2、考察专著的分布 分析各个出版社关于某一学科或专业的著作出版情 况,确定此学科的“核心出版社”,以指导图书馆的 采购工作 3、动态馆藏的维护 可分析流通期刊的最小核心,以及核心读者所感兴 趣的学科的最小核心,准确的为收藏服务,使馆藏 保持为一种有序状态
18 / 12
产生背景
19世纪末20世纪初,是科学发展史上一个 重要的转折时期。物理学和化学领域取得了 革命性的进展,同时文献领域科研人员和文 献骤增。洛特卡首先注意到这种情况,着手 研究了科研人员与其撰写的论著间的数量关 系。 洛特卡首先引入“科学生产率”的概念来测 量科研人员撰写科学文献的能力。
齐普夫定律
7 / 12
布拉德福定律
的含义:信息流的序性结构经验定律,
也叫文献分散定律。 布氏定律, 是英国文献学家布拉德福于1934 年在 《 Engineering 》 杂志上发表的《 Sources of information onspecific subjects 》 上提出的描述文分散规律的经验定律。 在其专著 《 文献工作 》 中,他又一次阐述了文献分散定律。 认为‚“在数量很大的文献体中,文献按某一规律的模型分散…… ”。 科学信息很大程度上是以科技期刊的形式出现的,借助期刊这 个载体得以交流传播,科技期刊对促进科学技术发展起着举足轻重 的作用。 布拉德福定律 (Bradford’ Law of Scattering)就是描述某一学 科论文在相关期刊中的分布规律。它定量的揭示了 ,今天仍然具有不可替代的理论价值和实 际意义。
23 / 12
三.洛特卡定律在我国的发展
初期研究工作——文武商,讨论定律的推广和适用 性问题; 应用研究——王崇德,1987年对我国情报科学作者 的分布情况进行研究。
24 / 12
四.合作者问题的研究
某种期刊在一定时期内的 合作度=作者总数/论文总数*100% 合作率=合作论文数/论文总数*100%
27 / 12
齐普夫定律
词汇在科技文献中的使用和出现频率是有一定规律的。 许多学者对词频分布理论进行了探索和研究,其中最为著 名的是齐普夫定律。 齐夫主要是根据汉莱 (M.Hanley) 为朱伊斯(J.Jayee) 的 中篇小说 《 尤利西斯 》( ( 《Ullysses 》) ) 一书所编的 频率词典来进行工作的。该词典文句容量为 260,432 个, 词典中收词 29,899 个。后来,齐普夫还根据其它一些文 句中的词频统计来论证单参数词频分布公式的正确性。 齐夫在做了大量艰苦的统计工作后,将单词以其出现 的频次的多寡进行了等级排队,经过计算,论证了描述词 的频率与等级序号之间关系的定量形式。
采用了情报学与数学、统计学相结合的研究手段。文献计量学通 过采集和处理数据,深刻、准确地观察和描述各种现象及规律。
布拉德福定律、洛特卡定律和齐普夫定律的建立,为文献计量学 奠定了坚实的基础。
最后,以若干基本定律和规律为基础进行文献分布研究。
4 / 12
发展趋势
21世纪,随着信息科学和信息技术的迅速发展,信息资源 向着电子化、数字化、网络化的方向发展,给人类社会、 政治、经济、科技和文化带来的巨大的影响和深刻的变革。 在新的社会环境和技术条件下,文献计量学的发展呈现新 的趋势。具体表现为:
文献计量学
三大定律
目录
Βιβλιοθήκη Baidu
1、文献计量学的概述 2、文献计量学三大定律 ①产生背景 ②发展 ③应用
概念
文献计量学,是将数学和统计学的方法运用于 文献及其他交流介质研究的一门学科。
文献计量学产生于20世纪初,20年代到40年代形成 了构成其主要理论框架的几个经典定律。1969年出现 “文献计量学”这个名词,成为情报学的重要组成部分。 现在文献计量学已成为图书情报领域内最活跃的一个分支 学科,体现了当代学科定量化的趋势。
16 / 12
4、检索工具完整性的测定 用来确定某一覆盖面的文摘索引至少要索及多少情 报源 评价某一学科的检索工具的完整性,为这些工具的 选择和利用提供科学依据 5、学科幅度的比较 可确定不同学科核心区和S值
核心区出现的期刊数量可作为两门学科重叠程度的依据 S值可以用来比较学科的领域范围和发展成熟程度
创立阶段
1934年,布拉德福的论文《特定主题的信息源》 1934-1948年,无人问津 1948年,《文献学》出版,使其理论开始传播
理论研究阶段(60S)
“布拉德福热”:相关研究空前活跃 形成两个学派:区域派和图像派
全面发展阶段(60S以后)
由纯粹的理论研究向应用领域渗透 理论与应用并举的全面发展情形
8 / 12
产生背景
1、文献分散是普遍的客观现象 在科学研究和文献工作中,布拉德福深深感到科学文献的 分散。他发现:一门学科的论文分散在其他学科的期刊杂 志上是屡见不鲜的。 2、科学统一性 科学统一性原则是布拉德福定律产生的思想基础。布拉德 福认为;按照科学统一性原则,科学技术的每一个学科都 或多或少、或远或近地与其他任何一个学科相关联。 3、文献统计研究是布氏定律产生的基础 布拉德福本人在 长期的文献工作中,对科学文献进行大量的统计研究,掌 握了文献分散的特点,发现了其中的某些规律性;并在文 献统计的基础上经过数学推导,得出了与上述理论推导一 致的结论,为布拉德福分散定律的正式确立奠定了基础。
6、指导读者利用期刊 以“核心期刊”的概念指导读者利用期刊
17 / 12
洛特卡定律
1926年,洛特卡最先研究了科学文献数 量与著者数量之间的关系,并创造性地提出 了“科学生产率”的概念。所谓“科学生产率” 是指科学家在科学上所表现出来的能力和工 作效率,通常用其生产的科学文献的数量来 衡量。洛特卡就是从“科学生产率”这个概 念出发,通过统计和分析科研人员的论著数 量,首次揭示了科学文献按著者的分布规律。
特点
文献计量学的概念是不统一的,不同研究者有不同的解释。同一 研究者也在不断修正自己的观点。其具有如下特点:
首先,文献计量学的研究内容主要是文献情报流的机理 探讨。
如论文作者指标、引证文献与被引证文献及二者之间的关系、文 献的利用情况、书目、文献、索引等。
其次,文献计量学的关键是定量,用定量化方法对文献 特征进行分析处理。
19 / 12
基本内容
洛特卡对这些数据的统计结果表包含两部分的内容: 1.与论著数量相对应的作者数量;2.著者频率,即相应的 著者占著者总数的百分比。这两个部分均按论著数量增序 排列。
在对数据的研究过程中,洛特卡发现,科学领域的论 著数量与著者频率有一定的关系。他在名为《科学生产率 的频率分布》中,论述了化学与物理领域中作者频率与论 文数量的分布规律,提出了描述这两者关系的一般公式, 同时还阐明了科学生产率的经验规律,即洛特卡定律,又 称“倒数平方定律”。
9 / 12
产生和基本内容
1933年,英国科学博物图书馆的布拉德福选择了“应 用地球物理学”和“润滑”专业领域为样本,组织图书馆的工 作人员统计所收集的科技期刊上的相关论文,共统计了4 90种期刊,1727篇论文,并将期刊按照相关论文载文量 的多少减序排列。 然后他采用3种不同的方法,即区域分析、图像观察 和数学推导的方法对文献统计数据进行了分析研究,结果 发现,尽管学科不同,但相关论文在相应的期刊有着同样 的分布规律。 布拉德福于1934年1月在《工程》发表了题为《专门 学科的情报源》一文,首次公开提出了定量描述文献分散 规律的经验定律,即布拉德福定律。
。
信息资源网络化的发展为网络计量学的产生提供了基础 条件和研究对象。
定义:网络信息计量学是采用数学、统计学等各种定量 方法,对网上信息的组织、存贮、分布、传递、相互引证和 开发利用等进行定量描述和统计分析,以便指示网络信息数 量特征和内在规律的一门新兴分支学科。
6 / 12
三大定律
布拉德福定律
洛特卡定律
洛特卡定律的发展
一. 洛特卡定律的验证工作
1926年,洛特卡定律诞生; 1941年,Davis对洛特卡的结果进行验证; 1949年,Zipf在《人类行为和最小努力法则》中 肯定洛特卡定律的同时也指出它的不足之处在于只 是一种近似的计算方法,而不是一种严格意义上的 分布。 后来,众多的学者在不同的领域取得数据进行研 究,对洛特卡定律的验证、完善与发展起到一定的 作用。 (在洛特卡定律的基础上,普莱斯进一步研究了科学家人数
与科学文献的数量,以及不同能力层次的科学家之间的定量 关系,提出了著名的普莱斯定律和一些其他重要结论)
22 / 12
二.弗拉奇的贡献
对洛特卡定律的验证工作作了一个客观、严谨 的总结; 发现了影响洛特卡分布的两个因素。 (a)研究者本人所处的时代或环境直接影响着研究结 果,即该定律的验证工作具有一定的人为性 (b)论文作者的数量,即统计样本中有关作者的数据 量或统计样本的容量与研究结果有关
n1:n2:…:nm=1:a:…:a^m-1
13 / 12
英国情报学家布鲁克斯首次用数学公式描述了布拉 德福的经验定律,发展了图像描述方法,从而完成 了布氏定律的这一重要的后续工作,并创造性地提 出用两个部分组成的数学表达式来描述布拉德福定 律,分别表示图像的曲线部分和直线部分:
14 / 12
总结:发展过程
26 / 12
洛特卡定律的应用
1、在图书馆学情报学方面,一般是用它来预测 发表不同数目文章的著者数量和特定学科的文献数 量; 2、在预测科学方面,按照洛特卡定律,可以从 统计或计算科学著者数量来预测文献数量的增长速 度和文献流的动向,便于掌握文献的交流规律,同 时从文献计量学的角度出发,也可以预测科学家数 量的增长和科学发展的规模及趋势等; 3、在科学学和人才学方面,可以用来研究科学 家的活动规律,研究人才的著述特征等。
20 / 12
基本内容
从洛特卡定律的产生过程可以看出,该定律的目的 和基本内容是:描述科学工作者人数与其所论著论 文之间的关系。
如果设f(x)为写了x篇论文的作者数占作者总数的 比例,则洛特卡定律可表示为:
C——某特定主题领域的特正常数。
洛特卡统计的指数a约:a=2,即“平方反比率”。
21 / 12