情报学的六大定律
情报学基础考试大纲
情报学基础考试大纲本考试大纲主要适用情报学专业的硕士研究生入学考试,内容涵盖了情报学的主要专业基础知识,包括情报学经验规律、情报学重要基础理论、情报学方法论、情报源、情报检索、情报分析、情报技术、情报服务以及当代情报学发展等内容。
要求考生掌握情报学基础理论与方法,并能够综合运用所学理论与方法分析问题和解决问题。
一、考试内容(一)情报学经验规律(1)布拉德福定律。
(2)洛特卡定律。
(3)齐夫定律。
(4)文献增长律。
(5)文献老化律。
(二)情报学基础理论(1)情报学概念系统(情报学的基本属性)。
(2)国外代表性情报学基础理论,如:布鲁克斯的知识基础论;约维茨的决策系统论;米哈伊洛夫的科学交流论。
(3)国内代表性情报学基础理论,如:卢太宏的规范论;王崇德的原理论;严怡民等的栈理论。
(4)情报学体系结构。
(5)情报学理论原则。
(6)情报学相关学科。
(三)情报学方法论(1)情报学方法论概述。
(2)通用科学研究方法,如:哲学方法中的系统论、控制论、信息论;逻辑方法中的演绎法、归纳法;数学方法中的数学分析法、统计分析法;等等。
(3)情报学专门方法,如:引文分析法;德尔斐法;等等。
(四)情报源(1)情报源及其类型。
(2)文献情报源及其数字化资源。
(3)非文献情报源及其特点。
(4)情报源评价。
(五)情报组织(1)分类组织法,如:体系分类法;组配分类法;体系-组配分类法;分类标引;分类标引的步骤与原则;自动分类聚类;等等。
(2)主题组织法,如:标题法;单元词法;叙词法;关键词法;主题标引;自动标引(统计标引法、概率标引法、句法分析法、语义分析法等)。
(3)索引文摘法,如:索引法;文摘法。
(4)元数据,包括:元数据定义、类型、作用;DC元数据及其特点;资源描述框架(如RDF模型及其特点)。
(5)语义网与本体,包括:语义网的概念与体系结构;本体的定义及其组成要素;本体构建与评价;关联数据。
(六)情报检索(1)情报检索理论模型和检索评价参数。
第02章.情报科学的基本原理
2.2 有序性原理
(3)耗散结构的条件 耗散结构理论中,当负熵流输入时,系统只有远离平衡态 才可能形成新的有序结构,在近平衡态时,新的有序结构 不可能出现。 情报结构的有序性充分体现了情报生产过程中的自组织机 理,如知识生产中的引文系统、网络链接系统,RSS中的 知识信息聚类,都说明情报的有序化自组织功能的存在。
2.3 相关性原理
2.情报学相关性的表现
(1)传统系统中的表现 传统的各种情报标引和检索语言正是基于文献情报 的相关性采用概念逻辑划分来组织和存贮情报的。由于 情报标引和检索语言 的产生,情报的相关性便可以反映 为概念之间的关系,对概念的内涵进行限制,外延实施 划分便可组织起相互关联而有序的现代情报检索系统。 (2)情报的相关性在不同的学科领域是不同的 (3)情报的相关性还可实现更深层次的知识组织 布鲁克斯的“知识地图” 知识表示和知识挖掘 专家系统
2.3 相关性原理
任何一种情报结构都是按一定规则相互关联的。研究 和揭示情报相互关联(即相关性)的规律和规则,是有效 组织和检索信息、知识、情报的基础。
2.3.1 对情报学相关性的理解
Saracevic认为情报学自诞生到20世纪90年代末有三个 重要的思想:信息检索、相关性、交互性。信息检索为信 息处理过程提供了逻辑基础;相关性直接面向人类信息需 求与评价过程;交互促成了人机之间的交流与反馈。 1.作为客体的信息(或情报)之间有着极强的相关性, 这使得对信息和情报的组织成为必要和可能。
2.5 小世界原理
无论世界如何大,人口如何多,联系多么困难,人 际情报交流与传递总是能实现的。研究和揭示人类信息 联系和交流得以实现的途径及其特征、规律是建立最佳 信息、知识和情报网络的基础。
2.3 相关性原理
情报学 六大定律
1、布拉德福定律
布拉德福定律是描述专业论文在期刊中分 布情况的经验规律,由英国著名文献学家 布拉德福(S.C。Bradford,1878-1948) 于1934年提出。
布拉德福定律的文字表述
如果将期刊按其刊载专业论文数量的多寡 以递减顺序排列,则可分出一个核心区和 相继的几个领域,当每区刊载的论文量相 等时,核心期刊数Nc和外围一区期刊数N1、 外围二区期刊数N2成 Nc:N1:N2=1:a:a2 其中a为布拉德福常数
最小努力原则
齐普夫(C.K.Zlpf)博士在他的专著 《人类行为和最小努力原则》中,首先阐 明了“最小努力原则” 齐普夫认为:每一个人在日常生活中都必 定要在他所处的环境里进行一定程度的运 动,这可视为走某种道路。无论哪一种运 动、哪一种道路,人们在这个过程中都有 意无意地按照某一个原则来进行,这个原 则就是“最小努力原则”。
洛特卡定律的应用
洛特卡定律描述了作者人数与其发表论文数 量之间的关系,首次揭示了两者之间存在 的规律。 主要用于研究“科学生产率” 可用于预测发表不同篇数论文的作者数量 和特定学科的论文总量 根据作者数量估计科学论文数量
3、齐夫定律
描述文献中的词与其出现频次之间关系的 经验规律 是一条与语言学密切相关的文献学规律。 由哈佛大学语言学教授齐夫(G.K.Zipf)于 1935年提出
其中,f(x)是发表x篇论文的作者占作者总数 的百分比(作者频率),常数a>1,c是常数。
a值的研究
后经研究,发现物理学等学科领域的作者 与论文之间的关系基本符合平方反比率, 即a=2; 生物、工程、计算机等领域则不符合平方 反比关系 人文科学、社会科学中,a值将变大 规模较大、科研合作程度较高的学科中,a 值会变小。
第三编情报学简答
第三编情报学第一章情报学基础1.情报的类型:按内容所属领域的不同,情报可以分为政治情报、经济情报、军事情报、科技情报和社会生活情报等。
按照载体的不同,情报可以分为文字情报、声像情报和实物情报。
文字情报是指用文字记录下来的情报资料。
声像情报是指音频和视频介质传播的情报。
实物情报是指以样品等实物为载体传播情报的情报。
按照加工程度的不同,情报可以分为一次情报、二次情报和三次情报。
一次情报是指没有加工过的原始情报,如实验记录、科研论文等。
二次情报是指在转换一次情报过程中产生的情报,如文摘、索引等。
三次情报是指在一次和二次情报基础上进一步提炼和分析而产生的情报,如述评、综述等。
按照加工程度的不同,情报可以分为一次情报(如科研论文)、二次情报(如文摘、索引)和三次情报(如述评、综述等)。
2.情报学①定义:国际化标准组织(ISO)对情报学的定义是,对信息的功能、结构、传递的研究和信息系统管理的研究。
②情报学的学科属性:情报学是一门综合性的学科,它涉及了数学、计算技术、图书馆学、心理学、语言学、管理学、逻辑学、运筹学等学科的知识,并和这些学科有着密切的联系。
3.情报学的研究内容:主要包括情报学理论、信息存储与检索、信息分析与研究、信息用户与信息服务、信息技术在信息工作中的应用。
情报学新的研究方向和热点:随着人们对信息需求的不断提高和信息技术的进步,目前情报学新的研究方向和热点主要集中在互联网上的信息检索技术和知识发现技术、多媒体信息检索、跨语言检索、数字图书馆、知识管理、数据仓库与数据挖掘、信息经济学、信息政策与法规、信息构建、竞争情报等方面。
4.情报学与信息科学的关系:信息科学是由研究信息现象与本质及其处理和管理的一系列学科构成的一个学科群。
情报学的研究对象也是信息,而不是物质和能量,因此也属于信息科学范畴。
情报学对信息的研究,着眼于将信息作为资源的研究,研究其搜集、整理、存储、检索、传递、利用,以及如何利用计算机系统来管理信息资源。
科技情报研究的重要定律
科技情报研究的重要定律⽂献分布定律、词频分布定律、作者分布定律、⽂献⽼化定律、⽂献增长定律、⽂献引⽤定律等六条定律是情报学产⽣和发展的基⽯,它们共同揭⽰了信息爆炸、解释了信息爆炸,并解决了信息爆炸社会中的信息有效利⽤问题,是情报学对信息社会的重要贡献。
⼀、布拉德福定律——⽂献分布定律由英国著名⽂献学家B.C.Bradford于⼆⼗世纪30年代率先提出的描述⽂献分散规律的经验定律。
定律描述:如果将科技期刊按其刊载某学科专业论⽂的数量多少,以递减顺序排列,那么可以把期刊分为专门⾯对这个学科定律描述的核⼼区、相关区和⾮相关区。
各个区的⽂章数量相等,此时核⼼区、相关区,⾮相关区期刊数量成 1:n:n^2的关系。
科学应⽤:确定某⼀领域核⼼期刊⽬录科学应⽤⼆、齐普夫定律——词频分布定律美国学者G.K.齐普夫于本世纪40年代提出的词频分布定律。
定律描述:如果把⼀篇较长⽂章中每个词出现的频次统计起来,按照⾼频词在前、低频词在后的递减顺序排列,并⽤⾃然数定律描述给这些词编上等级序号,即频次最⾼的词等级为1,频次次之的等级为2,……,频次最⼩的词等级为D。
若⽤f表⽰频次,r表⽰等级序号,则有fr=C(C为常数)。
齐普夫的表达仅适宜于中频词的情况,⾼频与低频词与该表述偏差较⼤。
科学应⽤:识别⽂献核⼼主题,可应⽤于基于内容(知识)的统计、挖掘与关联分析科学应⽤三、洛特卡定律——作者分布定律美国学者A.J.洛特卡在20世纪20年代率先提出的描述科学⽣产率的经验规律,⼜称“倒数平⽅定律”。
定律描述:写两篇论⽂的作者数量约为写⼀篇论⽂的作者数量的1/4;写三篇论⽂的作者数量约为写⼀篇论⽂作者数量的 1/9;写定律描述:N篇论⽂的作者数量约为写⼀篇论⽂作者数量的1/ n2……,⽽写⼀篇论⽂作者的数量约占所有作者数量的60%。
科学应⽤:识别领域核⼼作者,根据作者数量预测领域研究活动活跃程度科学应⽤:在洛特卡定律的基础上,普赖斯提出普赖斯定律和⼀些其他重要结论。
文献计量学六大规律
文献计量学:文献分布定律,布拉德福定律,词频分布定律,齐普夫定律,科学论文作者分布定律,洛特卡定律,文献增长,科学文献老化,引文分析,情报冗余等。
文献信息源的定量研究开始于20世纪初。
在20世纪70年代末,就形成了布拉德福定律、齐普夫定律、洛特卡定律、文献增长规律、文献老化规律、文献引用规律等六大规律,并在后来的研究中得到不断的完善与发展。
布拉德福定律:也称文献分散定律。
是由英国文献学家布拉德福(S.C.Bradford)1934 年首先提出。
它是定量描述科学论文在相关期刊中集中——分散状况的一个规律。
经过后来的许多研究者的修正和研究,发展成为著名的文献分布理论。
布氏定律的文字描述为“如果将科学期刊按其刊载某个学科领域的论文数量以递减顺序排列起来,就可以在所有这些期刊中区分出载文量最多的‘核心’区和包含着与核心区同等数量论文的随后几个区,这时核心区和后继各区中所含的期刊数成1:a:a 2 …… 的关系(a>1)。
”布氏定律主要反映的是同一学科专业的期刊论文在相关的期刊信息源中的不平衡分布规律。
布氏定律的应用研究也获得了许多切实有效的成果,应用于指导文献情报工作和科学评价,选择和评价核心期刊,改善文献资源建设的策略,确立入藏重点,了解读者阅读倾向,评价论文的学术价值以节约经费、节约时间,切实提高文献信息服务和信息利用的效率和科学评价的科学性。
洛特卡定律:是由美国的统计学家、情报学家洛特卡(A.J.lotka)研究出来的描述科学论文作者动态的最早的量化规律。
在科研活动中,不同人的科研能力及其成果著述数量肯定是不同的。
那么,在同样的一段抽样时间内,不同的科技工作者的论著数量分布有没有什么规律呢?1926 年,洛特卡发表了论文“科学生产率的频率分布”。
他在文中统计分析了化学和物理学两大学科中一段时间内科学家们的著述情况,提出了定量描述科学生产率的平方反比分布规律,又被称为“倒平方定律”。
其经典公式为:f(x) =(C为常数)上式的意义为:设撰写X 篇论文的作者出现频率为f(X) ,则撰写X篇论文的作者数量与他们所写的论文数量呈平方反比关系。
6讲 情报学的定律
图像描述将统计的期刊数据取对数,并利用了三个区中论文数量 相等这一个近似条件得到的结论。 • 因此,从数学观点来看,图像描述是没有任何错误的;从实际应 用情况来看,图像描述也非常接近于反映文献的实际分布情况, 甚至其近似程度比区域描述更为准确。
nt n
tn
如果 T 为这个作者群中发文最多的作者的发文数,那么式(3-4)有: s (1, T )= MC lnT= N
N
T = e MC
(3-4)
情报学理论与发展
6.2 洛特卡定律
6.2.1 洛特卡定律的基本内容
如果我们也仿效布拉德福区域分布,对洛特卡定律进行分区,则可规定 a1 为第一区所
发表论文最高数; a 2 为第二区所发表论文最高数; a3 为第三区所发表论文最高数,则有:
p3=a2p2=ap2= a2p1 于是有:p1:p2:p3=1:a: a2
(3-1)
布拉德福认为,式(3-1)与前面的区域描述形式是一致的。
情报学理论与发展
6.1 布拉德福定律
6.1.4 布拉德福定律的维克里推论
布拉德福定律提出后,不少学者试图从理论上加以验证 和修正,力图使其更具有实用价值。 B·C·维克里 (1948)较早研究了布拉德福定律,不仅充分肯定 了布拉德福的研究,而且指出了其论证过程中的矛盾之处, 同时还创造性地提出了自己的修正和补充。证明了布拉德福 定律的分区数目不一定是3,而可以是任意数。 维克里的研究成果既使布拉德福文献分布的图段和定律在结构 上得到了统一,在形式上趋于完整,又丰富了布拉德福定律 的内容。
a3 = a13 = T 3
2
情报学方法(最终版)
情报学情报学方法:在时间上有序的,协调的和统一的活动体系,是为了达到一定的目的和解决一定的课题,搜集和概括有关信息活动的资料而采取的包括方法,手段,程序和推理的多种方法的具体体现.H因子H因子的物理含义可简单的表述为:“有h篇论文被引用了不少于h次”。
不少学者认为H因子综合衡量了论文的数量和影响力H因子主要是一个影响力判定参数,其特点是关注科学家发表了多少有影响力的论文伯顿开谱勒公式:测试文献老化的数学模型之一,美国学者伯顿和开普勒根据对9门学科的有关文献进行引文统计分析后,1960提出这个公式,设被引用文献的累计百分数为Y,X为被引用文献的出版年龄。
(以10为单位)Y=1-(a/ex+b/e2x); a+b=1,a和b为常数,和学科有关。
布拉德福定律:信息流的序性结构经验定律,也叫文献分散定律——布拉德福定律。
如果将科学杂志按其刊载某个学科主题的论文数量,以递减顺序排列起来,就可以在所有杂志中区分出载文率最高的“核心”部分和包含着与核心部分同等数量论文的随后几个区,这时核心区和后继各区中所含的杂志数量为1:a:a 的平方的关系。
耦合因子:用来反映耦合的文献相互联系的强弱程度的指标。
二情报学的研究内容:1 信息资源管理2 知识管理3 情报检索4 竞争情报 5数字图书馆6 关于计量学的研究7 交叉学科8 情报科学的前沿领域2、反应速率、即年指标,IF他们之间的关系?他们是期刊的评价指标,反映的变化也是由小到大,反映速率主要反应的是相对的数量指标(去年),即年指标主要反映的是当年的情况,IF则是反映在一个相对时间范围内(两年)的情况。
引文分析的研究方法引文分析法,就是利用各种数学及统计学的方法进行比较、归纳、抽象、概括等的逻辑方法,对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种信息计量研究方法。
包括引文年代分析、引文量分析、引文的集中与离散规律分析、引文类型分析、引文语种分析、引文国别分析聚类和分类的区别:分类是事先定义好类别,类别数不变。
2 第二讲 情报学的基本定律
1.2 布拉德福定律 ——因文献紊乱,布拉德福与其助手兰开斯特-琼斯开 始着手文献工作。 ——布拉德福的设想:为了解决文献被重复摘录的普遍 现象,可以通过期刊的相关论文载文率的高低进行区 域划分。这些区域所含期刊的数量随着载文率的下降 而增多,呈现反比关系。 ——他以某一年中刊登电技术方面的论文284种期刊为 例,按其载文量多少排序,发现在全部电技术方面的 论文中,有1/3发表在10种本学科专业期刊中,另有 1/3出现在49种并非直接与电技术有关的力能学和交 通运输等相关期刊中;而最后1/3的论文发表在225种 与电技术毫无关系的期刊中。
——布拉德福编著了大量有关分类、编目理论与实践的 著作。并于1934年发表了在文献计量学中具有奠基意 义的论文——《专门学科的情报源》,首次阐述布拉 德福文献分散定律。 ——1948年,他出版了集毕生工作经验总结的专著“文 献工作” (Documentation),对文献分散定律及其文献 工作规律做了更加系统、全面的分析和论述,为文献 计量学的诞贡献巨大。 ——20世纪30年代,出版发达,文摘开始占据主导地位, 出现大量文摘“求全而录”,图书馆馆际合作不顺利, UDC推广不普遍。 ——科学发展的背景:文献分散普遍性 文献统计研究的兴起
——定理:如果将科技期刊按其刊载某学科专业论文的 数量多少,以递减顺序排列,那么可以把期刊分为专 门面对这个学科的核心区、相关区和边缘区。各个区 的文章数量相等,此时核心区、相关区,边缘区期刊 数量成1:n:n*n。 在布拉德福定律中,n为5
边缘区258刊404篇 相关区 59刊499篇
核心区 9刊429篇
1.3 布拉德福定律的图形表示(布鲁克斯改进) • 如果横坐标取期刊按载文量递减排列时的顺序号n 的对数,纵坐标取1至n号期刊所载论文的累积数, 我们将绘制出的曲线称为布拉德福分散曲线。 布 拉德福分散曲线由三部分构成,先是一段上升的 曲线AC,然后是一段直线CB,最后是下垂的曲 线。B.C.布鲁克斯用下述模式来表示布拉德 福定律:
论情报学的基本原理及理论体系构建
。知 识、 情报则显然是
认知属性的, 是知识 体 系 (科 学 体 系) 中的基本单元 或组件。信息链 十 分 准 确 地 描 述 了 信 息、 知识和情 报等重要的基本概念及其相互关系。本文在讨论中 正是基于信息链 框 架、 在不同场合及特定意义下交 替使用这些概念的。
,-./#01 -2 345 64!#0 "-6!537 2-/ "6!5#3!2!6 0#8 3564#!601 !#2-/903!-# !""# $%%% & %$’( ’ & $’ 2>?@AB@C )%%+ :;< = )* #; = $ ,
! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! !
;%8</,4(
应 当 说, 我国情报学术界对这些思想和原则中
$
引
言
的大部分是比较 熟 悉 的, 也了解它们作为独立的理 论或规律时在情报学中的作用和地位。但忽视了它 们作为一个整体在情报学发展中的奠基性作用。本 文作者曾从科学 情 报 的 属 性 出 发, 讨论了情报学的
[ $] 。 在 进 一 步 研 究 基 础 上, 本文总结 三个基本原 理
第一批论文时, 人们首先寄给最合适的期刊, 并在其 上发表。这些期 刊 伴 随 着 该 学 科 的 发 展, 刊载越来 越多的这类文章, 于是著者都希望把他们的文章发 表在本专业领域 的, 过去已经发表了大量高质量论 文的这类期刊 上。 投 稿 数 量 大 幅 度 增 加, 使期刊选 择性增大, 因而对文章的质量要求提高, 期刊的威信 也随之日益提高, 便产生了一些带 “核 心” 性质的期 刊, 这就是文献情 报 分 布 中 的 “集 中” 趋 势。 与 此 同 时, 有关这一学科的文章也在其他相关期刊上发表, 便又产生了文献的分散现象。如果我们从具有普遍 意义和一般性人 类 情 报 行 为 出 发 解 释 这 一 现 象, 就 会发现这种离散分布所导致的集中趋势是人控制的 选择行为在起 决 定 作 用。 在 这 种 选 择 作 用 下, 当一 系列同类对象被 人 选 择 时, 就会出现有的经常被选 择, 有的不常被 选 择。 这 种 频 度 不 均 的 选 择 本 身 使 得对象的特征信 息 更 加 突 出, 又会反过来作为再次 被选择的依据。如果我们把对象受到一次选择看成 一次成功, 那么这 种 成 功 的 累 积 必 然 容 易 导 致 新 的 成功, 普顿 斯 用 累 积 优 越 性 函 数 来 描 述 这 一 过 程。 这便是情报分布中出现马太效应的根本原因。 由上 分 析 可 知, 布拉德福定律揭示的不仅仅是 情报的离散分布, 而且又揭示了离散分布基础上的 集 中 取 向 和 核 心 趋 势, 它 所 创 造 的 频 次—等 级 排 序 法和对马太效应的深刻解释都具有普遍意义。如布 鲁克斯指出, “ 排 序 是 人 类 最 基 本 的 活 动, 人们学会 讲话和数数之前就懂得按照事物的某一特征进行排 序” 。排序也 必 然 是 人 们 获 取 情 报 信 息 的 重 要 手 段, 因而是 人 类 情 报 过 程 最 基 本 的 特 征。 频 次—等 级排序法有两个明 显 的 特 点: !依照对象的重要程 度为序直接表示出分析的数据, 提供丰富的信息, 有 助于 认 识 事 物 的 特 征; " 频 次—等 级 排 序 法 无 需 任 何统计理论或概 率 假 设 为 基 础, 就能对事件直接进 行分析和解释, 应用方便, 不受理论约束。这些特征 对于分析复杂的人类情报现象和情报过程都是十分 有价值的。不仅布拉德福定律, 著名的洛特卡定律、 齐夫定律等都是 通 过 这 种 简 单 的 排 序 而 得 到 的, 故 又称其为布—齐分布系。通过这种排序揭示的情报 对象离散分布的反向趋势—集中取向 (马太效应) 更 使人们看到, 相互矛盾、 对立的情报现象和情报过程 实际上是高度统一的。 上 述 有 关 信 息、 知识和情报离散分布的绝对性 以及揭示这种分 散 的 方 法 的 普 遍 性、 实用性和简明 性使情报学有可能和有能力向其他学科提供理论和 研究方法, 对其他学科产生影响, 这正是一个学科走
第一章情报学经验规律
第一章情报学经验规律1.1布拉德福定律定义:布拉德福定律是描述专业论文在期刊中分布情况的经验规律,由英国文献学家布拉德福提出。
文字表述为:如果将期刊按其刊载某专业论文数量的多寡以递减顺序排列,则可分出一个核心区和相继的几个区域,当每区刊载的论文量相等时,核心期刊数n c和外围一区期刊数n1、外围二区期刊数n2,成n c:n i:n2=1:a:a2关系,。
其中a为布拉德福常数。
(a≈5)布拉德福定律的主要用途是确定核心期刊,以指导期刊订购和期刊利用,并由此扩展到核心馆藏维护、核心检索工具选择等。
布拉德福定律也用于考察专著的分布等。
布鲁克斯将布拉德福定律表述为,R(n)={αnβ,(1≤n≤n c)klg(n/s),( n c≤n≤N)其中R(n)为相关论文累计量;N是期刊总数,n为期刊等级排序后的序号;α是n=1对应的R(n);维克利推论n c:(n c+n1):(n c+n1+n2):…=1:b:b2:…(b>1)其中 b 为维克利系数。
1.2洛特卡定律洛特卡定律是描述作者与其发表论文数量之间关系的经验规律,由美国洛特卡提出。
即作者的百分比分布(科学生产率的频率分布)应符合以下公式:f(x)=c x a其中,f(x)是发表x篇论文的作者占作者总数的百分比(作者频率),常数a>1(实验表明a≈2)故近似平方反比律f(x)=c x2∴c=6π2≈60.79%, f(1)=c12=c ∴f(2)=c22==f(1)22∴f(n)=cn2==f(1)n2即发表1篇论文的作者约占作者总数的60.79%,发表2篇论文的作者是发表1篇论文作者数量的1/4….发表n篇论文的作者是发表1篇论文作者数量的1/n2洛特卡定律描述了作者人数与其发表论文量之间的关系,首次揭示了作者与发表论文数量之间存在的规律,后经研究,发现物理学等学科领域的作者与论文数量之间的关系基本符合平方反比律,而生物、工程、计算机等领域则不符合平方反比律,一般来说,人文科学、社会科学中,a值将变大;规模较大、科研合作程度较高的学科中,a值会变小。
情报学若干问题辨析
情报学若干问题辨析情报学是一门发展中的新学科,国内外不同时期从不同侧面对它的定义和内涵有各种表述。
综合其共同点,情报学是研究有效地运用信息、知识和情报的规律性的一门科学。
情报学发源于图书馆学和文献学,已发展成为自然科学、技术科学和社会科学的交叉学科。
1 信息与情报“信息链”信息与情报是情报学的核心问题。
什么是信息?什么是知识?什么是情报?对这些基本概念如果没有明确的认识,就不可能获得对情报学及其相关学科的科学理解。
“信息”和“情报”,英语都是“Information”。
英语的Information是一个连续体的概念,“信息链”由事实→数据→信息→知识→“情报”、“智能”五个链环构成。
简单地说,“事实”是人类思想和社会活动的客观映射。
“数据”是事实的数字化、编码化、序列化、结构化。
“信息”是数据在信息媒介上的映射。
“知识”是对信息的加工、吸收、提取、评价的结果。
“情报”、“智能”则是运用知识的能力。
换句话说,“事实”、“数据”、“信息”、“知识”、“情报”五个链环组成“信息链”。
在“信息链”中,“信息”的下游是面向物理属性的,上游是面向认知属性的。
作为中心链环的“信息”既有物理属性也有认知属性,因此成为“信息链”的代表称谓。
“三个世界”模型英国科学哲学家卡尔·波普尔提出的“三个世界”的理论,从哲学高度阐述了信息的属性。
波普尔认为,信息有“三个世界”:第一世界是物理领域,第二世界是主观现实领域,第三世界是客观知识领域。
根据这个理论,信息分为三大类:第一类是有关客观物理世界的信息,即本体论意义上的信息,它反映事物运动的状态及其变化的方式;第二类是有关人类主观精神世界的信息,即主体论或认识论意义上的隐性信息,它反映人类能感受的事物运动状态及其变化方式,处于意识、思维状态;第三类是有关客观意义上概念世界的信息,即主体论或认识论意义上的显性信息,它反映人类所表述的事物运动状态及其变化方式,用语言、文字、图像、影视、数据等各种载体来表示,汇成一个实在的自主的“信息世界”。
情报学复习资料(2)
情报科学理论——第2章情报科学的基本原理2.1 离散分布原理信息、知识和情报是以离散形式分布的,在离散分布基础上趋向集中。
情报学需要研究如何用科学的方法获取情报密度最大的情报源,为用户情报需求提供最优服务由此离散分布原理实际上主导着整个情报活动,对其研究也将揭示情报学的奠基性的定律。
2.1.1 原理的表现形式内容单元以不同的方式从不同的角度分散于各种著作或不同形式的载体中。
本质上是由知识体系自身的分化和综合决定的,与情报的生产、利用,情报的累积性、再生性、老化性以及对创造者的独立性有密切的关系。
2.1.2 原理的研究成果——布拉德福定律频次——等级排序法按某一具体事项(如文章、作者,词等情报单元)在其主体来源(如期刊,作者集合或词的集合)中的出现频次按递减顺序排列起来,就会导出布拉德福分布。
这种现象广泛存在与社会科学领域内,如城市人口分布,书籍按页分布等。
这实质上是情报离散分布基础上形成的核心趋势和集中取向,是“成功”累积的结果,也是“马太效应”的表现形式。
2.布拉德福定律定律的两个不足对情报离散分布的机理研究得还不够深入。
对情报离散分布规律的研究还停留在宏观水平上即对期刊上发表的科学论文分散规律的研究,而在微观层次上对情报离散分布的研究—即在内容单元(而不是文献)和内在逻辑联系层次上的研究仍不多见。
案例:埃格希和鲁索出版了《情报计量学引论》,在论及情报的分散规律时,仍然是以宏观层次的文献为基础的根本上混淆了哲学。
2.1.3 微观层次的研究工作以实证的方式研究科学情报(信息)的分布以实证的方式研究网络信息的分布分析信息离散分布形成的机理通过这些工作,我们可以看到情报科学发展模式及其基本定律的一致性与稳定性。
2.1.4 信息离散分布或核心趋势的形成过程布拉德福定律:著者都希望把他们的文章发表在本专业领域的、过去已经发表了大量高质量论文的这类期刊上。
投稿数量增加,因而对文章的质量要求提高,期刊的威信也随之日益提高,便产生了一些带“核心”性质的期刊,这就是文献情报分布中的“集中”趋势。
情报学五定律
情报学五定律
拉贾,TS;周幼玲
【期刊名称】《图书馆理论与实践》
【年(卷),期】1989(000)004
【总页数】3页(P46-48)
【作者】拉贾,TS;周幼玲
【作者单位】不详;不详
【正文语种】中文
【中图分类】G250
【相关文献】
1.“儿童图书馆学五定律”初探——“图书馆学五定律”变体研究之一 [J], 智晓静;
2.“儿童图书馆学五定律”初探——“图书馆学五定律”变体研究之一 [J], 智晓静
3."十一五"期间我国图书馆学、情报学博士点院系图书馆学、情报学论文的实证研究 [J], 刘玉梅;洪霞;王正兴
4.图书馆学五定律、信息资源共享四定理和图书馆学2.0五定律 [J], 刘景宇
5.图书馆原理论略--从阮冈纳赞五定律及戈曼新五定律说起 [J], 黄俊贵
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
同被引
指当两篇文献被后来发表的一篇或多篇文 献所同时引用,则称这两篇文献具有同被 引关系。 同引文耦合一样,具有同被引关系的文献 必然具有某种联系,这种联系可以用共同 引用它们的文献数量的多少即同被引强度 来衡量。
自引
指著者引用自己以前独立创作或与他人合 作创作的文献。
分析引用关系的作用1
引文耦合以及被引和自引关系都很自然地 把已发表的文献连结成一个具有某种属性 的相关文献的网络,形成相关文献群。 对相关文献群进行研究,我们就可以通过 引文现象,揭示文献间相互关系的规律。
文献计量学的几大定律
普赖斯曲线(文献增长规律) ——以文献量为纵轴,以历史年代为横轴, 把不同年代的文献量在坐标上逐点描述出 来,然后以一光滑曲线连接各点,则可十 分近似地表征文献所时间增长的规律。 老化规律(文献老化规律) ——文献老化是一个过程,可用半衰期衡量 文献的老化。 引文规律 ——主要的引文关系为同被引,自引和引文 耦合。
老化规律示意图
)=0.5相对 图1-6中,与C(t)= 相对 中 ( )= 应的时间t, 应的时间 ,称为相应学科文献 的半衰期或半生期, 的半衰期或半生期,其含义是 经过t 年后已有50% 经过 s年后已有 %的文献不 再被引用、或者说只有50% 再被引用、或者说只有 %的 文献仍在被引用。 文献仍在被引用。
布拉德福定律的用途
确定核心期刊,指导期刊订购和期刊利用 核心馆藏维护 核心检索工具选择 布拉德福定律还可用于核心出版社的研究
2、洛特卡定律 、
描述作者与论文数量之间关系的经验规律 由美国情报学家洛特卡(A. J.Lotka, 1880-1949)于1926年提出
洛特卡定律
于是他提出作者的百分比分布应符合如下公式: 于是他提出作者的百分比分布应符合如下公式:
信息爆炸现象
5、文献老化规律 、
文献老化律是描述文献信息价值随时间推 移而不断下降的规律
负指数老化律
与指数增加律对应, 与指数增加律对应,负指数老化律的数学 模型如下 其中 C(t)代表发表 年后的文献被引次数 ( )代表发表t年后的文献被引次数 k是因学科而异的学科常数, 是因学科而异的学科常数, 是因学科而异的学科常数 d为老化率。 为老化率。 为老化率
洛特卡定律的应用
洛特卡定律描述了作者人数与其发表论文数 量之间的关系,首次揭示了两者之间存在 的规律。 主要用于研究“科学生产率” 可用于预测发表不同篇数论文的作者数量 和特定学科的论文总量 根据作者数量估计科学论文数量
3、齐夫定律 、
描述文献中的词与其出现频次之间关系的 经验规律 是一条与语言学密切相关的文献学规律。 由哈佛大学语言学教授齐夫(G.K.Zipf)于 1935年提出
分析引用关系的作用3
论文的耦合及同被引关系还可推广至两个 学科、两个专业、两个著者、两种科技期 刊耦合及同被引现象,帮助我们了解学科、 专业的发展历史和发展方向以及学科专业 间交叉渗透关系; 帮助我们了解学科专业人员的结构成分组 成上的复杂关系以及相关著者群的情况; 帮助我们了解科技期刊的专业性质、判断 科学期刊之间的关系以及确定核心期刊。
其中,f(x)是发表 篇论文的作者占作者总数 其中, ( )是发表x篇论文的作者占作者总数 的百分比(作者频率),常数a> , 是常数 ),常数 是常数。 的百分比(作者频率),常数 >1,c是常数。
a值的研究
后经研究, 后经研究,发现物理学等学科领域的作者 与论文之间的关系基本符合平方反比率, 与论文之间的关系基本符合平方反比率, 即a=2; = ; 生物、工程、 生物、工程、计算机等领域则不符合平方 反比关系 人文科学、社会科学中,a值将变大 人文科学、社会科学中, 值将变大 规模较大、科研合作程度较高的学科中, 规模较大、科研合作程度较高的学科中,a 值会变小。 值会变小。
分析引用关系的作用2
引用关系显示的文献关系还给我们提供了 一种新的文献检索途径,使我们可以从引 文的角度进行相关文献的检索。由于这种 检索途径只需借助于文献后所附的参考文 献,获得它们不需借助于其他检索工具, 因此它是一种简单方便的检索途径,将它 作为传统检索方法的一种补充而使用,可 大大提高文献的检索效率。
文献引用关系
最有代表性的是文献具有的引文耦合以及 同被引和自引关系。
引文耦合(共引)
指当两篇论文共同引用了一篇或数篇相同 的文献时,则称这两篇文献具有引文耦合 关系。 具有引文耦合关系的两篇文献一定存在着 某种联系,这种联系的强度可以用引文耦 合数量的多少来定量地加以衡量,若耦合 文献数量多,则两文献联系的强度大。
1、布拉德福定律 、
布拉德福定律是描述专业论文在期刊中分 布情况的经验规律,由英国著名文献学家 布拉德福(S.C。Bradford,1878-1948) 于1934年提出。
布拉德福定律的文字表述
如果将期刊按其刊载专业论文数量的多寡 以递减顺序排列,则可分出一个核心区和 相继的几个领域,当每区刊载的论文量相 等时,核心期刊数Nc和外围一区期刊数N1、 外围二区期刊数N2成 Nc:N1:N2=1:a:a2 其中a为布拉德福常数
情报学的六大定律
文献计量学的几大著名定律
洛特卡定律(作者和论文数量关系) ——Y(X)=C/X2 ,发表了X篇论文的作者出现的 频率为Y(X)。对信息生产的一种估计。 布拉德福定律(文献分散规律) ——核心区期刊数量:相关区期刊数量:外围区期 —— 刊数量=1:a:a2。文献分散规律 齐夫定律(文献中用词的规律) ——fr=C,词汇在文章中出现的频次与词的等级序 号词的文献(N≥5000), 用自然数1,2,3,…给文献中的词编级, 出现频次最高的为1,其次为2,直到r(r <N),则高频词的频次f与词级r的乘积是 一个常数: fr=C 其中,0<c<0.1
齐夫定律的应用
在图书情报领域得到了较广泛的应用,在图书情报工作人 员实践中常常要和语言文字打交道,需要语言学和数学方 法来研究问题,此时齐普夫定律便可发挥作用。 在情报的标引和词汇控制问题上,有些学者按照齐普夫定 律的词频分布,通过标引试验,找出被标引文献与叙词使 用频率的分布特征,确定符合使用频率的词,编入词表, 解决叙词表的选词问题。 可用于文献标引 可在数据库的文档组织中得到应用 “最小努力原则”对于确定信息中心的最佳地理位置,对 于信息中心资料库的合理排架方面也有指导作用
6、引文规律
由于科学知识和信息内容之间有着各种复 杂的关系,记载科学知识和信息内容的科 学文献必然会反映这种复杂的关系,因此 科学文献体系中的每一份文献都不是孤立 的,而是有着干丝万缕的联系,其表现之 一便是科学文献之间的相互引用。
科学文献的引用原因
科学文献的引用与被引用,是科学知识的 继承与利用所决定的,是科学发展的必然 规律和研究活动规律所决定的。 M.Weinstock在对科学文献相互引用关系 进行了系统的归纳后指出,文献被引用有 以下15种原因
思考题
如何理解引文规律?引文规律在网络环境 下有怎样的应用? 简要说明情报学的几大经验定律的表述和 应用。
4、文献增长规律 、
是描述文献信息量随时间而不断增加的规 律
文献增长规律
设t时间的文献信息数量为Q=F(t),则 有: Q=F(t)=aebt=aexp(bt) 其中: a>0为条件常数,代表t=0时刻的Q; b>0为时间常数,代表持续增长率; e=2.718 t通常以年计算。
文献增长规律说明的问题
最小努力原则
齐普夫(C.K.Zlpf)博士在他的专著 《人类行为和最小努力原则》中,首先阐 明了“最小努力原则” 齐普夫认为:每一个人在日常生活中都必 定要在他所处的环境里进行一定程度的运 动,这可视为走某种道路。无论哪一种运 动、哪一种道路,人们在这个过程中都有 意无意地按照某一个原则来进行,这个原 则就是“最小努力原则”。