信息计量学复习整理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息计量学复习整理
一、信息计量学的由来与发展
1.每年发表的文献量增长较快,并逐步形成了本学科的核心情报源
2.确立并提高了学科的地位
3.主要分支领域的研究取得重要成果
4.文献计量工具和手段的现代化取得重要进展
5.专业教育起步快、发展迅速
6.形成一支骨干队伍(核心研究队伍已基本形成)
7.国际交流与合作发展势头良好
二、信息计量学的概念和内容体系
概念:采用定量方法(数学、统计学等)来描述和研究情报(信息)的现象、过程和规律的一门学科。广义信息计量学——以广义信息论为基础(作为世界三个基本要素之一的信息)的信息计量;狭义信息计量学——研究情报信息(或文献情报)的计量问题。
三、信息计量学与相关学科(论述)
第一层——母体学科:图书馆学、文献学、情报学
第二层——工具性学科:数学、统计学、文献计量学、科学计量学
第三层——相似性学科:计算机科学、科学学、预测学、科技管理学、科学评价学
1.信息计量学与数学和统计学
信息计量学是数学方法应用于信息情报研究领域相结合而形成和发展起来的。信息计量学研究的最显著特征是定量分析,而数学正是定量分析的最强有力的工具。数学方法的应用程度成为信息计量学发展水平的重要标志。
2.信息计量学与文献计量学
从研究内容上来看,许多共同的研究内容,又有不尽相同的地方
从世界层次来看,文献计量学对应“世界I”——客观物理世界,信息计量学则属于“世界III”——客观知识世界。
从信息的层次来看,信息计量的范围包括“零次信息”的概念,但毫无疑问,文献信息时整个科学情报的主体。
从任务和方法上来看,信息计量学研究的任务更艰巨,更难找到恰当的定量方法及途径。
3.信息计量学与科学计量学
科学计量学——用定量方法研究科学学的一门学科,或者说,用以研究科学发展过程的各种定量方法的总和。
从研究目的来看,科学计量学从定量的角度来探讨科学发展的内在规律,信息计量学一是探明科学文献本身的规律,以提高信息管理的科学性,二是通过信息规律的讨论进而揭示科学技术的规律性。
从研究对象和方法来看,极为类似。
信息计量学的范围比科学计量学范围广很多。
服务信息科学的研究需求vs. 研究并验证科学的产生、传播和利用的量的规律性4.信息计量学与网络信息计量学
网络信息计量学是信息计量学的一个新的发展方向和重要的研究领域。继承与发
展的关系。
5.信息计量学与科学评价学
广义的科学评价:用科学的方法进行评价——评价的科学化。
信息计量学的理论原理和方法技术都被广范应用于定量科学评价中。
四、文献信息流的特征
静态特征:在一定时间内科学文献在空间的分布性质,如集中-离散分布、按著者分布、词汇在文献中分布、引文分布、主题相关分布等的规律性。
动态特征:科学文献随时间的延续而增长和老化的性质。既增长又老化。五、文献增长的指数增长规律
一般以文献累计数据为依据
正常的、日益增长的科学领域内的文献是按指数增加的。
F(t)=a·e^(bt)
t——时间,以年为单位
a——条件常数,即统计的初始时刻(t=0)的文献量
e——自然对数的底
b——时间常数,即持续增长率:某一年的累计增加量与前一年文献累计总数的比重。
六、文献老化的概念
1.过程观:历时观察
2.状态观:共时观察
3.过程状态辩证观:过程是状态连续变化的过程,状态是某一时刻过程的状态。
4.老化的不是科学情报本身,而是包含这些情报的文章(文献老化速度快,情
报老化速度较慢)情报老化相对于情报对象(客观存在的物体、事实、现象及其性质和特征等)而言,文献老化相对于情报用户(利用情报的人)而言。
5.表现:文献包含的信息失效;文献被替代;文献知识成为常识;文献内容不
再是研究热点。
七、文献老化的指标
1.半衰期(中值引文年限)、
历时半衰期:已发表的文献情报中有一半已不再使用的时间。
共时半衰期:某学科(专业)现时尚在利用的全部文献中较新的一半是在多长的一段时间内发表的。
2.普赖斯指数
Pr = 出版年限不超过5年的被引文献数量/ 被引文献总量* 100%
普赖斯指数越大半衰期越短,只适用于文献情报。
3.剩余有益性指标
某一年份某一期刊被用户所利用的文献数称为期刊有益性。经过若干年后,期刊还保留的有益性——即剩余有益性。
4.老化系数
负指数变化,与半衰期成正比。
八、文献信息集中与离散分布规律——布拉德福定律
1.区域描述:如果将一定时间内(通常一年)的按某学科载文量等级排列的期
刊划分为三个区,使每一个区所包含的相关论文数量相等,三个区中的期刊数量成n1:n2:n3 = 1:a:a^2的关系。
a——布拉德福常数,或称比例系数
2.图像描述:n1:n1-2:n1-3 = 1:b:b^2
n1-2 = n1+n2
n1-3 = n1+n2+n3
b——分散系数
3.一个定律,十来个经验公式,四个数学模型
九、齐普夫定律的理论基础——最省力法则
每一个人的运动都在一定的途径上进行,而且都将收一个简单的基本法则的制约,千方百计的选择一条最省力的途径。
从经济上、安全上、时间上,并结合本人主观条件及客观条件等种种因素考虑,想方设法地选择一个最符合自己条件和要求的方法或途径,使自己付出的“力”最小。
最小的“力”最少。(利益最大化——理性人假设)
十、文献信息词频分布规律——齐普夫定律
把一篇较长的文章(约5000)中每个词出现的频次统计起来,按照高频词在前,低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,Fr表示频次,r表示等级序号,则Fr·r = C。
fr表示频率,fr·r = c 。
取对数,直线图像描述。b·lg r + lg Fr = lg C
十一、文献信息作者分布规律——洛特卡定律
生产n篇文章的作者书是生产1篇文章作者的1/n^2左右,生产1篇文章的作者是全体作者的60%左右。
y(x)= y(1)/ x^2
广义洛特卡定律:f(x)= C / x^n ,x = 1,2,3,···Xmax(一定时期内作者撰文的最大能力)
十二、文献信息统计原则
1.针对性
2.准确性(核心要求)
3.代表性
4.可比性
5.累积性
十三、确定统计指标的原则
上述五条
6.指标概念明确
7.计算方法简便
8.单位明确
十四、文献信息统计的基本步骤
1.统计调查
(1)确定具体方法
(2)选准统计工具
(3)明确指标项目
2.统计整理
(1)计算