文献计量学方法
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
内容分析法
补充
内容分析法(Content Analysis)是对 文献内容进行系统的定量分析的一种 专门方法,其目的一般是弄清或测度 文献中本质性的事实或趋势。
20世纪初,人们提出在一般性阅读文献获得理解 之外,采用半定量的统计方法对文献的内容进行 深入分析和解释。二战中,美国传播学家拉斯韦 尔等在进行战时军事和政治信息分析中,以德国 公开出版的报纸为分析对象,分析获取法西斯政 权重要军政机密情报,取得了出乎意料的成功, 使内容分析法显示出实际效果。60年代,前苏联 学者在社会科学研究中采用内容分析法。60年代 日本巧妙获取大庆油田的相关情报。
制定分析框架——体现分析思路和保证系统性的 核心步骤。要求分析人员对问题本身和分析对象 二者都有深透的认识。其基本出发点是使分析单 元的测度结果能反映和说明实质性的问题。例如, 用图书馆中通用的主题词表作词频分析有时意义 不大,原因在于通用的主题词表并不是为分析专 门问题而设计的。
频数统计——一种规范性的操作,包括计数 和数据处理,需要通过大数量的统计反映统 计意义上的相关性。在内容分析中,最常用 的是词频统计。
分析样本——凡10万人口以上的城市的所有的州政府的 地方报纸均作为分析的对象,并考虑报纸质量和代表性。 约6000种地方报纸。 分析的框架——一级共10个,即教育、就业、环境、政 府和政策、健康、住房、人际关系和经济联系、法律和 正义、交通、福利和贫困。这些一级主题再分解为二级、 三级和四级主题。每一个一级主题大致分为8~16个小主 题,总共有117个小主题。 分析单元——以单篇报道作为分析单元,按主题框架对 每篇报道归类编码,建立可多种途径检索的全文数据库。 篇幅分析——利用所建的数据库可以实现多方面的内容 分析,如某一议题的篇幅变动分析,某一时期内各类主 题的比例结构等,从而完成系统化的定量和定性分析。
应用: 主要体现在文献信息的搜集环节上。 也可用于研究某一学科发展的特点以及学科之间的交叉影响 和相互渗透关系,并以此确定某些新学科的生长点。
布拉德福定律及其应用
也可用于研究某一学科发展的特点以及学科之间的交叉影响 和相互渗透关系,并以此确定某些新学科的生长点。
洛特卡定律及其应用
洛特卡定律是揭示文献著者与数量关系的基本定律,是为了 评价科学工作者的贡献,由洛特卡于1926年提出的。
内容分析法局限—— • 文献需具备两个条件:形式化原则,即能从文献 中抽出便于可靠统计的、具有语义特征的分析单 元。 统计原则,即要有一定数量的文献。 • 方法的背景是归纳法。即不可能超越和脱离所分 析的文献。不是一种发挥想象的开放式方法。 • 方法实施的工作量大,投入时间较长。特别是长 期跟踪或大范围扫描的内容分析工作,对人力和 时间的要求更加突出,需要计算机辅助分析。
8 文献计量学方法
内容提要
8.1 概述 8.2 文献计量学方法的
基本原理及其应用
8.1
概
述
文献计量学的产生和发展
值得关注的趋势
从文献计量向信息计量发展 文献计量学、科学计量学、信息计量学的合流趋势 文献计量研究手段的现代化趋势
重视文献计量学在科技管理和决策中的应用
文献计量学的研究对象和内容
结论汇总——在综合统计结果和定性分析的 基础上,得出某些结论性的看法,同时指出 所作的内容分析的适用范围或边界。
分析的核心是推理和比较。常见的有: 趋势比较——历史性纵向比较,着眼于同一 事件在时间序列中的变化趋势。 不同内容体比较——同一主题下,比较来源 不同的信息内容,从而得出结论。如各国对 同一事件的反应。这种比较是共时性的横向 比较。 内容内比较——对同一文献中不同主题的比 较,以分析其相关性和差异。如比较某报纸 对白人和黑人的不同用词。 带标准的内容比较——有一给定的标准作为 比较尺度,对文献内容进行相应的比较。即 事先确立某种评估标准,在该标准下得出比 较结果。
计分析,统计不局限于字面。如二战中统计“德国”出现 的次数时,包括“第三帝国”、“纳粹政府”、“希特勒 当局”等。 符号媒介分析——只从字面上统计特定的符号(如某些主 题词)出现的频率,不考虑语义,也不引入权重等,从中 进行内容分析。如依据某社论中某词出现的次数得出结论。
按内容分析采用的分析单元区分 词频分析——文献计量学研究的重要工具。 包括主题词词频分析和指示词词频分析。 篇幅分析——是以具有独立意义的内容篇幅 作为分析单元,根据对有关内容的比重 结构 及数量变化等进行分析和推测。内容篇幅的 统计以标准页或单篇报道等作为单位。一般 进行篇幅分析的工作量是比较大的。如J.奈斯 比特对美国社会发展趋势的分析。
分 析 方 法
内容分析的 类 型
指定分析:统计分析指定的人、 事、物出现的频次。 归因分析:统计分析相关特征 贾尼斯(美国内容分析专家)划分法 的频次。如分析某人物时统计 实用内容分析——对某些主题词或特定的词汇进行统计分 其不诚实信息出现的次数。 断言分析:统计对某人、事、 析,并赋予不同的权重(如对不同的字体、版面位置、排 物作出反应的有关信息次数, 名顺序等),推断其出现的原因和可能的后果。对报纸、 以分析特定的主题(如对某项 新闻进行内容分析时,常属该类型。 政策的反应)。 语义内容分析——针对文字的语义内容,对特定词汇作统
内容容提提要要81概述82文献计量学方法的基本原理及其应用从文献计量向信息计量发展文献计量学科学计量学信息计量学的合流趋势文献计量研究手段的现代化趋势重视文献计量学在科技管理和决策中的应用文献计量学的研究对象文献及其内容信息与文献相关的指标文献计量学的研究内容文献计量学的基本理论文献计量学的方法文献计量学的应用英国文献学家布拉德福提出了定量描述文献序性结构的经验定律
齐普夫定律的运用实例
电子邮件列表成员的相对价值。 按照齐普夫定律,这种网络的成员可以像齐普夫定律排列 单词那样来排序——按照你收件箱当中电子邮件的数量。每个 人所发的电子邮件都会给你收件箱的总“价值”贡献1/k,这
里的k是指每个人的排名。
引文分析及其应用
引文分析是运用数学、统计学和逻辑学的方法对论文、专著 等各种文献的相互引用现象进行分析,以揭示出其数量特征和 内在规律的一种研究方法。 在进行引文分析时,经常采用的计量指标有:引文率、被引 用率、自引率、被自引率、影响因数、即年指标、引文耦合强 度、同被引强度等。
洛特卡定律的数学表达式为:
发表x篇论文的著者出现的频率(在所 统计的著者总数中所占的比例)
f(x)=C/X2 ≈0.6/X2
C为常数,C的极 限值为0.6079 科学工作者发表 的论文数量
齐普夫定律及其应用
美国哈佛大学语言学教授齐普夫于1935年提出齐普夫定律: 在一篇足够长的文章(5000字以上)中,如果我们以单词词 频的高低进行等级排列(约定词频越高,则单词的等级越高), 词频最高的单词等级为1,次之为2,再次之为3,……,则词 频与等级之间存在着一次反比关系。
文献计量学的研究对象
文献及其内容信息 与文献相关的指标
文献计量学的研究内容
文献计量学的基本理论 文献计量学的方法 文献计量学的应用
8.2
文献计量学方法
的基本原理及其应用
布拉德福定律及其应用
英国文献学家布拉德福提出了定量描述文献序性结构的经验定 律:“如果将科技期刊按其刊载某专业论文的数量的多少以递 减顺序排列起来,则可以在这些期刊中区分出载文率最高的核 心区和包含着与核心区同等数量论文的后继几区。此时,核心 区和后继各区中所含的期刊数成1:n:n2……的关系(n>1)。
分析单元——是内容的“指示器”。一般先依 据目的确定分析范畴,即确定符合目的要求的 最一般的关键性概念。确定范畴时应避免两个 极端:过大的范畴可能使分析结果表面化和简 单化;过细的范畴造成几乎重复原文。范畴选 择之后,再明确相对应的分析单元。分析单元 是不再细分析测度单位。对文字对象,词是最 小的分析单元。此外,意义独立的词组、简单 句、段和意群甚至独立的篇也可视作分析单元。 在复杂的内容分析中,可同时采用几种分析单词频 该单词的等级序号
齐普夫定律及其应用
美国语言学家朱斯(M.Joos)提出了广义的齐普夫定律数学 公式:
F*rB=C
B为与样本有关的常数
法国数学家芒代尔布罗(B.Mandelbrot)运用信息论原理和 概率论方法在式8-5的基础上,进一步提出了新的修正式: F*(r+m)B=C m为与样本有关的常数;
主题词词频分析:用主题词作为分析单元,从统计所分析的
对象中有关主题词出现的频次为基础进行分析和推断。所用的 主题词取自图书馆的主题词表或数据库的叙词表,因此是用现 成的通用的高度规范的词汇作为分析单元。使用这些词,一方 面比较可靠、方便,另一方面可能难以揭示一些特定的内容, 并要求熟悉文献标引和有关专业的知识。 指示词词频分析:用特定的指示词作为分析单元,根据其频 次进行分析判断。指示词 是文献内容中能反映特定概念的实 义词,是依据具体的分析对象和分析目标专门选定的,是非标 准、非规范化的。优点是有可能满足特定的分析需要,较为灵 活,便于解决一些专门性的问题。但无法利用现成的规范的文 献标引,要在所选定的指示词的基础上专门建立有关的数据库, 因此往往工作量要大得多。
半定量分析方法。 对大量样本进行特征识别的系统方 法,具有统计性。 可以揭示出隐性的内容。是一种从 公开资料中萃取秘密信息的方法。
确定目的 建立假设
选择样本
定义分析单元 制定分析框架 频数统计 检验假设
内容 分析 步骤 框图
结论汇总
确定目的——必须首先明确。 选择样本——力求样本信息量大,有 连续性,便于统计分析并尽可能是分 析人员所熟悉的。
内容分析法案例— —
二战期间,侨居瑞士的德国 新闻记者伯尔托尔德· 雅各布 编写的一本反映德军168位军 事指挥官简历的172页的小册 子事件。
供词:“我 的小册子里 的全部材料 都是从德国 公开报刊上 得来的!”
内容分析法案例——
奈斯比特《大趋势——改变我们生活 的十个新趋热》
“《趋势报告》的工作人员每月不断地监 视6 000种地方报纸……经过12年这样仔 细地监视地方事件,我已经逐渐能清楚 地辨别出我们正在对美国进行结构重组 的方向。” ——奈斯比特