文献分析方法论
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
CNKI 学术热点
• CNKI学术热点是依托于 CNKI中国知识资源 总库中的海量文献和千万用户的使用情况 提供的学术趋势分析服务。通过关键词在 过去一段时间里的“ 学 术 关 注 指数”,用 户可以知道其所在的研究领域随着时间的 变化被学术界所关注的情况,又有哪些经典 文章在影响着学术发展的潮流;通过关键词 在过去一段时间内的“用户关注指数”,用 户还可以知道在相关领域不同时间段内哪 些重要文献被最多的同行所研读。
• 5.研究文献老化规律:目前,有关文献老化的研究一般 是从文献被利用角度出发的。D.普赖斯曾利用引文分析 探讨文献的老化规律。通过对“当年指标”和“期刊平 均引用率”的分析,他认为期刊论文是由半衰期绝然不 同的两大类文献构成的,即档案性文献和有现时作用的 文献。科学文献之间引文关系的一种基本形式是引文的 时间序列。对引文的年代分布曲线进行分析,可以测定 各学科期刊的“半衰期”和“最大引文年限”,从而为 制定文献的最佳收藏年限、对文献利用进行定量分析提 供依据。同时,一个学科的引文年代分布曲线与其老化 曲线极为相似。这有力地说明文献引文分布反映了文献 老化的规律性。因此,从文献引用的角度研究文献老化 规律是一种有效的途径和方法。
利用Eugene Garfield博士于1955年所发表的引文索引概念一文 为例,透过两个阶层的Backward引用参考文献,可以清楚地看 出Garfield博士文章与其引用和被引用参考文献的年代分布及 相关脉络,以追溯出早期的研究信息。
• 从Forward的功能将引用Garfield博士该篇文献的所有文章 依照主题做色彩区隔时,可以明显地看出Garfield博士该篇 文章除了对于信息科学与图书馆学领域产生影响外,亦影 响了其它如:护理学、心理学、核子医学、社会科学、外 科医学等等多个领域。
文献分析方法论
douhongqing@ 豆洪青
提纲
1.引文分析法及其作用
2. 聚类分析法及其作用
引文分析法Citation Analysis
尤金•加菲尔德Eugene Garfield 引文分析方法的创立者 SCI之父 HistCite的发明者
利用各种数学及统计学的方法和比较、归纳、抽象、 概括等逻辑方法,对科学期刊、论文、著者等各种 分析对象的引用与被引用现象进行分析,揭示其数 量特征和内在规律的一种文献计量分析方法。 ——邱均平《文献计量学》
万方学术趋势
• 万方数据的知识脉络也是以论文量为依据。其检索结果 中除了图表还有相关热词(与被检索词共现次数较多的 词)。知识脉络从某个知识点出发,结合时间维度形成的 脉络分析,对学术选题、学术研究等方面均有一定参考意 义。它的优点表现在:(1)知识脉络从时间维度揭示了知 识点的关注度,有助于学者了解学科发展规律和研究选 题;(2)知识脉络基于时序揭示了知识点之间随时间变化 的演化关系,有助于发现知识点之间的交叉、融合的演变 关系,有助于学者发现新的研究方向、研究趋势和研究热 点。当然,知识脉络也有一定的缺陷,即其用来判定热词 的是关键词的共现频次,这是一个绝对的表象,不能排除 各个关键词出现频次对其的影响,因此应引进相关的共现 强度指标。
关键词共现分析
• 学术论文的关键词的论文内容的提示符,是 作者学术思想及学术观点的凝结,也是文献 计量研究的重要指标。两个或更多关键词 在同一篇文献中同时出现称为关键词共现。
• 共词分析法作为文献计量学常用的研究方法,通过关键词与关键 词之间的共现关系描述某一学术领域内部组成关系及其结构,还 可以用于揭示学科的发展动态和发展趋势。关键词共现分析在 共词分析理论的基础上需要满足四个假设前提:第一,论文的关键 词、标题等关键术语都是经过作者深思熟虑、认真选择的,能够 反映该领域的研究现状;第二,当同一篇文章使用多个关键词时, 则这些关键词之间有一定的联系;第三,如果有足够多论文中使用 一对关键词,那么这对关键词所表示的关系在该学科具有特别的 意义;第四,经过培训的标引者选择用以描述内容的关键词,事实 上是相关科学概念可以信赖的一个指标。根据Whittaker J.等人 的观点,关键词共现分析还可以用于发现新的学科增长点和突破 口,即如果两个关键词同时与某关键词有较强共现关系,则这两个 关键词之间也可能存在某种关联,从而导致科学上某种创新的发 现。
• 引文分析中还有一些辅助概念,运用也较普遍: • ①文献耦合。一篇参考文献被两篇文献引用便构成 一个引文偶,引文偶愈多,说明两篇文献关系愈密 切。 • ②同被引。两篇论文共同被后来的一篇或多篇论文 所引用的现象,其量度是同被引强度,即两篇(或多 篇)文献同被后来的文献所引用的频次,显然,同被 引频次愈高,两篇论文相关性愈强。 • ③自引。作者引用自己以前发表的独撰与合撰论文 的现象,自引还可以扩展到杂志、学科、地区、团 体乃至国家对文献的反身自用。
• 3.研究学科信息源分布:通过文献间的相互引证关系,分析某 学科(或专业)文献的参考文献的来源和学科特性,不仅可以 了解该学科与哪些学科有联系,而且还能探明其信息的来源及 分布特征,从而为制定本学科的信息管理方案和发展规划提供 依据。 • 4.确定核心期刊:引文分析方法是确定核心期刊的常用方 法之一。这种方法的主要特点,是从文献被利用的角度来评价 和选择期刊的,比较客观。加菲尔德通过引文分析,研究了文 献的聚类规律。他将期刊按照期刊引用率的次序排列,发现每 门学科的文献都包含有其它学科的核心文献。这样,所有学科 的文献加在一起就可构成一个整体的、多学科的核心文献,而 刊载这些核心文献的期刊不过1000种左右。利用期刊引文的这 种集中性规律可以确定学科的核心期刊。
共被引分析法co-citation Analysis
文献共被引分析是计量文献之间关系的一种新方法。即2 篇文献共同被1篇文献引用,这2篇文献就构成共引关系。 共被引频率定义为这2篇文献一起被引用频次——马沙科
娃〃斯莫尔(苏联、美国科学记录学家)
作用
• 1.测定学科的影响和重要性:通过文献引用频 率的分析研究可以测定某一学科的影响和某一 国家某些学科的重要性。 • 2.研究学科结构:通过引文聚类分析,特别是 从引文间的网状关系进行研究,能够探明有关 学科之间的亲缘关系和结构,划定某学科的作 者集体;分析推测学科间的交叉、渗透和衍生 趋势;还能对某一学科的产生背景、发展概貌、 突破性成就、相互渗透和今后发展方向进行分 析,从而揭示科学的动态结构和某些发展规点:
• 一般来说,附在论文末尾的被引用文献是用户(作 者)所需要和利用的最有代表性的文献。因此,引 文的特点可基本反映出用户利用正式渠道获得信息 的主要特点,尤其是某信息中心对其所服务的用户 所发表的论文的引文分析,更具有直接的指导意义。 通过对同一专业的用户所发表的论文的大量引文统 计,可以获得与信息需求有关的许多指标,如引文 数量、引文的文献类型、引文的语种分布、引文的 时间分布、引文出处等。
• 7.评价人才: • 这是因为某著者的论文被别人引用的程度可以是衡 量该论文学术价值和影响的一种测度,同时,也从 科研成果被利用的角度反映了该著者在本学科领域 内的影响和地位。因此,引文数据为人才评价提供 了定量依据。从对历年诺贝尔奖金获得者的论文被 引用情况的统计来看,物理学、化学、医学领域中 诺贝尔奖金获得者中,其论文被引次数最高者 (ndan)为1888次;最低的也有79次 (J·H·D·Jensen);只有六名低于 200次。可见, 这些科学界的精英的论文的引用次数是很高的。
• 现代科学论文的一个重要特征是,在“参考文 献”标志下依序列出所援引文献的著录事项。 参考文献 (被引用文献)与正文(引用文献) 的简 单逻辑关系就是引文分析的基础和背景。致力 于引文分析理论和技术研究的文献学家主要有 格罗斯、.布朗等。普赖斯于1956年发表重要 著作《科学论文的网络》,为引文分析奠定理 论基础,E.加菲尔德于1953年受法律业务工具 书《谢泼德引文》的启发,于1961~1963编成 《科学引文索引》(SCI),使引文分析具备了实用 的工具。