2第二章 文献检索基础(正式版)
第二章 文献信息检索基本知识(2).概要
(2)截词检索表达式
用截词符号“*”、“?”或“$”加在检索词 的前后或中间,以检索一组概念相关或同一词根 的词。 按截断的位置可分为:
前截断、中间截断、后截断 按截断的字符数量可分为: 有限截断(?)、无限截断(*)
如:输入检索式“Comput*”,将检出包含 Computer、Computing、Computed、 Computerization 等词汇的结果。
第二章 信息检索基础知识
2.3 文献信息检索的工具
1、文献信息检索工具概述 检索工具是将大量分散无序的文献资料经过加 工整理,按照一定的规则和方法编制起来,用来 报道、存储和查找文献的工具,是附有检索标识
的某一范围文献条目的集合。
传统的检索工具是人们利用手工方法编制的
工具书,有字典、词典、目录、百科全书、名录、 类书、政书、表谱、图录等。这些工具书是人们
题录示例
(3)索引(引得) 索引是将书刊内容中所论及的篇名、语词、主 题等项目,按照一定的排检方法加以编制,注明出 处,供读者查检使用的检索工具。 索引与目录的根本区别就在于著录的对象不同, 目录所著录的是一个完整的出版单位,索引所著录 的则是完整的出版物的某一部分、某一观点、某一 知识单元,提高文献检索的深度和检索效率。
完全一致(精确匹配)、任意一致(模糊匹配)
等。
讨论1: 我馆书目查询系统共有多少种检索方式?其基 本检索有多少个检索字段?
讨论2: “中国学术期刊网络出版总库”有哪些检索方式?
?
? ? 中国科技期刊数据库初级检索界面
2、 信息检索方法
(1)常用法 ①顺查法 ②倒查法 ③抽查法 (2)回溯法 (3)循环法
文献检索课件-第二章
(1)准确
关键词表述准确是获得良好检索结果的必要前提。提
高关键词的准确性,需要注意两个方面:一是避免错别字;
二是避免有歧义的字、词。
• 作为关键词同时应避免最常用的词;
• 即使需要使用这些常用词,需加以限定; • 对于简单、通俗,容易产生歧义的关键词,也应该加一些 限制性的修饰词; • 采用搜索语法组合关键词,也可有效地提高搜索质量。
2.3 计算机检索的技术
2.3.1 布尔逻辑检索 2.3.2 截词检索 2.3.3 字段检索 2.3.4 位置检索 2.3.5 限制检索
2.3.4 位置检索
概括地说,位置检索是一类针对自然语言文本中检索 词之间特定位置关系而进行的检索匹配技术。位置检索允 许用户使用自然语言作为检索入口,并可深入到原文的章、 节、段、句等文本范围内进行信息的查找和匹配。
(4)选择多个关键词 关键词数量太少,不能准确地限定检索范围, 可能会得出大量的检索结果;太多则可能不被搜 索引擎识别,也会影响搜索效果。 每个搜索引擎对关键词数量的要求和态度不 同。
(5)根据网页特征选择查询词
很多类型的网页都有某种相似的特征。 • 例子一,要去“黄山”旅游,想了解一下相关事宜早作准
(2)力求简练
目前的搜索引擎在处理自然语言方面的能力 不是很强,因此在提交搜索请求时,用户最好把 自己的想法提炼成简单的,而且与希望找到的信 息内容主题关联的查询词。
关键词一般不能选没有检索意义的助词、介
词、连词、形容词或副词等,而多选用名词、短 语。
(3)具有代表性
也就是说,关键词要能成为被查询事物的典 型标志,时间、人物、地点一般可以成为增加关 键词代表性的有效限制因素。 另外,多用专业术语和专业名词,专业术语 和专业名词作为关键词所检索出来的结果一般与 搜索的主题相关性很大。
医学文献信息检索(完整版)
---------------------------------------------------------------最新资料推荐------------------------------------------------------医学文献信息检索(完整版)Nacl-星星-Clarence医学文献信息检索第一章绪论 1. 一个国家的综合国力在一定程度上将体现为信息的拥有量、处理能力和利用水平,即信息水平、信息能力、信息素质、信息潜能的总和。
2. NIQ-----国家信息化指标(国家智商)3. 医学生信息素养:个体能够认识到何时需要信息,能够检索、评估和有效利用信息的综合能力。
包括:信息意识、信息知识、信息能力、信息道德 4. 信息能力:活动+积累+表达+甄别+利用(终极目的) 5. 信息意识是前提,信息能力是核心,信息道德是方向。
6. 文献信息检索:教会医学生查找文献信息,提高检索、筛选、分析、评价、管理和综合利用文献信息的能力,最终使文献信息为我所用。
包括信息存储和信息检索两个环节。
7. 手工检索:常用法、追溯法、浏览法计算机检索:浏览法、搜索法、技术法 8. 外表特征途径:题名、著者、机构名、编号内容特征途径:分类、主题、代码第二章文献信息检索基础(一)基本概念概念信息信息是物质存在的一种知识人类对客观世界的正确情报为了解决某一特定问题而被传递的知识和事实,是被激活了的知识。
文献记录有知识的一切载体。
1/ 11凡属于人类的知识,用文字、图形、符号、声频、视频等手段记录保存下来,并用以交流传播的一切物质的载体。
方式、形态或运动状态,认识,是社会生产实践和是事物的一种普遍属性,科学研究的概括和总结,定义一般指数据、消息中包含的意义,可以使消息中所描述事件的不定性减少。
是人脑加工、整理序列化的信息。
特征基本要素客观性、动态性、依存性、规律性、实践性、渗透性、可传递性、共享性信源信宿媒介(语言、载体、信道)继承性、信息性知识性、传递性、效用性知识或信息经过传递使用产生效益知识内容记录手段载体信息是知识的源泉,知识是系统化、理论化的信息;联系情报是活化了的知识信息,是动态的、传递的知识;文献是信息、知识和情报通过某种手段记录储存在某种物质载体上而形成的外在表现形式。
第二章 文献检索基础知识
查阅文献资料的方法
综合法
综合法又称为循环法,它是把上述两种 方法加以综合运用的方法。
综合法既要利用检索工具进行常规检索 ,又要利用文献后所附参考文献进行追 溯检索,分期分段地交替使用这两种方 法。即先利用检索工具(系统)检到一 批文献,再以这些文献末尾的参考目录 为线索进行查找,如此循环进行,直到 满足要求时为止。
第二章 文献检索基础知识
第二章 文献信息检索基础
第一节 检索原理与检索语言 第二节 检索方法与检索步骤 第三节 检索系统概述 第四节 计算机检索系统
第一节、检索原理与检索语言
• 文献信息检索:将文献信息按照一定的规 律排列、储存起来,并根据信息用户的需 求查找出其所需信息的过程。所以广义的
文献信息检索是指信息 存储与检索 。
检索基本原理是以检索语言为基础,将文献的提问标识与检索 标识之间进行相关性的匹配,检索语言是标引者与检索者共同 使用的语言。
检索原理与检索语言
• 检索语言有多种名称,如文献检索语言、 信息检索语言、文献(信息)存储与检索 语言等,它是组织文献与检索文献时所使 用的共同语言,是保证存储和检索一致的 人工语言。
检索原理与检索语言
标引是在文献内容分析的基础上,按学科属性或
主题概念用合适的检索语言(分类符号或规范化的科 学名词、词组)对文献进行描述,形成反映文献内容 特征和外表特征的各种标识,按照一定的规则编排成 严格有序的排检序列,输入文献检索系统。
检索语言类型
检索原理与检索语言
①分类语言 (classification retrieval language) 是以知识的学科体系为基础,以符号(数字、字 母)为概念标识进行文献内容特征揭示的一种检 索语言。 它以学科类目名称作为基本词汇,通过类目的从 属关系来表达复杂的概念。
文献信息检索基础知识
(二)检索语言
1、概念:用于描述文献的外部及内部特征所用的语言。 2、分类:
描 述 文 献 外 表
检 索 语 言
特 征 的 语 言
特 征 的 语 言
题名(书名、篇名)语言 著者语言 号码语言(序列号、专利号) 分类语言
描 述 文 献 内 容
关键词
主题语言 主题词(叙词)
3、分类语言:以号码为基本字符,用分类号 表达文献主题概念的检索语言。 (《中图法》、《人大法》) (1)《中图法》结构体系如下:
指用户借助于计算机终端和通信线路与计算 机数据库中心直接进行对话的一种检索方式。用 户使用终端设备与远程中央计算机相连,运用规 定的指令操作,如:Dialog联机检索
微机
通讯网络
中央计算机
数据库
3、计算机检索的类型 (2)光盘检索(CD—ROM search) # 光盘单机检索→最终还是网络、联机检索。
微机
检索终端
#光盘联机检索
光驱
微机
检索终端
局域网
服务器
光驱
3、计算机检索的类型
(3)网络检索(networked search ) 全球性的分布式结构 开放式的信息环境 跨国界的信息流
正式与非正式信息交流渠道共存
信息缺乏有效的组织管理
4、各种机检的比较
联机 数据库量 数据更新 检索方法 检索范围 使用方便 费用支付 用户费用负担 用户精神负担 较多 较快 各库较一致 远程 光盘 较少 较慢 各库差异较大 单机或局域 因特网 不计其数 很快 各异 远程/局域
+
=
类 目
经济
索书号
“1”种次号
4、主题语言:用自然语言中的名词、词组、句子描述文 献主题概念的检索语言。 ※ 主题词:表达文献主题概念的词叫主题词 。当使用主
第二章文献信息检索基本知识
运算符
1、布尔逻辑运算符(Boolean Operators) 2、通配符和截词符 3、字段限制符
、
1、布尔逻辑运算符 Boolean Operators
名 称
逻辑 与
逻辑 或
逻辑 非
运算符
AND * OR +
NOT -
逻辑关 系
举例
作用
限定 A AND B 缩小
需求分析
信息源
检索工具 检索方法
检索途径 检索标识
确定学 科范围、
主题概 念。
确定信 息源类 型、 语
种、时 间和空 间范围。
选择数据 库及其文 档、搜索 引擎及网 站。
选择检索 途径
及其检索 标识
制定检索 策略
调整检索 策略
查找文献 线索
索取原始 文献
检索提 问表达 式
根据检索 结果,扩 大或缩小 检索范围, 提高查全 率和查准 率。
以工程索引EI为例,通配符和截词符的检索 表达式及检索结果如下:
算符 *
$
含义
结果
利用它可以输入检索词的起始部分,而 实现一簇词的检索
自动取词根运算符
Alter*可命中 alter,alternando,altern ant,alternate,alternati ve等
$alter可命中 alter,alternate,alterna tive
用检索 工具查 找到文 献线索
馆藏文献借阅、 复制 全文数据库 网上获取 向作者索取
检索提问表达式=检索词+运算符
检索词
分为两类: 字词类:名词术语(如叙词或关键词),或者是个
人或机构名称。 如:行政管理、王平、西安邮电大学等。
文献检索-第二章 文献检索基本知识(100829)(包括第三章)
A ——马克思主义、列宁主义、毛泽东思想、 邓小平理论 B ——哲学、宗教 C ——社会科学总论 D ——政治、法律 E ——军事 F ——经济 G ——文化、科学、教育、体育 H ——语言、文字 I ——文学 J ——艺术 K ——历史、地理
N ——自然科学总论 O ——数理科学和化学 P ——天文学、地球科学 Q ——生物科学 R ——医药、卫生 S ——农业科学 T ——工业技术 U ——交通运输 V ——航空、航天 X ——环境科学、安全科学
检索工具应具备的五个条件: 1、有明确的收录范围; 2、有完整明了的文献特征标识; 3、每条文献条目中必须包含有多个(一般 至少是3个)有检索意义的文献特征标识, 并标明供检索用的标识(即标目); 4、全部条目科学地按一定规则组织成为一 个有机整体; 5、有索引部分,提供多种必要的检索途径。
二、检索工具的种类 主要有以下几种划分方法: 1、按著录内容划分 (1)目录:它是对图书、期刊等单 位出版物外表特征的揭示和报导; 是记录具体出版物和收藏单位情况 的工具。目录通常以一个完整的出 版单位或收藏单位为著录的基本单 位。
三、数据库 1、数据库的类型 题录型数据库(对应于题录)、文摘 型数据库(对应于文摘)、数值型数据库、 事实型数据库、全文数据库。 2、数据库的组成 数据库→文档→纪录→字段 许多文档构成了完整的信息检索的数据库。 表2.3 数据库常用检索字段列表
四、检索工具中的缩写和音译 1、单词的缩写 2、学会简称 3、刊名缩写
3、著者途径 是根据已知文献著者(作者) 的姓名来查找文献的途径。 4、名称途径 这是根据文献的名称来查找文 献的途径。如:“书名目录”、“刊 名目录”。
5、序号途径 这是以文献的编号为特征编排和检 索文献的途径。如:“专利号索引”、 “报告号索引”等。 6、其他途径 有些检索工具还附有一些特殊索引,可 提供从特殊途径查找所需文献的线索。 如《CA》中的分子式途径、环结构式途 径等。
文献检索复习资料
文献检索复习要点—Jinying第一章绪论信息、知识、情报及三者关系;文献,文献按载体划分,文献按出版形式划分,文献级次(各级次的概念、代表文献及异同);ISBN和ISSN(概念、组成及检验方法)信息含义:是客观事物本质特征千差万别的反映。
是物质存在方式、形态或运动状态的反映。
(P3-P4)知识的概念:是人类通过信息对自然界,人类社会及思维方式与运动规律的认识与概括,是人的大脑通过思维重新组合和系统化了的信息,是信息中最有价值的部分。
情报的定义:为了解决一个特定问题从一定文献资料中提取或经过传递获得的知识。
情报的三个基本属性:知识性传递性针对性信息,知识,情报之间的关系从信息,知识和情报的定义可以看出,信息无处不在,信息的范围很大,信息中被人们认识的部分成为知识,而知识中被人们用来解决问题的部分成为情报,因此信息,知识和情报的关系是前者包含后者的关系。
ISBN:(P8) 概念:即国际标准书号,它是由10位数字组成,共分4段,其间用“—”相连,组成:1组号2出版社号3书序号4校验码算法:用1分别乘ISBN前12位中的奇数位,用3乘以偶数位,所得结果之和除以10可得,值的范围为0—9文献的含义:记录有知识的一切载体,包含知识内容、信息符号、载体材料、记录方式四个基本要素(P5)文献按载体划分:1印刷型2缩微型3视听型4电子型(P5-P6)文献按出版形式划分:1.图书2.连续出版物(期刊、报纸)3.会议文献4.学位论文5.科技报告6.专利文献7.标准文献8.政府出版物9.产品样本10.技术档案(P7-P11)文献级次:人类开发、利用文献的先后顺序。
(P6-P7)1零次文献:非正式出版物或非正式渠道的最原始的文献。
如日记、手稿、个人通信、口头言论2.一次文献:依据作者本人的研究或研制成果创作的文献。
如图书、期刊论文、会议论文3二次文献:按一定的方法对一次文献进行整理加工,使之有序化而形成的文献。
如目录、索引、文摘4三次文献:围绕某个专题或出于特定目的,根据二次文献提供的线索,选用大量一次文献的内容,进过筛选分析综合和浓缩等深度加工而形成的文献。
文献检索第二章
第二章中文科技信息检索工具与图书馆利用参考工具书(Reference Book)是根据一定的社会需要,以特定的编排形式和检索方法,为人们迅速提供某方面的基本知识(如字、词、文句、数据等)或文献资料线索,专供查询的特定类型的图书。
如辞典、年鉴、百科全书等。
参考工具书特点:查考性:参考工具书的编辑目的是供读者查考,而不是为了一般阅读,通过这类图书,人们可以简便而迅速地找到自己需要的知识信息。
概括性:参考工具书博采群书,对大量的原始材料加以取舍排比,浓缩出简明扼要的内容完整性:在一定的学科范围内收集的资料应全面、完备,能解疑释难。
易检性:参考工具书全部条目按照某种特定的方式组织成一个完整的体系,查检方便,一般附有多种索引,供人们从各个不同途径查找所需要的知识信息参考工具书作用:指示读书门径:书目提要、推荐书目、导读书目,能评价图书的得失,指导读书的方法和步骤。
解决疑难问题:工具书中的字典、词典、百科全书、年鉴、手册等,能帮助人们解决各种疑难问题。
提供参考资料提供丰富知识,便于掌握学术信息。
传播思想、文化知识。
参考工具书结构与编排:参考工具书一般有序、凡例说明、正文、辅助索引和附录等五部分组成。
序(前言):主要说明工具书的编辑目的,评论工具书的内容、特色、版本的演变及工具书的使用价值。
凡例说明(使用说明):主要说明本书的编排方式、著录格式以及使用方法等。
是指导读者迅速准确地使用工具书的指南。
正文:是参考工具书的主体部分。
正文的编排是否合理、科学、易于查检,是衡量工具书质量优劣的重要方法。
排检方式一般有五种 :(a)字顺法:是将参考工具书的内容按字、词的顺序系统组织排列的一种方法。
是参考工具书最主要的编排方法。
中文字顺法分为形序、音序、和号码3种排检方式。
形序又分笔画笔顺及部首法。
(b) 分类法:将全书的知识信息单元按照学科系统或事务性质进行分类并加以排列。
这种方法便于文献资料的族性检索,在查检到所需文献资料的同时,还可以获取大量的同类信息,使检索者对某一范围内的文献信息有一系统的了解。
《文献检索》第二章文献信息检索基础知识2
取;有的信息需要支付馆际互借的费);
b 确定搜集所需要的信息需要付出的时间 与精力; c 确定搜集所需要的信息和理解其内容是 否需要应用新的语种和技能(例如:信息是以 非中文/英文的语种表达信息内容的,要了解 其内容,则需要先学习一门新的语言;或是理 解信息内容需要应用到还未学过的学科知识)。
2.4.2 信息检索方法
5、在外文数据库中检索有关“儿童的天才教育” 方面的文献 (Infant or child or children) AND gifted education Gifted children AND Education
练习:计算查全率、查准率
相关信息 检出信息量 未检出信息量 20 10 非相关信息 30 1540
检索方法可以从已经掌握的一篇最新文献入手, 查找到它所引用的文献,再依据这些查出的文献, 查找到它们所引用的文献。如此反复,即可获得大 量的文献信息。
(3)循环法 是常用法与回溯法的结合,即先利用检索 工具查找出一批有用的文献,然后利用这些文 献所附的参考文献或原文中涉及的重要线索进 行追溯查找。
②倒查法 利用选定的检索工具, 由近及远地逐 年进行查找的检索方法。
特点: 以“查准”为主
宜于新的研究课题 较节省时间, 效率较高。
③抽查法 是在课题研究所处的发展高峰期的 若干年中进行查找。
特点: 快速检索的课题 较高的检索效率 前提是必须事先了解课题研究发展 的历史背景。
(2)回溯法
回溯法又称追溯法、引文法,是利用文 献末所附的参考文献或引用文献,由近及远 地进行追踪查找。
查全率
67%
查准率
40%
检索表达式主要有逻辑表达式、截词表达
式等 。
2.4.4.1逻辑表达式
文献检索-第二章 文献检索基本知识(100829)(包括第三章)共67页文档
分类语言就是用分类号和类目名称表 达学科体系的各种概念,将各种概念按学 科性质进行分类和系统排列。
体现这种分类体系的就是各种图书分 类法(表)。例如在我国广泛使用的《中 国图书馆分类法》(简称《中图法》)就 是其典型代表。
《中国图书馆分类法》(原称《中国图书馆图 书分类法》)是我国建国后编制出版的一部具有代 表性的大型综合性分类法,是当今国内图书馆使 用最广泛的分类法体系,简称《中图法》。《中 图法》初版于1975年,1980年出版的第二版, 1990年出版的第三版,2019年出版的第四版, 2019年9月出版了第五版。
马克思主义、列宁主义、毛泽东思想…… 哲学…… 社会科学……(扩充为9个基本大类) 自然科学……(扩充为10个基本大类) 综合性图书……
A ——马克思主义、列宁主义、毛泽东思想、 邓小平理论
B ——哲学、宗教 C ——社会科学总论 D ——政治、法律 E ——军事 F ——经济 G ——文化、科学、教育、体育 H —地理
4、全部条目科学地按一定规则组织成为一 个有机整体;
5、有索引部分,提供多种必要的检索途径。
二、检索工具的种类
主要有以下几种划分方法:
1、按著录内容划分
(1)目录:它是对图书、期刊等单 位出版物外表特征的揭示和报导; 是记录具体出版物和收藏单位情况 的工具。目录通常以一个完整的出 版单位或收藏单位为著录的基本单 位。
②叙词语言
它是以叙词作为文献内容标识和检 索依据的一种主题语言。叙词是从文献 的题目,摘要或正文中抽取出来,用以 表达文献基本内容的概念单元。叙词受 词表控制,词表中词与词之间无从属关 系,都是相互独立的概念单元。检索时, 利用这些概念单元组配起来,表达一个 复杂的概念。叙词语言特别适用于计算 机检索。
第二章、文献检索基础知识
(2)树状结构表: 树状结构表将字顺表中的主题词按照每个 词的词义范畴和学科属性,分别归入15个大类之中,多数 大类又进一步细分多达9 级。每一级类目用一组号码标明, 级与级之间用“.”号隔开。主题词上、下级之间采用逐级 缩进格式表现主题之间的隶属关系,每个主题词都有一个 或两个以上的树状结构号,该号是联系字顺表和树状结构 表的纽带。现摘录片段如下: Nervous System A8 Central Nervous System A8.186 Brain A8.186.211 Prosencephalon A8.186.211.730 Telencephalon A8.186.211.730.885 Basal Ganglia A8.186.211.730.885.105 Corpus Striatum A8.186.211.730.885.105.487 Neostriatum A8.186.211.730.885.105.487.550 Putamen A8.186.211.730.885.105.487.550.784
文献检索包括两方面的内容
一方面是文献线索 文献线索的查找,即如何利用检 文献线索 利用检 索工具的问题; 索工具 另一方面是特定原始文献 特定原始文献的查找,即在查 特定原始文献 找特定的文献线索后,找出原始文献 找出原始文献的过 找出原始文献 程。
文献检索的一般意义
促进素质教育,培养信息意识 避免低水平的重复劳动,全面掌握必要的文献 信息; 节省时间和费用,提高信息利用效率,促进信 息资源的开发; 促进专业学习,加速成才。
书名目录(Title Catalogue) 著者目录(Author Catalogue ) 分类目录(Classified Catalogue) 主题目录(Subject Catalogue )
第2章 文献信息检索基础
第2章 文献信息检索基础
2) 一次文献 一次文献又称为原始文献,是人们对研究或创造性活动成果的直接记录,一般指公开 出版的著作、期刊论文、科技报告、会议文献、学位论文、发明专利等。 3) 二次文献 二次文献是指通过科学的方法,将分散无序的一次文献经过筛选、分析、整理,按其 内容特征和外部特征进行提炼、浓缩,编制而成的有系统的文献,主要包括目录、文摘、 索引等。 4) 三次文献 三次文献是通过二次文献提供的线索,对某一范围的一次文献进行分析、综合研究、 归纳、整理等深加工所生成的文献。三次文献具有资料性和实用性等特点,是对一次文献 进行浓缩、提炼和重新组织的结果。 三次文献是按知识门类或专题将一次文献信息重新组织、高度浓缩而成的,是人们查 考数据信息和事实信息的主要信息源。 3. 根据出版形式划分 根据出版形式,文献通常划分为图书、连续出版物、特种文献三大类。 1) 图书 图书是对已有研究成果、生产技术知识、实践经验的论述和概括。按其内容性质和作 用,图书可分为普及读物、教科书、丛书、专著、论文集、参考工具书等。
第2章 文献信息检索基础
2) 连续出版物 连续出版物一般是指定期或不定期连续出版的刊物,包括期刊、报纸、年度出版物(年 鉴、指南等)以及成系列的报告、学会会刊和会议录等。连续出版物内容新颖,出版周期短、 速度快,能及时反映最新知识、最新科研成果和最新时事。 期刊(也称杂志)通常有连续的数字编号和发行的顺序时间,是一种以印刷或其他形式逐 次出版发行的出版物。期刊出版周期短,报道速度快,内容新颖广泛,信息量大,发行面 广。 报纸是一种以刊载新闻和评论为主的定期出版物。它比期刊时间性更强,出版周期更 短,报道信息更快。 3) 特种文献 特种文献通常指那些出版发行方式或获取途径比较特殊的文献。类型复杂多样,主要 包括专利文献、标准文献、会议文献、学位论文、科技报告、政府出版物、产品样本和档 案文献等。 专利文献蕴含着大量的技术、法律和经济信息,是记录有关发明创造信息的文献。专 利说明书是主体。与一般文献相比,专利文献具有及时性、新颖性、详尽性、系统性、实 用性、可靠性等特征。 标准文献是对工农业产品和工程建设的质量、规格、检验方法及其技术要求等方面做 出统一规定的规范性文献,具有一定的法律约束力。
第二章文献检索基础知识
• 用户只能根据自身的需要进行相应的调整两者 之间的比例。
检全率和检准率是评价检索系统 的检索效率的主要指标。
影响检索效果的主要原因
• 检索语言不当(沟通过程) • 检索系统收录文献不全,检索途径不齐全(
工具)
• 文献的标引深度不够,前后不一致或遗漏 了原文的重要概念或选词不当等(信息源) • 检索人员不具备选择检索词以表达文献主 题的能力(人)
• 追溯法:
又称回溯检索法、引文法、引证法、 是一种跟踪查找的方法。即以文献后面所 附的参考文献为线索,逐一追溯查找相关 文献的方法。在没有检索工具或检索工具 不齐全的情况下,利用此法能够获取一些 所需要的文献资料,但往往查全率不高, 回溯年代越远,所获取的文献越陈旧。
• 循环法:
又称交替法或分段法。是将常用法和 追溯法循环交替使用的方法,既是先用第 一种方法查出一定时期内地文献,再用第 二种方法查出前一时期的文献,如此交替 往前推移。
提高检索效果的措施
• 选择好的检索工具(手工或计算机) • 准确使用检索语言(用题名或作者) • 善于利用各种辅助索引(综合应用) • 提高检索策略制订水 • • 提出问题 分析研究课题,确定检索途径 实施检索 检索结果的分析与筛选
明确信息检索课题所涉及的学科范围 明确所需信息的类型,包括文献类型、时间范围、 语种、著者、机构等 明确信息检索课题对查新、查准和查全的指标要 求
分析研究课题
选择检索工具
确定检索途径
索取原始文献 按“由近及远、省 时省力”的原则
如:书名、刊名、人名、地名、语词等。
有分类索引、主题索引、关键词索引、科学引 文索引科技评论索引等
文献检索的方法
• 常用法 主要有: 顺查法、 倒查法、 抽查法
信息检索与利用 第2章 文献信息检索基础
2.1 文献信息概述
2.1.1 信息、知识、情报、文献 1. 信息 信息(information)一词原意是通知、报道或消息。作为一个科学概念,信息在19世纪末 最早出现在通信领域,是指通信系统传输和处理的对象。。根据近年来人们对信息的研究 成果,科学的信息概念可以概括为:信息是对客观世界中各种事物的运动状态和变化的反 映,是客观事物之间相互联系和相互作用的表征,表现的是客观事物运动状态和变化的实 质内容。利用文字、符号、声音、图形、图像等形式,通过各种渠道传播的信号、消息、 情报或报道等内容,都可以称之为信息。 一般认为,信息具有如下特点: (1) 普遍性和客观性。信息广泛存在于自然界、人类社会及思维领域中。只要有事物存 在,有事物的运动,就会有信息存在。而且,信息是不以人的意志为转移的。 (2) 存储性、传递性与依附性。信息是可以被存储和传递的。信息在空间上的传递称为 通信,在时间上的传递称为存储。存储和传递是信息的两种基本状态,存储是静态的(相对), 而传递则是动态的。信息的存储与传递都离不开物质作为“载体”和“媒体”,即信息必 须依附在一定的载体上才能被传递和利用。 (3) 共享性。同物质与能量的传递不同,信息源在发出信息后其自身信息并不减少,而 且同一信息可以同时被不同的人共同享用。 (4) 时效性。信息是有价值的,但是信息的价值又会随时间的推移而改变甚至消失。
(5) 价值相对性。相同的信息对不同的人会产生不同的效果和结局。这就是信息价值的 相对性。
2. 知识 知识是与信息相联系又有区别的概念。知识是主体获得的系统化、组织化了的信息。 知识反映了主体对客观事物存在及变化的内在规定性的认识,是主体获得的与事物存在及 变化内在规定性有关的结构化、系统化的信息,是信息的高级表现形式。 3. 情报 情报是指被传递的知识或事实,是知识的激活,是通过一定的载体,越过空间和时间 传递给特定用户,解决科研和生产中的具体问题所需要的特定知识和信息。情报既不等同 于知识也不等同于信息,它是为实现主体某种特定目的,有意识地对有关的事实、数据、 信息、知识等要素进行劳动加工的产物。目的性、传递性和效用性是情报最基本的属性。 4. 文献 我们可理解为,文献就是将知识、信息用文字、符号、图像、音频等记录在一定的固 态载体上的结合体。可以说,文献是信息的有形载体,是将游离流动的信息固化在物质载 体上而形成的。 文献由四个要素构成: (1) 信息内容,即文献所记录的知识和信息,这是文献的灵魂。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章文献信息检索基础第一节文献信息检索的概念与过程一、文献信息检索的作用文献信息检索的作用主要体现在以下两方面。
1.充分利用文献信息资源,避免重复劳动科学研究具有继承和创造两重性,科学研究的两重性要求科研人员在探索未知或从事研究工作之前,应该尽可能地占有与之相关的文献信息,即利用文献检索的方法,充分了解国内、国外,前人和他人对拟探索或研究的问题已做过哪些工作?取得了什么成就?发展动向如何?等等。
这样才能做到心中有数,防止重复研究,将有限的时间和精力用于创造性的研究中。
因此,文献信息检索是科学研究必不可少的前期工作。
2.为人们更新知识,实现终生学习提供门径在当代社会,人们需要终生学习,不断更新知识,才能适应社会发展的需求。
美国工程教育协会曾估计,学校教育只能赋予人们所需知识的20%~25%,而75%~80%的知识是走出学校后,在研究实践和生产实践中根据需要,不断再学习而获得的。
因此,掌握文献信息检索的方法与技能,是形成合理知识和更新知识的重要手段,是做到无师自通、不断进取的主要途径。
二、文献信息检索的概念1.信息检索的概念:信息具有共享性。
信息资源共享(information resource sharing)是当今社会的一个发展趋势。
为了分享人类共同的知识财富、研究成果,人们必须通过一种科学的方法从取之不尽的信息资源中去识别和获取所需要的那部分信息,这个过程就是信息检索(information searching)。
信息检索在信息处理和增值中具有重要意义。
信息的检索、利用和创造是一个循环和增值的过程,人们通过检索获得信息,经过处理筛选出自己需要的部分,在利用信息的过程中又创出新的信息,这些信息经过核准后又被标引、组织进检索工具,再提供人们使用,信息在这个循环的处理过程中不断得到扩充,它的增长是没有穷尽的。
如下图所示:保留/信息检索的概念有狭义和广义之分。
从广义上讲,信息检索应该包括信息的存贮与检索两方面的含义。
信息的存贮(information storing): 将信息按一定的方式组织起来,是指信息的有序化、系统化。
信息的检索 (information retrieval): 根据用户的需要,从系统化的有序信息集合中准确查找出特定相关信息的过程。
即信息的“查询”。
信息的存贮方式与检索方式是对应的。
对于信息检索而言,当前更普遍使用的术语是信息存取。
信息存取 (information access): "Assess" 该词源于计算机学科领域,指计算机访问文档或数据集的方式。
信息存取是将所有信息的存贮、检索活动与先进的计算机技术融合在一起,并将其引入信息检索的范畴。
它从本质上拓宽了信息检索的内涵与应用。
如果检索的对象是文献,那么就属于文献检索。
从狭义上讲,信息检索指的主要就是信息的“查询”。
2.信息检索的类型:(1)根据检索对象的不同,信息检索可以分为数据检索、事实检索、文献信息检索、文献全文检索、。
①数据检索数据检索以具有数量性质,并以数值形式表示的数据为检索对象。
这些数据都是经过有关学科领域的专家学者仔细挑选、反复验证、认为准确可靠,并且可以被人们直接使用。
因此这些数据也可以看作是浓缩型的信息。
因此,数据信息检索是一种确定性检索。
例如,查找各种物质的物理化学常数、各种统计数据和工程数据等属于数据检索的范畴。
②事实检索事实检索以事实为检索对象。
所谓“事实”又包括各种事件、事情发生的时间、地点、起因、经过、结局和预后,也包括对事物或事项本原的检索。
检索的结果是有关某一检索课题的具体答案,因此,事实检索也是一种确定性检索。
但事实信息检索过程中所得到的事实、概念、思想、知识等非数值性信息和一些数值性信息须进行分析、推理,才能得到最终的答案,因此要求检索系统必须具有一定的逻辑推理能力和自然语言理解功能。
目前,较为复杂的事实检索课题仍需人工才能完成。
例如,“有哪些海外华人得过诺贝尔奖?”“中国发明专利历年的申请案中,国外来华申请历年所占的百分比是多少?”这些事实信息,就需要对历年的数据进行统计,然后进行比较分析,才能得出具体答案。
③文献信息检索(简称“文献检索”)文献信息检索:以文献的题名、作者、摘要、来源出处、专利号、标准号、收藏处所等文献信息为检索对象,简称“文献检索”。
检索的结果是与检索课题相关的一系列文献信息(相关文献线索),检索结果不直接解答课题用户提出的技术问题,只提供与之相关的文献线索供参考,用户通过阅读后才决定取舍,因此,书目信息检索是一种相关性检索。
例如,调查“甲壳素水解制壳聚糖”的国内外专利技术有哪些,就属文献检索的范畴。
文献检索又有广义和狭义之分。
从广义上讲,文献检索也包括文献的存贮与检索两方面的含义。
文献的存贮(document storing): 是指将分散的、无组织的一次文献按一定的方式组织起来,使之有序化、系统化,并形成文献检索工具的过程。
文献的检索 (document retrieval): 则是根据用户的需要,从文献检索工具(系统化的有序文献信息集合)中准确查找出相关文献信息的过程。
即文献的“查询”。
从狭义上讲,文献检索指的就是文献的“查询”。
即:指根据一定的需要和目的,利用有关的检索工具,按照一定的方法、途径和步骤,查找出用户在特定时间和条件下所需文献信息的过程。
④文献全文检索(简称“全文检索”)全文检索以科研论文或专利说明书等文献的全文为检索对象,简称“全文检索”。
检索的结果是与课题相关的原始文献的全部文本,检索结果也不能直接解答用户提出的技术问题,因此,全文信息检索也是一种相关性检索,它是在文献信息检索基础上进行的更深层次的内容检索。
通过对全文的阅读,可进行技术内容及研究方向的对比分析,掌握与研究课题的相关程度,为研究的创新点提供参考与借鉴。
综上所述,数据检索是从存贮有大量数据、图表的检索系统中获取数值性数据,检索工具为各种手册、年鉴、图谱、表谱等参考工具书以及数值型数据库检索系统;事实检索是从存贮有大量知识信息、事实信息的检索系统中获取某一事实的具体答案,检索工具为各种字典、辞典、百科全书、年鉴和名录等参考工具书以及事实型数据库检索系统;文献检索是从存贮有题名项、作者项、出版项或文摘项的检索系统中获取有关的文献线索,检索工具为各种书目、文摘和索引等检索期刊或相应的文献信息数据库检索系统;全文检索是从存贮整份文献(整篇论文、专利说明书乃至整本著作)的全文检索系统中获取原始文献的全文,检索工具为各种全文数据库、电子图书馆或者专利说明书全文数据库系统。
(2)根据信息组织方式的不同,信息检索可以分为文本检索、超文本检索、超媒体检索。
①文本检索(Full Text Retrieval):是针对存贮于数据库中的整本图书、整篇文章中的任意内容进行的检索。
文本检索可以根据读者的需要获取文本数据库中的有关章、节、段、句、词等任何信息进行。
检索结果即可以是文本自身,也是可以对文本进行各种统计分析的结果。
例如,“《红楼梦》一书中‘贾宝玉’一共出现过多少次?”等问题就可以通过文本检索加以回答。
②超文本检索(Hyper Text Retrieval):是指对计算机网络节点中所存贮的文本信息以及超连接文本信息进行的检索。
它强调网络中心与网络节点之间的语义联接结构,依靠系统提供的复杂工具进行图示穿行和节点展示,提供浏览时查询以及跨库检索。
③超媒体检索(Hyper Media Retrieval):是指对存贮于计算机和计算机网络中的文本、图像、声音等多种媒体信息的检索。
它具有多维存贮结构,采用方向性链接。
与超文本检索一样,它也可以提供浏览时查询以及跨库检索。
(3)根据检索技术手段的不同,信息检索可以分为:手工检索(手检)和计算机检索(机检)①手工检索(manual retrieval):多使用印刷型或书本型检索(paper-based retrieval)工具,早期有检索卡片,现在使用最多的是检索期刊,它们定期地将最新收集到的信息加以汇总、组织和报道。
手工检索的技术要求不高,以人的劳动为本,由人来翻阅,由人来进行比较、选择,完成匹配。
手工检索工具能提供的检索途径十分有限,检索结果往往不尽人意。
②计算机检索(computer-based retrieval):技术含量高,它是通过计算机对数据库系统的操作来实现的。
计算机检索不仅需要先进的技术设施,也要求较高的人的文化素质。
检索系统包括:计算机主机设备、外部存贮器、输入输出设备、终端设备、通信设备等硬件设施,还需要控制、检索软件系统,包括:通信软件、操作系统、应用程序等,以实现对数据库的信息存取。
检索过程是在人与机器的合作、协同下完成的,它们经常用实时的(real time )、交互的(interactive )的方式从计算机存贮的大量数据中自动分拣出用户所需要的信息。
计算、比较、选择的匹配任务是由机器来执行的,而人则是整个检索方案的设计者和操纵者。
这里,检索的本质没有变,变化的是信息的媒体形式、表示方式、存贮结构、存取方式。
计算机检索又可以细分为光盘检索、联机检索和网络检索。
③ 计算机检索的优势计算机检索明显优于手工检索,主要表现为检索的信息量大、数据更新快、检索功能强、检索结果输出的多样性等。
检索的信息量大:且不说大型机器的海量存贮,一张普通光盘的信息存贮量就达650M ,相当于几十万页的印刷性图书。
计算机若与全球网络相连,就能获得世界范围的信息。
数据更新快:计算机处理与电子传输的速度快、数据的动态、及时更新、检索的实时性都是手检工具无法比拟的。
检索功能强:机检系统可提供很多检索途径,对一个检索途径还可以同时取若干个检索属性值,从多点交叉切入,有多重限定,有多种组合方式,允许人机交互,能达到高效、高精度的检索效果。
并具有多库检索,多媒体和多种知识检索功能。
检索结果输出的多样性:用户可以选择各种输出形式和输出格式,比如屏幕显示、拷贝、下载、打印等都是常用的方式,输出的内容、格式和形式可选择或自行定义。
总的趋势是机检方将逐步取代手检方式。
当前许多经典的印刷型工具都有与其相对应的电子数据格式、数据库,印刷工具则成了电子数据加工输出的“副产品”,许多新生的数据库不再与印刷型工具有缘,仅有其电子版本。
三、文献检索的过程文献检索的基本过程是:通过对大量的、分散无序的原始文献信息进行搜集、加工、整序,建立各种各样的检索系统,并根据用户的需要,从中查找出用户所需特定的文献信息(文献线索)。
文献检索的关键在于通过一定的方法和手段使文献的存贮与检索这两个过程所采用的特征标识(检索标识)保持一致,以便有效地获得和利用文献资源。
其中存贮是为了检索,而检索是存贮的根本目的所在。
文献存贮和检索的全过程如下图所示:原始文献加工文摘款目整序检索语言检索课题分析检索表达式检索系统规范化检索结果→↑→→→加工↑输入检索标识智能匹配→→文献信息的存储过程→文献信息的检索过程存贮的过程,主要对信息源进行搜集、加工和整序。