第二章 检索基础知识

合集下载

第二章 文献信息检索基本知识(2).概要

第二章 文献信息检索基本知识(2).概要
(大学生or本科生or研究生)-(大专生or高职生) and 就业
(2)截词检索表达式
用截词符号“*”、“?”或“$”加在检索词 的前后或中间,以检索一组概念相关或同一词根 的词。 按截断的位置可分为:
前截断、中间截断、后截断 按截断的字符数量可分为: 有限截断(?)、无限截断(*)
如:输入检索式“Comput*”,将检出包含 Computer、Computing、Computed、 Computerization 等词汇的结果。
第二章 信息检索基础知识
2.3 文献信息检索的工具
1、文献信息检索工具概述 检索工具是将大量分散无序的文献资料经过加 工整理,按照一定的规则和方法编制起来,用来 报道、存储和查找文献的工具,是附有检索标识
的某一范围文献条目的集合。
传统的检索工具是人们利用手工方法编制的
工具书,有字典、词典、目录、百科全书、名录、 类书、政书、表谱、图录等。这些工具书是人们
题录示例
(3)索引(引得) 索引是将书刊内容中所论及的篇名、语词、主 题等项目,按照一定的排检方法加以编制,注明出 处,供读者查检使用的检索工具。 索引与目录的根本区别就在于著录的对象不同, 目录所著录的是一个完整的出版单位,索引所著录 的则是完整的出版物的某一部分、某一观点、某一 知识单元,提高文献检索的深度和检索效率。
完全一致(精确匹配)、任意一致(模糊匹配)
等。
讨论1: 我馆书目查询系统共有多少种检索方式?其基 本检索有多少个检索字段?
讨论2: “中国学术期刊网络出版总库”有哪些检索方式?

? ? 中国科技期刊数据库初级检索界面
2、 信息检索方法
(1)常用法 ①顺查法 ②倒查法 ③抽查法 (2)回溯法 (3)循环法

第二章 信息检索基本知识

第二章 信息检索基本知识

(二)按出版形式划分:
原始文献
图书
特种文献
期刊
会 议 文 献
科 技 报 告
专 利 文 献
学 位 论 文
政 府 出 版 物
其 标 准
食品标准网

7-111-17892-0
《发票报文》GB/T 17303.2-1998 第二部分:国际贸易商业发票报 文
……
(三)按信息的加工程度来分: 1、一次文献信息 (原始文献):
一、检索工具的作用 1、报道作用 2、存储作用 3、检索作用
二、检索工具的特点
1、详细而又完整地记录了文献的外部特征和内部特征。
2、对所著录的文献,标引了可供检索的检索标识。 3、提供必要的检索手段,配备各种体系的索引。
三、检索工具的类型
按著录信息的特征划分:
1、目录 2、题录 3、文摘 4、索引
检索途径-分类途径 分类途径的缺点是新兴学科、边缘学科在 分类时往往难于处理,查找不便。另外, 从分类途径检索必须了解学科体系,否 则在将概念变换为分类号的过程中常易 发生错误,造成漏检或误检。
检索途径-主题途径
• 主题途径是一种按照文献的主题内容查找文献 的途径。使用的语言是主题语言。使用的检索 工具有“主题索引”、“关键词索引”、“叙 词索引”等。 • 主题法打破了传统的学科分类的框框,把分散 于各个学科的有关文献集中于同一主题词之下, 以文字作检索标识,索引按照资料内容的主题 词或关键词的字顺排列,检索时就象查字典一 样,不必考虑学科体系。
更多……
• 按检索方式,可分为印刷型检索工具和机器检 索工具; • 按出版形式,可分为期刊式检索工具、书本式 检索工具、卡片式检索工具、缩微式检索工具、 机读式检索工具等; • 按收录范围,可分为综合性检索工具、专题性 检索工具; • 按语种,可分为中文检索工具和外文检索工具;

第二章 文献信息检索基础知识

第二章 文献信息检索基础知识
载体是感光材料,如缩微平片、缩微胶卷。 另外,还有一种计算机输出缩微胶片。
这类文献特点是体积小、信息密度高、 轻便,易于传递,保存容易。但使用时必须 借助于放大设备。

电子型文献(Electronic Document)
原称机读型文献。是指以数字化技术将文献
存储在光、磁载体上,通过计算机或网络进行阅

2、学术期刊 (Periodicals,Journal,Magazine):
指有固定名称和统一的出版形式,按一定规律定
期或不定期连续出版的文献载体,与报纸属于称
连续性出版物。
(1)期刊的特征:
统一的刊名,有连续的年、卷、期及页码;
有国际标准连续出版物刊号ISSN (International Series Standard Number) ISSN由8位数字分两段组成,如1000-0135,前7 位是期刊代号,末位是校验号。
(3)期刊著录格式:
作者(多作者用逗号分开,超过3个者用“等或 et al”). 文章题目[J].刊物名称,年代,卷数(期 数):页数 如: Porter MF, Zhang J. An algorithm for suffix stripping. Program, 1980, 14(3):130~137
P:专利文献类别代码
(2)专利文献著录格式
专利申请者.
专利题名:专利国别(或地区), 专利号[P].出版日期. TACHIBANA R, SHIMIZU S, KOBAYSHI S, et al. Electronic watermaking method and system: US, 6,915,001[P]. 2002-04-25.
(1)图书的特征
图书没有统一的开本

检索基础知识

检索基础知识


主题词的表现形式

标题词:表述信息主题内容的规范化词(先组式 主题法) 元词:标引信息主题的词语是字面上不能再分的 基本词语(后组式主题法) 叙词:表述信息主题内容的规范化词(后组式主 题法) 关键词:表述信息主题内容的非规范化词(后组 式主题法)
三、检索系统
(一)文献检索系统定义 是指按某种方式、方法建立起来的供文 献信息用户查检文献信息及原始文献的一 种有层次的体系,是表征有序的信息特征 的集合体。(包括各种手工检索工具和各类 计算机检索系统)
元(如一篇文章,图书中的一部分,有时也可以是整本出版物)为基本著录单位。
示例1:
3. 文摘 ( abstract )——更有利于用户判断检索结果 的准确性。
文摘是指对一份文献(或称一个文献单元)的内容所做的简略、 准确的描述,文摘的著录项目除了著者,篇名及出处等外,还有表 示文献内容特征的摘要。
4. 索引 ( index )
检索工具的著录对象
目录:单位出版物 题录:单位出版物中的单篇文献 文摘:单位出版物中的单篇文献 索引:单位出版物或单篇文献中的知识单 元



手工信息检索工具的著录项目
目录: 注项 题录: 文摘: 索引: 出版物名称--编著者--出版项—附 题目/著者//出处 题目/著者//出处、文摘 知识单元---顺序号(或页码)

五、检索步骤
分析检索课题,明确检索要求 选择检索工具,确定检索途径 确定检索标识,确定检索运算 构筑检索提问,获取初步结果 调整检索策略,获取所需信息

六、检索效果的评价及其优化
检索效果评价的意义—— (1) 提高检索效率 (2) 改善系统性能
检索效果评价的指标

文献检索-第二章__文献检索基本知识

文献检索-第二章__文献检索基本知识

Z——综合性图书
O 数理科学和化学 (一级类目) O1 数学 (二级类目) O3 力学 O4 物理学 O6 化学 O61 无机化学(三级类目) O611 化学元素与无机化合物 (四级类目)

图书馆图书的排架与查询:

图书是按索书号排列在书架上的 图书查询先确定索书号 索书号:由图书分类号和书次号组成;分类号在上,书 次号在下。


⑶事实检索
事实检索以特定客观事实为检索对象,检索结果是某一具体 的、客观存在的事实。 如:查找“前事不忘、后事之师”最早的出处。

信息检索的类型

按照检索方式的不同,分为手工检索和计算机检索。

手工检索:用人工来处理和查找所需信息的检索过程。主要 依靠印刷型的二次文献,如文摘、目录等。
计算机检索:利用计算机和一定的通信设备查找所需的信息。 如联机检索和网络检索。
(2)主题途径
从文献中抽选出来的,代表文献内容实质词 汇——主题词,包括关键词、标题词、叙词等作 为检索标识,进行文献检索的一种途径。
(3)著者途径
根据已知文献著者(作者)的姓名来查找 文献的途径。
(4)名称途径
根据文献的名称来查找文献的途径。如: “书名目录”、“刊名目录”。
(5)序号途径
以文献的编号为特征编排和检索文献的途 径。如:“专利号索引”、“报告号索引”等。
(6)其他途径
有些检索工具还附有一些特殊索引,可提 供从特殊途径查找所需文献的线索。如《CA 》中的分子式途径、环结构式途径等。
3、文献的检索步骤
(1)分析研究待查课题
检索的目的是什么? 课题属于什么学科专业? 需要什么类型的文献?(中文,外文文献) 所需文献的年代范围等 另外,还需要了解与检索课题相关的专业背景知 识、有关的专业名词、术语等。

第二章检索基础知识-北方工业大学多模式教学网站

第二章检索基础知识-北方工业大学多模式教学网站

第二章检索基础知识一、判断题1、图书指内容比较成熟、资料比较系统、有完整装帧形式的出版物。

()2、综述因附有大量参考文献,所以是二次文献。

()3、三次文献是在合理利用二次文献的基础上,对一次文献内容进行归纳、综合而撰写的专著,图书、专利、产品、报纸都属于三次文献。

()4、信息检索实际上就是利用二、三次文献查找一次文献的过程。

()5、追溯法是利用已知的有关文献后所附的“引用参考文献”进行追溯查找相关文献的方法。

()6、中文期刊全文数据库(维普)提供的检索字段包括“基金资助”。

()7、我馆引进的重庆维普数据库检索系统能查到企业名录。

()8、通过万方的中国标准全文数据库可以查找标准文献的全文。

()9、CNKI仅提供CAJ格式的电子文献全文下载。

()10、在我馆购买的超星电子图书中可以查看全文电子期刊。

()二、关键词提取练习请从下列十个题目中任选五道题完成。

示例:信息战中数据访问和集成模型设计与实现关键词:信息战数据访问数据集成1.自动控制技术在地质灾害治理工程施工中的运用关键词:2.《高频电子技术》课程改革与实践关键词::3.地下车库中诱导通风系统的应用关键词:4.高尚建筑住宅小区的树种及花卉选择关键词:5.秦巴山地传统民居建筑保护与发展关键词:6、物联网中可信控制技术研究关键词:7、数字电视信号传输研究关键词:8、城市短波通信线路计算及CAD技术的应用关键词:9、谈建筑设计与城市设计的关系关键词:10、城市道路照明节能技术关键词:三、写出以下题目各自的检索表达式,注意检索词(包括相关词、同义词)和逻辑算符的使用,并判断有可能在本馆的哪些数据库中找到相关的文献?示例:2005年以来中国企业海外并购研究进展表达式:题名=(中国企业+我国企业)*题名=(海外并购+跨国并购)*题名=(研究进展+综述+述评)*时间=(2005-2011)数据库名称:中国期刊全文数据库、中文期刊全文数据库(维普)、人大复印报刊资料数据库、中经网教育专网注意:可以用多种检索字段进行检索1、数字图像匹配算法研究及实现2、奥运经济与拉动内需3、查找北方工业大学信息工程学院李晋宏教授的研究领域四、请在中国期刊全文数据库中,选择“电子技术与信息科学辑”,选择篇名作为检索字段,查找2010年以来关于“国家信息化”方面的论文有多少篇?并写出相应的检索表达式。

第二章 检索基本知识_PPT幻灯片

第二章 检索基本知识_PPT幻灯片

数据库
数据库的定义 数据库的类型 数据库的结构 数据库的检索途径
根据ISO/DIS 5127号标准(文献与情报工作术语), 数据库(database, databank)被定义为:“至少由 一种文档组成,并能满足某一特定目的或某一特定 数据处理系统需要的一种数据集合。”
通俗地说,数据库就是在计算机存储设备上(磁 带或磁盘)按一定方式存储的相互关联的数据集 合。
知识库是按一定要求存贮在计算机中的相互关联 的某些事实或知识的集合,它经过分类、组织和有序 化,成为构造专家系统(ES)的核心和基础。
网上医学多媒体数据库有:NLM的The Visible Human Project(可视人计划),Tox Town(用图像、 文字、声音、动画等形式传授化合物、环境与人体 健康关系知识的科普数据库),NIH Senior Health (兼有文字和声音朗读功能的老年卫生知识库)等。
6.知识库(Knowledge Base)
• 写读光盘:也叫写一次光盘,即WORM(Write Once Read Memory),是第二代光盘。
• 可擦写光盘:也叫读写式光盘,即ORAM(Optical Random Access Memory),是第三代光盘。
特点: 1. 存储容量大; 2. 读取速度快; 3. 稳定性好; 4. 库存寿命长; 5. 使用方便; 6. 性能价格比高
或者可简单地将数据库定义为:一个或多个机器可 读的,并按一定方式编制而成的文献记录集合。
数据库
数据库的定义 数据库的类型 数据库的结构 数据库的检索途径
按数据库的内容划分为以下类型
• 1.书目数据库(Bibliographic Database) • 2.事实数据库(Fact Database) • 3.数值数据库(Numeric Database) • 4.全文数据库(Full-Text Database) • 5.多媒体数据库(Multimedia Database) • 6. 知识库(Knowledge Base)

信息检索教程(第二章)

信息检索教程(第二章)

4
(b)按收录文献出版形式分
●图书目录 ●期刊目录 ●会议论文目录 ●标准目录等。
(c)按物质形式划分
●卡片目录 ●书本目录 ●机读目录 ●联机公共检索目录等。
5
(2)图书馆目录、OPAC和联合目录概述
①图书馆目录
定义:它主要提供馆藏资源的检索,又叫馆藏目录,它反映
了一个图书馆的文献收藏情况,是一种重要的检索工具。
26
常用法示例
27
追溯法示例
28
2.3.2检索途径
29
30
1.分类途径
图书期刊分类法
世界三大图书分类法
《杜威十进分类法》(DDC)(Dewey decimal Classification ) 《国际十进分类法》(UDC)(Universal Decimal Classification) 《国会图书馆图书分类法》(LCC)(Library congress classification)
定义:所谓文献检索的方法,即查找文献的方法。有以下三种: 常用法:直接利用文献检索工具或检索系统来查找文献的方法,是 一种常规的科学检索方法。又称工具法或直接法。分为顺查法 、倒查法和抽查法。 追溯法:是一种跟踪查找法。它不利用检索工具只是利用文献(尤其 是评述性论文或专著) 后面所附的参考文献进行逐一地追踪查 找原文。又称引文法。 综合法:是常用法和追溯法的综合。利用检索工具或检索系统进行 常规检索,再利用文献后所附参考文献进行追溯检索,分期分 段交替使用这两种方法,直到满足要求为止。可以查得较全面 较准确,尤其适用于那些过去年代内文献较少的课题。称循环 法、分段法或交替法。
22
2.2.2检索工具的鉴别与评价
1.信息收录范围与信息质量

第二章 信息检索基础知识

第二章 信息检索基础知识

全文检索
图像检索 超文本检索
文献检索
使用以二次文献为存储对象的信息系统,如目录
型、题录型、文摘型数据库,是一种相关性检索。特 点:检索结果不直接解答课题用户提出的技术问题, 只提供与之相关的线索。 例如:查找有关“食品安全与人类健康 ”方面的
国内外信息有哪些?
数据检索
以数值信息为检索对象,通过检索,用户可以获 得所需要的确切数据,是一种确定性检索。它一般以
的方式记录在相应的信息载体上,组织成系统
化的检索系统。
1. 数据库及其构成
数据库(database):至少由一种文档组
成,并能满足某一特定目的或某一特定数据处
理系统需要的一种数据集合。 通俗地说,数据
库就是在计算机存储设备上,按一定方式存储的 相互关联的数据集合,是信息检索的基础。
1. 数据库及其构成
一、信息检索的效果评价指标 二、影响检索效率的主要因素
一、信息检索的效果评价指标
以一个检索提问去检索任何一个数据库都会出现 4 个相关量:检出的相关信息量、未被检出的相关信 息量、检出的非相关信息量、未检出的非相关信息量。
一、信息检索的效果评价指标
1. 查全率 a 查全率(R )= —— ×100% a+c 查全率是对所需信息被检出程度的信息量指标。 2. 查准率 a 查准率(P )= ——×100% a+b 查准率是衡量拒绝非相关信息的指标。
中国图书馆分类法的体系结构:
S农业科学类目简表
(2)按事物的性质分类
按事物的性质分类 --- 热门主题 : 各种搜索引擎和网站 按事物的性质分类 --- 功能(使用方向)主题: 国际专
利分类法(IPC)
2.主题描述及信息检索语言

新第二章 信息检索基础知识

新第二章 信息检索基础知识

2.2 信息检索语言
三、主题语言
4.关键词语言
是指从文献标题、文摘、正文中抽离出来的,对表征文献主题 内容具有实质意义的语词,以关键词作为信息标识和检索依据的主 题语言。关键词没有固定的词表,因为对于同一个事物的概念,不 同作者甚至是同一个作者在不同的著作中用词都会不同,它是没有 经过规范化的自然语言词汇。 在检索中文医学文献中使用频率较高的《CMCC》数据库就是 采用关键词索引方法建立的。
2.5 计算机检索技术 四、词组检索
将固定词组或短语 看成单个词进行处理。
常用“ ”作为词组检索的运算符。
2.5 计算机检索技术 五、字段检索
对指定的一个或多个字段进行检索,从而提高查准率或查全率。
标题、作者、摘要、关键词、作者单位、文献来源、学位授予单位、 学位级别、会议信息、会址、会期、书名、出版地、出版年、专利号、报 告号、ISBN、ISSN等。
2.2 信息检索语言
一、信息检索语言的定义、作用和种类
4.分类:
篇名(题目) 著者名称 描述文献外表特征 文献序号 引用文献 等级体系分类语言 分类语言 组配分类语言 主题语言
检索语言
描述文献内容特征
代码语言
标题词语言 关键词语言 单元词语言 叙词语言 分子式索引 结构式索引 专利号索引等
2.2 信息检索语言
2.4 信息检索标识 一、检索标识的定义
检索标识即检索词,是指能表达检索课题主题概念和信息需 求的名词术语、分类号、名称、代码等的总称,包括主题词、 关键词、名称、分类号、分子式、专利号及各种号码。
2.4 信息检索标识 二、信息检索标识的类型
1.描述信息内容特征的检索标识: 分类、主题、代码(符号)。
2.5 计算机检索技术 一、布尔逻辑检索

文献检索基础知识

文献检索基础知识

UDC LC CC
(比)英特勒等
美ห้องสมุดไป่ตู้国会图书馆 编目组
(印)阮冈纳赞
混合 体系 组配
书目分类法
BC
(美)布利斯
混合
9
体系分类法
定义:以学科分类为基础,依据概念的划分与概括原理 ,把概括文献内容与事物的各种类目组成一个层层隶属 、详细列举的等级结构体系的一种分类法。
分类法
编制说明 分类表 复分表
10
《杜威十进分类法》(DDC)
000 总论 100 哲学 200 宗教 300 社会科学 400 语言 500 自然科学 600 应用科学 700 艺术 800 文学 900 历史、地理
510 数学 520 天文学 530 物理学 540 化学 550 地球科学 560 古生物学 570 生命科学 580 植物学 590 动物学
中国图书馆
《中国科学院图书馆图 书分类法》
《中国人民大学图书馆 图书分类法》
科图法 人大法
中国科学院图书馆
中国人民大学图书 馆
体系 体系 体系
《中国档案分类法》 中档法
国家档案局
体系
8
国际常用分类法
分类法名称
简称
主编
体系结构
杜威十进分类法
DDC
(美)杜威
体系
国际十进分类法 美国国会图书馆分类法
冒号分类法
东思想
50 自然科学(总论)72 能源学、动力工程
10 哲学
51 数学
73 电技术、电子技术
20 社会科学(总论)52 力学
74 矿业工程
21 历史、历史学 53 物理学
75 金属学(物理冶金)
27 经济、经济学 54 化学

第二章、文献检索基础知识

第二章、文献检索基础知识

(2)树状结构表: 树状结构表将字顺表中的主题词按照每个 词的词义范畴和学科属性,分别归入15个大类之中,多数 大类又进一步细分多达9 级。每一级类目用一组号码标明, 级与级之间用“.”号隔开。主题词上、下级之间采用逐级 缩进格式表现主题之间的隶属关系,每个主题词都有一个 或两个以上的树状结构号,该号是联系字顺表和树状结构 表的纽带。现摘录片段如下: Nervous System A8 Central Nervous System A8.186 Brain A8.186.211 Prosencephalon A8.186.211.730 Telencephalon A8.186.211.730.885 Basal Ganglia A8.186.211.730.885.105 Corpus Striatum A8.186.211.730.885.105.487 Neostriatum A8.186.211.730.885.105.487.550 Putamen A8.186.211.730.885.105.487.550.784
文献检索包括两方面的内容
一方面是文献线索 文献线索的查找,即如何利用检 文献线索 利用检 索工具的问题; 索工具 另一方面是特定原始文献 特定原始文献的查找,即在查 特定原始文献 找特定的文献线索后,找出原始文献 找出原始文献的过 找出原始文献 程。
文献检索的一般意义
促进素质教育,培养信息意识 避免低水平的重复劳动,全面掌握必要的文献 信息; 节省时间和费用,提高信息利用效率,促进信 息资源的开发; 促进专业学习,加速成才。
书名目录(Title Catalogue) 著者目录(Author Catalogue ) 分类目录(Classified Catalogue) 主题目录(Subject Catalogue )

检索基础知识

检索基础知识
出版周期长,信息传递慢; 传授知识,而不是报道最新情报。
图书一般分为两类: 阅读型:教科书、专著等 工具型: 字典、百科全书、年鉴、手册
国际标准书号(ISBN)
(-International Standard Book Number) 每一种正式出版的图书的唯一标识代码。 ISBN7-5013-1289-3北京图书馆出版社 第一段:语区号,代表国家、地区、语种,如0,1- 英,2-法,3-德,4-日,7-中 第二段:出版商代号,由国家或地区ISBN中心分配; 第三段:出版图书号,由出版商按出版顺序所给 第四段:校验位
2.1 中外文电子图书数据库
超星数字图书馆 读秀图书搜索与阅读平台 Apabi数字图书馆 龙语瀚堂典籍数据库(中文、历史) 金图国际外文数字图书馆(英文)
2.2 中文期刊全文数据库系统——数字化期刊子库 人大复印资料 博看网(畅销综合期刊)
2.3 学位论文全文数据库
C资源系统--学位论文数据库 欧美硕博论文数据库(PQDD 英文)
2.4 中文会议论文数据库
CNKI系列数据库-中国重要会议论文全万方数据资源系统2.5 电子报纸数据库
CNKI系列数据库-中国重要报纸全人民日报网络光盘版2.6 外文期刊全文数据库(综合型)
1、Science Direct数据库 2、Springlink & Kluwer数据库 3、SpecialSciDBS(国道数据) 4、InfoTrac OneFile数据库
2.7 文摘、引文数据库
中文引文数据库:
1、中国科学引文索引(CSCD) 2、中国社会科学引文索引(CSSCI) 3、全国报刊索引
万方数据资源系统
—中国标准全文数据库
2.10 文献传递的数据库(读者操作)

第二章信息检索基础1

第二章信息检索基础1

化学物质登记号(CAS registry number)检索
分子式(formula)检索 记录顺序号(accession number)检索 化合物结构图检索(structure search)检索 ……
不同检索途径常用字段名称
题名途径:题名、标题、篇名、题目、title 分类检索途径:分类号,中图分类号 主题途径:主题词、MeSH、MeSH terms、 Thesaurus、map term to subject headings 关键词途径:关键词、keywords、text words 著者途径:(第一)作者、著者、责任者、 author、first author
研、生产中的具体问题所需要的特定知识或信息。(微波炉
发明) (四)文献(Literature) 文献是记录有知识的一切载体,是知识的外在形式。
情报的基本属性
知识或信息 经过传递
经用户使用产生效益 情报的 基本属性
信息与知识、情报、文献的关系
知识源于信息,是信息的一部分 情报源于知识或信息,是激活了的知识或信息 文献是信息、知识、情报的主要载体形式
形成系统,便于检索的文献。
如:题录、书目、索引和文摘。
特征1 特征2 特征3 特征4 特征5
提取特 征
特征n
二次文献
二次文献
二次文献
2013-8-10
40
三次文献
三次文献是利用二次文献并在其指引下,对大 量的一次文献进行综合分析研究,加以浓缩和提 炼而成的文献。 包括综述、述评、进展、预测等,各类词典、 手册、年鉴、百科全书、指南等参考工具书也属 于三次文献的范畴。
一次文献、二次文献、三次文献
一次文献:
又称原始文献,是首次公开发表的文献,直 接记录了科研成果,报道了新发明、新技术、新 知识和新观点。 一次文献主要包括专著、期刊论文、科技报 告、会议文献、学位论文、专利文献等。

第二章 检索基本知识

第二章 检索基本知识

congress,meeting,symposium等 。
文献类型:按出版形式划分
产品资料
• 指产品目录、产品样本和产品说明书一类的厂商产品宣
传和使用资料。产品技术资料一般向厂商直接索取。
• 产品资料是人员选型、设计和引进国外设备仪器有价值
的参考资料。
技术档案
• 指生产建设和科学技术部门在技术活动中形成的。 • 技术档案的特点:真实性、保密性、准确性
文献标准草案ISO/DIS5217/Ⅱ 特点:* 内容全面系统、论点成熟。 * 出版周期长,不反映最新的知识信息。 * 图书一般都有国际标准书号(ISBN) 著录特征:书名、著者;出版项(出版地、出版社名、出版时间)总页 数、国际标准书号ISBN号;
国际标准图书号(ISBN)。 (International Standard Book Number) 它是国际标准化组织于 1972 年 公布的一项国际通用的出版物 统一编号方法。
参考文献引用举例
[1] 张坤,冯立群,于昌珏 . 图书馆目录[M]. 北京:科学技术出版社, 2007. 45-50. [2] 郑志红. 信息技术研讨会论文集:A集[C]. 北京:人民教育出版社, 2005. [3] 任玉辰. 通讯系统模拟软件[D]. 北京:北京大学数学系数学研究所, 2001 [4] 李长东,毛先渠,吕成义等. 浅谈通信管道的设计与铺设[J]. 北京 邮电大学大学学报(自然科学版),2003,55(2):12-17. [5] 刘喜. 列车自动防护(ATP)系统的功能[N]. 参考消息,2010-1117(5). [6] GB3100-3102,中华人民共和国国家标准—量和单位[S] [7] 孟津. 一种温热外敷药制备方案 [P]. 中国专利:881056073, 1989-07-26 [8] 赵克兵. 蜀河镇的兴衰与交通运输方式的演变[EB/OL]. /Traffic/121115/09134790.html.

第二章信息检索基础知识

第二章信息检索基础知识

属后组式语言。
主题词
概念:通过文献所属学科的主题对文献进行检索, 是以主题词为检索标识,它是一种特性检索。 主题词是用来表达文献的主题概念的,经过规范化 主题词 处理的名词或词组。 如:出生缺陷-畸形 杵状指-骨关节病,继发肥大性
主题词表- 主题词表-单元词表
《WPI--规范化主题词表》
(WPI--LIST OF STANDARD THESAURUS TERMS)
是检索英国德温特公司专利文献的工具。按规范 词字顺排列。其著录格式见图
WPI-List of Standard Thesaurus Terms 1987 COBALT(3772)(1) COBALT@(3) CODON【87】(4) ELECTRIC(33892)(1) Electrical(2)
关键词 自然语言 单元词 标题词 叙词 语 言 言 语
分类语言
分类语言是运用概念划分的方 法,按文献内容所属学科、专 业性质的逻辑次序,以数字、 字母或数字与字母结合为基本 字符,以分类号为标识,用来 存储和检索文献的文献标识系 统。
分类语言的特点
主要特点就是按学科专业性质集中图书 区分不同性质的图书 集中性质相同的图书 相近的放在相近的位置 按照远近亲疏的关系把图书组成为一个 有条理的体系 提供从学科分类查找图书的途径
机械制造工艺系统学 / 张恩生,申铁固编著-上海交通 大学出版社 TH16/ Z31 机械设计学习指南 / 陶民华等编机械工业出版社 TH122-44/ T43 机械优化设计基础 / 张九明编著煤炭工业出版社 TH122/ Z32A 分类号+著者号TP393-62/J25
主题语言
主题语言是指以自然语言的字符为字符, 以名词性术语为基本词汇,用名词性术 语作为标识的一种信息标识系统。是主 题概念检索文献信息的检索语言。

2第二章 计算机检索基础知识

2第二章 计算机检索基础知识

4、检域限制技术
1)字段域限制 字段检索可分为两类:后缀式和前缀式。 后缀限定(/) :指定在描述文献内容特征的字段 (基本字段)中进行检索时用后缀限定形式。例 如:carbon(w)dioxide/ti,ab 意味着该检索式在题名(ti)和文摘(ab)中进行检 索。 “ti”和“ab”之间被默认是逻辑“或”的关 系。 前缀限定(=):指定在描述文献外表特征的字 段,(辅助字段,非主题性字段)中进行检索时, 用前缀限定。
2、词位限制技术 (位置检索)
1) (W)与(nW)算符 W ── with 的缩写,(W)(若 W=1 时, 则可简写为“()”) 表示其两侧的检索词 必须按前后顺序排列,不可颠倒。 (nW)中的 n 表示两检索词中间允许插入 的单词数目少于或等于 n 个。 例如:检索式 “building(1W)construction”在命中的记 录中除以上形式外,还可能会有“building and construction”, “building under construction”等形式。
数据库的主要部分由一系列的记录所组成, 每个记录对应于一篇原始一次文献。每条记录由 不同的数据项目组成。我们将记录中的数据项目 称为字段。
字段(域)(Field),是组成文献信息
记录的基本数据单位。文献信息记录赋 予每个字段一个标识符号。 记录中用来描述文献信息内容特征的 字段叫“基本索引字段”,基本索引字 段用“/”加上字段标识符来表示。基本 索引字段主要包括:
数值数据库 图像数据库 源数据库 术语数据库 (一次文献) 文本- 数值数据库 全文数据库 混合数据库据源自库 按文献类型划分:

文献类数据库
书目数据库(二次文献) 全文数据库(一次文献)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

著录:对具体文献 著录: 的各种形式特征、 的各种形式特征、 内容特征及物质形 态等分行分析、 态等分行分析、选 择和记录的过程. 择和记录的过程
完成著录的过程 叫作”标引” 叫作”标引”。 通过标引, 通过标引,各种目 录、索引等检索 工具才能编成; 工具才能编成; 各种标引词存储 于计算机中, 于计算机中,才 能实现文献的检 索
中国古代图书六分法
西汉末年刘向、刘歆父子校书秘阁, 西汉末年刘向、刘歆父子校书秘阁,编撰了我国第一部综合 性目录—— 七略》 ——《 七略》实际上是把当时的图书分为6 性目录——《七略》。《七略》实际上是把当时的图书分为6类, 这就是所谓的“六分法” 类之下再分种,一共38 38种 这就是所谓的“六分法”。类之下再分种,一共38种: 六艺略”分易、 春秋、论语、孝经、 (1)“六艺略”分易、书、诗、礼、乐、春秋、论语、孝经、 小学9 小学9种。 (2)“诸子略”分儒、道、阴阳、法、名、墨、纵横、杂、农、 诸子略”分儒、 阴阳、 纵横、 小说10 10种 小说10种。 诗赋略”分屈原赋之属、陆贾赋之属、孙卿赋之属、 (3)“诗赋略”分屈原赋之属、陆贾赋之属、孙卿赋之属、杂 歌诗5 赋、歌诗5种。 兵书略”分兵权谋、兵形势、( 、(兵 阴阳、兵技巧4 (4)“兵书略”分兵权谋、兵形势、(兵)阴阳、兵技巧4种。 术数略”分天文、历谱、五行、蓍龟、杂占、形法6 (5)“术数略”分天文、历谱、五行、蓍龟、杂占、形法6种。 (6)“方技略”分医经、经方、房中、神仙4种。 方技略”分医经、经方、房中、神仙4
标引方式:分类、主题(受控词、自由词)、自动、 标引方式 分类、主题(受控词、自由词)、自动、名称标引等 分类 )、自动
2.2.1 分类语言
分类法是按信息资料内容的学科知识属性 分门别类来系统标示和组织信息资料, 分门别类来系统标示和组织信息资料,并 用分类号表达文献主题概念的方法。 用分类号表达文献主题概念的方法。
分类标识系统的特点
(1)分类法具有较强的系统性。 (1)分类法具有较强的系统性 分类法具有较强的系统性。 (2)分类法便于浏览检索。 (2)分类法便于浏览检索 分类法便于浏览检索。 (3)分类法提供对非文本信息的组织。 (3)分类法提供对非文本信息的组织 分类法提供对非文本信息的组织。 (4)检索语言的通用性。 (4)检索语言的通用性 检索语言的通用性。
1.目录 )——它主要用于反映文献的出版情况或收藏情况。 它主要用于反映文献的出版情况或收藏情况。 1.目录 ( catalog ) 它主要用于反映文献的出版情况或收藏情况
目录是对一批相关文献外部特征的揭示和报道。 目录是对一批相关文献外部特征的揭示和报道。通常以一个完整的出版或收藏单位为 一批相关文献外部特征的揭示和报道 著录的基本单位来报道和记录文献。只记录文献外部特征(如名称,著者, 著录的基本单位来报道和记录文献。只记录文献外部特征(如名称,著者,出版事项 )。目录一般按分类或字顺编排 目录一般按分类或字顺编排, 等)。目录一般按分类或字顺编排,主要供人们了解出版或收藏机构是否拥有所需图 期刊等出版物。 书、期刊等出版物。
Y
如:论资产者在市场经济初期的作用 论资产者在市场经济初期的作用
受控标引:资产阶级 市场经济 受控标引 资产阶级-市场经济 资产阶级 自由词标引:资产者 资产者-市场经济 自由词标引 资产者 市场经济
问题: 问题:两种不同的标引方式会 检索语言
中国图书馆图书分类法 中国科学院图书馆图书分类法 中国人民大学图书馆图书分类法 美国国会图书馆分类法 杜威十进位分类法
《中国图书馆分类法》 中国图书馆分类法》
K
历史、 历史、地理
K81 传记 K811 K82 K825 K825.1 K826.1 K833∕ K833∕837 世界人物传记 中国人物传记 人物传记: 人物传记:按学科分 哲学、 哲学、社会科学 自然科学、工程技术 自然科学、 各国人物传记
《杜威十进分类法》 ( DDC ) 杜威十进分类法》
1873年美国图书馆学家杜威所创, 1873年美国图书馆学家杜威所创,目 年美国图书馆学家杜威所创 前该分类法已经被翻译成30多种语言, 30多种语言 前该分类法已经被翻译成30多种语言, 在全球超过135 135个国家的 20多万个图 在全球超过135个国家的 20多万个图 书馆使用,在美国,95%的公共图书馆 的公共图书馆, 书馆使用,在美国,95%的公共图书馆, 25%的学院图书馆大学图书馆以及 的学院图书馆大学图书馆以及20% 25%的学院图书馆大学图书馆以及20% 的专门图书馆使用该分类法。 的专门图书馆使用该分类法。
2.2.2 主题语言
主题是一组具有共性事物的总称,用以表达文 主题是一组具有共性事物的总称, 献所论述和研究的具体对象和问题, 献所论述和研究的具体对象和问题,即文献的 内容” “内容” 主题词就是指以规定概念为基准,经过规范化 主题词就是指以规定概念为基准, 和优先处理后,具有组配功能、 和优先处理后,具有组配功能、能够显示词间 语义关系动态性的词或词组。 语义关系动态性的词或词组。 主题检索适合特性检索,系统性不强。 主题检索适合特性检索,系统性不强。
四部分类法
(1)“经部”——“易、书、诗、礼、春秋、孝 经部”——“ 春秋、 五经总义、四书、 小学” 10类 经、五经总义、四书、乐、小学”等10类; (2)“史部”——“正史、编年、纪事本末、 史部”——“正史、编年、纪事本末、 别史、杂史、诏令奏议、传记、史钞、载记、 别史、杂史、诏令奏议、传记、史钞、载记、时 地理、职官、政书、目录、史评” 15类 令、地理、职官、政书、目录、史评”等 15类; (3)“子部” 分为“儒家、兵家、法家、农家、 子部” 分为“儒家、兵家、法家、农家、 医家、天文算法、术数、艺术、谱录、杂家、 医家、天文算法、术数、艺术、谱录、杂家、类 小说家、释家、道家” 14类 书、小说家、释家、道家”等14类; (4)“集部”分为“楚辞、别集、总集、诗文 集部”分为“楚辞、别集、总集、 词曲” 评、词曲”等5类。
按出版类型划分:图书目录、期刊目录、会议论文目录。 按出版类型划分:图书目录、期刊目录、会议论文目录。 按物质形式划分:卡片目录、书本目录、机读目录(MARC) (MARC)、 按物质形式划分:卡片目录、书本目录、机读目录(MARC)、联机公共检索目录 )等 (OPAC ,Online Public Access Catalog )等。
2.2 检索语言
检索语言是根据人们检索工作的需要而创造的一种人 工语言,它是存储、查找文献的共同依据, 工语言,它是存储、查找文献的共同依据,也叫标引 语言。 语言。 题名语言:一般按题名字顺逐字排列 题名语言: 语言 描述文献外部 描述文献外部 特征的语言 特征的语言 著者语言: 著者语言:按姓前名后的字顺 语言 号码语言:如专利号、标准号、 号码语言:如专利号、标准号、ISBN 语言 分类语言:根据学科内容对文献进行分类 分类语言: 语言 图书分类号、专利分类号、 如:图书分类号、专利分类号、标准分类 号 描述文献内容 描述文献内容 特征的语言 特征的语言 主题语言:自然语言、 主题语言:自然语言、人工语言 语言
目录类型: 目录类型:
馆藏目录:反映一个图书馆文献收藏情况的目录。 馆藏目录:反映一个图书馆文献收藏情况的目录。 联合目录:反映一个地区或一个系统甚至全国或世界范围的图书馆、 联合目录:反映一个地区或一个系统甚至全国或世界范围的图书馆、信息服务
机构文献收藏情况的一种统一目录。 机构文献收藏情况的一种统一目录。
检索原理图
文献存储过程 检索过程
文献 主题分析 主题概念
用检索语言对 文献进行描述 情报工 作人员
检索需求 主题分析 主题概念
检索者
用检索语言对 文献进行描述
文献标识
检索工具(系统) 检索工具(系统)
检索表达式 (提问标识) 提问标识) 否
是否匹配 是
输出结果为零
得到检索结果 得到检索结果
2.1.3 检索的类型
按检索对象划分3 1、按检索对象划分3类
文献检索(Document Retrieval) 文献检索(Document 数据检索(Data Retrieval) 数据检索(Data 事实检索(Fact Retrieval) 事实检索(Fact
按信息检索手段划分2 2、按信息检索手段划分2类
手工信息检索 计算机信息检索
第二章 检索基础知识
2.1 2.2 2.3 2.4 2.5 2.6 2.7
基本原理 检索语言 检索工具 检索方法 检索步骤 机检技术 检索评价
2.1 文献检索的基本原理
2.1.1 文献检索的定义 广义文献检索(Document Information 广义文献检索( Retrieval) Retrieval)——将文献按照一定的方式组 将文献按照一定的方式组 织和存储起来,并根据用户的需求找出 存储起来 找出有 织和存储起来,并根据用户的需求找出有 关文献的过程。 关文献的过程。 狭义文献检索 狭义文献检索——指用户找出有关文献的 指用户找出有关文献的 过程。 过程。
存储 文献检索 检索
存储:是对文献进行著录、 存储:是对文献进行著录、 标引、整序, 标引、整序,编制检索工 具和建立检索系统的过程。 具和建立检索系统的过程。 检索: 检索:是指面向文献需求 而进行高度选择性的查找 过程。 过程。
2.1.2 检索原理
文献检索的过程就是检索提问标识与 文献检索的过程就是检索提问标识与 检索提问标识 著录标引标识相 存储在检索工具中的著录标引标识 存储在检索工具中的著录标引标识相 匹配的过程 的过程. 匹配的过程.
《杜威十进分类法》 ( DDC ) 杜威十进分类法》
000 100 200 300 400 500 600 700 800 900 总类 哲学类 宗教类 社会科学类 语言类 纯科学类 应用科学类 艺术类 文学类 地理历史类 310 320 330 340 350 360 370 380 390 普通统计学 政治学 经济学 法律 公共行政管理 社会机构社会团体 教育 商务、通讯、 商务、通讯、运输 习俗、礼仪、 习俗、礼仪、民俗 学校管理、 371 学校管理、 特殊教育 372 初等教育 373 中等教育 374 成人教育 375 课程 376 妇女教育 377 学校与宗教 378 高等教育 379 政府法规 管理与资助
相关文档
最新文档