第二章 信息检索方法

合集下载

第2章--信息检索PPT课件

第2章--信息检索PPT课件

经济
文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理
S
T U V X Z
农业科学
工业技术 交通运输 航空、航天 环境科学、安全科学 综合性图书
《中国图书馆分类法》
中国图书馆分类法分类表共分22个大类,再分17个 二级目录,医药卫生属于R大类。 《中图法》采用汉语拼音字母和阿拉伯数字组成的 混合制号码作类目标识,用一个字母标记一个基本
的问题;
另一方面是特定原始文献的查找,即在查找特定
的文献线索后,找出原始文献的过程。
第一节 信息检索基础
一、信息检索概念
(二)信息检索的意义和作用 信息检索 有助于知识更新 ,有助于同学们扩大视野 ,了解和把握有关学科中出现的新思想、新观点与 新知识。掌握信息检索技术是快速、准确地获取和 利用最新信息的有效途径。 信息检索有助于科学研究,了解和把握有关学科的 起源和发展过程。 有助于独立自主地解决自己在学习、生活和工作中 所遇到的疑难问题。 是接受终身教育的必要手段。 节省时间,提高效率。
第二节 信息检索语言
二、检索语言的种类
(一)分类检索语言 分类检索语言又称分类法,是用分类号(字母、数 字或它们的组合)来表达各种概念的,并将各种概 念按学科性质进行分类和系统排列的信息检索语言。 它以树状结构的形式,按知识门类的逻辑次序反映事物 的从属、派生关系,构成具有上位类和下位类隶属、同 位类并列的概念等级体系。 能较好体现概念的族性关系,从学科专业的角度检索资 料,比较方便,扩大、缩小检索范围方便。
(一)按信息检索的对象划分
数据信息检索 利用数据库、工具书等以数值或数据为对象的检 索,也称为数值检索。检索包含分子式、分子量 、公式 、图表等特定数据的信息。

第二章 文献信息检索基本知识(2).概要

第二章 文献信息检索基本知识(2).概要
(大学生or本科生or研究生)-(大专生or高职生) and 就业
(2)截词检索表达式
用截词符号“*”、“?”或“$”加在检索词 的前后或中间,以检索一组概念相关或同一词根 的词。 按截断的位置可分为:
前截断、中间截断、后截断 按截断的字符数量可分为: 有限截断(?)、无限截断(*)
如:输入检索式“Comput*”,将检出包含 Computer、Computing、Computed、 Computerization 等词汇的结果。
第二章 信息检索基础知识
2.3 文献信息检索的工具
1、文献信息检索工具概述 检索工具是将大量分散无序的文献资料经过加 工整理,按照一定的规则和方法编制起来,用来 报道、存储和查找文献的工具,是附有检索标识
的某一范围文献条目的集合。
传统的检索工具是人们利用手工方法编制的
工具书,有字典、词典、目录、百科全书、名录、 类书、政书、表谱、图录等。这些工具书是人们
题录示例
(3)索引(引得) 索引是将书刊内容中所论及的篇名、语词、主 题等项目,按照一定的排检方法加以编制,注明出 处,供读者查检使用的检索工具。 索引与目录的根本区别就在于著录的对象不同, 目录所著录的是一个完整的出版单位,索引所著录 的则是完整的出版物的某一部分、某一观点、某一 知识单元,提高文献检索的深度和检索效率。
完全一致(精确匹配)、任意一致(模糊匹配)
等。
讨论1: 我馆书目查询系统共有多少种检索方式?其基 本检索有多少个检索字段?
讨论2: “中国学术期刊网络出版总库”有哪些检索方式?

? ? 中国科技期刊数据库初级检索界面
2、 信息检索方法
(1)常用法 ①顺查法 ②倒查法 ③抽查法 (2)回溯法 (3)循环法

2信息检索的基本方法(一)

2信息检索的基本方法(一)

SCIENTIFIC SOLUTIONS
• 查找美国信息资源管理政策的有关文献 美国 and 信息资源管理 and 政策
• 含有草莓、香草和巧克力三种口味中任何一种的冰 淇淋
草莓 or 香草 or 巧克力
• 查找互联网有关的信息资源 • 互联网 or 因特网 or 万维网
SCIENTIFIC SOLUTIONS
SCIENTIFIC SOLUTIONS
4 截词检索(Truncation/Wildcat)
• 有时被称为通配符 • 前截词 • *ology→geology,sociology,psychology,archaeology, biology……
• 中间截词
• wom?n→ woman,women
SCIENTIFIC SOLUTIONS
检索词和运算符号合在一起的式子就是检索式 例子 寻找武汉大学校庆的资料 校庆 and 武汉大学(*)
高等教育 * 中国
湖南 or 湖北(+) 移动学习 + 泛在学习
大学 not 武汉大学 玉米——甜玉米
SCIENTIFIC SOLUTIONS
• 同时含有草莓、香草和巧克力三种口味的冰淇淋 • 草莓 and 香草 and 巧克力 • 用and链接的检索词越多,结果越少
• (nN) • Wuhan (1N) university
• Wuhan (1N) university— • 还可检出university of wuhan ,university
in wuhan……
SCIENTIFIC SOLUTIONS
3 短语检索(Phrase Search, Exact Search)
含有草莓或香草但不含巧克力口味的冰淇淋

第二章 信息检索

第二章 信息检索

2.检索技巧和提示
(1) 广泛浏览数据库 进入数据库前,需阅读数据库的说明,包括:出版、结构(权威性),出版类 型(期刊、会议、报告、专利…),文献类型(全文、文摘、题录…),收集年限,使 用权限,文献版本,服务方式(光盘、联机、专线、镜象、出国),连接方式,帐 号、密码,咨询联系等。现在许多数据库被组织到信息服务中心的web网页 上,并提供了有关介绍,应当充分地利用它们。
(1)积木型 积木型检索策略的含义是:把检索课题剖析成若干个概念面,先分别 对这几个概念面进行检索;在每个概念面中尽可能全和多地列举相关词 、同义词、近义词,并用布尔算符OR连接成子检索式,然后再用布尔算 符AND把所有概念面的子检索式连接起来,构成一个总检索式。 优点是:能够提供较明确的检索逻辑过程,以后容易检索和理解,还可 部分或全部地用作保留检索。一般地,“积木型”策略用于较复杂的检 索课题。 • 如“肺癌”与“吸烟”可以分成两个概念面,这两个概念面的各种形式 的检索词有: cancer smoker(s) • • carcinoma lung(s) cancer smoking cigar
(二)截词检索
截词检索:是指在检索时使用词的一个局部(某些 位置上的字符被截去)进行检索匹配,并认为凡满足这 个词局部中的所有字符要求的记录,都为命中结果。 截词检索需要使用专门符号(截词符),以指定截词 的具体位置与截断字符的数量。 • 按照截词位置的不同,截词检索分为: 右截词、左截词和中间截词三种。 例如:检索式 “wom?n”可检索到含有woman、women的结果。 截词检索实际上是一种隐含“逻辑或”的运算,能提 高查全率,扩大检索结果,是防止漏检的有力手段。
第二部分事实与数据检索工具
讨论事实、数据资源检索,其检索的对象是大量的、 常用的那些具体的科学技术数据和事实,如物理量、 物质特性、参数、规格等技术数据以及价格、产量、 公司名录、人名录等商业、经济等各种实用信息。 它们的检索工具包括:百科全书、年鉴、手册、词 典、机构指南和人名录、书目及书目指南等参考工 具。

第二章 信息检索基本知识

第二章 信息检索基本知识

(二)按出版形式划分:
原始文献
图书
特种文献
期刊
会 议 文 献
科 技 报 告
专 利 文 献
学 位 论 文
政 府 出 版 物
其 标 准
食品标准网

7-111-17892-0
《发票报文》GB/T 17303.2-1998 第二部分:国际贸易商业发票报 文
……
(三)按信息的加工程度来分: 1、一次文献信息 (原始文献):
一、检索工具的作用 1、报道作用 2、存储作用 3、检索作用
二、检索工具的特点
1、详细而又完整地记录了文献的外部特征和内部特征。
2、对所著录的文献,标引了可供检索的检索标识。 3、提供必要的检索手段,配备各种体系的索引。
三、检索工具的类型
按著录信息的特征划分:
1、目录 2、题录 3、文摘 4、索引
检索途径-分类途径 分类途径的缺点是新兴学科、边缘学科在 分类时往往难于处理,查找不便。另外, 从分类途径检索必须了解学科体系,否 则在将概念变换为分类号的过程中常易 发生错误,造成漏检或误检。
检索途径-主题途径
• 主题途径是一种按照文献的主题内容查找文献 的途径。使用的语言是主题语言。使用的检索 工具有“主题索引”、“关键词索引”、“叙 词索引”等。 • 主题法打破了传统的学科分类的框框,把分散 于各个学科的有关文献集中于同一主题词之下, 以文字作检索标识,索引按照资料内容的主题 词或关键词的字顺排列,检索时就象查字典一 样,不必考虑学科体系。
更多……
• 按检索方式,可分为印刷型检索工具和机器检 索工具; • 按出版形式,可分为期刊式检索工具、书本式 检索工具、卡片式检索工具、缩微式检索工具、 机读式检索工具等; • 按收录范围,可分为综合性检索工具、专题性 检索工具; • 按语种,可分为中文检索工具和外文检索工具;

第二章网络检索

第二章网络检索


2.1.3、网络信息资源的特点
(一)优点: 1.数量巨大,增长迅速 2.内容丰富,形式多样 3.结构灵活,分布广泛 4.开放互动,共享性强 5.传播快速,利用方便 6.更新速度快,动态性强
网络信息资源的特点
(二)缺点: 1.网络信息质量参差不齐,良莠不一 2.分散无序,缺乏管理
2.2 网络信息检索的方法


2、网上出版物
网上出版物是指在网络环境中编辑、出版、发行的出版物以 及印刷型出版物的网络版,包括网上图书、网上期刊、网上报 纸等。如今,通过Internet浏览、订阅电子期刊、报纸、图书 等已成为一种时尚,网络出版物的数量正急剧增加。如在中国 科技期刊网上可以免费查找《中国学术期刊》的题录。其中网
上参考工具书更是独树一帜,像一些百科全书、辞典、指南、
手册、文摘索引、目次表、名录等,这些网络版参考工具书使 用起来方便、快捷。目前因特网上有上万种电子期刊向网上用
户提供服务,其中很多是免费提供。
主要网上书店

中国图书网(/) 中华图书网(/)
短短的两年多时间内,设在北京大学的项目管理中心联合各参建
单位,建设了文理、工程、农学、医学四个全国文献信息中心, 华东、华中、华南等七个地区中心和一个东北地区国防信息中心, 建立了一系列国内外文献数据库,并开展了公共目录查询、信息 检索、馆际互借、文献传递、网络导航等网络化、数字化文献信 息服务,对保障"211工程"各高校的重点学科建设、培养高层次人 才、支持科研创新等发挥了重要的作用。
CALIS面向读者的服务功能主要有: (1)公共检索:可以在网上查找全国性或地区 性的书刊联合目录数据库,了解所需文献是否有及在 哪里收藏。也可以联机检索CALIS国内外各种类型的 文献数据库。 (2)馆际互借 (3)文献传递 (4)电子资源导航:对网上的电子资源进行收 集、加工和整序,形成虚拟图书馆资源,提供用户浏 览和查询。

文献检索,信息检索(2)第二章 信息检索原理

文献检索,信息检索(2)第二章  信息检索原理
优点:可以检索到某学科或专业的所有文献,有较高 的查全率。
缺点:常常落后于当前研究现状,分类表相对呆板的 学科关系,使得确定前沿概念、跨学科概念或非常具 体概念的分类,较困难。用户差异性。
分类语言
中国图书馆图书分类法 美国国会图书馆分类法 杜威十进位分类法 IPC国际专利分类法
基本部类 马列毛邓 哲学
(2)多概念课题
并列概念课题,如“新闻宣传研究”
“计算机在人文社会科学方面的应用” 上位类分类方法,如“灰色系统理论”
应用性课题,如“计算机在人口预测方面的应用”、
2.主题语言
是直接以代表信息内容特征和科学概念的概 念词作为检索标识,并按字顺组织的一种检索语 言。 是以表达文献主 是从文献的内容 是从文献的题目
一、检索算符 逻辑与
(一)布尔逻辑算符
布尔逻辑组配运算是采用布尔代数中的 逻辑“与”逻辑“或”、逻辑“非”等算符,
将检索提问式转换成逻辑表达式,限定检索
词在记录中必须存在的条件或不能出现的条 件。凡符合布尔逻辑所规定的条件的文献, 既为命中文献。
布尔逻辑运算符
————————————
1、逻辑“或” 2、逻辑“与” 3、逻辑“非”
2、逻辑“与”
————————————————
Chinese AND litera0,000 网络100,000,000) 用符号“and”或“*”表示,其逻辑表达式为: A * B 或 A and B 其意义为检索记录中必须同时含有检索词A和B 的文献,才算命中文献。
4、记录级
检索词在数据库的同一记录中。
(C)—citation
表示两侧的检索词(或检索项)必须出现在同一记录中,词
序不限,中间词数量不限,其作用与布尔逻辑算符AND相同。

第二章 信息检索基本方法与基本技术

第二章  信息检索基本方法与基本技术

2. 主题检索语言
• 标题词:经规范化处理的词或词组,先组式
语言
• 叙 词(单元词):经规范化处理的词或词
组,后组式语言,可自由灵活组配
• 关键词:未经规范化处理,直接从文献题名、
原文或文摘中选取的能反映原文主题内容的自 由词汇
二、检索工具
定义:检索工具是人们用来存储、报道和查找 文献的工具,它具有存储和检索的功能。
点击预约书刊可预约该书 预约图书:选定所需图书,输入证号、密码,执行预约 点击机读格式可查看该书的MARC信息
高级查询
• 在题名、著者、丛书名、主题词、出版社、 ISBN(书)、ISSN(刊)、索取号、起始年 代中填入自己确定的内容,其余的可以不填 写;选定语种(17种)和文献类型,然后进 行检索。 • 结果可检索到所需文献的题名、著者、出版 信息、索取号 • 查看选中图书的相关信息
图书馆信息查询系统
•书目查询 •读信者息 •新书通报:一个月内到馆的新书、馆藏 地,并可查看新书 •订购征询 •信息发布:预约到书列表、超期罚款、 超期催还、委托借阅到书列表
如何利用计算机进行检索
书刊查询
读者信息查询
图书馆主页的功能
信息发布功能:
图书馆最新服务动态、电子 资源试用等均及时在主页上发布。
一、信息检索原理
信息检索的原理(示意图)
存 储
特征化
表示
查 询
特征化
表示
信息 集合
选择与匹配
需求 集合
二、信息检索类型
手工检索 计算机检索 文献信息检索
• 信息检索(内容)
• 信息检索(工具手段)
数据信息检索
事实信息检索
第二节 信息检索语言与工具
一、信息检索语言

信息检索教程(第二章)

信息检索教程(第二章)

4
(b)按收录文献出版形式分
●图书目录 ●期刊目录 ●会议论文目录 ●标准目录等。
(c)按物质形式划分
●卡片目录 ●书本目录 ●机读目录 ●联机公共检索目录等。
5
(2)图书馆目录、OPAC和联合目录概述
①图书馆目录
定义:它主要提供馆藏资源的检索,又叫馆藏目录,它反映
了一个图书馆的文献收藏情况,是一种重要的检索工具。
26
常用法示例
27
追溯法示例
28
2.3.2检索途径
29
30
1.分类途径
图书期刊分类法
世界三大图书分类法
《杜威十进分类法》(DDC)(Dewey decimal Classification ) 《国际十进分类法》(UDC)(Universal Decimal Classification) 《国会图书馆图书分类法》(LCC)(Library congress classification)
定义:所谓文献检索的方法,即查找文献的方法。有以下三种: 常用法:直接利用文献检索工具或检索系统来查找文献的方法,是 一种常规的科学检索方法。又称工具法或直接法。分为顺查法 、倒查法和抽查法。 追溯法:是一种跟踪查找法。它不利用检索工具只是利用文献(尤其 是评述性论文或专著) 后面所附的参考文献进行逐一地追踪查 找原文。又称引文法。 综合法:是常用法和追溯法的综合。利用检索工具或检索系统进行 常规检索,再利用文献后所附参考文献进行追溯检索,分期分 段交替使用这两种方法,直到满足要求为止。可以查得较全面 较准确,尤其适用于那些过去年代内文献较少的课题。称循环 法、分段法或交替法。
22
2.2.2检索工具的鉴别与评价
1.信息收录范围与信息质量

最新第2章-信息检索基本方法精品文档

最新第2章-信息检索基本方法精品文档
② ?仅且必须截一个字母
例:wom?n :woman、women …
③ $ 截一个字母 或 0个字母
例:Hof$man* :Hofman、Hoffman、 Hoffmann、Hoffmanova …
位置算符
① N —— 表示两词相邻,顺序可以颠倒 ② W —— 表示两词相邻,但顺序不能颠倒 ③ SAME —— 表示两词必须出现在同一句子
从属和并列关系实例:
B 哲学
B0 哲学理论 B1 世界哲学 B2 中国哲学
B20 唯物主义与唯心主义(总论) B21 古代哲学 B22 先秦哲学(公元前221年) B23 秦汉、三国晋、南北朝哲学(公元前221年~公元589年) B24 隋、唐、宋、元、明、清哲学(589年~1840年) B25 近代哲学(1840年~1916年) B26 现代哲学(1919年~ ) B27 马克思主义哲学在中国的传播与发展
等同关系——同义词/近义词
• 异形同义词 • 缩写和全称 • 商品名、俗名、学名 • 化学物质名称和化学物质表达式 • 英文同根词
3. 逻辑非——A NOT B;A-B
• 用以排除不希望出现的检索词 • 用以缩检,提高查准率
AB
如果两个关系紧密的检索词同在一检索 逻辑中,对其中一个使用NOT逻辑会导 致含另一个词的文献也被排除。
论包装材料及其包装 技术入此)
T 工业技术
TS 轻工业、手工

TS0 一般性问题
TS09 包装装璜技

2.3 主题法
主题法——是指直接以表示文献或信息 主题的语词作标识,提供字顺检索途径 ,并主要采用参照系统揭示词间关系的 标引和检索文献的方法。
主题法——主题语言
主题语言——由受控的自然语言语词直 接表达主题概念,按词语字顺排列主题 概念,主要用参照系统显示概念之间关 系的标引语言。

第二章 信息检索基础知识

第二章 信息检索基础知识

全文检索
图像检索 超文本检索
文献检索
使用以二次文献为存储对象的信息系统,如目录
型、题录型、文摘型数据库,是一种相关性检索。特 点:检索结果不直接解答课题用户提出的技术问题, 只提供与之相关的线索。 例如:查找有关“食品安全与人类健康 ”方面的
国内外信息有哪些?
数据检索
以数值信息为检索对象,通过检索,用户可以获 得所需要的确切数据,是一种确定性检索。它一般以
的方式记录在相应的信息载体上,组织成系统
化的检索系统。
1. 数据库及其构成
数据库(database):至少由一种文档组
成,并能满足某一特定目的或某一特定数据处
理系统需要的一种数据集合。 通俗地说,数据
库就是在计算机存储设备上,按一定方式存储的 相互关联的数据集合,是信息检索的基础。
1. 数据库及其构成
一、信息检索的效果评价指标 二、影响检索效率的主要因素
一、信息检索的效果评价指标
以一个检索提问去检索任何一个数据库都会出现 4 个相关量:检出的相关信息量、未被检出的相关信 息量、检出的非相关信息量、未检出的非相关信息量。
一、信息检索的效果评价指标
1. 查全率 a 查全率(R )= —— ×100% a+c 查全率是对所需信息被检出程度的信息量指标。 2. 查准率 a 查准率(P )= ——×100% a+b 查准率是衡量拒绝非相关信息的指标。
中国图书馆分类法的体系结构:
S农业科学类目简表
(2)按事物的性质分类
按事物的性质分类 --- 热门主题 : 各种搜索引擎和网站 按事物的性质分类 --- 功能(使用方向)主题: 国际专
利分类法(IPC)
2.主题描述及信息检索语言

第二章 信息检索方法

第二章 信息检索方法
考虑学科范围、信息类型和数据量 【例题】用____检索α-呋喃甲醇羧酸酯的合成、含有碳和氢元素的
化合物的英文综合学术性文献。 A.外文Elsevier数据库 B.外文农业类CAB文摘数据库 C.外文农业类AGRICOLA数据库 D.外文食品科技文摘数据库FSTA
15
了解收录的文献类型 【例题】已知参考文献:王涛.土木工程CAD.中国水利水电出版
26
检索途径
1、主题途径 2、分类途径 3、责任者/刊名途径 4、号码途径
27
1、主题途径
主题途径是采用反映文献主题概念的 检索词作为检索入口的一种检索途径,也 是最常用、最重要的检索途径。
主题“是一组具有共性事物的总称, 用以表达文献所论述和研究的具体对象和 问题”,即文献的“中心内容”。
每种文献都包含着若干主题,研究或 阐述一个或多个问题。
Classification) 《国会图书馆图书分类法》(LCC)(Library congress
classification)
中国图书分类法: 《中国图书馆分类法》(中图法) 《中国科学院图书馆分类法》(科图法) 《中国人民大学图书馆分类法》(人大法)
32
《中图法》介绍
《中图法》——《中国图书馆分类法》,以学科来组织知 识,将全部知识领域划分为5个基本部类,22大类。
U447 桥梁安全与 事故
U448 各种桥型 U449 涵洞工程
图 2-4 《中图法》结构示意图 34
T类又可分为以下几类
TB 一般工业技术
TD 矿业技术
TE 石油、天然气工业
TF 冶金工业
TG 金属学、金属工艺
TH 机械、仪表工艺
TJ 武器工业
TK 动力工程

新第二章 信息检索基础知识

新第二章 信息检索基础知识

2.2 信息检索语言
三、主题语言
4.关键词语言
是指从文献标题、文摘、正文中抽离出来的,对表征文献主题 内容具有实质意义的语词,以关键词作为信息标识和检索依据的主 题语言。关键词没有固定的词表,因为对于同一个事物的概念,不 同作者甚至是同一个作者在不同的著作中用词都会不同,它是没有 经过规范化的自然语言词汇。 在检索中文医学文献中使用频率较高的《CMCC》数据库就是 采用关键词索引方法建立的。
2.5 计算机检索技术 四、词组检索
将固定词组或短语 看成单个词进行处理。
常用“ ”作为词组检索的运算符。
2.5 计算机检索技术 五、字段检索
对指定的一个或多个字段进行检索,从而提高查准率或查全率。
标题、作者、摘要、关键词、作者单位、文献来源、学位授予单位、 学位级别、会议信息、会址、会期、书名、出版地、出版年、专利号、报 告号、ISBN、ISSN等。
2.2 信息检索语言
一、信息检索语言的定义、作用和种类
4.分类:
篇名(题目) 著者名称 描述文献外表特征 文献序号 引用文献 等级体系分类语言 分类语言 组配分类语言 主题语言
检索语言
描述文献内容特征
代码语言
标题词语言 关键词语言 单元词语言 叙词语言 分子式索引 结构式索引 专利号索引等
2.2 信息检索语言
2.4 信息检索标识 一、检索标识的定义
检索标识即检索词,是指能表达检索课题主题概念和信息需 求的名词术语、分类号、名称、代码等的总称,包括主题词、 关键词、名称、分类号、分子式、专利号及各种号码。
2.4 信息检索标识 二、信息检索标识的类型
1.描述信息内容特征的检索标识: 分类、主题、代码(符号)。
2.5 计算机检索技术 一、布尔逻辑检索

第二章网络信息检索方法

第二章网络信息检索方法
以文献内容特征为检索途径
分类途径:分类目录/分类索引/族性检索 主题途径:主题索引/主题目录/主题词表/特征检索 注意:确定检索词的方法:
规范化词;国际上通用的词;隐性概念;核心概念;联机选词; 注意检索词的缩写词、词形变化、英美不同拼法
2.3查阅检索工具调整检索策略 检索式 检索 实际检索时很难一次成功 调整检索策略 满意
第2章网络信息检 索基本知识
2.2.1网络信息检索的基本方法
网络信息检索方法
工具法(常用法)
1. 顺查法,根据年代,由远及近 2. 倒查法,根据年代,由近及远 3. 抽查法,有针对性的抽查
追溯法,也称引文法 综合法,也称循环法,是前两种方法的结合
选择信息检索方法的原则
1、有检索工具时用工具法或循环法 2、无检索工具时用引文法 3、新兴学科或知识更新快的学科课题用倒查法 4、查全率要求高用顺查法 5、已经掌握课题发展的规律特点用抽查法
信息检索效果的评价
产生误检的原因可能有: 检索词一词多义;括号使用不正确; 检索词与英美人的姓名、地址名称相同; 不严格的位置算符的运用; 逻辑运算符号前后未空格; 截词运算不恰当; 检索式中没有使用逻辑非运算; 检索式中检索概念太少; 从错误的组号中打印检索结果
信息检索效果的评价
信息检索途径
❖内容特征 1分类途径 2主题途径
❖外部特征途径 1著者 2题名 3序号(专利号、标准号等等) 4引文 5其它(文献类型、日期、国别、语种、地址、 出版者等等)
2.3 网络信息检索步骤
1、分析检索课题,明确检索要求、时间、范围
不同的检索课题,同一课题的不同研究阶段的信息需求不一样。 检索目的、学科范围、主题概念、语种范围、时间范围、文献类型、

第二章文献信息检索基本理论与方法

第二章文献信息检索基本理论与方法
《中国人民大学图书馆图书分类法》 《中国科学院图书馆图书分类法》
4.
《中图法》将学科划分为5个基本部类,22个基 本大类,再进行层层划分,逐级分开。
16
《中图法》五大部类、二十二个基本大类
A、马克思主义、列宁主义 毛泽东思想、邓小平理论 B、哲学、宗教 C、社会科学总论 D、政治、法律 E、军事 F、经济 G、文化、科学、教育、体育 H、语言、文字 I、 文学 J、 艺术 K、历史、地理 N、自然科学总论 O、数理科学和化学 P、天文学、地球科学 Q、生物科学 R、医药、卫生 S、农业科学 T、工业技术 U、交通运输 V、航空、航天 X、环境科学、安全科学 Z、综合性图书
12
分类语言 描述文献内 关键词语言 标题词语言 单元词语言 叙词语言
容特征的语言
检索语言
主题语言
代码语言 书/刊/篇名 描述文献外 表特征的语言 著者姓名
引文 代码/序号
13
(1) 分类语言:是按文献的学科性质给予相应的分 类号,用分类号表达文献主题概念的检索语言, 根据分类表中的顺序编排成分类索引,提供分类 途经供检索文献使用。 它运用概念划分与概括的方法,按照知识门 类的逻辑次序从抽象到具体,从一般到特殊,从 简单到复杂,对知识进行科学划分,从而产生不 同级别且存在隶属关系和体现知识登记体系的类 目一个类目以不同的符号(分类号)作标识,从 而形成了以分类号为标记的体系分类语言。
29
索引分两种: 一种是作为工具书的主体,如文献题名(篇 目)索引。 另一种是作为工具书的一部分,一种检索 途径,内容索引如:主题索引、著者索引 等。 3. 题录是对单篇文献外表特征所作的著录。 著录项目包括文献题目、著者及其所在单 位、出处及文种等。

第二章信息检索基础1

第二章信息检索基础1

化学物质登记号(CAS registry number)检索
分子式(formula)检索 记录顺序号(accession number)检索 化合物结构图检索(structure search)检索 ……
不同检索途径常用字段名称
题名途径:题名、标题、篇名、题目、title 分类检索途径:分类号,中图分类号 主题途径:主题词、MeSH、MeSH terms、 Thesaurus、map term to subject headings 关键词途径:关键词、keywords、text words 著者途径:(第一)作者、著者、责任者、 author、first author
研、生产中的具体问题所需要的特定知识或信息。(微波炉
发明) (四)文献(Literature) 文献是记录有知识的一切载体,是知识的外在形式。
情报的基本属性
知识或信息 经过传递
经用户使用产生效益 情报的 基本属性
信息与知识、情报、文献的关系
知识源于信息,是信息的一部分 情报源于知识或信息,是激活了的知识或信息 文献是信息、知识、情报的主要载体形式
形成系统,便于检索的文献。
如:题录、书目、索引和文摘。
特征1 特征2 特征3 特征4 特征5
提取特 征
特征n
二次文献
二次文献
二次文献
2013-8-10
40
三次文献
三次文献是利用二次文献并在其指引下,对大 量的一次文献进行综合分析研究,加以浓缩和提 炼而成的文献。 包括综述、述评、进展、预测等,各类词典、 手册、年鉴、百科全书、指南等参考工具书也属 于三次文献的范畴。
一次文献、二次文献、三次文献
一次文献:
又称原始文献,是首次公开发表的文献,直 接记录了科研成果,报道了新发明、新技术、新 知识和新观点。 一次文献主要包括专著、期刊论文、科技报 告、会议文献、学位论文、专利文献等。

第二章信息检索基础知识

第二章信息检索基础知识

属后组式语言。
主题词
概念:通过文献所属学科的主题对文献进行检索, 是以主题词为检索标识,它是一种特性检索。 主题词是用来表达文献的主题概念的,经过规范化 主题词 处理的名词或词组。 如:出生缺陷-畸形 杵状指-骨关节病,继发肥大性
主题词表- 主题词表-单元词表
《WPI--规范化主题词表》
(WPI--LIST OF STANDARD THESAURUS TERMS)
是检索英国德温特公司专利文献的工具。按规范 词字顺排列。其著录格式见图
WPI-List of Standard Thesaurus Terms 1987 COBALT(3772)(1) COBALT@(3) CODON【87】(4) ELECTRIC(33892)(1) Electrical(2)
关键词 自然语言 单元词 标题词 叙词 语 言 言 语
分类语言
分类语言是运用概念划分的方 法,按文献内容所属学科、专 业性质的逻辑次序,以数字、 字母或数字与字母结合为基本 字符,以分类号为标识,用来 存储和检索文献的文献标识系 统。
分类语言的特点
主要特点就是按学科专业性质集中图书 区分不同性质的图书 集中性质相同的图书 相近的放在相近的位置 按照远近亲疏的关系把图书组成为一个 有条理的体系 提供从学科分类查找图书的途径
机械制造工艺系统学 / 张恩生,申铁固编著-上海交通 大学出版社 TH16/ Z31 机械设计学习指南 / 陶民华等编机械工业出版社 TH122-44/ T43 机械优化设计基础 / 张九明编著煤炭工业出版社 TH122/ Z32A 分类号+著者号TP393-62/J25
主题语言
主题语言是指以自然语言的字符为字符, 以名词性术语为基本词汇,用名词性术 语作为标识的一种信息标识系统。是主 题概念检索文献信息的检索语言。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2、分类途径
(1)图书期刊分类法 (2)专利分类法 (3)标准文献分类法 (4)分类途径的优缺点
(1)图书期刊分类法
世界三大图书分类法: 《杜威十进分类法》(DDC)(Dewey decimal Classification) 《国际十进分类法》(UDC)(Universal Decimal Classification) 《国会图书馆图书分类法》(LCC)(Library congress classification) 中国图书分类法: 《中国图书馆分类法》(中图法) 《中国科学院图书馆分类法》(科图法) 《中国人民大学图书馆分类法》(人大法)
按服务模式划分
二 、检索工具的选择
考虑学科范围、信息类型和数据量 【例题】用____检索α-呋喃甲醇羧酸酯的合成、含有碳和氢元素 的化合物的英文综合学术性文献。 A.外文Elsevier数据库 B.外文农业类CAB文摘数据库 C.外文农业类AGRICOLA数据库 D.外文食品科技文摘数据库FSTA 了解收录的文献类型 【例题】已知参考文献:王涛.土木工程CAD.中国水利水电出版 社 .2012.要找原文,使用____检索《土木工程CAD》。 A.中文科技期刊数据库 B.中国人民大学报刊全文数据库 C.国务院发展研究中心 D.图书馆的馆藏查询 信息网

作用:
帮助读者快速判断文献内容,节省阅读时间
替代原文
图2-2 EI的一例文摘
3、索引型检索工具
索引一般是附在专著或年鉴、百科全书等工具书 之后以及收录内容较多的二次文献之后,按主题词、人 名、地名、事件、概念等内容要项编排,按其内容可分 为主题索引、分类索引、关键词索引、引文索引。
图2-3 《中国大百科全书》的一例索引
《中图法》从大类到小类,层层展开,不断细分, 形成完整的知识体系。
例如: 关于红楼梦研究资料的分类为 I207.411 I 文学 I2 中国文学 I207 文学评论和研究 I207.4 小说研究 I207.41 古代小说研究 I207.411 《红楼梦》研究与评论
【例题】《哲学辞典》类号为:B-61 【例题】《法国的货币与银行 》的类号为:F825.65
AU——Author 作者
AF——Affiliation 作者单位 SO——Source 文章来源(刊名信息等) ISSN(ISBN)—— International standard Serial (book) Number PY——Publication year 出版年 LA——Language 语种
信息检索的类型(根据不同的检索对象):
一、数据检索: 检索的结果是数据。如某种材料的电阻;某变压器的参数;化学分子式、 数据图表等(手册), 某地方GDP增长情况(年鉴) 二、事实检索: 检索的结果是事实结论。查询某一事物(事件)的性质、定义、原理以 及发生的时间、地点过程等。如某产品是哪个厂家生产,哪个牌子的最好; 第一颗人造卫星是什么时候升空的(年鉴)
(4)分类途径的特点
1)通常适合族性检索,查全率高;不适合特 性检索,查准率低
2)不能适应学科发展中的变化,难以反映新 学科和新名词术语
【实例】食品风险分析是保证食品安全的一种 新模式,同时也是一门正在发展中的新兴学 科。风险分析的目标在于保护消费者的健康 和促进公平的食品贸易。目前的文章在分类 上暂时归入[ R155.5 ] 食品卫生与检验和 [ TS201.6 ] 食品安全与卫生。没有一个专 门的“食品风险分析”分类号。
部 号 A
IPC分类简表
部名
分部名
部号 E

部名 固定建筑物
分部名 建筑 钻进;采矿
人类生活必 农业 需 食品;烟草 个人或家用物 品
保健;娱乐
B 作业;运输 分离;混合 成型 印刷 交通运输 C 化学;冶金 化学 冶金 G 物理 F 机械工程; 发动机和泵 照明;采暖; 一般工程 武器;爆破 照明;加热 武器;爆破 仪器 核子学
主题途径的优缺点 通常适合特性检索,查准率高;不适合 族性检索,查全率低 【实例】主题词“C语言—程序设计”就比分 类号TP312表达得更准 希望专指度高时采用主题途径。
【获取主题词的技巧】在图书的版权页可以找 到在版编目里面的主题词和分类号码。或者 在图书馆的馆藏数据找到主题词。
【实例】版权页 样例如右图所 示
第二章 信息检索方法
2.1 2.2 2.3 2.4 2.5
检索的概念及原理 检索工具概述 检索方法及检索途径 检索式的拟订 检索步骤
2.1 信息检索的概念
一、信息检索的基本概念
狭义:是指依据一定的方法,从已经组织好的大量 有关文献信息集合中,查找并获取特定的相关文献 信息的过程。
广义:将信息按照一定的方式组织和存储起来,并 根据用户的需求找出有关信息的过程。
U41 道路工程 U44 桥涵工程 U45 隧道工程 U46 汽车工程 U48 其他道路 运输工具 U49 交通工程与公路 运输技术管理
U441 结构原理、 结构力学 U442 勘测、设计 与计算 U443 桥梁构造 U444 桥梁建筑材料 U445 桥梁施工 U446 桥梁试验观测 与检定 U447 桥梁安全与 事故 U448 各种桥型 U449 涵洞工程
4、全文型检索工具

特点:提供全文下载

按所收信息的学科内容划分:
综合性检索工具 我国的综合性数据库其加工深度不及专业性检 索工具,检索途径少。

专科性检索工具 能够比较集中、迅速准确和全面地反映某学科 领域的最新发展状况和最前沿的科研水平。详细完 整的专业信息极具针对性。

数据库的类型
按收录的文献类型划分
存储 过程
一次 分析 信息
信息 特征
检索 过程
检索 分析 课题
检索 提问
信 息 检 索 语 言
标引 信息特征 输入 存储信息与 标识
检索信息所 依据的规则 不一致
标引
检索提问 检索 标识
检 索 输出 系 统
检 索 结 果
图2-1 信息检索原理图
检索途径
常用字段缩写: TI——Title 文章题目 AB——Abstract 文章摘要 KW——Key 资料。查找相关文献的内容、出处、收藏单位等。如 系统地查找信息检索方面的相关文献(论文)
文献检索是信息检索的一种最基本的、最主要的形式。
2.2 检索工具概述
一、检索工具的定义及类型
检索工具是人们用来存储、报道和查找 各类信息的工具 。 按著录信息的特征划分
著录是指编制检索工具时对文献的内容和形 式特征进行分析、选择和记录的过程。 目录型检索工具 文摘型检索工具 索引型检索工具
《中图法》介绍
《中图法》——《中国图书馆分类法》,以学科来组织知 识,将全部知识领域划分为5个基本部类,22大类。 五大部类分别为: 马列主义、毛泽东思想; 哲学; 社会科学; 自然科学; 综合性图书。
基本大类 马列 哲学
简表
详表
社会 科学
自然 科学
综合
A 马克思主义、列宁主义 毛泽东思想、 邓小平理论 B 哲学、宗教 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 U1 综合运输 S 农业科学 U2 铁路运输 T 工业技术 U4 公路运输 U 交通运输 U6 水路运输 V 航空、航天 [U8] 航空运输 X 环境科学、安全科学 Z 综合性图书
A 综合…………………………………… 00/09 标准化管理与一般规定 10/19 经济、文化 20/39 基础标准 40/49 基础学科 50/64 计量 65/74 标准物质 75/79 测绘 B 农业林业……………………………… 00/09 农业、林业综合 10/14 土壤与肥料 15/19 植物保护 20/29 粮食与饲料作物 30/39 经济作物 40/49 畜牧 50/59 水产、渔业
D
纺织;造纸 纺织或未列入 其他类的柔性 材料 造纸
H
电学
(3)标准文献分类法
世界各国的标准分类法同文献资料分类法类似,或以数字为标记、 或以字母为标记、或以字母和数字混合为标记。 我国的标准分类法采用混合标记,一级类目以专业划分,用字母表 示类号,二级类目采用等级列类方法用双位制数字表示。排检时先按照 字母顺序,大类相同再按双位数字顺序排列。中国标准分类法 (Chinese Classification for Standards,简称CCS) 【部分分类】
检索途径
1、主题途径 2、分类途径 3、责任者/刊名途径 4、号码途径
1、主题途径
主题途径是采用反映文献主题概念的 检索词作为检索入口的一种检索途径,也 是最常用、最重要的检索途径。 主题“是一组具有共性事物的总称, 用以表达文献所论述和研究的具体对象和 问题”,即文献的“中心内容”。 每种文献都包含着若干主题,研究或 阐述一个或多个问题。
全文型检索工具
1、目录型检索工具 目录能反映一定历史时期科学文化发展的概貌

作用: 了解本学科的研究历史和研究现状。 通过各类书目,可查寻与研究课题密切相关的 事实和资料。
按收录的范围可分为:馆藏目录、出版社目录、国 家书目、联合目录。

2、文摘型检索工具 特点:具有摘要,提供文献的外表特 征和内容特征。如: 《中国生物学文摘》、 美国《化学文摘》
2.3 检索方法及检索途径
检索方法:
1.常规法: 所谓常规法就是利用常规检索工具查找有关 文献的方法 顺查法、倒查法、抽查法
2.引文法 就是查找参考文献或引用文献的方法。由远 及近地搜寻 ;由近及远地追溯 3.综合法 引文法和常规法结合

思考:信息检索就是从一定的文献集合(即 检索系统)中查找出符合特定需要的文献, 那么这个过程是如何实现的呢?
相关文档
最新文档