第二章信息检索技术与策略
第二章 信息检索

2.检索技巧和提示
(1) 广泛浏览数据库 进入数据库前,需阅读数据库的说明,包括:出版、结构(权威性),出版类 型(期刊、会议、报告、专利…),文献类型(全文、文摘、题录…),收集年限,使 用权限,文献版本,服务方式(光盘、联机、专线、镜象、出国),连接方式,帐 号、密码,咨询联系等。现在许多数据库被组织到信息服务中心的web网页 上,并提供了有关介绍,应当充分地利用它们。
(1)积木型 积木型检索策略的含义是:把检索课题剖析成若干个概念面,先分别 对这几个概念面进行检索;在每个概念面中尽可能全和多地列举相关词 、同义词、近义词,并用布尔算符OR连接成子检索式,然后再用布尔算 符AND把所有概念面的子检索式连接起来,构成一个总检索式。 优点是:能够提供较明确的检索逻辑过程,以后容易检索和理解,还可 部分或全部地用作保留检索。一般地,“积木型”策略用于较复杂的检 索课题。 • 如“肺癌”与“吸烟”可以分成两个概念面,这两个概念面的各种形式 的检索词有: cancer smoker(s) • • carcinoma lung(s) cancer smoking cigar
(二)截词检索
截词检索:是指在检索时使用词的一个局部(某些 位置上的字符被截去)进行检索匹配,并认为凡满足这 个词局部中的所有字符要求的记录,都为命中结果。 截词检索需要使用专门符号(截词符),以指定截词 的具体位置与截断字符的数量。 • 按照截词位置的不同,截词检索分为: 右截词、左截词和中间截词三种。 例如:检索式 “wom?n”可检索到含有woman、women的结果。 截词检索实际上是一种隐含“逻辑或”的运算,能提 高查全率,扩大检索结果,是防止漏检的有力手段。
第二部分事实与数据检索工具
讨论事实、数据资源检索,其检索的对象是大量的、 常用的那些具体的科学技术数据和事实,如物理量、 物质特性、参数、规格等技术数据以及价格、产量、 公司名录、人名录等商业、经济等各种实用信息。 它们的检索工具包括:百科全书、年鉴、手册、词 典、机构指南和人名录、书目及书目指南等参考工 具。
第二章_信息检索基础之二

检索表达式示例
字段代码与字段 名称对照
位臵检索
位臵检索又称邻近检索,主要是通过 检索式中的特定符号来规定检索词在结果 中出现的顺序和词间距。
例如检索“生物防治”的文献,若用 检索式“biological*control”检索,则 会将“抑制生物”(control biological) 的文献也查出来,这显然不是所需文献。
字段代码方式
在进行检索时,通常在检索式中加入字段代 码来限定检索字段。字段代码与检索词之间可用 后缀符“/”或前缀符连“=”接起来。各个系统的 字段代码和前缀后缀符号可能各有不同。有的系 统不分前缀后缀限定。 例如,美国专利局数据库的高级检索界面便使 用了字段限制代码,用户需用这些字段限制代码 构造检索式,在检索框中输入检索命令来进行检 索。
字段限制检索主要有两种方式:
菜单选择方式
在检索系统的界面上设臵的字段下拉菜单中 进行选择,在相应的检索框中输入检索词,就可 完成字段限制检索。目前大多数检索系统都设臵 了此种检索方式。 例如,在中国期刊全文数据库检索界面中, 可在其提供的字段下拉菜单中选择合适的字段名 称进行检索。
字段限制检索主要有两种方式:
字段限制检索
字段检索是限定检索词在记录中出现的字段范围, 检索时,计算机只对限定字段进行查找。 这种检索技术可以缩小检索范围,提高检索的准 确率。 一般而言,一条记录中主要用来表达文献内容 特征的字段称为基本索引字段,如题名、文摘、叙词、 自由词等。常用的基本索引字段及其代码如表所示。 表达文献外部特征的字段称为辅助索引字段,如著者、 机构名称、语种、刊名、来源、出版年等。常用的辅 助索引字段及其代码如表所示。
截词检索
有限截断比较精确,只检出用户需要的词汇,而无限 截断作用时必须注意词干不要太短,否则会检出许多无关 文献。 在中文数据库中作用最多的是后截断,即立脚前方一 致检索。例如,金盘书目系统的查询方式。 金
《信息检索教案》课件

《信息检索教案》PPT课件第一章:信息检索概述1.1 信息检索的定义解释信息检索的概念和意义强调信息检索在学术研究和日常生活的重要性1.2 信息检索的类型介绍不同类型的信息检索方法,如手工检索、计算机检索等解释各种检索方法的优缺点和适用场景1.3 信息检索的流程介绍信息检索的基本步骤,如确定检索需求、选择检索工具等提供实用的检索技巧和策略,帮助学生更有效地获取信息第二章:检索工具与数据库2.1 检索工具的类型介绍不同类型的检索工具,如目录、索引、文摘等强调各种检索工具的特点和适用场景2.2 数据库的类型介绍不同类型的数据库,如文献数据库、全文数据库等解释各种数据库的优缺点和适用场景2.3 检索工具与数据库的选择提供选择检索工具和数据库的依据和方法强调选择合适的工具和数据库对信息检索的重要性第三章:网络信息检索3.1 搜索引擎的使用介绍搜索引擎的概念和原理讲解如何有效地使用搜索引擎进行信息检索3.2 学术搜索引擎的使用介绍学术搜索引擎的概念和特点讲解如何利用学术搜索引擎获取学术信息3.3 社交媒体与网络信息检索介绍社交媒体在信息检索中的应用强调社交媒体在获取实时信息和社交网络分析中的价值第四章:信息检索技巧与策略4.1 检索关键词的选择讲解如何选择合适的检索关键词提供关键词选择的方法和技巧4.2 布尔逻辑检索介绍布尔逻辑检索的概念和原理讲解如何运用布尔逻辑提高检索效果4.3 短语检索与位置算符介绍短语检索和位置算符的概念和用法强调短语检索和位置算符在精确检索中的重要性第五章:信息检索实践与应用5.1 学术研究中的应用讲解信息检索在学术研究中的重要性演示如何利用信息检索进行文献综述和实证研究5.2 日常生活中的应用讲解信息检索在日常生活中的应用案例强调信息检索对提高生活质量的重要性5.3 信息检索的道德与法律问题介绍信息检索中的道德和法律问题,如版权、隐私等强调信息检索时应注意的道德和法律规范第六章:特定信息类型的检索6.1 图像和多媒体信息的检索介绍如何检索图像和多媒体信息演示使用图像搜索引擎和多媒体数据库的技巧6.2 统计数据的检索讲解如何检索统计数据介绍使用政府统计网站和专业统计数据库的方法6.3 专利信息的检索介绍如何检索专利信息演示使用专利数据库进行检索的步骤和技巧第七章:信息评估与批判性思维7.1 信息评估的标准讲解评估信息质量的标准和原则强调批判性思维在信息评估中的重要性7.2 识别信息源的可靠性介绍如何识别和评估信息源的可靠性分析不同类型信息源的可信度和偏见7.3 信息批判性思维的实践讲解如何运用批判性思维分析信息演示通过信息检索进行批判性思维实践的案例第八章:信息素养与终身学习8.1 信息素养的概念解释信息素养的内涵和外延强调信息素养在现代社会的重要性8.2 培养信息素养的策略介绍培养个人信息素养的策略和方法强调终身学习在维持和提升信息素养中的作用8.3 信息素养的实践应用讲解信息素养在个人和专业生活中的应用演示如何利用信息素养解决实际问题第九章:信息检索的未来趋势9.1 与信息检索介绍在信息检索中的应用探讨如何改变信息检索的方式9.2 大数据与信息检索讲解大数据对信息检索的影响探讨大数据时代信息检索的新挑战和新机遇9.3 未来信息检索技术的发展趋势预测未来信息检索技术的发展方向强调终身学习的重要性以适应不断变化的技术环境第十章:综合实践与案例分析10.1 综合实践项目设计设计一个综合实践项目,要求学生应用所学信息检索技能提供项目实施步骤和评估标准10.2 案例分析与讨论提供几个案例分析,要求学生应用信息检索技能解决问题鼓励学生进行讨论,分享他们的思考和经验10.3 课程总结与展望总结整个课程的重点和难点展望信息检索领域的发展前景,鼓励学生持续学习和探索重点解析本文教案主要涵盖了信息检索的概述、检索工具与数据库的选择、网络信息检索、信息检索技巧与策略、信息检索实践与应用、特定信息类型的检索、信息评估与批判性思维、信息素养与终身学习、信息检索的未来趋势以及综合实践与案例分析等十个章节。
计算机信息检索的策略和方法

计算机信息检索的方法与策略1. 计算机信息检索过程中的相关概念(1)数据库:数据库是“至少由一个文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合”。
通俗地说,数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。
数据库是计算机技术与信息检索技术相结合的产物,是现代重要的信息资源,也是信息检索的重要资料来源。
根据载体的不同,数据库可分为:联机数据库(online-database),光盘数据库(CD-ROM-database)和网络数据库(networked-database)三种。
(2)检索界面:指在进行计算机检索时,检索者与计算机交互对话的界面。
(3)检索方式:以检索过程的繁简程度或从何入手来区分的不同检索过程。
在数据库中往往设有初级检索/简单检索/基本检索(单途径检索);高级检索(多途径组合检索);专业检索(构造检索式);按类检索;按刊检索(刊物查询、刊名导航),篇目检索/论文查询;引文检索等方式供选择。
(4)检索途径:又叫检索入口、检索项,也有的数据库称之为检索字段。
指输入的检索条件所查询的数据区域。
不同数据库所设的途径并不相同。
一般都设有篇名、作者、关键词、全文等途径。
(5)检索词:检索词是检索者给出的字、词、字符或短语,用于查找含有它(它们)的记录。
(6)排序:指检索结果输出时的排列顺序。
输出结果按相关度排序时,则检索结果按检索词在检索字段中发现的频度由高到低依次排列。
无相关度时,输出结果则按文献的出版日期逆序排列或随机排列。
(7)二次检索:指在前一次检索结果的基础上,进一步限定检索条件所进行的再次检索。
二次检索可以多次使用,逐步缩小检索范围。
(8)限制条件:在检索对象的时间、文献类型、语种、同义词等方面做限制,与检索途径配合使用,以精化检索结果。
(9)检索词匹配:指输入的检索词在数据库的可检索字段值中的位置关系。
一般表示为前方一致、后方一致、完全一致(精确匹配)、任意一致(模糊匹配)等。
简述信息检索技术与策略

简述信息检索技术与策略
信息检索技术与策略是指利用计算机技术和信息科学方法来获取、组织、存储和检索信息的一种方法。
它是在日益增长的信息资源中高效获取所需信息的关键技术之一。
在信息检索过程中,一般采用关键词检索和全文检索两种方法。
关键词检索是指根据用户输入的关键词来查找相关信息;全文检索则是将用户提供的查询条件与文档库中的所有文本进行比对,并返回与查询条件相关的文档。
信息检索策略则是指在信息检索过程中的一系列操作和决策。
常用的策略包括查询扩展、查询改写、查询重排序等。
另外,信息检索技术与策略也涉及到评估指标的选择,如准确率、召回率、F值、平均精度等。
在信息检索领域,不断发展和创新的信息检索技术和策略为用户提供了更高效、精准、个性化的信息服务。
- 1 -。
第二章网络检索

2.1.3、网络信息资源的特点
(一)优点: 1.数量巨大,增长迅速 2.内容丰富,形式多样 3.结构灵活,分布广泛 4.开放互动,共享性强 5.传播快速,利用方便 6.更新速度快,动态性强
网络信息资源的特点
(二)缺点: 1.网络信息质量参差不齐,良莠不一 2.分散无序,缺乏管理
2.2 网络信息检索的方法
2、网上出版物
网上出版物是指在网络环境中编辑、出版、发行的出版物以 及印刷型出版物的网络版,包括网上图书、网上期刊、网上报 纸等。如今,通过Internet浏览、订阅电子期刊、报纸、图书 等已成为一种时尚,网络出版物的数量正急剧增加。如在中国 科技期刊网上可以免费查找《中国学术期刊》的题录。其中网
上参考工具书更是独树一帜,像一些百科全书、辞典、指南、
手册、文摘索引、目次表、名录等,这些网络版参考工具书使 用起来方便、快捷。目前因特网上有上万种电子期刊向网上用
户提供服务,其中很多是免费提供。
主要网上书店
中国图书网(/) 中华图书网(/)
短短的两年多时间内,设在北京大学的项目管理中心联合各参建
单位,建设了文理、工程、农学、医学四个全国文献信息中心, 华东、华中、华南等七个地区中心和一个东北地区国防信息中心, 建立了一系列国内外文献数据库,并开展了公共目录查询、信息 检索、馆际互借、文献传递、网络导航等网络化、数字化文献信 息服务,对保障"211工程"各高校的重点学科建设、培养高层次人 才、支持科研创新等发挥了重要的作用。
CALIS面向读者的服务功能主要有: (1)公共检索:可以在网上查找全国性或地区 性的书刊联合目录数据库,了解所需文献是否有及在 哪里收藏。也可以联机检索CALIS国内外各种类型的 文献数据库。 (2)馆际互借 (3)文献传递 (4)电子资源导航:对网上的电子资源进行收 集、加工和整序,形成虚拟图书馆资源,提供用户浏 览和查询。
信息检索的策略.ppt

2019/10/11
11
2.5.3计算机信息检索的技术
(1)后方截词
也称前方一致检索。将截词符放在一串字符的 后面,用以表示以相同字符串开头,而结尾不 同的所有词。
例1:comput* 可检出computer, computing,computers,computation 等。
(1)字段限制 (2)二次检索
2019/10/11
24
2.5.3计算机信息检索的技术
4.限制检索 (1)字段限制 字段限制可针对特定年代、特定类别、特定检索
点等做限制,主要分为两种类型: 基本索引字段限制检索 辅助索引字段检索
2019/10/11
25
2.5.3计算机信息检索的技术
2019/10/11
29
2.5.4 检索步骤
1、分析研究课题 2、选择检索系统 3、确定检索词,构造检索式 4、检索的实施,查找信息线索 5、索取原始文献
如:如“刘红光”/作者字段 AND“江苏大学”/ 机构字段NOT“汽车”/关键词字段;
如:“激光加工” NOT “激光切割”
2019/10/11
8
2.5.3 计算机信息检索的技术
布尔逻辑检索图示
2019/10/11
9
1、布尔逻辑检索
布尔逻辑算符的优先级顺序为 NOT,AND,OR。
另外可以使用括号改变它们之 间的运算顺序。
1.布尔逻辑检索 (3)逻辑“非”(用“NOT”或“-”表示) 逻辑“非”是一种排斥关系的组配,用于在某
一记录集合中排除含有某一概念的记录。
逻辑“非”的基本作用是缩小检索范围,起到 减少输出文献量的作用。
第二章 信息检索的基本知识

应用举例:
利用《中图法》在《全国报刊索引》中查找 有关“建筑抗震设计”方面的相关文献。 第一步:分析课题,按学科属性属于“T工业技术” 中的“TU建筑科学”大类。 第二步:查《中图法》确定分类号为:T工业技 术—TU建筑科学—TU3建筑结构—TU352.11抗震结 构。 第三步:根据《全国报刊索引》(科技版)的分 类目录给出的TU3建筑结构的页次,得到相关文献。 第四步:根据的出处索取原始文献。
第二章 信息检索的基本知识
主要内容
1.信息检索概述 2.信息检索原理及检索语言 3.信息检索系统与检索工具 4.信息检索的一般程序
2.1 信息检索概述
2.1.1信息检索的含义
信息检索(Information Retrieval)是指 将信息按一定的方式组织和存储起来,并根据用 户的需要找出有关信息的过程,又叫信息储存与 检索(Information storage and Retrieval), 这是广义的信息检索,如图2-1所示。狭义的信息 检索则是仅指该过程的后半部分,即从信息集合 中找出所需信息的过程。
内容特征 标题词 主题语言 关键词 叙词 描述文献外表特征的检索语言,例如篇名、著者姓名、文 献号等作为文献标识与检索依据直接明了,使用时较为简单。 而文献内容特征的语言,也就是分类语言和主题语言的原理和 使用方法是下面主要介绍的内容。
一条中文书目记录:
题名: 信息检索 作者: 徐天秀 出版项:北京:科学出版社,2006 页码: 320页 价格: CNY23.00 主题: 情报检索 索取号: G252.7/101 内容提要:本书是一本工具型书籍,提供的信息检索学科 范围广,内容尽量以最新版本为主,是一本适用性强的学 习信息检索方法和技巧的专著,尤其是本书配制的多媒体 光盘,为本课程的学习提供了便捷。 分类: G252.7
文献检索,信息检索(2)第二章 信息检索原理

缺点:常常落后于当前研究现状,分类表相对呆板的 学科关系,使得确定前沿概念、跨学科概念或非常具 体概念的分类,较困难。用户差异性。
分类语言
中国图书馆图书分类法 美国国会图书馆分类法 杜威十进位分类法 IPC国际专利分类法
基本部类 马列毛邓 哲学
(2)多概念课题
并列概念课题,如“新闻宣传研究”
“计算机在人文社会科学方面的应用” 上位类分类方法,如“灰色系统理论”
应用性课题,如“计算机在人口预测方面的应用”、
2.主题语言
是直接以代表信息内容特征和科学概念的概 念词作为检索标识,并按字顺组织的一种检索语 言。 是以表达文献主 是从文献的内容 是从文献的题目
一、检索算符 逻辑与
(一)布尔逻辑算符
布尔逻辑组配运算是采用布尔代数中的 逻辑“与”逻辑“或”、逻辑“非”等算符,
将检索提问式转换成逻辑表达式,限定检索
词在记录中必须存在的条件或不能出现的条 件。凡符合布尔逻辑所规定的条件的文献, 既为命中文献。
布尔逻辑运算符
————————————
1、逻辑“或” 2、逻辑“与” 3、逻辑“非”
2、逻辑“与”
————————————————
Chinese AND litera0,000 网络100,000,000) 用符号“and”或“*”表示,其逻辑表达式为: A * B 或 A and B 其意义为检索记录中必须同时含有检索词A和B 的文献,才算命中文献。
4、记录级
检索词在数据库的同一记录中。
(C)—citation
表示两侧的检索词(或检索项)必须出现在同一记录中,词
序不限,中间词数量不限,其作用与布尔逻辑算符AND相同。
第二章信息检索技术与策略

( ) 、 ‘ ’ 、“ ”
六、实施检索
使用各种检索工具进行检索。
七、调整检索策略
1. 检索结果信息量过多
① 减少同义词与同族相关词。 ② 增加限制概念,采用逻辑“与”连接检索词。 ③ 使用字段限定,将检索词限定在一定的字段范围。 ④ 使用逻辑“非”算符,排除无关概念。 ⑤ 增加语种限制以及缩短检索期限。 ⑥ 调整位置算符,由松变严。 ⑦ 将截词的词根变长或减少截词算符的使用。
三、信息检索的类型和方法
事实检索
检索系统中存储的是从原始文献中抽取的各种事实,用户 通过检索可获得有关事物、事件的发生与发展情况及相关资料, 它也是一种确定性检索。一般利用字词典、年鉴、百科全书、 手册等为检索工具。
例如:禽流感最早出现于哪个国家 检索工具:兽医手册
三、信息检索的类型和方法
全文检索
利用非线性信息组织方法建立的数据库检索相关信息的方式。
三、信息检索的类型和方法
按信息检索手段划分
手工信息检索 计算机检索
三、信息检索的类型和方法
2. 信息检索的方法
(1)引文追溯法:利用文献所附的参考文献进行追溯查找。 (2)工具法:是指利用各种检索工具或数据库查找文献信息的 方法。包括顺查法和倒查法两种。 (3)循环法:是工具法与引文追溯法相结合的一种检索方法
存储 检索
存检储索::是是对指信面息向进信行息著需录求、 标而引进、行整高序度,选编择制性检的索查工找 具过和程建。立检索系统的过程。
二、信息检索的概念和原理
原始文献 加工整理
数据库 存储
提问 检索 输出 检索
二、信息检索的概念和原理
信息检索原理 检索提问标识与存储标引标识进行比较,两者一
第二章 信息检索基本方法与基本技术

2. 主题检索语言
• 标题词:经规范化处理的词或词组,先组式
语言
• 叙 词(单元词):经规范化处理的词或词
组,后组式语言,可自由灵活组配
• 关键词:未经规范化处理,直接从文献题名、
原文或文摘中选取的能反映原文主题内容的自 由词汇
二、检索工具
定义:检索工具是人们用来存储、报道和查找 文献的工具,它具有存储和检索的功能。
点击预约书刊可预约该书 预约图书:选定所需图书,输入证号、密码,执行预约 点击机读格式可查看该书的MARC信息
高级查询
• 在题名、著者、丛书名、主题词、出版社、 ISBN(书)、ISSN(刊)、索取号、起始年 代中填入自己确定的内容,其余的可以不填 写;选定语种(17种)和文献类型,然后进 行检索。 • 结果可检索到所需文献的题名、著者、出版 信息、索取号 • 查看选中图书的相关信息
图书馆信息查询系统
•书目查询 •读信者息 •新书通报:一个月内到馆的新书、馆藏 地,并可查看新书 •订购征询 •信息发布:预约到书列表、超期罚款、 超期催还、委托借阅到书列表
如何利用计算机进行检索
书刊查询
读者信息查询
图书馆主页的功能
信息发布功能:
图书馆最新服务动态、电子 资源试用等均及时在主页上发布。
一、信息检索原理
信息检索的原理(示意图)
存 储
特征化
表示
查 询
特征化
表示
信息 集合
选择与匹配
需求 集合
二、信息检索类型
手工检索 计算机检索 文献信息检索
• 信息检索(内容)
• 信息检索(工具手段)
数据信息检索
事实信息检索
第二节 信息检索语言与工具
一、信息检索语言
计算机基础与应用——02网络信息检索

资源共享
• FTP
– FTP是文件传输协议(file transfer protocal)的缩 写,是一种重要的文件传输手段。通过FTP,可 以在因特网上的任意两台计算机之间互传文 件,而不管这两台计算机的硬件及操作系统 平台是否相同。 –习惯上,我们把从远程计算机(FTP服务器)向 本地计算机(客户机)传输即复制文件的过程称 为“下载”(Download),把从本地计算机向 远程计算机传输文件的过程称为“上 载”(Upload)。
– 特殊检索功能 • 自然语言(Natural Language)检索:直接采用自 然语言中的字、词或句子提问式进行检索。 • 多语种检索:提供多语言种类的检索环境供检索 者选择,系统可按指定的语种进行检索,并输出 相应的检索结果。 • 区分大小写的检索(Case-Sensitive):主要是针 对检索词中含有人名、地名等专有名词的检索。
邮件服务器B 客户机A
Internet
1
SMTP协议
3 POP协议
SMTP协议
2 邮件服务器A 客户机B
电子邮件的发送过程示意图
电子邮件系统的主要服务功能
(1)、既可以传递文本形式的邮件,也可以 传递声音、图形或影像格式的邮件。 (2)、可以把一封电子邮件同时发送给许多 接收者。 (3)、方便地存储(Save)、转发(Forward to)邮件和回复(Reply to)邮件。 (4)、可以定阅电子刊物。
二、信息检索策略
• 合理确定检索的关键词 • 采用选用适当的检索方法 – 分类目录检索 – 关键词检索 – 分类目录加关键词混合检索 – 多元引擎检索 • 检索结果的处理对策
• 常用的检索技巧 – 用搜索引擎检索到所需文档并连接到相关 网页后,有时会发现你所要的文件并没有 出现在当前屏幕中,这时简单的方法就是 在该网页中使用查找功能 。 – 一些常用网站的网址(URL)通常是可以 猜测出来的,当然首先需要我们了解URL 的基本组成,在需要时就可以“构造”出 这样一个网站的URL来。 – 在信息检索中,当一个很长的网址连接不 上时,可以试试“右切断网址”的方法, 从右至左依次删除网址中斜杠后面的内容, 直至链接成功。
第三节课 第二章 文献检索原理与方法

思考题
1.《中国图书法》(简称《中图法》)将图书分为() A. 5大部类,22个大类 B. 5大部类,26个大类 C. 6大部类,22个大类 D. 6大部类,26个大类 2.《中国图书法》(简称《中图法》)是我国常用的分类法,要 检索农业方面的图书,需要在( )类目下查找。 A. S类目 B. Q类目 C. T类目 D. R类目
第一步,《全国新书目》的新书是安排在"新书视窗"专栏,在 2000年第3期《全国新书目》的目录中寻找到"新书视窗"专栏, 在第41~77页。 第二步,在第41~77页的"新书视窗"专栏里,我们可以看到, 该专栏是按照出版社的顺序排列的。高等教育出版社在第45页, 广东经济出版社第46页,教育科学出版社在第52页。 第三步,在第45、46、52页,你可以看到这几个出版社最 近所出版的新书目录。 如广东经济出版社的目录中有以下记载: 知识经济与改革创新 黄铁苗主编 2000 20cm 25.00元 本书围绕改革开放中的热点、难点问题进行探索,具体内容 包括:所有制问财政金融问题、农村经济问题、就业问题、地方 经济问题和其他问题。
2.检索工具-类型
目录 (bibliography,catalogue) 文摘(abstract) 索引(index)
2.1 目录
目录是一批相关文献信息的著录集合,是以报道文献 出版信息为主要功能的工具。 特点:以单位出版物为著录对象,反映馆藏情况,主 要揭示文献外部特征 目录的著录项目:出版名称、责任者、出版项和稽核 项 目录的类型:《全国总书目》《全国新书目》《全国 西文期刊联合目录》
主题词法与分类法的比较
主题词法 分类法
新第二章 信息检索基础知识

2.2 信息检索语言
三、主题语言
4.关键词语言
是指从文献标题、文摘、正文中抽离出来的,对表征文献主题 内容具有实质意义的语词,以关键词作为信息标识和检索依据的主 题语言。关键词没有固定的词表,因为对于同一个事物的概念,不 同作者甚至是同一个作者在不同的著作中用词都会不同,它是没有 经过规范化的自然语言词汇。 在检索中文医学文献中使用频率较高的《CMCC》数据库就是 采用关键词索引方法建立的。
2.5 计算机检索技术 四、词组检索
将固定词组或短语 看成单个词进行处理。
常用“ ”作为词组检索的运算符。
2.5 计算机检索技术 五、字段检索
对指定的一个或多个字段进行检索,从而提高查准率或查全率。
标题、作者、摘要、关键词、作者单位、文献来源、学位授予单位、 学位级别、会议信息、会址、会期、书名、出版地、出版年、专利号、报 告号、ISBN、ISSN等。
2.2 信息检索语言
一、信息检索语言的定义、作用和种类
4.分类:
篇名(题目) 著者名称 描述文献外表特征 文献序号 引用文献 等级体系分类语言 分类语言 组配分类语言 主题语言
检索语言
描述文献内容特征
代码语言
标题词语言 关键词语言 单元词语言 叙词语言 分子式索引 结构式索引 专利号索引等
2.2 信息检索语言
2.4 信息检索标识 一、检索标识的定义
检索标识即检索词,是指能表达检索课题主题概念和信息需 求的名词术语、分类号、名称、代码等的总称,包括主题词、 关键词、名称、分类号、分子式、专利号及各种号码。
2.4 信息检索标识 二、信息检索标识的类型
1.描述信息内容特征的检索标识: 分类、主题、代码(符号)。
2.5 计算机检索技术 一、布尔逻辑检索
《信息检索与利用》课程教学大纲

《信息检索与利用》课程教学大纲
一、课程介绍
(一)课程性质
“信息检索与利用”课是一门公共基础课,也是培养学生信息意识、信息能力、信息素质及检索基本技能的一门方法课,具有较强的理论性、知识性和实践性。
(二)课程任务
通过理论教学和实践,使学生具备文献信息检索的基础知识和基本理论,熟悉本专业及相关专业文献信息资源;掌握通过多种方式获取和利用文献信息资源的基本技能;学会用科学的方法进行文献信息的收集、整理、加工和利用,提高学生在学习和工作中的自学能力和独立创新能力。
课程主要内容包括信息检索的基本原理和基本知识、信息资源的特点及分布、各类检索工具及数据库的使用方法、信息利用的基本知识和方法。
通过该课程的学习有利于提高学生独立学习和自我知识更新的能力。
本课程总学时32,其中实验或自主上机8学时。
二、学习目标
(一)课程的总体目标与基本要求
通过理论学习,要求学生掌握文献信息检索的基本理论(包括信息资源、信息检索系统、信息检索语言、信息检索原理);掌握信息检索的基本技术(信息检索方法、信息检索途径、信息检索步骤、信息检索结果的识别);从而掌握文献信息检索的理论基础,具备分析和解决文献信息检索实践中的具体问题的理论知识。
基本技能的重点在于锻炼学生应用基础理论去探讨、研究和解决实际问题的能力。
通过教学实习环节,要求学生熟悉与本专业有关的数据库信息检索系统和因特网信息检索系统,运用文献信息检索的基本原理和基本技术,实际操作相关检索系统,完成文献信息的检索和利用,掌握文献信息检索的基本技术,具备文献信息检索的基本技能。
(二)各章节学习目标
三、教学大纲
四、学习计划
五、考核要点。
第二章信息检索基础1

化学物质登记号(CAS registry number)检索
分子式(formula)检索 记录顺序号(accession number)检索 化合物结构图检索(structure search)检索 ……
不同检索途径常用字段名称
题名途径:题名、标题、篇名、题目、title 分类检索途径:分类号,中图分类号 主题途径:主题词、MeSH、MeSH terms、 Thesaurus、map term to subject headings 关键词途径:关键词、keywords、text words 著者途径:(第一)作者、著者、责任者、 author、first author
研、生产中的具体问题所需要的特定知识或信息。(微波炉
发明) (四)文献(Literature) 文献是记录有知识的一切载体,是知识的外在形式。
情报的基本属性
知识或信息 经过传递
经用户使用产生效益 情报的 基本属性
信息与知识、情报、文献的关系
知识源于信息,是信息的一部分 情报源于知识或信息,是激活了的知识或信息 文献是信息、知识、情报的主要载体形式
形成系统,便于检索的文献。
如:题录、书目、索引和文摘。
特征1 特征2 特征3 特征4 特征5
提取特 征
特征n
二次文献
二次文献
二次文献
2013-8-10
40
三次文献
三次文献是利用二次文献并在其指引下,对大 量的一次文献进行综合分析研究,加以浓缩和提 炼而成的文献。 包括综述、述评、进展、预测等,各类词典、 手册、年鉴、百科全书、指南等参考工具书也属 于三次文献的范畴。
一次文献、二次文献、三次文献
一次文献:
又称原始文献,是首次公开发表的文献,直 接记录了科研成果,报道了新发明、新技术、新 知识和新观点。 一次文献主要包括专著、期刊论文、科技报 告、会议文献、学位论文、专利文献等。
文献信息检索ppt.ppt

表述文献外表 特征的语言
责任者 代码 引文
语
言
的
分类法
类 型
表述文献内容 特征的语言
主题法
主题途径 主题词是规范化的检索语言,主题词检索途径的 检索系统都有相应的主题词词表,利用主题词途 径标引或检索文献时,一定要先查对词表,再进 行标引或检索。国内中文主题词表一般采用《中 国主题词表》或《中国图书馆图书分类主题词 表》,英文文献检索系统一般采用《❖ 是一种定量检索技术:在每个提问词后面给 定一个数值表示其重要程度,这个数值称为 权,在检索时先查找这些词在记录中是否存 在,然后计算存在的权值总和,权值之和达 到或超过给定阈值,该记录即为命中记录。
七 聚类检索
❖ 把相似度较高的文献集中在一起形成一个个 的文献类的检索技术。
八、匹配方式 P37-38
❖ 检索词的词干后(前)加一个“?”(有的系统 为加*),表示词干后(前)可以有任意个字符。
如“apple?”可代替(apple + apples + apple-pie + applesauce);
❖ 由于文字结构方面的原因,中文检索系统极 少使用通配符进行截词。
❖ 椰壳制备高比表面积活性炭 ,椰壳可能表达 为椰子壳,可以用“(椰子壳十椰壳)*高比 表面积活性炭 ”,或直接用“椰*高比表面 积活性炭 ”
AB
用符号“or”或“+”表示,其逻辑表达式为: A or B 或 A+B
其意义为检索记录中凡含有检索词A或检索词B, 或同时含有检索词A和B的,均为命中文献。
例:
2、逻辑“与”
————————————————
AB
用符号“and”或“*”表示,其逻辑表达式为: A * B 或 A and B
2第二章 计算机检索基础知识

据
库
按文献类型划分:
数
文献类数据库
书目数据库(二次文献) 全文数据库(一次文献)
据
库 数值数据库 非文献类数据库 图像数据库 术语数据库
按载体形式分为 :
单机版光盘数据库 数 据 联机数据库 光盘数据库 络版光盘数据库
库
网络数据库
镜像站数据库
三、数据库的文档结构
1. 顺排文档(linear file):是按记录的编号
顺序排列的文档。为主文档。顺排文档结构简 单,管理方便,节省储存空间,但检索速度较 慢。
2. 倒排文档(inverted file):是将数
据库中具有某些特征的字段值和具有该 字段值的记录号按顺序排列构成的文档, 也称为索引文档。
4.数据结构具有通用性、开放性、动态性 5.信息资源体积小,数量巨大
一座拥有百万册图书的图书馆,经过数字化处理后,只需 3400张光盘就可以全部存储下来。
6.传播方式的无限性
电子信息资源不受时间、空间的限制,实现跨时空、跨行业 的传播。
7.交互性
电子信息资源不是传统信息资源的复制,而是对传统信息 资源和信息交流渠道的补充。
2.2
数据库
一、 定义
数据库是可以共享的某些具有共同存取方 式的相关数据,以一定的组织方式的集合。 数据库本质的三个要素:相关数据、共同 存取方式和一定的组织方式、共享。 通俗地说,数据库是以某一特定方式组织 和存放的数据的仓库。
数据库与其他数据集合的主 要区别在于数据库中的各项 数据可以通过同一种方式进 行储存与查找,因此同一个 数据库中的记录格式都是一 样的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、信息检索的类型和方法
1. 信息检索的类型
按
文献检索
检
数据检索
索
事实检索
内
全文检索
容 划 分
图像检索 超文本检索
三、信息检索的类型和方法
文献检索
使用以二次文献为存储对象的信息系统,如目录型、题录 型、文摘型数据库,是一种相关性检索。特点:检索结果不直 接解答课题用户提出的技术问题,只提供与之相关的线索。
四、信息存储
1. 数据库及其构成
数据库(database):至少由一种文档组成,并 能满足某一特定目的或某一特定数据处理系统需要的 一种数据集合。 通俗地说,数据库就是在计算机存储 设备上,按一定方式存储的相互关联的数据集合,是 信息检索的基础。
四、信息存储
1. 数据库及其构成
一条信息记录(record)是由若干个字段 (Field)所组成,字段是构成记录的基础;信息记 录的集合就形成文档,一个数据库可以包含有一个文 档,也可以含有若干个文档。
第一节 信息存储的基本知识
一、信息筛选 二、信息描述 三、信息检索语言 四、信息存储
一、信息筛选
信息筛选是指对原始信息有无作用的挑选和鉴别,是建立信息 资源检索系统的基础和保障。 信息筛选原则:针对性、系统性、预见性、科学性、计划性和 及时性。 信息筛选方法:直观判断、分析、集体讨论、专家裁决、数学 核算、现场核实等方法。
第二章 信息检索技术与策略
第一节 信息存储的基本知识 第二节 信息检索概述 第三节 现代信息检索策略 第四节 检索效果评价
第一节 信息存储的基本知识
信息存储是指利用一定的科学规则和方法,通 过对信息的特征进行分析、表征和提炼,并按给定 的参数和序列公式排列、存储在相应载体上,组织 成系统化的具有检索功能的系统过程。
四、信息存储
2.数据库记录的格式
“记录”是文献信息数据库的基本组成单位。 每一条记录是由三种类型的字段组成:检索系统存取 号、基本索引字段和辅助索引字段。
四、信息存储 2.数据库记录的格式
第二节 信息检索概述
一、信息检索的发展历程及进展 二、信息检索的概念与原理 三、信息检索的类型和方法 四、信息检索工具
二、信息描述
信息描述是指根据一定的规则和技术标准,对信息的外 部特征、物质形态和内容特征进行全面描述并给予记录的过 程。
一条信息之所以有别于其他信息,主要是它与其他信息 在外表和内容两方面的特征都有所不同。
二、信息描述
信息名称
外部特
信息来源
信 息
征描述
信息加工者 类型及表现形式
描
述
内容特 征描述
如:中国图书馆分类法 美国国会图书馆分类法 杜威十进位分类法
三、信息检索语言
中国图书馆分类法的体系结构:
部类(5个): 马克思主义、列宁主义、毛泽东思想 哲学 社会科学 自然科学 综合性图书
三、信息检索语言
中国图书馆分类法的体系结构:
大类(一级类目) 22 个
三、信息检索语言
中国图书馆分类法的体系结构:
信息内容特征的描述较为复杂,必须借助于特定 的信息检索语言。
三、信息检索语言
信息检索语言是根据信息组织和信息检索的需要 而创制的人工语言,又称信息组织语言、情报语言、 标引语言、索引语言等。
三、信息检索语言
1. 分类检索语言
分类检索语言是用分类号和类名来表达各种概念, 将各种概念按学科门类的逻辑次序或事物的性质进行 分类和系统排列。
从存储有大量原始文献全文的数据库中检索全文或某一 章节,属相关性检索的范畴。特点:是在书目信息检索基础 上更深层次的内容检索。
例如:检索由陈代文等撰写的“动物营养与免疫研究进 展 ”一文的全文
检索工具:中文科技期刊数据库等
例如:查找有关“食品安全与人类健康 ”方面的国内外 信息有哪些?
三、信息检索的类型和方法
数据检索
以数值信息为检索对象,通过检索,用户可以获得所需 要的确切数据,是一种确定性检索。它一般以数据大全、手 册、年鉴等为检索工具。
例如:2013年申请中国发明专利和获得授权发明专利最 多的国家有哪些?
检索工具:中国统计年鉴
三、信息检索的类型和方法
事实检索
检索系统中存储的是从原始文献中抽取的各种事实,用户 通过检索可获得有关事物、事件的发生与发展情况及相关资料, 它也是一种确定性检索。一般利用字词典、年鉴、百科全书、国家 检索工具:兽医手册
三、信息检索的类型和方法
全文检索
一、信息检索的发展历程及进展
(一)手工检索阶段 (二)机械检索阶段 (三)计算机检索阶段
1. 脱机批处理检索 2. 联机检索 3. 光盘检索 4. 网络检索
二、信息检索的概念和原理
信息检索:是指将信息 (主要指文献信息)按一定 的方式组织和存储起来,并 根据用户的需要找出相关信 息的过程。
信息检索
分类号 主题词
关键词
信息外部特征的描述
期刊论文: 文献题目、著者、著 者工作单位、文献的 出处(刊名、刊号、 卷期、起止页码)、 语种、参考文献及图 表的数量等。
图书: 书名、著者(或编 者、译者)、出版 项(出版社、地点、 时间)稽核项(价 格、页数、参考文 献)、书号等。
信息内容特征的描述
信息内容特征描述:是指在对信息内容进行分析 的基础上,根据一定的规则对信息的内容予以揭示, 并赋予标识的过程。
S农业科学类目简表
三、信息检索语言
2.主题检索语言
主题检索语言是用语词作为概念标识,按字顺排列,并用参 照系统等方法间接显示概念间相互关系的一种信息检索语言,也 称主题法系统。
◆ 标题词语言(Heading) 受《词表》控制 ◆ 元词(单元词)语言 (Uniterm) 受《词表》控制 ◆ 叙词语言( Descriptor ) 受《词表》控制 ◆ 关键词语言(Keyword) 不受《词表》控制
存储 检索
存检储索::是是对指信面息向进信行息著需录求、 标而引进、行整高序度,选编择制性检的索查工找 具过和程建。立检索系统的过程。
二、信息检索的概念和原理
原始文献 加工整理
数据库 存储
提问 检索 输出 检索
二、信息检索的概念和原理
信息检索原理 检索提问标识与存储标引标识进行比较,两者一
致或信息标引的标识包含着检索提问标识,则具有该 标识的信息就从检索系统输出,输出的信息就是检索 命中的信息。