第三章 计算机信息检索

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(四)计算机检索的特点: 1.检索方便快捷 2.检索功能强大 3.获得信息类型多 4.检索范围广泛
(五)计算机检索的类型 1.线索检索:这种检索的结果是有关文献的题录信息。
通常包括文献题名、著者、出处、文献内容提要等。 检索者可按照题录信息提供的线索索取文献的原文。
这种数据库检索系统有中国生物医学文献数据库等。
第三章 计算机信息检索
一、概述 二、检索系统的组成 三、检索步骤
一、概述
(一) 计算机检索的概念: 指人们在计算机检索网络或终端机上,使用特定的检
索指令、检索词和检索策略,从计算机检索数据库中检索 出需要的信息,然后再由终端设备显示、下载和打印的过 程。
(二)计算机检索的原理:
用户提问标识 (检索词)
(三)计算机检索发展历程
计算机检索是在计算机技术和通信技术发展的基础 上建立起来的。
发展历程大致可以概括为批量处理、联机检索与网 络系统三个阶段。
1 批量处理阶段
20世纪50年代末,IBM公司利用一台IBM650计算机成 功地编制出关键词索引,为用户定期检索和提供特定主题 的新到文献,并很快得到了推广应用。
4.超文本检索: 通过检索已经链接好的存贮有文本等信息的结点来获
取文献信息,是网络信息检索与浏览的主要手段。
搜索引擎来如谷歌、百度等。
二、计算机检索系统的组成
1.计算机系统 2.数据库 3.通讯线路 4.用户终端
三、计算机检索的步骤
1.用户提出问题。 2.选择与课题相关的数据库。 3.确定检索途径。 4.确定检索词。 5.拟定检索提问式。 6.上机检索。 7. 对检索效果的评价。
(四)确定检索词。
检索词可以划分为四类:表示主题的检索词、表示作 者的检索词、表示分类的检索词和表示特殊意义的检索词。
(五)拟定检索提问式 检索式是检索者向计算机发布的指令,也是人机对话
的语言,检索式表达了检索者的检索意图。
filetype:pdf title: (“河北农业大学" (动植物检疫))
(4)摘要途径 是从中、英文摘要途径查找文献的方法。
(5)引文途径
根据文献之间的引用关系查找所需文献信息。 引文文献包括注释和参考文献,是指在著作中所引用 的观点、材料、方法的著作和论文。
2 文献外表特征途径 是指文献上标明的显而易见的项目。
(1)文献名称途径 是根据已知文献的名称(如书名、刊名等)查找文
一个数据库是由一 种或多种文档构成 的数据集合,
每个文档由若干记录组成,每条记录由若干字段构成。一
个记录代表一篇文献。
数据库
文档1 文档2 文档3
. . .
记录1 记录2 记录3
. . . 记录n
字段1 字段2 字段3
. . . 字段n
篇名 关键词 著者 单位 刊名
文档n
2 检索:用户按一定的要求将检索词输入计算机内,由计 算机对其进行处理,并与数据库中的记录进行匹配运算。 最后将检索结果按要求的格式输出。
献的途径。
(2)著者途径 根据已知文献的编者、著者、译者的姓名来查找文
献的途径。
需要注意的是:欧、美人的姓名习惯是名在前,姓 在后。名字可以缩写,姓一般不缩写(欧洲匈牙利除外)。
M. R. Smith 名姓
(3)文献序号途径 是根据文献的序号(如专利号、标准号、报告号等)
获取所需文献。
例如ISBN、ISSN。
(4)机构途径 是根据著者所在单位查找文献信息的途径。
(5)时间途径 根据时间范围查找文献的途径。
(6)其他途径。 主要是指专业性检索工具(如BA、CA等)所使用
的辅助索引。
如生物学文摘属种索引、地理名称索引。
索引:根据一定需要,把书刊中的主要内容或各种题 名摘录下来,标明出处、页码,按一定次序分条排列, 以供人查阅的资料。
匹配比较
系统的文献特征 标识(标引词)
符合比较原则和逻辑运 算条件者即为命中信息
1 存贮:文献著录(字段)以一定的格式输入计算机,成 为文献记录。经过计算机处理,将大量的文献记录以一定 的结构存贮在磁盘上,生成文献数据库。
文献数据库 定义:至少有一种文档组成,能满足特定目的或特定处 理系统需要的数据集合。
பைடு நூலகம்
3 网络系统阶段
20世纪90年代,随着互联网的迅速发展及超文本技 术的出现,检索软件的开发,使联机检索进入了又一个崭 新的时期。
目前,信息检索技术正向两个方向发展:
(1)传统信息检索向全文文本、多媒体、多载体、多 原理等新型信息检索发展;
(2)信息资源的网络化和分布化,向基于概念、超文 本信息和多媒体信息检索技术发展。
1文献的内容特征途径 (1)分类途径
是按照文献内容所属学科性质的分类体系,查找所需 文献的方法。
(2)主题途径 根据文献内容所讨论的中心问题查找文献。
查找的依据是主题词。
主题词(subject word):代表文献内容,有实质意 义并经过规范化的词。
它专指性强,检索速度快,能把分散在各个学科的文 献查全。缺点:主题词选不准,可能造成漏检、误检。
2.全文检索:这种检索的结果是有关文献的全文信息。 全文检索是将文献全文存储到数据库中,并建立了与
线索检索基本相同的检索途径。
这种数据库检索系统有中国知网、万方数据、维普、 超星数字图书馆、读秀等。
3.多媒体检索:这种检索的结果是有关文献的多媒体信息, 如声音、图像、图形、文字等。
与一般文本信息相比,多媒体信息具有直观、形象 和内容丰富的特点。因此,在一些学科信息检索中,如医 学、生物学、化学、工业机械设计,多媒体检索是一个重 要部分。有爱迪科森网上报告厅,西安数图等。
(一)用户提出问题。
1 明确检索目的,需求哪一类信息。 2 明确课题的主题或主要内容。 3 课题涉及的学科范围,以便根据学科选择信息资源。 4 所需信息的数量、语种、年代范围、类型等具体指标。
(二)选择与课题相关的数据库。 选择标准: 1 看课题内容。 2 看数据库本身的质量。
(三)确定检索途径。 按文献特征分为两大类:外表特征途径、内容特征途径。
用户直接利用存储管理信息源的计算机检索系统服务 器本身进行的信息检索,它无需通过网络来建立客户端与 服务器之间的连接。
2 联机检索阶段
20世纪60年代末,数据通讯网络出现,大容量计算机 分时系统和强功能检索软件研制成功。
20世纪70~80年代,联机检索得到迅速发展,一些联 机检索系统开始向公众提供商业性服务,如DIAI、OG、 ESA、ORBIT、BRS等许多世界著名的联机检索系统相继投 人商业性运营。
银杏产量 影响 气候
(一级主题词) (二级主题词) (三级主题词)
银杏产量 影响,气候
《中国分类主题词表》是在《中图法》编委会的主 持出版的一部大型文献标引工具书。
(3)关键词途径 关键词(Keyword):是代表文献内容,有实
质意义的自然语言。
要点在于选好关键词。
• 区别
主题词:规范化人工语言 关键词:自然语言
(六)计算机检索。根据检索策略进行检索,并随时根 据实际情况调整检索策略。
1 对于检索数量比较少的结果,可以进行扩检,提高查 全率。
2 对检索数量过多的检索结果,可以进行缩减,以提高
查准率。
(七)对检索效果的评价。
包括四个方面:
1 查全率。 2 查准率。 3 检索时间。 4 检索成本。
缩短检索时间,降低检索成本。
相关文档
最新文档