信息检索分类

合集下载

信息检索的定义、分类和技术

信息检索的定义、分类和技术
这两个检索词的文献都将被命中。
〃图书馆〃 NOT “文献检索〃,表示只含有〃图书馆〃但不含有
■V 〃文献检索〃的文献才被命中。
位置检索
位置检索也称为临近检索,是指用一些特定的位置算 符来表 达检索词与检索词之间的顺序和词间距的检索。
位置算符主要有(W)算符、(nW)算符、(N)算符、 (nN)算符、(F)算符以及(S)算符。
狭义
狭义的信息检索仅指信息查询。即用户根据需要,采用某种方法,借助检索工具, 从信息集合中找出所需要的信息。
信息检索的分类
信息检索的分类
手工检索
即以手工翻检的方式,利用图书、期刊、目录卡片等工具来检索的一种手段。 其 优点是回溯性好,没有时间限制,不收费,缺点是费时,效率低。
机械检索
利用计算机检索数据库的过程,其优点是速度快,缺点是回溯性不好,且有 时间 限制。
截词检索
前截断 输入"*ware",可以检索出software , hardware等所有以ware结尾的单词及 其 构成的短语。
后截 输入"recon*",可以检索出reconnoiter,reconvene等所有以recon开头的单 词及其构成的短语。 o
字段限制检索
字段限制检索
字段限制检索是计算机 检索时,将检索范围限定在 数据库特定的字段中。常用 的检索字段主要有:标题、 摘要、关键词、作者、作者 单位、参考文献等。
操作形式
字段限定检索的操作形式 有两种:一种是在字段下拉菜 单中选择字段后输入检索词; 二是直接输入字段名称和检索 词。
谢谢您的观看
敬请批评指点
个其他词。
(F) 此算符表示其两侧的检索词必须在同一字段中出现, 算符 词序不限,中间可插任意检索词项。

信息检索按检索对象可分为

信息检索按检索对象可分为

信息检索按检索对象可分为:1)文献检索(包括题录、文摘和全文);2)数据检索(包括数据、表格、公式等);3)事实检索(以某一客观事实为检索对象,查找某一事物发生时的时间、地点及过程的检索)?定题服务(意义)文献分类:一)按出版形式可分为:1)图书(50页以上的印刷方式或其他方式或单独刊物的出版物,eg:专著、汇编书、多卷书、丛书等;正式出版的图书都会有一个国际标准书号ISBN); 2)期刊:每一种期刊都有一个连续出版物编号或称国际标准刊号ISSN【附:?维普——期刊;CNKI,万方——期刊、学位论文、报纸、图书】二)按载体形式分类:1)印刷型文献/纸质型文献;2)机读型文献——1、缩微型(缩微胶卷、缩微平片),2、视听型文献(录像带、VCD、英语磁带等),3、数字化文献(光盘、磁带、数据流带等)印刷型和数字化型是主要的文献载体形式文献的级别:1)一级文献(原始文献,一般指作者的原始创作,eg数据库提供的原文,专著、期刊论文、学位论文、研究报告、会议论文、专利文献等)2)二次文献(统称检索工具,文献检索的主要工具和手段(题录、目录、索引、文摘等)3)三次文献(年鉴、进展、述评、综述等)【灰色文献/零次文献——未公开的最原始的文献】检索工具的种类——按著录格式分类:1)目录,即书目(典藏目录、联合目录);2)索引(题录,即概要,指检索工具所著录的篇目、著者、出处、语种等,但不包括文摘);3)文摘信息组织:主题词组织法——美国国立医学图书馆编制的医学主题词表MeSH是目前最权威、最常用的标准主题词表(Pubmed、中国生物医学文献数据库均采用);《中国图书馆分类法》即《中图法》是目前国内常用的体系分类语言。

截词检索:*代表一或多个字符;?代表任意一个字符;2)字段限制检索:制定检索提问在特定字段中出现,只有在指定的字段中出现与检索提问相同的记录才能被检索出来。

Eg.“提问”【字段名】;如、HIF U 【TIAB】获得信息——每条列表对应一个网页且应包含以下三个要素:标题,URL—检索出的每一条信息的地址、网址,摘要第一个搜索导航工具——雅虎——目录式(1)引号可以避免搜索引擎拆分关键词(2)《》百度的特殊用法:书名号会出现在搜索结果中;不会被拆分百度、google常用语法:1)filetype——特定文档类型的搜索。

第三章 信息检索的基本知识

第三章 信息检索的基本知识

1、逻辑“或”(和) 、逻辑“
————————————————— A
B
用符号“ 或 表示, 用符号“or”或“+”表示,其逻辑表达式为: 表示 其逻辑表达式为: A or B 或 A+B 其意义为检索记录中凡含有检索词A或检索词 , 其意义为检索记录中凡含有检索词 或检索词B, 或检索词 或同时含有检索词A和 的 均为命中文献。 或同时含有检索词 和B的,均为命中文献。
分 析 课 题
检索词: 检索词: : :
富营养化(水华), ),处理 富营养化(水华),处理 治理,修复), ),湖泊 (治理,修复),湖泊
ቤተ መጻሕፍቲ ባይዱ
, ,

检索工具: 检索工具:
1. 2. 3. 4. 5. 6. 7. 8. 中文科技期刊全文数据库(维普) 1989中文科技期刊全文数据库(维普) 1989-现在 中国科技成果数据库(万方) 1986中国科技成果数据库(万方) 1986-现在 中国期刊全文数据库(同方) 1979中国期刊全文数据库(同方) 1979-现在 中国优秀博硕士学位论文全文数据库(同方)1999中国优秀博硕士学位论文全文数据库(同方)1999-现在 中国学位论文文摘数据库(万方) 1989中国学位论文文摘数据库(万方) 1989-现在 中国学术会议论文全文数据库(万方) 1995中国学术会议论文全文数据库(万方) 1995-现在 中国重要会议论文全文数据库(同方) 2000中国重要会议论文全文数据库(同方) 2000-现在 中国重大科技成果数据库(万方) 1990中国重大科技成果数据库(万方) 1990-现在
中图分类法
中图法》 个基本部类, 《中图法》分 5个基本部类,将知识门类分为 哲学” 社会科学” 自然科学” “哲学”、“社会科学”、“自然科学”三大部 马克思主义、列宁主义、 类。马克思主义、列宁主义、毛泽东思想是指导 我们思想的理论基础,作为一个基本部类, 我们思想的理论基础,作为一个基本部类,列于 首位。此外,考虑到图书本身的特点, 首位。此外,考虑到图书本身的特点,对于一些 内容庞杂,类无专属, 内容庞杂,类无专属,无法按某一学科内容性质 分类的图书,概括为“综合性图书” 分类的图书,概括为“综合性图书”,作为一个 基本部类,置于最后。 22个大 基本部类,置于最后。在此基础上扩展为 22个大 类。 标记符号采用拉丁字母与阿拉伯数字相结合的混 合号码制。 合号码制。

信息检索---名词解释

信息检索---名词解释

一、名词解释信息检索:信息检索最普通的理解就是信息查找。

它是将信息按一定的方式组织起来,并根据信息用户的需求查找出有关的信息的过程和技术。

信息检索又叫做信息存储与检索(information storage and retri)。

信息检索可以分为事实检索、数据检索、文献检索。

特性检索:也称强相关性检索,强调向用户提供高度对口的信息。

强调检索的准确性,对检索结果的数量不作要求。

族性检索:也成弱相关性检索,强调向用户提供系统、完整的信息。

注重检索的全面性,要求检索出一段时间期限内有关特定主题的所有信息,对准确性要求较低。

特种文献:特种文献是一种不以书刊形式出版的文献,一般不公开发行,它包括专利文献、会议资料、科技报告、技术标淮、学位论文、政府出版物、产品样本及其说明书等。

其特点是内容涉及面广、种类多、数量大、报道快、参考价值高。

OPAC:联机图书馆公共检索目录,有开放的公共查询目录演化而来,是20世纪70年代末美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。

参考工具书:是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。

年鉴:是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。

手册:是汇集某一方面常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。

名录:是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。

搜索引擎:就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。

图书:论述或介绍某一领域知识的出版物。

期刊:期刊一般是指名称固定、开本一致的定期或不定期连续出版物。

信息检索的分类

信息检索的分类

信息检索的分类
信息检索是一种通过计算机技术实现的信息获取方式,它采用特定的搜索策略在大量
的信息资源中查找并提取相关的信息,并将其成果呈现给用户。

信息检索可以按不同的标
准进行分类,以下是常见的几种分类方式。

一、基于目的分类
根据信息检索的目的不同,可以将其分为两大类:一是用于学术研究的信息检索(包
括学术论文、科研报告、专著等学术性文献的检索);二是面向大众需求的信息检索(包
括新闻资讯、生活服务、娱乐娱乐等信息资源的检索)。

信息检索的数据源范围是信息检索的重要参数之一,通常分为以下三类:
1.全文检索:全文检索是指将整个文本作为检索对象,即将文本中的所有词语构成一
个关键词表,在该表中查找符合搜索条件的文本记录。

2.区域检索:区域检索是指将文本分成若干段落或区域,然后在这些段落或区域中进
行检索。

3.元数据检索:元数据检索是指利用文本资源的元数据进行检索,包括标题、作者、
创建日期、文件格式、主题分类等。

根据不同的检索目标,可以将信息检索分为两类:
1.内容检索:即检索某个主题、关键词等相关的文本内容。

2.地址检索:即找到与某个主题、关键词等相关的网址、链接等地址信息。

综上所述,信息检索根据目的、范围、技术和检索目标等不同标准可以分为不同类型,但是信息检索目的都是为了快速、准确获取所需信息,以满足不同用户群体的信息需求。

信息检索的种类

信息检索的种类

信息检索的种类信息检索是指使用计算机技术,通过输入关键词等方式,获取网络中的相关文本、数据和图像等信息的过程。

信息检索由于其重要性和广泛应用,已经发展出了多种检索分类。

本文将介绍信息检索的五种分类。

1. 文本检索文本检索是信息检索中最常见的形式。

这种检索是指用户输入关键词,然后计算机返回文本文件中包含这些关键词的所有文件。

文本检索可以通过基本类型、布尔运算符或者向量空间模型(VSM)等方法进行操作,其有利于搜索具有某些特定主题的文档,是最基本的信息检索。

2. 图像检索图像检索是指使用图像描述或样本图片查询相关图片的过程。

图像检索非常重要,因为纯文本检索无法满足人们对照片和其他图像的搜索需求。

图像检索可能涉及到基于颜色、文本、纹理、形状等方面的各种特征,并选择相应的图像来用于搜索。

3. 音频检索音频检索是指使用计算机技术检索音频文件,包括闻起来很棒的歌曲和其他类型的声音剪辑。

音频检索算法通常分为两种类型:基于内容的检索和基于元数据的检索。

此外,用户也可以从网络信息库中搜索他们想要的音频,比如在一些音乐网站上搜索本地或全球性的音频。

4. 视频检索视频检索是一种查询视频文件的方法,可以检索包含关键字的视频文件。

与图像检索类似,视频检索的算法通常需要基于视觉、颜色、文本、音频等多种特征进行,从而能够实现更准确的检索。

5. 数据库检索数据库检索是指通过结构化查询语言(SQL)搜索关系数据库中的记录。

这种检索可以是基于关键词、數值等方式搜索数据,也可以是基于特定的数据库软件检索;除此之外,还可以实现通过网络收集的信息库上进行搜索。

总之,信息检索是现代计算机和网络技术中的一个重要组成部分,随着信息存储和收集的不断增加,信息检索的重要性也在不断提高。

越来越多的互联网用户对信息检索进行了更为广泛的尝试,从而开拓了新的检索领域和方法。

信息检索概念及分类

信息检索概念及分类

信息检索概念及分类
一、概念
信息检索(Information Retrieval)是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。

狭义的信息检索仅指信息查询(Information Search)。

即用户根据需要,采用一定的方法,借助检索工具,从信息集合中找出所需要信息的查找过程。

广义的信息检索是信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户特定的需要将相关信息准确的查找出来的过程。

又称信息的存储与检索。

一般情况下,信息检索指的就是广义的信息检索。

二、分类
(一)按存储与检索对象划分,信息检索可以分为:
文献检索
数据检索
事实检索
以上三种信息检索类型的主要区别在于:数据检索和事实检索是要检索出包含在文献中的信息本身,而文献检索则检索出包含所需要信息的文献即可。

(二)按存储的载体和实现查找的技术手段为标准划分:
手工检索
机械检索
计算机检索
其中发展比较迅速的计算机检索是“网络信息检索”,
也即网络信息搜索,是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。

(三)按检索途径划分:
直接检索
间接检索。

信息检索的分类与方法

信息检索的分类与方法

信息检索的分类与方法在信息时代,我们可以轻松地获得各种信息,但如何快速、准确地检索出我们所需的信息,成为了一个很重要的问题。

为此,人们研究出了许多信息检索的方法。

本文将介绍信息检索的分类与方法。

一、信息检索的分类信息检索可以分为传统信息检索和Web信息检索两种。

1.传统信息检索传统信息检索是指在计算机出现之前,人们借助书籍、报纸、杂志等传统媒介查找信息的方式。

这种方式需要人们手动进行检索,费时费力,效率低下,但它在信息分类、存储、管理等方面做得很好,有很强的逻辑性和系统性。

2.Web信息检索Web信息检索是指在计算机及互联网出现之后,利用搜索引擎等工具进行信息检索。

这种方式利用了互联网的优势,能够获取到最新、最广泛的信息,检索速度快、效率高。

但由于互联网信息量巨大,存在大量的垃圾信息和重复信息,对信息质量的判断和筛选需要更为谨慎。

二、信息检索的方法信息检索的方法可以分为主动检索和被动检索两种。

1.主动检索主动检索是指用户主动搜索目标信息的过程,在搜索引擎中输入关键词进行检索。

这种方式需要用户自行选择关键词并输入,检索结果与关键词的选择和输入方式密切相关,所以需要用户有一定的专业知识和筛选能力。

2.被动检索被动检索是指用户被动接收与目标信息相关的信息的过程。

这种方式有多种形式,例如RSS订阅、新闻推送等,用户只需要选择自己感兴趣的信息源,订阅相关信息即可,无需关注具体的检索方法,检索结果自动推送给用户。

这种方式对用户的专业知识要求较低,但需要用户对信息源的筛选和选择有一定的认知和判断能力,以保证接收到的信息质量。

三、信息检索的技巧为了使信息检索更加精确、高效,我们应该掌握以下几项技巧:1.选择合适的搜索引擎不同的搜索引擎有不同的检索范围和优势,我们应该根据所需信息的特点和自身的需求选择合适的搜索引擎。

例如:谷歌适用于多语种和涉及面广的检索;百度适用于国内的信息检索。

2.使用关键词合适的关键词可以直接影响检索结果的质量和准确性,我们应该根据具体情况选择合适的关键词。

信息检索与分析利用

信息检索与分析利用
如TextMining、NLTK等,用于文本处理、 主题提取、情感分析等。
引文分析工具
如Citespace、Sci2等,用于引文分析和知 识图谱绘制。
数据可视化工具
如Tableau、PowerBI等,用于数据可视化 展示和交互式分析。
信息利用与知识创新
05
信息利用方式
01
02
03
直接利用
获取现成的信息,用于解 决当前问题或满足当前需 求。
间接利用
对信息进行整合、分析和 挖掘,形成新的知识或见 解。
创造性利用
基于现有信息,进行创新 性的思考和探索,产生前 所未有的成果。
知识创新过程
知识获取
通过各种途径获取相关的知识 和信息,包括文献资料、实地
调查、专家咨询等。
知识整合
将获取的知识进行分类、整理 和归纳,形成有序的知识体系 。
知识转化
信息产权保护
知识产权定义
01
知识产权是指人们对其智力成果所享有的法律权利,包括专利、
商标、著作权等。
知识产权保护的意义
02
保护知识产权有助于激发创新活力,促进科技进步和社会发展。
防止侵权行为
03
在信息检索与分析利用过程中,应尊重知识产权,遵守相关法
律法规,防止侵犯他人知识产权的行为。
信息传播法规
筛选和过滤结果
对检索结果进行筛选和过滤,排除不相关或质量不高 的信息。
信息检索评价
查全率评估
评估检索到的相关信息量,衡量检索的全面 性。
查准率评估
评估检索结果的准确性和相关性,衡量检索 的质量。
响应时间评估
评估检索工具的响应速度,衡量检索的效率。
信息分析基础

文献信息检索类型

文献信息检索类型

文献信息检索类型
文献信息检索类型主要分为以下几种:
1. 主题检索:根据文献的主题内容进行检索,常用的检索词有主题词、关键词、分类号等。

2. 作者检索:根据文献的作者进行检索,常用的检索方式有作者姓名、作者机构等。

3. 标题检索:根据文献的标题进行检索,常用的检索方式有全文标题、副标题、主题词等。

4. 出版物检索:根据文献的出版物进行检索,常用的检索方式有期刊名称、出版社、出版年份等。

5. 摘要检索:根据文献的摘要进行检索,常用的检索方式有全文摘要、关键词等。

6. 全文检索:根据文献的全文进行检索,常用的检索方式有全文索引、全文检索等。

以上是文献信息检索的常见类型,不同类型的检索方式适用于不同的情况,需要根据具体情况选择合适的检索方式。

信息检索基础 检索语言及其分类

信息检索基础 检索语言及其分类

《中国图书馆图书分类法》
R91下分为R911药物数学、R912药物物理学、R913 药物物理化学、R914药物化学、R915药物生物学。 R914下又分为{R914.1}药物分析、R914.2药物设 计 、 R914.3 无 机 药 学 化 学 、 R914.4 有 机 药 物 化 学 、 R914.5有机合成药物化学。
医学信息检索
检索语言及其分类
教 学
目 标
1
了解检索语言的分类
2
熟悉《中国图书馆图书分类法》
3
熟悉《医学主题词表》(MeSH)
了解检索语言的分类
检索语言是信息检索中用来描述文献特征和表达检索提问内容的一种专门性的人工语言,是一组有规则 的、能够反映出信息内容及特征的标识符,用于联系文献信息与用户需求的“语言括主题词和关键词语言。主题词语言与关键词语言的区别在于规范化程度不同。 ○关键词又名自由词,中选取的具有实质意义的名词,这种词不受主题词表限制,一般是未经规是从文献范
化或略规范化的词,常用于一般检索或精度要求不高的检索。 ○主题词是规范化词汇,最大的优点是概念准确、专指度高。它对文献中出现的同义词、近义词、多义词以
思 考 题
1
简述检索语言的分类及其特点
2
《中国图书馆图书分类法》分类体系是怎样的
3
主题词与关键词的区别是什么
图1主题:氟哌酸*胃肠炎 图2 主题:诺氟沙星*胃肠炎
《医学主题词表》(MeSH)
主题检索语言是信息检索语言中检索效率较高、使用频率较多的一种语言。人们为了更快更 好地检索文献,将概念更准确、专指度更高的反映文献内容的主题词编制成专门的主题词表, 供大家使用。目前国内最常用的主题词表是《医学主题词表》(MeSH)、《中医药学主题 词表》和《汉语主题词表》。 《医学主题词表》(MeSH)是美国国家医学图书馆从1960年起编制,并于1963年正式使 用的一部规范化的可扩充的动态性叙词表,是生物医学领域具有权威性的主题词表。MeSH 主要包括主题词表和树状结构表两个部分。

信息检索

信息检索

文献:记录信息和知识的一切载体。

文献检索:以文献为检索对象,查找含有用户所含信息的文献。

文摘:是将论文或专著的内容加以浓缩,以精炼的语言把文献信息的重要内容,学术观点,数据及结构准确的描述下来并按一定目录规则与排列起来,供读者查阅的一种信息系统.核心期刊是科技期刊中少数高质量的特定期刊,指各学科领域刊载本专业高水平学术论文,能反映本学科最新研究成果及前沿研究状况与发展趋势的期刊,其载文率、被引用率以及参考利用价值都很高.浏览法:直接浏览最新期刊,特别是核心期刊上的一次文献。

追溯法:当查到一篇参考价值较大的新文献后,以文献后面附的参考文献为线索,由近及远,进行逐一追踪的方法。

顺查法:是由旧到新的查找。

多用于已知所查主题起始年代。

倒查法:是由新到旧的查找。

多用于查找新课题或某课题的新内容。

抽查法:有选择地在某课题文献发表较集中的年限查找。

多用于事先了解该学科或课题的发展历史背景。

循环法:又称分段法,是交替使用“常用法”和“追溯法”来进行检索的综合检索方法。

即利用检索工具查到一批文献资料,又利用这些文献所附的参考文献追溯查找。

信息:是客观存在的事物现象,是生物体或有一定功能的机器可以感知的客观事物发出的一切有意义的信号和消息。

特点:客观性、可认知性、传递性、时效性知识:是人们对自然界、人类社会中各种信息进行思维分析、加工提炼、并加以系统和深化而形成的信息集合。

情报:用不同的方法和手段,在有效的时间内所获得的有针对性和有价值的信息或知识。

特点:传递性、时效性查全率:在信息检索结果中,检索出的相关信息占信息检索系统中相关信息的比例.查准率:是指系统进行检索时,系统中检出的相关文献量与检出的文献总量的比率。

数据库:是计算机存储设备上按一定方式存储的相互关联的数据集合,同时又反作用于新形象检索.搜索引擎:指根据一定的策略、运用特定的计算机程序搜索互联网上的信息,对信息进行组织和处理后显示给用户,是为用户提供检索服务的系统。

文献信息检索系统的分类

文献信息检索系统的分类

文献信息检索系统的分类文献信息检索系统的核心是数据库,而数据库本身又常以收录内容及功能的不同划分为如下几种类型。

1.书目型数据库(bibliographic database)主要是指二次文献数据库,包括各种机读版的题录型、文摘型的数据库。

如《中国生物医学文献数据库》(SinoMed)、MEDLINE等。

它们提供了可满足用户多种信息检索需求的有关文献的各种特征,如文献的篇名、著者、出处(包括刊名、年、卷、期、页码)、摘要、收藏单位等。

不仅可以告知用户其所需文献的线索一题录(包括篇名、著者、出处),更可以提供整篇文献内容浓缩的替代品一文摘。

因此,这是文献检索中最常用的一种数据库。

2.事实数值型数据库( fact-date database)主要为用户提供有关事物、人物、机构等方面的事实性信息和数值型数据。

例如万方数据资源系统中的事实型数据库《中国科研机构数据库》《中国科技信息机构数据库》《中国高等院校及中等专业学校数据库》,美国国立癌症研究所的关于癌症治疗信息的医生咨询数据库(PDQ),反映药物处方信息的《医师案头参考书》(Physicians'Desk Reference, PDR)等。

电子化的参考工具书,如词典、百科全书指南等也属于事实型数据库的范畴。

3.全文型数据库(full-text database)是将文献全文的全部内容转化为计算机可以识别、处理的信息单元而形成的数据集合。

全文型数据库对文献的字、词、句,乃至段落等进行更深层次的编辑加工,允许用户采用自然词语以及截词、邻近算符等匹配方法,方便快速地查到所需的文献,并能直接获取文献原文。

例如CNKI的学术文献总库、万方数据资源系统中的数字化期刊、EIsevier Science电子期刊全文库。

因此,全文型数据库是集文献线索的查询和文献全文的提供于一体,实现了毕其功于一役的一站式信息服务。

4.知识型数据库(knowledge database)一种疾病,不仅有一个概念性的界定,而且涉及病因、病理、诊断、治疗等相关知识;一种药物,不仅有其化学结构上的名称或命名,而且有药理作用、药效动力、副作用、适应证、使用方法等相关知识; -项检查,不仅有其概要性描述,而且涉及原理、检测值的解释、临床意义、操作方法、正常值范围、适用范围等一系列相关知识。

信息检索

信息检索
? 狭义的网络信息检索——指网络搜寻——利用相应的检索工具或检索系统,运用科学的方法,从有序的信息集合中查出所需信息的过程。
5.信息检索新策略
? 目前综合性搜索引擎的特点是查找范围很广而深度和专业性不够。
? 实行“元搜索”,即利用元搜索引擎先对综合性搜索引擎进行主题相关的检索,分析返回页面,下载结果URL,将得到的页面进行分析、存储、提取,得到一个庞大的初始结果集。再利用这个结果集对超链进行一定的分析判断后,按照传统的沿链递归方法“爬行”,对结果集进行扩展。利用这种检索策略,既需要掌握知名综合性搜索引擎的使用方法,又需要了解专业引擎和元搜索引擎的特点。
? 智能代理是在人工智能技术上发展起来的,常见的应用功能有资源挖掘、资源集成(沟通网络上不同物理位置的分布资源)和资源定制。
? 检索领域中的智能代理的研究就是要Agent去模仿人在信息检索中的行为(思考、比较、甄别、去重、判断、评估等等),并主动完成一系列高级、复杂的自动处理任务,而不是机械、被动地代理用户完成任务。
主题目录方式:主题目录方式的优点是可通过浏览的方式层层遍历,找到所需要的信息线索,再通过信息线索链接到相应的网络信息资源。该方式具有系统性、可扩充性、结构清晰、使用方便的优点,但更适合于建立专业性网络信息资源体系。
超媒体方式:超媒体技术是超文本与多媒体技术的结合,它将文字、表格、声音、图像、视频等多媒体信息以超文本组织起来,使用户可以通过高度链接的网络结构在各种信息库中自由航行,找到所需信息。
10.跨语言检索技术
? 跨语言信息检索是指使用一种语种的提问查询不同语种的检索技术,例如,输入的是中文的提问式,信息检索系统将返回英文、法文或其他语种描述的相关信息。结果信息资料可以是文本信息,也可以是以其他形式存在的信息。目前研究的较多的是文本信息与语音信息的跨语言信息检索。

信息技术基础-信息检索

信息技术基础-信息检索

(二)搜索引擎的高级查询功能
25
使用搜索引擎的高级查询功能可以在搜索时实现包含完整关键词、包含任意关键接上,在弹出的下拉列 表框中选择“高级搜索”选项。
(2)打开“高级搜索”对话框,在“包 含全部关键词”文本框中输入“贵阳 云南”文 本,要求查询结果页面中要同时包含“贵阳” 和“云南”两个关键词。
卡片式检索工具:就是 可以帮助检索的各类卡 片,如图书馆的各种卡
片目录。
(三)信息检索的发展历程
11
2.计算机检索阶段
随着社会的进步和不断发展,各种信息呈爆炸式增长,手工检索已经无法满足日益增长的 信息检索需求;同时,计算机技术、网络技术及数据传输技术也在飞速发展,为计算机检索提 供了技术保障,信息检索从此迈入了计算机检索阶段。计算机检索经历了以下4个阶段。
(二)常见搜索引擎推荐1.”二字源于我国宋朝词人辛弃疾执 着追求,其搜索界面如图所示。
19
2.360搜索
360搜索属于全文搜索引擎,是目前 被广泛应用的主流搜索引擎之一,其搜索 界面如图所示。
(二)常见搜索引擎推荐
(2)在打开的页面中可以看到查询 结果,但其中有些内容是不属于“中国国 家地理”期刊的。此时单击网页左侧“期 刊”栏中的“中国国家地理”超链接。
(三)期刊信息检索
37
期刊是指定期出版的刊物,包括周刊、旬刊、半月刊、月刊、季刊、半年刊、年刊等。下 面将在国家科技图书文献中心网站中,检索有关“中国国家地理”的期刊,其具体操作如下。
(1)打开“国家科技图书文献中心”网 站首页,撤销选中“会议”“学位论文”两个 选项,然后在“文献检索”搜索框中输入关键 词“中国国家地理”,最后单击“检索”按钮。
广义的信息检索
广义的信息检索包括信息存储和信息获取 两个过程。信息存储是指通过对大量无序 信息进行选择、收集、著录、标引后,组 建成各种信息检索工具或系统,使无序信 息转化为有序信息集合的过程。

信息检索

信息检索

信息检索1.信息检索的概念。

狭义信息检索是指用户找出有关信息的过程。

广义信息检索是将信息按照一定的方式组织和存储起来,并根据用户的需求找出有关信息的过程。

2. 信息检索的类型(1)按照检索对象的不同划分早期分为:文献检索、事实检索、数据检索。

当前三分方法:文本检索、音频与视频检索、数值检索。

(2)按检索手段划分:手工检索、机器检索3.简述信息检索的基本原理信息检索的基本原理:对信息集合与需求集合的匹配与选择。

实现信息检索,主要涉及三个关键要素:信息集合、用户信息需求、匹配选择。

一、信息集合:信息集合是指有关某一领域的,经采集、加工的信息集合体。

二、需求集合:用户的信息需求是在社会实践活动中产生的。

当人们在完成某一任务或工作时,经常觉得缺少某些知识,这就产生了信息需求。

三、选择与匹配:要在信息集合中快速获取用户所需信息,需要信息检索提供一种匹配机制,能够把需求集合与信息集合依据某种相似性标准进行比较与判断,进而选择出符合用户需要的信息。

匹配机制至少包括两个要素:第一是匹配标准,即相似性标准;第二是执行匹配的动因。

4.计算机信息检索经历了脱机检索阶段、联机检索阶段、光盘检索阶段、网络检索阶段。

5.信息检索领域的主要研究问题有哪些?⑴信息检索理论:检索语言、检索模型、标引理论、相关性理论、知识组织与表示理论⑵信息检索工具/系统:信息检索系统的结构、功能、设计开发、管理运营、应用评价等⑶信息资源及其收集、加工:信息存储、数据库⑷检索技术与方法:文本检索技术、数值检索技术、音频与视频检索技术、网络搜索技术⑸用户研究与检索策略:用户的查询心理、检索需求及其类型、用户查询信息的行为特征等、用户信息需求分析、检索式构造、相关反馈方法、检索过程调整与控制等⑹其他密切相关的自动化处理技术:自动聚类与分类、自动摘要、信息可视化、信息过滤、信息提取、机器翻译、人机交互等。

信息检索的两种研究方式:以计算机为中心和以用户为中心,以计算机为中心的IR问题是主流。

第二章信息检索基础知识

第二章信息检索基础知识

属后组式语言。
主题词
概念:通过文献所属学科的主题对文献进行检索, 是以主题词为检索标识,它是一种特性检索。 主题词是用来表达文献的主题概念的,经过规范化 主题词 处理的名词或词组。 如:出生缺陷-畸形 杵状指-骨关节病,继发肥大性
主题词表- 主题词表-单元词表
《WPI--规范化主题词表》
(WPI--LIST OF STANDARD THESAURUS TERMS)
是检索英国德温特公司专利文献的工具。按规范 词字顺排列。其著录格式见图
WPI-List of Standard Thesaurus Terms 1987 COBALT(3772)(1) COBALT@(3) CODON【87】(4) ELECTRIC(33892)(1) Electrical(2)
关键词 自然语言 单元词 标题词 叙词 语 言 言 语
分类语言
分类语言是运用概念划分的方 法,按文献内容所属学科、专 业性质的逻辑次序,以数字、 字母或数字与字母结合为基本 字符,以分类号为标识,用来 存储和检索文献的文献标识系 统。
分类语言的特点
主要特点就是按学科专业性质集中图书 区分不同性质的图书 集中性质相同的图书 相近的放在相近的位置 按照远近亲疏的关系把图书组成为一个 有条理的体系 提供从学科分类查找图书的途径
机械制造工艺系统学 / 张恩生,申铁固编著-上海交通 大学出版社 TH16/ Z31 机械设计学习指南 / 陶民华等编机械工业出版社 TH122-44/ T43 机械优化设计基础 / 张九明编著煤炭工业出版社 TH122/ Z32A 分类号+著者号TP393-62/J25
主题语言
主题语言是指以自然语言的字符为字符, 以名词性术语为基本词汇,用名词性术 语作为标识的一种信息标识系统。是主 题概念检索文献信息的检索语言。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

信息检索系统分类——按组织方式分
超媒体检索:
是对存储的文本、图像、声音等多 种媒体信息的检索。它是多维存储结构, 有向的链接,可提供浏览式查询和跨库 检索。
信息检索系统分类之检索手段
信息检索系统分类——按检索手段分
手工检索:
是检索人直接用手、眼、脑组织查 找印刷型文献的检索。这种检索方式具 有直观、灵活,无需各种设备和上机费 用的优点。
信息检索系统分类——按检索手段分
计算机检索:
是通过机器对已数字化的信息,按 照设计好的程序进行查找和输出的过程。 按处理方式分有脱机检索和联机检索; 按存储方式分,有光盘检索和网络检索。 计算机检索的优势在于,可大大提高检 索效率,扩宽检索领域。
名次剖析
ห้องสมุดไป่ตู้
目录
目录是著录一批相关文献并按照一定的次序编排而 成的一种揭示与报导文献的工具。目录又称书目。
信息检索系统分类之组织方式
信息检索系统分类——按组织方式分
文本检索:
是将存储在数据库中的整本书、整 篇文章、中的任意内容信息查找出来的 检索。可以根据需要获得全文的有关章、 节、段、句、词等的信息,也可以进行 各种统计和分析。
信息检索系统分类——按组织方式分
超文本检索:
是对每个节点中所存的信息以及信 息链构成的网络中信息的检索。强调中 心节点之间的语义联接结构,靠系统提 供的工具进行图示穿行和节点展示。提 供浏览式查询,可进行跨库检索。
常见的索引有科学引文索引、中文社会科学引文索引、十 三经索引、二十四史纪传人名索引、中国哲学史论文索引、 诗经索引、史记索引等。
文摘
文摘是通过描述文献的外部特征和简明扼要地摘录 文献内容要点来报道文献的一种检索工具,是二次 文献的核心。其特点是增加了表示文献内容特征的 摘要,以精练的语言把文献的重要内容、学术观点、 数据及结构准确地摘录下来,并按一定的著录规则 与排列方式编排起来,供读者查阅使用。
信息检索系统
第二组: 组长:唐远强 组员:曹源、田浩宇、张兴禹、钟勇
信息检索系统分类之检索内容
信息检索系统分类——按检索内容分
数据信息检索系统:
是将经过选择、整理、鉴定的数值 的数据存入数据库中,根据需要查处可 回答某一问题的数据检索。其对象既包 括数组为载体的数据和参数,也包括图 表、化学式等非数字数据。比如检索 “2011年中国国民生产总值是多少?”。
全文
整篇文章;文章的全部文字。
目录、题录、索引、文摘、全文区别
目录:按次序编排以供查考的图书或篇章的名目 题录:只含著录事项而无摘要的文献款目。如果含
摘要,则一般称为文摘。 索引:针对数据(文献或一本书)内部的关键信息
(关键词、关键句、常出现的词)进行分类整理。 文摘:又称摘要。对文献的主要内容所做的简略而
它对文献的描述比较简单,每一个条目的著录项有书 (刊名)、卷(期)数、作者、出版年月、出版地及
书(刊)收藏情况等。目录的种类很多,有国家书目、 馆藏目录、联合目录等。
题录
题录是将图书和报刊中论文的篇目按照一定 的排检方法编排,供人们查找篇目出处的工 具。题录的著录项通常包括:篇名、著者 (或含其所在单位)和来源出处,无内容摘 要。
信息检索系统分类——按检索内容分
事实信息检索系统:
是将存储于数据库中的有关某一事 件发生的地点、时间、经过等情况查找 出来的检索。其检索对象既包括事实、 概念、思想、知识等非数值信息,也包 括一些数据信息。例如“联想集团的创 始人是谁?”。
信息检索系统分类——按检索内容分
文献信息检索系统:
是将存储于数据库中的关于某一主 题文献的线索查找出来的检索。检索结 果往往是一些可提供研究的课题使用的 参考文献的线索或全文。文献检索是信 息检索的核心部分。根据检索内容不同 文献检索又可分为书目检索和全文检索。
索引
索引是将书刊内容中所论及的篇名、语词、主题等项目, 按照一定的排检方法加以编制,注明出处,供读者查检使 用的检索工具。索引是对文献内容较深人的揭示。
索引与题录的根本区别就在于题录的对象不同,目录所著 录的是一个完整的出版单位,如一种图书、一种期刊等, 而索引所著录的则是完整的出版物的某一部分、某一观点、 某一知识单元,因此,索引能解决目录只对文献作整体的 宏观著录的不足,满足读者对文献内容单元的微观揭示和 检索的要求,提高文献检索的深度和检索效率。
确切的叙述,一般不加评论、补充或解释。 全文:将文献中的所有内容一一罗列出来。
相关文档
最新文档