信息资源检索概述
信息检索知识点
信息检索知识点信息检索是指从大规模的信息资源中,通过利用各种信息检索工具和技术,准确和高效地找到用户所需要的信息的过程。
信息检索技术在现代社会中扮演着重要的角色,它不仅广泛应用于互联网搜索引擎,还在图书馆、数据库、企业信息管理等领域发挥着重要作用。
本文将介绍信息检索的定义、关键概念和一些常用技术。
一、信息检索的定义和目标信息检索是指通过计算机等工具从大规模的信息资源中,按照用户的需求进行检索,提供相关性高、准确性好的信息结果。
它的目标是帮助用户快速地找到所需的信息,提升信息搜索效率和准确性。
二、关键概念1. 查询:用户提交的检索请求,通常由一系列关键词组成。
2. 检索词:查询中使用的关键字或关键词短语。
3. 检索结果:根据查询返回的与之相关的文档或信息。
4. 相关性:衡量检索结果与查询之间相关程度的指标,通常使用相关性排序算法进行排序。
5. 文档:信息资源的基本单位,可以是网页、文章、图片、音频等形式。
三、信息检索的主要技术1. 分词技术:将文本数据按照一定规则分割成有意义的词语,是信息检索的基础步骤。
2. 索引技术:将文档中的关键词与其所在位置进行索引,以提高检索效率和准确性。
3. 倒排索引:根据关键词构建索引表,记录关键词与文档之间的对应关系,常用于搜索引擎等场景。
4. 相似度计算:根据查询和文档的相似性,为检索结果进行排序。
5. 结果评估:通过评估检索结果的质量,改进检索算法和模型。
四、常用的信息检索模型1. 布尔模型:将查询和文档转化为布尔表达式,按照布尔运算进行检索。
2. 向量空间模型:用向量表示文档和查询,通过计算向量之间的相似度进行检索。
3. 概率检索模型:基于统计方法,利用概率模型进行信息检索。
五、信息检索的挑战和发展方向1. 大规模数据处理和存储:随着互联网的快速发展,信息资源呈指数级增长,如何高效地处理和存储大规模的数据成为了一个挑战。
2. 多语言检索:不同语言的信息检索在跨语言信息检索中面临很大的难度和挑战。
信息资源检索与利用检索报告
信息资源检索与利用检索报告一、背景介绍信息资源检索与利用是指在海量的信息资源中,通过合理的检索方法和技巧,找到所需的信息并加以利用的过程。
随着互联网的发展和普及,人们获取信息的渠道越来越多样化,但同时也带来了信息过载和信息噪声等问题。
因此,如何高效地进行信息检索和利用成为了一个重要的问题。
二、检索工具介绍1. 百度:百度是目前国内使用最广泛的搜索引擎之一,拥有强大的搜索算法和丰富的搜索结果。
其缺点是存在较多广告干扰和“水军”等不良信息。
2. 谷歌:谷歌是全球最大、最流行的搜索引擎之一,其搜索结果质量高、准确性强。
但由于谷歌在中国受到限制,需要使用代理才能访问。
3. 万方数据库:万方数据库是国内知名学术文献库之一,收录了大量学术期刊、学位论文等文献资源。
其优点是专业性强,但需要付费才能获取完整文献。
三、检索技巧介绍1. 关键词选择:关键词是进行检索的基本单位,选择合适的关键词可以提高检索效率。
一般来说,关键词应该具有代表性、准确性和广泛性。
2. 检索语法:在搜索引擎中使用检索语法可以帮助精准匹配所需信息。
例如,在百度中使用“双引号”可以限定搜索结果为完全匹配的内容。
3. 高级检索:许多搜索引擎都提供了高级检索功能,可以通过设置检索条件、范围等方式进行精细化的检索。
四、实际操作以百度为例,我们进行了一次关于“人工智能”的检索。
首先选择合适的关键词“人工智能”,并在搜索框中输入。
然后选择“工具”-“时间”-“不限”进行时间范围的设置,以便获取最新的信息。
接着使用“双引号”将关键词括起来,以确保搜索结果为完全匹配内容。
最后通过阅读搜索结果、筛选有用信息等方式进行利用。
五、总结信息资源检索与利用是一个复杂而重要的过程,需要我们掌握一定的技巧和方法。
在实际操作中,我们应该选择合适的工具和关键词,并使用各种技巧和方法进行精细化的检索。
只有这样才能高效地获取所需信息,提高工作和学习效率。
16因特网信息资源检索概述v3
因特网信息检索的特点
1 分布地域广,检索范围广泛、全面
因特网信息检索的特点
2 超文本检索,具有交互式作业的特点
超文本的信息资源通过网上各节点的链路把 相关信息或图标有机地链接成一个网络结构, 用户可以从任何一个节点开始阅读文档
因特网信息检索的特点
3 检索内容新、实时性强、传播速度快
因特网信息检索的特点
传统网络信息服务工具
【文件传输服务】
是在网络通讯协议FTP的支持下实现的一种本地计算机和远程服务器之间 的文件传送
传统网络信息服务工具
【电子邮件服务】
是用户或用户组之间通过计算机网络接受或发送文字、图像和语音等多种 形式络新闻服务】
通常被称作Usenet,是通过Internet提供新闻组专题讨论服务的一种应 用软件
Giganews:美国最大的usenet服务商 UseNeXT:欧洲最大的usenet服务商
传统网络信息服务工具
【WAIS信息服务】
WAIS(Wide Area Information Service)称为广域信息服务器,是一 种数据库索引查询服务
访问WAIS主要有三种方法: 运行一个本地主机的WAIS客户程序 • 用Telnet远程登录到WAIS Client • 通过Gopher进入WAIS
【Gopher】
是一种基于多种菜单的交互式检索工具
• 文本文件信息查询 • 电话簿查询 • 多媒体信息查询 • 专有格式文件查询 • ……
服务器1
服务器2
服务器n
用户计算机
传统网络信息服务工具
【WWW信息资源】
WWW(World Wide Web,万维网)采用了超文本与超媒体的技术, 以多媒体形式向用户展现丰富的信息
第二章-互联网信息资源检索概论
12
发展前景:
虽然目录型检索工具在当今互联网信息检 索界的地位已不如从前,但仍是个个人维护的目录 型检索工具,它成为了相当一部分上网用 户的“入口”,许多对上网无从下手的人, 最需要的就是这样的导航网站,如今360也 开发了360网址。
第2章
1
第2章 互联网信息检索概论
2.1互联网信息检索类型和特点 2.2互联网信息检索原理之一——信息组织 2.3互联网信息检索原理之二——信息查询 2.4互联网检索工具的性能评价
2
2.1互联网信息检索的类型和特点
2.1.1互联网信息检索的类型 2.1.2互联网信息检索的特点
8
最具代表的互联网目录型检索工具当属 “yahoo”(雅虎),是由斯坦福大学的研究 生杨致远(Jerry Yang)和David Filo与 1993年创立的。
互联网刚开始发展时,他们在网上冲浪时, 逐渐把自己喜爱的站点编成一个名单以便 寻找,并将这一名单在网上公布,供网友 使用,这就是雅虎的前身,也是目录型检 索工具的工作原理。
索互联网站点提供了极大的方便,但随着
互联网的持续发展,它的缺点也越来越明 显,其地位收到了以Google为代表的搜索 引擎的挑战。
时过境迁,雅虎和搜狐都已经发展成了门
户网站。
10
补充:门户网站
中国四大门户网站:新浪、网易、搜狐、 腾讯
门户网站:又被称为链接页面,是通向某 类综合性互联网信息资源并提供相关信息 服务的应用系统。
张朝阳在中国创办“搜狐”,也是比较成 功典型的互联网目录型检索工具。
9
优点:人工参与度高,网络资源目录的组 织编排符合人们所熟悉的知识分类体系,
检索目标性相对较强,提供的检索结果准 确性也较高。
第五章数字信息资源检索概述
使用各类组配算符、使用检索限定、 选择检索入口,其检索功能与简单检 索基本一致,但检索结果更为准确。
命令检索(command search)
字段代码 TI AU KW DE
CS
AB DT
JN
PY ISSN/ISBN FT
中文数据库常用字段
题名 作者 关键词 主题词
机构(作者单位)
文摘 文献类型
期刊名称
出版年 ISSN/ISBN 全文
其它检索技术
嵌套检索(优先算符,nesting):即用括 号将优先检索的检索式括起来,系统会首先检 索括号中的概念。如:
3 检索费用较低。
电子资源的主要检索方式
二次检索
简单检索
高级检索
命令检索
简单检索(simple search 、easy search 、quick search 、
basic search)
简单检索,又称基本检索、快速检索,即为 用户提供一个简单的检索界面,帮助非专业或 初入门用户方便提交的检索式。
检索技巧
❖检索结果过少,漏掉了相关文献?
放宽检索要求,提高检全率[扩检]
去掉某个方面的检索要求; 放宽检索范围:学科领域、时间、文章类型,关键词出
现的字段等; 将描述检索主题的词想全,包括同义词及缩写形式;
如:NPC OR Nasopharyngeal carcinoma
使用单数单词检索,可以检索到大多数单词单数、复数 和所有格,不规则单词除外; 如:city 可以检索出 city,cities,city’s,cities’
2017第二讲(1)-信息检索概述 二
6. 输出检索结果
根据检索系统提供的检索结果输出格式,选择需要的 记录以及相应的字段(全部字段或部分字段),将结果显 示在屏幕上、存储到磁盘或直接打印输出,网络数据库检 索还可以提供电子邮件发送,整个检索完成。
第三节 检索效果的评价
• 检索效率 检索效率是衡量检索效果好坏的指征,一般通 过查全率和查准率两方面来反映。 查全率:指系统在进行某一检索时检索出的相关文 献与系统文献库中的相关文献总量之比率。 查准率:指系统在进行某一检索时,检索出的相关 文献量与检索出的文献总量之比率。 与查全率和查准率相对应的指标是漏检率和误检率。
检索效果的评价公式
查全率=被检出相关文献量/相关文献总量 =(a/a+c)×100%
例如:查有关“雷尼替丁的含量测定”的文献
运用布尔逻辑技术的检索式可写成: 雷尼替丁 AND 含量测定
其作用是缩小检索范围,提高查准率。
逻辑或:是一种具有概念并列关系的组配
用OR(or)或 +算符表示 A OR B:表示让系统查找含有检索词A或B,或同时包 括检索词A和检索词B的信息。
如:查有关 “维生素C”的文献 (“维生素C”: vitamin C 又称 L-ascorbic acid抗坏血酸)
例: 自行车(模糊) 扩展概念:脚踏车、单车等
精确检索
也称精确匹配或完全匹配,结果中包含与检索词完全相同的内容。
提示
目前计算机数据系统除了提供专业检索要 写检索表达式检索外,更多的会提供其他 检索途径如基本检索、高级检索等,其检 索界面以检索输入框及检索条件限定框的 格式让用户根据已知条件一步步构建检索 表达式来检索文献(构建原理是一致的)
trace elements not zone 微量元素 not 锌
信息检索概述PPT课件
④知识、情报和文献
知识是人类社会实践的总结,是人的主观世界对客观世界的 概括和总结。
情报的概念是极其广泛的,它是一种普遍存在的社会现象。
文献一词最早出现在《论语·八佾》中,新版《辞海》读文 献的定义作了解释:“记录有知识的一切载体的统称,即用文字、 图像、符号、声频、视频等手段记录人类知识的各种载体(如纸 张、胶片、磁带、磁盘、光盘等)。
物质的运动产生信息;各种信息经过人们系统化的加工处理,
转化成知识;知识经过系统化的加工处理转化为情报;情报用于
社会实践,解决实践中存在的问题,创造出物质财富或精神财富,
这时的情报便转化为生产力,产生新的信息,形成一个无限循环
的转化过程。这也表明,信息包含知识、知识包含情报。它们不
仅仅是包含关系,而且可以互相转化。
信息检索概述
1
1、信息资源及其组织
①信息的概念 ②信息的特征 ③信息的类型 ④知识、情报和文献 ⑤信息源
2
①信息的概念
我国汉语中很早就有“信息”这 个词。早在一千多年前,唐朝诗人李 中在《碧云集·暮春怀故人》一诗中 就留下了“梦断美人沉信息,目穿长 路倚楼台”的佳句。当时,“信息” 指的是音信、消息。
信息就是人或者机器通过感官或 者外部设备与外界交流的所有内容。
3
②信息的特征
a、客观性与普遍性 b、流动性与传递性 c、时效性与有效性 d、与载体的不可分割性与可加工性 e、积累性与价值性
4
③信息的类型
按照载体的形式划分:印刷型、缩微型、声像 型、电子型 按信息的应用范围划分:白色信息、灰色信息、 黑色信息 按信息的加工程度划分:零次信息、一次信息、 二次信息、三次信息 按照数字化信息资源标准划分:结构化数据、 非结构化的数据
信息检索笔记
第一章信息资源的概述一.传统信息资源的概述1.概念与特征2.类型:(1)一类文献:原始文献(2)二类文献:对一类文献的加工整理,报道揭示一类文献,提供的是一类文献的线索和地址(书目,索引,文献)(3)三类文献:来源于一类文献,有丰富的权威的资料,可以解决各种问题。
如:百科全书,字典,词典,手册,年鉴,名录二.数字信息资源1.与传统信息资源相比具有的特征:(1)以多媒体为内容特征(2)内容复杂多样(3)更新速度快,时效性强(4)利用不受时空限制(5)具备检索系统(6)具备全方位的动态的信息服务功能2.数字信息资源的类型:(1)按性质和功能划分:a)一次文献:原始文献b)二次文献:参考数据库,搜素引擎,网资,导航等。
c)三次文献:元搜素引擎(关于搜素引擎的搜素引擎)(2)按载体划分:光盘,网络数据库,联机检索系统(三)主要数字信息资源1.参考型数据库:包含各种数据信息的来源和属性的数据库。
包括:书目数据库,索引数据库,文献数据库2.全文数据库:收录有原始文献全文的数据库3.事实数据库;直接提供原始文献的数据库,分为数值数据库,指南数据库,术语数据库4.电子图书5电子报纸6.搜索引擎/分类指南7.网络学术资源学科导航:对各类信息资源进行筛选整理之后,按学科属性对其进行分类、组织。
第二章信息检索概述一.信息检索:信息检索就是利用一定的检索工具,运用一定的检索技术和方法查找信息的过程。
二.信息检索的原理1.利用计算机进行信息检索的前提和基础是信息的组织和贮存。
没有贮存就没有检索对象。
2.信息的组织与贮存就是数据库的建立过程。
在这一过程中,系统对收集到的信息进行概念分析(即找出能够表达主题的关键词),然后赋予其特征标识(这一过程也叫对信息内容进行标引),并按特定的编排方法将其组织起来,形成有序的具有可检性特征的数据库。
3.计算机进行信息检索的原理就是指用户和检索人员将能够表达其信息需求的检索式提交给检索系统,检索系统即自动将检索式与系统中的信息进行匹配,凡是信息特征标识和逻辑组配关系与用户检索式一致的,既未命中内容。
信息检索技术手册
信息检索技术手册一、引言信息检索技术是指通过计算机等工具对大规模的信息资源进行存储、索引和检索,以满足用户需求的技术。
本手册将为读者介绍信息检索技术的基本原理、常用算法和实际应用,以帮助读者更好地理解和应用这一领域的技术。
二、基本概念1. 信息检索概述信息检索是指根据用户需求,在大规模的信息资源中寻找到相关的信息并返回给用户。
它涉及到文档的存储、索引和检索等一系列工作,其目的是提供高效、精确的信息检索服务。
2. 关键词提取关键词提取是信息检索的基础工作之一,通过分析文本内容,从中提取出具有代表性的关键词。
关键词的准确提取可以提高文档的索引效果,并帮助用户更快地找到所需信息。
3. 文档索引文档索引是信息检索中的核心环节,它将文档的关键信息进行结构化存储,以方便用户进行检索。
常见的文档索引方法包括倒排索引、正排索引等,它们能够提高信息检索的效率和准确性。
4. 相关性评估在信息检索过程中,需要对检索结果进行相关性评估,以确定哪些结果与用户需求最为相关。
相关性评估主要依靠一些算法和模型,如向量空间模型、余弦相似度等,可以对文档进行排序和过滤,提供用户满意的搜索结果。
5. 查询扩展为了提高信息检索的准确性和广度,查询扩展技术可以帮助用户进行更全面的信息检索。
查询扩展通过自动或人工的方式,对用户的查询进行扩展和修正,从而提供更准确的搜索结果。
三、常用算法1. 倒排索引算法倒排索引算法是信息检索领域中最常用的索引方法之一。
它通过将文档中的关键词映射到相应的文档位置,实现了根据关键词快速定位到相关文档的功能。
2. 向量空间模型向量空间模型是一种常用的文档表示方法,它将文档表示为高维向量,通过计算向量之间的相似度,实现文档的相关性评估和排序。
3. PageRank算法PageRank算法是一种用于网页排序的算法,它通过计算网页之间的链接关系和重要度,为搜索引擎提供了一个权威性的排序准则。
四、实际应用1. 搜索引擎搜索引擎是信息检索技术的典型应用之一,如谷歌、百度等。
信息资源管理与检索
信息资源管理与检索一、引言信息资源管理与检索是指对大量的信息资源进行有效的管理和快速的检索,以满足用户的信息需求。
在当今信息化的社会中,信息资源的数量呈爆炸式增长,如何高效地管理和利用这些信息资源成为一个重要的问题。
本文将从信息资源管理和信息检索两个方面进行探讨。
二、信息资源管理信息资源管理是指对信息资源进行全面的、系统的管理。
它包括对信息资源的采集、整理、存储、维护、更新和共享等各个环节的管理。
首先,对信息资源的采集是指通过各种渠道和手段获取信息资源。
采集到的信息需要经过整理,包括对信息进行分类、编目和标注等,以方便后续的管理和检索。
存储是指将整理好的信息资源进行有效的存储,可以采用数据库、文档管理系统等方式进行存储。
维护是指对存储的信息资源进行日常的维护工作,包括备份、修复和更新等。
信息资源的更新是一个持续的过程,及时对信息进行更新可以保持信息的准确性和时效性。
共享是指将信息资源进行共享,以便用户能够方便地获取和利用这些信息。
三、信息检索信息检索是指根据用户的需求,在信息资源中快速地找到相关的信息。
它包括了对用户需求的理解、对信息资源的索引和对索引进行查询的过程。
首先,理解用户的需求是信息检索的关键。
用户需求可能是一个关键词、一个问题或一个具体的需求描述。
理解用户需求后,需要对信息资源进行索引,建立起索引词与信息资源之间的联系。
索引词可以是关键词、主题词等。
索引是信息检索的基础,一个好的索引可以提高检索的效率和准确性。
最后,根据用户的需求进行查询,找到相关的信息资源并返回给用户。
四、信息资源管理与检索的挑战信息资源管理与检索面临着许多挑战。
首先,信息资源的增长速度非常快,如何有效地管理和利用这些信息资源是一个难题。
其次,信息资源的质量和准确性也是一个重要的问题,需要对信息进行筛选和验证。
此外,不同类型的信息资源需要采用不同的管理和检索方法,如何选择合适的方法也是一个挑战。
另外,随着移动互联网的发展,用户对信息的需求越来越个性化,如何满足用户的个性化需求也是一个挑战。
计算机信息资源检索方式
计算机信息资源检索方式一、引言计算机信息资源检索是指利用计算机技术和网络通信手段,从庞大的信息库中获取所需信息的过程。
随着互联网的迅猛发展,计算机信息资源的数量和种类不断增加,有效地检索所需信息变得尤为重要。
本文将介绍几种常见的计算机信息资源检索方式,包括关键词检索、分类检索、专家检索和全文检索。
二、关键词检索关键词检索是最常见也是最基本的检索方式之一。
用户通过输入与所需信息相关的关键词,系统根据关键词与文档的匹配程度,返回相关的信息资源。
关键词检索具有灵活性和效率高的特点,但对用户的搜索技巧和关键词选择有一定要求。
为了提高搜索结果的准确性,用户可以使用逻辑运算符(如AND、OR、NOT)来组合多个关键词进行检索。
三、分类检索分类检索是按照一定的分类体系对信息资源进行分类和组织,用户通过选择相应的分类进行检索。
分类检索的优点在于能够提供结构化的搜索结果,使用户更容易找到所需信息。
常见的分类检索方式包括目录检索和标签检索。
目录检索是将信息资源按照一定的主题或领域进行分类,用户可以通过浏览目录层级来找到所需信息。
标签检索则是通过为信息资源打上标签,用户可以通过点击标签来检索相关内容。
四、专家检索专家检索是指通过与领域专家进行交流和咨询,获取所需信息的一种方式。
用户可以通过与专家进行面对面的交流,或者通过邮件、电话等方式向专家提问。
专家检索的优势在于可以获得专业的解答和指导,但也存在时间、地点和专家资源有限等问题。
五、全文检索全文检索是指通过对信息资源的全文内容进行分析和索引,实现对文本中关键词的检索。
与关键词检索不同,全文检索可以检索到文本中所有包含指定关键词的内容,而不仅仅是标题或摘要。
全文检索的优势在于能够提供更准确、更全面的搜索结果,但也需要消耗更多的计算资源。
六、其他检索方式除了以上几种常见的检索方式外,还有一些其他的检索方式。
例如,推荐系统可以根据用户的兴趣和偏好,主动推荐相关的信息资源;问答社区可以通过用户提问和回答的方式,提供有针对性的信息检索服务。
信息资源检索基础知识
单元词语言
采用单元词通过组配(字面) 来表达文献的主题概念。单元 词是从文献中抽取的,能表达 文献主题的最基本、不能再分 的单元词语。
叙词语言
采用叙词通过概念组配来表达 文献的主题概念。叙词是从文 献内容中抽取的,能表达文献 内容基本概念的并经过规范化 的名词或术语。
关键词语言
以关键词作为文献内容标识 和检索入口的一种主题语言。 关键词是直接从文献中抽取 的,未经规范化处理的自由 词。
领导学 决策学 管理计划和控制 管理组织学 应用管理学
将T类展开
T 工业技术 TB 一般工业技术 4 工业通用技术设备 48 包装工程 482 包装设计 .1纸、纸板 .2林材 .3塑料 …… .其他 485 包装类型 486 包装机械设备 487 包装技术检测 488 包装工厂 489 各类产品包装
TP20 一般性问题 TP21自动化元件、部件 TP23 自动化装置与设备 TP24 机器人技术 TP27 自动化系统 TP29 自动化技术在各方 面的应用
•主题语言
主题语言是采用表达某一事物或概念的名词 术语来标引、存储、检索的一种检索语言。
标题词语言
直接用规范化语词来标引文 献主题,按字顺排列成词表。 主-副搭配
后组式语言
是指在检索前,检索词在词表中没有 被预先组配,检索时用户可根据不同 的检索需求对某些词进行任意组配
第三节 信息资源检索方法
1、布尔检索技术 2、截词检索技术 3、邻近检索技术 4、字段检索技术
3.1布尔逻辑检索技术
布尔逻辑检索是指通过标准的布尔逻辑关 系算符来表达检索词与检索词间的逻辑关 系的检索方法 主要的布尔逻辑关系词有:逻辑与(AND)、 逻辑或(OR)、逻辑非(NOT)
信息检索概述(陈1章)
根据检索目标和工具的特点,制定相应的检索策略,包括关键词选择、 检索式构建、检索限制条件设置等。
实施检索并调整策略
按照制定的检索策略进行检索,并根据检索结果及时调整策略,以提 高检索效率和准确性。
网络环境下信息筛选和评价方法
信息筛选方法
通过浏览标题、摘要、关键词等信息,初步筛选出与需求相关的信息。进一步阅读全文 或详细信息,判断其是否符合需求。对于不确定的信息,可以查阅相关文献或咨询专家
提高个人信息素养途径探讨
加强信息基础知识学习
通过课程学习、自学等方式,提高计算机、 网络、数据库等方面的基础知识。
提高信息检索技能
通过实践锻炼,不断提高信息检索的准确性 和效率。
增强信息分析与Biblioteka 用能力学会对检索结果进行深入分析和挖掘,提取 有用信息并加以利用。
培养信息道德与规范意识
自觉遵守信息道德规范和法律法规,树立正 确的信息价值观。
03
公共服务
政府工作人员可以利用信息检索技术 快速查找国家和地方的政策法规,为 政策制定和执行提供法律依据。
通过信息检索技术对社交媒体、新闻 网站等平台的舆论信息进行收集和分 析,政府可以及时了解民意和舆情走 向,为政府决策提供参考。
信息检索技术可以帮助政府提高公共 服务的效率和质量,如为市民提供便 捷的政务信息查询服务。
VS
信息表达
信息表达是指将用户的信息需求以某种形 式表达出来,以便进行信息检索。常见的 信息表达方式包括关键词、自然语言描述 、可视化图表等。有效的信息表达能够提 高检索的准确性和效率。
检索系统构成及工作原理
检索系统构成
一个完整的信息检索系统通常包括信息源、 索引器、检索器和用户接口四个主要组成部 分。其中,信息源是原始信息的来源;索引 器负责将信息源中的信息进行加工处理,生 成索引;检索器根据用户输入的查询请求在 索引中进行匹配和排序;用户接口则提供用 户与检索系统交互的界面。
第五讲-网络信息资源检索
获取FTP信息资源的主要方法
使用FTP搜索引擎搜索FTP站点 利用专用FTP软件中“站点管理器”
FTP搜索引擎
FTP搜索引擎的功能是搜集匿名FTP服务器 提供的目录列表以及向用户提供文件信息 的查询服务。由于FTP搜索引擎专门针对各 种文件,因而相对WWW搜索引擎,寻找软 件、图像、电影和音乐等文件时,使用FTP 搜索引擎更加便捷。
如
virus inurl:secutiry filetype:pdf inurl:
搜索的关键字包含在网页标题中 intitle:
如intitle:交通规划
示例:查找新浪网上九寨沟的图片 搜索:“九寨沟 site:”
示例:关于4G的word文档 搜索:4G filetype:doc
示例:网址中含security的关于virus的网页 搜索:virus inurl:secutiry
示例:教育网中标题含有“交通规划” 的格式为pdf的文章 搜索:intitle:交通规划 filetype:pdf inurl:
目录检索
如果不想搜索广泛的网页,而是想寻找某些专题 网站,可以访问Google的分类目录 “/”, 分类的网站目录一般由专人负责,分类明确,信 息集中 目前Google使用的分类目录采用了ODP的内容 另外,Google根据其专业的“网页级别” (PageRank)技术对目录中登录的网站进行了 排序,可以让一般的检索更具高效率
国内著名新闻组
1.新凡 news:// / 2.济南万千 news:/// 3.宁波: news:// 4.希网新闻组 news://
对搜索的网站进行限制 site:
如九寨沟
site: ppt, xls,
信息检索概述
目前,我国各大文献数据库《中国 科学引文数据库》、《中国学术期刊 综合评价数据库》以及数字化图书馆、 中国期刊网等都要求学术论文按《中 图法》标注中图分类号。
(2) 主题语言
主题语言是指以自然语言的字符为字 符,以名词术语为基本词汇,用一组名 词术语作为检索标识的一类检索语言。 主题语言表达的概念比较准确,具有较 好的直观性、灵活性和专指性,满足用 户从主题概念角度检索新兴专业学科、 交叉学科文献信息的要求。
本校图书馆主页——可查中图分类号
TM 电工技术 TM0 一般性问题 TM1 电工基础理论 TM2 电工材料 TM3 电机 TM4 变压器、变流器及电抗器 TM5 电器
TM6 发电、发电厂 TM7 输配电工程、电力网及电力 系统 TM8 高电压技术 TM91 独立电源技术(直接发电) TM92 电气化、电能应用 TM93 电气测量技术及仪器
第二章信息检索概述
2.1信息检索的涵义
信息检索的概念有狭义和广义之分。
狭义的信息检索(Information Retrieval) 是指依据一定的方法,从已经组织好的大量有关文 献集合中,查找并获取特定的相关文献的过程。这 里的文献集合,不是通常所指的文献本身,而是关 于文献的信息或文献的线索。如果真正要获取文献 中所记录的信息,那么还要依据检索所取得的文献 线索索取原文。
以知识属性来描述和表达信息内容的信 息处理方法称为分类法。《国际专利分 类表》、《中国图书馆分类法》等。
中国图书馆分类法简表(第四版)
A
马克思主义、列宁主义、 毛泽东思想、邓小平理论
B 哲学、宗教 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术 TB 一般工业技术