第二章-互联网信息资源检索概论

合集下载

第二章 信息检索

第二章 信息检索

2.检索技巧和提示
(1) 广泛浏览数据库 进入数据库前,需阅读数据库的说明,包括:出版、结构(权威性),出版类 型(期刊、会议、报告、专利…),文献类型(全文、文摘、题录…),收集年限,使 用权限,文献版本,服务方式(光盘、联机、专线、镜象、出国),连接方式,帐 号、密码,咨询联系等。现在许多数据库被组织到信息服务中心的web网页 上,并提供了有关介绍,应当充分地利用它们。
(1)积木型 积木型检索策略的含义是:把检索课题剖析成若干个概念面,先分别 对这几个概念面进行检索;在每个概念面中尽可能全和多地列举相关词 、同义词、近义词,并用布尔算符OR连接成子检索式,然后再用布尔算 符AND把所有概念面的子检索式连接起来,构成一个总检索式。 优点是:能够提供较明确的检索逻辑过程,以后容易检索和理解,还可 部分或全部地用作保留检索。一般地,“积木型”策略用于较复杂的检 索课题。 • 如“肺癌”与“吸烟”可以分成两个概念面,这两个概念面的各种形式 的检索词有: cancer smoker(s) • • carcinoma lung(s) cancer smoking cigar
(二)截词检索
截词检索:是指在检索时使用词的一个局部(某些 位置上的字符被截去)进行检索匹配,并认为凡满足这 个词局部中的所有字符要求的记录,都为命中结果。 截词检索需要使用专门符号(截词符),以指定截词 的具体位置与截断字符的数量。 • 按照截词位置的不同,截词检索分为: 右截词、左截词和中间截词三种。 例如:检索式 “wom?n”可检索到含有woman、women的结果。 截词检索实际上是一种隐含“逻辑或”的运算,能提 高查全率,扩大检索结果,是防止漏检的有力手段。
第二部分事实与数据检索工具
讨论事实、数据资源检索,其检索的对象是大量的、 常用的那些具体的科学技术数据和事实,如物理量、 物质特性、参数、规格等技术数据以及价格、产量、 公司名录、人名录等商业、经济等各种实用信息。 它们的检索工具包括:百科全书、年鉴、手册、词 典、机构指南和人名录、书目及书目指南等参考工 具。

第二章-网络信息资源的检索与利用 第二,三节

第二章-网络信息资源的检索与利用 第二,三节

A.互联网上的国内期刊信息
• 查找国内期刊,可以从以下站点入手: • 一、中国期刊网: • 二、维普科技期刊网: 或 / • 三、万方数据资源系统的数字化期刊: /qikan/ind ex.jsp • 四、学科导航信息

图片搜索

二.常用网络信息资源的检索
• • • • • • • 1. 网络检索--- 图书 2. 网络检索----期刊 3. 网络检索----报纸 4. 网络检索----人物,机构 等信息 5. 网络检索----专利, 标准, 科技报告, 统计数据等信息
怎样查找互联网上的图书信息?
网络信息资源 检索﹠利 用
• 网络信息资源与常用中英文搜索引擎
• 常用网络信息资源的检索利用(学术) • 网络信息资源的检索策略与技巧
第二节
• 常用网络信息资源的检索利用(学术)
一.重要的学术搜索简介
二.常用网络信息资源的检索利用
一.重要的学术搜索简介
• 1. Google scholar(Google学术搜索 ) • 2. Scirus(科学搜索)是目前网上最全面、 综合性最强的科技文献搜索引擎之一 • 3.一些专业专题搜索引擎。

Directory of Open Access Journals
• DOAJ( Directory of Open Access Journals)由 由Lund University建立,它提供有质量控制的可 免费获取的网上电子期刊资源,它的目标是建成一 个无学科、无语言限制的综合性的科学期刊系统, 方便科研人员使用,并可提升期刊的显示度。 • 目前该网站已收集了482种期刊,并把这些期刊分 成了15个大类,53个小类,其中包括农业、生命科 学、化学、数学、物理、天文学、工程技术、环境 科学DOAJ( Directory of Open Access Journals 、社会科学等。

第二章网络检索

第二章网络检索


2.1.3、网络信息资源的特点
(一)优点: 1.数量巨大,增长迅速 2.内容丰富,形式多样 3.结构灵活,分布广泛 4.开放互动,共享性强 5.传播快速,利用方便 6.更新速度快,动态性强
网络信息资源的特点
(二)缺点: 1.网络信息质量参差不齐,良莠不一 2.分散无序,缺乏管理
2.2 网络信息检索的方法


2、网上出版物
网上出版物是指在网络环境中编辑、出版、发行的出版物以 及印刷型出版物的网络版,包括网上图书、网上期刊、网上报 纸等。如今,通过Internet浏览、订阅电子期刊、报纸、图书 等已成为一种时尚,网络出版物的数量正急剧增加。如在中国 科技期刊网上可以免费查找《中国学术期刊》的题录。其中网
上参考工具书更是独树一帜,像一些百科全书、辞典、指南、
手册、文摘索引、目次表、名录等,这些网络版参考工具书使 用起来方便、快捷。目前因特网上有上万种电子期刊向网上用
户提供服务,其中很多是免费提供。
主要网上书店

中国图书网(/) 中华图书网(/)
短短的两年多时间内,设在北京大学的项目管理中心联合各参建
单位,建设了文理、工程、农学、医学四个全国文献信息中心, 华东、华中、华南等七个地区中心和一个东北地区国防信息中心, 建立了一系列国内外文献数据库,并开展了公共目录查询、信息 检索、馆际互借、文献传递、网络导航等网络化、数字化文献信 息服务,对保障"211工程"各高校的重点学科建设、培养高层次人 才、支持科研创新等发挥了重要的作用。
CALIS面向读者的服务功能主要有: (1)公共检索:可以在网上查找全国性或地区 性的书刊联合目录数据库,了解所需文献是否有及在 哪里收藏。也可以联机检索CALIS国内外各种类型的 文献数据库。 (2)馆际互借 (3)文献传递 (4)电子资源导航:对网上的电子资源进行收 集、加工和整序,形成虚拟图书馆资源,提供用户浏 览和查询。

网络信息资源检索PPT课件

网络信息资源检索PPT课件
03
02
完整性
信息内容是否全面、完整,没有遗 漏或缺失。
权威性
信息来源是否具有权威性,发布者 是否具有专业资质。
04
信息资源的获取与整理
搜索引擎
使用搜索引擎进行关键词检索,获取相关信 息。
网络爬虫
利用网络爬虫技术自动抓取网页信息。
数据库
通过学术数据库、行业数据库等获取专业信 息。
信息筛选
对获取的信息进行筛选、去重、分类等处理, 整理成有用的资源。
高级检索功能的使用
限定字段检索
通过限定字段范围,缩小检索结果的范围,提高检索 效率。
模糊匹配
使用模糊匹配功能,对关键词进行模糊查询,提高查 全率。
分类导航
利用网站提供的分类导航功能,快速定位到相关资源。
检索结果评估与筛选
评估检索结果的相关性
根据检索结果与需求的匹配程度,评估检索结 果的可靠性。
筛选优质资源
跨媒体检索
随着多媒体技术的不断发展,跨媒体检索将成为未来网络 信息资源检索的重要方向,用户可以通过图片、视频、音 频等多种方式进行信息检索。
THANKS露
网络信息检索过程中,用户的个人信息可能被泄露或滥用,如搜索引擎记录用户 的搜索历史和位置信息等。
信息安全
网络信息资源的共享和传输过程中可能存在安全风险,如黑客攻击、数据篡改等 ,这些威胁可能对用户的隐私和信息安全造成严重威胁。
人工智能在信息检索中的应用
个性化检索
人工智能技术可以根据用户的兴趣、偏好和行为习惯,为用户提供更加个性化的检索结果,提高检索的准确性和 效率。
02
数据库检索的代表有CNKI、万方 等,它们提供了更为专业和深入
的搜索结果。
数据库检索的优点是信息质量较 高,收录的文献和数据较为全面 。

第二章 信息检索的基本知识

第二章 信息检索的基本知识

应用举例:
利用《中图法》在《全国报刊索引》中查找 有关“建筑抗震设计”方面的相关文献。 第一步:分析课题,按学科属性属于“T工业技术” 中的“TU建筑科学”大类。 第二步:查《中图法》确定分类号为:T工业技 术—TU建筑科学—TU3建筑结构—TU352.11抗震结 构。 第三步:根据《全国报刊索引》(科技版)的分 类目录给出的TU3建筑结构的页次,得到相关文献。 第四步:根据的出处索取原始文献。
第二章 信息检索的基本知识
主要内容
1.信息检索概述 2.信息检索原理及检索语言 3.信息检索系统与检索工具 4.信息检索的一般程序
2.1 信息检索概述
2.1.1信息检索的含义
信息检索(Information Retrieval)是指 将信息按一定的方式组织和存储起来,并根据用 户的需要找出有关信息的过程,又叫信息储存与 检索(Information storage and Retrieval), 这是广义的信息检索,如图2-1所示。狭义的信息 检索则是仅指该过程的后半部分,即从信息集合 中找出所需信息的过程。
内容特征 标题词 主题语言 关键词 叙词 描述文献外表特征的检索语言,例如篇名、著者姓名、文 献号等作为文献标识与检索依据直接明了,使用时较为简单。 而文献内容特征的语言,也就是分类语言和主题语言的原理和 使用方法是下面主要介绍的内容。
一条中文书目记录:
题名: 信息检索 作者: 徐天秀 出版项:北京:科学出版社,2006 页码: 320页 价格: CNY23.00 主题: 情报检索 索取号: G252.7/101 内容提要:本书是一本工具型书籍,提供的信息检索学科 范围广,内容尽量以最新版本为主,是一本适用性强的学 习信息检索方法和技巧的专著,尤其是本书配制的多媒体 光盘,为本课程的学习提供了便捷。 分类: G252.7

网络信息资源检索课件

网络信息资源检索课件
网络信息资源具有多样性、交互 性、动态性、共享性等特点,可 以满足不同用户的需求,提供便 捷的信息获取方式。
网络信息资源的类型
政府信息
包括政府机构、政策法规、统 计数据等信息。
学术信息
包括学术论文、研究报告、学 术期刊等信息。
商业信息
包括公司简介、产品信息、市 场调研等信息。
个人信息
包括博客、论坛、社交媒体等 信息。
应了解常见的网络攻击手段,如钓鱼网站、恶意软件等,采取相应 的防范措施。
THANKS
感谢观看
网络信息资源的发展历程
1 2
互联网的兴起
随着计算机技术和通信技术的发展,互联网逐渐 兴起,成为人们获取信息的重要途径。
信息爆炸时代
随着互联网的普及,网络信息量呈爆炸式增长, 搜索引擎的出现使得信息检索变得更加便捷。
3
个性化信息服务
随着大数据和人工智能技术的发展,个性化信息 服务逐渐成为主流,能够根据用户需求提供更加 精准的信息服务。
网络信息资源检索课件
• 网络信息资源概述 • 网络信息资源检索基础 • 搜索引擎的使用 • 学术信息检索 • 网络信息资源的质量评价 • 网络信息资源的合理使用
01
网络信息资源概述
定义与特点
定义
网络信息资源是指通过计算机网 络可用的各种信息资源的总和, 包括文本、图像、音频、视频等 形式。
特点
使用恰当的关键词
选择能够准确描述信息需求的关键词,避免使用过于宽泛或模糊的词 汇。
调整检索策略
根据检索结果不断调整关键词和查询方式,以提高检索效率和准确性。
03
搜索引擎的使用
搜索引擎的原理与分类
搜索引擎的原理
搜索引擎通过爬取互联网上的网页,建立索引,然后根据关键词匹配程度进行 排序,为用户提供搜索结果。

《网络信息资源检索》课件

《网络信息资源检索》课件

合法获取和使用
在使用网络信息资源时,应通过合法途径获取和 使用,避免使用盗版或非法获取的资源。
05
网络信息资源检索的发展趋势
个性化信息检索服务
总结词
个性化信息检索服务是一种基于用户兴趣和需求的信息检索方式,通过分析用户的历史搜索记录、兴趣偏好等信 息,为用户提供更加精准、个性化的搜索结果。
详细描述
信息排序
检索结果通常会按照相关度、时 间顺序等标准进行排序,以便用 户快速找到所需的信息。
02
网络信息资源检索工具
搜索引擎
搜索引擎定义
搜索引擎是一种网络信息资源检索工具,通过爬取互联网上的网 页信息,建立索引数据库,为用户提供关键词检索服务。
搜索引擎分类
搜索引擎可分为全文搜索引擎、元搜索引擎、垂直搜索引擎等类型 ,每种类型都有其特点和适用场景。
3
常用网络资源目录
常用的网络资源目录包括Yahoo目录、Open Directory等。
03
网络信息资源检索技巧
关键词选择与提炼
01
关键词是检索过程中最关键的要素,选择恰当的关 键词能够提高检索的准确性和效率。
02
关键词的提炼需要从信息主题、内容、特征等方面 进行提炼,以突出信息的核心内容。
03
常用特种文献数据库
常用的特种文献数据库包括万方数据、维普资讯、中国知网等。
网络资源目录
1 2
网络资源目录定义
网络资源目录是指将互联网上的各类资源进行分 类和整理,形成一个层次结构化的目录体系,方 便用户进行查找和检索。
网络资源目录特点
网络资源目录具有高度的组织性和分类性,能够 提供全面、系统的互联网资源检索服务。
图书馆资源

02139 计算机信息检索 自考考试大纲

02139 计算机信息检索  自考考试大纲

湖北省高等教育自学考试课程考试大纲课程名称:计算机信息检索课程代码:02139第一部分课程性质与目标一、课程性质与特点计算机信息检索是湖北省高等教育自学考试信息管理与系统专业(本科)的学位课程,旨在系统地培养学生的信息获取、组织、评价和综合利用能力,提高学生的信息素养和信息技能,满足学生快速、准确、有效地获取和高效地利用网络信息资源的需求。

本课程引进数据库技术、网络技术和通信技术的内容,并紧密结合网络环境下信息资源的特点和信息检索的实际需要,全面而又系统地介绍了信息检索的基本理论和基础知识,尤其是网络信息资源检索的特点、检索技术和检索方法。

此外,还介绍了多种不同的网络信息资源检索工具、搜索引擎、网络数据库、网络信息资源检索系统的功能及其使用方法以及不同类型网络信息资源的获取方法和应用领域,为用户快速、有效地获取自身需要和适用的网络信息资源提供了有效的途径和方法。

二、课程目标与基本要求1.系统掌握信息检索的相关概念、类型及信息检索语言,尤其是信息资源检索的技术、方法、途径、步骤,以及效果评价;2.理解网络信息资源的概念、特点和类型,熟练掌握网络信息资源检索的特点、方法和工具;3.学习搜索引擎的概念、功能、类型、工作方法,及其使用方法和技巧,掌握各类主要的搜索引擎的工作原理和检索方法;4.熟练掌握主要的中文和英文网络数据库的检索;5.学习掌握当前主要的核心检索评价系统,并能合理实现各类常用特种文献信息的网络检索。

三、与本专业其他课程的关系该课程要求考生具备信息管理与信息系统专业的基础理论,其先行课程为计算机应用基础、信息资源建设、互联网及其应用等。

第二部分考核内容与考核目标第一章信息资源检索基础知识一、学习目的与要求理解信息资源的内涵,信息资源检索的概念、类型及信息检索系统和语言;掌握信息检索技术,信息资源检索的方法、途径和步骤,以及效果的评价。

二、考核知识点与考核目标(一)信息资源检索的相关概念,检索方法、途径和步骤(重点)识记:信息检索及其相关概念、类型,信息检索系统和数据库。

2检索原理和搜索引擎

2检索原理和搜索引擎

26
搜索引擎的工作原理就像超市
因 特 网
爬行器 蜘蛛) (蜘蛛)
索引生成器 网页数据库) (网页数据库)
27
查询检索器 (用户查询) 用户查询)
第一步: 第一步:从互联网上抓取网页
利用能够从互联网上自动收 集网页的Spider系统程序,自 系统程序, 集网页的 系统程序 动访问互联网, 动访问互联网,并沿着任何网页 中的所有URL(统一资源定位器, 统一资源定位器, 中的所有 统一资源定位器 俗称“网址” 爬到其它网页, 俗称“网址”)爬到其它网页,重 复这过程, 复这过程,并把爬过的所有网页 收集回来。 收集回来。
10
检索语言的类型 分类语言 描述文献内 容特征 检索语言 描述文献外 部特征 主题语言 关键词语言 单元词语言 标题词语言 叙词语言
题名 著者/团体作者名 著者 团体作者名 出版事项 代码/序号 代码 序号
11
6、信息检索的要领 、
What? 信息需求 Where?信息源 How?检索技术
12
17
2、网络信息资源的特点 、
信息量大、 信息量大、传播广泛 信息类型多样、 信息类型多样、内容丰富 信息时效性强、 信息时效性强、变化频繁 信息分散无序、 信息分散无序、但关联程度高 信息缺乏管理、 信息缺乏管理、良莠不齐 所以在网络信息检索中, 所以在网络信息检索中,我们常常要借助于 搜索引擎来帮助我们“大海里捞针” 搜索引擎来帮助我们“大海里捞针”。 来帮助我们
23
第三代搜索: 第三代搜索:网页搜索
它们都属于网页自动搜索 引擎, 引擎,有的还带有智能分 析或FTP P2P搜索功能 FTP、 析或FTP、P2P搜索功能
24
5、搜索引擎的工作原理 、

《网络信息资源检索》课件

《网络信息资源检索》课件
文搜索。
3 必应
微软推出的搜索引擎,注 重用户体验和视觉效果。
如何优化检索关键词
使用具体描述性词语,选择正确的关键词顺序,尝试使用相关词汇和同义词。
搜索引擎通常由爬虫、索引、排名等组成,通过收集、处理和展示信息。
检索词的选择与组合方法
选择准确且具体的检索词,使用布尔运算符和引号来组合或限定检索词的范围。
关键词搜索和全文搜索的区别
关键词搜索仅匹配检索词,而全文搜索会匹配整个文本内容,结果更全面但可能不准确。
常用的搜索引擎及其特点
1 谷歌
全球最大的搜索引擎,提 供广泛的信息检索。
《网络信息资源检索》 PPT课件
本课件将介绍网络信息资源检索的重要性以及相关技术和方法,帮助您更好 地利用搜索引擎和数据库来获得准确有效的信息。
什么是网络信息资源检索?
网络信息资源检索是通过使用搜索引擎和数据库等工具,寻找和获取互联网 上的各种信息资源的过程。
检索技术的发展历史
1
关键词检索
2
随着互联网信息爆炸增长,关键词检索
成为主要方法。
3
人工索引
早期检索技术主要依赖人工整理和分类 信息。
自然语言处理
利用机器学习和人工智能技术,使搜索 更智能化。
检索引擎的分类和作用
通用搜索引擎提供广泛的信息检索,如谷歌、。ຫໍສະໝຸດ
专业搜索引擎
针对特定领域的信息检索,如医学、法律。
元搜索引擎
整合多个搜索引擎的搜索结果。
检索引擎的原理和构成

网络检索课件_第2章_网络信息资源检索概论

网络检索课件_第2章_网络信息资源检索概论
网络信息资源检索概论
12
Internet基础概念 2.1.2 Internet基础概念
4. 域名地址
由于IP地址是以数字来表示主机地址,较难记忆。 为了使用和记忆的方便,就产生了更为高级的字符型主机 地址,即域名地址。Internet在1984年采用了域名管理系 统(Domain Name System,DNS),入网的每台主机都具 有与下列结构类似的域名: 主机名.机构名.网络名.最高层域名 域名地址由2-5段英文字符组成,中间用圆点“.” 分隔,例如东北财经大学的域名地址为, 其含义是:主机名.东北财经大学.教育网.中国。域名地 址是分级管理的,可分为顶级域、二级域、三级域和三级 以下域,其中的顶级域是最高层域名,可由3种类型构成:

2

网络信息资源检索概论

1

2
Internet概述 Internet概述
2
网络信息资源概述
3
网络信息资源检索
网络信息资源检索概论
2.1
Internet概述 Internet概述
3
Internet的起源与发展 2.1.1 Internet的起源与发展
Internet基础概念 2.1.2 Internet基础概念
网络信息资源检索概论
11
Internet基础概念 2.1.2 Internet基础概念
3. IP地址 IP地址
Internet是基于TCP/IP协议的网络,网络中的每 个结点(服务器、工作站、路由器)必须有一个唯一的地 址,用来保证通信时准确无误。它是网络位置的唯一标识, 称为IP地址。 每个IP地址由32位二进制位组成,8位为一组, 共分4个字节段,每个字节段用圆点“.”分隔。由于二进 制数不便于理解,所以IP地址一般用十进制数字表示,如 202.199.165.1。每个IP地址包括两个部分:网络标识和 主机标识。同一个物理网络上的所有主机用一个网络标识, 网络中的每一个主机(服务器、工作站、路由器)各有一 个唯一的主机标识与之对应。

第二章 信息检索基础知识

第二章 信息检索基础知识

全文检索
图像检索 超文本检索
文献检索
使用以二次文献为存储对象的信息系统,如目录
型、题录型、文摘型数据库,是一种相关性检索。特 点:检索结果不直接解答课题用户提出的技术问题, 只提供与之相关的线索。 例如:查找有关“食品安全与人类健康 ”方面的
国内外信息有哪些?
数据检索
以数值信息为检索对象,通过检索,用户可以获 得所需要的确切数据,是一种确定性检索。它一般以
的方式记录在相应的信息载体上,组织成系统
化的检索系统。
1. 数据库及其构成
数据库(database):至少由一种文档组
成,并能满足某一特定目的或某一特定数据处
理系统需要的一种数据集合。 通俗地说,数据
库就是在计算机存储设备上,按一定方式存储的 相互关联的数据集合,是信息检索的基础。
1. 数据库及其构成
一、信息检索的效果评价指标 二、影响检索效率的主要因素
一、信息检索的效果评价指标
以一个检索提问去检索任何一个数据库都会出现 4 个相关量:检出的相关信息量、未被检出的相关信 息量、检出的非相关信息量、未检出的非相关信息量。
一、信息检索的效果评价指标
1. 查全率 a 查全率(R )= —— ×100% a+c 查全率是对所需信息被检出程度的信息量指标。 2. 查准率 a 查准率(P )= ——×100% a+b 查准率是衡量拒绝非相关信息的指标。
中国图书馆分类法的体系结构:
S农业科学类目简表
(2)按事物的性质分类
按事物的性质分类 --- 热门主题 : 各种搜索引擎和网站 按事物的性质分类 --- 功能(使用方向)主题: 国际专
利分类法(IPC)
2.主题描述及信息检索语言

第2章网络信息检索

第2章网络信息检索

3.按组配方式划分 (1)先组式语言(Pre-coordination) (2)后组式语言(Post-coordination)
2.5.3分类语言
1.分类语言的概念 分类语言(Classification language)是 用分类号和类目来表达各种主题概念的检索语言。 它以学科体系为基础,将各种概念按学科性质和 逻辑层次结构进行分类和系统排列。分类语言的 具体表现形式主要是分类表。常见的分类法有 《中国图书馆分类法》、《中国科学院图书馆分 类法》(科图法)、《杜威十进分类法》(DDC)、 《美国国会图书馆分类法》(LC)。
基本部类
马克思主义、列宁主义、毛泽东思想、邓小平理论 哲学 社会科学
基本大类
A马克思主义、列宁主义、毛泽东思想、邓小平理论 B哲学、宗教 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理
自然科学
N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学、安全科学 Z 综合性图书
2.3.1数据库的含义
简单地说,数据库是依照某种数据模型组 织起来并存放于计算机存储设备中要的信息资源,也是信息检索的重要 资料来源。
2.3.2数据库的类型
1.按照数据库的内容与功能划分 (1)参考数据库(Reference Database) 指为用户提供信息线索的数据库,它可以指引用户获 取原始信息,有时又称为二次文献数据库,包括书目数据 库、文摘数据库和索引数据库。 (2)源数据库(Source Database) 指能直接提供原始资料或具体数据的数据库,包括数 值数据库、文本一数值数据库、全文数据库、术语数据库、 图像数据库和多媒体数据库等。 (3)混合数据库 指同时存储参考数据库和源数据库的数据库。

信息检索教程 第二章 检索语言

信息检索教程 第二章 检索语言

17
【例题】检索英语会话类辞典,例如《美国语会话百科》、 《英语会话大全》、《现代英汉生活用语图解词典》,请 选择,哪种检索途径才能够同时查出这3本书? 【选项】 A.用关键词“会话”和“词典” B.用中国图书分类号H319.9-61
C.用书名“英语会话”和“大全”
D.用书名“英语会话”和“词典” 【答案】B
2.1.3.3 按信息标识的组合使用方法,可分 为先组式语言、后组式语言和散组 式语言
2.1.3.4 按语言的规范程度,可分为人工语 言和自然语言
3
第2章 检索语言
2.2.1 概念逻辑
2.2 检索语言 的理论基础
2.2.1.1 概念间的关系 不相容 关系
相容关系
同一 属种
整体与 全面与 不相排斥 交叉 部分 某一方面 的并列
10
第2章 检索语言
2.3.2.3 主要体系分类法介绍 国内常见的体系分类法有:
《中国人民大学图书馆图书分类法》,简称《人大法》 《中国图书馆分类法》,简称《中图法》 《中国科学院图书馆图书分类法》,简称《科图法》 《中国档案分类法》
国外常见的体系分类法有:
《杜威十进分类法》(Dewey Decimal Classification)简称DC或DDC 《美国国会图书馆分类法》(Library of Congress Classification)简称LC 《国际十进制分类法》(Universal Decimal Classification)简称UDC
11
《中国图书馆分类法》 第2 章 检索语言
我国目前广泛使用的分类法是《中国图书馆分类法》。它是由国 家图书馆等单位组织全国力量,以学科分类为基础,并结合图书的特 性所编制的分类法。它将学科分五大部类,基本序列是:马克思主义 列宁主义毛泽东思想、哲学、社会科学、自然科学、综合性图书,由 5大部类、22个大类、6个总论复分表、30多个专类复分表、4万余条 类目组成了一个完善的分类体系。 标记制度采用拉丁字母与阿拉伯数字相结合的混合号码制,用一 个字母代表一个大类,以字母的顺序反映大类的序列,在字母后用数 字表示大类下类目的划分,数字的设置尽可能代表类的级位,并基本 上遵从层累制的原则。

第二章信息检索基础1

第二章信息检索基础1

化学物质登记号(CAS registry number)检索
分子式(formula)检索 记录顺序号(accession number)检索 化合物结构图检索(structure search)检索 ……
不同检索途径常用字段名称
题名途径:题名、标题、篇名、题目、title 分类检索途径:分类号,中图分类号 主题途径:主题词、MeSH、MeSH terms、 Thesaurus、map term to subject headings 关键词途径:关键词、keywords、text words 著者途径:(第一)作者、著者、责任者、 author、first author
研、生产中的具体问题所需要的特定知识或信息。(微波炉
发明) (四)文献(Literature) 文献是记录有知识的一切载体,是知识的外在形式。
情报的基本属性
知识或信息 经过传递
经用户使用产生效益 情报的 基本属性
信息与知识、情报、文献的关系
知识源于信息,是信息的一部分 情报源于知识或信息,是激活了的知识或信息 文献是信息、知识、情报的主要载体形式
形成系统,便于检索的文献。
如:题录、书目、索引和文摘。
特征1 特征2 特征3 特征4 特征5
提取特 征
特征n
二次文献
二次文献
二次文献
2013-8-10
40
三次文献
三次文献是利用二次文献并在其指引下,对大 量的一次文献进行综合分析研究,加以浓缩和提 炼而成的文献。 包括综述、述评、进展、预测等,各类词典、 手册、年鉴、百科全书、指南等参考工具书也属 于三次文献的范畴。
一次文献、二次文献、三次文献
一次文献:
又称原始文献,是首次公开发表的文献,直 接记录了科研成果,报道了新发明、新技术、新 知识和新观点。 一次文献主要包括专著、期刊论文、科技报 告、会议文献、学位论文、专利文献等。

第2章 网络信息资源

第2章 网络信息资源
第2章 网络信息资源
• 网络信息资源极其丰富,包罗万象,其内 容涉及到所有专业领域,它是知识、信息 的巨大集合,是人类的资源宝库。同时, 网络的开放性与交互性使其成为全球范围 内传播和交流科研信息、教育信息、商业 信息和社会信息的最主要渠道。
2.1
网络信息资源的概念
• 2.1.1 网络信息资源含义 • 随着互联网发展进程的加快,信息资源网络化成为一大潮 流。与传统的信息资源相比,网络信息资源在数量、结构、 分布和传播范围、载体形态、内涵、传递手段等方面都显 示出新的特点。这些新的特点赋予了网络信息资源新的内 涵。作为知识经济时代的产物,网络信息资源也称虚拟信 息资源,它是以数字化形式将文字、图像、声音、动画等 多种形式的信息存储在光盘、磁盘等非纸张载体中,并通 过网络和计算机等方式再现出来的信息资源。从信息资源 建设的角度出发,网络信息资源不再是一个物理概念,也 不是独立存在的实体,而是一个跨国家、跨地区的信息空 间,一个网络信息资源库。
2.1.1 网络信息资源含义
• 网络信息资源含义,从广义上说,是指网 络信息活动中所有要素的总和,包括与网 络相关的信息内容、信息网络、信息人才、 信息系统、信息技术等资源;从狭义上说, 是指以数字化形式记录的,以多媒体形式 表达的,存贮在网络计算机磁介质、光介 质以及各类通讯介质上的,并通过计算机 网络通讯方式进行传递的信息内容的集合。
2.1.3 网络信息资源的类型
• 这种联机检索系统的优点和缺陷都十分明显。优点是整 个系统都在系统管理员集中管理下,安全可靠。缺点是主 机负担重,一旦出现故障,整个网络将瘫痪;网络扩展困 难;由于所采用技术标准不公开,因此相关技术缺乏发展 动力,灵活性差。 • 由于Internet网络的发展和冲击,传统的联机网络的局限 性日益明显,并严重制约其发展,大有不进而亡之势。经 过近几年的努力,世界知名的联机系统如Dialog, STN, Compuserve Amercian Online纷纷建立自己的WWW服 务器,开发Internet接口,改善用户界面,增加服务项目 与内容,将其服务对象从原来有限的用户扩大到世界各地, 大大增加了数据库的使用率。

网络信息资源检索PPT课件

网络信息资源检索PPT课件
2
数字信息资源的特点
存储介质和传播形式发生变化
将文字,图像及各类音像资料中的声音动态图像结 合在一起,利用数字技术进行制作存储在光盘,磁盘, 硬盘等载体上
以多媒体作为内容特征
集文本图片,动态图像,声音超外国投资等多种形 式为一体
信息资源类型多种多样
包括数据库,电子期刊,电子图书,电子报纸,专 利等正式出版物,以及学位论文,教学课件等灰色文 献
多层次的信息服务功能
检索功能,学科导航,分类主题指南,网上讨论等
3
数字信息资源的特点
更新速度快,时效性强 具备检索系统 不受时间,地域限制。
4
数字信息资源的产生与发展
1960年代初,“化学题录”和“医学索引” 1965年以后,数据库联机检索开始出现,最著
名的如DIALOG,MEDLINE等, 1980年以后,由于卫生通信技术,光纤通信技
精选课件精选课件pptppt33存储介质和传播形式发生变化存储介质和传播形式发生变化将文字图像及各类音像资料中的声音动态图像结将文字图像及各类音像资料中的声音动态图像结合在一起利用数字技术进行制作存储在光盘磁盘合在一起利用数字技术进行制作存储在光盘磁盘硬盘等载体上硬盘等载体上以多媒体作为内容特征以多媒体作为内容特征集文本图片动态图像声音超外国投资等多种形集文本图片动态图像声音超外国投资等多种形式为一体式为一体信息资源类型多种多样信息资源类型多种多样包括数据库电子期刊电子图书电子报纸专包括数据库电子期刊电子图书电子报纸专利等正式出版物以及学位论文教学课件等灰色文利等正式出版物以及学位论文教学课件等灰色文多层次的信息服务功能多层次的信息服务功能检索功能学科导航分类主题指南网上讨论等检索功能学科导航分类主题指南网上讨论等精选课件精选课件pptppt44更新速度快时效性强更新速度快时效性强具备检索系统具备检索系统不受时间地域限制
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11
12
发展前景:
虽然目录型检索工具在当今互联网信息检 索界的地位已不如从前,但仍是个个人维护的目录 型检索工具,它成为了相当一部分上网用 户的“入口”,许多对上网无从下手的人, 最需要的就是这样的导航网站,如今360也 开发了360网址。
第2章
1
第2章 互联网信息检索概论
2.1互联网信息检索类型和特点 2.2互联网信息检索原理之一——信息组织 2.3互联网信息检索原理之二——信息查询 2.4互联网检索工具的性能评价
2
2.1互联网信息检索的类型和特点
2.1.1互联网信息检索的类型 2.1.2互联网信息检索的特点
8
最具代表的互联网目录型检索工具当属 “yahoo”(雅虎),是由斯坦福大学的研究 生杨致远(Jerry Yang)和David Filo与 1993年创立的。
互联网刚开始发展时,他们在网上冲浪时, 逐渐把自己喜爱的站点编成一个名单以便 寻找,并将这一名单在网上公布,供网友 使用,这就是雅虎的前身,也是目录型检 索工具的工作原理。
索互联网站点提供了极大的方便,但随着
互联网的持续发展,它的缺点也越来越明 显,其地位收到了以Google为代表的搜索 引擎的挑战。
时过境迁,雅虎和搜狐都已经发展成了门
户网站。
10
补充:门户网站
中国四大门户网站:新浪、网易、搜狐、 腾讯
门户网站:又被称为链接页面,是通向某 类综合性互联网信息资源并提供相关信息 服务的应用系统。
张朝阳在中国创办“搜狐”,也是比较成 功典型的互联网目录型检索工具。
9
优点:人工参与度高,网络资源目录的组 织编排符合人们所熟悉的知识分类体系,
检索目标性相对较强,提供的检索结果准 确性也较高。
缺点:信息涵盖量不大,更新能力有限, 相对成本较高。
面临挑战:在互联网发展早期,为人们检
优点:扩大检索范围,提高检索效率,增 加了找到所需信息的可能性。
21
②垂直搜索引擎 其特点是“专、精、深”,且具有行业色
彩,与通用搜索引擎的海量信息无序化相 比,垂直搜索引擎的信息量虽然小,但更 加专注、深入具体。 比如酷讯的机票检索和团800的团购导航。
22
2.1.2互联网信息检索的特点
19
2、索引非文件形式的互联网信息资源的能 力有限,为了保证Robot抓取网页的效率, 让其不至于迷失在无尽的链接中无法返回, 通常Robot在漫游各个网站时会受到目录深 度的限制,较大搜索引擎的robot一般也就 能顺链到一个网站的4-5网检索工具
①元搜索引擎。它弥补了搜索引擎的不足, 他不存在Robot,也不存在存放网页的数据 库,当用户检索一个关键词时,它把用户 的检索请求转换成其他搜索引擎所能接受 的命令格式,并发送访问数个搜索引擎来 检索这个关键词,这些搜索引擎的结果经 过处理后再返回给用户。
3
2.1.1互联网信息检索的类型
1、“顺链而行”的浏览 基于互联网“超链接”的技术特点,用户
在浏览网页时,可以非常方便地利用超文 本文件中的链接从一个网页跳转到另一个 相关网页。这些类似于传统文献检索中的 “追溯检索”,但是检索效率已大大提升。 追踪网页的超链接,用户可以一轮一轮不 断地扩大检索范围,在很短的时间内获得 大量相关信息。
17
优点
充分利用了计算机的处理能力,对于规模 巨大的互联网信息资源的索引和检索具有 强大的优势,使得人们可以用更少的时间 检索到更广阔的互联网信息。
18
缺点
1.检索噪音问题。使用搜索引擎检索某个关 键词或关键词组合,通常会返回大量检索 结果,逐一浏览这些结果对用户来说是不 现实的。搜索引擎不断改进算法,使得最 满足检索需求的结果排序靠前,取得了一 定的效果,但是仍不能完全令人满意。
4
在互联网发展初期,“顺链浏览”的人工 浏览方式是互联网信息检索最主要的手段, 而浏览器的“书签”(收藏夹)功能是成 为该阶段被使用得最多的功能之一。
5
马云与黄页
1995年4月,马云和妻 子再加上一个朋友, 凑了两万块钱,专门 给企业做主页的杭州 海博网络公司就这样 开张了,网站取名 “中国黄页”,成为 中国最早的互联网公 司之一。其后不到三 年时间,他们利用该 网站赚到了500万元。
中国黄页2009年6月1 日,网站正式上线, 完全公益性网站,不 收任何费用!
6
人们对互联网信息的寻找,从最原始的 “顺链浏览”到黄页等早期检索工具,实 现了第一个飞跃。互联网黄页本质上就是 一种目录型检索工具。
7
2、基于目录型检索工具的互联网信 息检索
目录型检索工具,也被称为网络资源目录 或网络主题指南,它是一种基于人工的检 索工具,由人工发现、抓取、辨别互联网 信息,依靠编目、标引人员的知识,按照 图书分类、学科分类或其他分类依据的体 系,建立主题树分层目录,将采集、筛选 后的信息分门别类地放入各大类或子类下 面,用户通过逐级浏览这些目录来查询自 己所需要的内容。
13
14
15
3、基于索引型检索工具的互联网信 息检索
随着互联网信息量的急剧增加,仅以“网 站”为信息基本单元的检索方式已经不能 满足更精细的检索需求,于是基于“页面” 为信息基本单元的检索方式成为主流。
最具代表性的索引型网络检索工具就是搜 索引擎
16
搜索引擎原理
利用一个成为Robot的程序自动访问Web站 点,提取站点上的网页,并根据网页中的 链接进一步提取其他网页,并将搜集到的 网页加入到搜索引擎的数据库中,并建立 索引,供用户检索使用。然后用户输入关 键字之后进行检索。
1、无限检索范围,动态的检索对象 2、丰富的检索内容,新兴的检索领域 3、强大的检索工具,低廉的检索费用
23
2.2互联网信息检索原理之一—— 信息组织
目录型检索工具是基于某种人类制定的知 识分类体系,对网络信息资源的编排和组 织加以人工控制,其工作原理相对简单。 这里介绍的互联网信息检索原理,主要是 指基于计算机技术的索引型检索工具的工 作原理。
相关文档
最新文档