信息检索网络信息资源检索

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一节
网络信息资源概述
(3)网络数据库
网络数据库是借助于因特网、以web为检索平台提供 信息检索服务的数据库,是数据库技术与web技术结合的 产物。网络数据库所储存的信息都是经过人工严格收集、整 理加工和组织的具有较高学术价值、科研价值的信息资源。 许多著名的国际联机数据库检索系统(如Dialog)都开设 了与因特网的借口,用户可以通过远程登陆或以WWW方 式进行付费检索。有许多从事传统信息服务的机构开发了网 络数据库,如EBSCO公司的BSP(商业资源数据库)、万 方数据资源系统,CNKI等,都是由专门的信息信息机构或 公司来制作维护。
第一节
网络信息资源概述
2.网络信息资源的特点
(1)数量巨大,增长迅速
网络信息资源虽然出现较晚,但其数量增长迅猛。
(2)变化频繁,良莠不齐
信息发布的自由造成网络信息呈爆炸式增长,精加工信息 与与未经过任何过滤的低质量信息并存,造成信息的良莠不齐, 信息资源的更迭、消亡无法预测。
第一节
网络信息资源概述
第二节 搜索引擎概述
二、搜索引擎的类别
1.综合类搜索引擎 指在检索过程中不限制检索信息的类型和主题范围, 以所有网络信息资源为检索对象,检索结果包括所涉 及的任何领域、任何方面的网络信息资源。 常用综合类搜索引擎: 谷歌、yahoo、百度、新浪、搜狐。。。
研究者的信息来源
第二节 搜索引擎概述
第一节
网络信息资源概述
(5)网上动态消息
网络的开放性和交互性,使得网上有很多动态性很 强的信息,如网上新闻、BBS、政府机构发布的信息、 政策法规、会议消息、研究成果等。
(6)其他网络信息
网上还有大量的电子邮件以及娱乐游戏、教育培训、 应用软件等信息。
第二节 搜索引擎概述
一、搜索引擎的搜索原理
搜索引擎是一个服务器程序,通过特定的检索软件,检索 自己的索引数据库并将检索结果交给用户。一个完整的搜索引 擎包括数据采集器、分析器、索引器、检索器和用户接口。
(3)内容丰富,形式多样
网络信息资源内容包罗万象,覆盖了不同学科,不同领 域,不同语言的信息资源,形式上包括文本、图像、声音、软 件、数据库等。是多媒体,多语种,多类型信息的混合体。
(4)自由发布,交流直接
提供了自由发表个人见解的空间和获取非出版信息的机会。 包括哪些正式出版物中所不能得到的信息,如类似于灰色文献 的信息,还未成熟的观点、教学资料等,网络扩大了人际交流 的空间,如新闻组,讨论组等,它提供一种开放的双向信息流 通方式,可以形成广泛的论坛氛围。
第二节 搜索引擎概述
(2)Intute(http://www.intute.ac.uk/) Intute是一个免费、便捷、强劲的搜索工具,由英国高等 教育资助理事会下的信息系统联合委员会(JISC)和艺术与人 文研究委员会(AHRC)开发建立,专注于教学、研究方面的 网络资源。所收录的信息资源都是经过行业专家选择和评审的, 从而保证了其质量。目前数据库信息已达120060条。 Intute共设四大领域:科学与技术、艺术与人文、社会科 学、健康与生命科学。各个领域下又包含诸多学科,以科学与 技术类为例,覆盖了天文、化学、物理、工程、计算、地理、 数学、地球科学、环境以及交叉学科,信息达33806条。
用 户 INTERNET 采 集 器 分 析 器 索 引 器 索引数据库 检 索 器 检 索 器
用 户
第二节 搜索引擎概述
搜索引擎的核心是采集器robots, robots是一个在 网络上检索文件且自动跟踪该文件的超文本结构,并循环 检索被参照的所有文件的软件。主要功能是根据预先设定 好的一组规则来搜集因特网上的信息,网页爬虫在各网址 中爬行,访问网络中公开区域的每一个站点并记录其网址, 创建详尽的网络目录。
提供根据疾病名称、所属学科和内容性质(会议报告、 杂志文章的全文或摘要等)的英文着个字母的分类检索 (The Medscape Index)。在主页的首页可直接进入临 床管理系列(Clinical Management Series)、杂志全 文(Journals)、实用指南(Practice Guidelines)、指 南进展、杂志扫描、会议摘要和时间表、专家提问和讨论、 临床挑战等栏目。
(5)检索方便,价廉实惠
用户可以根据需要和已知信息任意选择检索方式与 入口,进行自然语言检索、全文检索,可迅速找到所 需内容。输出的信息按照相关型大小排列,检索信息 更全面准确。
(6)分散无序,缺乏管理 海量的信息和快捷地传播加剧了网络信息的无序
状态,许多信息资源缺乏加工和组织,网络信息的地 址、链接、内容出于经常性的动态变化之中,缺乏统 一管理机构控制,没有统一标准,缺乏质量控制和管 理机制。
第二节 搜索引擎概述
在物理与科学检索中,包括许多重要实验室网站检索,如 Lawrence Livermore国家实验室、欧洲粒子物理实验室 (European Laboratory for Particle Physics)、太阳 与空间观察室(Solar & heliospheric Observatory)等, 而且还有数据库和出版物网站,如美国国家海洋与气象局数据 库、科学家通讯、应用光谱学杂志等。 PhysLink的另一重要内容是它的物理资料,罗列了重要 物理常数、网上单位换算、物理公式、核物理数据、粒子物理 数据、表面物理数据、网上元素周期表、材料安全信息、各种 奖项信息、教育资源等。
第二节 搜索引擎概述
(3)PhysLink(http://www.physlink.com/) 1995年由麦克马斯特大学建立,为物理和天文学的研 究和教育提供了一个全面的网络资源、工具、服务和门户站 点。其信息和服务包括:重要文章(Cover Story)、请教 专家(Ask Experts)、就业机会(Physics Jobs)、科学 软件资源站点目录(Science Software)、科技参考资料 (Science Reference)、物理院系(Physics Departments)、物理学会(Physics Societies)、科 学期刊(Scientific Journals)、研究生咨询(Graduate Advisor)、物理新闻(Physics News)、高科技公司 (HighTech Companies)等。
第一节
网络信息资源概述
(2)远程登录信息资源
指在远程登录协议(telecommunication network protocol)的支持下,用户计算机经由因 特网与远程计算机连接,并在权限允许的范围内检索 和使用远程计算机系统中的各种硬件、软件资源。通 过远程登录方式获取的信息资源主要是政府部门、研 究机构对外开放的数据库、商用联机检索系统等。例 如dialog目前仍然提供远程登录形式的联机检索方 式,,付费取得账号和口令之后,可以检索其数据库 资源。
(4)电子出版物
以数字代码形式将文字、图像、声音、视频等信息 存储在磁、光、电介质上,通过因特网传播,并通过 电脑或相关设备阅读的出版物,包括电子图书、电子 期刊和电子报纸等。现有的电子出版物,有的是传统 纸本文献的电子版本,也有的是完全以数字化形式编 辑、制作、出版和发布,并形成网络化形式发行。
第一节
网络信息资源概述
2.按照信息加工层次划分
(1)网络资源指南和搜索引擎
网络信息检索工具有资源指南和搜索引擎之分。资源指 南按主题的等级排列主题类目索引,用户通过逐层浏览类 别目录,逐步细化的方式来寻找合适的类别直至具体的资 源。搜索引擎强调检索功能,是个专用的WWW服务器, 收集了全世界上千万个WWW主页信息。
(2)联机馆藏目录 网络上许多机构提供馆藏书目信息和中外 文期刊联合目录信息, 包括各图书馆和信息机 构提供的公共联机检索(OPAC)馆藏书目、 地区或行业的图书馆的联合目录等。全国高等 教育文献保障体系(CALIS)提供多所高校的 馆藏期刊、书目和学位论文联合查询。用户只
要通过图书馆的URL,就可以查询该馆的 图书馆馆藏,不受时间地点的限制。
第二节 搜索引擎概述
1.分析器的主要功能是对采集器robots搜集来的网页信 息或者下载的文档进行分析,以用于建立索引,这些 分析包括分词、过滤及转换等。 2.索引器的功能是对采集器所搜索的信息进行分析处理, 从中抽出索引项,用于表示文档以及生成文档库的索 引表。 3.检索器将用户查询与系统资源进行检索匹配,并根据 一定的算法将相关网页排序输出。 4.用户接口是系统提供给用户进行检索交互的,要求提 供检索窗口,特定的检索功能,接受用户检索要求, 将用户的检索要求编制成计算机可执行的规范化检索 式,提供用户相关信息反馈机制,现实检索结果。
(4)用户服务组信息资源
各种各样的用户服务组,保罗 新闻组信息资源、电 子邮件信息资源、邮件列表、专题讨论组等,都是因 特网上最受欢迎的信息交流形式。他们都是由一组对 某一特定主题有共同兴趣的网络用户组成的电子论坛, 用户以邮件形式进行网上交流和讨论。用户服务组信 息资源是一种丰富、自由和开放性的资源。
第二节 搜索引擎概述
导航栏内栏目有:医学继续教育、会议、Байду номын сангаас源中心、 患者教育、图书馆、讨论区。医学教育为其特色栏目。 也提供多种数据库检索:Medscape是检索自身网站 的资源;Medline是美国国立医学图书馆提供的覆盖全 球近4800种医学期刊的全文数据;Druginfo是 FirstDatabank和美国医师协会提供的最大的药物数 据库,可查询20万种药物的使用剂量、毒副作用、使用 注意事项等内容。
2.专业类搜索引擎
专业类搜索引擎又称垂直型搜索引擎,是专门检索某一类 型、方面、学科、主题信息资源的搜索引擎。对某一特定信息 资源的描述、介绍都非常详细和专业,具有学术性强、针对性 强、目标明确、查准率高而全的特点。常用专业搜索引擎有如 下几种: (1)美国Medscape(http://www.medscape.com) 美国Medsite publishing 公司于1997年7月在 WWW上建立的著名医学搜索引擎,提供医学主题的分类目 录浏览和站点检索的功能。可检索图像、声频、视频资料,至 今共收藏了近20个临床学科25000多篇全文文献。
第三章 网络信息资源检索
第一节 第二节 第三节
网络信息资源概述 搜索引擎概述 网络免费信息资源检索
第一节
网络信息资源概述
网络信息资源定义和特点 网络信息资源的类型
第一节
网络信息资源概述
一、网络信息资源定义和特点 1.网络信息资源的定义
网络信息资源是指以电子数据形式将文字、图像、 声音、动画等多种形式的信息存放在光、磁等非印刷 载体中,并通过网络通信、计算机或终端等方式再现 出来的信息资源的总和。
(3)FTP信息资源
文件传输协议FTP(file transfer protocol)的 主要功能是利用网络在本地与远程计算机之间建立联接, 从而实现运行不同操作系统的计算机之间的文件传送。通 过FTP可获取的信息资源的类型很广泛,任何以计算及方 式存储的信息均可以保存在FTP服务器中,FTP不仅允许 从远程计算机获取和下载文件,也可将文件从本地复制到 远程计算机上。FTP是获取免费软件、共享软件资源不可 缺少的工具。目前,FTP信息资源仍然是因特网上的最重 要信息资源。很多机构都建有FTP服务器,可以利用相关 工具用来查找特定信息资源所在的FTP主机、文件名及其 所在的子目录名称。
第一节
网络信息资源概述
二、网络信息资源的类型
1.按照所采用的网络传输协议划分 (1)WWW信息资源
WWW(world wide web)信息资源,也称为 WEB信息资源,是一种基于超文本传输协议(HTTP)的, 在WWW客户端和服务端之间传输,建立在超文本、超媒体 等技术基础上,集文本、图像、图形、声音等为一体,以网页 形式存在,以直观的图形用户界面展现的一类信息资源形式。 WWW信息资源自20世纪90年代问世以来,得到了迅速发 展,现在已经是因特网上信息资源的最主要、最常见的形式, 这类信息资源一般通过搜索引擎进行检索。
相关文档
最新文档