第二章 网络信息资源检索

合集下载

第2章--信息检索PPT课件

第2章--信息检索PPT课件

经济
文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理
S
T U V X Z
农业科学
工业技术 交通运输 航空、航天 环境科学、安全科学 综合性图书
《中国图书馆分类法》
中国图书馆分类法分类表共分22个大类,再分17个 二级目录,医药卫生属于R大类。 《中图法》采用汉语拼音字母和阿拉伯数字组成的 混合制号码作类目标识,用一个字母标记一个基本
的问题;
另一方面是特定原始文献的查找,即在查找特定
的文献线索后,找出原始文献的过程。
第一节 信息检索基础
一、信息检索概念
(二)信息检索的意义和作用 信息检索 有助于知识更新 ,有助于同学们扩大视野 ,了解和把握有关学科中出现的新思想、新观点与 新知识。掌握信息检索技术是快速、准确地获取和 利用最新信息的有效途径。 信息检索有助于科学研究,了解和把握有关学科的 起源和发展过程。 有助于独立自主地解决自己在学习、生活和工作中 所遇到的疑难问题。 是接受终身教育的必要手段。 节省时间,提高效率。
第二节 信息检索语言
二、检索语言的种类
(一)分类检索语言 分类检索语言又称分类法,是用分类号(字母、数 字或它们的组合)来表达各种概念的,并将各种概 念按学科性质进行分类和系统排列的信息检索语言。 它以树状结构的形式,按知识门类的逻辑次序反映事物 的从属、派生关系,构成具有上位类和下位类隶属、同 位类并列的概念等级体系。 能较好体现概念的族性关系,从学科专业的角度检索资 料,比较方便,扩大、缩小检索范围方便。
(一)按信息检索的对象划分
数据信息检索 利用数据库、工具书等以数值或数据为对象的检 索,也称为数值检索。检索包含分子式、分子量 、公式 、图表等特定数据的信息。

网络信息资源检索技术

网络信息资源检索技术

军队由于扼杀自由和抢劫,已经沦为一把双刃剑,对谁都没有 安全感。 关键词拟定: 军队 army 扼杀自由 liberticide 双刃剑:double-edged sword 抢劫 由于同义词、近义词太多:<robbery>
<mugging> <hijack> <heist> <highjack> <plunder> <stick-up> <spoilation> <dacoity> <pillage> <brigandage> <rob of> <rifle> <expilare> <despoilation> <mugged> <prey> 所以建议舍弃。由以上三个词已经可以构成
在百万上千万的网页中,使得它们事实上不能被用来帮助 找到什么有用的信息(除非和别的关键词一起使用),比如说 “气温”,有无数个网站提供跟“气温”相关的信息,从 地方天气预报到学术论文到气象学科普等等,所以使用更 多的关键词或更明确的关键词来检索要比单纯检索“气温” 好得多,例如设计一个类似“北京冬季气温零下”这类特 殊的搜索关键词。 3、在检索提问时避免使用行为关键词,谨慎使用修饰词。----第3个检索技巧
其实上面,Jan在列检索词时罗列了太多的无用词,例如 building,daylight似乎没有必要。我们可以更改一下: 第一、该鸟应为食肉类动物:可以定检索词为“猛禽”,英 文为raptor,bird of prey。我们利用中文来进行检索; 第二、该鸟的体形:类似于乌鸦。鸦类在鸟类中体形较大, 大致在50—70厘米之间。可以利用50厘米来进行检索; 第三、该鸟的毛色:灰白相间; 第四、该鸟的喙:黄黑相间。 利用Google检索,找到“泡泡社区--‖逛‖中国濒危珍稀动 物————鸟类”,网址为 /040410/959254-2.html 上面有各种鸟类的图片,可以确定所看到的鸟类应为“游 隼”。 第五、利用“游隼*生活习性”来检索到以下网址: /dispbbs.asp?boardid=36&id=1466 野生动物保护论坛。

第二章 信息检索基本知识

第二章 信息检索基本知识

(二)按出版形式划分:
原始文献
图书
特种文献
期刊
会 议 文 献
科 技 报 告
专 利 文 献
学 位 论 文
政 府 出 版 物
其 标 准
食品标准网

7-111-17892-0
《发票报文》GB/T 17303.2-1998 第二部分:国际贸易商业发票报 文
……
(三)按信息的加工程度来分: 1、一次文献信息 (原始文献):
一、检索工具的作用 1、报道作用 2、存储作用 3、检索作用
二、检索工具的特点
1、详细而又完整地记录了文献的外部特征和内部特征。
2、对所著录的文献,标引了可供检索的检索标识。 3、提供必要的检索手段,配备各种体系的索引。
三、检索工具的类型
按著录信息的特征划分:
1、目录 2、题录 3、文摘 4、索引
检索途径-分类途径 分类途径的缺点是新兴学科、边缘学科在 分类时往往难于处理,查找不便。另外, 从分类途径检索必须了解学科体系,否 则在将概念变换为分类号的过程中常易 发生错误,造成漏检或误检。
检索途径-主题途径
• 主题途径是一种按照文献的主题内容查找文献 的途径。使用的语言是主题语言。使用的检索 工具有“主题索引”、“关键词索引”、“叙 词索引”等。 • 主题法打破了传统的学科分类的框框,把分散 于各个学科的有关文献集中于同一主题词之下, 以文字作检索标识,索引按照资料内容的主题 词或关键词的字顺排列,检索时就象查字典一 样,不必考虑学科体系。
更多……
• 按检索方式,可分为印刷型检索工具和机器检 索工具; • 按出版形式,可分为期刊式检索工具、书本式 检索工具、卡片式检索工具、缩微式检索工具、 机读式检索工具等; • 按收录范围,可分为综合性检索工具、专题性 检索工具; • 按语种,可分为中文检索工具和外文检索工具;

第二章-网络信息资源的检索与利用 第二,三节

第二章-网络信息资源的检索与利用 第二,三节

A.互联网上的国内期刊信息
• 查找国内期刊,可以从以下站点入手: • 一、中国期刊网: • 二、维普科技期刊网: 或 / • 三、万方数据资源系统的数字化期刊: /qikan/ind ex.jsp • 四、学科导航信息

图片搜索

二.常用网络信息资源的检索
• • • • • • • 1. 网络检索--- 图书 2. 网络检索----期刊 3. 网络检索----报纸 4. 网络检索----人物,机构 等信息 5. 网络检索----专利, 标准, 科技报告, 统计数据等信息
怎样查找互联网上的图书信息?
网络信息资源 检索﹠利 用
• 网络信息资源与常用中英文搜索引擎
• 常用网络信息资源的检索利用(学术) • 网络信息资源的检索策略与技巧
第二节
• 常用网络信息资源的检索利用(学术)
一.重要的学术搜索简介
二.常用网络信息资源的检索利用
一.重要的学术搜索简介
• 1. Google scholar(Google学术搜索 ) • 2. Scirus(科学搜索)是目前网上最全面、 综合性最强的科技文献搜索引擎之一 • 3.一些专业专题搜索引擎。

Directory of Open Access Journals
• DOAJ( Directory of Open Access Journals)由 由Lund University建立,它提供有质量控制的可 免费获取的网上电子期刊资源,它的目标是建成一 个无学科、无语言限制的综合性的科学期刊系统, 方便科研人员使用,并可提升期刊的显示度。 • 目前该网站已收集了482种期刊,并把这些期刊分 成了15个大类,53个小类,其中包括农业、生命科 学、化学、数学、物理、天文学、工程技术、环境 科学DOAJ( Directory of Open Access Journals 、社会科学等。

第二章-互联网信息资源检索概论

第二章-互联网信息资源检索概论
11
12
发展前景:
虽然目录型检索工具在当今互联网信息检 索界的地位已不如从前,但仍是个个人维护的目录 型检索工具,它成为了相当一部分上网用 户的“入口”,许多对上网无从下手的人, 最需要的就是这样的导航网站,如今360也 开发了360网址。
第2章
1
第2章 互联网信息检索概论
2.1互联网信息检索类型和特点 2.2互联网信息检索原理之一——信息组织 2.3互联网信息检索原理之二——信息查询 2.4互联网检索工具的性能评价
2
2.1互联网信息检索的类型和特点
2.1.1互联网信息检索的类型 2.1.2互联网信息检索的特点
8
最具代表的互联网目录型检索工具当属 “yahoo”(雅虎),是由斯坦福大学的研究 生杨致远(Jerry Yang)和David Filo与 1993年创立的。
互联网刚开始发展时,他们在网上冲浪时, 逐渐把自己喜爱的站点编成一个名单以便 寻找,并将这一名单在网上公布,供网友 使用,这就是雅虎的前身,也是目录型检 索工具的工作原理。
索互联网站点提供了极大的方便,但随着
互联网的持续发展,它的缺点也越来越明 显,其地位收到了以Google为代表的搜索 引擎的挑战。
时过境迁,雅虎和搜狐都已经发展成了门
户网站。
10
补充:门户网站
中国四大门户网站:新浪、网易、搜狐、 腾讯
门户网站:又被称为链接页面,是通向某 类综合性互联网信息资源并提供相关信息 服务的应用系统。
张朝阳在中国创办“搜狐”,也是比较成 功典型的互联网目录型检索工具。
9
优点:人工参与度高,网络资源目录的组 织编排符合人们所熟悉的知识分类体系,
检索目标性相对较强,提供的检索结果准 确性也较高。

第二章网络检索

第二章网络检索


2.1.3、网络信息资源的特点
(一)优点: 1.数量巨大,增长迅速 2.内容丰富,形式多样 3.结构灵活,分布广泛 4.开放互动,共享性强 5.传播快速,利用方便 6.更新速度快,动态性强
网络信息资源的特点
(二)缺点: 1.网络信息质量参差不齐,良莠不一 2.分散无序,缺乏管理
2.2 网络信息检索的方法


2、网上出版物
网上出版物是指在网络环境中编辑、出版、发行的出版物以 及印刷型出版物的网络版,包括网上图书、网上期刊、网上报 纸等。如今,通过Internet浏览、订阅电子期刊、报纸、图书 等已成为一种时尚,网络出版物的数量正急剧增加。如在中国 科技期刊网上可以免费查找《中国学术期刊》的题录。其中网
上参考工具书更是独树一帜,像一些百科全书、辞典、指南、
手册、文摘索引、目次表、名录等,这些网络版参考工具书使 用起来方便、快捷。目前因特网上有上万种电子期刊向网上用
户提供服务,其中很多是免费提供。
主要网上书店

中国图书网(/) 中华图书网(/)
短短的两年多时间内,设在北京大学的项目管理中心联合各参建
单位,建设了文理、工程、农学、医学四个全国文献信息中心, 华东、华中、华南等七个地区中心和一个东北地区国防信息中心, 建立了一系列国内外文献数据库,并开展了公共目录查询、信息 检索、馆际互借、文献传递、网络导航等网络化、数字化文献信 息服务,对保障"211工程"各高校的重点学科建设、培养高层次人 才、支持科研创新等发挥了重要的作用。
CALIS面向读者的服务功能主要有: (1)公共检索:可以在网上查找全国性或地区 性的书刊联合目录数据库,了解所需文献是否有及在 哪里收藏。也可以联机检索CALIS国内外各种类型的 文献数据库。 (2)馆际互借 (3)文献传递 (4)电子资源导航:对网上的电子资源进行收 集、加工和整序,形成虚拟图书馆资源,提供用户浏 览和查询。

网络信息资源检索PPT课件

网络信息资源检索PPT课件
03
02
完整性
信息内容是否全面、完整,没有遗 漏或缺失。
权威性
信息来源是否具有权威性,发布者 是否具有专业资质。
04
信息资源的获取与整理
搜索引擎
使用搜索引擎进行关键词检索,获取相关信 息。
网络爬虫
利用网络爬虫技术自动抓取网页信息。
数据库
通过学术数据库、行业数据库等获取专业信 息。
信息筛选
对获取的信息进行筛选、去重、分类等处理, 整理成有用的资源。
高级检索功能的使用
限定字段检索
通过限定字段范围,缩小检索结果的范围,提高检索 效率。
模糊匹配
使用模糊匹配功能,对关键词进行模糊查询,提高查 全率。
分类导航
利用网站提供的分类导航功能,快速定位到相关资源。
检索结果评估与筛选
评估检索结果的相关性
根据检索结果与需求的匹配程度,评估检索结 果的可靠性。
筛选优质资源
跨媒体检索
随着多媒体技术的不断发展,跨媒体检索将成为未来网络 信息资源检索的重要方向,用户可以通过图片、视频、音 频等多种方式进行信息检索。
THANKS露
网络信息检索过程中,用户的个人信息可能被泄露或滥用,如搜索引擎记录用户 的搜索历史和位置信息等。
信息安全
网络信息资源的共享和传输过程中可能存在安全风险,如黑客攻击、数据篡改等 ,这些威胁可能对用户的隐私和信息安全造成严重威胁。
人工智能在信息检索中的应用
个性化检索
人工智能技术可以根据用户的兴趣、偏好和行为习惯,为用户提供更加个性化的检索结果,提高检索的准确性和 效率。
02
数据库检索的代表有CNKI、万方 等,它们提供了更为专业和深入
的搜索结果。
数据库检索的优点是信息质量较 高,收录的文献和数据较为全面 。

第二章 信息检索的基本知识

第二章 信息检索的基本知识

应用举例:
利用《中图法》在《全国报刊索引》中查找 有关“建筑抗震设计”方面的相关文献。 第一步:分析课题,按学科属性属于“T工业技术” 中的“TU建筑科学”大类。 第二步:查《中图法》确定分类号为:T工业技 术—TU建筑科学—TU3建筑结构—TU352.11抗震结 构。 第三步:根据《全国报刊索引》(科技版)的分 类目录给出的TU3建筑结构的页次,得到相关文献。 第四步:根据的出处索取原始文献。
第二章 信息检索的基本知识
主要内容
1.信息检索概述 2.信息检索原理及检索语言 3.信息检索系统与检索工具 4.信息检索的一般程序
2.1 信息检索概述
2.1.1信息检索的含义
信息检索(Information Retrieval)是指 将信息按一定的方式组织和存储起来,并根据用 户的需要找出有关信息的过程,又叫信息储存与 检索(Information storage and Retrieval), 这是广义的信息检索,如图2-1所示。狭义的信息 检索则是仅指该过程的后半部分,即从信息集合 中找出所需信息的过程。
内容特征 标题词 主题语言 关键词 叙词 描述文献外表特征的检索语言,例如篇名、著者姓名、文 献号等作为文献标识与检索依据直接明了,使用时较为简单。 而文献内容特征的语言,也就是分类语言和主题语言的原理和 使用方法是下面主要介绍的内容。
一条中文书目记录:
题名: 信息检索 作者: 徐天秀 出版项:北京:科学出版社,2006 页码: 320页 价格: CNY23.00 主题: 情报检索 索取号: G252.7/101 内容提要:本书是一本工具型书籍,提供的信息检索学科 范围广,内容尽量以最新版本为主,是一本适用性强的学 习信息检索方法和技巧的专著,尤其是本书配制的多媒体 光盘,为本课程的学习提供了便捷。 分类: G252.7

信息检索基础知识

信息检索基础知识
文献加工困难,阅读不方便。
例如:缩微平片、缩微胶片等。
声像型:
定义: 也称视听型,是指通过特定设备,使用光、声、
磁、电等技术将信息转换为声音、图像、影视和动 画等形式,给人以直观、形象感受的知识载体。 (一种非文字形式的文献) 优点:
信息存储密度高,形象直观、生动、逼真。 缺点:
成本高,不易检索和更新。 例如:录音带、唱片等。
专著(原始文献)
•ISBN号*
期刊
定义:
期刊一般是指名称固定、开本一致的定期或不定期 出版的汇集许多个著者论文的连续出版物。(期刊上刊 登的论文大多数是原始文献)
按内容分:学术性期刊、通讯性期刊、述评性期刊等。
例如:
按时间长短分:周刊、月刊、双月刊、季刊、年刊等。
ISSN号*
报纸
定义:
报纸是以刊载新闻和时事评论为主的定期向公众发 行的印刷出版物。是大众传播的重要载体,具有反映和 引导社会舆论的功能。
广义:信息、信息生产者、信息技术和设备。
二、信息资源(文献)的类型
(一)按文献的载体不同划分: 1、手写型 2、印刷型 3、缩微型 4、声像型 5、电子型 6、多媒体型 (二)按文献的出版形式不同划分: 1、图书 2、期刊 3、报纸 4、会议文献 5、学位论文 6、科技报告 7、专利文献 8、标准文献 9、产品样本 10、档案 11、政府出版物 (三)按文献的加工程度不同划分: 1、零次文献 2、一次文献 3、二次文献 4、三次文献
知识固化在纸张上的一类文献。 优点:
便于阅读、传递,便于大量印刷,成本低。 缺点:
信息存储密度低、分量重,体积大,收藏空间大, 保存期短,管理困难。
例如:图书、期刊、报纸以及各种印刷材料。
缩微型:

《网络信息资源检索》课件

《网络信息资源检索》课件

合法获取和使用
在使用网络信息资源时,应通过合法途径获取和 使用,避免使用盗版或非法获取的资源。
05
网络信息资源检索的发展趋势
个性化信息检索服务
总结词
个性化信息检索服务是一种基于用户兴趣和需求的信息检索方式,通过分析用户的历史搜索记录、兴趣偏好等信 息,为用户提供更加精准、个性化的搜索结果。
详细描述
信息排序
检索结果通常会按照相关度、时 间顺序等标准进行排序,以便用 户快速找到所需的信息。
02
网络信息资源检索工具
搜索引擎
搜索引擎定义
搜索引擎是一种网络信息资源检索工具,通过爬取互联网上的网 页信息,建立索引数据库,为用户提供关键词检索服务。
搜索引擎分类
搜索引擎可分为全文搜索引擎、元搜索引擎、垂直搜索引擎等类型 ,每种类型都有其特点和适用场景。
3
常用网络资源目录
常用的网络资源目录包括Yahoo目录、Open Directory等。
03
网络信息资源检索技巧
关键词选择与提炼
01
关键词是检索过程中最关键的要素,选择恰当的关 键词能够提高检索的准确性和效率。
02
关键词的提炼需要从信息主题、内容、特征等方面 进行提炼,以突出信息的核心内容。
03
常用特种文献数据库
常用的特种文献数据库包括万方数据、维普资讯、中国知网等。
网络资源目录
1 2
网络资源目录定义
网络资源目录是指将互联网上的各类资源进行分 类和整理,形成一个层次结构化的目录体系,方 便用户进行查找和检索。
网络资源目录特点
网络资源目录具有高度的组织性和分类性,能够 提供全面、系统的互联网资源检索服务。
图书馆资源

第二章 信息检索原理

第二章 信息检索原理
22
2013-11-4
2、主题语言 主题语言是直接以代表信息内容特征和科 学概念的概念词作为检索标识,并按字顺 组织起来的一种检索语言。 分为:规范主题语言和非规范主题语言
2013-11-4
23
1)、规范主题语言 • 以自然语言为基础,经过标准化、规范化处理 的词语,具有概念性、规范性、组配性、语义 性和动态性。
信息源 用户
信息分析、 著录、标引
检索语言 数据库
用户需求分析
信息的表示
存储
检索
检索提问式
匹配过程
输出检索结果
2013-11-4 4

信息检索的实质是一个匹配(match)的过程:
也就是信息用户的需求和信息集合的比较与选择,用户 根据检索需求,对一定的信息集合采用一定的技术手段, 根据一定的线索与准则找出相关的信息。
2013-11-4 27
第三节 检索途径
• 一、信息检索方法
• 二、信息检索途径
2013-11-4
28
1.信息检索的方法
顺查法:从过去某一时间起往现在检索
倒查法:从现在往过去逐年逐月地检索 用户注重新信息,如:写论文
常规法:
信 息 检 索 的 方 法
抽查法就是抽查某一时段的信息.在事 物发展的关键、鼎盛时期,用户注意的 是某些重要的、关键性信息资源
计算机检索简称“机检”,是利用计算机和一定的通信 设备查找所需信息的检索方式.
特点:速度快、效率高、查全较高,成本高,费用大,
查准率通常不尽人意, 现代信息检索即计算机信息检索,是指利用计算机和网 络来处理和查找文献信息的检索方式。目前广泛使用的 计算机检索系统包括光盘系统、联机检索系统和网络检 索系统。
2013-11-4 9

《网络信息资源检索》课件

《网络信息资源检索》课件
文搜索。
3 必应
微软推出的搜索引擎,注 重用户体验和视觉效果。
如何优化检索关键词
使用具体描述性词语,选择正确的关键词顺序,尝试使用相关词汇和同义词。
搜索引擎通常由爬虫、索引、排名等组成,通过收集、处理和展示信息。
检索词的选择与组合方法
选择准确且具体的检索词,使用布尔运算符和引号来组合或限定检索词的范围。
关键词搜索和全文搜索的区别
关键词搜索仅匹配检索词,而全文搜索会匹配整个文本内容,结果更全面但可能不准确。
常用的搜索引擎及其特点
1 谷歌
全球最大的搜索引擎,提 供广泛的信息检索。
《网络信息资源检索》 PPT课件
本课件将介绍网络信息资源检索的重要性以及相关技术和方法,帮助您更好 地利用搜索引擎和数据库来获得准确有效的信息。
什么是网络信息资源检索?
网络信息资源检索是通过使用搜索引擎和数据库等工具,寻找和获取互联网 上的各种信息资源的过程。
检索技术的发展历史
1
关键词检索
2
随着互联网信息爆炸增长,关键词检索
成为主要方法。
3
人工索引
早期检索技术主要依赖人工整理和分类 信息。
自然语言处理
利用机器学习和人工智能技术,使搜索 更智能化。
检索引擎的分类和作用
通用搜索引擎提供广泛的信息检索,如谷歌、。ຫໍສະໝຸດ
专业搜索引擎
针对特定领域的信息检索,如医学、法律。
元搜索引擎
整合多个搜索引擎的搜索结果。
检索引擎的原理和构成

信息检索教程(第二章)

信息检索教程(第二章)

4
(b)按收录文献出版形式分
●图书目录 ●期刊目录 ●会议论文目录 ●标准目录等。
(c)按物质形式划分
●卡片目录 ●书本目录 ●机读目录 ●联机公共检索目录等。
5
(2)图书馆目录、OPAC和联合目录概述
①图书馆目录
定义:它主要提供馆藏资源的检索,又叫馆藏目录,它反映
了一个图书馆的文献收藏情况,是一种重要的检索工具。
26
常用法示例
27
追溯法示例
28
2.3.2检索途径
29
30
1.分类途径
图书期刊分类法
世界三大图书分类法
《杜威十进分类法》(DDC)(Dewey decimal Classification ) 《国际十进分类法》(UDC)(Universal Decimal Classification) 《国会图书馆图书分类法》(LCC)(Library congress classification)
定义:所谓文献检索的方法,即查找文献的方法。有以下三种: 常用法:直接利用文献检索工具或检索系统来查找文献的方法,是 一种常规的科学检索方法。又称工具法或直接法。分为顺查法 、倒查法和抽查法。 追溯法:是一种跟踪查找法。它不利用检索工具只是利用文献(尤其 是评述性论文或专著) 后面所附的参考文献进行逐一地追踪查 找原文。又称引文法。 综合法:是常用法和追溯法的综合。利用检索工具或检索系统进行 常规检索,再利用文献后所附参考文献进行追溯检索,分期分 段交替使用这两种方法,直到满足要求为止。可以查得较全面 较准确,尤其适用于那些过去年代内文献较少的课题。称循环 法、分段法或交替法。
22
2.2.2检索工具的鉴别与评价
1.信息收录范围与信息质量

计算机基础与应用——02网络信息检索

计算机基础与应用——02网络信息检索
现 代 教 育 技 术 理 论 与 应 用
资源共享
• FTP
– FTP是文件传输协议(file transfer protocal)的缩 写,是一种重要的文件传输手段。通过FTP,可 以在因特网上的任意两台计算机之间互传文 件,而不管这两台计算机的硬件及操作系统 平台是否相同。 –习惯上,我们把从远程计算机(FTP服务器)向 本地计算机(客户机)传输即复制文件的过程称 为“下载”(Download),把从本地计算机向 远程计算机传输文件的过程称为“上 载”(Upload)。
– 特殊检索功能 • 自然语言(Natural Language)检索:直接采用自 然语言中的字、词或句子提问式进行检索。 • 多语种检索:提供多语言种类的检索环境供检索 者选择,系统可按指定的语种进行检索,并输出 相应的检索结果。 • 区分大小写的检索(Case-Sensitive):主要是针 对检索词中含有人名、地名等专有名词的检索。
邮件服务器B 客户机A
Internet
1
SMTP协议
3 POP协议
SMTP协议
2 邮件服务器A 客户机B
电子邮件的发送过程示意图
电子邮件系统的主要服务功能
(1)、既可以传递文本形式的邮件,也可以 传递声音、图形或影像格式的邮件。 (2)、可以把一封电子邮件同时发送给许多 接收者。 (3)、方便地存储(Save)、转发(Forward to)邮件和回复(Reply to)邮件。 (4)、可以定阅电子刊物。
二、信息检索策略
• 合理确定检索的关键词 • 采用选用适当的检索方法 – 分类目录检索 – 关键词检索 – 分类目录加关键词混合检索 – 多元引擎检索 • 检索结果的处理对策
• 常用的检索技巧 – 用搜索引擎检索到所需文档并连接到相关 网页后,有时会发现你所要的文件并没有 出现在当前屏幕中,这时简单的方法就是 在该网页中使用查找功能 。 – 一些常用网站的网址(URL)通常是可以 猜测出来的,当然首先需要我们了解URL 的基本组成,在需要时就可以“构造”出 这样一个网站的URL来。 – 在信息检索中,当一个很长的网址连接不 上时,可以试试“右切断网址”的方法, 从右至左依次删除网址中斜杠后面的内容, 直至链接成功。

2第二章 网络信息检索技术与搜索引擎

2第二章 网络信息检索技术与搜索引擎

检索式的编制,直接影响到检索质量、检索 效率和检索费用。要注意概念的分析,算符使用 正确但不能达到应有检索效果的例子很多。
例如,一个查找欧洲投资流向的题目,在列 出检索词时就存在整体与部分的关系,如果用 EUROPE AND INVESTMENTS去检索,就会有大量文 献漏检,原因在于“欧洲”指一个整体地理概念, 无法代表通常意义上的英、法等各发达国家,而 后者往其他国家和地区投资的情况正是我们所需 要 的 。 因 此 , 检 索 时 应 用 : ( EUROPE OR BRITAIN OR FRANCE OR ITALY OR SPAIN OR… ) AND INVESTMENTS。
二、网络信息高级检索技术
1 加权检索
加权检索的侧重点不在判定检索词或字符 串是否在文献记录中存在以及与其他的检索词 或字符串的关系,而在于判定检索词或字符串 在满足检索逻辑后对文献命中与否的影响程度, 它根据用户的检索需求来确定检索词,再根据 每个词在检索要求中的重要程度不同,分别给 予一定的数值(权重)加以区别,同时给出检 索命中界限进行限制。
如果用一个以上的代码,则用逗号隔开, 下面是较复杂的例子:
(business information/DE,TI OR business intelligence/ID,TI) AND PY=199? AND LA =English
各代码之间的关系可看作是“逻辑或”, 只要把字段代码加到检索词中,计算机就在 被指定的字段中进行查找,并将命中文献检 出。
采用“AND”(“ *”)算符时,检索式 写作 A AND B (即 A * B ),表明数据库中 同时有检索词 A 和 B 的记录才为命中记录。 逻辑与可增强检索的专指性,缩小检索范 围。 如“plant AND ecology”表示要求检 索出同时包含plant和 ecology的文献。

第2章网络信息检索

第2章网络信息检索

3.按组配方式划分 (1)先组式语言(Pre-coordination) (2)后组式语言(Post-coordination)
2.5.3分类语言
1.分类语言的概念 分类语言(Classification language)是 用分类号和类目来表达各种主题概念的检索语言。 它以学科体系为基础,将各种概念按学科性质和 逻辑层次结构进行分类和系统排列。分类语言的 具体表现形式主要是分类表。常见的分类法有 《中国图书馆分类法》、《中国科学院图书馆分 类法》(科图法)、《杜威十进分类法》(DDC)、 《美国国会图书馆分类法》(LC)。
基本部类
马克思主义、列宁主义、毛泽东思想、邓小平理论 哲学 社会科学
基本大类
A马克思主义、列宁主义、毛泽东思想、邓小平理论 B哲学、宗教 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理
自然科学
N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学、安全科学 Z 综合性图书
2.3.1数据库的含义
简单地说,数据库是依照某种数据模型组 织起来并存放于计算机存储设备中要的信息资源,也是信息检索的重要 资料来源。
2.3.2数据库的类型
1.按照数据库的内容与功能划分 (1)参考数据库(Reference Database) 指为用户提供信息线索的数据库,它可以指引用户获 取原始信息,有时又称为二次文献数据库,包括书目数据 库、文摘数据库和索引数据库。 (2)源数据库(Source Database) 指能直接提供原始资料或具体数据的数据库,包括数 值数据库、文本一数值数据库、全文数据库、术语数据库、 图像数据库和多媒体数据库等。 (3)混合数据库 指同时存储参考数据库和源数据库的数据库。

第2章 网络信息资源

第2章 网络信息资源
第2章 网络信息资源
• 网络信息资源极其丰富,包罗万象,其内 容涉及到所有专业领域,它是知识、信息 的巨大集合,是人类的资源宝库。同时, 网络的开放性与交互性使其成为全球范围 内传播和交流科研信息、教育信息、商业 信息和社会信息的最主要渠道。
2.1
网络信息资源的概念
• 2.1.1 网络信息资源含义 • 随着互联网发展进程的加快,信息资源网络化成为一大潮 流。与传统的信息资源相比,网络信息资源在数量、结构、 分布和传播范围、载体形态、内涵、传递手段等方面都显 示出新的特点。这些新的特点赋予了网络信息资源新的内 涵。作为知识经济时代的产物,网络信息资源也称虚拟信 息资源,它是以数字化形式将文字、图像、声音、动画等 多种形式的信息存储在光盘、磁盘等非纸张载体中,并通 过网络和计算机等方式再现出来的信息资源。从信息资源 建设的角度出发,网络信息资源不再是一个物理概念,也 不是独立存在的实体,而是一个跨国家、跨地区的信息空 间,一个网络信息资源库。
2.1.1 网络信息资源含义
• 网络信息资源含义,从广义上说,是指网 络信息活动中所有要素的总和,包括与网 络相关的信息内容、信息网络、信息人才、 信息系统、信息技术等资源;从狭义上说, 是指以数字化形式记录的,以多媒体形式 表达的,存贮在网络计算机磁介质、光介 质以及各类通讯介质上的,并通过计算机 网络通讯方式进行传递的信息内容的集合。
2.1.3 网络信息资源的类型
• 这种联机检索系统的优点和缺陷都十分明显。优点是整 个系统都在系统管理员集中管理下,安全可靠。缺点是主 机负担重,一旦出现故障,整个网络将瘫痪;网络扩展困 难;由于所采用技术标准不公开,因此相关技术缺乏发展 动力,灵活性差。 • 由于Internet网络的发展和冲击,传统的联机网络的局限 性日益明显,并严重制约其发展,大有不进而亡之势。经 过近几年的努力,世界知名的联机系统如Dialog, STN, Compuserve Amercian Online纷纷建立自己的WWW服 务器,开发Internet接口,改善用户界面,增加服务项目 与内容,将其服务对象从原来有限的用户扩大到世界各地, 大大增加了数据库的使用率。

2网络信息资源检索

2网络信息资源检索

3. 事实数据库(Factual database) :
指包含大量数据、事实,直接提供原始资料的数据库。 又分为数值数据库(Numeric database)、指南数据库 (directory database)、术语数据库(terminological database)等 4. 电子图书(electronic books) 指供在电脑上阅读的一种新型的数字化书籍, 是多媒体 技术和超文本技术发展的产物。一般有专用电子图 书阅读器。如:超星数字图书馆,中国数字图书馆 有限公司的网上图书馆,书生之家“中华图书网”, 方正Apabi电子图书
例: intelligent N1 robot* (OCLC FirstSearch )
3. Adj - adjacency
邻接算符,表示在此算符两侧的检索词必须按所列词序排列,不能 颠倒,两词之间不允许有其他的词或字母。相当于短语检索。
例: intelligent adj robot* 4. F - Field
所谓全文检索是利用文献记录中任何有实义的关键词、 词组或字符串作为检索词,词与词之间的位置关系可以用 位置运算符来表达。位置运算符的使用,进一步强化了对 概念的限制,比布尔逻辑运算符更能表达复杂的概念,并 避免AND逻辑组配产生的词义含糊或误检。
为了提高检索的广度和准确度,常常需要对检索词 之间的位置关系加以限定。 •**全文检索的运算方式,不同的检索系统有不同的规 定,主要差别有两点: • 规定的位置算符不同; • 位置算符的职能和使用范围不同。 下面介绍几种数据库经常使用的位置运算符:

网络信息资源检索的基本技术

布尔逻辑检索(boolean logic)
是当今检索理论中最成熟的理论之一,也是构造 检索表达式最基本、最简单的匹配模式。布尔逻 辑检索是通过布尔逻辑算符来实现的,这些运算 符能把一些具有简单概念的检索词(或检索项) 组配成为一个具有复杂概念的检索式,用以表达 用户的检索要求
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(3)网络信息资源按网络传输协议可划分为www、 Telnet、FTP、用户服务组、Gopher等信息资源。 ● www信息资源:是建立在超文本、超媒体技术以 及超文本传输协议的基础上,集文本、图形、图像、 声音为一体,并以直观的图形用户截面展现和提供信 息的网络资源形式。
● Telnet信息资源:指借助远程登录,在网络通信 协议(Telecom-munication Network Protocol)的 支持下,可以访问共享的远程计算机中的资源。
2、网络信息资源检索的特点 (1)信息检索空间的拓宽 (2)交互式作业方式 (3)用户界面友好且操作方便

3、网络信息资源检索工具 网络信息检索工具的类型: WEB资源检索工具、非 WEB资源检索工具。 其中WEB资源检索工具还可以分为: ①目录型网络检索工具 ②搜索引擎 ③多元搜索引擎

第3节

常见的目录型检索工具
1、概述 目录型网络检索工具,也称网络目录索引,顾名 思义就是将网站分门别类地存放在相应的目录中。
●工作原理:依靠专职编辑人员建,完全依赖手工操 作。用户(指网络上的各个网站的站长们)提交网站 后,目录编辑人员会亲自浏览所提交的网站,然后根 据一套自定的评判标准甚至编辑人员的主观印象,决 定是否接纳该网站,然后形成信息摘要,并将该站点 的信息放在相应的类别和目录中。所有这些收录的站 点同样被存放在一个“索引数据库”中。
雅虎口碑网是雅虎中国的一个特色产品。以全 网搜索为基础而打造出来的一个生活服务平台。雅虎 口碑网提供的检索为区域性的检索,它能对用户的 IP地址进行分析,确认用户所在地,并返回页面。 若用户想了解其他地方的资讯,可以点击页面左上角 的“切换城市”。 雅虎口碑网提供了分类极为细致的目录索引服 务,也提供了简单的搜索引擎服务。
●目录型网络检索工具所采用的分类法主要有:主 题分类法、学科分类法和图书分类法等。 ●优点:信息准确、导航质量高,分类浏览方式直 观易用 ●缺点:其数据库的规模相对较小,在某些主题下 收录范围不够全面,使检索到的信息数量有限;其更 新、维护的速度或周期要受系统人员工作时间的制约, 导致检索工具的新颖性不够,可能会产生一些“死链 接(Dead link)”。
雅虎口碑网
搜索引擎 服务
目录索引 服务
3、有道搜索(网易) “有道搜索”作为网易自主研发的全新中文搜索 引擎,它致力于为Internet用户提供更快更好的中文 搜索服务。它于2006年底推出测试版,2007年7月 正式成为网易旗下搜索引擎的内核,并 于2007年12月11日推出正式版。目前有道搜索已推 出的产品包括网页搜索、博客搜索、图片搜索、新闻 搜索、音乐搜索、 海量词典、桌面词典、工具栏和 有道阅读。 /about/productlist.html
第一节

网络信息资源
1、Internet(因特网)概述 因特网是英文Internet的中文译名,也有人译作互 联网或国际互联网。1997年7月18日,全国科学名词 审定委员会正式确定Internet译为因特网。
(1)Internet发源于美国国防60年代的研究计划。 (2)Internet遵循的是TCP/IP(也即传输控制协议/网 间协议),它是一种网络通信协议,它规范了网络上 的所有通信设备,尤其是一个主机与另一个主机之间 的数据往来格式以及传送方式。
ALEXA排名
Alexa是第三方网站流量统计机构。 Alexa原理:Alexa排名是“到达率”及“页面浏览量”决定,统计数 据包括一天、一周和三个月3个时间单位。 1)每百万到访人数:表示一百万个安装alexa工具条的用户中有多少 个访问了此站。而周、三月平均到达率是分别统计一周内及三月内的 日平均到达率。 2)平均页面浏览数:是安装alexa工具条用户对某个网站的页面浏览 数量,同一天内同一用户访问同一页面只计算一次。 “人均页面浏览数”是所有网站访问者一天内访问页面的平均数, 同一页面同一用户访问只算一次。 而周、三月平均浏览数是分别统计一周内及三月内的日平均浏览数 局限性:alexar排名只能对安装了alexa工具条客户端进行统计 /

SOSO导航
搜搜特色服务之一: 搜吧:搜吧是与搜索技术结合紧密的一种类似论 坛的社区,在搜吧里用户可以自由创建感兴趣的新版 面,在该版面的主题涵盖范围内畅所欲言,特色是进 入门坎低,发言自由自在,并与腾讯公司的其它服务 紧密结合。用户可以通过搜吧首页的“目录分类”导 航,选择所感兴趣的吧进入;也可以通过搜索引擎进 入相应吧(前提是此吧存在)。
第二章 网络信息检索
浙江大学宁波理工学院图书馆 乐思诗
在现在的网络信息环境下,网络信息资源是我 们学习、工作、生活中利用率最高的信息资源之一。 对网络信息资源的利用是终身学习的需要,也是个人 信息素养中的重要内容。 因此,本章节将为大家介绍如何充分发挥网络 信息资源的重要作用,并能迅速在上百万个网站中快 速有效地查找到所需信息。
2、网络信息资源的特点 (1)信息的开放性 (2)信息来源丰富 (3)信息内容多样性 (4)信息表现形式多样化 (5)免费信息资源丰富 (6)信息传播速度快

(7)信息交互性 (8)信息承载平台的多样性 (9)信息关联性 (10)信息组织的局部有序性与整体无序性
3、网络信息资源的分类 网络信息资源可按照信息来源、信息载体或网络传输协 议来分类。 (1)网络信息资源按信息来源可分为:政府、公众、商用 等信息资源。 ●政府信息资源:由各国政府在网络上发布有关该国家 与政府的各种公开信息。 ● 公众信息资源:为社会公众服务的机构所拥有信息资 源。
第二节

网络信息资源检索
1、网络信息资源检索概述 (1)网络信息资源检索的作用 ① 能比较全面地掌握有关的网络信息 ②能提高网络信息利用的效率,节省时间与费用 ③能提高人才的信息素质,加速成才
(2)网络信息资源检索的方式 ①浏览 ②借助网络目录索引查找信息 ③利用搜索引擎进行信息检索 ④在线数据库查询

●商用信息资源:由商情咨询机构或商业性公司拥有 的并负责发布的各类信息。 ●教育科研信息资源:由各类教育科研机构或网上数 据库拥有并负责发布的各类信息。 (2)网络信息资源按信息载体可划分为电子邮件型、 图书馆目录、书目与索引、全文资料及电子出版物、 数据库、新兴资源等信息资源。 ● 新兴资源:包括网上论坛信息资源、博客信息资 源、问答互动平台信息资源等等。



PR值查询网站 / /Ranks/ /pr/ 提高PR值

内容丰富。一个500页的网站和一个有5000 页内容的网站的PR值显然会有所不同 网站持续更新 被更多的网站链接 网页中的内容的独特性等。
爱问的特色服务之一: “爱问”共享资料-- “iShare”资料共享平台 用户可以从这里找到由其他网友提供的各种各 样的资料,如合约合同范本、音乐录音带、教育资料, Flash短片或小游戏等。 网友必须注册,并使用用户名、密码登录后方可 使用iShare的各种资料。
爱问--共享资料
爱问的特色服务之二: 知识人--中文互动问答平台 用户如有疑难问题,可以选择先在已有问题中 搜索,看是否已经有了现成的答案;如果没有,用户 可以发出提问,等待其他用户的回答。 “知识人”将已有问题进行了详细的分类,用 户可根据这个目录索引逐层找到自己所需的答案。

有道全部服务
有道搜索最大的特点是:鼠标移动到某个搜索结 果网页地址前的“预览”图标,本页窗口会弹出一 个预览文本框。在预览文本框中快速浏览结果页面的 文本信息后,用户就能判断是否需要点击链接访问该 网页。
有道的搜索结果预览
4、搜狗(搜狐) 搜狗是搜狐公司于2004年8月3日推出的全球首 个第三代互动式中文搜索引擎,域名为 。目前搜狗搜索引擎的中文网页收 录量达到100亿,平均每天更新5亿网页。 搜狗的产品线还包括了网页应用和桌面应用两大 部分。
2、雅虎中国(YAHOO!) 雅虎()是世界上最早的搜索引 擎之一,雅虎拥有一流的Web目录和较佳的新闻链 接以及许多附加服务。有10余种语言版本,各版本 的内容互不相同。提供类目、网站及全文检索功能。 目录分类比较合理,层次深,类目设置好,网站提要 严格清楚。

雅虎口碑网
爱问--知识人
6、搜搜(腾讯) 搜搜()是腾讯旗下的搜索网站, 是腾讯主要的业务单元之一。网站于2006年3月正式 发布并开始运营。搜搜目前主要包括网页搜索、综合 搜索、图片搜索、音乐搜索、论坛搜索、搜吧等16 项产品,通过Internet信息的及时获取和主动呈现, 为广大用户提供实用和便利的搜索服务。

搜狗提供的全部服务
搜狗网址导航
5、爱问(新浪) “爱问iAsk”(/)是新浪完全 自主研发的搜索产品,采用了智慧型互动搜索技术, 为广大网民提供了较为人性化的搜索服务。 “爱问”提供了网页、新闻、博客、音乐、图片、 地图、知识人、资料等信息的检索服务。

新浪“爱问”
4、网络信息资源的评价 网络信息资源的统一评价指标 (1)可靠性:信息提供者、元信息 (2)精确性:时效性、全面性、服务对象及目的 (3)合理性:引用数据或事实的准确性、客观 (4)便利性 (5)支持情况:信息来源、外链 (6)网站的服务连续性和安全性

谷歌网页级别

谷歌网页级别即PageRank(PR),又称网页排名,是谷歌的专利技术。与文 献计量学中的引文分析相似,即它基于这样的假设:论文被引用的次数越高, 它的学术价值就越大。 谷歌通过计算PageRank(PR) 对网站(网页)进行评价,PR值一般为0~10 之间,数字越大,网站(网页)的重要性或权威性越高。 在网站(网页)总量一定的前提下,PR值在总体上保持“能量守恒”,即当一 个网站的PR值上升后,总有一个网站的PR值会下降。 PageRank 技术是通过对由超过 50,000 万个变量和 20 亿个词汇组成的方程进 行计算,PageRank 能够对网页的重要性做出客观的评价。PageRank 并不计 算直接链接的数量,而是将从网页 A 指向网页 B 的链接解释为由网页 A 对网 页 B 所投的一票。这样,PageRank 会根据网页 B 所收到的投票数量来评估该 页的重要性。此外,PageRank 还会评估每个投票网页的重要性,因为某些网 页的投票被认为具有较高的价值,这样,它所链接的网页就能获得较高的价值 。重要网页获得的 PageRank(网页排名)较高,从而显示在搜索结果的顶部 。谷歌技术使用网上反馈的综合信息来确定某个网页的重要性。搜索结果没有 人工干预或操纵,这也是为什么谷歌会成为一个广受用户信赖、不受付费排名 影响且公正客观的信息来源。
相关文档
最新文档