16因特网信息资源检索概述v3

合集下载

因特网信息资源检索

因特网信息资源检索

三部分的作用
1.搜索器:负责定期地自动到各个网站上, 1.搜索器:负责定期地自动到各个网站上, 搜索器 把网页抓下来,并顺着页面上的链接, 把网页抓下来,并顺着页面上的链接,持 续不断地抓取网页。 续不断地抓取网页。 2.索引器:把搜索器抓来的网页进行分析, 2.索引器:把搜索器抓来的网页进行分析, 索引器 按照关键词进行索引, 按照关键词进行索引,并存入服务器的数 据库中。 据库中。 3.检索器:面向用户, 3.检索器:面向用户,接受用户提交的查 检索器 询字串,在索引数据库中查询,并将查询 询字串,在索引数据库中查询, 结果反馈给用户。 结果反馈给用户。

小结
本节课我们主要学习了全文搜索引擎和目 录搜索引擎的工作原理, 录搜索引擎的工作原理,希望同学们好好 理解☺ 理解☺
判断题
1.常用的两种搜索引擎是目录类搜索引擎和元搜索引擎。 1.常用的两种搜索引擎是目录类搜索引擎和元搜索引擎。 常用的两种搜索引擎是目录类搜索引擎和元搜索引擎 ( ) × 2.为了适应不同搜索群体的需要, 2.为了适应不同搜索群体的需要,许多搜索引擎一般都提 为了适应不同搜索群体的需要 供多语种检索功能。( 供多语种检索功能。 ) ∨ .通过专业搜索引擎获得的信息资源一般来说比较权威 通过专业搜索引擎获得的信息资源一般来说比较权威。 3 .通过专业搜索引擎获得的信息资源一般来说比较权威。 ( ) ∨ 4.元搜索引擎的搜索范围可以是多个搜索引擎的数据库, 4.元搜索引擎的搜索范围可以是多个搜索引擎的数据库, 元搜索引擎的搜索范围可以是多个搜索引擎的数据库 而不局限于某一搜索引擎的数据库内。( ) ∨
3.4搜索引擎的发展趋势 搜索引擎的发展趋势
1、多媒体信息检索
传统的多媒体数据库中, 传统的多媒体数据库中,除了文本和数字还包括 图形、图象、声音、视频、动画等各种媒体组合。 图形、图象、声音、视频、动画等各种媒体组合。但 多媒体信息具有丰富的内涵, 图象的颜色、纹理、 多媒体信息具有丰富的内涵,如:图象的颜色、纹理、 形状,动画中的运动、声音和音调等 例如歌曲的旋 形状,动画中的运动、声音和音调等。例如歌曲的旋 音调、音质等难以用文字描述 等难以用文字描述。 律、音调、音质等难以用文字描述。这正是基于内容 的音频检索需要研究和解决的问题, 的音频检索需要研究和解决的问题,以期达到更深的 检索层次和更好的检索效果。 检索层次和更好的检索效果。

1.3因特网信息资源检索-教科版高中信息技术选修三教案

1.3因特网信息资源检索-教科版高中信息技术选修三教案
三、特色信息检索工具以及其他信息检索工具
教师讲解:除了上述搜索引擎以外,还有一些其他的搜索引擎。如特色信息搜索引擎、一些专业性质的搜索引擎,还有以FTP、Telnet、Usenet等资源为检索对象的搜索引擎。
例:北大天网既提供因特网信息资源检索,也以因特网形式提供FTP文件检索。
最早的FTP搜索引擎是基于文本显示的Archie。
教学反思
(2)专业垂直搜索引擎
垂直类搜索引擎只面向某一特定的领域,专注于自己的特长和核心技术,能够保证对该领域信息的完全收录与及时更新。
五、信息检索工具的工作原理
1、全文搜索引擎工具的工作原理:
组成:搜索器、索引器、检索器。(如右图)
2、目录索引类搜索引擎的基本工作原理:
以人工方式采集和存储网络信息,依靠手工为每个网站确定标题,并给出大概的描述,建立关键词索引,将其放入相应的类目体系中。
四、因特网信息检索发展趋势
1、教师提问:现在几乎每个大型网站都有自己的搜索引擎,搜索引擎在短短的时间发展速度非常快。随着科学的进步,搜索引擎将来会是什么样子,会有什么发展趋势呢?
2、任务:阅读课本P21-22“因特网信息检索发展趋势”部分内容,了解其发展趋势。
3、总结:
(1)多媒体信息检索
在多媒体数据库中,除了传统的文本和数字外,还包括图形、图像、视频、音频、动画以及各种媒体的组合。
新课教学:
一、目录类搜索引擎和全文搜索引擎
1、教师通过总结观察同学们的搜索情况:
发现大部分同学都用搜狐、新浪等网站上的一些目录来进行信息的搜索,或者用、Google等搜索网站进行搜索。
2、得出结论:
大部分同学采用的是最常见的两大类搜索引擎,即目录索引类搜索引擎(如:搜狐、常用因特网信息检索工具的使用方法

因特网信息检索与应用3

因特网信息检索与应用3

7.2.1 Outlook Express 功能简介
Outlook Express提供了方便的信函编辑功能,在信函 Word 中可随意加入图片,文件和超级链接,如同在Word中编 辑一样;多种发信方式,可立即发信,延时发信,信件 暂存为草稿等方式;同时管理多个E-mail帐号,如果你有 多个邮件帐号,可以方便管理;可通过通讯簿存储和检 索电子邮件地址;提供信件过滤功能。
1、认识Outlook Express窗口 、认识 窗口 双击桌面上的Outlook Express图标,打开Outlook Express 之后,会出现一个主窗口 。
2、定制Outlook Express窗口 、定制 窗口
(1)打开“查看” 下拉式菜单,执行“布局”菜单 命令,打开Outlook Express窗口布局对话框 。 (2)设置Outlook Express的布局,其中前面复选框中 打勾的为在Outlook Express窗口中显示的内容。根据需 要进行调整,做出最适合你工作风格的界面来。
6、预订新闻组 、 在添加新闻服务器时,Outlook Express 会提示用户预订 该服务器上的新闻组。预订的好处在于,预订后的新闻组将 包含在文件夹列表中,便于访问。可以按照以下方式预订新 闻组: (1)单击文件夹列表窗中的服务器名,然后单击工具栏 上的“新闻组”按钮。单击要预订的新闻组,然后单击“预 订”即可。 (2)在查看未预订的新闻组时,可单击“工具”菜单, 然后单击“新闻组”。在文件夹列表中单击新闻组即可查看 预订的新闻组。如果要取消对新闻组的预订,可单击工具栏 上的“新闻组”按钮,选择所需的新闻组,然后单击“取消 预订该新闻组”即可。
配置邮件帐号包括用户名、密码、电子邮件地址、POP3 邮件服务器(邮件接收服务器)地址、SMTP服务器(邮件发 送服务器)地址。

Internet信息资源及其检索

Internet信息资源及其检索

第5章 Internet信息资源及其检索5.1 Internet信息资源1. Internet信息资源特点Internet上的信息资源具有以下特点:1) 信息源丰富Internet是个开放的信息传播平台,任何机构、任何人都可以将自己拥有的且愿意让他人共享的信息上网。

在这个庞大的信息供应源中,起主导作用的主要有:公共图书馆、网络信息服务商、传统媒体、传统联机服务商、高等院校、科研机构、各类商业公司等。

2) 信息内容多样性网络是信息的载体,信息是网络的灵魂。

没有信息,网络就没有使用价值。

Internet 是信息的海洋,信息内容几乎无所不包。

有科学技术领域的各种业信息,也有与大众日常生活息息相关的信息;有严肃主题信息,也有体育、娱乐、旅游、消遣和奇闻趣事;有历史档案信息,也有显示现实世界的信息;有知识性和教育性的信息,也有消息和新闻的传媒信息;有学术、教育、产业和文化方面的信息,也有经济、金融和商业信息。

3) 信息表现形式多样化Internet是一个集声音、图像、文字、照片、图形、动画、电影、音乐为一体的包罗万象的综合性信息系统。

你可以伴着优雅的音乐,循着链路随意在网上漫游,看看精美的网页、阅读精彩的文件,使学习成为一种浪漫、愉快的旅程。

4) 信息时效性利用Internet信息制作技术,能很快地将信息传播到世界各地。

由于几乎在事件发生的同一时间内,就能将信息快速制作、上网,因此,网上信息的更新周期短、内容新颖。

5) 信息交互性Internet是交互性的,不仅可以从中获取信息,也可以向网上发布信息。

Internet提供讨论、交流的渠道。

在Internet上可以找到提供各种信息的人:科学家、工程技术专家、医生、律师、教育家、明星以及具备各种专长和爱好人们;也可以找到一些专题讨论小组,通过交流、咨询获得专家和其他用户的帮助,同时也可发表个人的见解。

6) 信息关联性Internet的信息组织是基于超文本的,因此,有关联的信息之间通过链接形成一个相互联系的信息渠道,人们可以由此及彼、由远而近、顺藤摸瓜、找到想要的信息。

因特网信息资源检索

因特网信息资源检索
因特网信息资源检索
因特网中的信息检索 信息检索工具的工作原理
目录索引类与全文搜索引擎
常用的搜索引擎:目录索引类搜索引擎、全文 搜索引擎。
目录索引类搜索引擎:雅虎、新浪、搜狐等 全文搜索引擎:Google、等 练习分别用和新浪搜索下面几项:
任务一:金庸的简介 任务二:金庸的第一部作品 任务三:金庸总共写了几部作品 任务四:《天龙八部》是金庸的第几部作品
全文搜索引擎的工作原理 搜索引擎的工作包括如下三个过程: 一是搜索器在因特网中发现、搜集网页信息 网页快照:每一张被复制下来的网页叫做一张网 页块照,并存储在搜索服务器数据库中.网页被删 除用户可以从搜索服务器中取出 二是索引器对所搜集的信息进行提取和组织,并 建立索引库 三是由检索器根据用户输入的查询关键词,在 索引中快速检出相关文档,进行文档与查询内 容相关比较,对人、检出的结果进行排序、并 将查询返回给用户
目录索引类搜索引擎的基本工作原理
目录索引类搜索引擎一般采用人工方式采集和 存储网络信息,依靠手工为每个网站确定一标 题,并给出大概的描述,建立关键字索引,将 其放入相应的类目体系中。
任务五ቤተ መጻሕፍቲ ባይዱ令狐冲、任我行是金庸哪一部作品 中的构画的人物?
任务六:金庸的写作风格。
特色信息检索工具
综合信息检索范围比较广,如查找图片、音频 资料等,则用其中的一项功能
专业性质的搜索引擎,主要搜索社会科学信息
其他信息检索工具
用于搜索FTP、Telnet、Usenet等资源检 索,如:北大天网、Archie

元搜索引擎
元搜索引擎可调用多个搜索引擎,扩大检索范围,提高 检索的全面性,但速度较慢
因特网信息检索发展趋势
1.多媒体信息检索 2.专业垂直搜索引擎

Internet 信息资源检索

Internet 信息资源检索
技术(北京)有限公司, 随后于同年10月成立了深圳分公司,20080%的市场份额。其功能完备,搜索精度高,除 数据库的规模及部分特殊搜索功能外,其他方面 可与当前的搜索引擎业界领头人物Google相媲美, 在中文搜索支持方面有些地方甚至超过了Google, 是目前国内技术水平最高的搜索引擎。 搜狐、新浪、263、Tom、21CN、广州视窗等搜 索引e的 全文搜索服务)。
主要功能
手气不错
• 按下“手气不错”按钮将自动进入 Google 查询到的第一个网页。 您将完全看不到其它的搜索结果。如:输入中央电视台,会直接转 到中央电视台的网站。
网页快照
• Google 在访问网站时,会将看过的网页复制一份网页快照,以备在 找不到原来的网页时使用。单击“网页快照”时,您将看到 Google 将该网页编入索引时的页面。Google 依据这些快照来分析网页是否 符合您的需求。 • 在显示网页快照时,其顶部有一个标题,用来提醒您这不是实际的 网页。符合搜索条件的词语在网页快照上突出显示,便于您快速查 找所需的相关资料。 • 尚未编入索引的网站没有“网页快照”,另外,如果网站的所有者 要求 Google 删除其快照,这些网站也没有“网页快照”。
大多数的搜索引擎依靠少量大型服务器, 这样,在访问高峰期速度就会减慢,而 Google 却利用相互链接的 PC 来快速查找 每个搜索的答案。 这一创新技术成功地缩 短了响应时间,提高了可扩展性,并降低 了成本。这也是其他公司一直在效仿的技 术。
网站排名
Google检索到的网站排名是按照网站的被链接数量由高到低 排列,不存在人为的干预因素。因此最先出现的往往都是质 量较高的网站。 PageRank 技术:通过对由超过 50,000 万个变量和 20 亿 个词汇组成的方程进行计算,PageRank 能够对网页的重要 性做出客观的评价。PageRank 并不计算直接链接的数量, 而是将从网页 A 指向网页 B 的链接解释为由网页 A 对网页 B 所投的一票。这样,PageRank 会根据网页 B 所收到的投 票数量来评估该页的重要性。 此外,PageRank 还会评估每个投票网页的重要性,因为某 些网页的投票被认为具有较高的价值,这样,它所链接的网 页就能获得较高的价值。重要网页获得的 PageRank(网页 排名)较高,从而显示在搜索结果的顶部。Google 技术使 用网上反馈的综合信息来确定某个网页的重要性。搜索结果 没有人工干预或操纵,这也是为什么 Google 会成为一个广 受用户信赖、不受付费排名影响且公正客观的信息来源。

信息资源检索基础知识

信息资源检索基础知识

记录号
•题录著录格式 如下:
题名
著者姓名
030301007 网络时代的管理创新/高维钫(北京 邮电大学文法经济学院)//经济管理.—— 2002,13(6),53-55
著者可单编辑位版
原文出处
11
与目录区别 目录 题录
著录对象不同 单位出版物
单篇文献
可编辑版
12
不仅描述文献的外表特征,而且
文摘
还揭示文献的内容特征,是带有 文摘内容的、扩展了的题录 。
可编辑版
7
2、信息资源检索系统的类型
目录、题录、文摘、参考工具、全文数据库和搜索引擎
按著录方式划分 手工检索系统、计算机检索系统、 按存储介质划分 穿孔卡片系统、缩微品检索系统
按检索手段划分
脱机检索系统、联机检索系统、 光盘检索系统、网络检索系统
可编辑版
8
目录
是对一批相关文献外表特征的揭示 和报道,是有序的文献清单。
U 交通运输
I 文学
V 航空、航天
J 艺术
X 环境科学、安全科学
K 历史、地理
Z 综合性图书
可编辑版
35
C 社会科学总论
C8 统计学
C91 社会学
C92 人口学
C93 管理学
C931 管理技术方法
.1
管理数学
.2
管理的方式方法
……
C933 领导学
C934 决策学
C935 管理计划和控制
C936 管理组织学
可编辑版
48
一、检索策略与检索步骤
1、检索策略
广义
为实现检索目标而制定的全盘计划或
方案
狭义
检索式
可编辑版

因特网信息资源检索-PPT课件

因特网信息资源检索-PPT课件

选择“教 育”类目
没找到“高考”, 就找 “教育”里 跟接近“高考” 的“中小学教育”
找到啦!
按关键词语查找搜索:
注意啦,要先 在这里输入关 键字!
有关内容了!
全文搜索引擎的工作原理
工作 原理
搜索引擎是如何搜索信息的呢? 你听说过“网络机器人”、“爬虫”、“蜘蛛” 吗? 他们只是搜索引擎的一个部分,叫“搜索器”
发展 趋势
专业垂直搜索引擎
专业垂直类搜索引擎只面向某一个特定的领域,专 注于自己的特长和核心技术,能够保证对该领域信 息的完全收录和及时更新。
(2)网络目录: 按主题性质分类 先分领域,后分各科专 以某种分类体系为依据 题 ,最后列出网站 形成由信息链组成的树状结构 即总目录——专题目录——链接——网站
特点和区别
目录索引
无需输入关键字,可通过浏览主 题了解某一主题的相关资源
人工采集并存储网络信息 网页内容丰富、学术性较强 维护费用大、更新速度慢
搜索引擎(Search Engine)是一种用于帮助因特网用户查询信息 的搜索工具,它以一定的策略在因特网中搜集、发现信息,对信息 进行理解、提取、组织的处理,并为用户提供检索服务,从而起到 信息导航的目的。
全文搜索引擎
信息 检索
sogou
目录索引类搜索引擎
sina
按目录类别查找搜索:
比如:查高考资料
元搜索引擎在搜索的时候,用户只需提交一次搜索请求, 而且可以同时搜索多个数据库,并根据多个搜索引擎的 检索结果进行二次加工,如对检索结果进行重排和标明 检索结果来源等,输出给用户。 缺点:一般支持AND、OR、NOT等操作,一般只使用 简单、直接的搜索策略,并且检索速度也慢。
当我们查找图片、音频等信息时,使用综合信息检 索引擎通常会找到很多无用的信息,所以搜索效率和有 效性都不高。这时,就可以使用特色搜索引擎(有时是 综合信息检索工具中的一个功能),特色检索工具专门 搜集某一类的信息资源,内容丰富,数据量大,能帮助 我们迅速找到一些有用的信息。

因特网信息资源检索

因特网信息资源检索
特色的,也可以用综合搜索引擎的 某个功能
专业搜索引擎
元搜索引擎
精品课件
四、网上信息检索技巧
1、使用空格 输入更多的关键词,只要在关键词中间留空格, 这相当于多个关键词之间的关系是逻辑“与”。 练习1,查找“出门在外”的歌曲
2、使用减号. 要避免搜索某个词语,可以在这个词前面加上 一个减号(“-”, 英文字符).但在减号之前必须留一 空 格.如要了解搜索引擎历史,可以这样输入关键字:搜 索引擎 宗教 -佛教 -基督教
精品课件
1.3因特网信息资源检索
常用元搜索引擎 1、Ithaki ( /dir.html) 支持包括中文在内的14种语言检索。 2、Ixquick ( /) 可搜索网站、MP3、新闻、图象等多种网络资源 3、qbSearch /) 4、Turbo10 /) 5、Dogpile /) 6、Webcrawler /) 7、 /)
精品课件

目录索引类搜索引擎的基本工作原理
目录索引类搜索引擎一般采用人工方式采集和存储网络信息,依靠 手工为每个网站确定 一个标题,并给出大概的描述,建立关键字索引, 将其放入相应的类目体系中。
特点:在查询信息时,不用事先确定信息检索目标(即关键词), 可以通过浏览主题了解某一主题的相关资源。 优点:目录索引类搜索引擎的网页由人工精选,网页内容丰富,学 术性较强。 缺点:更新速度慢。
精品课件
下列不属于元搜索引擎特点的是( A )。 A.搜索时,用户必须多次提交搜索请求 B.可同时搜索多个数据库 C.一般支持AND、OR、NOT等操作 D.一般只使用简单、直接的搜索策略
精品课件
三、因特网资源检索策略
搜索内容
一般信息资源 图片、视频 专业性较强
全面了解网上信1.3因特网信息资源检索

英特网资源检索-3

英特网资源检索-3

常见问题
如何缩小搜索范围 “and”或“or”无效 and” or” 需要输入完整的词语 英文字母大小写是否有影响
高级检索及服务功能
搜索图片功能 大学搜索 页面翻译 网上论坛 “年度排行榜” 年度排行榜”
Google的特色功能 Google的特色功能
查找特点类型的文件“ filetype:” 查找特点类型的文件“ filetype:”
目录索引式搜索引擎
这种搜索引擎是以人工方式或半自动方式搜集信 息,由编辑人员查看信息之后,人工形成信息摘要, 并将信息置于事先确定的分类框架中。信息大多面 向网站,提供目录浏览服务和直接检索服务 特点:目录索引式搜索引擎虽然有搜索功能,但仅 仅是按目录分类的网站链接列表而已,用户完全可 以不用进行关键词查询,仅靠分类目录也可以找到 需要的信息。 代表:Yahoo、搜狐、新浪、网易等 代表:Yahoo、搜狐、新浪、网易等
元搜索引擎
是在接受用户查询请求时,将用户的查询请求同 时在其他多个引擎上进行搜索,将返回的结果进 行重复排除、重新排序等处理后,作为自己的结 果返回给用户,服务方式为面向网页的全文检索。 优点:返回结果的信息量更大、更全 缺点:用户需要做更多的筛选 代表:Dogpile、Vivisimo、infoSpace、搜星等 代表:Dogpile、Vivisimo、infoSpace、搜星等
支持13种非html文件的搜索 支持13种非html文件的搜索
计算器 链接搜索“ link:” 链接搜索“ link:” 指定网域 “site:” site:” 错别字改正
中英文字典 天气查搜索引擎
Altavista Infoseek
网络资源目录
搜狗 – Sogou 新浪 Yahoo
搜索技巧简介

因特网信息资源检索 因特网中的信息检索

因特网信息资源检索  因特网中的信息检索

编号:005备课时间:课题:因特网信息资源检索因特网中的信息检索课型:新授课课时:1教学目标1.了解常用的因特网信息检索工具的类型。

2.掌握常用因特网信息检索工具的使用方法,能熟练使用检索工具获取所需信息。

3.了解因特网信息检索发展趋势。

内容分析:本节全面介绍了各种搜索引擎及其发展趋势。

该部分首先创设了一个情境:为让更多的人了解北京、支持北京 2008 年奥运会,我们需要搜集相关资料,然后以该搜索活动为工作主线,将各种检索工具的介绍串连起来。

元搜索引擎是一个较新的内容,通过学习需要学生知道元搜索引擎的工作方法和产生的意义,从而进一步领略人类在网络信息处理中表现出来的聪明才智。

方法策略:本节主要介绍了各种搜索引擎及其发展趋势、各种搜索引擎的特点。

教学中可采用任务驱动法,教师可利用教材中创设的情境,提出搜索任务,从具体的任务中让学生了解各种不同的搜索引擎,并体验利用不同搜索引擎搜索同一类信息时的不同效果。

对搜索引擎发展趋势的介绍是为了让学生了解一些前沿知识,提高学习兴趣,激发学习热情,这部分内容的教学可以通过简单的实例外加学生的阅读来完成,也可以补充一些相关资料。

教学过程:1.情境引入“五一黄金周”就要到了,同学们计划去青岛好好放松一下。

为了做好充分的准备,陈菲等同学决定在班级网站上介绍一下青岛城市概况和青岛主要风景区的相关文字、图片资料以及一些多媒体材料等。

那么,陈菲他们怎样才能快速而全面地搜索所需的资料呢?2.讲授新知环节一目录类搜索引擎和全文搜索引擎的讲授(1)教师通过总结观察同学们的搜索情况发现大部分同学都用搜狐、新浪等网站上的一些目录来进行信息的搜索,或者用百度、Google 等搜索网站进行搜索。

图 1-1 目录搜索引擎页面举例图 1-2 输入检索关键字的百度首页(2)得出结论大部分同学采用的是最常见的两大类搜索引擎,即目录索引类搜索引擎(如:搜狐、新浪等网站上的一些目录)和全文搜索引擎(百度、 Google 等搜索网站)。

课件2:因特网信息资源检索

课件2:因特网信息资源检索

1.3因特网信息资源检索
五. 因特网信息检索发展趋势

(1)多媒体信息检索 (2)专业垂直搜索引擎

课堂总结

这节课我们学习了两大知识点:一是信息检索 的方法;二是搜索引擎特点及工作原理,这一 部分是我们这节课的重点,也是难点,只有你 真正理解了它们工作的原理,我们才会真正能 够根据不同查询要求,综合并灵活使用各种检 索工具,准确、高效地获取我们所需要的信息 ,这也是我们课标所要求的。
注意的问题

搜索引擎并不真正搜索互联网,它搜索的 实际上是预先整理好的网页索引数据库。 搜索引擎,也不能真正理解网页上的内容 ,它只能机械的匹配网页上的文字。
因特网信息资源检索
1.目录索引类搜索引擎
2.全文搜索引擎
3.特色信息检索工具 4.其它信息检索工具 5.元搜索引擎
1.3因特网信息资源检索
雅虎 ()
搜网 ()
1.3.2信息检索工具的工作原理
目录索引类搜索引擎的基本工作原理
目录索引类搜索引擎一般采用人工方式采集和存储网络信息,依靠 手工为每个网站确定 一个标题,并给出大概的描述,建立关键字索引, 将其放入相应的类目体系中。 特点:在查询信息时,不用事先确定信息检索目标(即关键词), 可以通过浏览主题了解某一主题的相关资源。 优点:目录索引类搜索引擎的网页由人工精选,网页内容丰富,学 术性较强。 缺点:更新速度慢。
1.3因特网信息资源检索
5.元搜索引擎
元搜索引擎——这是一种搜索引擎之上的(强调逻辑关系、逻辑结构)搜 索引擎,它可以同时检索多个成员搜索引擎的数据库。
一般的网络检索工具局限在本引擎的数据库内进行搜索,由于不同的
搜索引擎各自的信息收集方式和范围、检索算法和结果排序方法都各不 相同,因此检索结果也不尽相同。为了获得较好的结果,1995年出现了 元搜索引擎,元搜索引擎能方便地检索多个搜索引擎,扩大检索范围, 提高检索的全面性。但是由于元搜索引擎出现的时间短,一些搜索引擎 强大的检索功能还不能实现。

因特网信息检索

因特网信息检索
1.搜索器:负责定期地自动到各个网站上, 把网页抓下来,并顺着页面上的链接,持 续不断地抓取网页。
2.索引器:把搜索器抓来的网页进行分析, 按照关键词进行索引,并存入服务器的数 据库中。
3.检索器:面向用户,接受用户提交的查 询字串,在索引数据库中查询,并将查询 结果反馈给用户。
全文搜索引擎的工作原理:
目录式搜索引擎 ---分类检索
利用罗列目录的方式引导搜索者依据目 录查找需要的信息。
特色信息检索工具:
虽说现在网上可选的搜索引擎也不少,但更多 的都像是一个大商场,难以搜索到一些针对性很 强的信息。其实,在搜索引擎的世界里,也有不 少像外面“精品店”一样的特色搜索引擎,灵活 地使用它们,一定能够让您先人一步地找到自己 想要的资料。
目录索引类搜索引擎最大的缺点: 分类具有主ห้องสมุดไป่ตู้性,花费时间多,更 新速度慢。
真正的高手不是拥有很多的检索工具 知识,也不是知道最多的检索技巧, 而是那些能够根据不同查询要求,综 合并灵活使用各种检索工具,同时对 所要检索的内容有一定了解的人。
目录索引类搜索引擎
目录索引类搜索引擎一般采用人工方式采 集和存储网络信息,依靠手工为每个网络 确定一个标题,并给出大概的描述,建立 关键字索引,将其放入相应的类目体系中。
目录索引类搜索引擎一般为一条链状组成 树型结构:
总目录 专题目录 链接 网站
目录索引类搜索引擎最大的特点 就是在查询信息时,事先可以没有 特定的信息检索目标(关键词), 通过浏览主题了解某一主题的相关 资源。
下面以“北大天网”为例。
北大天网既提供因特网信息资源检索, 也以因特网形式提供FTP文件检索
搜索引擎的发展趋势
1、多媒体信息检索
传统的多媒体数据库中,除了文本和数字还包括 图形、图象、声音、视频、动画等各种媒体组合。但 多媒体信息具有丰富的内涵,如:图象的颜色、纹理、 形状,动画中的运动、声音和音调等。例如歌曲的旋 律、音调、音质等难以用文字描述。这正是基于内容 的音频检索需要研究和解决的问题,以期达到更深的 检索层次和更好的检索效果。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

因特网信息检索的特点
1 分布地域广,检索范围广泛、全面
因特网信息检索的特点
2 超文本检索,具有交互式作业的特点
超文本的信息资源通过网上各节点的链路把 相关信息或图标有机地链接成一个网络结构, 用户可以从任何一个节点开始阅读文档
因特网信息检索的特点
3 检索内容新、实时性强、传播速度快
因特网信息检索的特点
传统网络信息服务工具
【文件传输服务】
是在网络通讯协议FTP的支持下实现的一种本地计算机和远程服务器之间 的文件传送
传统网络信息服务工具
【电子邮件服务】
是用户或用户组之间通过计算机网络接受或发送文字、图像和语音等多种 形式络新闻服务】
通常被称作Usenet,是通过Internet提供新闻组专题讨论服务的一种应 用软件
Giganews:美国最大的usenet服务商 UseNeXT:欧洲最大的usenet服务商
传统网络信息服务工具
【WAIS信息服务】
WAIS(Wide Area Information Service)称为广域信息服务器,是一 种数据库索引查询服务
访问WAIS主要有三种方法: 运行一个本地主机的WAIS客户程序 • 用Telnet远程登录到WAIS Client • 通过Gopher进入WAIS
【Gopher】
是一种基于多种菜单的交互式检索工具
• 文本文件信息查询 • 电话簿查询 • 多媒体信息查询 • 专有格式文件查询 • ……
服务器1
服务器2
服务器n
用户计算机
传统网络信息服务工具
【WWW信息资源】
WWW(World Wide Web,万维网)采用了超文本与超媒体的技术, 以多媒体形式向用户展现丰富的信息
4 检索途径多,操作方便、灵活
因特网信息检索的特点
5 检索界面友好,操作简单、易行
因特网信息资源检索概述
因特网信息检索的一般方法
1. 浏览 2. 通过网络资源指南查找相应的信息 3. 利用网络检索工具进行信息检索
因特网信息检索的一般方法
1 浏览
因特网信息检索的一般方法
2 通过网络资源指南查找相应的信息
本讲小结
因特网信息检索的特点
1. 分布地域广,检索范围广泛、全面 2. 超文本检索,具有交互式作业的特点 3. 检索内容新、实时性强、传播速度快 4. 检索途径多,操作方便、灵活 5. 检索界面友好,操作简单、易行
本讲小结
因特网信息检索的一般方法
1. 浏览 2. 通过网络资源指南查找相应的信息 3. 利用网络检索工具进行信息检索
因特网信息检索的一般方法
3 利用网络检索工具进行信息检索
远程登录
文件传输服务


电子邮件服务


网络新闻服务


Archie


WAIS信息资源


Gopher信息资源
WWW信息资源
传统网络信息服务工具
【远程登录】
是在网络通讯协议Telnet的支持下,使本地计算机暂时称为远程计算机的 一个仿真终端
本讲小结
传统网络信息服务工具
远程登录 文件传输服务 电子邮件服务 网络新闻服务 Archie WAIS信息资源 Gopher信息资源 WWW信息资源
因特网信息资源检索概述
【学习目标】
➢ 了解因特网信息检索的基本特点 ➢ 掌握因特网信息检索的一般方法 ➢ 了解传统网络信息服务工具
因特网信息资源检索概述
【因特网信息检索的特点】
1. 分布地域广,检索范围广泛、全面 2. 超文本检索,具有交互式作业的特点 3. 检索内容新、实时性强、传播速度快 4. 检索途径多,操作方便、灵活 5. 检索界面友好,操作简单、易行
传统网络信息服务工具
【Archie信息资源】
Archie是因特网上用来查找其标题满足特定条件的所有文档的自动搜索服 务的工具
有三条途径可使用Archie服务器: 通过Telnet远程登录到Archie服务器主机。 使用Archie客户机程序。 通过邮件获得Archie服务。
FTP 搜索 引擎
传统网络信息服务工具
相关文档
最新文档