因特网上的信息检索

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

因特网上的信息检索练习题.xls 因特网上的信息检索练习题
搜索引擎的特点
搜索引擎 优点 缺点 温馨小提示
需人工介入, 需人工介入, 收录网站质量 浏览某方面的 维护量大, 维护量大,信 目录搜索引擎 高 全人工审 信息或专题 息量大, 息量大,更新 核 不及时 返回信息多, 返回信息多, 查找非常具体 全文搜索引擎 信息及时又多 需用户筛选结 或特殊的问题 果 方便简单快捷 全面了解网上 没有自己的数 可以同时使用 信息资源 据库 多个搜索引擎
元搜索引擎
其它搜索技术或工具
地图: 股票、 如: 地图:http://ditu.google.cn/ 股票、天气等
小结:Hale Waihona Puke Baidu小结:
在这几中检索工具中, 在这几中检索工具中, • 目录式搜索引擎虽有成本高,信息少的缺点,但它的信息准 目录式搜索引擎虽有成本高 信息少的缺点, 虽有成本高, 确这一优点是另二者所无法比拟的,故在一定的领域,一定 确这一优点是另二者所无法比拟的,故在一定的领域, 的时间,它仍会被使用; 的时间,它仍会被使用; • 机器人(全文)搜索引擎是当前各种搜索引擎的主流; 器人(全文)搜索引擎是当前各种搜索引擎的主流; 是当前各种搜索引擎的主流 • 搜索引擎分类不同,工作方式也不同,因而导致了信息覆 搜索引擎分类不同,工作方式也不同, 盖范围方面的差异, 盖范围方面的差异,仅限于使用单一的搜索引擎是不明智 的,根据不同的要求选用不同的搜索引擎或者两者结合使 用才是明智之举。 用才是明智之举。
获取相关信息的源 位置(URL) 位置(URL)
以人工方式或半自动方 式搜集信息, 式搜集信息,由编辑人 员查看信息之后, 员查看信息之后,人工 形成信息摘要, 形成信息摘要,并将信 息置于事先确定的分类 框架中。 框架中。信息大多面向 网站, 网站,提供目录浏览服 务和直接检索服务; 务和直接检索服务;目 录的用户界面 用户界面基本上都 录的用户界面基本上都 是分级结构, 是分级结构,首页提供 了最基本的几个大类的 入口, 入口,用户可以一级一 级地向下访问, 级地向下访问,直至找 到自己感兴趣的类别。 到自己感兴趣的类别。
知识回顾
• 因特网非常受欢迎的一个应用是万维网 。 借助于万维 因特网非常受欢迎的一个应用是万维网。 软件沿着下划线链接, 网 浏览器,软件沿着下划线链接,你会很容易地从一个 页面导航到其他页面。 页面导航到其他页面。网页被保存在 服务器硬盘 中, 并且每个页面都有一个惟一的地址,被称 为 统一资源定位器 统一资源定位器(URL) 。
通过一个统一 的用户界面向 多个搜索引擎 同时递交用户 查询, 将返回 的结果进行综 合处理后再返 回给用户.
举例
元 搜 索 引 擎
请同学们分组查找“清华大学概况”的信息。填写“搜索引擎比较表” 请同学们分组查找“清华大学概况”的信息。填写“搜索引擎比较表”, 并由填表结果思考: 并由填表结果思考: 对同样的检索信息,为什么不同的搜索引擎搜索信息的效率、结果、准确 对同样的检索信息,为什么不同的搜索引擎搜索信息的效率、结果、 效率 各有不同呢?它们(目录式搜索引擎和全文搜索引擎) 工作过程( 率各有不同呢?它们(目录式搜索引擎和全文搜索引擎)的工作过程(或原 到底是怎样的?其工作过程的不同导致各搜索引擎有怎样的特点 特点? 理)到底是怎样的?其工作过程的不同导致各搜索引擎有怎样的特点? (结合课本 结合课本P70和P73相关知识,分析重点:全文搜索引擎 相关知识, 结合课本 和 相关知识 分析重点:全文搜索引擎)
分组方法:1组:1-10号 分组方法: 组 号 组 长: 1组:1号 组 号
2组:11-30 号 组 2组:11号 组 号
3组:31-50号 组 号 3组:32号 组 号
搜索引擎的工作原理
组织、分类 、存储
目录式搜索引擎
人工或半自动方式 收集信息的URL 收集信息的 搜索引擎网络公司 用户查询 通过浏览器软件访问
搜索引擎的分类
类型
目录式搜索引擎
网络信息资源按照主题分类,并以层次树状形式 进行组织
定 义 举 例
www.163.com
搜索引擎的分类
类型 定义 使用关键词到预先 建好的或租用其它 索引数据库查询信 息的一类搜索引擎. 举例
全 文 搜 索 引 擎
www.baidu.com
搜索引擎的分类
类型 定义
搜索引擎的工作原理
自动从网上“抓 取”网页,返回 URL 建立索引数据 库URL 在索引数据库 中搜索排序 搜索引擎网络公司 用户查询 通过浏览器软件访问
全文搜索引擎
获取相关信息的源位置 (URL)
一股是自动 网页搜索程 序在因特网上搜索网页, 序在因特网上搜索网页 , 并将网页信 息不断地传 回服务器 。 索引编辑程 序对传送回 来的网页信 息进行加工, 建立索引, 息进行加工 , 建立索引 , 存储到索引 数据库中 。 另一股是学生所熟悉的, 另一股是学生所熟悉的 , 即用户输入搜索关键词, 即用户输入搜索关键词 , 用户接口程 序将其传送 到搜索引擎 服务器上 。 服务器上的 检索程序根 据关键词在 索引数据库 中进行查找 , 并将查询 结果传送给 用户接口程 序 , 用户接 口程序再以 网页的形式 向用户显示 查询结果
3.2 因特网上信息检索的方法 上官
学习目标: 学习目标: 1、掌握搜索引擎的分类与特点。 、掌握搜索引擎的分类与特点。 2、了解搜索引擎的产生与发展。 、了解搜索引擎的产生与发展。 3、理解搜索引擎的工作原理。 、理解搜索引擎的工作原理。 重点:搜索引擎的类型与特点。 重点:搜索引擎的类型与特点。 难点: 难点:搜索引索的工作原理
3.2.1 因特网信息检索方法
基于超文本/超媒体的信息浏览 基于超文本 超媒体的信息浏览
P68
小结
• 因特网信息检索方法:
1、基于超文本/超媒体的信息浏览 、基于超文本 超媒体的信息浏览 2、基于目录服务的信息查询 、 3、基于搜索引擎的信息检索 、
• 搜索引擎的分类、原理:
1、目录式搜索引擎:人工;量少质高 更新慢 、目录式搜索引擎 人工 量少质高,更新慢 人工; 2、全文搜索引擎:蜘蛛程序(机器人);量多,杂 );量多 、全文搜索引擎:蜘蛛程序(机器人);量多, 3、元搜索引擎:实现简单,没有自己的数据库 、元搜索引擎:实现简单, 其他:检索代理; 其他:检索代理;特种搜索引擎
搜索引擎的工作原理
全文搜索引擎
搜索引擎网站的计算机服务器就是厂房, 搜索引擎网站的计算机服务器就是厂房,而“蜘蛛”、“机器人”、 蜘蛛” 机器人” 爬虫”等自动网页搜索程序扮演了采购员角色, “爬虫”等自动网页搜索程序扮演了采购员角色,需要整日奔波在 网络上以采购网页。采购回来的网页由加工工人“ 网络上以采购网页。采购回来的网页由加工工人“网页搜索引擎程 进行加工,加工好的产品则存放到产品仓库“索引数据库” 序”进行加工,加工好的产品则存放到产品仓库“索引数据库”中, 供用户查找。在用户使用搜索引擎进行资源检索时, 供用户查找。在用户使用搜索引擎进行资源检索时,与用户直接打 交道的是用户接口程序(例如浏览器),用户接口扮演了“ ),用户接口扮演了 交道的是用户接口程序(例如浏览器),用户接口扮演了“订单接 收及送货员”的双重角色, 收及送货员”的双重角色,它接收搜索关键词并将其传送到搜索引 擎服务器上,同时还负责显示经过排序的检索结果, 擎服务器上,同时还负责显示经过排序的检索结果,供用户有选择 地打开找到的网页,然后将检索结果传送给用户接口程序。 地打开找到的网页,然后将检索结果传送给用户接口程序。
相关文档
最新文档