第十章 网络信息检索工具
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(二)Vivisimo(http://www.vivisimo.com) (二)Vivisimo(http://www.vivisimo.com) 1.Vivisimo检索功能 1.Vivisimo检索功能 2.Vivisimo显示机制 2.Vivisimo显示机制
(三)ProFusion(http://www.profusion.com/) (三)ProFusion(http://www.profusion.com/) ProFusion意为信息的熔炉(Information ProFusion意为信息的熔炉(Information Fusion),ProFu- sion是1997年Intelliseek公 Fusion),ProFu- sion是1997年Intelliseek公 司创建的一个优秀的元搜索引擎,提供个 性化的检索结果。
(二)搜索引擎的其他检索功能 1.自然语言检索 1.自然语言检索 2.多语种检索 2.多语种检索 3.概念检索 3.概念检索 4.过滤检索 4.过滤检索
三、主要搜索引擎介绍 (一)AltaVista(http://www.altavista.com) (一)AltaVista(http://www.altavista.com) (二)Lycos(http://www.lycos.com) (二)Lycos(http://www.lycos.com) (三)Google(http://www.google.com) (三)Google(http://www.google.com) (四)Fast/AllTheWeb(http://www.alltheweb.com) (四)Fast/AllTheWeb(http://www.alltheweb.com) (五)百度(http://www.baidu.com) (五)百度(http://www.baidu.com) (六)天网(http://e.pku.edu.cn) (六)天网(http://e.pku.edu.cn) (七)其他英文搜索引擎 (八)其他中文搜索引擎
二、网络资源目录的类型和特点 (一)网络资源目录的类型 1.传统分类法型网络资源目录 1.传统分类法型网络资源目录 2.创新型网络资源目录 2.创新型网络资源目录
(二)网络资源目录的特点 1.在体系结构上,以树状结构为主 1.在体系结构上,以树状结构为主 2.在类目设置上,以事物为中心确定类目 2.在类目设置上,以事物为中心确定类目 3.类目的展开呈现出明显的多维性 3.类目的展开呈现出明显的多维性 4.类目直接用语词作为标记 4.类目直接用语词作为标记 5.面向用户的易用性 5.面向用户的易用性 6.类目体系呈现出动态的特征 6.类目体系呈现出动态的特征 7.表现出明显的兼容性 7.表现出明显的兼容性
5.简述网络资源目录的原理和特点。 5.简述网络资源目录的原理和特点。 6.试分析分类法与超文本技术的关系。 6.试分析分类法与超文本技术的关系。 7.网络资源目录有哪几种类型? 7.网络资源目录有哪几种类型? 8.目前在网上使用的传统分类法型的网络资源 8.目前在网上使用的传统分类法型的网络资源 目录有哪些? 目录有哪些?试对它们加以 评价。 9.Yahoo、 9.Yahoo、Open Directory、搜狐、蓝帆的目录 Directory、搜狐、蓝帆的目录 各有什么特点? 各有什么特点?试用该目录 查询“信息检索” 查询“信息检索” 方面的有关网络资源,并说明查询过程。 10.简述元搜索引擎的原理和特征。 10.简述元搜索引擎的原理和特征。
(二)元搜索引擎的评价 1.元搜索引擎的初始化方式 1.元搜索引擎的初始化方式 2.覆盖的网络资源类型 2.覆盖的网络资源类型 3.网络信息获取方式 3.网络信息获取方式 4.检索功能 4.检索功能 5.检索结果输出格式 5.检索结果输出格式
三、主要元搜索引擎介绍 (一)Dogpile(http://www.dogpile.com) (一)Dogpile(http://www.dogpile.com) 1.Dogplie基本检索 1.Dogplie基本检索 2.Dogpile高级检索 2.Dogpile高级检索 3.其他检索 3.其他检索
第十章 网络信息检索工具
第一节 网络信息检索工具的发展和类型 一、网络信息检索工具的发展 网络信息检索工具是指在因特网上提 供信息检索服务的信息检索系统。
二、网络信息检索工具的类型 1.按索引方式划分,可分为目录型检索工具和 1.按索引方式划分,可分为目录型检索工具和 索引型检索工具 2.按检索时搜索的检索工具数量划分,可以分 2.按检索时搜索的检索工具数量划分,可以分 为独立型检索工具和集合型检索工具 3.按检索网络资源的类型划分,可分为Web资 3.按检索网络资源的类型划分,可分为Web资 源检索工具和非Web资源检索工具 源检索工具和非Web资源检索工具
【思考题】 思考题】 1.网络检索工具可以分为哪几种类型?各有什 1.网络检索工具可以分为哪几种类型? 么特点? 么特点? 2.简述搜索引擎的组成和检索功能。 2.简述搜索引擎的组成和检索功能。 3.试比较中文Google和百度。 3.试比较中文Google和百度。 4.利用Google查找中央电视台网站上关于“伊 4.利用Google查找中央电视台网站上关于“ 拉克战争” 拉克战争”的网页。
三、网络资源目录介绍 (一)Yahoo(http://www.yahoo.com) (一)Yahoo(http://www.yahoo.com) (二)Open Directory(http://dmoz.org/) (二)Open Directory(http://dmoz.org/) (三)LookSmart(http://www.looksmart.com) (三)LookSmart(http://www.looksmart.com) (四)Galaxy(http://www.galaxy.com) (四)Galaxy(http://www.galaxy.com) (五)The (五)The WWW Virtual Library(VL) Library(VL) http://www.vlib.org/) (http://www.vlib.org/) (六)搜狐(http://www.sohu.com) (六)搜狐(http://www.sohu.com) (七)蓝帆(http://www.linefan.com/search/) (七)蓝帆(http://www.linefan.com/search/)
第四节 元搜索引擎
一、元搜索引擎的含义和特征 元搜索引擎(Metasearch Engine)又称多 元搜索引擎(Metasearch Engine)又称多 元搜索引擎或集合式搜索引擎。元搜索引擎是 一种将多个独立搜索引擎集成在一起,提供统 一的检索界面,将用户的检索提问同时提交给 多个独立的搜索引擎,并将检索结果一并返回 给用户的网络检索工具。
(三)搜索引擎的特点 1.支持全文检索 1.支持全文检索 2.检索功能较为全面,检索方法多样 2.检索功能较为全面,检索方法多样 3.检索结果按相关性排序 3.检索结果按相关性排序 4.查询速度快,维护更新及时 4.查询速度快,维护更新及时 5.关键词检索为主,分类目录浏览为辅 5.关键词检索为主,分类目录浏览为辅
(四)Ixquick(http://www.ixquick.com) (四)Ixquick(http://www.ixquick.com) Ixquick创建于1998年,现属于Surfboard Ixquick创建于1998年,现属于Surfboard Holding BV公司(荷兰的一家公司),整个 BV公司(荷兰的一家公司),整个 公司由3 公司由3个具有献身精神和雄心壮志的年轻 人组成。
二、元搜索引擎的原理和分类 (一)元搜索引擎的原理 (二)元搜索引擎的分类
二、元搜索引擎的技术和评价 (一)元搜索引擎的技术 1.用户提问转换技术 1.用户提问转换技术 2.分布式数据库调用技术 2.分布式数据库调用技术 3.检索机制设计与优化技术 3.检索机制设计与优化技术 4.检索结果输出技术 4.检索结果输出技术
二、搜索引擎的检索功能 搜索引擎产生和发展的历史虽然不长, 但它的功能却非常强大,搜索引擎的检索实 际上也是一种数据库检索,几乎可以提供一 般数据库的全部检索功能,如布尔逻辑检索、 词组检索、截词检索、字段检索、限制检索、 位置检索和自然语言检索等。
(一)搜索引擎的基本检索功能 1.布尔逻辑检索 1.布尔逻辑检索 2.词组检索 2.词组检索 3.截词检索 3.截词检索 4.位置检索 4.位置检索 5.字段检索 5.字段检索 6.区分大小写检索 6.区分大小写检索
第三节 网络资源目录
一、网络资源目录的含义和原理 (一)网络资源目录的含义 网络资源目录是一种主要采用人工或 机器搜索信息,由人工对搜集的信息进行 甄别、加工整理、分类,建立分类导航或 分类编排网站目录,提供分类浏览的检索 工具。
(二)网络资源目录的原理 1.网络资源目录以分类理论为依据 1.网络资源目录以分类理论为依据 2.网络资源目录以人工收集信息和组织信息为主 2.网络资源目录以人工收集信息和组织信息为主 3.网络资源目录将超文本技术融进了分类法 3.网络资源目录将超文本技术融进了分类法
11.元搜索引擎可分为哪几种类型,各有什么 11.元搜索引擎可分为哪几种类型,各有什么 特点? 特点? 12.元搜索引擎主要涉及的技术有哪些? 12.元搜索引擎主要涉及的技术有哪些? 13.试分析和评价Dogpile和Vivisimo。 13.试分析和评价Dogpile和Vivisimo。 14.请自拟一个检索课题,利用三个元搜索引 14.请自拟一个检索课题,利用三个元搜索引 擎进行检索,并比较检索结果。
(五)万纬搜索(http://www.widewaysearch.com) (五)万纬搜索(http://www.widewaysearch.com) 1.万纬搜索的检索功能 1.万纬搜索的检索功能 2.万纬搜索的特色 2.万纬搜索的特色
(六)其他重要的元搜索引擎 1.MetaCrawler(http://www.metacrawler.com/) 1.MetaCrawler(http://www.metacrawler.com/) 2.Mamma(http://www.mamma.com) 2.Mamma(http://www.mamma.com) 3.SavvySearch(http://www.savvysearch.com) 3.SavvySearch(http://www.savvysearch.com) 4.Highway611(http://www.highway61.com) 4.Highway611(http://www.highway61.com) 5.Digisearch(http://www.digiway.com/digisearch) 5.Digisearch(http://www.digiway.com/digisearch) 6.EZ2WWW(http://www.ez2www.com) 6.EZ2WWW(http://www.ez2www.com)
第二节 搜索引擎
一、搜索引擎的概况 (一)搜索引擎的含义 搜索引擎来自英文“ 搜索引擎来自英文“Search Engine”,意 Engine” 为信息查找的发动机,Biblioteka Baidu最为常用的网络 资源搜索工具之一。
(二)搜索引擎的组成 1.数据采集 1.数据采集 2.数据组织 2.数据组织 3.用户检索 3.用户检索