2.2获取网络资源的策略与技巧
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
#
3.搜索引擎的分类 搜索引擎的分类
• (1)全文搜索引擎 全文搜索引擎 • 全文搜索引擎是名副其实 的搜索引擎,国外具代表性 的有Google、 Fast/AllTheWeb、AltaVista、 Inktomi、Teoma、WiseNut 等,国内著名的有百度 (Baidu)。它们都是通过从 互联网上提取的各个网站的 信息(以网页文字为主)而 建立的数据库中,检索与用 户查询条件匹配的相关记录, 然后按一定的排列顺序将结 果返回给用户,因此他们是 真正的搜索引擎。
#
• ④强制搜索 • 给关键词加上英文双引号可以强制搜索一个整体词语。比如:搜 给关键词加上英文双引号可以强制搜索一个整体词语。比如: 我的太阳” 就应该用引号引起来, 索歌曲 “啊,我的太阳”,就应该用引号引起来,否则,会把包含 我的太阳 就应该用引号引起来 否则,会把包含" 我的太阳", 太阳 等很多无关的内容都罗列出来, 太阳"等很多无关的内容都罗列出来 我的太阳 ,"太阳 等很多无关的内容都罗列出来,我们需要的 信息反而很难找到。 信息反而很难找到。 • ⑤不要局限于一个搜索引擎 • 多使用几个搜索引擎 • ⑥使用通配符? 使用通配符? • 在搜索引擎中输入:天?地?成语,看一看你能找到哪些有关 在搜索引擎中输入: 成语, 的成语? “天?地?”的成语? • ?是通配符,可代表任意字符。本例中,?代表一个汉字或其他 是通配符,可代表任意字符。本例中,? ,?代表一个汉字或其他 符号, 成语”是第二个关键词,用来限制查找范围。 符号,“成语”是第二个关键词,用来限制查找范围。
#
பைடு நூலகம்
(2)目录搜索引擎
• 目录索引虽然有搜索功能, 目录索引虽然有搜索功能, 但在严格意义上算不上是真 正的搜索引擎, 正的搜索引擎,仅仅是按目 录分类的网站链接列表而已。 录分类的网站链接列表而已。 用户完全可以不用进行关键 词(Keywords)查询,仅靠 )查询, 分类目录也可找到需要的信 息。目录索引中最具代表性 的莫过于大名鼎鼎的Yahoo 的莫过于大名鼎鼎的 雅虎。其他著名的还有Open 雅虎。其他著名的还有 Directory Project )、LookSmart、 (DMOZ)、 )、 、 About等。国内的搜狐、新 等 国内的搜狐、 浪、网易搜索也都属于这一 类。
2.2 获取网络信息的 策略与技巧
2010.10
网络资源数量庞大、浩如烟海, 网络资源数量庞大、浩如烟海,要从 网络获取有效信息无异于大海捞针。 网络获取有效信息无异于大海捞针。有 没有什么方法和技巧, 没有什么方法和技巧,让大海捞针变得 不再困难呢? 不再困难呢?
#
一、网络信息检索的方法
• • • • 学习活动任务1: 学习活动任务 : 请同学们上网查找下列问题的答案: 请同学们上网查找下列问题的答案: 全国青少年网络文明公约? ①全国青少年网络文明公约? 世界第一枚邮票出现在哪个国家? ②世界第一枚邮票出现在哪个国家?
• 当用户以关键词查找信息时,搜索引擎 当用户以关键词查找信息时, 会在数据库中进行搜寻, 会在数据库中进行搜寻,如果找到与用 户要求内容相符合的网站, 户要求内容相符合的网站,便采用特殊 的算法——通常根据网页中关键词的匹 的算法 通常根据网页中关键词的匹 配程度,出现的位置/频次, 配程度,出现的位置/频次,链接质量 等计算出各网页的相关度及排名等级, 等计算出各网页的相关度及排名等级, 然后根据关联度高低, 然后根据关联度高低,按顺序将这些网 页链接返回给用户。 页链接返回给用户。
#
三.文件的合法下载
• Windows自带的下载工具,不具有断点 续传功能,一次下载不成功的话,下次 只能从头开始重新下载。
#
#
5、搜索的技巧 、
• ①提炼搜索关键词 • 从复杂搜索意图中提炼出最具代表性和提示性的关键词 • ②细化搜索条件 • 搜索条件越具体,搜索范围就越小,搜索结果就越精确。通常采 搜索条件越具体,搜索范围就越小,搜索结果就越精确。 用的方法是:输入多个关键词,关键词之间用空格隔开。 用的方法是:输入多个关键词,关键词之间用空格隔开。 • ③用好逻辑符号 • 使用逻辑符号,可以准确地缩小搜索范围。一般在搜索引擎中, 使用逻辑符号,可以准确地缩小搜索范围。一般在搜索引擎中, 减号)来代表逻辑 前要留一个空格, 用"-"(减号 来代表逻辑 非"。在使用时,"-"前要留一个空格,而 减号 来代表逻辑"非 。在使用时, 前要留一个空格 "-"后则紧跟需要排除的关键词,不能再加空格。"-"也应该用英 后则紧跟需要排除的关键词, 后则紧跟需要排除的关键词 不能再加空格。 也应该用英 文符号。比如搜索"相机 结果中"相机 总和"数码 结合在一起, 相机",结果中 相机"总和 数码"结合在一起 文符号。比如搜索 相机 结果中 相机 总和 数码 结合在一起, 如果我不想关注数码相机,则可以搜索"相机 数码 搜索"信息 数码"。 如果我不想关注数码相机,则可以搜索 相机 –数码 。搜索 信息 技术" 技术", 技术 与"信息 -技术 ,搜索结果就不一样。 信息 技术 搜索结果就不一样。
#
2.搜索引擎的原理 搜索引擎的原理
• 搜索引擎之所以有如此庞大的数据信息,是因 为该网站提供了强大的数据收集功能,搜索引 擎网站的搜集功能分为“定期”和“提交网站” 两种形式。
• 定期搜索,即每隔一段时间搜索引擎主动派出“蜘蛛” 程序,对一定IP地址范围内的互联网站进行检索,一 旦发现新的网站,它会自动提取网站的信息和网址加 入自己的数据库。 • 此外,有些商业网站,为宣传自己的网站内容,经常 到一些知名的搜索引擎网站提交自己的网站信息,这 样搜索引擎网站会在一定时间内定向向你的网站派出 “蜘蛛”程序,扫描你的网站并将有关信息存入数据 库,以备用户查询。 #
直接访 直接在地址栏输入网址 或网络实名,打开包含 问网页 该信息的网页
利用分类目录或关键词, 使用搜 在特定的搜索引擎中查 索引擎 找
查询在 利用网上的在线数据库 线数据 查询 库
二、使用搜索引擎
• 1、什么是“搜索引擎”? 、什么是“搜索引擎” • 搜索引擎(Search Engines)是一个对互联网 上的信息资源进行搜集整理,然后供你查询的 系统,它包括信息搜集、信息整理和用户查询 三部分。搜索引擎是一个为你提供信息“检索” 服务的网站,它使用某些程序把因特网上的信 息归类以帮助人们在茫茫网海中搜寻到所需要 的信息。
#
网络信息检索的方法
分类 使用方法 例子
查询凤凰卫视的节目信 息,直接访问凤凰网 www.ifeng.com 使用百度搜索引擎 www.baidu.com,输入 www.baidu.com,输入 “金庸 祖籍” 要对“眼睛与视力” 进 行资料统计和分析,可 访问在线数据库 www.data.ac.cn #
对比: 对比: 目录搜索引擎: 目录搜索引擎:查询准确率高 全文搜索引擎: 全文搜索引擎:查询齐全率高 #
4、常见搜索引擎 、 • http://www.baidu.com 百度 • http://www.google.com 谷歌 • http://www.sohu.com/ 搜狐 • http://www.sina.com/ 新浪 • http://www.yahoo.com. cn/ 雅虎