因特网上的信息检索课件

合集下载

高中信息技术3.2因特网上的信息检索优秀课件

找科技文献：选择正确的数据库或电子图书馆确定正确的检索点和关键词正确使用检索表过达式AND、OR、NOT
怎么下载？——下载技巧
下载文本信息：下载整个页面、剪贴复制；下载图片信息：右键单击保存、屏幕抓图；下载Flash信息：IE浏览器中不能使用复制；
需使用下载工具下载；下载音视频文件或软件：使用下载工具下载
因特网上的信息检索
因特网上的信息检索
网找什么？
What?
络Hale Waihona Puke 信哪里找？息 Where?
检索怎么下载？
how?
网上信息资源分布搜索技巧下载技巧
找什么？——网上信息资源分布
找新闻
门户网站、CCTV
找多媒体信息门户网站、专业网站、网络电视
找软件
软件下载网站
找科技文献电子图书：数字图书馆电子报刊：网上数据库专业文献：专业信息网站
一、信息检索方法
1、基于超文本/超媒体的信息浏览
2、基于目录效劳的信息查询 3、基于搜索引擎的信息检索
二、搜索引擎的开展及分类
1、搜索引擎的产生 2、搜索引擎的分类
能够实实在在找到用户所关心的内容分类，网站导航质量高。
目录式搜索引擎
搜索引全文式搜索引擎擎
分类不够细，某些特殊分类可能没有。更新不及时、需人工干预
信息量大、更新及时、不需人工干预
返回的信息过多，有很多无关信息
元搜索引擎
没有自己的数据库，而是将用户查询请求同时向多个搜索引擎递交，将返回的结果进行重新排除、重新排序等处理，将综合结果返回给用户。
找什么？——网上信息资源分布
中国重要的网上资源中国三大门户网：搜狐、新浪、网易中国三大数字图书馆：超星、方正、书生之家中国三大网上期刊数据库：清华、维普、万方中国最大的多媒体信息巧

因特网信息的查找课件ppt课件

怎么挑选合适的搜索工具
快速准确易用
个海位于欧、亚、非三大洲之间？ A;非
课堂作业2
什么是元搜索引擎？元搜索引擎有哪些？
关键词提炼
什么是关键词就是您输入搜索框中的文字，也就是您命令搜索引擎寻找的东西。
提炼正确的关键词无庸至疑，选择正确的关键词是一切的开始。学会从复杂搜索意图中提练出最具代表性和指示性的关键词对提高信息查询效率至关重要，这方面的技巧（或者说经验）是所有搜索技巧之母。
例如：多少级以上的地震会造成破坏？ a)4.5级 b)5级 c)6级
复习
信息获取的一般过程：定位信息需求
选择信息来源
调
整
确定信息获取方法
评价信息
实例引入
同学们知道世界七大奇观是什么
吗?
上网查！
•/ •/ •/ •/ •/ •/
搜索引擎的历史
现代意义上的搜索引擎的祖先，是1990年由蒙特利尔大学学生Alan Emtage发明的Archie。Alan Emtage想到了开发一个可以以文件名查找文件的系统，于是便有了Archie。
最早现代意义上的搜索引擎出现于1994年7月。当时Michael Mauldin将John Leavitt的蜘蛛程序接入到其索引程序中，创建了大家现在熟知的Lycos。
网络信息检索的方法
分类
使用方法
直接访问网页
知道信息所在网页的地址或网络实名,可快捷地检索到结果
使用搜索引擎
利用分类目录或关键词,在特定的搜索引擎中查找所需的信息
查询在线数据库利用网上的在线数据库进行查询
/(在线翻译)
那么，究竟怎么在网上搜索信息呢？说到信息搜索，我们就不得不提到搜索引擎。

第二节__因特网上的信息检索

能不够及时. 能不够及时
搜索引擎的分类
类型定义使用关键词到预先建好的或租用其它索引数据库查询信息的一类搜索引擎. 举例
全文搜索

信息量大、更新较及时、不需人工干预。优点: 信息量大、更新较及时、不需人工干预。返回信息过多，有很多无关信息。缺点:返回信息过多，有很多无关信息。
注意的问题
搜索引擎并不真正搜索互联网，搜索引擎并不真正搜索互联网，它搜索的实际上是预先整理好的网页索引数据库。实际上是预先整理好的网页索引数据库。搜索引擎，也不能真正理解网页上的内容，搜索引擎，也不能真正理解网页上的内容，它只能机械的匹配网页上的文字。它只能机械的匹配网页上的文字。
动动手
搜索引擎工作原理
1、信息的采集与存储、
信息的采集包括人工采集和自动采集两种方式。人工采集由专门的信息人员跟踪和选择有用的WWW站点或页面，并按规范方式分类标引并组建成索引数据库。自动采集是通过自动索引软件（Spider、Robot或Worm）来完成的，Spider、Robot或Worm在网络上不断搜索相关网页来建立、维护、更新索引数据库，自动采集能够搜索、采集来建立、维护、和标引网络上众多站点和页面，并根据检索规则和数据类型对数据进行加工处理，因此它收录、加工信息的范围广、速度快，能及时地向用户提供Internet中的新增信息，告诉用户包含这个检索提问的所有网址，并提供通向该网址的连接点，检索比较方便。
1994年起搜索引擎发展举例年起搜索引擎发展举例
产生时间
1994.4 1995.12 1997.10 1998.9
搜索工具
Yahoo Altavista 北大天网 Google
开发组或公司
斯坦福大学 DEC公司公司北大计算机研究室

因特网信息的查找.ppt 教科版

关键词：震级破坏
目录索引类搜索引擎
又称“分类搜索” 工作原理
将收取到的各个网站的信息按照目录分类，建立索引数据库供人们分类查找代表网站教育类高考专题搜狐、新浪、网易
•总目录——专题目录——链接——网站
2、专题目录
3、链接
4、网站
类型目录索引全文搜索
举例

/(在线翻译)
查询在线数据库
•/ •/ •/ •/ •/ •/
按其工作方式划分：
全文搜索引擎：目录索引类搜狐、网易等
元搜索引擎：
全文搜索引擎
又称”关键字查询” 工作原理
通过从因特网上提取的各个网站的信息而建立的索引数据库,当用户查询时,它在库中检索与用户查询条件相符的相关记录,然后按一定引擎（二）
收录、加工信息的范围广、速度快，能及时地提供
新增信息给用户。
每个搜索引擎都提供了多种检索功能，有利于提高
检索效率。
适合于检索特定的信息及较为专、深、具体或类属
不明确的课题。
一次检索输出的结果可能很多，但当中包含了许多
重复、虚假的信息，因此要过滤一大堆与检索主题互不相干的检索结果。
课堂作业：
1、在因特网搜索信息时，为了缩小范围，经常要进行的操作（） A、改变关键词 B、使用逻辑控制符号AND C、换一个搜索引擎 D、使用逻辑控制符号OR 2、某人在网上看到自己喜欢的图片，想下载下来正确的操作步骤是（） A、单击鼠标左键 B、单击鼠标右键，选择“图片另存为…” C、按鼠标中间键 D、双击鼠标
俄罗斯德国英国英国
德国英国德国德国
正确答案是C
逻辑运算符“与and”与“非not” ,将若干关键词组合起来。

因特网信息资源检索课件

a)找问题解决办法
我们在工作和生活中，会遇到各种各样的疑难问题，比如电脑中毒了，被开水烫伤了等等。很多问题其实都可以在网上找到解决办法。因为某类问题发生的几率是稳定的，而网络用户有好几千万，于是几千万人中遇到同样问题的人就会很多，其中一部分人会把问题贴在网络上求助，而另一部分人，可能就会把问题解决办法发布在网络上。有了搜索引擎，我们就可以把这些信息找出来。
不要局限于一个搜索引擎。强制搜索的方法-----加英文双引号选择合适的查询关键词（用好and、or、not）。
选择查询词是一种经验的积累。
搜索范例
例如，要查找2019年国内十大新闻，查询词可以是“2019年国内十大新闻”；但如果把查询词换成“2019年国内十大事件”，搜索结果就没有能满足需求的了。
找这类信息，核心问题是如何构建查询关键词。一个基本原则是，在构建关键词时，我们尽量不要用自然语言（所谓自然语言，就是我们平时说话的语言和口气），而要从自然语言中提炼关键词。这个提炼过程并不容易，但是我们可以用一种将心比心的方式思考：如果我知道问题的解决办法，我会怎样对此作出回答。也就是说，猜测信息的表达方式，然后根据这种表达方式，取其中的特征关键词，从而达到搜索目的。
1.搜索器在因特网上发现搜集网页信息 2.索引器对所搜集的信息进行提取组织并建立索引库 3.检索器根据用户输入的查询关键词，在索引库中捡出文档，进行比较、排序，反馈用户
2、目录搜索
5、发展趋势
1.多媒体信息检索 2.专业垂直搜索引擎
6பைடு நூலகம்怎样成为搜索高手
表述准确是获得良好搜索结果的必要前提（例如）
因特网信息资源检索课件
因特网信息资源检索
平时我们用搜索引擎在网上搜索资料时经常会遇到这些麻烦: 1、有些内容找不到； 2、有很多无关的信息； 3、有些页面无法显示

因特网信息资源检索课件

市场调研信息检索能够帮助用户获取实时的市场动态、行业趋势和竞争情报。通过搜索引擎、行业网站、专业市场调研报告等多种途径，用户可以获得广泛的市场数据和深入
的行业分析，为决策提供有力支持。
案例三：专利信息检索
总结词
权威、专业、全面
VS
详细描述
专利信息检索是因特网信息资源检索中具有重要价值的领域。通过国家知识产权局、世界知识产权组织等权威机构的网站，用户可以检索到全球范围内的专利信息，包括专利申请、授权和无效宣告等状态，以及专利说明书、权利要求书等详细资料。
学术评价
评价一个学术搜索引擎的质量需要考虑其覆盖的学术资源范围、检索结果的准确性和权威性等因素。
特种文献数据库
特种文献数据库概述
特种文献数据库是指针对某一特定领域或主题的文献数据库，收录内容较为专业和深入。
特种文献数据库举例
多样性
因特网信息资源涵盖了各种领域，包括新闻、学术、商业、
娱乐等。
动态性
因特网信息资源不断更新和变化，具有时效性。
全球性
因特网信息资源不受地域限制，全球范围内的用户均可访问
。
因特网信息资源的类型与来源
网站
包括个人网站、企业网站、政府网站等。
数字图书馆
提供电子书籍、期刊论文等资源。
因特网信息资源的类型与来源
评价一个搜索引擎的质量需要考虑多个因素，如搜索结果的准确性、速度、覆盖面等。
学术搜索引擎
学术搜索引擎概述
学术搜索引擎是专门针对学术资源进行检索的搜索引擎，提供更为精准和专业
的学术信息检索服务。
学术搜索引擎使用技巧
使用学术搜索引擎时，可以通过限定关键词、使用布尔逻辑运算符等技巧

因特网信息的查找课件

2007年06月11日新浪与 2007年06月11日新浪与 Google(谷歌谷歌) Google(谷歌)在北京联合召开新闻发布会，合召开新闻发布会，正式宣布双方达成战略合作关系。作关系。
返回
搜索引擎的使用技巧
提炼关键词
组合关键词
附加逻辑命令
元词
返回
搜索引擎的使用技巧
夹谷莺啼
端木书台
吴峰望日
石梁仙境
徐福故里
秦山神路
抗日山
兴庄夜雨
因特网上信息的查找
千年而不绝。独具，历韵 ” 神啼谷莺
神奇效果，故此以， “夹的真乱，假啼自无莺
回荡莺，松涛伴再和，形成涧壑上加，啾啁
黄的阵阵鸣响
白花似雪幽，左怪胁壁立，如红削花似石洞，刹
古旧作为县之镇山。山上苍火松，
大吴山位于县境
364.4 米，为赣榆县最高山，高，部北西
。夜半登山，，
“苏北吐鲁葡番萄 ” 之称而。名，有闻植种以河镇
军区的广大军民曾四次兴
五师教导旅，以及滨海二
海拔
部苏鲁两省交处，主峰界
江苏省连云港市赣榆县西
抗日山原名马山，位于鞍
173 1944 年间，八路军一一米。 1941—
雨 ” 。观，故名景一大

《因特网信息的查找》课件

04
因特网信息查找的伦理和法
律问题
信息隐私的保护
1 2
信息隐私的定义
信息隐私是指个人或组织在信息交流过程中所拥有的个人信息不被非法获取、披露、利用以及侵扰的权益。
保护个人隐私的重要性
保护个人隐私是维护个体尊严和基本人权的重要体现，有助于维护社会秩序和公共利益。
3
如何在因特网上保护个人隐私
在使用因特网时，应采取措施保护个人隐私，如使用加密技术、定期清理浏览器缓存、避免在公共场合透露个人信息等。
使用关键词
选择与需求相关的关键词进行搜索，以提高搜索效率和准确性。
筛选结果
对搜索结果进行筛选，排除无关或质量不高的信息，保留有
价值的内容。
02
因特网信息查找的方法
搜索引擎的使用
搜索引擎基本原理
常用搜索引擎
搜索技巧
搜索引擎的工作原理主要包括爬取、建立索引和查询索引三个步骤。搜索引擎通过爬取互联网上的网页，建立索引数据库，用户通过关键词查询，快速找到相关网页。
数据安全与隐私保护
云计算和大数据技术也涉及到数据安全和隐私保护的问题，需要采取相应的措施来确保用户信息安全。
信息查找的个性化服务
个性化推荐
根据用户的历史搜索记录和兴趣偏好，为用户推荐相关领域的信息和资源，提高信息查找的效率和满意度。
个性化搜索界面
提供个性化的搜索界面，根据用户的喜好和习惯进行定制，使用户能够更加便捷地获取所需信息。
社交媒体信息筛选
02
用户可以通过关注重要账号、筛选话题标签等方式获取感兴趣
的信息。
社交媒体信息分析
03
用户可以通过分析社交媒体上的信息，了解公众的关注点、舆

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

类型定义网络信息资源，通过人工整理分类，按照主题分类,并以层次树状形式进行组织的一类搜索引擎. 代表：雅虎新浪搜狐举例
目录搜索

优点: 实实在在找到用户所关心内容分类,网站导航质量高缺点:分类不够细,需要人工介入,目录的维护量大, 更新可
能不够及时.
如：①感冒 AND 咳嗽 ②大学生 AND 心理障碍 ③市场经济 AND 诚信（有“市场经济”同时有“诚信”，运算结果是阴影部分）。
A A
C B B
表明结果必须同时含有A和B才行，指A与B的交集C。须出现在同一个记录中。
逻辑非

检索式A NOT B A － B

表达检索词间的排除关系。可缩小检索范围，提高查准率，运算结果是阴影部分。例：①学生NOT小学生 ②微量元素 NOT 锌 ③能源 NOT 核能
阅读教材回答如下问题：
网络信息检索的方法搜索引擎的分类及特点搜索引擎的工作过程
因特网信息检索方法
在因特网中信息检索的方法有三种： 1、基于超文本/超媒体的信息浏览
从一个超文本/超媒体文档入手，沿着嵌入其中的、用户感兴趣的超链接区搜索信息
2、基于目录服务的信息查询
根据信息的主题降网络上的信息资源进行分类，并以目录的形式组织和表现
3、基于搜索引擎的信息检索
搜索引擎是一种信息检索工具，它从因特网上接受用户的查询请求，在数据库中进行检索，然后返回查询结果
基于超文本/超媒体的信息浏览
基于目录服务的信息查询
基于搜索引擎的信息检索
搜索引擎的产生
最早的搜索引擎出现于1994年4月。斯坦福大学的两名博士生，美籍华人杨致远和美国人David Filo共同创办了超级目录索引雅虎（Yahoo），并成功地使搜索引擎的概念深入人心。
沿着网页中所有的URL爬到其他网页，重复这一过程，把爬过的网页收集回来搜索引擎的蜘蛛（Spider）系统程序会定期重新访问所有网页，以实现该网站信息的更新蜘蛛模拟器
2、建立索引数据库
由分析索引系统程序对蜘蛛收集到的网页进行分析，
提取相关网页信息（包括网页的URL、编码类型、页面内容所包含的关键词、关键词位置、生成时间、大小等），进行大量复杂的计算（算出网页中每一个关键词的相关度，即出现的次数），然后放到响应的索引数据库中

逻辑“或”是并列概念关系的一种组配，通常用运算符为“OR”或“+”表示，能够扩大检索结果，运算结果是阴影部分例：周恩来OR周总理少年 or 儿童至少要有一个出现在记录中
A
B
逻辑与
检索式A AND B A * B
是具有概念交叉关系和限定关系的一种组配。可缩小检索范围，提高查准率。
A
B
添加英文双引号

添加英文双引号.
双引号中的词语在查询到的文档中将作为一个整体出现.这一方法在查找名言警句或专有名词时显得格外有用.
1994年起搜索引擎发展举例
产生时间
1994.4 1995.12 1997.10
搜索工具
Yahoo Altavista 北大天网
开发组或公司
斯坦福大学 DEC公司北大计算机研究室
网站特点
早期Yahoo数据是手工输入第一个支持自然语言关键词和高级检索的引擎收录网页约6000万,有强大的 FTP搜索功能
1998.9
Google
斯坦福大学
提供网页评级动态摘要、网页快照，每天更新、多文档格式支持
快照、预览、相关词搜索、 mp3、 flash搜索功能2001.8公司搜索引擎的分类
按照信息收集方法和服务提供方式，搜索引擎可分为: 目录式搜索引擎全文搜索引擎元搜索引擎
搜索引擎的分类
查询信息排序
搜索
检索
索引数据库
搜索引擎的分类
类型定义
元搜索引擎就是通过一个统一的用户界面向多个搜索引擎同时递交用户查询,返回结果去重合并,综合结果返回给用户.（没有自己的数据库）
举例
元搜索引擎
优点: 结果精确、全面，汇聚各大搜索引擎的结果。缺点: 检索速度较慢、牺牲个别搜索引擎性能，并非1+1=2
3、在索引数据库中搜索排序
当用户输入关键词搜索后，由搜索程序从网页索引数
据库中找到符合该关键词的所有网页，按照该关键词在各网页中的相关度即次数，进行排序，并返回给用户，相关度越高，排名越靠前
4、查询和响应
选择最好的搜索工具
每一个搜索都是不同的，如果你为每一个搜索都选择最好
的搜索工具，那么每次你都会得到最好的搜索结果。最常见的选择是使用全文搜索引擎还是网站分类目录。一般的规则是，如果你在找什么特殊的内容或文件主题，那么使用网站分类目录如 yahoo和sohu。对于特殊类型的信息考虑使用特殊的搜索工具，比如你要找人或找地点，那么使用专业的寻人引擎或地图和位置搜索网站。事实上几乎每种主题都有特殊的搜索工具。
元搜索引擎示意图
搜索引擎的工作原理
目录式搜索引擎是以人工或半自动方式收集信息，有
编辑人员查看信息后，人工形成信息摘要，并将信息至于事先确定的分类框架中。用户通过浏览分类目录来查看自己所需要的信息，在链接信息资源所在的位置。
搜索引擎的工作原理
1、目录式搜索引擎是以人工或者半自动方式收集信息，由编辑人员查看信息后，人工形式信息摘要，并将信息置于事先确定的分类框架中
搜索引擎的工作原理
2、全文搜索引擎并不能真正理解用户的查询内容，只能把匹配查询关键词与索引数据库中的内容进行匹配。全文搜索引擎的工作过程是：从网上抓取网页建立索引数据库在索引数据库中搜索排序响应用户查询
1、如何从互联网抓取网页
使用蜘蛛（Spider）系统程序，自动访问因特网，并
使用自然语言搜索
多数搜索引擎对自然语言的处理很好。事实上，搜索
引擎能够从语句结构得到很有用的信息，不会象仅得到几个关键词那样容易迷失。

与其输入几个不合语法的关键词，还不如试一下一句自然的提问。与其搜索“昆明公交车路线”，不如试一下 “我在昆明如何乘坐公交车？"
逻辑或
检索式 A OR B 检索式建好的或租用其它索引数据库查询信息的一类搜新较及时、不需人工干预。缺点:返回信息过多，有很多无关信息，广告也特别多。
全文搜索引擎
用户查询查询结果
输入关键字