第四讲网络信息检索工具1精品PPT课件

合集下载

网络信息检索工具——搜索引擎.ppt

网络信息检索工具——搜索引擎.ppt

14
利用Google进行专题信息检索
1 简单专题信息检索及目录检索 接受一项简单专题,最直截了当就是在搜索框内输入一个 关 键 词 , 然 后 点 击 下 面 的 “ Google 搜 索 ” 按 钮 ( 或 者 直 接 回 车),结果就出来了。 如果对查询的领域熟悉,只想寻找某些专题网站,首先考虑 用目录检索。目录分类明确,则网站专题信息集中,剔除了大 量不相关的信息。不过对查找中文信息,Google的中文目录太 少只有非常普通简单的类目,可能很难满足需求(中文目录 “/Top/World/Chinese_Simplified/” )。
搜索器、分析器、索引器、检索器和用户接口。
同检索数据库一样,利用搜索工具检索,也需要用户能 够将自己的检索需求编制成合适的检索策略,并且需要 一定的检索技巧。
搜索引擎采用的检索词和信息标识词匹配运算的主要方 法有:布尔逻辑检索、截词检索、限制检索、加权检索、 词位置检索和全文检索等。
2019-8-17
感谢你的观看
2
搜索引擎分类
检索型搜索引擎:它使用自动索引软件来发现、收集并标 引网页,建立数据库,并以Web形式让用户找到所需信息 资源。比较著名的有:引擎将信息系统地分门归类,经过 人工整理后形成庞大而有序的分类目录体系,用户可以在 目录体系的导引下通过逐级浏览,发现、检索到有关的信 息。雅虎就是以卓越的分类目录型导航服务而称誉全球。
-横向相关查询: 当用户找到某个感兴趣的网页,搜索引擎提供查询内容近似的其 他网页的功能(不限于同一网站)。一般是在信息条目后面给出 “Similar Pages”或“More results like this”链接。 -除上述功能外,现在搜索引擎都纷纷开始提供分类搜索,如新 闻搜索、图象搜索、新闻组搜索、Flash搜索等等。

第4章网络信息资源检索精品PPT课件

第4章网络信息资源检索精品PPT课件
(4)inurl:限制你搜索的关键词出现在网 页的url中。
• 例:搜索网页url中含有“mp3”的网页,输入: “inurl:mp3”。
(5)link:可以得到一个所有包含了某个指 定URL的页面列表.
• 例如:link: 就可以得到所有连接到Google的 页面。
12
单击中文主页,单击 in English链接进入英文界面。英文界面还有 更多功能:
第4章 网络信息资源检索
4.1 概述 4.2 网络检索工具—搜索引擎 4.3 综合性搜索引擎 4.4 专业性搜索引擎 4.5 特色搜索引擎
1
4.1.1 网络信息资源的定义、特点
定义:
• 从字面上理解,网络信息资源是指“通过计算 机网络可以利用的各种信息资源的总和”。具 体的说是指所有以电子数据的形式把文字、图 像、声音、动画等多种形式的信息存贮在光、 磁等非纸介质的载体中,并通过网络通信、计 算机或终端等方式再现出来的资源 。
(5)信息分散、无序。互联网是一个基于TCP/IP协议的联结各国、各 机构数以万计的计算机网络的通信网,对网络信息资源本身的组织管 理无统一标准和规范,网络信息分散于不同国家、不同地区服务器上, 采用不同的操作系统及数据结构,字符界面、图形界面、菜单方式、 超文本方式等,缺乏集中统一的管理机制。
3
4.1.2 网络信息资源的类型
• 例2:搜索包含“网络安全”方面的powerpointer文 件。输入:网络安全。
• 例3:搜索包含“搜索引擎”方面的pdf文件。输入: 搜索引擎。
11
(3)intitile:限制你搜索的关键词出现在 网页标题中。
• 例:搜索网页标题中含有“信息检索”的网页, 输入:“intitile:信息特点:

电子商务网络信息检索PPT

电子商务网络信息检索PPT

真假优劣混杂,鉴别难 度加大
第一节网络信息的基本知识 二、互联网信息资源的主要种类
1、根据网络信息发布者身份进行分类
1 大学 2 政府 机构 3
公司 企业 或其 它商 业机 构
4
学术
5
图书
6
个人/ 普通 大众
组织

第一节网络信息的基本知识 二、互联网信息资源的主要种类
2、根据网络信息性质进行分类定为特定站点—site 有时候,您如果知道某个站点中有自己需 要的东西,就可以把搜索范围限定在这个 站点,以提高查询效率。 使用方式:在查询内容的后面加上 “site:站点域名”。 例如,天空网下载软件不错,就可以这 样输入“msn site:” 注意,“site:”后面的站点域名不要带 “http://”;另外,“site:”与站点名之间 不要留空格。
• B2B不仅仅是建立一个网上的买卖者群体,它也 为企业的之间的战略合作提供了基础。任何一家 企业,不论它具有多强的技术实力或多好的经营 战略,要想单独实现B2B是完全不可能的。单打 独斗的时代已经过去,企业间建立合作联盟逐渐 成为发展趋势。网络使得信息通行无阻,企业之 间可以通过网络在市场、产品或经营等方面建立 互补互惠的合作,形成水平或垂直形式的业务整 合,以更大的规模、更强的实力、更经济的运作 真正达到全球运筹管理的模式。
第三节 网络信息检索实务
二、搜索中小企业定义和划分标准
关键字分析:可以考虑“中小企业 定义 划分 标 准”这些,但实际上,只要讲到中小企业的定义, 就会涉及到它的划分标准,所以,只要以“中小企 业 定义”作为关键字搜擎,再将其返回结果分析、汇总 即可。
网易搜索的信息类型:网页 图片 典 更多»
seekle搜索的信息类型:MP3 论坛 论坛提出建议)

网络信息资源检索课件

网络信息资源检索课件
网络信息资源具有多样性、交互 性、动态性、共享性等特点,可 以满足不同用户的需求,提供便 捷的信息获取方式。
网络信息资源的类型
政府信息
包括政府机构、政策法规、统 计数据等信息。
学术信息
包括学术论文、研究报告、学 术期刊等信息。
商业信息
包括公司简介、产品信息、市 场调研等信息。
个人信息
包括博客、论坛、社交媒体等 信息。
应了解常见的网络攻击手段,如钓鱼网站、恶意软件等,采取相应 的防范措施。
THANKS
感谢观看
网络信息资源的发展历程
1 2
互联网的兴起
随着计算机技术和通信技术的发展,互联网逐渐 兴起,成为人们获取信息的重要途径。
信息爆炸时代
随着互联网的普及,网络信息量呈爆炸式增长, 搜索引擎的出现使得信息检索变得更加便捷。
3
个性化信息服务
随着大数据和人工智能技术的发展,个性化信息 服务逐渐成为主流,能够根据用户需求提供更加 精准的信息服务。
网络信息资源检索课件
• 网络信息资源概述 • 网络信息资源检索基础 • 搜索引擎的使用 • 学术信息检索 • 网络信息资源的质量评价 • 网络信息资源的合理使用
01
网络信息资源概述
定义与特点
定义
网络信息资源是指通过计算机网 络可用的各种信息资源的总和, 包括文本、图像、音频、视频等 形式。
特点
使用恰当的关键词
选择能够准确描述信息需求的关键词,避免使用过于宽泛或模糊的词 汇。
调整检索策略
根据检索结果不断调整关键词和查询方式,以提高检索效率和准确性。
03
搜索引擎的使用
搜索引擎的原理与分类
搜索引擎的原理
搜索引擎通过爬取互联网上的网页,建立索引,然后根据关键词匹配程度进行 排序,为用户提供搜索结果。

网络信息查找使用技巧介绍PPT课件

网络信息查找使用技巧介绍PPT课件

检索式的构成
2、高级检索运算符
• 双引号、连字号、斜线、问号、等号、省略号都可以作为短 语的连接符号查找名言或专有名词 • 指定网域:利用site:可以在某个特定的网站或域中 进行搜索 • 指定文件类型:filetype:文件类型,可以在一类文件中进行 搜索,比如,filetype:pdf, filetype:ppt等 • 搜索的关键词包含在URL链接中:inurl: • 搜索的关键词包含在网页标题中:intitle: • 搜索的关键词包含在网页的“锚”中:inanchor: 或allinan chor: • 搜索所有链接到某个URL的网页:link:

搜索引擎分类
第一类 目录式搜索引擎(网站)
第二类 全文式搜索引擎(网页) 第三类 元搜索引擎
目录式搜索引擎
这种搜索引擎是以人工方式或半自动方式搜集信息,由编辑人员查看信息之后,人工形成信息摘要,并将信息置于事 先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务

目录的用户界面基本上都是分级结构,首页提供了最基本的几个大类的入口,用户可以一级一级地向下访问,直至找 到自己感兴趣的类别,另外,用户也可以利用目录提供的搜索功能直接查找关键词
对于返回的结果系统会进行重复排除、重新排序等处理后,作为自己的结果返回给用 户,服务方式为面向网页的全文检索。严格意义上来讲,Meta搜索引擎只能算是一种 用户代理,而不是真正的搜索引擎
这类搜索引擎的优点是返回结果的信息量更大、更全,缺点是不能够充分使用所使用 搜索引擎的功能,用户需要做更多的筛选。
其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂 直搜索引擎则显得更加专注、具体和深入。(例如:机票搜索,旅游搜索、生活搜索、小说 搜索、视频搜索等等)

网络信息检索(一).ppt

网络信息检索(一).ppt


如:/index.php
10
2007
1.4 域名与网络信息资源有什么关系?
由于Internet最初是在美国发源的,因此最早的域名并无国家标识,人 们按用途把它们分为几个大类,它们分别以不同的后缀结尾:
.com 商业公司
.edu 教育机构
.org 组织、协会等
17
2007
2.3 网络信息资源的特点




复杂性:网络信息资源具有大数量、多类型、多媒体、非规范、跨 时间、跨地域、跨行业、多语种等特点。 在很大程度上网络的增长和信息资源的动态快速增加是由用户驱动 的,但缺乏有效的统一管理机制,信息安全和信息质量的不均衡性。 信息分布和构成缺乏结构和组织,信息源不仅分散无序,而且其更 跌和消亡也往往无法预测,因此增大了信息资源管理和利用的难度。 信息发布具有很大的自由性和任意性,隐私型信息进入了公共信息 传播渠道;由于缺乏必要的过滤、质量控制和管理机制,不仅学术 信息、商业信息,政府信息、个人信息、不合适(反动、黄色)的 信息混为一体,质量良莠不齐。增加了信息识别和利用的难度。
30个月全球网站数量翻一番总数已突破1亿大关 【2006年11月03日】
18
2007




正式出版物和非正式信息交流交织在一起,使传统的 人类信息交流链的格局被打破,各方在网络上既可以 是信息的生产者、发布者,也可以是传播者和使用者, 对学术交流环境和信息利用产生了深刻的影响。 网络营造了“地球村”,既极大地促进了人类信息资 源的共享,又带来了一些意想不到的问题,如文化冲 突、信息侵略、信息威慑等。 使用成本低 共享程度高 是信息资源的宝库……
15
2007
2.2 网络信息资源的类型

网络信息资源检索PPT课件

网络信息资源检索PPT课件
2
数字信息资源的特点
存储介质和传播形式发生变化
将文字,图像及各类音像资料中的声音动态图像结 合在一起,利用数字技术进行制作存储在光盘,磁盘, 硬盘等载体上
以多媒体作为内容特征
集文本图片,动态图像,声音超外国投资等多种形 式为一体
信息资源类型多种多样
包括数据库,电子期刊,电子图书,电子报纸,专 利等正式出版物,以及学位论文,教学课件等灰色文 献
多层次的信息服务功能
检索功能,学科导航,分类主题指南,网上讨论等
3
数字信息资源的特点
更新速度快,时效性强 具备检索系统 不受时间,地域限制。
4
数字信息资源的产生与发展
1960年代初,“化学题录”和“医学索引” 1965年以后,数据库联机检索开始出现,最著
名的如DIALOG,MEDLINE等, 1980年以后,由于卫生通信技术,光纤通信技
精选课件精选课件pptppt33存储介质和传播形式发生变化存储介质和传播形式发生变化将文字图像及各类音像资料中的声音动态图像结将文字图像及各类音像资料中的声音动态图像结合在一起利用数字技术进行制作存储在光盘磁盘合在一起利用数字技术进行制作存储在光盘磁盘硬盘等载体上硬盘等载体上以多媒体作为内容特征以多媒体作为内容特征集文本图片动态图像声音超外国投资等多种形集文本图片动态图像声音超外国投资等多种形式为一体式为一体信息资源类型多种多样信息资源类型多种多样包括数据库电子期刊电子图书电子报纸专包括数据库电子期刊电子图书电子报纸专利等正式出版物以及学位论文教学课件等灰色文利等正式出版物以及学位论文教学课件等灰色文多层次的信息服务功能多层次的信息服务功能检索功能学科导航分类主题指南网上讨论等检索功能学科导航分类主题指南网上讨论等精选课件精选课件pptppt44更新速度快时效性强更新速度快时效性强具备检索系统具备检索系统不受时间地域限制

网络信息检索4ppt课件共56页文档

网络信息检索4ppt课件共56页文档
6
网络信息资源检索基础
1. 网络基础 2. 网络信息资源概念、类型及其特点 3. 网络信息资源的评价与选择 4. 网络信息检索工具
7
1.网络基础知识
1.1 认识IP地址 ❖ 人们为了通信的方便给每一台计算机都事先分配一个类似
我们日常生活中的电话号码一样的标识地址,称作网络协 议地址,是分配给主机的一个32位地址,由4个字节组成。 分为动态IP地址和静态IP地址两种。动态IP地址指的是每 次连线所取得的地址不同,而静态IP地址是指每次连线均 为同样固定的地址。如在图书馆无线上网就是动态IP地址, 每次所取得的地址不同。 ❖ 静态地址如学校网站的IP 10.80.96.202 通常一经设定,变动较少。
sooyle/ ❖ 抽屉
chouti/ ❖ social bookmarking

5
个人仓库:网络存储空间、网络硬盘
❖ 存储你的文档 site./list/156wangluoyingpan.htm ❖ 超大邮箱
site./list/18youxiang.htm Live mail(原Hotmail) 5 GB(3个月不登录将自动 清除) ❖ 其实,有1个G就可以存很多文章了。

29、在一切能够接受法律支配的人类 的状态 中,哪 里没有 法律, 那里就 没有自 由。— —洛克

30、风俗可以造就法律,也可以废除 法律。 ——塞·约翰逊
网络信息检索
2010.9.16
2
信息检索能力的三个层次
1. 知道在哪里能找到信息(了解不同的信息源) 2. 能从信息源中检索出合适的信息(课题分析和检
网络信息检索4ppt课件

26、我们像鹰一样,生来就是自由的 ,但是 为了生 存,我 们不得 不为自 己编织 一个笼 子,然 后把自 己关在 里面。 ——博 莱索
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四讲
网络信息检索工具
知识总结
文献检索:
检索工具:线索性、参考性、全文数据库 检索语言:分类语言、主题语言
工具书:
参考性工具书:字词典、百科全书、年鉴等 线索性工具书:书目、索引、文摘
图书、期刊、学位论文、会议论文的线索性工具书及常用全文 数据库
专利、标准
专利基础知识与文献检索 标准基础知识与文献检索
(5)其他常用搜索引擎
1.
2. 万维搜索 3. 中国精彩网址:
网址之家: 4.中文搜索引擎指南:
搜索引擎直通车
七、教育信息源
(一)教育部网站 (二)中国开放教育资源协会 (三)中国教育在线 (四) 其他考研网站推荐
(一)教育部网站
地址:
(二)中国开放教育资源协会
例:“信息检索”
5、+,-的使用(加权检索)
+:该词一定要出现在检索结果中 例:+信息管理
-:该词一定不要出现在检索结果中 例:-知识管理
6、限定检索
限定字段、限定站点类型、限定数据类型、 限定日期、限定域名等
五、网络信息检索策略及其优化
1、构造检索策略的步骤:
(1)分析课题,明确检索目标。 (2)选择网络检索工具或数据库。 (3)分析概念,选择检索词。 (4)构造检索式。 (5)检索并优化检索策略。
org 非营利组织 gov 政府部门 int 国际组织 info 信息机构
一、网络信息资源的特点
1、优点:
(1)信息量大,传播广泛 (2)信息层次多,品种多样 (3)自由发布,交流直接 (4)信息传播速度快,变化频繁 (5)检索方便,价廉实惠
中国互联网络信息中心
2、缺点:
(1) 信息庞杂,分散无序 (2) 质量不一,缺乏管理 (3) 重复建设,缺乏宏观调控 (4) 网络通路不畅
本讲主要内容
网络信息检索工具相关问题 教育、新闻、软件信息源等
几个常用术语
(1)Web站点:
若将WWW看成Internet上的大型图书馆,则每 个Web站点就是一本书。
(2)主页或首页(Homepage):
主页就是该书(Web站点)的封面和目录或是 整个网络文件的起始页。
(3)Web页或网页:
2、优化检索策略的方法
(1)若检索结果太多,应缩检,提高查准率
➢ 使用逻辑非剔除无关内容 ➢ 将AND算符改为更严格的位置算符 ➢ 提高检索词专指度,用规范词、下位类词 ➢ 限定检索,例限定字段、语种、时间等 ➢ 精确检索
(2)若检索结果太少,应扩检,提高查全率
➢ 多用OR ➢ 改变位置算符的严格程度 ➢ 使用检索词的同义词、近义词、上位类词 ➢ 使用截词符,以检出所有词干相同的词 ➢ 选择更合适的网络检索工具与数据库
新闻是事实报道之源,我们应该找那些新 闻发布最快、最全、最权威的源。
(China Open Resources for Education, CORE)成立于2003年10月。
宗旨:共享教育资源,提高教育质量。
网址:
内容:包括以MIT为代表的世界一流大学的 2000多门开放课程,上千门的中国精品课程以 及大量国外大学网站。
(三)中国教育在线
八、新闻信息源
每个Web页面就是其中的一张书页,是网络文 件的组成部分。
(4)统一资源定位器(URL),也称网址
信息资源在网上的地址,用来定位和检索WWW 上的文档。资源类型+主机名(服务器域名) +子目录 (可选)+文件名(可选)。例:
(5)常用域名代码
com 商业机构 edu 教育机构 net 网管组织 mil 军事部门
特点:自动采集、索引、检索、输出 典型代表: google、天网等
3、多元搜索引擎(关键词)
特点:多个搜索引擎的集成、统一输出界面 典型代表:万纬搜索、搜星等
目录检索、关键词检索比较:
✓ 目录(分类)检索:用于目标模糊、主题
较宽泛、某专业网站或网页的查找;要求查 准时选用。
✓ 关键词(主题)检索:用于目标明确、主
题较狭窄、知识点或事实数据等网页的查找; 要求查全时选用。
四、网络信息检索技巧与方法
1、布尔逻辑检索
(1)逻辑“与” 用and,*,&,×表示
A and(*,&,×) B
(2)逻辑“或” 用or,+,∣表示
AB
A (+, ∣) B
(3)逻辑“非” 用not,- ,!表示
AB
A not(-,!)B
(2) Google()
“手气不错” 自动将您带到Google推荐的网页。 空格即代表and 或者检索:OR必须大写 支持“-”功能,但减号之前必须留一空格。 对大小写不敏感 专用词语上加上双引号 “网页快照”从服务器里直接取出缓存的网页。先顺序not,and,or 有(),先内后外 例:计算机信息检索
2、位置算符检索
(1)(W)-with 例:information(W)retreval
(2)(nW)-nWords 例:electronic(2W)resources
(3)(N)-Near 例:junior(N)high
二、网络信息资源的组织方式
1、自由文本方式: ——全文数据库的组织
2、主页方式: ——对各类对象作全面介绍
3、超文本方式: ——将信息组织为网络结构
三、网络信息检索工具的类型及特点
1、目录型搜索引擎(分类)
特点:人工采集、分类、编制 典型代表: Yahoo! 、搜狐等
2、机器人搜索引擎(关键词)
(4)(nN)-nNear 例: information(3N)retreval
(5)(F)—Field 例: information(F)retreval
3、截词检索
通用截词符:?或 *
❖ 按截词位置分:左截断、右截断、
中截断、左右截断
❖ 按截词字符多少:有限截词
无限截词
4、词组检索(精确检索):用“”
“-”减除无关资料 A | B代表A or B。 相关检索:为您提供"其它用户搜索3搜索、图片搜索、Flash搜索
(4)天网(/)
主要检索中国教育和科研网上的web资源 主要提供内容检索 FTP文件检索 信息博物馆 空格表示and 支持“”功能 不区分字母的大小写
相关文档
最新文档