第四讲_网络信息检索工具1

合集下载

第四讲网络信息检索工具1精品PPT课件

第四讲网络信息检索工具1精品PPT课件
第四讲
网络信息检索工具
知识总结
文献检索:
检索工具:线索性、参考性、全文数据库 检索语言:分类语言、主题语言
工具书:
参考性工具书:字词典、百科全书、年鉴等 线索性工具书:书目、索引、文摘
图书、期刊、学位论文、会议论文的线索性工具书及常用全文 数据库
专利、标准
专利基础知识与文献检索 标准基础知识与文献检索
(5)其他常用搜索引擎
1.
2. 万维搜索 3. 中国精彩网址:
网址之家: 4.中文搜索引擎指南:
搜索引擎直通车
七、教育信息源
(一)教育部网站 (二)中国开放教育资源协会 (三)中国教育在线 (四) 其他考研网站推荐
(一)教育部网站
地址:
(二)中国开放教育资源协会
例:“信息检索”
5、+,-的使用(加权检索)
+:该词一定要出现在检索结果中 例:+信息管理
-:该词一定不要出现在检索结果中 例:-知识管理
6、限定检索
限定字段、限定站点类型、限定数据类型、 限定日期、限定域名等
五、网络信息检索策略及其优化
1、构造检索策略的步骤:
(1)分析课题,明确检索目标。 (2)选择网络检索工具或数据库。 (3)分析概念,选择检索词。 (4)构造检索式。 (5)检索并优化检索策略。
org 非营利组织 gov 政府部门 int 国际组织 info 信息机构
一、网络信息资源的特点
1、优点:
(1)信息量大,传播广泛 (2)信息层次多,品种多样 (3)自由发布,交流直接 (4)信息传播速度快,变化频繁 (5)检索方便,价廉实惠
中国互联网络信息中心
2、缺点:
(1) 信息庞杂,分散无序 (2) 质量不一,缺乏管理 (3) 重复建设,缺乏宏观调控 (4) 网络通路不畅

网络信息检索工具——搜索引擎.ppt

网络信息检索工具——搜索引擎.ppt

14
利用Google进行专题信息检索
1 简单专题信息检索及目录检索 接受一项简单专题,最直截了当就是在搜索框内输入一个 关 键 词 , 然 后 点 击 下 面 的 “ Google 搜 索 ” 按 钮 ( 或 者 直 接 回 车),结果就出来了。 如果对查询的领域熟悉,只想寻找某些专题网站,首先考虑 用目录检索。目录分类明确,则网站专题信息集中,剔除了大 量不相关的信息。不过对查找中文信息,Google的中文目录太 少只有非常普通简单的类目,可能很难满足需求(中文目录 “/Top/World/Chinese_Simplified/” )。
搜索器、分析器、索引器、检索器和用户接口。
同检索数据库一样,利用搜索工具检索,也需要用户能 够将自己的检索需求编制成合适的检索策略,并且需要 一定的检索技巧。
搜索引擎采用的检索词和信息标识词匹配运算的主要方 法有:布尔逻辑检索、截词检索、限制检索、加权检索、 词位置检索和全文检索等。
2019-8-17
感谢你的观看
2
搜索引擎分类
检索型搜索引擎:它使用自动索引软件来发现、收集并标 引网页,建立数据库,并以Web形式让用户找到所需信息 资源。比较著名的有:引擎将信息系统地分门归类,经过 人工整理后形成庞大而有序的分类目录体系,用户可以在 目录体系的导引下通过逐级浏览,发现、检索到有关的信 息。雅虎就是以卓越的分类目录型导航服务而称誉全球。
-横向相关查询: 当用户找到某个感兴趣的网页,搜索引擎提供查询内容近似的其 他网页的功能(不限于同一网站)。一般是在信息条目后面给出 “Similar Pages”或“More results like this”链接。 -除上述功能外,现在搜索引擎都纷纷开始提供分类搜索,如新 闻搜索、图象搜索、新闻组搜索、Flash搜索等等。

第4章网络信息资源检索精品PPT课件

第4章网络信息资源检索精品PPT课件
(4)inurl:限制你搜索的关键词出现在网 页的url中。
• 例:搜索网页url中含有“mp3”的网页,输入: “inurl:mp3”。
(5)link:可以得到一个所有包含了某个指 定URL的页面列表.
• 例如:link: 就可以得到所有连接到Google的 页面。
12
单击中文主页,单击 in English链接进入英文界面。英文界面还有 更多功能:
第4章 网络信息资源检索
4.1 概述 4.2 网络检索工具—搜索引擎 4.3 综合性搜索引擎 4.4 专业性搜索引擎 4.5 特色搜索引擎
1
4.1.1 网络信息资源的定义、特点
定义:
• 从字面上理解,网络信息资源是指“通过计算 机网络可以利用的各种信息资源的总和”。具 体的说是指所有以电子数据的形式把文字、图 像、声音、动画等多种形式的信息存贮在光、 磁等非纸介质的载体中,并通过网络通信、计 算机或终端等方式再现出来的资源 。
(5)信息分散、无序。互联网是一个基于TCP/IP协议的联结各国、各 机构数以万计的计算机网络的通信网,对网络信息资源本身的组织管 理无统一标准和规范,网络信息分散于不同国家、不同地区服务器上, 采用不同的操作系统及数据结构,字符界面、图形界面、菜单方式、 超文本方式等,缺乏集中统一的管理机制。
3
4.1.2 网络信息资源的类型
• 例2:搜索包含“网络安全”方面的powerpointer文 件。输入:网络安全。
• 例3:搜索包含“搜索引擎”方面的pdf文件。输入: 搜索引擎。
11
(3)intitile:限制你搜索的关键词出现在 网页标题中。
• 例:搜索网页标题中含有“信息检索”的网页, 输入:“intitile:信息特点:

第四讲网络信息检索

第四讲网络信息检索

二、网络信息检索的发展趋势
1、智能化 、 智能化是网络信息检索未来主要的发展方向。 智能化是网络信息检索未来主要的发展方向。智能检索 是基于自然语言的检索形式, 是基于自然语言的检索形式,机器根据用户所提供的以 自然语言表述的检索要求进行分析, 自然语言表述的检索要求进行分析,而后形成检索策略 进行搜索。 进行搜索。 2、可视化 、 信息检索中的可视化是将数据库中不可见的语义关系用 图像形式可视化显示并表达用户检索过程。 图像形式可视化显示并表达用户检索过程。在可视化空 间展示的信息可以看见它们是二维的或三维的。 间展示的信息可以看见它们是二维的或三维的。
Байду номын сангаас
Internet检索工具与技巧 检索工具与技巧
二、按专业范畴划分 1、综合性搜索引擎 主要以网页和新闻组为搜索对象,信息覆盖范围广, 主要以网页和新闻组为搜索对象,信息覆盖范围广, 适用用户广泛, 适用用户广泛,如Yohoo!, Alta Vista, Exite, Infoseek等 Infoseek等。 2、专业性搜索引擎 社会科学信息网关 医学世界检索 Deja News 搜索新闻信息的引擎 域名搜索引擎
Internet检索工具与技巧 检索工具与技巧
常见的通用域名: 常见的通用域名:
• • • • • • • • com 商业组织 biz 商业组织,有时也可用来代替.com 商业组织,有时也可用来代替 edu 教育机构 gov 政府组织 org 各式各样的组织 net 网络资源(网络化组织) 网络资源(网络化组织) int 国际组织 pro 医生和律师等职业 • • • • • • mil 军事机构 aoro 航空运输业 coop 商业合作社 info 信息机构 museum 博物馆 name 个人网站

网络信息检索及其检索工具

网络信息检索及其检索工具

摘要进入20世纪90年代以后,互联网的发展风起云涌,人类社会的信息化、网络化进程大大加快。

与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。

网络信息资源的迅猛增长,使人们获得有用信息越来越困难,网络检索工具应运而生,文章介绍了网络信息检索工具的类型和功能,提出了检索工具的发展趋势。

关键字:网络信息检索;检索工具;因特网;web资源检索目录摘要 (I)1 信息检索的定义 (1)2网络信息检索简介 (1)2.1网络信息检索定义 (1)2.2 网络信息检索的原理 (1)2.3网络信息检索与传统信息检索的区别 (2)2.4网络信息检索技巧 (2)3网络信息检索工具类型 (3)3.1非web资源检索工具 (3)3.2web资源检索工具 (3)4网络信息检索工具的功能 (4)5网络信息检索展望 (5)5.1网络信息检索的展望 (5)5.2网络信息检索工具展望 (5)参考文献 (6)浅谈网络信息检索及其检索工具1 信息检索的定义什麽是信息?信息是消息,人们在学习、工作、日常生活中随时随地都在接受和利用信息;信息是资源,它具有使用价值和价值;信息是财富,且是无价之财富;信息是生产力要素,更是一种不可估量的促进生产力发展的新动力。

因此,人类社会的发展,科技技术的进步,都离不开信息资源的开发和利用。

而且,信息资源的真实状况及开发利用程度,已经成为衡量一个国家经济、文化、科技以及综合国力的重要指标。

我们怎样快速的查找信息和有序的整理信息?信息检索是最快的途径。

信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。

人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。

网络信息检索工具与方法

网络信息检索工具与方法

安全象只弓,不拉它就松,要想保安 全,常 把弓弦 绷。20.10.3009:21:4409:21Oc t-2030- Oct-20
加强交通建设管理,确保工程建设质 量。09:21:4409:21:4409:21Fri day, October 30, 2020
安全在于心细,事故出在麻痹。20.10.3020.10.3009:21:4409:21:44October 30, 2020
如音乐、视频、其它文件压缩包)
NEXT
实常用的英文搜索引擎,如msn、google搜索等。 任选一个搜索引擎,查找以下信息资源并下载: (1)一个专业的音乐网站 (2)音频资源汤灿版“呼唤” (3)一张经典XP系统桌面 (4)北京电子地图 (5)影视文件《宝贝计划》的详细介绍 (6)电子图书《飘》 (7)游戏视频文件《剑侠情缘》的宣传片 (8)访问至少两个专业flash网站 (9)网页制作背景素材 (注意:关键词、辅助关键词的提炼、布尔检索式等检索技巧的利用)
踏实肯干,努力奋斗。2020年10月30日上午9时21分 20.10.3020.10.30
追求至善凭技术开拓市场,凭管理增 创效益 ,凭服 务树立 形象。2020年10月30日星期 五上午9时21分 44秒09:21:4420.10.30
严格把控质量关,让生产更加有保障 。2020年10月 上午9时 21分20.10.3009:21Oc tober 30, 2020
二、搜索引擎的构成及工作原理
信息资源搜集
各记录链接

访问

搜索

引擎
索 策 略
用户 接口
摘要信 息反馈
搜索引擎本地的 摘要信息数据库
各万维 网站点
资源
详细信息反馈

网络检索工具

网络检索工具

网络信息检索工具的类型信息检索的步骤一、分析研究课题,明确检索要求课题的主题内容、研究要点、学科范围、语种范围、时间范围、文献类型等二、选择信息检索系统,确定检索途径1、选择信息检索系统的方法:(1)在信息检索系统齐全的情况下,首先使用信息检索工具指南来指导选择;(2)在没有信息检索工具指南的情况下,可以采用浏览图书馆所的信息检索工具室所陈列的信息检索工具的方式进行选择;(3)从所熟悉的信息检索工具中选择;(4)主动向工作人员请教;(5)通过网络在线帮助选择。

2、选择信息检索系统的原则:(1)收录的文献信息需含盖检索课题的主题内容;(2)就近原则,方便查阅;(3)尽可能质量较高、收录文献信息量大、报道及时、索引齐全、使用方便;(4)记录来源,文献类型,文种尽量满足检索课题的要求;(5)数据库是否有对应的印刷型版本;(6)根据经济条件选择信息检索系统;(7)根据对检索信息熟悉的程度选择;(8)选择查出的信息相关度高的网络搜引引擎确定检索词的基本方法:选择规范化的检索词;使用各学科在国际上通用的、国外文献中出现过的术语作检索词;找出课题涉及的隐性主题概念作检索词;选择课题核心概念作检索词;注意检索词的缩写词、词形变化以及英美的不同拼法;联机方式确定检索词。

四、制定检索策略,查阅检索工具1、制定检索策略的前提条件是要了解信息检索系统的基本性能,基础是要明确检索课题的内容要求和检索目的,关键是要正确选择检索词和合理使用逻辑组配。

2、产生误检的原因可能有:一词多义的检索词的使用;检索词与英美人的姓名、地址名称、期刊名称相同;不严格的位置算符的运用;检索式中没有使用逻辑非运算;截词运算不恰当;组号前忘记输入指令“s”;逻辑运算符号前后未空格;括号使用不正确;从错误的组号中打印检索结果;检索式中检索概念太少。

3、产生漏检的原因或检索结果为零的原因可能有:没有使用足够的同义词和近义词或隐含概念;位置算符用得过严、过多;逻辑“与”用得太多;后缀代码限制得太严;检索工具选择不恰当;截词运算不恰当;单词拼写错误、文档号错误、组号错误、括号不匹配等。

《网络信息检索》课件

《网络信息检索》课件

常见的网络信息检索工具和平台
搜索引擎著名的搜索引擎包括、谷歌、必应,它 们提供全面的互联网信息检索服务。
学术搜索引擎学术搜索引擎如Google学术、学术专注 于学术文献和科研成果的检索。
社交媒体搜索
社交媒体搜索工具如Twitter搜索和微博热搜, 用于搜索和分析社交媒体上的内容。
专业数据库
专业数据库如PubMed和IEEE Xplore,提供 特定领域的学术文献和专业信息。
在线搜索引擎的基本原理和功 能
在线搜索引擎通过抓取和索引互联网上的网页,提供用户快速、准确的检索 功能。
如何使用在线搜索引擎进行检 索
使用关键词、引号、加号、减号等搜索运算符,可以帮助用户更精确地进行 在线搜索。
1
起源
网络信息检索起源于20世纪60年代的计算机科学研究,随着互联网的发展逐渐 成为重要的领域。
2
现状
今天,网络信息检索已经成为人们获取知识、解决问题、进行研究的重要途径, 搜索引擎已经成为人们生活中不可或缺的工具之一。
3
未来
随着技术的不断进步,网络信息检索将继续发展,面临着更多的挑战和机遇。
网络信息检索的应用场景
2 索引构建和优化
信息检索模型用于表示和处理文本数据, 包括向量空间模型和概率模型等。
索引是快速检索信息的关键组件,优化索 引结构和存储方式可以提高检索效率。
Байду номын сангаас
3 查询扩展和推荐
4 语义分析和自然语言处理
通过查询扩展和推荐算法,提供更准确、 丰富的搜索结果,帮助用户满足信息需求。
利用语义分析和自然语言处理技术,提高 搜索结果的准确性,理解用户的查询意图。
搜索引擎的高级查询技巧
高级查询技巧如限定范围、排除结果、使用通配符和搜索语法等,可以提高 搜索效果和准确性。

网络信息检索(一).ppt

网络信息检索(一).ppt


如:/index.php
10
2007
1.4 域名与网络信息资源有什么关系?
由于Internet最初是在美国发源的,因此最早的域名并无国家标识,人 们按用途把它们分为几个大类,它们分别以不同的后缀结尾:
.com 商业公司
.edu 教育机构
.org 组织、协会等
17
2007
2.3 网络信息资源的特点




复杂性:网络信息资源具有大数量、多类型、多媒体、非规范、跨 时间、跨地域、跨行业、多语种等特点。 在很大程度上网络的增长和信息资源的动态快速增加是由用户驱动 的,但缺乏有效的统一管理机制,信息安全和信息质量的不均衡性。 信息分布和构成缺乏结构和组织,信息源不仅分散无序,而且其更 跌和消亡也往往无法预测,因此增大了信息资源管理和利用的难度。 信息发布具有很大的自由性和任意性,隐私型信息进入了公共信息 传播渠道;由于缺乏必要的过滤、质量控制和管理机制,不仅学术 信息、商业信息,政府信息、个人信息、不合适(反动、黄色)的 信息混为一体,质量良莠不齐。增加了信息识别和利用的难度。
30个月全球网站数量翻一番总数已突破1亿大关 【2006年11月03日】
18
2007




正式出版物和非正式信息交流交织在一起,使传统的 人类信息交流链的格局被打破,各方在网络上既可以 是信息的生产者、发布者,也可以是传播者和使用者, 对学术交流环境和信息利用产生了深刻的影响。 网络营造了“地球村”,既极大地促进了人类信息资 源的共享,又带来了一些意想不到的问题,如文化冲 突、信息侵略、信息威慑等。 使用成本低 共享程度高 是信息资源的宝库……
15
2007
2.2 网络信息资源的类型

04第四章:信息检索工具

04第四章:信息检索工具
(1)Chang, D.H. (2000). Knowledge, culture, and identity: American influence on the development of Library and Information Science in South Korea. Unpublished doctoral dissertation①, Univ. of Texas at Austin
(1)王玲.基于知识发现的生物信息学.生物工程进展⑥,2000 ③,Vol.20 ①,No.3②:27-29④,ISSN 1003-3565 ⑤ (2)Guterman, L. The Promise and Peril of “Open Access”. Chronicle⑥ of Higher Education, January 30,2004③, 50 ①(21②):A10-12,A14④,ISSN : 0009-5982⑤
1.检索工具的概念
检索工具就是用来报道、存储和查找文献信息的信 息集合。
是在一次文献基础上加工、提炼、编辑而成的二次 文献,能使用户广、快、准、省(省时、省力、省 钱)地获取有关文献信息。
上一页
首页
下一页
4
一、手工检索工具
2.检索工具必须具备的基本条件
①收录有足够的文献,且这些文献都含有一定的情报量。 ②对所收录文献的各种外部特征和内容特征有详细描述,使成为一条
17
7.手工检索工具检索的基本途径
②文献内容特征检索途径
主题 标题词、叙词、单元词——主题途径 自然语言标识————————关键词途径 人工语言标识 学科分类号————分类途径 分子式、结构式索引—————其他途径
18
8. 手工检索工具的使用方法

网络信息检索的工具(一)

网络信息检索的工具(一)

网络信息检索的工具(一)摘要]搜索引擎是人们使用Internet信息资源的重要工具。

本文对目前的中文搜索引擎进行了简要的分析,指出了其存在的缺陷和发展的方向。

关键词]信息检索中文搜索引擎存在的问题发展方向随着Internet信息资源的迅速增长,如何在浩瀚的信息海洋中准确、方便、快速地找到自己所需的信息,成了迫切需要解决的问题,从1995年开始出现的信息检索工具——搜索引擎很好地解决了这一问题。

然而各种搜索引擎,特别是尚处于发展初期的中文搜索引擎还存在着很多的缺陷有待改进,本文旨在分析目前中文搜索引擎存在的主要问题,并为解决此类问题提出一些建议和方法。

一、搜索引擎的概念和及类型搜索引擎又称检索引擎,是指运行在Internet上,以信息资源为对象,以信息检索的方式为用户提供所需数据的服务系统,主要包括信息存取、信息管理和信息检索三大部分。

目前,中文搜索引擎主要有三种类型:目录式搜索引擎、机器人搜索引擎(又称全文搜索引擎)和元搜索引擎。

1.目录式搜索引擎。

目录式搜索引擎是以人工或半人工方式收集信息,建立数据库,由编辑人员在访问了某个web站点后,对该站点进行描述,并根据站点的内容和性质将其归为一个预先分好的类别。

由于目录式搜索引擎的信息分类和信息搜集有人的参与,其搜索的准确度较高,导航质量也不错。

但因其人工的介入,维护量大,信息量少,信息更新不及时都使得人们利用它的程度有限。

国内著名的新浪、搜狐、中文雅虎都属于这种类型。

2.机器人搜索引擎。

这是一种目前运用较广泛的搜索引擎。

国内以百度,google、天网为代表。

它是使用自动采集软件Robot,搜集和发现信息,并下载到本地文档库,再对文档内容进行自动分析并建立索引。

对于用户提出的检索要求,通过检索模块检索索引,找出匹配文档返回给用户。

机器人搜索引擎具有庞大的全文索引数据库。

其优点是信息量大,范围广,较适用于检索难以查找的信息或一些较模糊的主题。

缺点是缺乏清晰的层次结构,检索结果重复较多,需要用户自己进行筛选。

网络信息检索工具

网络信息检索工具

(3)以“|”表示逻辑“或” 使用“A|B”来搜索“或者包含词语A,或者包含词语B”的 网页。
如:毛泽东|毛主席
(4) intitle:在网页标题中搜索
在一个或几个关键词前加“intitle:”,可以限制只搜索网页 标题中含有这些关键词的网页。 如:intitle:上海世博会
利用intitle查找论文 直接找特定论文 除了找论文网站,我们也可以直接搜索 某个专题的论文。看过论文的都知道,一般的论文,都 有一定的格式,除了标题、正文、附录,还需要有论文 关键词,论文摘要等。其中, “关键词”和“摘要”是 论文的特征词汇。而论文主题,通常会出现在网页标题 中。
口号:确解用户之意,切返用户之需
(二)GOOGLE一般搜索技术
1.默认模糊搜索、默认拆分语句和过长的短语 2.如何精确搜索(短语搜索) 3.通配符*用法 4.点号匹配任意字符:. 5.布尔逻辑
与:空格、AND 或:OR、| 非:-(减号) 6.约束条件:+ 7.同义词:~ 8.数字范围:.. 9.括号:()
……
第二节 常用搜索引擎技巧分析
想一想:你用过哪些搜索引擎?
第二节 常用最大的中文搜索引擎、最大的中文以及服务 稳定的特点。
摄影 site: 在hao123中找摄影的网站
(6) “开始连接”、“正在连接”搜索免费电影
网络上有很多热心人提供免费电影的下载地址。为了表明 真实可靠,把下载过程也同时附上。现在最流行的下载工 具是flashget和迅雷。 Flashget下载开始就是“正在连接”, 迅雷则是“开始连接”。所以,可以用想找的电影名字, 加上“开始连接”或者“正在连接”,来寻找免费电影。
在索引数据库中搜索排序
当用户输入关键词搜索后,由搜索系统程序从网页索 引数据库中找到符合该关键词的所有相关网页。因为所有 相关网页针对该关键词的相关度早已算好,所以只需按照 现成的相关度数值排序,相关度越高,排名越靠前。

3.2.1 网络信息检索工具

3.2.1 网络信息检索工具
ห้องสมุดไป่ตู้
搜索引擎的分类
搜索引擎的分类 元搜索引擎: 元搜索引擎:
元搜索引擎又称为集合式搜索引擎, 元搜索引擎又称为集合式搜索引擎,是一种 调用其它独立搜索引擎的引擎,亦称“ 调用其它独立搜索引擎的引擎,亦称“搜索引擎之 母(The mother of search engines)”。在这里, ) 。在这里, 总的” 超越”之意, “元”(Meta)为“总的”、“超越”之意,元 ) 搜索引擎就是对多个独立搜索引擎的整合、调用、 搜索引擎就是对多个独立搜索引擎的整合、调用、 控制和优化利用。相对元搜索引擎, 控制和优化利用。相对元搜索引擎,可被利用的 独立搜索引擎称为“源搜索引擎” 独立搜索引擎称为“源搜索引擎”或“搜索资 源”。
搜索引擎的发展简史
搜索引擎的分类 按工作方式主要可分为三种:
• 全文搜索引擎 (Full Text Search Engine) ) • 目录式搜索引擎 (Search Index/Directory) ) • 元搜索引擎 (Meta Search Engine) )
搜索引擎的分类 全文搜索引擎: 全文搜索引擎
全文搜索引擎工作原理
搜索引擎的自动信息搜集功能分两种。 搜索引擎的自动信息搜集功能分两种。一种是定 期搜索,即每隔一段时间,搜索引擎主动派出“蜘蛛” 期搜索,即每隔一段时间,搜索引擎主动派出“蜘蛛” 程序,对一定IP地址范围内的互联网站进行检索, IP地址范围内的互联网站进行检索 程序,对一定IP地址范围内的互联网站进行检索,一 旦发现新的网站, 旦发现新的网站,它会自动提取网站的信息和网址加 入自己的数据库。另一种是提交网站搜索, 入自己的数据库。另一种是提交网站搜索,即网站拥 有者主动向搜索引擎提交网址,它在一定时间内( 有者主动向搜索引擎提交网址,它在一定时间内(2天 到数月不等)定向向该网站派出“蜘蛛”程序, 到数月不等)定向向该网站派出“蜘蛛”程序,扫描 并将有关信息存入数据库,以备用户查询。 并将有关信息存入数据库,以备用户查询。 当用户以关键词查找信息时, 当用户以关键词查找信息时,搜索引擎会在数据 库中进行搜寻,如果找到与用户要求内容相符的网站, 库中进行搜寻,如果找到与用户要求内容相符的网站, 便采用特殊的算法——通常根据网页中关键词的匹配 便采用特殊的算法 通常根据网页中关键词的匹配 程度,出现的位置/频次,链接质量等——计算出各网 程度,出现的位置/频次,链接质量等 计算出各网 页的相关度及排名等级,然后根据关联度高低,按顺 页的相关度及排名等级,然后根据关联度高低, 序将这些网页链接返回给用户。 序将这些网页链接返回给用户。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录(分类)检索:用于目标模糊、主题
较宽泛、某专业网站或网页的查找;要求查 准时选用。
关键词(主题)检索:用于目标明确、主
题较狭窄、知识点或事实数据等网页的查找;
要求查全时选用。
四、网络信息检索技巧与方法
1、布尔逻辑检索
(1)逻辑“与” 用and,*,&,×表示
A and(*,&,×) B
1、目录型搜索引擎(分类)
特点:人工采集、分类、编制 典型代表: Yahoo! 、搜狐等
2、机器人搜索引擎(关键词)
特点:自动采集、索引、检索、输出 典型代表: google、天网等
3、多元搜索引擎(关键词)
特点:多个搜索引擎的集成、统一输出界面 典型代表:万纬搜索、搜星等
目录检索、关键词检索比较:
七、教育信息源

(一)教育部网站


(二)中国开放教育资源协会
(三)中国教育在线/

(四) 其他考研网站推荐

(一)教育部网站

地址:

(二)中国开放教育资源协会

(China Open Resources for Education,

八、新闻信息源

新闻是事实报道之源,我们应该找那些新 闻发布最快、最全、最权威的源。


(一)新华网
(二)人民网

(三)光明网
(一)新华网

《半月谈》
Байду номын сангаас
可以作为考研时事政治复习资料。 中国国际报道 注重挖掘重大的独家新闻和组织重大主题报 道,注重对中国和世界重大事件的权威性深 度报道,注重对国内外政治经济社会现象和 发展趋势的准确性和前瞻性剖析。
使用逻辑非剔除无关内容 将AND算符改为更严格的位置算符
提高检索词专指度,用规范词、下位类词
限定检索,例限定字段、语种、时间等
精确检索
(2)若检索结果太少,应扩检,提高查全率
多用OR
改变位置算符的严格程度
使用检索词的同义词、近义词、上位类词 使用截词符,以检出所有词干相同的词 选择更合适的网络检索工具与数据库


支持“”功能
不区分字母的大小写
(5)其他常用搜索引擎
1. /
2. 万维搜索/ 3. 中国精彩网址:/ 网址之家:/ 4.中文搜索引擎指南:/ 搜索引擎直通车/
/
下次课实习课


熟悉网络检索工具(搜索引擎)的使用方法 与技巧,谈谈你的收获,分析其优缺点。 检索关于一条两会或地震的相关信息。
人民网() 光明网(

• •

2010年考研的相关政策与你的理想考研信息。 查找一个本专业或你感兴趣的应用软件,写 出其简介。 写在16开大小的纸张上。
3、截词检索
通用截词符:?或 *
按截词位置分:左截断、右截断、
中截断、左右截断
按截词字符多少:有限截词
无限截词
4、词组检索(精确检索):用“”
例:“信息检索”
5、+,-的使用(加权检索)
+:该词一定要出现在检索结果中 例:+信息管理 -:该词一定不要出现在检索结果中 例:-知识管理
6、限定检索
每个Web页面就是其中的一张书页,是网络文 件的组成部分。
(4)统一资源定位器(URL),也称网址
信息资源在网上的地址,用来定位和检索WWW
上的文档。资源类型+主机名(服务器域名) +子目录 (可选)+文件名(可选)。例:
/
/news/default.asp
提供“全文检索”和“旧报查询”。

九、软件工具


(一)华军软件园:
(二)天空软件园:


(三)迅雷在线:
(四)IT168下载频道:
(一)华军软件园:
中国互联网络信息中心
2、缺点:
(1) 信息庞杂,分散无序
(2) 质量不一,缺乏管理
(3) 重复建设,缺乏宏观调控
(4) 网络通路不畅
二、网络信息资源的组织方式
1、自由文本方式: ——全文数据库的组织 2、主页方式: ——对各类对象作全面介绍 3、超文本方式: ——将信息组织为网络结构
三、网络信息检索工具的类型及特点
(2)逻辑“或” 用or,+,∣表示 A or(+, ∣) B
A B
(3)逻辑“非”
用not,- ,!表示
A B
三者之间:
A not(-,!)B
无(),优先顺序not,and,or 有(),先内后外 例:计算机信息检索
2、位置算符检索
(1)(W)-with 例:information(W)retreval (2)(nW)-nWords 例:electronic(2W)resources (3)(N)-Near 例:junior(N)high (4)(nN)-nNear 例: information(3N)retreval (5)(F)—Field 例: information(F)retreval

“手气不错” 自动将您带到Google推荐的网页。


空格即代表and
或者检索:OR必须大写
支持“-”功能,但减号之前必须留一空格。
对大小写不敏感 专用词语上加上双引号 “网页快照”从服务器里直接取出缓存的网页。 检索结果按“重要性”排序(3)()“-”减除无关资料


A | B代表A or B。
相关检索:为您提供"其它用
新闻搜索、MP3搜索、图片搜索、Flash搜索
(4)天网(/)

主要检索中国教育和科研网上的web资源 主要提供内容检索 FTP文件检索 信息博物馆 空格表示and
CORE)成立于2003年10月。

宗旨:共享教育资源,提高教育质量。 网址: 内容:包括以MIT为代表的世界一流大学的 2000多门开放课程,上千门的中国精品课程以 及大量国外大学网站。

(三)中国教育在线/
(四)其他考研网站推荐

跨考网(/)


考研加油站()
考研共济网()

你来我网—考研天地 () 中国研究生招生信息网 ()
《环球》


《瞭望》

(二)人民网
包括人民日报在内的13种报纸和14种杂志的综合 网站,主页提供分类、主题、版次三种检索途径,非 常有利于回溯性检索。
(三)光明网

属光明日报集团,号称“知识分子的网上家园”,是报 纸刊登学术类文章的重要信息源。
第四讲
网络信息检索工具
知识总结

文献检索:

检索工具:线索性、参考性、全文数据库 检索语言:分类语言、主题语言

工具书:

参考性工具书:字词典、百科全书、年鉴等 线索性工具书:书目、索引、文摘

图书、期刊、学位论文、会议论文的线索性工具书及常用全文 数据库

专利、标准

专利基础知识与文献检索 标准基础知识与文献检索
(5)常用域名代码
com 商业机构 org 非营利组织
edu net mil
教育机构 网管组织 军事部门
gov 政府部门 int 国际组织 info 信息机构
一、网络信息资源的特点
1、优点:
(1)信息量大,传播广泛 (2)信息层次多,品种多样
(3)自由发布,交流直接
(4)信息传播速度快,变化频繁 (5)检索方便,价廉实惠 /
本讲主要内容

网络信息检索工具相关问题 教育、新闻、软件信息源等
几个常用术语
(1)Web站点:
若将WWW看成Internet上的大型图书馆,则每 个Web站点就是一本书。
(2)主页或首页(Homepage):
主页就是该书(Web站点)的封面和目录或是 整个网络文件的起始页。
(3)Web页或网页:
限定字段、限定站点类型、限定数据类型、 限定日期、限定域名等
五、网络信息检索策略及其优化
1、构造检索策略的步骤:
(1)分析课题,明确检索目标。 (2)选择网络检索工具或数据库。 (3)分析概念,选择检索词。 (4)构造检索式。 (5)检索并优化检索策略。
2、优化检索策略的方法
(1)若检索结果太多,应缩检,提高查准率
最知名的国内软件站点
(二)天空软件园:
(三)迅雷在线:
下载速度快
(四)IT168下载频道:
功能较多,特别是IT 培训很有用
网络优盘




六、常用网络检索工具
(1)Yahoo!
英 文: 简体中文:
1994.4由美籍华人杨致远等创建。 ——网上最早、最成功的目录型通用检索工具
14个主题逐级细分。 编辑人员采集信息、分析、标引、维护。
(2) Google()
相关文档
最新文档