第4章网络信息资源检索精品PPT课件
合集下载
现代信息检索简明教程第四章PPT课件
16
第三节 国内主要联机检索系统简介
一、万方数据资源系统 (一) 万方数据资源系统简介
万方数据资源系统 () 已相继推出4大类13个系列的科技和工商类数据库,上网 的数据库有百余个,上网的科技期刊 1000 多种,总记录 量达600万条以上,累计出版50余种CD-ROM光盘,在国内
外拥有用户万余家。
17
(二) 主要数据库产品介绍
(1) 中国企业、公司及产品数据库(CECDB中文版)
(2) 中国科学技术成果数据库(CSTAD) (3) 中国科技文献数据库(CSTDB)
(4) 中国学术会议论文数据库(CACP)
(5) 中国学位论文数据库(CDDB) (6) 中国化工产品供需厂商数据库(CPEDB) (7) 中国科技论文与引文分析数据库(CSTPC) (8) 《中国信息导报》(1979-1997年)光盘珍藏版
20
四、维普数据资讯系统检索
重庆维普资讯有限公司是科学技术部西南信息中心下属的 一家大型专业化数据公司,是中文期刊数据库建设事业的 奠基者。 目前国内常用的中国科技期刊全文数据库、中国科技期刊 引文数据库均为维普公司开发。维普系统也提供多种服务
方式,如网上包库、镜像站点及光盘服务等。
21
DIALOG系统工作时间很长,仅在北京时间星期 天下午6时至星期一凌晨2时停止开放,其他时间 均提供服务。
15
ቤተ መጻሕፍቲ ባይዱ
(二) OCLC FirstSearch
OCLC (Online Computer Library Center),即联 机计算机图书中心, OCLC 创建于 1967 年,是世界上 最大的文献信息服务机构之一。 使用 OCLC 产品和服务的用户已有 70 多个国家和地 区的38000多个图书馆和教育科研机构。 FirstSearch 系统可检索 70 多个数据库,其中的 30多个数据库可提供全文检索服务,总计包括7500 多 种期刊的联机全文和3 000多种期刊的联机电子映象, 达900多万篇全文文章。
因特网上信息检索(检索与原理)
搜索 蜘蛛程序自动 用关键字 引擎 搜索后产生索 或关键字 引数据库 表达式检 索
网页
较短
较大
量大
元搜 本身一般不带 用关键字 数据库 索引 或关键字 擎 表达式检 索
网页
较短 较大 量大 命中率可 (视被引 (视被引 (视被引 能稍高 用的搜索 用的搜索 用的搜索 引擎) 引擎) 引擎)
搜索引擎的发展趋势
适合查找综合性、概括性的主题概念,或对检索准 确度要求较高的课题。 专题指南的局限性在于其信息更新速度慢,跟不上 网络信息的发展。
数据库的规模相对较小,收录的网页数量和深度都 相对不足,用户很难检索到较专深的信息,比较容 易遗漏交叉相关信息 。
全文搜索引擎(一)
使用自动索引软件来发现、收集并标引网页, 建立数据库。它的Spider自动在因特网上漫游, 不断搜集各类新网址及网页,形成数以千万乃 至亿万条记录的数据库;它以Web形式提供给 用户一个检索界面,供用户输入检索关键词、 词组或短语等检索项,以其特定的检索算法代
如:雅虎、/ 新浪、 /
搜狐、 /
网易、 /
目录索引类搜索引擎二
目录索引类搜索引擎特点
比较适合用户进行笼统或较笼统的主题浏览和检索。
查准率较高,查全率较低。
C.爬虫 D.CuteFTP
4.下列不属于元搜索引擎特点的是( B.可同时搜索多个数据库 C.一般支持AND、OR、NOT等操作 D.一般只使用简单、直接的搜索策略
)。
A.搜索时,用户必须多次提交搜索请求
判断题
1.常用的两种搜索引擎是目录类搜索引擎和元搜索引擎。 ( ) 2.为了适应不同搜索群体的需要,许多搜索引擎一般都提 供多语种检索功能。( )
各个网站上,把网页抓下来, 并顺着上面的链接,持续不断 地抓取网页。如“网络机器 人”、“爬虫”、“蜘蛛”。
第四章 搜索引擎
优点:返回结果信息量更大,更全 缺点:用户要做过多筛选
本章内容
一、搜索引擎的概述 二、搜索引擎的检索方法和技巧(重点) 三、常用的搜索引擎简介 四、如何能有效检索 五、搜索引擎目前存在的问题和未来趋势
二、搜索引擎的检索方法和技巧※
(一)搜索引擎的检索方法 1、单词检索 2、词组检索 3、布尔逻辑检索 4、截词检索 5、限定检索 6、字母大小写 7、名词检索 8、检索结果的显示
强制搜索
如果要对忽略的关键字进行强制搜索,则需要在该关键 字前加上明文的“+”号。 比如:搜索关于www起源的一些历史资料搜索:则我们可 以用下面的检索式进行搜索:
+www +的历史 internet
另一个强制搜索的方法是把上述的关键字用英文双引号 引起来。 例如上面的够访问超过10亿的中文网页.
首本检索
布尔逻辑算法 在结果中检索 相关搜索 错别字提示 汉语拼音提示
检索结果
检索结果 标题 文件格式 摘要 网查信息 针对教育网站搜索(),专门 有大学搜索()
(二)谷歌(http:)
特点:具有界面简洁、检索精确度高、质量高等优 点
概况
Sergey Brin
Larry Page
概况
Google名字的由来: Googol表示10的100次幂, 这一术语体现了公司整合网上海量信息的远 大目标。
三、常用的搜索引擎简介(一)() (二)Google() (三)北大天网() (四)雅虎 (中文版: .cn
英文版:)
高级检索
Intitle
把搜索范围限 定在网页标题 中,“intitle:” 和后面的关键 词之间不要有 空格。 如:intitle:周杰伦
高级检索
site: 搜索范围限定在特定站点中,可以提高查询效
本章内容
一、搜索引擎的概述 二、搜索引擎的检索方法和技巧(重点) 三、常用的搜索引擎简介 四、如何能有效检索 五、搜索引擎目前存在的问题和未来趋势
二、搜索引擎的检索方法和技巧※
(一)搜索引擎的检索方法 1、单词检索 2、词组检索 3、布尔逻辑检索 4、截词检索 5、限定检索 6、字母大小写 7、名词检索 8、检索结果的显示
强制搜索
如果要对忽略的关键字进行强制搜索,则需要在该关键 字前加上明文的“+”号。 比如:搜索关于www起源的一些历史资料搜索:则我们可 以用下面的检索式进行搜索:
+www +的历史 internet
另一个强制搜索的方法是把上述的关键字用英文双引号 引起来。 例如上面的够访问超过10亿的中文网页.
首本检索
布尔逻辑算法 在结果中检索 相关搜索 错别字提示 汉语拼音提示
检索结果
检索结果 标题 文件格式 摘要 网查信息 针对教育网站搜索(),专门 有大学搜索()
(二)谷歌(http:)
特点:具有界面简洁、检索精确度高、质量高等优 点
概况
Sergey Brin
Larry Page
概况
Google名字的由来: Googol表示10的100次幂, 这一术语体现了公司整合网上海量信息的远 大目标。
三、常用的搜索引擎简介(一)() (二)Google() (三)北大天网() (四)雅虎 (中文版: .cn
英文版:)
高级检索
Intitle
把搜索范围限 定在网页标题 中,“intitle:” 和后面的关键 词之间不要有 空格。 如:intitle:周杰伦
高级检索
site: 搜索范围限定在特定站点中,可以提高查询效
第四章 网络教育资源的检索与利用
搜索引擎(Search engine)使用自动索引软件 来发现、收集并标引网页、建立数据库。以网页 形式提供给用户一个检索界面,供用户输入检索 关键词、词组或短语等检索项。代替用户在数据 库中查找出与其提问匹配的记录并返回结果,且 按其相关度排序输出。
教育网站 电子书籍 网上教育教学 信息资源
数据库
电子论坛
电子期刊
虚拟软件库
电子百科
虚拟图书馆
(一)电子书籍/电子图书 现在网上电子书籍的类型主要是那些名家的经 典著作,如莎士比亚的著作。中文电子书也不在少 数,如北极星书库()收 集有数千种中文书籍。 目前,使用网上的电子书籍通常是免费的,然 而,随着读者越来越多地利用网上资源以及相应的 有关版权法修改的问题,预计将来有可能实行收费 制度。事实上,国外正在形成网上电子书出版业。 几个比较著名的电子图书网站: 超星数字图书馆(/) 网络中国电子图书网()
(六)教育网站
教育网站是一个广泛的概念,目前尚无统一的分类办法。我方 便起见,我们暂时列出一些主要的类型: (1)教学类。这类网站提供比较完整的课程教学或辅导,从一 门、数门到上百门不等。通常称之为网校。
(网易公开课:) (101网校: /) (2)教育类。此类网站把目标瞄准课外、校外教育,如社区教
三、教育/学资源的特点
1.信息显示的多媒化。 2.信息处理的数字化。 3.信息检索超媒体化。 4.信息来源的全球化。 5.信息传递及时性。 6.信息共享开放性。
四、常用的网络教育/学资源
尽管相对于Internet 网络上的所有信息,教育教学信息 资源只占很少的一部分,但相对我们的需要来说已经够多 的了。我们将Internet 中的教育教学信息资源分成下列 八大类:电子书籍、电子期刊、数据库、虚拟图书馆、电 子百科、教育网站、虚拟软件库和电子论坛,如下图所示:
教育网站 电子书籍 网上教育教学 信息资源
数据库
电子论坛
电子期刊
虚拟软件库
电子百科
虚拟图书馆
(一)电子书籍/电子图书 现在网上电子书籍的类型主要是那些名家的经 典著作,如莎士比亚的著作。中文电子书也不在少 数,如北极星书库()收 集有数千种中文书籍。 目前,使用网上的电子书籍通常是免费的,然 而,随着读者越来越多地利用网上资源以及相应的 有关版权法修改的问题,预计将来有可能实行收费 制度。事实上,国外正在形成网上电子书出版业。 几个比较著名的电子图书网站: 超星数字图书馆(/) 网络中国电子图书网()
(六)教育网站
教育网站是一个广泛的概念,目前尚无统一的分类办法。我方 便起见,我们暂时列出一些主要的类型: (1)教学类。这类网站提供比较完整的课程教学或辅导,从一 门、数门到上百门不等。通常称之为网校。
(网易公开课:) (101网校: /) (2)教育类。此类网站把目标瞄准课外、校外教育,如社区教
三、教育/学资源的特点
1.信息显示的多媒化。 2.信息处理的数字化。 3.信息检索超媒体化。 4.信息来源的全球化。 5.信息传递及时性。 6.信息共享开放性。
四、常用的网络教育/学资源
尽管相对于Internet 网络上的所有信息,教育教学信息 资源只占很少的一部分,但相对我们的需要来说已经够多 的了。我们将Internet 中的教育教学信息资源分成下列 八大类:电子书籍、电子期刊、数据库、虚拟图书馆、电 子百科、教育网站、虚拟软件库和电子论坛,如下图所示:
第四章网络信息检索(1)(1)
• 支持模糊检索网络系统一旦发现拼写、扫联机检索系统
• 主要运用于集合型网络信息检索系统 • 技术关键:A、对标引机制和检索功能相异的网络系统 的使用 采用尽量简单的检索式 B、对来自不同网络系统的检索结果的整合 去重合并
检索技术对查准率和查全率的影响
截词检索
• 截词是指检索者将检索词在他认为合适的地方 截断。 • 截词检索就是用截断的词的一个局部进行的检 索,并认为凡满足这个局部中的所有字符的文 献,都为命中的文献。 • 截词可分为前、中、后截词,又可分为有限截 词和无限截词,通常用“*”表示有限截词, 用“?”表示无限截词。
相关反馈
• 根据对检得结果的分析和计算,抽取有助于提 高检索结果相关度的关键词,将它们用于原有 检索式的修改,然后再据些检索更多的相关结 果。
网络信息资源
• 通过计算机网络可以利用的各种信息资源的总和, 即以数字化形式记录的,以多媒体形式表达的, 分布式存储在网络计算机的存储介质以及种类通 信介质上,并通过计算机网络通信方式进行传递 的信息内容的集合。
网络信息资源特点
• 信息量大、传播广泛
• 信息类型多样、内容丰富
• 信息时效性强、动态和不稳定
• 整个过程由系统自动完成。
• 提高查全率
• 例:sogou
加权检索
• 根据检索要求,赋予同一检索式中各个 检索词以不同的权数。 • 以数字(如:1,2,3,其中3为最高权 数)或符号(如:*)表示。
• 例:金融危机影响:金融危机+影响
模糊检索
• 自动纠正在输入数据库信息和检索式过程中产 生的错误,以保证输入信息的正确性。
• 表达式: 检索词/基本索引字段
附加索引字段=检索词 例:Dialog联机检索系统中,基本索引字段代码: TI 题名、篇名 ID 标引词 AB 摘要 DE 主题词、叙词
• 主要运用于集合型网络信息检索系统 • 技术关键:A、对标引机制和检索功能相异的网络系统 的使用 采用尽量简单的检索式 B、对来自不同网络系统的检索结果的整合 去重合并
检索技术对查准率和查全率的影响
截词检索
• 截词是指检索者将检索词在他认为合适的地方 截断。 • 截词检索就是用截断的词的一个局部进行的检 索,并认为凡满足这个局部中的所有字符的文 献,都为命中的文献。 • 截词可分为前、中、后截词,又可分为有限截 词和无限截词,通常用“*”表示有限截词, 用“?”表示无限截词。
相关反馈
• 根据对检得结果的分析和计算,抽取有助于提 高检索结果相关度的关键词,将它们用于原有 检索式的修改,然后再据些检索更多的相关结 果。
网络信息资源
• 通过计算机网络可以利用的各种信息资源的总和, 即以数字化形式记录的,以多媒体形式表达的, 分布式存储在网络计算机的存储介质以及种类通 信介质上,并通过计算机网络通信方式进行传递 的信息内容的集合。
网络信息资源特点
• 信息量大、传播广泛
• 信息类型多样、内容丰富
• 信息时效性强、动态和不稳定
• 整个过程由系统自动完成。
• 提高查全率
• 例:sogou
加权检索
• 根据检索要求,赋予同一检索式中各个 检索词以不同的权数。 • 以数字(如:1,2,3,其中3为最高权 数)或符号(如:*)表示。
• 例:金融危机影响:金融危机+影响
模糊检索
• 自动纠正在输入数据库信息和检索式过程中产 生的错误,以保证输入信息的正确性。
• 表达式: 检索词/基本索引字段
附加索引字段=检索词 例:Dialog联机检索系统中,基本索引字段代码: TI 题名、篇名 ID 标引词 AB 摘要 DE 主题词、叙词
信息检索与运用PPT课件(共8章)第四章包罗万象的互联网络----网络信息资源检索
搜索范围控制
合理控制搜索范围有助于获取 相关信息,避免徒劳无功。可 以使用高级搜索选项来缩小搜 索范围。
ቤተ መጻሕፍቲ ባይዱ
信息内容评判
搜索到的信息需要仔细评判其 可信度和有效性,以免获取不 实或过时的信息。
版权和隐私问题
在浏览网络信息时,要注意遵 守相关的知识产权和隐私保护 法规。
网络信息资源的鉴别与评价
鉴别网络信息
数据库式网络信息资源
数据库式网络信息资源是利用数据库技术组织和存储的各种专业 知识和数据资源。它提供了持续更新和专业检索功能,涵盖了科 学、技术、医疗等各个领域的前沿信息。登录数据库可获得结构 化的、可靠的数据和知识,是学习和研究的宝贵来源。
多媒体网络信息资源
互联网已经成为人类最大规模的多媒体信息宝库。从文本、图像、音频到视频 ,各种格式的内容随时随地可以被获取和分享。这些丰富多彩的网络多媒体资 源为学习、工作和娱乐提供了无限可能。
1994年
Yahoo!和Excite等全文检索引擎相继问 世,开启了现代搜索引擎的发展。
1998年
Google推出了基于网页排名的全新技术 ,彻底革新了搜索引擎的工作机制。
网络搜索引擎的工作原理
数据收集
1
通过网络爬虫自动抓取网页内容
信息索引 2
对收集的数据进行结构化处理和存储
查询匹配 3
根据用户查询快速匹配相关内容
包罗万象的互联网络 网络信息资源检索
互联网为人们提供了海量、多样的信息资源。掌握有效的网络信息检索方法对 于获取所需信息至关重要。本章将介绍如何利用各种检索工具和方法高效地查 找和筛选所需的网络信息。
by
互联网 - 人类最大的信息资源
庞大信息库
网络信息资源的获取精品PPT课件
–注意 » “site:”后面跟的站点域名,不要带“http://” » site:和站点名之间,不要带空格。
❖ site可以检索某一网域内的内容 (domain) ▪ 关键词 site:.edu——在教育网(.edu)内查找,也 可以用doБайду номын сангаасai找资料要比常规链接的速度快 得多。
使用Intitle搜索学术论文
❖通过搜索引擎找到收集论文的网站,然后在这些 网站上查找需要的资料
▪ 使用“论文”做关键词即可
❖ 直接搜索某个专题的论文
▪ 学术论文都有一定的格式:标题、正文、附录、关键 词、摘要等
• 关键词和摘要是论文的特征词汇 • 论文标题通常会出现在网页标题中
▪ 比如:关键词 摘要 intitle:小学 信息技术整合
▪ 输入多个关键词搜索,可以获得更精确更丰富的搜索结果。
• 例如,搜索[日照 车管所]比搜索[日照车管所]可得到更多的搜索结 果。
• 当你要查的关键词较为冗长时,建议将它拆成几个关键词来搜索,词 与词之间用空格隔开。
• 多数情况下,输入两个关键词搜索,就已经有很好的搜索结果。搜索引擎的使用技巧(以为例)❖ “”——精确匹配
▪ 如果输入的查询词很长,在经过分析后,给出的 搜索结果中的查询词,可能是拆分的。
▪ 如果您对这种情况不满意,可以尝试让不拆分查 询词。给查询词加上双引号,就可以达到这种效果。
• 如:“日照植物园”,搜索结果中的五个字就不会idu为例)
❖ (|)——并行搜索
▪ 逻辑“或”的操作,使用“A | B”来搜索“或者包含 关键词A,或者包含关键词B”的网页。使用同义词作 关键词并在各关键词中使用“|”运算符可提高检索的 全面性。
• 如:“计算机|电脑”idu为例)
❖ site可以检索某一网域内的内容 (domain) ▪ 关键词 site:.edu——在教育网(.edu)内查找,也 可以用doБайду номын сангаасai找资料要比常规链接的速度快 得多。
使用Intitle搜索学术论文
❖通过搜索引擎找到收集论文的网站,然后在这些 网站上查找需要的资料
▪ 使用“论文”做关键词即可
❖ 直接搜索某个专题的论文
▪ 学术论文都有一定的格式:标题、正文、附录、关键 词、摘要等
• 关键词和摘要是论文的特征词汇 • 论文标题通常会出现在网页标题中
▪ 比如:关键词 摘要 intitle:小学 信息技术整合
▪ 输入多个关键词搜索,可以获得更精确更丰富的搜索结果。
• 例如,搜索[日照 车管所]比搜索[日照车管所]可得到更多的搜索结 果。
• 当你要查的关键词较为冗长时,建议将它拆成几个关键词来搜索,词 与词之间用空格隔开。
• 多数情况下,输入两个关键词搜索,就已经有很好的搜索结果。搜索引擎的使用技巧(以为例)❖ “”——精确匹配
▪ 如果输入的查询词很长,在经过分析后,给出的 搜索结果中的查询词,可能是拆分的。
▪ 如果您对这种情况不满意,可以尝试让不拆分查 询词。给查询词加上双引号,就可以达到这种效果。
• 如:“日照植物园”,搜索结果中的五个字就不会idu为例)
❖ (|)——并行搜索
▪ 逻辑“或”的操作,使用“A | B”来搜索“或者包含 关键词A,或者包含关键词B”的网页。使用同义词作 关键词并在各关键词中使用“|”运算符可提高检索的 全面性。
• 如:“计算机|电脑”idu为例)
网络信息资源检索的一般方法与技巧PPT课件
40
– 逻辑或(OR,+/|) A OR B(A + B,A | B)数据库中凡有检索词A或 者B,或同时有A和B的记录均为命中记录。 连接多个同义、近义、相关词,扩大检索范围 例:robot or android sensor + detector
41
– 逻辑非(NOT,-/!) A NOT B(A – B,A ! B)数据库中凡有检索词A而 不含检索词B的记录才为命中记录。 排除不希望出现的概念,增强检索的准确性 例:airplane not helicopter energy - nuclear
网络信息资源检索的一般方 法与技巧
信息管理系
1
整体概述
概述一
点击此处输入
相关文本内容
概述二
点击此处输入
相关文本内容
概述三
点击此处输入
相关文本内容
2
网络信息资源检索的一般方法与 技巧
• 分析问题 • 选择检索工具 • 确定检索入口 • 确定检索词 • 构造检索表达式 • 实施检索并修改检索策略
3
4
录、档案文号目录等 – 中文目录、西文目录、日文目录、少数民族文
字目录等
11
• 书目:
– 指一批相关文献的记录,其基本功能是反映某 一地区、某一时期在某一领域中出版物的信息 。
• 索引
– 揭示文献内容出处、提供文献查考线索的检索 工具,包括篇目索引和内容索引。
12
• 文摘
– 是一种既揭示文献外部特征、又通过摘录文献 要点报道文献内容的检索工具。
检索工具
词典 引语工具书
提供具体信息的参 考型检索工具
百科全书、类书、政书 传记资料 手册
机构名录
地理资料
– 逻辑或(OR,+/|) A OR B(A + B,A | B)数据库中凡有检索词A或 者B,或同时有A和B的记录均为命中记录。 连接多个同义、近义、相关词,扩大检索范围 例:robot or android sensor + detector
41
– 逻辑非(NOT,-/!) A NOT B(A – B,A ! B)数据库中凡有检索词A而 不含检索词B的记录才为命中记录。 排除不希望出现的概念,增强检索的准确性 例:airplane not helicopter energy - nuclear
网络信息资源检索的一般方 法与技巧
信息管理系
1
整体概述
概述一
点击此处输入
相关文本内容
概述二
点击此处输入
相关文本内容
概述三
点击此处输入
相关文本内容
2
网络信息资源检索的一般方法与 技巧
• 分析问题 • 选择检索工具 • 确定检索入口 • 确定检索词 • 构造检索表达式 • 实施检索并修改检索策略
3
4
录、档案文号目录等 – 中文目录、西文目录、日文目录、少数民族文
字目录等
11
• 书目:
– 指一批相关文献的记录,其基本功能是反映某 一地区、某一时期在某一领域中出版物的信息 。
• 索引
– 揭示文献内容出处、提供文献查考线索的检索 工具,包括篇目索引和内容索引。
12
• 文摘
– 是一种既揭示文献外部特征、又通过摘录文献 要点报道文献内容的检索工具。
检索工具
词典 引语工具书
提供具体信息的参 考型检索工具
百科全书、类书、政书 传记资料 手册
机构名录
地理资料
网络信息资源的使用及检索技巧PPT共63页
文 家 。汉 族 ,东 晋 浔阳 柴桑 人 (今 江西 九江 ) 。曾 做过 几 年小 官, 后辞 官 回家 ,从 此 隐居 ,田 园生 活 是陶 渊明 诗 的主 要题 材, 相 关作 品有 《饮 酒 》 、 《 归 园 田 居 》 、 《 桃花 源 记 》 、 《 五 柳先 生 传 》 、 《 归 去来 兮 辞 》 等 。
55、 为 中 华 之 崛起而 读书。 ——周 恩来
网络信息资源的使用及检索技巧
6
、
露
凝
无
游
氛
,
天
高
风
景
澈
。
7、翩翩新 来燕,双双入我庐 ,先巢故尚在,相 将还旧居。
8
、
吁
嗟
身
后
名
,
于
我
若
浮
烟
。
9、 陶渊 明( 约 365年 —427年 ),字 元亮, (又 一说名 潜,字 渊明 )号五 柳先生 ,私 谥“靖 节”, 东晋 末期南 朝宋初 期诗 人、文 学家、 辞赋 家、散
1
0、倚源自南窗以寄
傲
,
审
容
膝
之
易
安
。
谢谢!
51、 天 下 之 事 常成 于困约 ,而败 于奢靡 。——陆 游 52、 生 命 不 等 于是呼 吸,生 命是活 动。——卢 梭
53、 伟 大 的 事 业,需 要决心 ,能力 ,组织 和责任 感。 ——易 卜 生 54、 唯 书 籍 不 朽。——乔 特
55、 为 中 华 之 崛起而 读书。 ——周 恩来
网络信息资源的使用及检索技巧
6
、
露
凝
无
游
氛
,
天
高
风
景
澈
。
7、翩翩新 来燕,双双入我庐 ,先巢故尚在,相 将还旧居。
8
、
吁
嗟
身
后
名
,
于
我
若
浮
烟
。
9、 陶渊 明( 约 365年 —427年 ),字 元亮, (又 一说名 潜,字 渊明 )号五 柳先生 ,私 谥“靖 节”, 东晋 末期南 朝宋初 期诗 人、文 学家、 辞赋 家、散
1
0、倚源自南窗以寄
傲
,
审
容
膝
之
易
安
。
谢谢!
51、 天 下 之 事 常成 于困约 ,而败 于奢靡 。——陆 游 52、 生 命 不 等 于是呼 吸,生 命是活 动。——卢 梭
53、 伟 大 的 事 业,需 要决心 ,能力 ,组织 和责任 感。 ——易 卜 生 54、 唯 书 籍 不 朽。——乔 特
网络信息资源检索PPT课件
2
数字信息资源的特点
存储介质和传播形式发生变化
将文字,图像及各类音像资料中的声音动态图像结 合在一起,利用数字技术进行制作存储在光盘,磁盘, 硬盘等载体上
以多媒体作为内容特征
集文本图片,动态图像,声音超外国投资等多种形 式为一体
信息资源类型多种多样
包括数据库,电子期刊,电子图书,电子报纸,专 利等正式出版物,以及学位论文,教学课件等灰色文 献
多层次的信息服务功能
检索功能,学科导航,分类主题指南,网上讨论等
3
数字信息资源的特点
更新速度快,时效性强 具备检索系统 不受时间,地域限制。
4
数字信息资源的产生与发展
1960年代初,“化学题录”和“医学索引” 1965年以后,数据库联机检索开始出现,最著
名的如DIALOG,MEDLINE等, 1980年以后,由于卫生通信技术,光纤通信技
精选课件精选课件pptppt33存储介质和传播形式发生变化存储介质和传播形式发生变化将文字图像及各类音像资料中的声音动态图像结将文字图像及各类音像资料中的声音动态图像结合在一起利用数字技术进行制作存储在光盘磁盘合在一起利用数字技术进行制作存储在光盘磁盘硬盘等载体上硬盘等载体上以多媒体作为内容特征以多媒体作为内容特征集文本图片动态图像声音超外国投资等多种形集文本图片动态图像声音超外国投资等多种形式为一体式为一体信息资源类型多种多样信息资源类型多种多样包括数据库电子期刊电子图书电子报纸专包括数据库电子期刊电子图书电子报纸专利等正式出版物以及学位论文教学课件等灰色文利等正式出版物以及学位论文教学课件等灰色文多层次的信息服务功能多层次的信息服务功能检索功能学科导航分类主题指南网上讨论等检索功能学科导航分类主题指南网上讨论等精选课件精选课件pptppt44更新速度快时效性强更新速度快时效性强具备检索系统具备检索系统不受时间地域限制
数字信息资源的特点
存储介质和传播形式发生变化
将文字,图像及各类音像资料中的声音动态图像结 合在一起,利用数字技术进行制作存储在光盘,磁盘, 硬盘等载体上
以多媒体作为内容特征
集文本图片,动态图像,声音超外国投资等多种形 式为一体
信息资源类型多种多样
包括数据库,电子期刊,电子图书,电子报纸,专 利等正式出版物,以及学位论文,教学课件等灰色文 献
多层次的信息服务功能
检索功能,学科导航,分类主题指南,网上讨论等
3
数字信息资源的特点
更新速度快,时效性强 具备检索系统 不受时间,地域限制。
4
数字信息资源的产生与发展
1960年代初,“化学题录”和“医学索引” 1965年以后,数据库联机检索开始出现,最著
名的如DIALOG,MEDLINE等, 1980年以后,由于卫生通信技术,光纤通信技
精选课件精选课件pptppt33存储介质和传播形式发生变化存储介质和传播形式发生变化将文字图像及各类音像资料中的声音动态图像结将文字图像及各类音像资料中的声音动态图像结合在一起利用数字技术进行制作存储在光盘磁盘合在一起利用数字技术进行制作存储在光盘磁盘硬盘等载体上硬盘等载体上以多媒体作为内容特征以多媒体作为内容特征集文本图片动态图像声音超外国投资等多种形集文本图片动态图像声音超外国投资等多种形式为一体式为一体信息资源类型多种多样信息资源类型多种多样包括数据库电子期刊电子图书电子报纸专包括数据库电子期刊电子图书电子报纸专利等正式出版物以及学位论文教学课件等灰色文利等正式出版物以及学位论文教学课件等灰色文多层次的信息服务功能多层次的信息服务功能检索功能学科导航分类主题指南网上讨论等检索功能学科导航分类主题指南网上讨论等精选课件精选课件pptppt44更新速度快时效性强更新速度快时效性强具备检索系统具备检索系统不受时间地域限制
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(4)inurl:限制你搜索的关键词出现在网 页的url中。
• 例:搜索网页url中含有“mp3”的网页,输入: “inurl:mp3”。
(5)link:可以得到一个所有包含了某个指 定URL的页面列表.
• 例如:link: 就可以得到所有连接到Google的 页面。
12
单击中文主页,单击 in English链接进入英文界面。英文界面还有 更多功能:
第4章 网络信息资源检索
4.1 概述 4.2 网络检索工具—搜索引擎 4.3 综合性搜索引擎 4.4 专业性搜索引擎 4.5 特色搜索引擎
1
4.1.1 网络信息资源的定义、特点
定义:
• 从字面上理解,网络信息资源是指“通过计算 机网络可以利用的各种信息资源的总和”。具 体的说是指所有以电子数据的形式把文字、图 像、声音、动画等多种形式的信息存贮在光、 磁等非纸介质的载体中,并通过网络通信、计 算机或终端等方式再现出来的资源 。
(5)信息分散、无序。互联网是一个基于TCP/IP协议的联结各国、各 机构数以万计的计算机网络的通信网,对网络信息资源本身的组织管 理无统一标准和规范,网络信息分散于不同国家、不同地区服务器上, 采用不同的操作系统及数据结构,字符界面、图形界面、菜单方式、 超文本方式等,缺乏集中统一的管理机制。
3
4.1.2 网络信息资源的类型
• 例2:搜索包含“网络安全”方面的powerpointer文 件。输入:网络安全。
• 例3:搜索包含“搜索引擎”方面的pdf文件。输入: 搜索引擎。
11
(3)intitile:限制你搜索的关键词出现在 网页标题中。
• 例:搜索网页标题中含有“信息检索”的网页, 输入:“intitile:信息特点:
(1)数量庞大,增长迅速。最大的搜索引擎Google已收录200亿网页, 且每年以级数的速度在增长。据预测,式多样。通过因特网可以获取学习、娱乐、工作、生 活、购物等各方面的信息。另外,资源有有文本、视频、音频、动画 多种表现形式。
13
Google的免费软件:
桌面搜索:只有1.7MB。 Google 工具栏 Picasa 图片管理软件 Google talk:即时通讯软件。 Google Earth:基于卫星图片的地图软件。 Google SketchUp:3D作图软件。 Google Pack:Google发布的免费软件包。
• Blog Search:博客搜索,已支持中文检索。 • Book Search:Google的图书搜索。 • Froogle:Google的商品购物搜索引擎。 • Google Finance:财经搜索。 • Google Maps:Google的图书搜索。 • Google Video:Google的视频搜索。
2006年4月12日Google公司宣布Google 的全球中文名称正式取名为“谷歌”。
(屏蔽了一些网站)
10
网页搜索:支持以下几个高级命令检索:
(1) “site”表示搜索结果局限于某个具体网站 或者网站频道。
(2):搜索特定类型的文件。格式:“关键词 文件的扩展名”。
• 例1:搜索包含“电子商务”关键词的word文件。输 入:电子商务 。
• 从互联网上抓取网页 • 建立索引数据库 • 在索引数据库中搜索排序。
7
4.2.3 搜索引擎类型
按照信息搜集方法和服务提供方式的不同, 搜索引擎系统可以分为三大类:
• (1)目录式搜索引擎: • (2)全文搜索引擎: • (3)元搜索引擎:
超搜索---:网页数据库式分为:HTML、TXT、DOC 、PDF、 RM、 MP3……。
5
4.1.3 网络信息检索的一般方法
1.网上浏览
• (1)偶然发现。 • (2)顺“链”而行。
2.网络资源指南(目录型检索工具) 3.搜索引擎 4.图书馆网站的网络导航
6
4.2 网络检索工具—搜索引擎
4.2.1 搜索引擎概念 4.2.2 搜索引擎基本原理 搜索引擎的原理,可以看作三步:
(3)变化频繁,价值不一。比较大的网站的一般信息一般每天更新一次, 特别是新闻信息实时更新,大网站的内容更新快且真实可靠,小网站 或个人网站虽不乏优秀和可参考的信息,但质量良莠不齐。
(4)结构复杂,分布广泛。网络信息主要采取万维网网页形式—超链接 结构,但网上还有大量的FTP文件,论坛信息,新闻组信息,不同的 信息结构需要不同的检索工具。
8
4.3 综合性搜索引擎
4.3.4 搜狐搜狗的使用
9
4.3.1 Google的使用
两位斯坦福大学的博士生 Larry Page 和 Sergey Brin 在 1998 年创立了 Google。 Google是目前因特网上最大的搜索引擎
4
• 若按组织形式分,可将网络信息资源分为以下 三种类型:文件型、数据库型、超媒体型。
• 按时效性分,可将网络信息资源分为动态信息、 电子报纸、电子期刊、电子图书、联机馆藏目 录、联机数据库等。
• 按信息的媒体形式分为:文本信息、超文本信 息、多媒体信息。
• 按网络信息服务方式分为:网站信息、新闻组 信息、论坛信息、文件服务信息。
按人类信息交流的方式分类:
• 非正式出版信息。如电子邮件、电子会议、专题组和论坛、电子 公告板新闻等。
• 正式出版物。即用户可以查询到的各种数据库、联机杂志、电子 版工具书、报纸、专利信息等。
从网络信息检索角度,按信息查询方式对网络信息进行分 类:
• (1) 互联网(WWW)信息。 • (2) FTP信息。 • (3) Telnet信息。 • (4) USENET/Newsgroup信息资源。 • (5) USTSERV/Mailing List 信息。 • (6) Gopher信息。
• 例:搜索网页url中含有“mp3”的网页,输入: “inurl:mp3”。
(5)link:可以得到一个所有包含了某个指 定URL的页面列表.
• 例如:link: 就可以得到所有连接到Google的 页面。
12
单击中文主页,单击 in English链接进入英文界面。英文界面还有 更多功能:
第4章 网络信息资源检索
4.1 概述 4.2 网络检索工具—搜索引擎 4.3 综合性搜索引擎 4.4 专业性搜索引擎 4.5 特色搜索引擎
1
4.1.1 网络信息资源的定义、特点
定义:
• 从字面上理解,网络信息资源是指“通过计算 机网络可以利用的各种信息资源的总和”。具 体的说是指所有以电子数据的形式把文字、图 像、声音、动画等多种形式的信息存贮在光、 磁等非纸介质的载体中,并通过网络通信、计 算机或终端等方式再现出来的资源 。
(5)信息分散、无序。互联网是一个基于TCP/IP协议的联结各国、各 机构数以万计的计算机网络的通信网,对网络信息资源本身的组织管 理无统一标准和规范,网络信息分散于不同国家、不同地区服务器上, 采用不同的操作系统及数据结构,字符界面、图形界面、菜单方式、 超文本方式等,缺乏集中统一的管理机制。
3
4.1.2 网络信息资源的类型
• 例2:搜索包含“网络安全”方面的powerpointer文 件。输入:网络安全。
• 例3:搜索包含“搜索引擎”方面的pdf文件。输入: 搜索引擎。
11
(3)intitile:限制你搜索的关键词出现在 网页标题中。
• 例:搜索网页标题中含有“信息检索”的网页, 输入:“intitile:信息特点:
(1)数量庞大,增长迅速。最大的搜索引擎Google已收录200亿网页, 且每年以级数的速度在增长。据预测,式多样。通过因特网可以获取学习、娱乐、工作、生 活、购物等各方面的信息。另外,资源有有文本、视频、音频、动画 多种表现形式。
13
Google的免费软件:
桌面搜索:只有1.7MB。 Google 工具栏 Picasa 图片管理软件 Google talk:即时通讯软件。 Google Earth:基于卫星图片的地图软件。 Google SketchUp:3D作图软件。 Google Pack:Google发布的免费软件包。
• Blog Search:博客搜索,已支持中文检索。 • Book Search:Google的图书搜索。 • Froogle:Google的商品购物搜索引擎。 • Google Finance:财经搜索。 • Google Maps:Google的图书搜索。 • Google Video:Google的视频搜索。
2006年4月12日Google公司宣布Google 的全球中文名称正式取名为“谷歌”。
(屏蔽了一些网站)
10
网页搜索:支持以下几个高级命令检索:
(1) “site”表示搜索结果局限于某个具体网站 或者网站频道。
(2):搜索特定类型的文件。格式:“关键词 文件的扩展名”。
• 例1:搜索包含“电子商务”关键词的word文件。输 入:电子商务 。
• 从互联网上抓取网页 • 建立索引数据库 • 在索引数据库中搜索排序。
7
4.2.3 搜索引擎类型
按照信息搜集方法和服务提供方式的不同, 搜索引擎系统可以分为三大类:
• (1)目录式搜索引擎: • (2)全文搜索引擎: • (3)元搜索引擎:
超搜索---:网页数据库式分为:HTML、TXT、DOC 、PDF、 RM、 MP3……。
5
4.1.3 网络信息检索的一般方法
1.网上浏览
• (1)偶然发现。 • (2)顺“链”而行。
2.网络资源指南(目录型检索工具) 3.搜索引擎 4.图书馆网站的网络导航
6
4.2 网络检索工具—搜索引擎
4.2.1 搜索引擎概念 4.2.2 搜索引擎基本原理 搜索引擎的原理,可以看作三步:
(3)变化频繁,价值不一。比较大的网站的一般信息一般每天更新一次, 特别是新闻信息实时更新,大网站的内容更新快且真实可靠,小网站 或个人网站虽不乏优秀和可参考的信息,但质量良莠不齐。
(4)结构复杂,分布广泛。网络信息主要采取万维网网页形式—超链接 结构,但网上还有大量的FTP文件,论坛信息,新闻组信息,不同的 信息结构需要不同的检索工具。
8
4.3 综合性搜索引擎
4.3.4 搜狐搜狗的使用
9
4.3.1 Google的使用
两位斯坦福大学的博士生 Larry Page 和 Sergey Brin 在 1998 年创立了 Google。 Google是目前因特网上最大的搜索引擎
4
• 若按组织形式分,可将网络信息资源分为以下 三种类型:文件型、数据库型、超媒体型。
• 按时效性分,可将网络信息资源分为动态信息、 电子报纸、电子期刊、电子图书、联机馆藏目 录、联机数据库等。
• 按信息的媒体形式分为:文本信息、超文本信 息、多媒体信息。
• 按网络信息服务方式分为:网站信息、新闻组 信息、论坛信息、文件服务信息。
按人类信息交流的方式分类:
• 非正式出版信息。如电子邮件、电子会议、专题组和论坛、电子 公告板新闻等。
• 正式出版物。即用户可以查询到的各种数据库、联机杂志、电子 版工具书、报纸、专利信息等。
从网络信息检索角度,按信息查询方式对网络信息进行分 类:
• (1) 互联网(WWW)信息。 • (2) FTP信息。 • (3) Telnet信息。 • (4) USENET/Newsgroup信息资源。 • (5) USTSERV/Mailing List 信息。 • (6) Gopher信息。