因特网信息资源检索
因特网信息资源检索与利用自考模拟卷-C[含答案]
理论部分一、选择题1.下列不属于因特网信息资源的特点的是()答案:CA、无限性和广泛性B、新颖性C、有序性D、共享性2.下列选项,不属于web资源的是()答案:DA、主页B、超文本传输协议C、浏览器D、ftp3.下列选项不属于因特网信息检索特点的是()答案:BA、检索范围大B、信息冗余小C、检索工具强大D、检索效率高4.下列不属于因特网信息资源检索方法的是()答案:DA、不依靠任何检索工具的浏览B、借助检索工具的浏览C、基于关键词的检索D、基于搜索引擎的检索5.下列不属于搜索引擎的是()答案:CA、B、C、D、6.以下关于谷歌搜索引擎说法错误的是()答案:BA、创建于1998年B、数据库规模仅次于ASKC、可以处理的特殊文档包括docD、支持不完整布尔检索7.以下关于雅虎中国目录搜索引擎说法错误的是()答案:DA、创建于1999年B、在中国里诞生C、支持一搜引擎D、支持完整布尔检索8.以下关于中文雅虎搜索引擎说法错误的是()答案:CA、创建于1999年B、一搜的域名挂接到中文雅虎C、不存在中文雅虎目录结构D、支持简单布尔检索9.下列不属于中文网络资源目录的是()答案:CA、B、C、D、10.下列关于元搜索引擎正确的是()答案:BA、基于浏览器的搜索引擎B、基于搜索引擎的搜索引擎C、显示结果只能展示原urlD、不可同时调用多个独立数据库11.下列属于常用All-in-one式元搜索引擎的是()答案:AA、B、C、D、12.下列不属于常用中文文献检索系统的是()答案:CA、CNKI平台B、NSTL网络服务系统C、OCLC FIrstSearchD、CSDL13.多媒体信息检索的类型不包括()答案:CA、图像B、视频C、pptD、音频14.以下不属于常用图像搜索引擎的是()答案:BA、B、C、D、15.以下文件格式中,不属于图像格式的是()答案:CA、jpgB、bmpC、txtD、png16.政府上网工程主站点正式开通运行()答案:CA、1995年B、1997年C、1999年D、2001年1、网上书店()是因特网上最大、最著名的图书及音像制作品销售公司答案:AA. 亚马逊网上书店B. 当当网上书店C. 卓越D. Barnes and Nobles2、中国旅游网的网址是( ) 答案:CA . B. C . D. 3、世界上最大的中文新闻搜索平台是()答案:DA. DaypopB. 谷歌新闻 C . 雅虎新闻 D.百度新闻4、下列不属于因特网信息资源特点是()答案:CA. 检索范围大B. 检索效率高C. 检索工具限制D. 信息冗余大5、检索功能直接影响信息检索的检全率,检准率,检索的灵活性,方便性以及(),是评价与选择因特网信息检索工具的核心指标答案:A A.检索速度B.检索范围C.检索技术D.检索限定6、检索功能评价指标可进一步细分为以下指标:()答案:DA. 检索限定 B . 检索技术 C . 检索方式 D. 以上都是7、以知识分类为基础,按学科性质及从属层次关系组织网络资源,类目排序以字顺标准分类是()答案:AA. 学科分类法B. 图书分类法C. 主题分类法D. 分面组配法8、用某一检索词进行检索时,能同时对该词同样或类似概念的词,如同义词。
第七章 Internet 信息检索工具—搜索引擎
(4)用户接口
供用户输入查询,显示匹配结果。 用户接口的设计和实现使用人机交互的 理论和方法,以充分适应人类的思维习 惯。
4、搜索引擎的主要任务
(1) 信息搜集 各个搜索引擎都派出绰号为蜘蛛(Spider)或机 器人(Robots)的“网页搜索软件”,在各网 页中爬行,访问网络中公开区域的每一个站点 并记录其网址,将它们带回搜索引擎,从而创 建出一个详尽的网络目录。由于网络文档的不 断变化,机器人也不断地把以前已经分类组织 的目录更新。
第七章 Internet 信息检索工 具—搜索引擎
7.1搜索引擎基本理论
1、什么是搜索引擎?
简单地说,所谓搜索引擎,就是采用信息自 动跟踪标引等技术、建立在因特网上专门提 供网络信息资源导航服务检索工具。 它能够通过Internet 接受用户的查询指令 ,并向用户提供符合其查询要求的信息资源 网址。
5、搜索引擎的种类
检索型搜索引擎:它使用自动索引软件来发现、收集并标引网 页,建立数据库,并以Web形式让用户找到所需信息资源。比 较著名的有:息系统地分门归类,经过人工 整理后形成庞大而有序的分类目录体系,用户可以在目录体系 的导引下通过逐级浏览,发现、检索到有关的信息。雅虎就是 以卓越的分类目录型导航服务而称誉全球,典型的分类目录搜 索引擎如Yahoo ( /) 混合型搜索引擎:它兼有检索型和目录型两种方式。如:新浪、 搜狐、网易、中华等门户网站。 多元搜索引擎:也称为集合型搜索引擎。它是将多个搜索引擎 集成在一起,通过统一的检索界面进行网络信息多元搜索 的 检索工具。按照工作方式的不同可分为并行处理式和串行处理 式两大类。著名的有: Meta crawler、Dogpile、Mamma和万 维搜索(Http:///)等。
引号 引号( “ ” )的作用是,括在其中的多个词 被当作一个短语来检索。绝大部分主要搜索引 擎都支持短语检索,找到含有与短语词序和意 义完全相同的页面。例如,检索式 “ electronic magazine ” ,表示把 electronic magazine 当作一个短语来搜索。 如果不加引号,搜索引擎就会把两词之间的空 格按“与”处理,查出包含 electronic 和 magazine 的页面,结果应与用户要求的主题 内容相去甚远。
16因特网信息资源检索概述v3
因特网信息检索的特点
1 分布地域广,检索范围广泛、全面
因特网信息检索的特点
2 超文本检索,具有交互式作业的特点
超文本的信息资源通过网上各节点的链路把 相关信息或图标有机地链接成一个网络结构, 用户可以从任何一个节点开始阅读文档
因特网信息检索的特点
3 检索内容新、实时性强、传播速度快
因特网信息检索的特点
传统网络信息服务工具
【文件传输服务】
是在网络通讯协议FTP的支持下实现的一种本地计算机和远程服务器之间 的文件传送
传统网络信息服务工具
【电子邮件服务】
是用户或用户组之间通过计算机网络接受或发送文字、图像和语音等多种 形式络新闻服务】
通常被称作Usenet,是通过Internet提供新闻组专题讨论服务的一种应 用软件
Giganews:美国最大的usenet服务商 UseNeXT:欧洲最大的usenet服务商
传统网络信息服务工具
【WAIS信息服务】
WAIS(Wide Area Information Service)称为广域信息服务器,是一 种数据库索引查询服务
访问WAIS主要有三种方法: 运行一个本地主机的WAIS客户程序 • 用Telnet远程登录到WAIS Client • 通过Gopher进入WAIS
【Gopher】
是一种基于多种菜单的交互式检索工具
• 文本文件信息查询 • 电话簿查询 • 多媒体信息查询 • 专有格式文件查询 • ……
服务器1
服务器2
服务器n
用户计算机
传统网络信息服务工具
【WWW信息资源】
WWW(World Wide Web,万维网)采用了超文本与超媒体的技术, 以多媒体形式向用户展现丰富的信息
因特网上信息检索(检索与原理)
搜索 蜘蛛程序自动 用关键字 引擎 搜索后产生索 或关键字 引数据库 表达式检 索
网页
较短
较大
量大
元搜 本身一般不带 用关键字 数据库 索引 或关键字 擎 表达式检 索
网页
较短 较大 量大 命中率可 (视被引 (视被引 (视被引 能稍高 用的搜索 用的搜索 用的搜索 引擎) 引擎) 引擎)
搜索引擎的发展趋势
适合查找综合性、概括性的主题概念,或对检索准 确度要求较高的课题。 专题指南的局限性在于其信息更新速度慢,跟不上 网络信息的发展。
数据库的规模相对较小,收录的网页数量和深度都 相对不足,用户很难检索到较专深的信息,比较容 易遗漏交叉相关信息 。
全文搜索引擎(一)
使用自动索引软件来发现、收集并标引网页, 建立数据库。它的Spider自动在因特网上漫游, 不断搜集各类新网址及网页,形成数以千万乃 至亿万条记录的数据库;它以Web形式提供给 用户一个检索界面,供用户输入检索关键词、 词组或短语等检索项,以其特定的检索算法代
如:雅虎、/ 新浪、 /
搜狐、 /
网易、 /
目录索引类搜索引擎二
目录索引类搜索引擎特点
比较适合用户进行笼统或较笼统的主题浏览和检索。
查准率较高,查全率较低。
C.爬虫 D.CuteFTP
4.下列不属于元搜索引擎特点的是( B.可同时搜索多个数据库 C.一般支持AND、OR、NOT等操作 D.一般只使用简单、直接的搜索策略
)。
A.搜索时,用户必须多次提交搜索请求
判断题
1.常用的两种搜索引擎是目录类搜索引擎和元搜索引擎。 ( ) 2.为了适应不同搜索群体的需要,许多搜索引擎一般都提 供多语种检索功能。( )
各个网站上,把网页抓下来, 并顺着上面的链接,持续不断 地抓取网页。如“网络机器 人”、“爬虫”、“蜘蛛”。
第六讲 09秋 网络信息资源检索工具
搜索引擎
常用或有发展前景的搜索引擎类型:
• 图像搜索型
图像搜索引擎是面向因特网上嵌入式图像或被链接的图像,通常 要实现以下功能:允许用关键词搜索图像内容、日期和制作人;能通过 颜色、形状和其他形式上的属性进行搜索;把图像作为搜索结果的一部 分显示。 图像搜索引擎通过显示一张略图、图像的URL、存放图像的站点 的URL以及有关图像的某些信息的方式显示搜索结果。
• 常用中文搜索引擎 • 常用英文搜索引擎 • 元引擎
搜索引擎
• 常用中文搜索引擎
• 搜狐 • 雅虎中国• 新浪• • 天网* * * * *
• • • • • •
常用英文搜索引擎 Yahoo! * Google * Excite * Hotbot * Lycos *
搜索引擎 *
• • 搜狐 网址 : 1).搜狐是由爱特信公司(ITC )1998年2月在北京推 出,正式向互联网用户提供服务的,其提供一个详 尽的Web分类目录,采用树型结构 • 其检索界面分为:简单检索(关键字查询)和高级 检索两种形式 • 对检索资源类型按网站、网页、类目、新闻 网址 等五种类型划分 • 默认状态下是逻辑与的关系 对检索结果根据分类类目及网站信息与关键字串的相 关程度来排序
系统检索软件接受用户提交的检索提问后,按照本系统 的句法规定对用户输入的字符串、运算符、标识符、空格等 进行识别和判定后,代理用户在数据库中检索,并对检索进 行评估比较,按与检索结果的相关程度排序后提供给用户。
搜索引擎
• 搜集 判断 标引 分类
主题 加工 数据库
目录索引库 创建 检索界面 Web页面导航
搜索引擎 *
• • 5) 新浪 URL 1998年12月底推出新浪中文网站8个大类) • 可分为网站、网页、新闻标题、新闻全文、图片、 软件检索 • 特点:1)在关键词查询的反馈结果中,在同一页面上 包含网站、网页、新闻标题、新闻全文、图片、软 件、商品等各类信息的综合搜索结果,使用户得到 最全面的信息 分类目录内容比较新,如XML、JSP、蓝牙等建立类目 较快 提供相关检索功能 具有中文网址搜索功能• 第二代搜索引擎 搜狗 ?• 第三代搜索引擎
《2.2因特网信息的查找》
因特网信息的查找教学设计教案背景1.学科:信息技术2.学段:高一3.课时:14.课程类型:综合解决课5.教材版本:教科版6.教学环境:网络机房教案课题普通高中新课程标准实验教科书教育科学出版社版《信息技术基础(必修)》课本第二章的第二节——《因特网信息的查找》。
教学目标知识与技能1.了解搜索搜索引擎的含义;2.了解常用搜索搜索引擎的类型、特点及其工作原理;3.熟练掌握不同搜索引擎的使用方法。
过程与方法1.有效使用网络检索信息;2.使用搜索引擎帮助系统;3.通过“做中学”体验操作过程中的挫折与喜悦。
情感、态度与价值观1.通过搜索过程,比较与评价几种不同的搜索引擎。
2.通过小组相互讨论,培养与人合作的能力;3.通过实践,进一步认识到掌握检索技巧的重要性,能利用现代信息交流渠道,解决学习和生活中的问题,为终身使用奠定基础。
4.能够合法地获取网上信息。
教学重难点1.掌握目录索引类搜索、全文搜索的使用方法。
2.掌握关键词搜索的技巧,根据信息需求选择合适的关键字,灵活运用“与”“或”“非”等逻辑运算符,提高信息检索效率。
教材分析《因特网信息的查找》是普通高中新课程标准实验教科书教育科学出版社版《信息技术基础(必修)》课本第二章的第二节内容。
学习内容主要包括搜索引擎的相关基本知识:产生和发展、分类及基本工作原理、代表性的搜索引擎介绍;搜索技巧:搜索引擎类型的确定、检索关键词的选择、多关键词的使用、复合逻辑运算的组织等。
该部分内容实践性较强,学生由于缺乏实际操作的经验,相关知识储备不足,学起来有一定困难,会觉得枯燥无味。
但是这部分内容又在课标所规定的网络基础知识范围之内,学生必须掌握。
因此针对这部分内容,教学中能让学生边做边学,这样学生在动手实践中既掌握了一项获取信息的基本技能,增强了动手能力和学习体验,又巩固了前面所学的基础知识,从而获得较好的教学效果。
教学方法教师演示讲授法、学生讨论法、任务驱动法。
教学准备利用“百度搜索”搜集资料,制作多媒体课件。
Internet网络信息检索技巧
搜索引擎分类
检索型搜索引擎:它使用自动索引软件来发现、收集并标 引网页,建立数据库,并以Web形式让用户找到所需信息 资源。比较著名的有: A信息系统地分门归类,经过 人工整理后形成庞大而有序的分类目录体系,用户可以在 目录体系的导引下通过逐级浏览,发现、检索到有关的信 息。雅虎就是以卓越的分类目录型导航服务而称誉全球。 混合型搜索引擎:它兼有检索型和目录型两种方式。如: 新浪、搜狐、网易、中华等门户网站。 多元搜索引擎:也称为集合型搜索引擎。它是将多个搜索 引擎集成在一起,通过统一的检索界面进行网络信息多元 搜索 的检索工具。
3.5其他用法类似的限定检索
参阅英文Google大全。
()
Yahoo是因特网上历史最悠久、用户数最多的综合型、混 合型搜索引擎,是分类式搜索引擎的典范。它拥有10余种 语言版本,且各版本的内容互不相同。 如果用户的检索词在Yahoo !中查询不到结果,它会自动 将查询转交给Google搜索引擎做进一步的检索。 Yahoo!支持词语检索和“+‖ 和“–‖限制检索等,它还提 供日期限定、URL和题名限制检索等。“+‖限定关键字串 一定要出现在结果中; “–‖限定关键字串一定不要出现在 结果中。
利用Google进行专题信息检索
1 简单专题信息检索及目录检索 接受一项简单专题,最直截了当就是在搜索框内输入一个 关键词,然后点击下面的“ Google 搜索”按钮(或者直接回 车),结果就出来了。 如果对查询的领域熟悉,只想寻找某些专题网站,首先考虑 用目录检索。目录分类明确,则网站专题信息集中,剔除了大 量不相关的信息。不过对查找中文信息,Google的中文目录太 少只有非常普通简单的类目,可能很难满足需求(中文目录 “/Top/World/Chinese_Simplified/”) 。
因特网上科技信息资源的检索方法与技巧
因特网 以其丰富 的信 息资 源、 惊人 的传输 速度和多 功能 的服务 手段 、 为科技 工作者搜集和交流信 息提供 了便 利。然
索 检 索 条 件 , 用 用 利
布尔检索运算符(n o、o) ad、rn t 实行 逻辑组配 检索。用户可根
全文信息 , 一部分期 刊只提供文 章的摘要 信息。若想查 找含
全 文 的 文 章 , 须 在 检 索 时 提 前 设 定 。如 Sr gr i 必 p ne Ln 据 i k数 库 需 选 定 “ i r Ve al Pb ctn n ” , 样 检 索 结 果 Fl : i be ulao s l 项 这 t e w i i O y 中才 会 出 现 带 有 眼 镜 标 志 的 文 章 , 全 文 文 章 。A P数 据 库 即 S
网络上 几种主要类 型科技 信息 的检索 方法 及检索 策略 的制 定等方 面加 以总 结 和探 讨 , 以期方 便 广大科 研 工作 者 的利
用。
中需选定“ u et( 文 )项 , 能 检 出带有 全文 的文章 。 FlTx 全 l ” 才 每一全文数据库都有特定的检索规则 和检索方式 , 户需 注 用 意区别使用 。 2 网上特种科技信息检 索 网上特种科技信 息包括会议文献 、 专利文献 、 科技报告 、 学位论文 、 技术标 准 等 网络信息 资 源。特 种文 献形式 多样 , 数量庞大 , 实用价值 高 , 内容涉及科 学技术 的各个 领域 , 科 是 研工作不可缺少 的信 息源 。但 由于 其 出版 形式 的多样性 及
期刊数据库》 可提供 傻 瓜检 索 、 统检 索 、 传 分类检 索、 高级 检 索 和整 刊检索等五种检索方式 ;万方数 字化期刊子 系统》 《 可
提 供 关 键 词 检 索 和 分 类 检 索 两 种 检 索 方 式 ;p ne ik数 Sr grLn i
网络信息检索与利用参考试题与答案
网络信息检索与利用一、名词解释题:网络信息资源:是将文字、图像、声音、动画等各种形式的信息,以数字化形式存储并借助计算机与网络通讯设置发布,收集、组织、存储、传递、检索和利用信息资源。
www:信息检索数据库:是至少有一个文档组成并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。
联机检索:指用户利用计算机联合通过通讯网络与世界各地的信息检索系统联机,从检索系统的数据库中查找出所需信息的过程。
它允许用户以智能机对话,联机会话,这样交互的方式直接访问检索系统及数据库、检索是实时在线进行。
查全率:是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例。
查准率:是指检出文献中合乎需要的文献的数量占检出文献的全部数量。
关键词:关键词又称自由词,它属于自言语言范畴。
关键词是直接来自文献本身,能够反映文献主题概念,具有实际检索意义的词语。
以搜索引擎为代表的基于关键词的检索工具能够利用全文索引技术。
布尔逻辑检索:又称布尔代数是指使用,and,or,not等运用符,查找含有某种词语特定主配形式的网页。
搜索引擎:是一个可以用文件名查找文件的系统。
元搜索引擎:是一种基于搜索引擎的网络检索工具。
它是将多个搜索引擎集合在一起,通过一个统一的检索界面接收并处理用户的查询提问。
在进行检索时调用一个或者多个独立搜索引擎的数据库。
桌面元搜索引擎:顾名思义,桌面元搜索引擎不是通过网上调用方式在线使用,而是直接在用户的计算机上进行,相当于用户自己拥有一个元搜索引擎,所以称之为桌面元搜索引擎。
All-in-One式元搜索引擎:又称搜索引擎元目录,它将主要的搜索引擎集中起来,并按类型或检索问题等编排组织成目录帮助导引用户根据检索需求来选择适用的搜索引擎。
联合书目数据库:联合目录是揭示报道若干个文献收藏单位的文献入藏情况,汇总若干个单位馆藏的书目信息的目录。
参考信息:是指人名、地名、机构、事件、统计数据等一类数据,事实信息,是人们的工作研究和日常生活中经常要查考、引用的信息。
1.3 因特网信息资源检索【导学案】
1.3 因特网信息资源检索导学案一、学习目标1、了解常用的因特网信息检索工具的类型2、能描述信息检索工具的基本工作原理和特点3、体验因特网信息检索工具的优缺点4、掌握常用因特网信息检索工具的使用方法,能熟练使用检索工具获取信息二、学习重难点搜索引擎的基本工作过程和基本工作原理选择合适的信息检索工具高效获取信息三、【学习准备】1、阅读教材P16—P22,了解并弄清以下知识点(1)什么是搜索引擎?(2)常用的搜索引擎是哪两种?(3)什么是特色搜索引擎?(4)元搜索引擎的特点。
(5)英特网信息检索的发展趋势。
2、阅读教材P23—P26,了解并弄清以下知识点(6)全文搜索引擎的工作原理(7)目录索引类搜索引擎的工作原理(8)利用因特网进行资源检索的策略有哪些?(9)如何成为一个网络信息检索高手?四、【学习流程】1、搜索引擎:2、搜索引擎按工作方式分为和3、全文搜索引擎的使用方法称为4、例举3个常用的全文搜索引擎、、5、目录索引类搜索引擎的使用方法称为6、例举3个常用的目录索引类搜索引擎、、7、【搜索技巧】(1)使用权威网站(2)使用不同的搜索引擎,不要局限于一个搜索引擎(3)关键词提炼:学会从复杂搜索意图中提炼出最具代表性和指示性的关键词。
这样可以更准确的搜索到你要查询的内容。
(4)输入多个关键词搜索。
缩小搜索范围的简单方法就是添加搜索词(5)用好逻辑命令:、、以及“+”和“-”(6)强制搜索:通过添加来搜索短语。
(7)每个搜索引擎都有自己的帮助系统。
遇到困难,首先求助于帮助系统。
【题目训练】【比一比】(1)歌词补充完整:“我和你,心连心,;为梦想,千里行,。
来吧,朋友,伸出你的手。
我和你,心连心,。
”歌名:《》,有效关键词:(2)成语补充完整:()假()威()屯()聚冒天下提示:使用通配符,?代表任意一个字符,*代表任意多个字符(3)关键词是“中国电影+故事片|喜剧片-恐怖片”,搜索的信息是8、(有时是综合信息检索工具中的一个功能),这些检索工具专门搜集某一类的信息资源,内容丰富,数据量大,能帮助我们迅速找到一些有用的信息。
因特网上信息资源检索
特色信息检索工具:例如
其他信息检索工具:例如
请同学们通过下面三个任务来体验因特网上信息搜索的神奇魅力吧!
任务一:我们都来自家乡黄桥,“黄桥”的由来你们知道吗?
二、教学课题
教学课题:《因特网信息资源检索》
1、了解因特网上信息搜索引擎的分类、工作原理;
2、掌握搜索信息的方法、获取因特网上信息的技巧;
3、应用所学知识,了解如何辨别和下载适用的因特网信息;
三、教材分析
“因特网信息资源检索”是教育科学出版社的《网络技术应用》第一章的第三节内容。它是在学习了第二节“因特网信息交流与网络安全”理论基础上,为实际应用做好充足准备。我们在学习和工作中,往往首先要做的是信息的搜集工作,这样就要求我们考虑通过什么途径和方法获取这些信息,本节“因特网信息资源检索”介绍了获取信息的方法—搜索,以及各个搜索引擎之间的工作原理和特点。
完成任务二
注意区分使用合适的关键字。
完成任务二
了解使用关键字搜索的技巧。
通过做题和老师释疑,了解本课的理论精髓。
六、教学反思
课后,经过交流探讨,教学目标的完成情况是比较好的。开始通过情境创设引起学生的注意力,让学生的思维活跃起来。再通过由课本至真实网络环境的应用,由学生亲眼所见身边事、人,体会搜索引擎的神奇,并将其技巧总结出来,充分调动了学生学习的积极性。最后再由实际操作上升到理论讲解,能起到答疑解惑的效果,恍然大悟。但是课堂上忽略了两个问题,一是在网络搜索中,不光是泰兴有黄桥,全国各地同名的黄桥多大十几处,在课堂开始时应提及,并注意学生的情绪。二是在网络使用过程中,目前学校使用的网络软件还不能从根本上杜绝学生不做与课堂内容无关的事情,学生在网络条件下浏览网站,还得不到强有效的引导控制,如何有效地过滤网络不良信息,这是教学技术和教育中任重而道远的一件事。
第二节__因特网上的信息检索
搜索引擎的分类
类型 定义 使用关键词到预先 建好的或租用其它 索引数据库查询信 息的一类搜索引擎. 举例
全 文 搜 索
信息量大、更新较及时、不需人工干预。 优点: 信息量大、更新较及时、不需人工干预。 返回信息过多,有很多无关信息。 缺点:返回信息过多,有很多无关信息。
注意的问题
搜索引擎并不真正搜索互联网, 搜索引擎并不真正搜索互联网,它搜索的 实际上是预先整理好的网页索引数据库。 实际上是预先整理好的网页索引数据库。 搜索引擎,也不能真正理解网页上的内容, 搜索引擎,也不能真正理解网页上的内容, 它只能机械的匹配网页上的文字。 它只能机械的匹配网页上的文字。
动动手
搜索引擎工作原理
1、信息的采集与存储 、
信息的采集包括人工采集和自动采集两种方式。 人工采集由专门的信息人员跟踪和选择有用的WWW站点或 页面,并按规范方式分类标引并组建成索引数据库。 自动采集是通过自动索引软件(Spider、Robot或Worm)来 完成的,Spider、Robot或Worm在网络上不断搜索相关网页 来建立、维护、更新索引数据库,自动采集能够搜索、采集 来建立、维护、 和标引网络上众多站点和页面,并根据检索规则和数据类型 对数据进行加工处理,因此它收录、加工信息的范围广、速 度快,能及时地向用户提供Internet中的新增信息,告诉用户 包含这个检索提问的所有网址,并提供通向该网址的连接点, 检索比较方便。
1994年起搜索引擎发展举例 年起搜索引擎发展举例
产生时间
1994.4 1995.12 1997.10 1998.9
搜索工具
Yahoo Altavista 北大天网 Google
开发组或公司
斯坦福大学 DEC公司 公司 北大计算机研究室
因特网信息检索的方法、策略与技巧
索” 只支持 用英 语检 索 。
新 闻组搜 索 。 o g 链 接 了全世 界所 有 G ol e
用户 注意 它 。 基于 目录 的信 息查 询 是基 于 网
上 目录一 般 以主题 方式 组织 , 大主 题下 又包 括 若 干 小 主 题 , 户 只 要 一 层 一 层 地 查 下 用
W . ad . a w w a cm、易 网Ot / d ap / t:
w l 16cm wq 2 . ) a 0 t /w  ̄ p u d c) a p / w e k eu n雅虎 t: 、
文本 的信 息查 询 、 基于 目录 的信 息 查询 和基
ห้องสมุดไป่ตู้
内提 供 相 对 全 面 、准 确 的信 息 。 这类 搜 索
引 擎 的 代 表 是 wec we(t :/ / b m l ht r p
w . e ca lrcn) w w brwe. o 。
常用
的廷蜡蝙
G g 0t/w w og cm、 o l ap /w gol a) e t: e
于搜 索引 擎的信 息查 询 。 基于超 文 本 的信息 查 询也 称浏 览 , 在利 用浏 览法 进行 检索 时 , 用户 只需 以 一个 节点 作 为入 口, 据 该节 点 的 文 本 内容 , 入 其 根 嵌
中链 接指 向 的主题 , 后选 择 自己感 兴 趣 的 然
中 国 O t/w yh o a e/ 搜 狐 O t / ap /  ̄ a o c m n) t: 、 ap / t:
著 名新 闻 网站 , 只要 输 入 检 索 词 ,og 就 G ol e
会 迅 速在 这 些 网站 里 查 找 ; 外 , 闻组 还 此 新
_网络信息检索与利用
(一)因特网上的信息资源(次重点)网上有什么样的信息:政府信息、科研信息、教育信息、文化信息、休闲娱乐信息。
网上不太可能有的信息:如有并企业公司的战略、发展规划,商业、贸易秘密;商业性库和大多数有版权的印刷资料等。
因特网上信息资源的特点及信息利用价值因特网信息的特点:无限性和广泛性,多样性,共享性,新颖性,无序性。
因特网信息的优越性:价廉,新颖、深入,广泛直接交流,非正式和自由发表园地。
(二)因特网上信息资源的种类(重点)因特网上信息资源的主要类型有以下五种:(1)Web 信息资源指建立在超文本、超媒体技术的基础上,集文本、图形、图象、声音为一体,并以直观的图形用户界面展现和提供信息的网络资源形式。
(2)Telnet 信息资源指借助远程登录(remote login),在网络通信协议Telnet(telecommunication network protocol)的支持下,在远程计算机上登录,使自己的计算机暂时成为远程计算机的终端,进而可以实时访问、使用远程计算机中对外开放的资源。
(3)FTP 信息资源FTP(file transfer protocol) 是因特网使用的文件传输协议。
该协议的主要功能是完成一个系统到另一个完整的文件拷贝。
即在因特网的联网计算机之间传输文件。
(4)用户服务组信息资源由一组对某一特定兴趣的网络用户组成的电子论坛。
如新闻组(usenet newsgroup)、邮件列表(mailing list)、专题讨论组(discussion group)、兴趣组(interest group)、辩论会(conference)等等。
(5)RSS信息资源RSS是一种用于共享新闻和其他Web内容的数据交换规范,是将用户订阅的内容传送给他们的通令协同格式。
2、因特网信息资源的评价标准(1)目的(2)范围(3)内容:准确性、权威性、新颖性、独特性、可靠性、图形和多媒体设计、信息的展示与设计、可操件性。
因特网免费学术资源检索与利用
“ ”引号界定检索词,使检索词按相同词序出现 例:“billy the kid ”(小魔王比利)
搜索引擎关键词检索规则
intitle: 全部词必须出现在网页的标题内 Google可用“allintitle: ”
Google关键词检索规则
Site:表示搜索结果局限于某个具体网站或者网站频道,如果是要 排除某网站或者域名范围内的页面,只需用“-网站/域名”。注意: site后面的网址不能有http://或www.
如 BioMed Central等。
3.3 开放获取(OA)的文献类型
开放获取期刊 开放获取图书 电子印本系统 开放获取机构收藏库 开放获取课程 专利、科技报告会议论文、学位论文、标准等 获取途径:除网络OA资源外,CNKI、万方等 数据库均可检索OA文献。
开放获取期刊检索
经同行评论的文章、论文、图书、摘要和文章。Google 学术搜索可帮助您 在整个学术领域中确定相关性最强的研究。部分论文有全文。
2.scirus搜索引擎:/
scirus搜索引擎是是目前互联网上最全面、综合性最强的科技文献门户网 站之一,由Elsevier出版社开发。提供最为全面的科学信息搜索服务,涵盖期 刊、科学家主页、课程资源、预印本、数据库和网页等多方面信息3.8亿条 。
/
开放获取课件
MIT开放获取课件(MIT OpenCourseWare) 世界课堂(World Lecture Hall) /world/lecture 中国国家科学数字图书馆与化学相关的教学资源 /ListPageC/Edu.shtml 日本开放式课程 http://www.jocw.jp 中国教育部精品课程建设 /new/ 网上人大开放课程 /opencmr/cmrcourse/kfkc/kfkc.htm
因特网上专利信息资源的分布及其检索与利用
随着经济全球化的进程 , 中外知识 产权 问题成为热点问题。2 0 0 5年
中国受理 的专利 申请已经超 过了 4 万件 , 7 中国出 口的760 0 多亿美 元的 商品中, 高新科技产品已经 占 2 %, 到 8 机电产品超 过 了 5 %, 6 里边包含着 大量 的知识产权。但 20 年 中国的发 明专利申请量是 9 万件 , 05 . 3 国有和 民营企业的申请量只有 1 多件。很多企业处在有 “ 万 制造” 没有 “ 创造 ” , 有“ 产权” 知识” 无“ 的状态。商务部的一项调查显示 , 我国每年约有 7 % 0 左右的出口企业遭遇到 国外技术型贸易壁垒 的限制 , 并且这些技术 壁垒 大多与知识产权有关。 专利战略 已 经成 为企业总体发展战略的一个 重要
() 2 国际( 地区 ) 性专利组织 的网站 。如 : 界知识 产权组织 ( t : 世 ht / p/ w wwp. t , w .ion) 欧洲 专利 局( t / w .u e p tn— fc. g , i ht / we mp ̄一 a to i o ) 非洲 p:w e er
知 识 产 权 组 织 ( t :w w. p.io e) ht # w o i p . t。 p a w n
专利制度 的公开性使得获取 专利信息 比获取 其他技术 信息都 要 容 易。 随着互联 网技术的发展 , 国内外专利信息都可 以通过网络免费查询 。 l 因Leabharlann 网专利信 息资 源 的分布情 况
( ) 国知识产权 局及地方知识产权部门的机构网站。如 : 1各 中国国家
殊金属 公司专利信息 (t :w ws c op oooko t1, hp/ w .m . ./ h/ky.m )东芝公 司 t / s cjk t h 专利信 息(t :w w .si . ./ copt, 立公司专利信 (t : hp/ w 3o b cj c / l a 日 t / t h a op c s / )  ̄ hp , t
网络信息检索2
第8章 Internet信息检索 (2)
扬州职大电子工程系 贾湛
INTERNET基础知识
网络信息资源是我们学习、工作、生活中利用率最高 的信息资源之一。网络信息资源又称电子信息资源,因特 网信息资源等,它是以电子化、数字化的形式存储在网络 节点中的,借助于计算机网络进行传播和利用的信息产品 和信息系统的的集合体。有许多网络信息是免费的,因此 相对与本馆纸质文献信息资源和数字资源的检索利用,其 对人的影响更为深远。 如何高效地利用网络信息资源,首先应该了解IP地 址、URL、DNS和TCP/IP协议等INTERNET基础知 识。
FR
新西兰
NZ
美国
US
CH IE RD 瑞士 爱尔兰 研究公开 该公司目前报道专利的国家共35个,另有两个组织(欧洲专利公约,European
CN IL RO Treaty)和两种出版 中国 以色列 罗马尼亚 Patent Convention ,国际专利合作条约, Patent Cooperation
FTP 信息资源
FTP 信息资源——利用文件传输协议FTP ( File Transfer Protocol)可以获取的信息资源。 FTP 使用户可以在本地计算机和远程计算机之间发送和 接收文件,FTP 不仅允许从远程计算机上获取、下载文 件(Download),也可以将文件从本地计算机拷贝传输 到远程计算机(Upload)。 FTP 是目前Internet 上获取免费软件和共享软件资源 不可缺少的工具。
Telnet 信息资源
Telnet 信息资源是指借助远程登录,在网络通信协议( TelecommunicationNetwork Protocol)的支持下, 可以访问共享的远程计算机中的资源。Telnet 使用户可以在 本地计算机上注册到远程计算机中的资源。使用Telnet,用 户可以与全世界许多信息中心、图书馆及其他信息资源联系。 Telnet 远程登录的使用: 1.用户在远程主机上有自己的帐号,即用户拥有注册的用户名 和口令; 2.许多Internet 主机为用户提供了某种形式的公共Telnet 信息资源,这种资源对于每一个Internet 用户都是开放的。
因特网信息资源检索 因特网中的信息检索
编号:005备课时间:课题:因特网信息资源检索因特网中的信息检索课型:新授课课时:1教学目标1.了解常用的因特网信息检索工具的类型。
2.掌握常用因特网信息检索工具的使用方法,能熟练使用检索工具获取所需信息。
3.了解因特网信息检索发展趋势。
内容分析:本节全面介绍了各种搜索引擎及其发展趋势。
该部分首先创设了一个情境:为让更多的人了解北京、支持北京 2008 年奥运会,我们需要搜集相关资料,然后以该搜索活动为工作主线,将各种检索工具的介绍串连起来。
元搜索引擎是一个较新的内容,通过学习需要学生知道元搜索引擎的工作方法和产生的意义,从而进一步领略人类在网络信息处理中表现出来的聪明才智。
方法策略:本节主要介绍了各种搜索引擎及其发展趋势、各种搜索引擎的特点。
教学中可采用任务驱动法,教师可利用教材中创设的情境,提出搜索任务,从具体的任务中让学生了解各种不同的搜索引擎,并体验利用不同搜索引擎搜索同一类信息时的不同效果。
对搜索引擎发展趋势的介绍是为了让学生了解一些前沿知识,提高学习兴趣,激发学习热情,这部分内容的教学可以通过简单的实例外加学生的阅读来完成,也可以补充一些相关资料。
教学过程:1.情境引入“五一黄金周”就要到了,同学们计划去青岛好好放松一下。
为了做好充分的准备,陈菲等同学决定在班级网站上介绍一下青岛城市概况和青岛主要风景区的相关文字、图片资料以及一些多媒体材料等。
那么,陈菲他们怎样才能快速而全面地搜索所需的资料呢?2.讲授新知环节一目录类搜索引擎和全文搜索引擎的讲授(1)教师通过总结观察同学们的搜索情况发现大部分同学都用搜狐、新浪等网站上的一些目录来进行信息的搜索,或者用百度、Google 等搜索网站进行搜索。
图 1-1 目录搜索引擎页面举例图 1-2 输入检索关键字的百度首页(2)得出结论大部分同学采用的是最常见的两大类搜索引擎,即目录索引类搜索引擎(如:搜狐、新浪等网站上的一些目录)和全文搜索引擎(百度、 Google 等搜索网站)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课题:1.3 因特网信息资源检索
教学分析:本节内容是理论性的知识,学生对因特网信息检索已有一定的基础,但是对搜索引擎的工作原理还是不很了解,需要更进一步的学习。
教学可建立在学生原有的因特网信息检索的基础上,使学生在教师的指导下通过自主探究、分组讨论得到结论。
教学目标:1.了解因特网信息检索工具的类型、特点和工作原理;2.能比较出不同检索工具的优缺点,并进一步提高搜索技能,熟练地使用检索工具获取所需的信息;3.了解搜索引擎的发展趋势。
教学重点:全文和目录索引类搜索引擎的工作原理
教学难点:全文和目录索引类搜索引擎的工作原理
课时安排:1课时
教学方法:任务引导法、合作学习法、演示法
教学过程:
一、经常使用的两种信息检索方式
目录索引类搜索引擎和全文搜索引擎。
二、特色信息检索工具
专门搜集某一类的信息资源,内容丰富,数据量大,能帮助我们迅速找到一些有用的信息。
其他信息检索工具
最早的FTP搜索引擎是基于文本显示的Archie。
三、元搜索引擎
是一种调用其他多个独立搜索引擎的引擎,是对多个独立搜索引擎的整合,调用,控制和优化,能方便地检索多个搜索引擎,扩大检索范围,提高检索的全面性。
四、因特网信息检索发展趋势
基于内容的多媒体信息搜索引擎
基于专业领域的垂直搜索引擎
五、全文搜索引擎的工作原理
搜索器:负责定期地自动到各个网站上,把网页抓下来,并顺着上面的链接,持续不断地抓取网页。
索引器:把搜索器抓来的网页进行分析,按照关键词句进行索引,并存入服务器的数据库中。
检索器:面向用户,接收用户提交的查询字串,在索引数据库中查询,并将结果反馈给用户。
六、目录索引类搜索引擎工作原理
一般采用人工方式采集和存储网络信息,依靠手工为每个网络确定一个标题,并给出大概的描述,建立关键字索引,讲其放入相应的类目体系中。
七、小结
利用困特网进行信息资源检索时,如果想大致了解某一个领域的信息资源,可以使用目录索引类搜索引擎;如果需要检索的信息资源目标比较明确,则可以根据信息资源的类型选择搜索工具。
八、课堂练习
1.目录索引类搜索引擎一般采用什么方式采集和存储信息
A.人工方式
B.“蜘蛛”程序
C.关键字检索
D.检索工具
2.最早的FTP搜索引擎是基于文本显示的
A.Google
B.Baidu
C.Archie
D.天网搜索
3.下列不属于搜索引擎中“搜索器”工作程序的是
A.网络机器人
B.蜘蛛
C.爬虫
D.CuteFTP
4.下列不属于元搜索引擎特点的是
A.搜索时,用户必须多次提交搜索请求
B.可同时搜索多个数据库
C.一般支持AND、OR、NOT等操作
D.一般只使用简单、直接的搜索策略
九、实践园地
1.三个代表的英文翻译:____________
2.以写无题诗著名的唐代诗人李商隐写过这样两句诗:“______________________,心有灵犀一点通。
”
3.神州六号宇宙飞船发射时间________________________
4.网上找一幅郁金香的图片,格式为JPG,保存到桌面上建立的文件夹。
5.在网上搜索氧化还原反应的演示文稿,并保存到桌面上建立的文件夹。
6.通过地图等特色搜索找到你家大概位置
7.借助Google-earth软件精确定位你家的位置(选做题)
教后记:。