网络信息资源检索 信息检索
网络信息检索作业
网络信息检索作业1.网络信息资源检索常用的检索技术有哪些?答:网络信息资源检索常用的检索技术有(1)布尔逻辑检索(Boolean search)(2)截词检索技术(Truncation search)(3)短语检索(4)临近检索(5)加权检索技术(Weigh search)2.搜索引擎主要分几类,例举各代表性的搜索引擎。
答:(一)按检索方式、方法可划分为:目录型搜索引擎、索引型搜索引擎(1)目录型搜索引擎有代表性的目录型搜索引擎有:Yahoo! 、Galaxy、Look Smart、中文雅虎、新浪、搜狐、网易等。
(2)索引型搜索引擎有代表性的索引型搜索引擎:中英文Google、Hotbot、AltaVista、Ask Jeeves、百度、天网等。
(二)按搜索功能可划分为:独立型搜索引擎、元搜索引擎(1)独立型搜索引擎大多数网络检索工具都是独立型的。
(2)元搜索引擎常用的元搜索引擎有:Dogpile、Metacrawler、Vivisimo、万纬搜索、搜乐搜索等。
(三)按检索内容、主题可划分为:综合型搜索引擎和专业型搜索引擎(1)综合型搜索引擎常用的Yahoo!、百度、Google等。
(2)专用型搜索引擎如医学领域、化学领域、专利信息查询等专门性的网络检索工具。
3.什么是开放存取?答:含义:对某文献的开放存取是指它在 Internet公共领域里可以被免费获取,并允许任何用户阅读、下载、复制、传递、打印、搜索、超链接,也允许用户为之建立索引,用作软件的输入数据或其他任何合法用途。
用户在使用该文献时不受财力、法律或技术的限制,而只需在存取时保持文献的完整性,对其复制和传递的惟一限制,或者说版权的惟一作用应是使作者有权控制其作品的完整性以及作品被正确接受和引用。
4.网络参考信息有哪些类型?答:(1)百科知识检索网站(2)人物信息检索网站(3)地理信息检索网站(4)机构信息检索网站(5)术语信息检索网站(6)统计信息检索网站。
《文献检索课程》1-1信息检索与网络资源基础知识
Information Retrieval & Internet application
参考教材
1、实用信息检索方法与利用,赵乃瑄,化学工业出版社,2008.9 2、网络信息检索与利用,隋莉萍等,清华大学出版社,2008.9 3、网络信息检索:工具方法 实践,沈固朝, 高等教育出版社, 2004.8 4、数字信息资源的检索与利用,肖珑,北京大学出版社,2003.7 5、文献检索与利用,花芳,清华大学出版社,2009.9
1.1 信息素养概述
– 美国图书馆协会ALA,1989提出: 信息素养是指个人“能认识到何时需 要信息,和有效地搜集、评估和使用所 需信息的能力。”
1.1.2 如何判断自己已具备了信息素养呢
• 能够独立地决定所需信息种类和程度
独立意味着在获取信息资源的过程中个人可以决 定所需要的信息种类和程度,表现为主动学习、自 主吸纳知识的过程。 种类:图书、期刊、学位论文、专利、标准等十类 程度:背景信息---概念、事实、数据
1.1.2 如何判断自己已具备了信息素养呢
• 能够根据现有的知识背景和评价标准对信息 及其来源进行评价和遴选
此标准意味着能够在分析信息的基础上, 熟练、批判性地评价信息,有效地吸收、存 储和快速获取信息,能从所获取的信息中遴 选出信息的中心思想,并依据科研项目的要 求来评价信息及其来源,提取最权威、经典 的和具有创新理念的综述及其他文献信息。
第一章 信息检索基础知识
1.1 信息素养概述 1.2 信息与信息源 1.3 参考文献的著录格式 1.4 信息检索概念及分类途径 1.5 信息检索技术
1.1 信息素养概述
1.1.1 信息素养定义
– 信息检索是培养信息素养的课程 – 信息素养
《网络信息检索》教案
《网络信息检索》教案一、教学目标1. 让学生了解网络信息检索的基本概念和意义。
2. 培养学生运用网络信息检索工具获取信息的能力。
3. 提高学生筛选、评估和合理利用网络信息资源的素养。
二、教学内容1. 网络信息检索的概念与意义2. 常用网络信息检索工具及其使用方法3. 网络信息检索的技巧与策略4. 网络信息的筛选、评估与利用5. 网络信息检索的伦理与法律问题三、教学方法1. 讲授法:讲解网络信息检索的基本概念、意义、技巧和策略。
2. 演示法:展示网络信息检索工具的使用方法。
3. 实践操作法:让学生亲自动手进行网络信息检索实践。
4. 讨论法:引导学生探讨网络信息检索中的伦理和法律问题。
四、教学准备1. 教学PPT:制作包含网络信息检索相关内容的PPT。
2. 网络环境:确保教学过程中可以正常使用网络。
3. 网络信息检索工具:提前准备好相关网络信息检索工具,如搜索引擎、学术数据库等。
4. 实践案例:准备一些网络信息检索的实际案例,用于讲解和练习。
五、教学过程1. 导入新课:通过一个网络信息检索的实际案例,引发学生对网络信息检索的兴趣。
2. 讲解基本概念:介绍网络信息检索的概念和意义。
3. 演示检索工具使用:展示常用网络信息检索工具的使用方法。
4. 实践操作:让学生亲自动手进行网络信息检索实践,巩固所学知识。
5. 讨论与交流:引导学生探讨网络信息检索中的伦理和法律问题。
六、教学评估1. 课堂参与度:观察学生在课堂上的发言和提问情况,评估学生的参与度。
2. 实践操作:检查学生在实践操作中的表现,评估其网络信息检索能力。
3. 讨论与交流:评估学生在讨论中的表现,判断其对网络信息检索伦理和法律问题的理解程度。
七、教学拓展1. 邀请专业人士进行讲座:邀请从事网络信息检索工作的专业人士进行讲座,分享实际工作经验和案例。
2. 组织实地考察:组织学生参观图书馆、信息中心等场所,了解网络信息检索在实际工作中的应用。
3. 开展课后项目:鼓励学生在课后进行网络信息检索项目实践,提高其实际应用能力。
信息检索的方法与途径,详细论述检索步骤
信息检索的方法与途径,详细论述检索步骤
信息检索是指通过各种方法和途径寻找获取所需的信息。
信息检索的方法和途径千差
万别,主要包括图书馆检索、网络检索、专业数据库检索等。
本文将详细论述信息检索的
步骤,帮助读者更好地掌握信息检索的技巧。
信息检索的步骤包括确定检索词、选择检索工具、进行检索、评价检索结果和获取信息。
确定检索词是信息检索的第一步,检索词的选择应准确、清晰和具体,以提高检索效果。
选择检索工具是指选择适合的信息资源和工具进行检索,如图书馆的书目检索系统、
网络搜索引擎、学术数据库等。
不同的检索工具有不同的特点和使用方法,需要根据具体
情况进行选择。
第三步是进行检索,根据确定的检索词和选择的检索工具进行信息检索。
在进行检索时,可以采用布尔检索、通配符检索、截词检索等技巧,以获得更精确的检索结果。
检索
结果可能涉及大量信息,这就需要进行筛选和评价。
评价检索结果是信息检索的重要环节,需要根据信息的来源、可信度、相关性等因素进行评估,从而确定哪些信息是有价值的。
获取信息是信息检索的最终目的,根据评价的检索结果选择获取信息的途径,如阅读
相关文献、下载电子资源、寻求专家意见等。
获取信息后可以进行整理、分析和应用,从
而满足自己的信息需求。
信息检索的步骤虽然看似简单,但实际操作起来需要综合运用各种技巧和方法,具有
一定的复杂性和难度。
希望读者在进行信息检索时,能深入理解信息检索的步骤,灵活运
用各种技巧和方法,以提高信息检索的效率和质量。
信息检索-简答题(整理)较全版本
四、简答1. 简述信息组织、存储与检索的关系。
答:信息组织、存储与检索三者是不可分割的。
信息检索是通过信息存取系统(即检索工具)来实现的,任何一种信息存取系统都包括信息存储子系统和信息检索子系统,它们是同一事物中既相互对立又相互联系、互为依存的两个方面,而信息存取系统的建设,需要信息组织。
信息组织在信息资源开发中具有重要的地位,在信息管理中具有承上启下的作用,它是建立信息系统的重要条件,是信息存储与检索的基础。
所以,三者是不可分割的。
2. 简述信息存储的含义及作用。
答:信息存储是指通过多种形式记录和排序信息的过程。
它包含三层含义:一是将所采集的信息按照一定规则记录在相应的信息载体上;二是将这些载体按照一定的特征和内容性质组织成系统有序的、可供自己或者他人检索的集合体;三是应用计算机等先进的技术和手段,提高信息存储的效率和信息利用水平。
存储子系统的建设,要求根据一定的原则记录和描述信息或知识载体的内容与形式特征,然后按特征序化成各类信息集合并组织成系统。
信息存储部分是揭示信息特征、整序信息、建设系统的过程。
只有经过记录、描述与组织序化的知识集合,才能提供有效的信息检索。
因此,信息存储是基础,信息检索是目的。
3.文献的概念及分类4.什么是文献类型标识符,在什么情况下使用如何使用答:文献类型标识符:标识各种文献类型的符号。
使用范围:仅在含有各种文献类型的目录及其他检索工具中使用。
使用方法:著录在正题名后面,并用中括号“[ ]”括起来。
5.目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。
它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。
6.信息检索语言7.追溯法:8.文献信息资源9.信息的概念是什么信息有哪些特征10.影响查全率和查准率的因素有哪些11试比较分类语言与主题词语言分类语言是运用概念划分的原理,以分类号为标识,将各种概念按学科性质加以划分和排列,用以分门别类地、系统地组织信息的一种检索语言,它又可以分为体系分类语言和组配分类语言以及混合分类语言。
网络信息资源检索PPT课件
02
完整性
信息内容是否全面、完整,没有遗 漏或缺失。
权威性
信息来源是否具有权威性,发布者 是否具有专业资质。
04
信息资源的获取与整理
搜索引擎
使用搜索引擎进行关键词检索,获取相关信 息。
网络爬虫
利用网络爬虫技术自动抓取网页信息。
数据库
通过学术数据库、行业数据库等获取专业信 息。
信息筛选
对获取的信息进行筛选、去重、分类等处理, 整理成有用的资源。
高级检索功能的使用
限定字段检索
通过限定字段范围,缩小检索结果的范围,提高检索 效率。
模糊匹配
使用模糊匹配功能,对关键词进行模糊查询,提高查 全率。
分类导航
利用网站提供的分类导航功能,快速定位到相关资源。
检索结果评估与筛选
评估检索结果的相关性
根据检索结果与需求的匹配程度,评估检索结 果的可靠性。
筛选优质资源
跨媒体检索
随着多媒体技术的不断发展,跨媒体检索将成为未来网络 信息资源检索的重要方向,用户可以通过图片、视频、音 频等多种方式进行信息检索。
THANKS露
网络信息检索过程中,用户的个人信息可能被泄露或滥用,如搜索引擎记录用户 的搜索历史和位置信息等。
信息安全
网络信息资源的共享和传输过程中可能存在安全风险,如黑客攻击、数据篡改等 ,这些威胁可能对用户的隐私和信息安全造成严重威胁。
人工智能在信息检索中的应用
个性化检索
人工智能技术可以根据用户的兴趣、偏好和行为习惯,为用户提供更加个性化的检索结果,提高检索的准确性和 效率。
02
数据库检索的代表有CNKI、万方 等,它们提供了更为专业和深入
的搜索结果。
数据库检索的优点是信息质量较 高,收录的文献和数据较为全面 。
信息检索基础知识
例如:缩微平片、缩微胶片等。
声像型:
定义: 也称视听型,是指通过特定设备,使用光、声、
磁、电等技术将信息转换为声音、图像、影视和动 画等形式,给人以直观、形象感受的知识载体。 (一种非文字形式的文献) 优点:
信息存储密度高,形象直观、生动、逼真。 缺点:
成本高,不易检索和更新。 例如:录音带、唱片等。
专著(原始文献)
•ISBN号*
期刊
定义:
期刊一般是指名称固定、开本一致的定期或不定期 出版的汇集许多个著者论文的连续出版物。(期刊上刊 登的论文大多数是原始文献)
按内容分:学术性期刊、通讯性期刊、述评性期刊等。
例如:
按时间长短分:周刊、月刊、双月刊、季刊、年刊等。
ISSN号*
报纸
定义:
报纸是以刊载新闻和时事评论为主的定期向公众发 行的印刷出版物。是大众传播的重要载体,具有反映和 引导社会舆论的功能。
广义:信息、信息生产者、信息技术和设备。
二、信息资源(文献)的类型
(一)按文献的载体不同划分: 1、手写型 2、印刷型 3、缩微型 4、声像型 5、电子型 6、多媒体型 (二)按文献的出版形式不同划分: 1、图书 2、期刊 3、报纸 4、会议文献 5、学位论文 6、科技报告 7、专利文献 8、标准文献 9、产品样本 10、档案 11、政府出版物 (三)按文献的加工程度不同划分: 1、零次文献 2、一次文献 3、二次文献 4、三次文献
知识固化在纸张上的一类文献。 优点:
便于阅读、传递,便于大量印刷,成本低。 缺点:
信息存储密度低、分量重,体积大,收藏空间大, 保存期短,管理困难。
例如:图书、期刊、报纸以及各种印刷材料。
缩微型:
信息检索网络信息资源检索
第二节 搜索引擎概述
导航栏内栏目有:医学继续教育、会议、资源中心、 患者教育、图书馆、讨论区。医学教育为其特色栏目。 也提供多种数据库检索:Medscape是检索自身网站 的资源;Medline是美国国立医学图书馆提供的覆盖全 球近4800种医学期刊的全文数据;Druginfo是 FirstDatabank和美国医师协会提供的最大的药物数 据库,可查询20万种药物的使用剂量、毒副作用、使用 注意事项等内容。
第三章 网络信息资源检索
第一节 第二节 第三节
网络信息资源概述 搜索引擎概述 网络免费信息资源检索
第一节
网络信息资源概述
网络信息资源定义和特点 网络信息资源的类型
第一节
网络信息资源概述
一、网络信息资源定义和特点 1.网络信息资源的定义
网络信息资源是指以电子数据形式将文字、图像、 声音、动画等多种形式的信息存放在光、磁等非印刷 载体中,并通过网络通信、计算机或终端等方式再现 出来的信息资源的总和。
提供根据疾病名称、所属学科和内容性质(会议报告、 杂志文章的全文或摘要等)的英文着个字母的分类检索 (The Medscape Index)。在主页的首页可直接进入临 床管理系列(Clinical Management Series)、杂志全 文(Journals)、实用指南(Practice Guidelines)、指 南进展、杂志扫描、会议摘要和时间表、专家提问和讨论、 临床挑战等栏目。
(4)用户服务组信息资源
各种各样的用户服务组,保罗 新闻组信息资源、电 子邮件信息资源、邮件列表、专题讨论组等,都是因 特网上最受欢迎的信息交流形式。他们都是由一组对 某一特定主题有共同兴趣的网络用户组成的电子论坛, 用户以邮件形式进行网上交流和讨论。用户服务组信 息资源是一种丰富、自由和开放性的资源。
信息检索
5.信息检索新策略
? 目前综合性搜索引擎的特点是查找范围很广而深度和专业性不够。
? 实行“元搜索”,即利用元搜索引擎先对综合性搜索引擎进行主题相关的检索,分析返回页面,下载结果URL,将得到的页面进行分析、存储、提取,得到一个庞大的初始结果集。再利用这个结果集对超链进行一定的分析判断后,按照传统的沿链递归方法“爬行”,对结果集进行扩展。利用这种检索策略,既需要掌握知名综合性搜索引擎的使用方法,又需要了解专业引擎和元搜索引擎的特点。
? 智能代理是在人工智能技术上发展起来的,常见的应用功能有资源挖掘、资源集成(沟通网络上不同物理位置的分布资源)和资源定制。
? 检索领域中的智能代理的研究就是要Agent去模仿人在信息检索中的行为(思考、比较、甄别、去重、判断、评估等等),并主动完成一系列高级、复杂的自动处理任务,而不是机械、被动地代理用户完成任务。
主题目录方式:主题目录方式的优点是可通过浏览的方式层层遍历,找到所需要的信息线索,再通过信息线索链接到相应的网络信息资源。该方式具有系统性、可扩充性、结构清晰、使用方便的优点,但更适合于建立专业性网络信息资源体系。
超媒体方式:超媒体技术是超文本与多媒体技术的结合,它将文字、表格、声音、图像、视频等多媒体信息以超文本组织起来,使用户可以通过高度链接的网络结构在各种信息库中自由航行,找到所需信息。
10.跨语言检索技术
? 跨语言信息检索是指使用一种语种的提问查询不同语种的检索技术,例如,输入的是中文的提问式,信息检索系统将返回英文、法文或其他语种描述的相关信息。结果信息资料可以是文本信息,也可以是以其他形式存在的信息。目前研究的较多的是文本信息与语音信息的跨语言信息检索。
网络资源与信息检索(本科)讲课要点与考试重点
网络资源与信息检索(本科)讲课要点第一章信息检索的基础知识讲课要点:一、信息(一)基本概念(P1-2)1、信息:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就成为信息。
2、文献:大凡人类的知识用文字、图形、符号、声频、视频的手段记录下来的东西,统统可称为文献。
也可以称为固化在一定载体上的知识。
3、资料:固化在一定的实物或载体上的知识。
4、信息的传递渠道(二)信息的类型及特点(P4-7)从不同的角度信息可以分为不同的类型1、加工层次(请注意这三者的不同与联系)(1) 一次信息(原始文献)(2) 二次信息(检索工具)(3) 三次信息(参考工具)2、出版形式——图书、期刊、特种文献,结合教材P24-25的内容(请从基本概念、内容特点、著录特点三个方面着重掌握图书、期刊、会议、专利、标准、学位六种类型)3、物理类型——印刷型、缩微型、机读型、声像型4、按信息的性质划分P75、按信息所表征的服务对象划分P7二、信息检索(P2-4)(一)信息检索就是从大量的文献中查寻与信息提问所指定的课题(对象)有关的文献,或者是包含用户所需事实与消息的文献的过程。
它包括三个方面:数据检索、事实检索、文献检索数据检索、事实检索、文献检索三者中以文献检索为主。
数据和事实检索是检索出包含在文献中的具体情报;文献检索则是要检索出包含所需要情报的文献。
(二)文献检索及其类型1、定义:检索系统的建立及检索工具的组织和积累文献的查寻,利用检索工具检出与课题相关的文献。
2、直接检索是从通过阅读原始文献直接获取所需信息快捷、方便漏查率高3、间接检索是通过检索工具的指导再查找原始文献而获取所需信息。
系统、全面滞后? 为什么间接检索是一种更为科学的检索方法?三、检索工具(P8-11)(一)基本概念:按一定的学科、主题等进行搜集整理并给予文献的标志,是及时报道的二次文献,具有报道、存贮、检索的功能。
信息资源检索与利用
学术搜索引擎通常提供高级搜索功能,如关键词搜索、作者搜索、引用搜索等,使用户 能够更加精确地定位所需信息。
数据库检索
01 02
数据库检索
数据库检索是指通过专门的数据库进行信息检索的方式。这些数据库通 常由专业机构或出版商提供,收录了大量的学术论文、期刊文章、专利 等资源。
权威性高
数据库中的资源通常经过筛选和评价,具有较高的权威性和可信度。
使用布尔逻辑运算符
利用AND、OR、NOT等运算符优化检索结果。
限定检索范围
通过限定时间、地区、文献类型等,缩小检索范围,提高检索效 率。
利用高级检索功能
许多检索工具都提供高级检索功能,利用这些功能可以更精确地 定位信息。
信息筛选与评价
01
02
03
筛选相关性
从检索结的是为用户提供准确、 及时、全面的信息,以满足用户的需 求。
信息检索原理
信息检索原理:信息检索的原理主要包括信息标引、信息组织和信息检索三个环节。
信息标引是指对信息资源的主题内容进行标识和描述,以便于信息组织;信息组织是指将标引后的信息按照一定的方式进行 整理、归类、存储,以便于信息检索;信息检索是指根据用户的需求,利用一定的技术和方法,从信息组织中查找、获取、 提炼和组织所需信息的过程。
核心。
信息素养是实现个人自我价值和 推动社会进步的重要因素,对于 个人职业发展、终身学习以及社
会进步具有重要意义。
信息素养能力要求
信息获取能力
能够根据需要,通过各种途径 获取相关信息,包括图书馆、
互联网、数据库等。
信息评价能力
能够对获取的信息进行客观评 价,判断其真实性和准确性。
信息利用能力
能够将获取的信息应用于实际 工作和学习中,提高工作效率 和创新能力。
网络信息资源检索
e、Gopher信息资源 Gopher信息资源 Gopher又称信息鼠,这是一种基于菜单的网络服务, Gopher又称信息鼠,这是一种基于菜单的网络服务, 又称信息鼠 类似万维网的分布式客户机/服务器形式的信息资源体系。 类似万维网的分布式客户机/服务器形式的信息资源体系。 它是因特网上一种分布式信息查询工具,各个Gopher Gopher服务 它是因特网上一种分布式信息查询工具,各个Gopher服务 器之间彼此连接,全部操作都在一级级菜单的指引下,用 器之间彼此连接,全部操作都在一级级菜单的指引下, 户只需在菜单中选择和浏览相关内容, 户只需在菜单中选择和浏览相关内容,就完成了对因特网 上远程联机信息系统的访问。此外,Gopher还可提供与前 上远程联机信息系统的访问。此外,Gopher还可提供与前 文所提及的其他多种信息系统的连接, WWW、FTP、 文所提及的其他多种信息系统的连接,如WWW、FTP、 Telnet等 Telnet等。
(5)按发布机构分: )按发布机构分:
a、企业站点信息资源 、 这类资源站点一般以com为一级或二级域名注 为一级或二级域名注 这类资源站点一般以 如中国石化公司。其 册。如中国石化公司 。 信息资源一般以初始信息为主, 信息资源一般以初始信息为主,如提供公司整体概 各类产品信息、商业服务信息等,更新及时、 况,各类产品信息、商业服务信息等,更新及时、 动态性强。 动态性强。 b、学校、科研院所站点信息资源 、学校、 这类站点一般以edu或ac为一级或二级域名注 或 为一级或二级域名注 这类站点一般以 册,如(江南大学)现名: (江南大学)现名: 。主要提供学术性较强的各种 。 信息,如科研活动介绍、学术动态、信息检索、 信息,如科研活动介绍、学术动态、信息检索、远 程教育等。 程教育等。
信息检索复习资料
A卷一、名词解释:1.信息资源 2.信息检索3.著录法4.关键词标引5.知识发现二、填空1.按组织方式分,信息检索有()、()、超媒体检索。
2.信息检索策略有两种方式即()和()。
3.表示主体的检索词有标题词、()、()关键词。
4.常用的逻辑运算符有:()、OR或+、()。
5.信息检索工具常用的排检方法有字序法、()。
6.中国特有的工具书是()、()。
三、问答1. 信息检索的研究内容有哪些?2. 数据库有哪些类型?3. 搜索引擎的类型有哪些?四、论述1、试例说明传统检索型工具书和参考型工具书的使用。
2、如何利用检索工具查找历史类文献?参考答案:一、名词解释(30%)1.信息资源。
是人类存储在载体(包括大脑)上的已知或未知的可利用的资源。
信息中的载体信息和主题信息资源的最基本的组成部分。
2.信息检索。
是从大量相关信息中利用人—机系统等各种方法加以有序识别与组织以便及时找出用户所需部分信息的过程。
3.著录法。
是对信息与文献的形式特征和内容特征进行分析、选择和记录的方法。
4.关键词标引。
使用非规范化的自然语言——关键词来表达文献或信息资源主题内容的过程。
5.知识发现。
是从数据中发现有用知识的整个过程,使多个步骤相互连接,反复进行人机交互的过程。
二、填空(20%)1.按组织方式分,信息检索有全文检索、超文本检索、超媒体检索。
2.信息检索策略有两种方式即手工检索策略和计算机检索策略。
3.表示主体的检索词有标题词、单元词、叙次、关键词。
4.常用的逻辑运算符有:AND或*, OR或+, NOT或-。
5.信息检索工具常用的排检方法有字序法、类序法。
6.中国特有的工具书是类书,政书。
三、问答(24%)1.信息检索的研究内容有哪些?检索理论研究、检索语言研究、数据库研究、著录法研究、检索系统研究、检索策略研究、检索服务研究。
2.数据库有哪些类型?传统数据库(情报数据库、图形数据库等);专门应用领域的数据库(统计数据库、工程数据库、空间数据库;新一代数据库(分布式数据库、多媒体数据库、面象对象数据库、实时数据库等)。
网络信息检索试题及答案
网络信息检索试题及答案1. 试题:问题1:请简要说明网络信息检索的概念和意义。
问题2:网络搜索引擎是如何工作的?请描述其大致流程。
问题3:在进行信息检索时,如何选择合适的关键词?请列举几个选择关键词的技巧。
问题4:什么是布尔检索?请解释布尔检索的原理,并举例说明。
问题5:简述专业学术搜索引擎的特点及其在科研领域中的应用。
2. 答案:问题1:网络信息检索的概念和意义网络信息检索指的是通过互联网来获得所需信息的一种技术和方法。
随着互联网的快速发展,信息爆炸性增长,人们在获取所需信息时遇到了很大的困难。
网络信息检索的出现,解决了这一问题。
它可以帮助用户快速、高效地从海量的网络信息中筛选出所需的内容,节省了人们寻找信息所需的时间和精力。
问题2:网络搜索引擎的工作原理与流程网络搜索引擎是一种用于在互联网中搜索信息的工具。
它的工作原理可以大致分为三个步骤:爬取、建索引和搜索。
首先,爬取阶段,搜索引擎会使用网络爬虫程序从互联网上获取网页内容。
爬虫程序按照一定的策略,通过链接跳转关系,沿着网页之间的链接获取更多的网页。
然后,在建索引阶段,搜索引擎会对获取的网页内容进行处理,提取出关键词,并将这些关键词与网页建立索引。
索引的建立包括对关键词进行分词、去除停用词、统计词频等操作,以便后续的检索。
最后,在搜索阶段,用户输入关键词,搜索引擎会根据建立好的索引从海量的网页中匹配与关键词相关的网页,并将结果呈现给用户。
搜索引擎会根据网页与关键词的相关度排序,并提供用户进一步的过滤和排序选项,以便用户找到最符合需求的信息。
问题3:选择合适的关键词的技巧选择合适的关键词是进行网络信息检索的关键,以下是几个选择关键词的技巧:1) 确定主题:首先明确需要搜索的主题是什么,将主题所涉及的关键词列出来。
2) 同义词替换:考虑使用与主题相关的同义词或近义词,以扩大搜索范围。
3) 组合关键词:将多个关键词组合使用,可以缩小搜索范围,提高搜索精确度。
网络信息资源检索方法
网络信息资源检索方法
网络信息资源检索方法
一、通用检索方法
1.关键字检索法:利用随机检索词组进行检索,取得相关信息资源,在资源数量大多时十分有效。
2.元检索法:将检索词扩充为包含变体、前缀、词根、后缀等,以获得更大量的检索结果。
3.定向检索法:根据检索词的相关关系,建立检索词的主题及邻接词,定向检索更多内容相关的信息。
二、高级检索方法
1.混合检索法:将关键字检索和元检索相结合;利用元检索扩大检索词集,再进行关键字检索及筛选,把检索成果进一步提高。
2.前后文检索法:可选择检索词的前一句话网页和后一句的信息,来提高检索准确率。
3.元数据检索法:当Web页面使用XL节点,以ML格式保存时,可以通过检索XL或ML中的特性元数据信息的检索方法,来检索相关信息资源。
三、特殊检索方法
1.知识检索法:根据客观世界中知识,以抽象数学、计算机求解和启发式方法,来检索Web资源。
2.主题检索法:从其他网站内容中抽取信息,根据主题声明方式进行检索,以达到信息检索的目的。
3.联想检索法:根据网页关键字等特征,检索出相似但含义不同的信息资源,以全面检索主题性内容。
文献信息检索第4章 习题与答案
第4章网络信息资源检索1.搜索引擎的类型有哪些?常用的中文搜索引擎是什么?答:1)搜索引擎的类型:按信息覆盖范围及用户群可分为通用搜索引擎(综合搜索引擎)和垂直搜索引擎(专业搜索引擎);按搜索范围搜索引擎可以分为独立搜索引擎和元搜索引擎;按其工作方式(索引方式)分为目录式搜索引擎、全文搜索引擎和语义搜索引擎。
2)常用的中文搜索引擎:Google(谷歌)、百度搜索引擎、搜狗搜索引擎、必应搜索引擎、360搜索引擎等。
2. 简述搜索引擎的工作原理和常用搜索引擎提供的检索方式。
答:1)搜索引擎的工作原理可以归纳为三步:抓取网页——处理页面(建立索引数据库)——建立检索页面。
2)常用搜索引擎提供的检索方式主要是分类目录检索和关键词检索。
(1)分类目录检索:分类目录检索索引数据库通常称为目录(Catalog),该目录是由人工进行分类建立的,类似于图书馆的目录,适合于主题较宽或要求较为简单的查询。
(2)关键词检索:关键词检索主要是指利用搜索索引查找网页的方法,适合于主题较为专指、细小或狭窄的查询。
3. 如何在百度中快速地查找到“西藏”地图,如何使用检索技巧快速检索出文件类型(扩展名)为PPT的“有机化学”信息和中国教育网上有关“周济”的信息。
答:1)查找“西藏”地图步骤:(1)打开百度();(2)点击右上角的“地图”,在搜索框内输入“西藏”,点击回车即可。
2)检索有关“有机化学”、文件类型为PPT的信息方法有二:方法一步骤:(1)打开百度();(2)点击右上角的“设置”----“高级搜索”,指定文件格式为PPT(.ppt),在搜索框内输入“有机化学”,点击高级搜索即可。
方法二步骤:(1)打开百度(),利用高级检索语法filetype:直接输入检索式;(2)利用高级检索语法filetype:直接在主页搜索框中输入“有机化学filetype:ppt”,点【百度一下】或回车即可。
3)检索中国教育网上有关“周济”的信息:(1)打开百度();(2)直接利用百度高级语法site:,在主页搜索框输入直接输入“周济site:”,点【百度一下】或回车即可将检索结果限定在 中。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
形成提问式
即用户把概念上的需求以检索词的形式提交给检索 系统。提问式是检索系统理解用户信息需求的主要 途径,因此提问式是影响检索效率的关键因素。
国内外的研究表明,用户形成提问式趋于两个特点:
– 用户多倾向于采用单一的检索词汇。
– 用户只使用简单的检索提问式。而研究已经表明:
若想得到更高的检准率,用户应尽可能多地使用 搜索引擎的高级检索。
机器人搜索引擎
由一个蜘蛛(Spider)的机器人程序以某种策略自动 地在互联网中搜集和发现信息,由分析模块为搜集
到的信息建立索引,再由检索模块根据用户的查询
要求检索索引库,并将查询结果返回给用户。
优点:信息量大、更新及时、毋需人工干预; 缺点:返回信息过多,有很多无关信息,用户必须 从结果中进行筛选。 这类搜索引擎的代表有NorthernLight、Excite、 Infoseek、FAST、Google。
加“-”号表示去除该检索词,但要在+、-号前 留一个空格位。如检索“ 乙肝预防 ”方面的信息, 需输入“ hepatitis B +prevention ”;检索“人 类乙肝 ”方面的信息,可输入“ hepatitis B –
animal ”,即可去除动物乙肝方面的信息。
Google的检索规则(4)
用“ ” 指短语检索或精确检索。如 “ hepatitis B virus ”。可以准确查询乙肝
病毒方面的信息。在查找专有名词时格外有
用。
Google的检索规则(5)
支持“ OR ”(大写)搜索,如要查询“ 甲 肝 ”或“ 乙肝 ”方面的内容,可输入:
甲肝 OR 乙肝
Google的检索规则(6)
用户需求
需求表达
反 馈
数据库
索 引 索引文档相关Fra bibliotek法形成提问式
匹
配
按相关排序
结果输出
网络信息检索过程
影响网络信息检索的用户因素(一)
影响 信息检索过程 的用户因素 信息需求和需求表达 形成提问式
• •
•
相关判断
研究证明:用户的动机和信息需求的重要性会影 响信息检索的持续时间和用户所作的检索努力。 信息需求 需求表达 递减过程
相关判断
用户的相关判断是人机交互的基础,是再次 形成提问式的前提,而决定“相关性”的尺度
则完全由用户决定。
有很大的随意性
影响网络信息检索的用户因素(二)
用户的思维、习惯、情感状态因素
• 思维定势 • 惰性思维
• 情感状态
影响网络信息检索的用户因素(三)
个体差异性因素
• 性别
• 年龄
• 经验
网络数据资源 用户
网络搜索引擎
网络数据资源因素
数量丰富 规范性差
可信度低
“因特网与其说把用户带入了信息世界,不如说 是把他们领进了茫茫无际的大海”。 -----《时代周刊》
用户因素
信息检索的定义是:处理信息条目的显示、存 储、组织和访问,而显示和组织信息条目是为
了使 用户更容易访问他们感兴趣的信息。
PageRank “网页级别” 技术
人气质量 地点和频率法
当从网页 A 链接到网页 B 时,Google 就认为" 网页 A 投了网页 B 一票"。
Google按照关键字的相邻程度对检索结果进 行区分排列,免去了不相关结果的干扰。
提交检索式后应答十分迅速,最多仅需5秒即
可返回搜寻结果。
• 知识
网络搜索引擎
搜索引擎是因特网上的工具网站,其主要任务 就是在因特网上主动搜索Web服务器中的信息
并将其自动索引,将索引内容存储于可供查询
的索引数据库中 。
网络搜索引擎
按照信息搜集方法和服务方式的不同,搜索引擎
系统可以分为三大类:
• • •
目录式搜索引擎
元搜索引擎
机器人搜索引擎
目录式搜索引擎
不区分英文字母大小写, 所有的字母均作小写处
理 。例如:输入“ MEDLINE ”、“ Medline ”,
或是“midline ”,结果都是一样的。
基本检索界面
基本检索 Google Search
在主页检索框内直接输入查询内容,点击下方的 “ Google Search ”键,即可检出所有相关网站;其
网络信息资源检索
Internet的最早起源于美国国防部高级研究计
划署DARPA(Defence Advanced Research
Projects Agency)的前身ARPAnet,该网于 1969年投入使用。由此,ARPAnet成为现代计 算机网络诞生的标志。
构成网络信息资源检索的要素
水平。用户可以在3D地图上搜索特定区域,
放大缩小虚拟图片。Google Earth主要通过 访问航天和卫星图片扩展数据库来实现这些 上述功能,含有美国宇航局提供的大量地形 数据,未来还将覆盖更多的地形。
• 不使用词干法,也不支持通配符“ * ”搜索, 对查询要求一字不差。如:对“ element ”和
“ elements ”的搜索,会出现不同的结果,
因此在搜索时需试用不同的关键词。
Google的检索规则(3)
可用“ + ”或“ – ”号控制检索范围,检索词前加
“+”号表示检出内容必须包括该检索词,检索词前
“ 手气不错 ”设置点击检索键旁边的“ I’m Feeling
Lucky ”,则检出Google推荐的最佳网站.
基本检索界面
网页目录界面
图片检索界面
新闻浏览界面
Google earth
Google Earth采用的3D地图定位技术把 Google Map上的最新卫星图片推向一个新
元搜索引擎
面向网页的全文检索,但没有自己的数据库,而是
将用户的查询请求同时向多个搜索引擎递交,将返
回的结果排序后,提供给用户。
优点是返回结果的信息量更大、更全; 缺点是不能充分使用有关搜索引擎的功能,用户需 要做更多的筛选。
这类搜索引擎的代表有WebCrawler、InfoMarket等。
以人工方式或半自动方式搜集信息,人工形成信 息目录、摘要,并将信息置于事先确定的分类框
架中,建立分类目录。
优点:信息准确、导航质量高 。 缺点:需要人工介入、维护量大、信息量少、信 息更新不及时 。 这类搜索引擎的代表有Yahoo、Looksmart、 OpenDirectory、 GoGuide等。
www.Google .com
由斯坦福大学计算机科学系 LarryPage 和 SergeBrine 博士于1998年创建。现已拥有30多亿网页,支持多
种语言检索,包括中文简体和中文繁体,并有中文
Google 网页。
Google = 10100
汉语里大数名字不多,通常用的亿、兆、京、垓分 别是 10 的 8 次方、12 次方、16 次方和 20 次方。 由佛经引入的大数有恒河沙(10 的 52 次方)、频 波罗(10 的 56 次方),矜羯罗(10 的 112 次 方),佛经里最大的数叫做“不可说不可说转”,为 10 的 7 X 2122 次方。
Google的检索规则(1)
• 关键词之间默认逻辑关系为AND。不需要在关 键词之间加 AND 或 + ;如果想缩小搜索范围,
只需输入更多的关键词,在关键词中间注意留
空格。如查找“糖尿病预防”,只需输入
“diabetes prevention”,或“糖尿病预防”即
可。
Google的检索规则(2)