什么是信息检索
04 网络信息检索-检索表达式

3、 科 技 特 种 文 献
科技报告 科技会议文献 专利文献 学位论文 标准文献 政府文献 产品资料 科技档案
45
(1)科技报告(technical report)
是报道科学研究项目和开发调查工作的成 果总结,或是其进展中的阶段性进展情况报告。 科技报告的内容不少涉及国家部署、支持的高 科技研究项目,包括生产技术方面的、基础理 论方面的。它专业性强,报道详尽,有技术数 据、图表,有研究比较,出版速度快。
37
科技图书内容比较成熟、全面、可靠、系统, 它是对已有研究成果、生产技术和经验或某一 知识体系的论述或概括。 科技图书的基本素材来自期刊论文、会议论文、 研究报告、学位论文等一次文献,其中包括作 者本人的研究、见地。 科技图书的出版周期较长,信息传递较慢,这 是它的一大遗憾。为获得最新研究信息,科技 人员首选的出版物是科技期刊。
——十大信息源
(1)科技图书 (6)科技报告
(专利文献 (5)学位论文
特 (8)标准文献
种
文 (9)科技档案 献 (10)产品样本
36
1、科技图书(Sci-Tech book)
一般分为两大类:阅读类图书(reading book)和参考类图书(reference book),前 者有教科书(text book)、专著(monograph) 和论文集(anthology)等,后者是参考工具 书(reference book),它们是百科全书 (encyclopedia)、手册(handbook)、年鉴 (yearbook)等。
20
逻辑与(AND)*
换一个角度看,“逻辑与”又能 防止漏检。
例如,用户输入“新闻美学”作 为检索词,可命中《戈公振的新闻 美学实践》这样的文献,但漏检了 《新闻的美学属性》、《新闻标题 中的美学》这些文献。如果用“新 闻*美学”来进行检索,则上述三 篇文献都检中。
信息管理的基本理论

18
按信息源的运动规律划分:
➢ 离散信息源:不受时间限制,没有规律性,断断续续或零 星生产的信息;
➢ 连续信息源:随着时间的推移而连续不断地、有规律地发 出的信息。
按信息源在信息布局中的地位划分:
➢ 强势信息源:处于主导地位的信息源; ➢ 弱势信息源:处于随从地位的信息源。
23
② 选择信息来源
类型
例子
优点
不足
文献型信息源
口头型信息源 (个人信息源
)
电子型信息源
实物型信息源 (现场信息源
)
报纸、期刊、公文、 报表、图书、辞典
同学、朋友、亲戚、 父母、老师
广播、电视、电话、 因特网
运动会、动物园、销 售市场、各类公共场
所及事件发生现场
全面、系统、可靠、 清晰、明确
灵活、方便
明确目的确定内容选择方法搞好预算二信息收集的原则和程序222信息收集的基本程序定位信息需求选择信息来源确定获取方法评价信息观察法问卷调查计算机检索文献型口头型电子型实物型信息的时间信息的地域信息的内容范围信息的数量适应性载体形式可信度时效性定位信息需求信息需求包括所需要的信息和要求表现在
信息管理学
Information Management
➢ 人物信息源:人是信息的创造者,是最富活力的信息源;
人类的语言使得人类能不断创造与传播各种信息
➢ 实物信息源:直观生动,含有丰富的信息
➢ 文献信息源:存储在纸张、胶片、磁带、磁盘等物质载体 上而形成的信息源;基本功能:存储和传播信息
➢ 机构信息源:以机构单位、团体组织为范畴的信息源,如 图书馆、档案馆、科研机构、学术团体等
文献检索整理(W)

一、概念1.信息:信息是人类了解自然及人类社会的凭据;是指对消息的接受者来说预先不知道的报道;是生物以及具有自动化控制系统的机器通过感觉器官和相应的设备与外界交换的一切内容。
2.知识:是人类对客观事物规律的认识。
是人的主观世界对客观世界的概括和如实反映。
是人类征服自然、改造自然的经验记载。
是人类大脑通过思维重新组合、转换、提炼系统化的信息组合,是信息的一部分。
3.情报:为解决一个特定问题所需要的、取得的一种针对性、及时性的知识。
是人们在一定时间内为一定目的而传递的有使用价值的知识。
4.文献:在存贮、检索、利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、或在载体上或依附载体而存贮有信息或数据的载体。
换言之,文献就是记录有知识的一切载体。
5.一次文献:也叫一级文献或原始文献,是作者根据工作经验、研究成果和实践体会为依据形成的处于原始形式中的文献。
6.二次文献:也叫检索性文献是将一次文献(包括部分三次文献)浓缩、整序、加工编辑成有系统的条目化文献,将大量分散的无序信息转变为有序的便于管理的系统。
7.检索工具:检索工具是用以储存、报道和检索文献的工具。
因此,它具有存储和检索的功能。
8.检索语言:检索语言是指用于描述检索系统中信息的外部特征和内部特征及表达用户信息提问的一种专门的人工语言,是保证存储和检索一致的一种共同性的人工语言。
9.索引:是指对文献的外表特征和内容特征用各种检索标识符(字母、数字、汉字等)进行描述,并将它们按一定的规则及排列方式组织起来。
10.信息检索:广义的信息检索全称为“信息存储与检索”,是指把信息按一定的方式予以排列、贮存,并根据用户需要检出所需信息的过程和技术。
狭义讲是指从信息集合中查找并检出用户所需要的信息的过程。
信息检索分为文献检索、数据检索、事实检索。
11 分类号:每一个类目都用相对固定的代码作为标识,叫做分类号。
12.知识产权:知识产权,概括的说,是指公民、法人或其公组织对其在科学技术和文学艺术等领域内,主要基于脑力劳动创造完成的智力成果所依法享有的专有权利。
信息检索技术

第一章信息检索概述1,什么是信息检索?它有哪些主要类型?信息检索指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程。
有目的和组织化的信息存取活动,其中包括“存”和“取”两活动。
旧分类方法:文献检索、事实检索、数据检索新分类方法:文本检索、数值检索、音/视频检索2,试分析阐述信息检索的基本原理,信息集合、需求集合、匹配与选择,信息检索三阶段及期特点?答:即信息集合与需求集合的匹配与选择。
(1)信息集合是指有关某一领域的,经采集、加工的信息的集合。
形成可供用户访问与检索的对象,在某种意义上说,它是以一种公共知识结构,它有可能弥补某个特定用户的知识结构缺陷,即可以向用户提供所需要的知识或信息,或是获取知识的线索,或者提供某种信息区激活人脑中存储的知识。
(2)需求集合:用户的信息需求是在社会实践活动中产生的。
众多用户不同形态的信息需求的汇集,就形成了需求集合的存在。
信息需求的产生与满足,是实施信息检索行为的前提与基础,也是实施信息检索行为的目的所在。
(3)选择与匹配:面对信息集合与需求集合,如何在两者之间建立起了解与沟通的桥梁,以便能够从信息集合中快速获取用户所需要或所缺少的信息与知识呢?这就需要信息检索提供一种“匹配”机制。
它的主要功能在于:能够把需求集合与信息集合依据某种相似性标准进行比较与判断,进而选择出符合用户需要的信息。
这里,我们要求匹配机制至少包括两个要素:一是匹配标准,即相似性标准;二是执行匹配的动因。
3,信息检索主要经历了哪些不同的发展阶段?各阶段有何特点?(1)手工检索阶段,主要特点可以概括为印刷文献(图书、期刊、会议、专利、学位论文)为主要检索对象;以各类文摘、题录、和目录性工具书为可利用的主要检索工具;以图书馆的参考咨询部门为开展信息检索服务的中心机构。
(2)计算机化检索阶段(脱机批处理检索时期、联机实时检索时期、联机网络化与多元化检索时间),主要特点:以各类机读数据库为检索对象;各类信息中心,联机服务中心作为新兴的信息服务部门而存在;信息检索用户逐渐由专业检索人员(检索中介)向个人终端用户转移和扩散。
什么是信息检索

什么是信息检索?1、信息检索是一门关于如何查找文献、知识和信息的工具性课程,被认为是开启知识宝库的金钥匙。
2、信息检索课程是一门对于本科生到博士生都具有很强实用性的课程,对于帮助我们学生提高科研能力和拓宽科研领域具有重要的作用。
开设信息检索课的作用大学生需要学习,如何提高自己获取和利用文献信息的能力;进入工作岗位后如何更新自己的知识结构,使自己不落伍.所以,获取知识和信息的能力成为了大学生必须具备的重要能力之一.信息检索这门课主要讲授检索文献的一些基本方法,培养学生检索文献的技能.学习和科技需要文献,个人全面素质的提高需文献,生活中也离不开各种信息.我们在信息检索课中,老师侧重介绍了信息检索工具与检索技巧!但对于今后我们的生活中,这种检索思想将会发挥更大的作用,所以平时我们应多积累一些有关互联网上的检索工具(包括搜索引擎和检索技巧)方面的知识,这方面的能力可能带给我们更大的实惠。
信息检索课程作为一门方法课程,它不仅使我们的信息意识更为敏锐,而且使我们了解了信息组织与检索的原理,让我们学会了操作使用各种专业文献信息数据库和网络检索工具。
通过老师认真指导在我们不断练习的基础上,我们不仅掌握了娴熟的检索操作技能,而且逐步掌握了如何选择合适得信息源,如何确切表达特定的信息需求,以与如何应对检索过程中出现的各种问题。
在信息检索课中学习到了什么?1、通过信息检索课程学习,知道了什么是信息,信息的有哪些类型,信息有什么特征,信息有什么作用。
2、通过信息检索课程的学习,知道什么是信息检索,信息检索的类型有哪些,知道了信息检索的过程,知道了信息检索的方法和途径,知道了信息检索的技巧和策略,学会了如何去评价信息。
3、通过信息检索课程的学习,知道了网络上原来还有那么多数字图书馆,有那么多知识数据库。
4、通过信息检索课程的学习,发现搜索引擎并不是仅仅用来搜索网页和MP3,还可以用来搜索重要的知识,发现了搜索引擎原来还有如此多的笑秘密。
信息检索

1.信息素质的三大要素是什么?信息意识:指人对于各种信息的自觉的心理反映(包括对于信息的科学的,正确的认识以及对自身信息需求的意识)信息能力:是指所具备的关于信息技术应用的知识与能力(包括信息查询获取,组织加工,综合分析以及对信息的有效利用,评估,传播等方面的知识与能力)信息道德:是指整个信息活动中的道德规范(包括信息的生产者,加工者,传播者以及使用者都必须自觉遵守和维护的信息道德规范)2.信息检索的主要功能是什么?“从自身角度出发来谈,”3.什么是学术水平信息检索?是指具有魔种权威性的单位(机构)为了客观的考察,评价或奖励在学术研究方面做出贡献的个人或组织,借助国际公认的著名三大检索系统(如SCI,EI,CPCI),对一定时限内某地区,某组织及有关个人所撰写的研究论文等进行全面检索,从一定的层面上反映和评判有关地区,组织及个人的学术水平的检索活动。
4.什么是科研课题立项信息检索?主要作用是什么?科研课题立项信息检索(也加科技查新)是国家科技都为避免科研课题重复立项和客观正确的判断科研成果的新颖性而设立的一项工作。
其作用主要表现在()证明即将开展的科研是否具有必要性,能否成为有科研价值的科研项目。
()获得科研背景资料及相关材料,使得科研工作更加高效,完善。
()避免重复研究,浪费人力物力财力。
5.文献的概念是什么?是记录有知识的一切载体(GB3792.1.83)83是时间,如果加个T是代表参考6.什么是一次文献?一次文献是指作者以本人的生产实践,学术研究与科研工作成果为依据,进行创作,撰写而形成的文献。
如期刊论文,科技报告,会议论文,专利说明及各种专著等等。
7.专利的类型:发明专利实用新型外观设计特点:新颖性创作性实用性专利的三方面含义:专利权专利技术专利文献8.什么叫二次文献?是对一次文献信息进行加工、提炼、浓缩而形成的工具性文献。
它主要包括通过对大量分散无序的一次文献的收集与组织——按照一定的方法进行整理、加工,使之有序化、系统化——形成各种书目,题集和文献数据库。
信息检索

1.什么是信息检索?从广义的角度讲,信息检索包含信息存储和信息获取两个过程。
信息存储指通过对大量无序信息的选择和收集、著录和标引等方法,建成各种各样的信息检索工具或信息检索系统,使之成为有序化信息集合的过程。
获取是存储的逆过程,其实质是根据特定的需求,运用以组织好的检索系统,将特定的信息查找出来。
存储是获取的前提和基础,没有存储就没有获取,而获取是存储的目的,二者密切联系,互相依存,缺一不可。
狭义的信息检索是指广义的信息检索的后一个过程,即信息获取的过程,相当于人们所说的信息查检等。
具体来说,狭义的信息检索指通过一定的方法,从已存储的信息中检索出与用户提问相关的文献、数据和事实的过程,即根据用户的特定要求查找所需信息的过程。
2.信息检索效果的评价指标有哪些?(1)检索效果有效性评价,即检索技术效果的评价,是对检索系统满足检索要求的有效程度的评价,主要以查全率和查准率为评价标准。
(2)检索系统使用的评价,包括系统对用户是否需要,是否实用有多大的实用效果,即检索的社会效果的评价,需要应用社会学方法。
(3)检索费用——效率评价,即检索的经济效果的评价,包括检索系统完成检索服务的成本及时间消耗,需要应用经济学方法。
评价信息检索效果的指标主要有6个:收录范围、查全率、查准率、响应时间、用户负担和输出形式。
附:查全率=【检出相关文献信息量/检索系统中相关文献信息总量】*100%=(a/a+c)*100%查准率=【检出相关文献信息量/检出文献信息总量】*100%=(a/a+b)*100%漏检率=【漏检相关文献信息量/检索系统中相关文献信息总量】*100%=(c/a+c)*100%误检率=【误检文献信息量/检出文献信息总量】*100%=(b/a+b)*100% 3.什么是检索语言?检索语言的实质是用于表达一系列概括文献信息内容的概念及其相互关系的概念标识系统。
它可以是从自然语言中精选出来并加以规范化的一套词汇,可以是代表某种分类体系的一套分类号码,也可以是代表某一类事物的某一方面特征的一套代码(如化合物的各种代码),用于对文献内容进行主题标引、特征描述或逻辑分类。
荷兰医学文摘excerptamedica

定义:一种用激光技术在特制圆盘上记录和再生信息的介 质,是一种不同于磁性载体的光学存储器
直径4.75英寸 重量150g
* 只读光盘 CD-ROM(Compact Disc-Read Only Memory) * 写读光盘 WORM (Write Once Read Many) * 可擦写光盘 Writable
⑶倒排文档: 将数据库中记录的全部文献特征标识按一
定顺序排列而成的文献记录集合。 2、数据库的利用
倒排文档:
著者倒排文档 著者 存取号 Han js … 010003 Han qd …010001 Ma dl …010002
.
.
.
.
.
.
主题词倒排文档 主题词 存取号 基因 … 010003 心血管 … 010001 肿瘤 … 010002
(一)脱机检索 Off-line Retrieval
定义:又称批式检索,是指用户将检索要求送往检索 中心,由专职操作计算机的人员进行检索,再将 检索结果返回给用户的一种检索方式。
优点:①批处理可同时进行多项检索(信息存储在 磁带上)
②检索费用低,无通讯费用,费用由用户平贪
缺点:①缺乏用户与系统的直接交流,检索要求表 达不清,影响检索质量, “ 一次机会”式的检索 ②时间上的延迟
优点:
① 克服了地理上的障碍 ,“人机对话”方式可使检索 者随意更改检索策略,从而达到很高的检全率和 检准率
② 消除了时间上的延迟:分时 ③ 保证检索者获得最新、最及时的文献信息
缺点:
①检索费用高:如 Dialog系统 ②检索技术较为复杂,难以成为普及型的检索手段
(三)光盘检索 CD-ROM SEARCHING
信息检索复习思考题

信息检索复习思考题第一部分:信息检索概述1、信息资源的概念及其特点是什么?答:信息资源是人类存储与载体(包括人脑)上的已知或未知的可利用的信息。
信息中的载体信息和主体信息是使信息资源的最基本的组成部分。
特点:客观性,寄载性,传递性,动态性,相对性,增长性,共享性,规模性。
2、简述信息资源的类型。
答:按照信息资源的开发程度来区分,可分为潜在信息资源与现实信息资源两大类。
现实信息资源又可分为口语信息资源、体语信息资源、实物信息资源、文献信息资源、网络信息资源和多媒体信息资源。
3、什么是信息检索?其类型是什么?答:信息检索包括存储与检索两个部分。
存储是对有关信息进行选择、并对信息特征进行著录标引和组织,建立信息数据库;检索则根据提问制定策略和表达式,利用信息数据库。
这里要理解概念分析。
概念分析即将概念转化成系统语言,是存储与检索共有的过程,因此从这个意义上说,信息存储是信息检索的逆过程,两者是不可分割的一个整体。
类型:1.按检索内容分,有数据信息检索、事实信息检索和文献信息检索2.按组织方式分,可有全文检索、超文本检索和超媒体检索3.按检索手段分,有手工检索和机器检索4、信息检索的研究内容有哪些?答:1.检索理论研究2.检索语言研究3.数据库研究4.著录法研究5.标引和组织法研究6.检索系统研究7.检索策略研究8.检索服务研究第二部分:信息检索理论与方法1、如何制定检索策略?答:1.选择检索系统2.确定检索词3. 构造检索表达式4.实施检索策略2、检索词有哪些?答:1)表示主题的检索词标题词,单元词,叙词,关键词2)表示作者的检索词作者姓名、机构名3)表示分类的检索词分类号4)表示特殊意义的检索词ISBN、ISSN、引文标引词3、信息检索方法主要有哪些?常规检索法、回溯检索法、循环检索法4、据文献的内部特征和外部特征,有哪些信息检索途径?据文献外部特征和内部特征,信息检索途径分为两大类:1.以文献的外部特征为检索途径1)题名途径2)责任者途径3)号码途径2.以文献内容为检索特征1)分类途径2)主题检索3)分类主题索引5、解释著录、著录法、款目、标引。
图书馆基础理论知识

. .图书馆基础知识与理论1、什么是图书馆:据《中国大百科全书》的解释,图书馆是收集、整理、和保存文献资料并向读者提供利用的科学、文化、教育机构。
2、图书馆的职能与属性:基本职能:“保存”和“利用”。
社会职能:传递文献、文化教育、保存人类文化遗产、文献整序。
图书馆本质属性:信息交流中介。
3、图书馆构成要素:文献信息资源、用户、工作人员、技术方法、建筑与设备。
4、图书馆的基本业务:收集:图书馆的藏书是经过长期积累形成的通过经常的收集补充,才能形成有系统有特色的藏书体系。
整理:收集到馆的图书文献,需要进行登记、分类、著录、加工等工作,才能建立起科学的藏书体系提供给读者使用。
典藏:经过整理的图书馆文献,应该进行有效的管理和传递,此前必须进行科学的组织与管理,包括书库划分、图书排列和图书保护。
流通:所谓流通就是把图书有效地送到读者手中,围绕流通工作要进行发展读者、流通推广、宣传辅导、参考咨询、文献检索等工作。
5、图书馆工作的基本原则:整体性原则、标准化原则、网络化原则、以人为本原则、开放性原则。
6、什么是图书馆2.0:图书馆2.0代表一种现代化形式的图书馆服务之广义模式,它反映了图书馆提供服务给使用者的模式之转变。
7、图书馆形态的发展有哪几种:传统图书馆(1850—)、自动化图书馆(1970—)、复合图书馆(1990—)、数字图书馆(1995—)。
8、什么是网络图书馆:网络图书馆即网络环境下的图书馆,具体地说,网络图书馆是由电子图书馆或数字图书馆组成,可以广泛开展电子资讯服务和实现资讯资源分享的电脑网络资讯服务系统。
网络化图书馆的馆藏资讯资源由两部分组成,一是本馆的现实馆藏:二是网络上的资讯资源(虚拟馆藏)。
9、按藏书量分图书馆可以分为哪几类:大型图书馆是指藏书100万册以上的图书馆;中型图书馆是指藏书50万到100万册的图书馆;小型图书馆是指藏书50万册以下的图书馆。
10、我国图书馆的主要类型:我国图书馆的主要类型包括国家图书馆、公共图书馆、高等院校图书馆、科学图书馆、专业图书馆、技术图书馆、工会图书馆、军事系统图书馆以及中小学图书馆、儿童图书馆等。
信息检索作业

1、什么是信息素养?信息素养的内涵是什么?信息素养教育与大学生培养有何关系?中国与欧美国家信息素养教育有何异同?答:(1)信息素养(Information Literacy)的出现最早源于图书检索技能,它是一个含义广泛且不断发展变化的综合性概念。
信息素养是应用信息技术以适应信息社会所特有能力,是通过教育培育的,在信息社会中获得信息、利用信息、开发信息方面的修养与能力。
(2)信息素养是指具有获取和利用各种信息资源以解决信息需求及制定信息决策的能力。
一般而言,信息素养由信息意识、信息知识、信息能力和信息规范四方面内容组成。
其中信息意识是先导,信息知识是基础,信息能力是骨架、信息规范是保障,四个方面相辅相成,缺一不可。
具体表现为:1.意识到准确和完整的信息是决策的基础,能够对信息资源进行批判性的思考,并将有用信息变成自己思想的一部分。
2.拥有本专业及相关学科的专业知识和技能,能不断地将新信息融合到现有知识结构中。
3.了解信息需求及问题所在,知道在何时、通过何种信息源、如何解决相关信息问题,具备评价和分析信息的能力,能够制定信息检索策略,根据实际用途组织信息。
4.具有良好的信息道德,能遵守信息法规,合理、合法地利用信息,有效维护信息安全等。
(3)1.时代发展的需求新的世纪,信息社会化已成为必然,信息已是当今社会必不可少的重要资源。
美国著名的未来学家阿尔温·托夫勒在《权力的转移》一书中指出:“谁掌握了知识和信息,谁就掌握了支配他人的权力。
”可见,在信息社会中,人们利用现代信息技术获取自己需要的信息的能力,已是人们在信息社会中不被淘汰的必备素养。
大学生是建设我国小康社会的栋梁之才,接受信息素养教育,培养良好的信息素养,才能更好地适应和加快社会信息化的发展。
2.终身学习的需要在信息时代,知识更新加快,知识和信息的时效性越来越强,半衰期日趋缩短,大学所学的知识很快会过时。
所以,增强自学能力和终身接受教育是大学生必须具备的基本素养,而这正是信息素养教育赋予大学生的一种能力。
信息检索

信息检索1.信息检索的概念。
狭义信息检索是指用户找出有关信息的过程。
广义信息检索是将信息按照一定的方式组织和存储起来,并根据用户的需求找出有关信息的过程。
2. 信息检索的类型(1)按照检索对象的不同划分早期分为:文献检索、事实检索、数据检索。
当前三分方法:文本检索、音频与视频检索、数值检索。
(2)按检索手段划分:手工检索、机器检索3.简述信息检索的基本原理信息检索的基本原理:对信息集合与需求集合的匹配与选择。
实现信息检索,主要涉及三个关键要素:信息集合、用户信息需求、匹配选择。
一、信息集合:信息集合是指有关某一领域的,经采集、加工的信息集合体。
二、需求集合:用户的信息需求是在社会实践活动中产生的。
当人们在完成某一任务或工作时,经常觉得缺少某些知识,这就产生了信息需求。
三、选择与匹配:要在信息集合中快速获取用户所需信息,需要信息检索提供一种匹配机制,能够把需求集合与信息集合依据某种相似性标准进行比较与判断,进而选择出符合用户需要的信息。
匹配机制至少包括两个要素:第一是匹配标准,即相似性标准;第二是执行匹配的动因。
4.计算机信息检索经历了脱机检索阶段、联机检索阶段、光盘检索阶段、网络检索阶段。
5.信息检索领域的主要研究问题有哪些?⑴信息检索理论:检索语言、检索模型、标引理论、相关性理论、知识组织与表示理论⑵信息检索工具/系统:信息检索系统的结构、功能、设计开发、管理运营、应用评价等⑶信息资源及其收集、加工:信息存储、数据库⑷检索技术与方法:文本检索技术、数值检索技术、音频与视频检索技术、网络搜索技术⑸用户研究与检索策略:用户的查询心理、检索需求及其类型、用户查询信息的行为特征等、用户信息需求分析、检索式构造、相关反馈方法、检索过程调整与控制等⑹其他密切相关的自动化处理技术:自动聚类与分类、自动摘要、信息可视化、信息过滤、信息提取、机器翻译、人机交互等。
信息检索的两种研究方式:以计算机为中心和以用户为中心,以计算机为中心的IR问题是主流。
检索是什么意思

检索是什么意思
对于这个问题相信大家都很好奇吧,下面我就为大家介绍一下。
检索的基本含义:检索,是指根据一定目的,从文献中查出所需信息的过程;也指从一定范围、领域或项目中找出所需要的事物或有关的人员等。
搜索引擎顾名思义,就是在互联网上通过相应的技术来帮助我们获取自己想要的资源并完成查询的服务平台,可以说只要你会使用电脑和能够正常接入互联网,那么使用搜索引擎来寻找您需要的资源将不再困难。
检索的概念检索一般是指按照某种要求或标准查找和选择信息
资料。
搜索则是指主动地、有目的地去寻找。
由此可见,两者之间既有区别又有联系。
从信息检索的角度看,它包括三方面的含义:1.
检索是从文献中查找所需要的知识和情报。
2.检索是对所需要的知识和情报进行鉴别和筛选,然后提供给用户。
3.检索是为了满足用户的需要而采取的各种手段和措施。
从搜索引擎的角度看,它是指为了实现特定的功能,利用计算机科学技术,对互联网上海量数据进行组织和处理,存储和管理,并为用户提供检索服务的系统软件。
从这些概念可以看出,检索与搜索是不同的。
检索侧重于对信息的收集,而搜索则侧重于信息的获得。
如何利用搜索引擎查询到所需内容呢?其实非常简单,你首先需要把你想要的内容输入到百度里面,当然前提是你必须知道你要查询的内容,然后点击百度的“搜索”键,当然还可以直接点击右边的搜索框,最后输入你要查询的内容,例如:输入“自考报名时间”,就
会显示出全国各省市的报名时间,并且会告诉你哪天开始报名,比较适合急着报名的朋友。
信息检索与利用-1

美国《化学文摘》中 的关键词索引
美国《化学文摘》中的 普通主题索引
美国《化学文摘》 作者索引
专利号索引
来源索引
索引的结构
索引通常由一批索引款目和参照系统构成 (1)款目:索引款目(index entry)是描述所指示的某个 主题或事物及其在信息集合中的物理地址的一条记录。一 条索引款目通常包含有三项内容,即标目(标识)、说明 语和存储地址。 标目(headings)是用来表达索引款目所指示的主题或事物, 并控制款目在索引档中的排档位置的语词符号。 说明语(modification)是指放在标目后面(或下面),指 示所查信息的特征,或解释(限制)标目含义的词、词组 或短语。说明语有时就是文献名称,有时是改写或压缩过 的文献名称,有时是标引人员自编的短语或短句。 存储地址(reference; location)是指索引款目中所指示 的主题或事物在特定信息集合中的物理地址,如页码、文 摘号等等。
信息的组织
•
•
•
主题法-主题词(叙词)法 主题词(叙词):是经过规范化处理的, 以基本概念为的表达文献主题的词或词组。 主题词(叙词)法:是以从自然语言中精 选出来的、经过严格处理的语词作为文献 主题标识,通过概念组配方式表达文献主 题的标引方法。 有主题词(叙词)表,主题词之间有严密 的参照关系。
• • •
•
分类途径与主题途径的比较 标识符号不同(类号-语词) 体系编排不同(等级-字顺) 类目语义关系的表达方式不同 (等级-参照) 检索特点不同(族性-特性)
外部特征
• 文献的外部特征通常包括论文的作者、机 构、文献来源,报告号,专利的申请人、 发明人,专利号等。 • 依赖相应的外部特征索引来完成。如通过 著者索引可查找个人作者的文献,也可查 出机构或团体作者的信息;利用专利文献 中的专利号索引可以很便捷地找到专利说 明书;通过专利申请人索引,可以查到某 人或机构所申请的全部专利文献。
信息检索 什么是搜索引擎和信息门户

什么是搜索引擎。
搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。
在搜索引擎分类部分我们提到过全文搜索引擎从网站提取信息建立网页数据库的概念。
搜索引擎的自动信息搜集功能分两种。
一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。
另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。
由于近年来搜索引擎索引规则发生了很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,因此目前最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将你的网站收录。
当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置/频次,链接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。
这种引擎它的特点是搜全率比较高。
什么是信息门户。
在Internet的环境下,把各种应用系统、数据资源和互联网资源统一集到信息门户之下,根据每个用户使用特点和角色的不同,形成个性化的应用界面,并通过对事件和消息的处理、传输把用户有机地联系在一起。
什么叫文献检索

什么叫文献检索文献检索(Information Retrieval),是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,这是广义的信息检索。
狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻(Information Search)。
下面由店铺带领大家简单了解一下。
文献检索主要分类计算机信息检索是指以计算机技术为手段,通过光盘和联机等现代检索方式进行信息检索的方法。
与手工检索一样,计算机信息检索应作为未来科技人员的一项基本功,这一能力的训练和培养对科技人员适应未来社会和跨世纪科研都极其重要,一个善于从电子信息系统中获取信息的科研人员,必定比不具备这一能力的人有更多的成功机会,美国报道生活新方式的期刊POV 也将交互网络检索专家作为未来十大热门职业之一,这些情况都说明了计算机信息检索越来越重要,故值得大家对这一技术予以重视。
零次文献指未经正式发表或未形成正规载体的一种文献形式。
如:书信,手稿,会议记录,笔记等。
特点:客观性,零散性,不成熟性。
一般是通过口头交谈、参观展览、参加报告会等途径获取,不仅在内容上有一定的价值,而且能弥补一般公开文献从信息的客观形成到公开传播之间费时甚多的弊病。
一次文献(primary document):是指作者以本人的研究成果为基本素材而创作或撰写的文献,不管创作时是否参考或引用了他人的著作,也不管该文献以何种物质形式出现,均属一次文献。
大部分期刊上发表的文章和在科技会议上发表的论文均属一次文献。
二次文献(secondary document):是指文献工作者对一次文献进行加工、提炼和压缩之后所得到的产物,是为了便于管理和利用一次文献而编辑、出版和累积起来的工具性文献。
检索工具书和网上检索引擎是典型的二次文献。
三次文献(tertiary document):是指对有关的一次文献和二次文献进行广泛深入的分析研究综合概括而成的产物。
信息检索题目答案

4、信息检索在发展过程中经历了那些阶段?20世纪中期以前,手工式阶段20世纪中期,机械式阶段3、试分析布尔模型的优缺点•缺点–开始时需要猜想把文档分为相关和不相关的两个集合,一般来说很难–实际上这种模型没有考虑关键词在文档中的频率(因为所有的权重都是二值的)–假设关键词之间相互独立第03章文本索引和搜索1、什么是索引?建立索引的目的是什么?常用的索引技术有哪些?–索引是一种数据结构,它在关键词与包含关键词的文档之间建立了一种映射关系,从而加快检索的速度。
•建立索引的目的–加快检索速度•常用的索引技术–倒排索引–后缀数组–签名文件2、什么是倒排索引•倒排索引–也称倒排文档,是从关键词快速查询到文档的索引结构。
文档正常表示为关键词的集合,建立倒排索引是把每个关键词表示为其所在文档的集合,这个过程称为inversion,即倒排。
3、倒排索引的记录表中可以存放哪些内容?•位置信息–形式上:序号或指针–内容上:文档、段落、句子、词•附加信息–特殊位置信息:所在单元(标题、小标题)–权重信息4、倒排索引的建立方法有哪些?各方法具体如何实现?•基于排序的倒排文档建立方法•步骤–在文档中抽取关键词,并在其后附上其文档编号。
即表示成<单词,文档编号>的形式–对抽出的关键词进行排序,使之便于归并相同关键词–对相同关键词进行归并,把合并后的关键词放入倒排文档的词汇表。
统计每一关键词的文档频率作为目长,把每一关键词后的记录号顺序放在记录表中•基于合并的倒排文档建立方法算法–①逐个读取文档,在内存中使用动态数据存储结构(如动态数组、链表等)保存索引,直到占用的内存大小超过一定的阈值为止–②将生成的临时索引结构转存到磁盘,并清空内存–③如果所有文档处理完毕,则转到④;否则,转到①记录表中一般用16位或32位整数表示文档和单词位置的绝对编号,16位容易溢出而32位浪费空间。
解决该问题的方法1、定长整数描述变化:用比较少的字节(如16位)表示编号的相对变化,仅记录相邻位置之间的差异。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
什么是信息检索?
1、信息检索是一门关于如何查找文献、知识和信息的工具性课程,被认为是开启知识宝库的金钥匙。
2、信息检索课程是一门对于本科生到博士生都具有很强实用性的课程,对于帮助我们学生提高科研能力和拓宽科研领域具有重要的作用。
开设信息检索课的作用
大学生需要学习,如何提高自己获取和利用文献信息的能力;进入工作岗位后如何更新自己的知识结构,使自己不落伍.所以,获取知识和信息的能力成为了大学生必须具备的重要能力之一.
信息检索这门课主要讲授检索文献的一些基本方法,培养学生检索文献的技能.学习和科技需要文献,个人全面素质的提高需文献,生活中也离不开各种信息.
我们在信息检索课中,老师侧重介绍了信息检索工具与检索技巧!但对于今后我们的生活中,这种检索思想将会发挥更大的作用,所以平时我们应多积累一些有关互联网上的检索工具(包括搜索引擎和检索技巧)方面的知识,这方面的能力可能带给我们更大的实惠。
信息检索课程作为一门方法课程,它不仅使我们的信息意识更为敏锐,而且使我们了解了信息组织与检索的原理,让我们学会了操作使用各种专业文献信息数据库和网络检索工具。
通过老师认真指导在我们不断练习的基础上,我们不仅掌握了娴熟的检索操作技能,而且逐步掌握了如何选择合适得信息源,
如何确切表达特定的信息需求,以及如何应对检索过程中出现的各种问题。
在信息检索课中学习到了什么?
1、通过信息检索课程学习,知道了什么是信息,信息的有哪些类型,信息有什么特征,信息有什么作用。
2、通过信息检索课程的学习,知道什么是信息检索,信息检索的类型有哪些,知道了信息检索的过程,知道了信息检索的方法和途径,知道了信息检索的技巧和策略,学会了如何去评价信息。
3、通过信息检索课程的学习,知道了网络上原来还有那么多数字图书馆,有那么多知识数据库。
4、通过信息检索课程的学习,发现搜索引擎并不是仅仅用来搜索网页和MP3,还可以用来搜索重要的知识,发现了搜索引擎原来还有如此多的笑秘密。
5、通过信息检索课程的学习,学会了怎样利用检索系统迅速查找与本专业相关的知识和资料。
6、通过信息检索课程的学习,培养了我们的独立学习的能力,培养了阅读能力和论文写作能力。
使我们具备了较高的信息素养。
7、通过信息检索课程的学习,发现课程中的知识和技能对将来学习和生活有很大的帮助。
比如在写毕业论文的时候,查找参考文献和撰写文献综述就不那么困难了
学习信息检索课的心得与体会:
学习信息检索课最大的体会就是能够在浩如烟海的信息世界里迅速有效的找到、找准自己需要的知识和信息。
尤其是在当前信息爆炸得时代,在科研过程中,平时生活中当遇到实际问题的时候,信息检索课上学到的检索知识都能帮助我尽快通过利用所学的检索工具和检索方法获取解决问题的答案。
学习信息检索课程另一个体会就是它对于我们今后得工作学习有着极其重要的作用。
信息检索课程由于其具有很强的实用性,学习这门课使我们具备了一定的检索技能,无论是其中的科技查新部分还是在我们科研过程中的实际应用上都教给了我们实实在在得技能,使我们在今后的工作中有了牢靠的技术支撑。
通过这对信息检索的学习,我学到了很多对今后生活很有用处的知识。
我学到了维普数据、万方中国专利信息网、中国标准全文数据库、SPRINGER、EBSCO等数据库的应用,学会使用这些数据库对
我以
后在查找文献方面提供了很大的便利。
信息检索是一门实用性很强的课程,在没学习这门课以前,我遇到需查阅的问题,只知道查阅百度或谷歌,而且一般都只看中文网站,学习后,我们能够较充分地综合利用学校的资源,获得更权威,更可靠的知识
总之,信息检索是门结合知识性和应用性为一体的学科,对我们的自学能力是一种提高,对将来的学习很有帮助
对信息检索课程的建议:
从排课的课程表中可以看出,信息检索课在我校的地位明显偏低,主要表现在我校领导对开设这门课的重要性认识不足,对这门课程不是很关心,课时还比较比较少,还没公选课的课时多,而且还没有专门的教材,这就更不能引起学生的重视。
所以我建议可以适当的对这门课程的课时增加,组织有关人员定期对这门课进行抽查,选取合适的教材。
严格要求学生,如第一节课可以介绍这门课程的重要性,让学生知道这门课对以后的生活、学习有很大的帮助。
在课堂上,老师应多提问学生,而且还应留出时间让学生自己操作,合理安排学生上机,着重培养我们利用计算机检索信息的能力,充分利用校园网络可以适当地给学生布置有关本专业的作业,从而加强学生实际检索信息的能力,提高学生获取信息的能力,这样才能调动学生的积极性,有利于学生对这门课的学习。