计算机信息检索重点
计算机信息检索重点
信息检索数据(Data):泛指所有描述事物的形貌、特性、状态或任何其他属性的数字、文字或符号。
一般指原始,未处理过的数据。
信息(Information):1. 物质存在的一种方式。
一般指数据、消息中所包含的意义。
可以使消息中所描述的事件的不定性减少。
2. 是事物运动的状态与方式的反映。
知识(Knowledge):A、是在改造世界的实践中所获得的认识和经验的总和。
B、是人类的主观世界对客观世界概括和反映,是大量有组织的信息,是关于事实和思想的有组织的陈述。
提供某种经过思考的判断和某种实验的结果。
(信息是知识的原材料,知识是信息加工的抽象化产物。
)情报(Information):钱学森:“情报是活化了的、激活了的知识”。
可以理解为是指传递着的有特定效用的知识或信息。
三要素:知识性、传递性、效用性文献(Literature):记录有知识的一切载体。
三要素:载体(文献的外部形式,它是知识的包装或运载方式,常称之为媒体(media)。
)、知识(反映了文献的信息内容。
)、记录(信息的一种人工编码,通过人工、机械以及声、光、电、磁等各种技术手段生成多种包含知识信息内容的符号,以一定的形态出现,形成各种媒体的文献类型。
)文献对人类文明进步具有重大意义:知识的积累、传播与创造研究成果的确认与评价信息环境及其认识:信息环境的变化,20世纪90年代中期前,书本时期-----手工检索,缩微时期-----缩微检索,20世纪90年代后期,光盘时期-----单机检索,网络初期-----联机检索21世纪,网络兴盛-----网络检索第一章信息检索原理一、信息检索的含义(掌握)广义:信息检索包括信息的存储过程和查找过程;狭义:仅指信息的查找。
二、信息检索的类型(一、)以检索内容划分(重点)1.文献信息检索凡是利用目录、文摘或索引等二次信息查找某一课题、某一著者、某一地域、某一机构、某一事物的有关信息以及这些信息的出处和收藏单位等,都属于文献信息检索范畴。
信息检索知识点
信息检索知识点信息检索是指从大规模的信息资源中,通过利用各种信息检索工具和技术,准确和高效地找到用户所需要的信息的过程。
信息检索技术在现代社会中扮演着重要的角色,它不仅广泛应用于互联网搜索引擎,还在图书馆、数据库、企业信息管理等领域发挥着重要作用。
本文将介绍信息检索的定义、关键概念和一些常用技术。
一、信息检索的定义和目标信息检索是指通过计算机等工具从大规模的信息资源中,按照用户的需求进行检索,提供相关性高、准确性好的信息结果。
它的目标是帮助用户快速地找到所需的信息,提升信息搜索效率和准确性。
二、关键概念1. 查询:用户提交的检索请求,通常由一系列关键词组成。
2. 检索词:查询中使用的关键字或关键词短语。
3. 检索结果:根据查询返回的与之相关的文档或信息。
4. 相关性:衡量检索结果与查询之间相关程度的指标,通常使用相关性排序算法进行排序。
5. 文档:信息资源的基本单位,可以是网页、文章、图片、音频等形式。
三、信息检索的主要技术1. 分词技术:将文本数据按照一定规则分割成有意义的词语,是信息检索的基础步骤。
2. 索引技术:将文档中的关键词与其所在位置进行索引,以提高检索效率和准确性。
3. 倒排索引:根据关键词构建索引表,记录关键词与文档之间的对应关系,常用于搜索引擎等场景。
4. 相似度计算:根据查询和文档的相似性,为检索结果进行排序。
5. 结果评估:通过评估检索结果的质量,改进检索算法和模型。
四、常用的信息检索模型1. 布尔模型:将查询和文档转化为布尔表达式,按照布尔运算进行检索。
2. 向量空间模型:用向量表示文档和查询,通过计算向量之间的相似度进行检索。
3. 概率检索模型:基于统计方法,利用概率模型进行信息检索。
五、信息检索的挑战和发展方向1. 大规模数据处理和存储:随着互联网的快速发展,信息资源呈指数级增长,如何高效地处理和存储大规模的数据成为了一个挑战。
2. 多语言检索:不同语言的信息检索在跨语言信息检索中面临很大的难度和挑战。
计算机复习信息检索
计算机复习信息检索信息检索是指通过计算机技术,根据用户的需求,在大规模的信息资源中准确、快速地找到相关的信息。
在当今信息爆炸的时代,信息检索的重要性不言而喻。
本文将介绍信息检索的基本概念、技术和应用,并附带答案和解析。
一、信息检索概述信息检索是指通过计算机对大规模信息资源进行全文检索、关键词检索等方式,根据用户需求提供相关信息的过程。
其目标是提高检索准确性和检索效率,帮助用户快速获取所需信息。
信息检索系统由信息资源、检索模型、检索方法和用户界面等组成。
其中,信息资源包括数据库、文档集合等;检索模型包括向量空间模型、布尔模型等;检索方法包括倒排索引、词频统计等;用户界面提供检索接口供用户输入查询词,并显示检索结果。
信息检索的基本流程包括:用户输入查询词->检索系统进行查询处理->检索系统返回相关文档。
二、信息检索技术1. 关键词检索关键词检索是最常见的信息检索方式,用户通过输入关键词,检索系统根据关键词在信息资源中进行匹配,并返回相关文档。
关键词检索常用的算法有向量空间模型、TF-IDF算法等。
全文检索是指对文档集合中的全部文本进行检索,而不仅仅是关键词。
全文检索主要通过分词、建立倒排索引等技术来实现。
用户输入的查询词可以是一个短语或一句话。
3. 自然语言查询自然语言查询是指用户使用自然语言进行查询,而不是像关键词查询那样只输入几个词。
自然语言查询需要将用户的自然语言转化为计算机可处理的查询语言,如SQL语句。
4. 语义检索语义检索是一种基于语义理解的检索方法,通过对查询词的语义进行分析,实现更精准、准确的检索。
语义检索常用的技术有词义消歧、词向量模型等。
三、信息检索应用1. 搜索引擎搜索引擎是信息检索的最常见应用之一,在互联网上广泛使用。
搜索引擎通过爬虫程序对互联网进行爬取,建立庞大的索引库,并通过用户输入的查询词返回相关页面。
2. 文献检索在学术界和科研领域,文献检索是非常重要的工作。
信息检索重点
1.信息检索(information retrieval) 定义(1)广义的信息检索:是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关的信息的过程和技术。
所以它的全称又叫信息存储与检索(information storage and retrieval).(2)狭义的信息检索:指广义的信息检索的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们的所说的信息查寻。
(information search)2.检索工具定义:检索工具是人们用来存储、报道和查找文献的工具。
因此,它具有存储和检索的功能。
存储是把分散、无序的文献,采用一定的检索语言使其集中,组织起来,成为有规律的检索系统,变成检索工具。
检索是人们按照有关检索语言,采用一定的方法和途径,检出自己所需的文献。
3.检索策略的定义陈光祚:所谓检索策略就是在弄清用户情报需求实质的前提下,选择检索途径、检索用词以及明确各词之间逻辑关系和查找步骤的科学安排。
赖茂生:所谓检索策赂,是指为实现检索目的而制定的全盘计划和方案,是对整个检索过程的谋划和指导。
4.信息资源:是人类存储与载体(包括人脑)上的已知或未知的可利用的信息。
信息中的载体信息和主体信息是使信息资源的最基本的组成部分。
填空一.检索工具的功能(1)报道功能。
(2)标识功能。
(3)辅助检索功能。
二.检索工具的类型1 按检索方法划分检索工具可以划分为手工检索和机械检索工具两大类型,机械检索工具主要是指计算机检索。
2 按收录范围划分检索工具可分为综合性检索工具、专业性检索工具、单一性检索工具3种。
综合性检索工具收录范围广,涉及多门学科。
专业性检索工具收录的范围仅限于某一学科领域。
单一性检索工具只收录某一特种类型的文献,但学科范围可广可窄。
3 按出版形式划分检索工具又可分为书本式、卡片式、磁带式和缩微制品等形式,书本式又包括书刊式、单卷式和附录式3种。
4 按收录文献的对象和揭示方式来划分⑴目录目录是一批图书或其他单独出版的资料的系统化记载及内容的揭示。
信息检索初步知识点总结
信息检索初步知识点总结信息检索是指利用计算机系统来检索和获取文档或者信息资源的技术和方法。
在当今信息爆炸的时代,信息检索具有非常重要的意义。
信息检索系统可以帮助人们快速准确地获取所需要的信息资源,不仅可以提高工作和学习效率,还可以帮助人们更好地利用信息资源。
在信息检索中,有一些基本的知识点是非常重要的,下面我将对这些知识点进行总结。
1. 信息检索的概念和发展历史信息检索是指从信息库中按照一定的要求来搜索、检索信息的过程。
它主要是利用计算机技术来实现信息的存储、检索和利用。
信息检索的发展可以追溯到20世纪50年代,随着计算机技术的发展,信息检索技术也得到了很大的发展。
现代信息检索系统不仅能够实现文档的存储和检索,还可以实现自然语言处理、信息抽取、信息过滤等功能。
2. 信息检索的基本过程信息检索的基本过程包括信息需求分析、文档表示和查询处理、检索模型和算法、评价和反馈等几个方面。
其中,信息需求分析是整个信息检索过程的第一步,它包括对用户的信息需求进行分析和建模,确定用户的检索目标和检索词,为后续的检索准备工作做好准备。
文档表示和查询处理是指对文档和查询进行适当的表示和处理,以便计算机系统能够理解和利用。
检索模型和算法是指根据文档和查询的表示,计算出相关度得分,以确定文档的相关性。
最后,评价和反馈是指对检索结果进行评价和反馈,以优化检索系统的性能。
3. 信息检索的技术手段信息检索的技术手段主要包括文本索引技术、全文搜索技术、信息抽取技术、信息推荐技术等几个方面。
其中,文本索引技术是指将文档中的关键词进行索引,以便计算机系统能够快速地定位到相关的文档。
全文搜索技术是指利用全文索引进行搜索,可以实现对文档中所有内容的搜索。
信息抽取技术是指从文档中抽取出有用的信息,以便为用户提供更精确的搜索结果。
信息推荐技术是指根据用户的行为和偏好,为用户推荐相关的信息资源。
4. 信息检索的评价指标信息检索的评价指标主要包括召回率、准确率、F值、MAP值等几个方面。
信息检索复习题以及重点
信息检索复习题1、信息检索的步骤包括:界定问题、选择信息源、制定检索策略并实施检索、评价信息、分析利用信息五个步骤。
2、文献中ISBN、ISSN分别是指:国际标准书号、国际标准刊号。
3、文献按出版形式划分为哪几种?简述之。
答:按出版类型划分:图书、期刊、特种文献:(科技报告、会议文献、专利文献、标准文献、学位论文、政府出版物、产品资料、技术档案)4、给出“基于云计算的煤矿安全监测预警系统研究”一文的关键词。
煤矿监测预警云计算数据挖掘5、给出3种常用搜索引擎名称,什么情况下应该使用百度快照?答:百度、Google、360、搜狗搜索到的结果无法打开或打开速度很慢的情况下,可以使用百度快照。
6、利用百度搜索一份技术开发合同,应该在搜索框输入(技术开发合同 filetype:doc 或技术开发合同 filetype:ppt )。
(提示:技术开发合同的格式:doc或pdf)。
百度以“filetype:”来限制,后面是文档格式。
文档可以是pdf、doc、xls、ppt等。
首选gov(政府)、edu(教育)、org(非盈利性机构)、ac(学术类)网站;次选com(商业) net(网络)等7、CNKI中国知网主要收录哪些类型的全文学术文献?期刊文献,报纸,会议文献,国外学术文献,工具书,年鉴,专利,成果,标准文献,博士学位论文,硕士学位论文8、查找中文全文图书和期刊文献分别有哪几个数据库?中文全文数据库:CNKI中国知网.维普期刊资源整合服务平台.万方数据知识服务平台,读秀学术搜索9、学位论文有哪些特点?简述之。
4)学位论文(dissertation,thesis)指高等院校和科研机构的毕业生在获取相应学位时,必须提交的论文。
外部特征:著者、论文题名、颁发学位的机构名称、学位等级、授予年份等。
其主要辨识特征是学位名称,特征词:Ph,D,MS等。
从内容上看,学位论文具有以下四个特点:学术性,科学性,创造性,规范性10、依据GB/T7714-2005,分别给出图书、期刊和学位论文的著录格式,并各举一例。
信息检索重点
一、信息检索四要素1、信息检索的前题:信息意识2、信息检索的基础:信息源3、信息检索的核心:信息获取能力4、信息检索的关键:信息利用二、信息基本特征:普遍性、客观性、扩散和传递性、增值性(创新)、可存贮性和可压缩性、可知性(信息能力)和共享性知识属性:意识性、信息性、实践性、继承性、渗透性情报属性:针对性、知识性、时间性、传递性、效用性信息、知识、情报的关系:信息经过人脑思维加工,即认识飞跃产生知识,情报属于知识的范畴。
广义的情报是信息的传递,因此,情报具有信息和知识两种性质。
三、按载体不同分为:口头信息源、实物信息源、文献信息源四、文献信息源:1、按出版形式不同可分为十种类型:图书、期刊、科技报告、会议文献、政府出版物、专利文献、标准、产品资料、学位论文、技术档案2、按记录信息的材料可分为三种类型:纸印本文献、缩微型文献、机读型文献3、按加工深度不同可划分为四种:零次文献、一次文献、二次文献、三次文献四者之间的关系:从零次文献到三次文献,是一个从分散的原始文献加工整理系统化的过程。
零次文献是一次文献的素材,一次文献是基础,是检索的对象;二次文献是检索一次文献的工具;三次文献是一次文献的浓缩,是情报信息的重要来源。
五、信息检索系统类型:⑴根据检索目标和检出文献信息形式的不同:文献检索、数据检索、事实检索⑵根据具体检索手段不同:手工检索、机械检索六、检索步骤:分析研究课题确定检索范围和检索标识选定检索工具确定检索途径查找和获取原始文献七、信息检索的方法:⒈常用法:是利用检索工具查找文献的方法.⑴顺查法⑵倒查法⑶抽查法⒉追溯法:从已知的现有文献后所列参考文献入手,逐一追查原文,从这些原文后所列参考文献再逐一追查,不断扩检的查找方法⒊循环法:指追溯法常用法混合使用的方法。
八、信息检索的途径:⒈根据外表特征划分著者途径;书名、篇名、刊名途径;序号途径⒉根据内容特征划分分类途径(SA、Ei);主题途径(SA、Ei);分子式途径(CA)九、文献检索的一般步骤:1、分析研究课题2、确定检索范围与检索标示3、选择检索工具4、确定检索途径5、查找和获取原始文献检索途径与方式:初级检索:默认的检索方式高级检索:两种检索方式组合使用,如“篇名”和“著者”。
信息检索重点总结题型
信息检索考试内容:1名词解释(5题,共15分)2填空(40分)3简答(难,拉分题,35分)4著录格式(10分)书本基础知识:第一章:1 信息:是事物属性的再现,是由事物发出的消息、指令、数据等所包含的内容,广泛地存在于自然界和人类社会中。
2 知识:人们对客观事物运动规律的认识,是经过人脑加工处理过的系统化了的信息。
知识是人类经验和智慧的总结,是人们科学地认识世界、改造世界的力量。
3 情报:指传递着的有特定效用的知识。
是人们为了解决某个具体问题所需的新的知识信息。
基本属性:知识性、传递性和效用性。
信息>知识>情报。
4文献:记录有知识的一切载体。
文献的三要素:知识、载体、记录方式。
5科技文献:记录有科学技术信息或知识的一切载体。
科技文献的类型:按照载体形式划分:①印刷型文献②微缩型③声像型④电子型按照出版形式划分:图书/期刊/会议文献/科技报告/专利文献/学位论文/技术标准/政府出版物/产品样品和说明书/技术档案/报纸。
按照加工层次分:①一次文献:作者以本人的研究成果为基本素材而创作(或撰写)的文献。
包括:期刊论文、专利说明书、会议论文、科技报告、学位论文。
②二次文献:是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。
二次文献的重要性在于可以帮助人们查找一次文献。
包括:目录、题录、文摘、索引、各种数目数据库。
③三次文献:是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。
如综述、述评、词典、手册、百科全书、年鉴、指南数据库、专著、教科书、论文丛集、文献指南、数目的目录。
6图书的主要外部特征是:书名、著者、出版社名称、出版地点、出版时间、图书总页数、国际标准书号(ISBN)。
国际标准书号具有唯一性。
①ISBN(International Standard Book Number)由10位数字分成4段组成,各段依次是:地区或语种号-出版商代号-书名号-校验号如:7-302-02372-7,表示中国大陆代号为302的(清华大学)出版社,出版的一种图书,其书号为02372、该书的校验码为7 。
信息检索原理期末重点背诵知识点
信息检索原理期末重点背诵知识点信息检索1、信息检索概念:P12、信息检索的原理⼀整节内容要⾃⼰理解:P3-P4图1-1要掌握⽂献替代和⽂献整序的概念要掌握3、信息检索在历史上的不同表现:联机检索、光盘检索、⽹络检索的区别和特征:P6-P94、信息检索的模型概念:P95、布尔模型、向量空间模型、经典概率模型要理解并掌握各⾃的优缺点:P11-P126、信息检索系统的概念:P127、检索效果的评价指标:P15-P164个指标:查全率、查准率、漏检率、误检率掌握它们的含义并懂得计算8、⽹络检索的表达式:布尔逻辑检索、邻近检索、短语检索、截词检索的特点、区别和联系:P17-P219、信息检索的技巧要理解尤其是要掌握及时调整检索策略:P33-P3610、搜索引擎的概念:P3711、数据库知识,实验内容,特点12、引⽂的概念13、搜索引擎的分类:P40-41搜索引擎划分的类别以及元搜索引擎的概念要掌握12、CBR概念 P11312、多媒体信息检索的原理和⽅法:P110-P114其中要重点理解基于内容的多媒体信息检索的检索形式(可以结合课件)13、专利的概念:P12514、专利的类型:P126(理解⼀下各类型的区别)15、专利⽂献的概念:P12716、专利⽂献的类型:P127(理解⼀下各类型的区别)17、灰⾊⽂献的概念:P14718、会议⽂献的概念:P15819、科技报告的概念:P16320、查新的概念:P20021、科技查新的作⽤:P201(每⼀个⼩标题后⾯要⾃⼰展开⼀段)关于上课讲的那⼏个数据库⼤家⾃⼰看⼀下PPT,掌握⼀下。
以上纯属个⼈观点题型:名词解释:5*4=20简答题: 4*10=40论述题: 2*20=40考试时间:1⽉8⽇上午:9:00—11:001.信息检索的概念 (P1)信息检索有⼴义和狭义两重含义。
⼴义上说,信息检索是指将信息按照⼀定的⽅式组织和存储起来,并根据信息⽤户的需求查找相关信息的过程。
信息检索考试重点
信息检索考试重点信息检索考试类型:闭卷考试题型:单选、判断、名词解释、应用(信息检索过程)考试重点:1、文献:文献是记录知识的一切载体。
凡是用文字、图形、符号、声频、视频记录下来,具有存贮和传递知识功能的一切载体都称为文献。
2、文献类型:印刷型缩微型视听型机读型3、知识:是在人们对信息进行分析的基础上提供的解决方案。
知识管理的主要目的是使信息能够服务于人们的行动和决策。
4、信息:是凭借人的认知能力和经验对数据进行选择、评价、组织和分析的结果。
信息管理主要是解决数据的相关性、系统化和规范化的问题。
5、数据:指离散孤立的互不关联的事实、文字、数据和符号,这些资料之间缺乏相关性。
6、文献级次:零次文献(灰色文献):指非正式出版物或非正式渠道交流的文献。
一次文献(原始文献):凡是著者在科学研究,生产实践中根据科研成果,发明创造撰写的文献,称为一次文献。
一次文献是文献的主体,是最基本的情报源,是文献检索的对象。
二次文献:它是将分散、无序的一次文献,按照一定的原则进行加工,整理、提炼、组织,使之成为便于存贮、检索的系统。
如目录等检索工具。
三次文献:它是在利用二次文献的基础上,选用一次文献的内容,进行分析、概括、综合研究和评价而编写出来的文献。
它又可分为综述研究类和参考工具类两种类型。
前者如动态综述、学科总结、专题述评、进展报告等;后者如年鉴、手册、大全等。
三次文献源于一次文献,又高于一次文献,属于一种再创性文献。
三次文献一般来说系统性好,综合性强,内容比较成熟,常常附有大量的参考文献,有时可作为查阅文献的起点。
高级文献:计算机型文献,如:PTF、HTM等。
7、十大文献源1图书(Books) 2期刊(Periodicals)或(Journal,Magazine) 3科技报告(Technical reports) 4政府出版物 5会议文献(Conference papers) 6专利文献:(patents) 7学位论文(Thesis,Dissertation)8技术标准(Technical standards) 9科技档案 (document) 10产品样本8、文献检索:从大量的文献中查找与特定课题有关的文献的过程。
信息检索知识点
计算机检索1.信息素养(信息素质、信息能力):作为具有IL(information literacy)能力的人,必须能够充分地认识到何时需要信息,并有能力去有效地发现、检索、评价和利用所需要的信息,从而具有终身学习的能力,总能够为任何任务和决策找到所需信息.2.信息检索广义:指将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术.包括存储和检索两个过程.狭义:从信息集合中找出所需信息的过程。
信息查找(Information Search,Information Seeking)2.1信息现状分析1)信息爆炸导致文献量急剧增加,内容相互渗透,语种增多;文献分布异常分散;文献寿命愈来愈段;2)由于条件限制,人们吸收和利用信息的能力并未得到相应的提高.3.检索的作用1)促进智力资源的开发;2)协助管理者做出正确的决策;3)帮助科研人员借鉴前人的研究成果,避免重复劳动;4)信息检索是知识更新的手段.4.数据库类型(1):作为图书馆数字资源的数据库特指为科学、教学、学习所需各种参考资料的集合,以数据库的形式管理和利用。
自建数据库:馆藏目录(OPAC),本校学位论文数据库.商业性数据库:数据库商、出版商和其他机构以商业化方式提供的各种电子资源,图书馆需要支付一定的费用购买数据库的使用权再提供给一定的读者群。
免费数据库:开放获取资源、机构典藏和其他免费的网络资源。
5.数据库类型(2)从收录文献的内容分,有综合性数据库和专业性数据库之分;从收录文献的类型分,有图书数据库、期刊数据库、学位论文数据库、报纸数据库、会议文献数据库、专利文献数据库、标准数据库等;从提供文献的形式分,有全文数据库、文摘数据库、引文数据库;各数据库举例:专业数据库:Petroleum Abstract(PA)、EnCSciFinder Schoiar(CA)综合性数据库:读秀、Scopus、EI、SCI特定文献类型,如图书、期刊、学位论文等:超星、EIsevier ScienceDirect、PQDT全文数据库:CNKI、维普、SPE摘要性数据库:EI、PA引文数据库:Web of Science、CSSCI(中文社会科学引文索引)6.Science Citation Index Expanded(SCI—E)是个什么样的数据库?它是ISI检索平台中Web of Science核心合集中的一个子库它是一个摘要型数据库它是一个引文数据库它是一个期刊数据库它收录的学科范围包括科学、技术的各学科7.查文献应该如何选择数据库?学科专业:有专业型数据库时,首选专业型数据库;数据量:选择数据量大的;文献类型:根据研究的需要。
大一信息检索知识点总结
大一信息检索知识点总结信息检索是指通过计算机技术和各种检索方法,从大规模文献资源中快速、准确地获取用户所需信息的过程。
在大一学习信息管理与信息系统专业的过程中,我们需要了解一些关键的信息检索知识点。
本文将对大一信息检索的相关知识进行总结,帮助同学们更好地理解和掌握这一领域的基础知识。
一、信息检索的基本概念与原理(1)信息检索的定义:信息检索是指根据用户的需求,在文献、数据库和其他信息资源中寻找与之相符合的信息的过程。
(2)信息检索的基本原理:包括索引构建和检索处理两个阶段。
索引构建阶段将信息资源进行结构化整理,并建立相应的索引表;检索处理阶段通过用户提供的检索词,结合索引表,通过匹配算法找到与之相关的信息资源。
二、信息检索的关键技术(1)词项选择与权重计算:根据用户需求,选择合适的检索词,并使用权重计算方法为词项赋予合适的权重,提高检索效果。
(2)检索模型:包括布尔模型、向量空间模型和概率模型等不同的模型,用于描述检索系统中信息资源与用户需求之间的匹配关系。
(3)评价指标:用于评价检索系统的性能,常见的指标包括召回率、准确率以及F值等。
(4)查询扩展:通过对用户查询词进行扩展,提高检索系统的召回率和准确率。
三、信息检索的常用工具和技术(1)搜索引擎:如百度、谷歌等,通过互联网收集、分析并索引网页信息,为用户提供搜索服务。
(2)数据挖掘:通过对大规模数据进行模式识别和深入分析,挖掘其中有价值的信息,为决策提供支持。
(3)文献管理工具:如EndNote、NoteExpress等,用于管理、组织和检索学术文献。
(4)信息可视化技术:通过可视化手段,将海量的信息以直观的方式展示给用户,提高信息的理解和使用效率。
四、信息检索的应用领域(1)图书馆信息服务:包括文献检索、馆藏资源管理、读者咨询等。
(2)企业信息管理:包括企业知识管理、产品信息检索、竞争情报等。
(3)科学研究与学术交流:通过信息检索工具,快速获取相关领域的最新研究进展和学术成果。
信息检索重点
一、信息检索四要素1、信息检索的前题:信息意识2、信息检索的基础:信息源3、信息检索的核心:信息获取能力4、信息检索的关键:信息利用二、信息基本特征:普遍性、客观性、扩散和传递性、增值性(创新)、可存贮性和可压缩性、可知性(信息能力)和共享性知识属性:意识性、信息性、实践性、继承性、渗透性情报属性:针对性、知识性、时间性、传递性、效用性信息、知识、情报的关系:信息经过人脑思维加工,即认识飞跃产生知识,情报属于知识的范畴。
广义的情报是信息的传递,因此,情报具有信息和知识两种性质。
三、按载体不同分为:口头信息源、实物信息源、文献信息源四、文献信息源:1、按出版形式不同可分为十种类型:图书、期刊、科技报告、会议文献、政府出版物、专利文献、标准、产品资料、学位论文、技术档案2、按记录信息的材料可分为三种类型:纸印本文献、缩微型文献、机读型文献3、按加工深度不同可划分为四种:零次文献、一次文献、二次文献、三次文献四者之间的关系:从零次文献到三次文献,是一个从分散的原始文献加工整理系统化的过程。
零次文献是一次文献的素材,一次文献是基础,是检索的对象;二次文献是检索一次文献的工具;三次文献是一次文献的浓缩,是情报信息的重要来源。
五、信息检索系统类型:⑴根据检索目标和检出文献信息形式的不同:文献检索、数据检索、事实检索⑵根据具体检索手段不同:手工检索、机械检索六、检索步骤:分析研究课题确定检索范围和检索标识选定检索工具确定检索途径查找和获取原始文献七、信息检索的方法:⒈常用法:是利用检索工具查找文献的方法.⑴顺查法⑵倒查法⑶抽查法⒉追溯法:从已知的现有文献后所列参考文献入手,逐一追查原文,从这些原文后所列参考文献再逐一追查,不断扩检的查找方法⒊循环法:指追溯法常用法混合使用的方法。
八、信息检索的途径:⒈根据外表特征划分著者途径;书名、篇名、刊名途径;序号途径⒉根据内容特征划分分类途径(SA、Ei);主题途径(SA、Ei);分子式途径(CA)九、文献检索的一般步骤:1、分析研究课题2、确定检索范围与检索标示3、选择检索工具4、确定检索途径5、查找和获取原始文献检索途径与方式:初级检索:默认的检索方式高级检索:两种检索方式组合使用,如“篇名”和“著者”。
信息检索知识点
信息检索知识点 Revised by Liu Jing on January 12, 2021信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体?检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。
存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程是存储过程的逆过程。
因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法(1)顺查法(2)倒查法(3)抽查法(4)追溯法(5)循环法5.信息检索的途径(1)内部特征途径a)分类途径b)主题途径(2)外部特征途径a)题名途径b)着者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2)可操作性强,应用广泛;(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4)能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
信息检索重点
信息的基本概述一信息:1.信息的特征(5个普遍性与客观性、依存性与传递性、可知性与共享型、可扩充性与可压缩性、时效性与滞后性)2.数据信息、知识、文献、情报、智慧DIKW模型看截图3.信息检索的概念与本质(匹配过程)本质:是用户的信息需求和信息集合的匹配过程,进而满足用的信息需求的过程二信息资源(定义信息资源是人类在认识世界和改造世界过程中产生、整理、记录的有用信息的集合)1.信息资源的类型按时间的产生顺序先导信息资源、即时信息资源、滞后信息资源按传播形式口头信息资源、文献信息资源、实物信息资源按载体形式书写型、印刷型、缩微型、视听型、数字型按出版形式(十大科技情报源)图书、期刊、会议文献、学位论文、专利文献、科技报告、标准文献、技术档案、产品资料、政府出版物按加工深度(零次一次,二次)一次文献知识的首次固化期刊论文、标准、报告、文献等:是依据作者本人的科研成果而撰写的首次记录科研成果的原始文献二次文献检索工具题录,目录,书录,文摘,索引:是对分散的无组织的一次文献进行加工整理、压缩、提炼、简化、整理的产物三次文献直接提供答案百科全书,词典,手册:对大量一次文献经过综合、分析、提炼撰写而成零次文献实验数据,观察记录,手稿等:是形成一次文献之前的信息、知识、情报、即未公开记录或未公开与社会的最原始的文献,或没有正式的发表的文字材料信息资源的特点能够重复使用、具有整合性、具有流动性、共享性、实效性、动态性、不可分性、支配性信息资源的作用可以减少物质与能量的作用,从而极大提高社会劳动生产率,有利于实现国民经济的可持续发展。
信息资源已经成为了当今社会的核心资源。
信息资源的开发利用,可有效降低社会的运营成本三信息社会(概述与内容包括哪三类资源)信息素养的三个层次:基础性、自我满足性、自我实现性信息素养(IL)(定义美国图书馆协会:具有信息素养的人能够知道什么时候需要信息,能够有效的识别、获取、评价、和利用所需要的信息)信息素养的内涵:信息意识对信息的敏感程度,有效发现信息需求,是人们产生信息需求,形成信息动机和兴趣的动力和源泉信息知识信息的基本知识(相关理论、知识与方法),信息技术和知识(信息技术原理)等信息能力获取、理解、处理、表达、评价、利用、创新等信息法律与道德(又称信息伦理)了解利用信息所涉及的经济、法律和社会问题,合理、合法地获取和利用信息第二章信息检索绪论一信息检索概述信息检索概念广义:存储和查询将信息按一定的方式组织和存储,并根据信息用户需求查找所需信息的过程侠义:查询从信息集合中查询信息用户所需信息的过程(仅指从已经存贮的具有检索功能的信息集合中查询出所需要的信息的过程)信息检索原理信息需求与信息集合:匹配检索者将检索提问式与存储与检索系统的文献标引词进行匹配对比,取得一致性即为最符合要求的结果信息检索类型信息检索内容对象数据、事实、文献信息检索组织方式全文、超文本、超媒体信息检索的手段手工与计算机信息检索步骤6个分析课题明确需求、选择检索工具或数据库、确定检索方法、确定检索途径、查找文献检索、获取原始文献。
信息检索复习重要知识
一、名词解释(4题,20分)目录:以一个完整的出版单位或收藏单位作为著录的基本单位,将一批著录款目按照一定的次序编排而成的一种揭示及报道文献的工具。
索引:将某一信息集合中的相关信息按照某中可查顺序排列并系统地指引给读者的一种检索工具。
年鉴:一种按年度出版,概述或反映上一年度有关领域的重大事件、重大进展和重要成果,汇集重要文献、详尽数据很统计资料的连续出版物。
手册:是汇集某一范围内基础知识和基本数据资料,以便于人们在生产、科研、教学等具体工作过程中可以经常查证的实用便览型参考工具。
OPAC:由开放的公共查询目录演化而来,是20世纪70年代末由美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。
CALIS:是经国务院批准的我国高等教育公共服务体系之一,在教育部的领导下,把国家的投资、现代图书馆理念、先进的技术手段、高校丰富的文献资源和人力资源整合起来。
信息检索:广义上,信息检索是指信息存储与查找的过程,狭义上,指信息查找的过程,信息查找是指通过查询机制从各种检索系统中查找出用户所需要的特定信息的过程。
搜索引擎:泛指网络上以一定的策略搜集信息,对信息进行组织和处理,并为用户提供信息检索服务的工具和系统,是网络资源检索工具的总称。
百科全书:是指收录了各个知识门类的知识,或者系统而完备地概述了某一知识门类知识的大型参考性工具,是最完备的参考工具,有“工具书之王”的美誉。
学位论文:学位论文是伴随着学位制度的实施而产生的,是高等院校或科研机构的毕业生为获取学位资格而撰写的学术性研究论文。
特种文献:一种介于图书与期刊之间的文献类型,通常在出版发行或获取途径方面比较特殊,因此也被称为灰色文献。
电子图书:是指以数字形式加工,通过计算机网络进行传播,,并借助于计算机或类似设备来阅读的图书,是电子出版物中最常见的文献形式。
参考工具书:是根据一定的社会需要以特定的编排方式和检索方法汇编某学科或特定范围的知识和资料,其目的是为人们解决疑难和提供数据或事实信息,是作为工具使用的专供查考的特定类型的图书。
计算机信息检索复习
计算机信息检索复习计算机信息检索是指通过计算机技术来获取和利用大量信息资源的过程。
在现代社会,数据量爆炸式增长,人们需要从海量的信息中快速准确地找到所需的信息。
计算机信息检索因此成为一门重要的学科,被广泛应用于各个领域。
本文将从计算机信息检索的基本概念、分类方法、技术算法以及发展前景等方面进行复习。
一、基本概念1.1 信息检索与搜索引擎的区别信息检索是指通过用户输入的关键词等信息,在信息资源中查询并返回相关信息的过程,而搜索引擎是指以互联网为载体,通过爬取、索引和检索技术,提供全面、快速、准确的信息查询服务。
1.2 关键词关键词是用户在进行信息检索时使用的重要词汇,它能够准确描述用户的需求。
在信息检索系统中,关键词通常通过布尔逻辑运算符进行联合查询,以便更加准确地匹配用户需求。
1.3 相关性相关性是指检索结果与用户需求的一致程度,是衡量信息检索系统性能的重要指标。
相关性通常通过计算文档与查询之间的相似度来确定。
二、分类方法2.1 根据检索领域根据检索领域的不同,可以将计算机信息检索分为一般文本检索、专业文献检索、多媒体检索等。
2.2 根据检索模式根据检索模式的不同,可以将计算机信息检索分为精确检索和模糊检索。
精确检索要求检索结果与用户需求完全一致,而模糊检索则容许检索结果与用户需求存在一定程度的差异。
2.3 根据检索技术根据检索技术的不同,可以将计算机信息检索分为基于关键词的检索和基于内容的检索。
基于关键词的检索是目前应用最广泛的检索方式,而基于内容的检索则能够更好地满足用户个性化需求。
三、技术算法3.1 倒排索引倒排索引是一种常用的信息检索技术,它将文档集合中的每个词汇与包含该词汇的文档进行关联,快速地定位文档。
倒排索引能够大大提高检索效率和准确性。
3.2 向量空间模型向量空间模型是一种通过计算文档与查询之间的相似度进行检索的方法,它将文档和查询表示为向量,通过计算它们之间的夹角来衡量相似度。
信息检索知识点
信息检索知识点信息检索考点整理 1 、信息检索的概念广义的信息检索就是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储与检索两个过程; 而狭义的信息检索仅指有序化信息的检索查找。
2. 信息检索的原理就就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡就是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就就是初步命中检索所需的信息。
3 、为什么说信息存储与检索就是两个不可分割的有机体?检索的全过程包括存储与检索两个过程,存储与检索就是相辅相成、不可分割的。
存储过程主要就是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要就是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程就是存储过程的逆过程。
因此,检索者只有在全面了解存储者就是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4 、信息检索的方法 (1)顺查法 (2)倒查法 (3)抽查法(4)追溯法 (5)循环法 5 、信息检索的途径 (1)内部特征途径a) 分类途径 b) 主题途径 (2)外部特征途径 a) 题名途径 b) 著者途径 c) 文献编号途径 d) 检索途径 e) 机构检索法 f) 引文检索途径 6 、布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2) 可操作性强,应用广泛;(3) 构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4) 能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7 、概率排序原则: 如果一个检索系统对用户的每个检索提问的反应就是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果就是最好的。
《信息检索》考试重点
《信息检索》考试重点信息是指事物的存在方式和运动状态,是对客观世界中各种事物的变化和特征的反映,是客观事物之间相互作用和联系的表征,是客观事物经过感知或认识后的再现。
这里强调信息是事物属性的表征,即信息不是事物本身,而是用来表现事物特征的一种普遍的形式。
信息的特征7个:客观性、普遍性、可存储性、可传递性、扩散性、共享性、时效性。
信息的功能4个:经济型功能,选择与决策、管理与协调、研究与开发。
知识是人类通过信息对自然界。
生物界、人类社会运动规律的认识和概括,是人的大脑通过思维重新集成整合的系统化信息,是信息中最有价值的部分。
也就是说信息是产生知识的原材料,知识是信息的加工的抽象化产物。
知识是一种特定的人类信息,它四对信息进行提炼和深化的结果。
知识的类型:显性知识和隐性知识、实体知识和过程知识、核心知识和非核心知识。
情报是具有特定传递对象的特定知识或有价值的信息。
情报的特征:动态性、按特定方式传递、为特定目的服务的、常常带有一定的时效性和机密性情报的类型。
情报的分类:根据情报的来源与加工程度划分,情报可以分为:零次情报、一次情报、二次情报、三次情报。
零次情报是指为公开于社会、没有经过记录整理、非正式传递的、直接作用于人的、非文献情报的总称。
如私人笔记、手稿、设计草图、会议记录、口头言论等。
一次情报:是指为经过加工或者加工程度等于零的原生情报。
这种情报直接反映实际情况和科研成果,有如生产过程中的原料。
固定原生情报的文献称为原生文献,也称一次文献。
如调查报告、研究报告、科学论文、专利说明书、会议文献、专著等。
二次情报是一种派生情报,是针对一次情报加工的产品。
一二次情报的作用不仅在于报导,更重要的是为查找一次文献提供线索。
刊载二次情报的文献称为二次文献,二次文献按照加工的方式和深度又分为书目、索引、文摘等形式。
其中文摘是一份文献的内容缩短的精确的表达,它是二次情报的重要形式。
三次情报是在一次二次情报的基础上,经过分析研究和综合概括而编撰的情报。
信息检索知识点
信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体?检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。
存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程是存储过程的逆过程。
因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法(1)顺查法(2)倒查法(3)抽查法(4)追溯法(5)循环法5.信息检索的途径(1)内部特征途径a)分类途径b)主题途径(2)外部特征途径a)题名途径b)著者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2)可操作性强,应用广泛;(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4)能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
8.什么是计算机信息检索?所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息检索数据(Data):泛指所有描述事物的形貌、特性、状态或任何其他属性的数字、文字或符号。
一般指原始,未处理过的数据。
信息(Information):1. 物质存在的一种方式。
一般指数据、消息中所包含的意义。
可以使消息中所描述的事件的不定性减少。
2. 是事物运动的状态与方式的反映。
知识(Knowledge):A、是在改造世界的实践中所获得的认识和经验的总和。
B、是人类的主观世界对客观世界概括和反映,是大量有组织的信息,是关于事实和思想的有组织的陈述。
提供某种经过思考的判断和某种实验的结果。
(信息是知识的原材料,知识是信息加工的抽象化产物。
)情报(Information):钱学森:“情报是活化了的、激活了的知识”。
可以理解为是指传递着的有特定效用的知识或信息。
三要素:知识性、传递性、效用性文献(Literature):记录有知识的一切载体。
三要素:载体(文献的外部形式,它是知识的包装或运载方式,常称之为媒体(media)。
)、知识(反映了文献的信息内容。
)、记录(信息的一种人工编码,通过人工、机械以及声、光、电、磁等各种技术手段生成多种包含知识信息内容的符号,以一定的形态出现,形成各种媒体的文献类型。
)文献对人类文明进步具有重大意义:知识的积累、传播与创造研究成果的确认与评价信息环境及其认识:信息环境的变化,20世纪90年代中期前,书本时期-----手工检索,缩微时期-----缩微检索,20世纪90年代后期,光盘时期-----单机检索,网络初期-----联机检索21世纪,网络兴盛-----网络检索第一章信息检索原理一、信息检索的含义(掌握)广义:信息检索包括信息的存储过程和查找过程;狭义:仅指信息的查找。
二、信息检索的类型(一、)以检索内容划分(重点)1.文献信息检索凡是利用目录、文摘或索引等二次信息查找某一课题、某一著者、某一地域、某一机构、某一事物的有关信息以及这些信息的出处和收藏单位等,都属于文献信息检索范畴。
其检索的结果是文献信息2.数据信息检索(Data Retrieval)凡是利用参考工具书、数据库等检索工具检索包含在文献中的某一数据、参数、公式或化学分子式等,统称为数据信息检索。
其检索结果为数据信息。
3.事实信息检索(Fact Retrieval)凡是利用百科全书等检索工具从存储事实的信息系统中查找出特定事实的过程称为事实信息检索。
其检索结果是基本事实。
文献信息检索是一种相关性的检索,检索的结果是文献线索,还必须进一步查找才能检索到有关的一次信息;数据与事实信息检索是一种确定性检索,检索的结果是可供用户直接利用的信息。
一般情况下,文献信息检索通过二次信息来实现,而数据与事实信息检索则通过三次信息来完成。
(二、)以信息存储和检索的方式和技术划分(掌握)1.手工检索(Manual Retrieval)手工检索简称“手检”,是指人们通过手工的方式来存储和检索信息。
其使用的检索工具主要是书本型、卡片式的信息系统,即目录、索引、文摘和各类工具书。
检索过程是由人工以手工的方式完成的。
2.计算机检索(Computer-based Retrieval)计算机检索简称“机检”,是指人们利用数据库、计算机软件技术、计算机网络以及通信系统进行的信息存储和检索,其检索过程是在人机的协同作用下完成的。
三、信息检索的意义(重点)(会用自己的语言表达)1. 避免重复研究或走弯路—科学技术的发展具有连续性和继承性,闭门造车只会重复别人的劳动或者走弯路。
2. 节省研究人员的时间3. 是获取新知识的捷径一、检索工具的定义(了解)1.用来揭示、存储和查找信息的工具,主要指手工检索工具。
2.检索系统则是由一定的检索设备(如计算机)和经过加工整理并存储在相应载体(如磁带、磁盘等)上的信息集合及其他设备共同构成的一种具有存储和检索功能的信息服务系统。
二、检索工具的类型(了解)目录目录款目索引索引款目文摘1、目录综合性目录:是以各个学科门类的图书或者报刊文献为揭示对象的目录。
如《全国总书目》、《中国国家书目》、《中国报纸名录》、《中国期刊名录》等。
(1)专题目录(2)馆藏目录(3)联合目录2、索引(Index)(1)索引是指将信息中所包含的主题词、分类号、著者姓名、论文题名等内容摘录出来,并注明它们所在图书、期刊或检索工具中的位置,然后按照一定的规则编排组织起来所形成的检索工具。
如《工程索引》(Ei)的“主题索引”、“著者索引”等。
(2)索引条目至少有两个著录项目:标目(标识Heading)和存储地址,有时候可能还会有说明语。
主题索引、著者索引是最常用的索引。
3、文摘(Abstract)(1)文摘就是对一份文献的内容所进行的简略而准确的描述。
通俗地讲,文摘就是原始文献的内容摘要。
它是将论文或书籍的主要论点、数据和结论等信息简明扼要地摘录出来,注明出处,并按一定方式编排的一种文献检索和阅读工具。
它是检索工具的主体,二次信息的核心。
美国的《工程索引》(Ei)和英国的《科学文摘》(SA)等均属此类检索工具。
(2)文摘通常以一个内容上独立的文献单元(如期刊中的一篇论文、会议录中的一篇会议论文或一种图书)为基本著录单位(见第五章《工程索引》文摘款目的样页)。
它和目录的主要区别在于:目录以单位出版物为著录对象,而文摘的著录对象可以是一个单位出版物,也可以是单位出版物的个别内容;目录反映的是文献的外部特征,而文摘既反映文献的外部特征,又反映文献的内容特征。
三、信息检索的方法(掌握):1、常规法 2、追溯法 3、交替法(一)常规法:常规法就是利用检索工具查找信息的方法,因在信息检索中经常使用而得名。
它又分为顺查法、倒查法及抽查法三种。
⏹顺查法——顺查法即是利用检索工具、根据课题研究的起始年代由远及近逐年查找信息的方法。
顺查法比较费时间,但由于是逐年查找,因而有较高的查全率。
⏹倒查法——倒查法与顺查法相反,它是利用选定的检索工具由近及远、逐年逐卷地进行查找信息的方法。
当检索者的要求是获取近期文献时,最好采用倒查法。
倒查法的查准率较高,查全率比顺查法低。
⏹抽查法——抽查法是针对课题研究所处的发展高峰阶段进行的信息检索,它往往用来解决要求快速检索的课题。
抽查法有较高的检索效率,但使用该方法的前提是必须事先了解该研究课题的历史背景。
(二)追溯法:追溯法又称引文法,主要有以下两类。
1.传统追溯法——它是利用一次信息所附的参考文献进行追溯查找的方法。
检索时可以先查找出几篇与课题有关的专著或述评(这类文献往往附有大量的参考文献,多时可达上百篇),以此作为起点进行检索。
2.引文追溯法——它是一种由远及近的检索方法,即找到一篇与课题有关的论文后进一步查找该论文被哪些文献引用过、是否有人对该领域做过进一步研究、实践结果如何、最新的进展怎样等。
由远及近地追寻,信息愈来愈新,研究也就越深入。
这种方法主要依靠专门的引文索引,如《科学引文索引》(SCI)、《社会科学引文索引》(SSCI)等。
(三)交替法1、交替法就是以追溯法和常规法交替使用来查找信息的方法,又称分段法或综合法。
2、即先利用检索工具查出一批相关信息,然后利用这些信息所附的参考文献进行追溯,扩大线索,由此获得更多信息。
交替法比前两种方法的检索效果好,是一种立体型的检索法。
3、当检索工具缺期或缺卷时,使用该方法也能连续获得所需年限以内的信息四、信息检索的程序(重点)(会用自己的语言表达)1、分析检索课题2、选择检索工具3、选择检索途径,确定检索标识4、选择检索方法5、获取原始文献(一)分析检索课题课题分析是信息检索过程中最重要的环节。
每一项检索课题都有明确的目的和具体的要求。
课题分析应从以下几方面进行。
1.分析主题内容确定文献的学科范围,其次找出课题研究需要解决的关键问题,选择恰当的主题词或关键词,这是成功检索的第一步。
2.分析时间范围分析查找年代,确定检索的时间范围,可避免浪费时间和精力。
根据课题的历史背景和检索要求,推算出所需信息最为适当的时间段。
例如,为了了解某个领域的最新研究进展,只查询近一两年的文献就可以了。
如果是专利的查新检索,回溯年限则相对要长些。
3.分析信息类型在进行信息检索时,还要进一步确定待查信息的类型。
因为不同的检索工具对不同信息的收集量不同。
如研究基础理论课题,则应侧重于检索期刊论文、专著和会议论文;如果是技术应用和开发的课题,则侧重于检索专利文献、标准文献及科技报告等。
明确信息类型,可为选择检索工具和检索手段提供依据,提高检索的针对性,否则将会降低检索效率,甚至一无所获。
(二)、选择检索工具选择检索工具的依据有以下两方面。
1.根据课题涉及的学科范围进行选择如果课题复杂,涉及的学科多,应选择综合性和专业性检索工具相结合的方法进行检索:如果课题涉及学科单一,可以以专业性检索工具为主、综合性检索工具作为补充。
如要查找关于“计算机软件”的信息,可以先利用专业性较强的《科学文摘》(SA)的C辑“计算机与控制文摘(CCA)”查找,然后再用综合性的工具《工程索引》(Ei)作为补充。
如果检索课题涉及某种特定的信息类型,则应选用收录特定信息类型的检索工具。
比如要检索专利文献,应选用<<中国专利公报》、《世界专利索引》(WPl),或者专利信息数据库等检索工具。
2.根据检索工具收录范围和编制体系进行选择不同的检索工具在收录范围、报道形式、编排体系、著录格式和索引系统等方面不尽相同,使用时可根据具体检索要求加以选择。
这里需要强调的是,对于类型相似的检索工具,应该根据收录的信息量、文摘和题录的质量、标引的质量、使用的方便程度及出版的周期等加以选择。
(三)选择检索途径,确定检索标识检索途径是检索的入口。
主要有两类:一是反映信息内容特征(主题、分类)的检索途径,二是反映信息外部特征(著者、题名、代码等)的途径。
1.选择检索途径(1)分类途径——它是按学科分类体系查找信息的途径,主要有分类目录和分类索引。
它以学科概念的上、下、左、右关系来反映事物的派生、隶属、平行、交叉的关系,能够较好地满足族性检索的要求。
(2)主题途径(3)题名途径(4)著者途径⏹如著者索引、著者目录、全国报刊索引。
⏹缺点:无系统性和完整性。
(5)信息代码途径⏹通过已知信息的专用代码查找信息的途径。
⏹ISBN、ISSN、专利号、合同号、标准号、入藏号等。
2.确定检索标识每个检索途径对应一种检索标识。
●采用主题词做检索标识时,应考虑该词的同义词、近义词,以免漏检。
●上位类(放大)、下位类(缩小)(四)选择检索方法(五)获取原始文献1.判断信息的发表类型2.缩写语和非拉丁语系文字的音译问题3.通过其他方式获得4馆际互借、代购、向著者索取、向出版发行机构购买、联机订购、数据库全文。