信息检索与利用期末复习材料复习过程
《信息检索与利用》期末复习资料
《信息检索与利用》期末复习资料试题的难易程度和题量适当,按难易程度分为三个层次:容易占40%,一般占40%,较难占20%。
一、填空题1.__是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。
信息2.__是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。
知识3.__ 是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。
情报4.___是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。
文献5.___是指在国内外学术或非学术会议上发表的论文或报告。
会议文献6.___是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。
学位论文7.___是对文献内容和形式特征进行选择和记录的过程。
著录8.___是指特定的数值型数据为对象的检索。
数据检索9.___是指以特定的事实为目标的检索。
事实检索10.事实与数据检索工具主要依靠各类___完成各种数据或事实的查询。
参考工具书11.按照结构原理,信息检索语言可以分为____、___、___等多种类型。
分类语言,主题语言,代码语言12.Internet是基于 ___协议的网络。
TCP/IP13.二级域名是指__。
教育机构14.目前WWW环境中使用较多的浏览器有Microsoft公司的__和Netscape公司的___。
Internet Explorer,Netscape15.FTP信息资源检索中匿名登录的用户名是___。
Anonymous16.网络信息检索工具一般由___、___、___三部分组成。
信息采集子系统,数据库,检索代理软件17.据互联网统计公司comScore发布的2007年12月世界搜索引擎市场份额前几名中,主要的搜索引擎公司有___、___、____等。
信息检索期末复习材料
信息检索第一章信息检索基础1、信息的含义:广义的信息指自然界和一切人类活动所传达出来的信号和消息,是事物表现得一种普遍形式。
狭义的信息指经过搜集、记录、处理和存储的可供检索的文献、数据和事实2、一次文献:指作者以本人的研究成果为基本素材而创作或撰写的文献。
(著作、报纸、期刊、会议资料、研究报告、政府出版物、专利说明书、产品样本、标准文献、学位论文等)二次文献:指对一次文献进行加工、提炼和压缩后所得到的报道性产物。
检索工具书和网上引擎是典型的二次文献。
(目录、题录、索引、文摘)三次文献:是指对有关的一次文献和二次文献进行广泛深入的分析研究综合概括而成的具体知识、数据。
如综述、百科全书、辞典等。
3、信息检索的含义:从大量的信息集合中找出所需信息的过程与方法。
广义:包含信息储存和检索两部分狭义:信息检索4、信息检索的原理:将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配5、信息检索的意义:①信息检索是有效利用信息资源、实现其最大价值的科学方法②信息检索是再学习的工具、是获取知识的有效途径③信息检索能有效地提高科研工作的效率、节省人力物力及时间6、信息检索的历程:手工检索、计算机检索7、信息检索的方法:直接浏览法、常用法(顺查法、倒查法、抽查法)、追溯法、综合法查全率和查准率的关系、局限性1)查全率=[检出的相关文献信息量/检索系统中相关文献信息总量]×100%=[a/(a+c)]×100%2)查准率=[检出的相关文献信息量/检出文献信息总量]×100%=[a/(a+b)]×100%3)查全率与查准率的局限性:①对文献相关性的判断不可避免的带有主观性和模糊性②全部相关文献的总量很难确定③“相关文献”总是被同等对待,实际上其相关程度是有区别的9、影响检索效果的因素:①标引上网质量②检索语言的性能③检索途径的数量④检索策略的优劣⑤检索人员的素质第二章检索语言1、检索语言的定义:广义的检索语言泛指信息检索过程中涉及的人工语言和自然语言。
信息资源检索与利用期末复习题
信息资源检索与利用期末复习题第一章、信息检索基础文献的概念:为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录到唱片上,或存储在磁盘上,这种附着在各种载体上的记录统称为文献。
文献由四要素构成:文献信息、文献载体、符号系统和记录方式文献的属性:知识信息性、客观物质性、人工记录性、动态发展性由信息、知识和文献三者的概念可知,三者之间是密切相关的。
信息是物质存在的方式、形式和运动规律的表征。
人脑对事物属性的感知形成信息;人们对信息集合加工、整理形成系统化,表现形成人类社实践的知识;知识被记录在载体上形成文献,文献被人类广泛传播、运用在理论和实践中以产生新人信息、知识和文献。
如此循环,不断创新,形成各种各样的新知识,从而推动人类前进。
由此可见,信息、知识、文献在社会系统中表现出一种不间断的延续性。
这种大量客观存在的由人们直接或间接开发利用的信息集合总称为信息资源信息资源按信息的出版或加工形式划分:图书(ISBN)国际书号报刊(ISSN)标准刊号会议文献名称专利文献(CN)科技报告学位论文技术档案产品资料标准文献政府出版物按照信息加工层次划分:一次文献、二次文献、三次文献一次文献的特点:具有学术上的新观点、新发明、新技术、新成果、提供了新的知识信息,是创造性劳动的结晶,有直接参考、借鉴和使用的价值,是人们检索和利用的主要目标。
二次文献的特点:仅是对一次文献进行系统化的压缩,无新知识产生,具有汇集性,检索性的特点三次文献的特点:具有综合性高、针对性强、系统性好、知识信息面广的特点。
区别:从文献的角度看,一次文献是人们检索与利用的主要对象,二次文献是文献信息的检索工具,三次文献是人们考查数据、事实信息的主要信息源。
信息检索的概念:是将信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户的需要找出有关信息的过程。
它的全过程又称为信息存储与检索。
信息检索与利用复习资料
第一讲图书馆的利用一、图书馆基础知识1.图书馆定义(1)图书馆是收集、整理、存储和利用文献信息,并为社会的政治、经济服务的文化教育机构。
(2)图书馆是社会知识、信息与文化的记忆装置、扩散装置。
3.我国图书馆的现状(1)国家图书馆(2)公共图书馆系统(3)科学、专业图书馆系统(4)高校图书馆系统二、高校图书馆的利用1.图书馆的传统服务(1)外借服务(2)阅览服务(3)参考咨询服务(4)馆际互借服务(5)读者教育与培训2.图书馆的网上服务(1)馆藏书目数据库检索服务(2)网上文献信息传递服务(3)网上信息共享服务(4)网络资源信息导航服务三、大学生与图书馆2.大学生要学会利用图书馆(1)了解图书馆藏书结构,掌握图书馆学科分类体系(2)了解和掌握图书馆机读目录的使用和检索方法(3)掌握工具书的使用方法和网络信息检索技能第二讲信息检索基础理论一、什么是信息检索?信息检索就是信息用户为处理解决各种问题而查找、识别、获取相关的事实、数据、知识的活动及过程。
三、什么是信息资源?信息资源是指人类社会经济活动中经过加工处理的、有序化的并大量积累后的有用信息的集合。
(狭义)和它的生产者以及信息技术的集合。
(广义)五、文献信息资源文献信息资源是指以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息资源。
例如,手稿,书籍,光盘,胶片,磁带等。
七、印刷型文献的分类(名词解释)1.图书图书基本上有两大类:一是供读者阅读的图书;例如,各种专著,教科书,各种文学读物,科普读物,二是供读者查阅的图书(参考工具书)。
例如,各种目录,手册,词典等。
2.期刊期刊是一种定期或不定期的连续性出版物,每期版式基本相同,有固定名称,用卷期、年月、或其他顺序号出版。
作者众多,内容不重复,有多篇文章,内容新颖,出版周期短,报道文章速度快,信息量大。
例如《知音》、《重庆教育学院学报》、《小说月报》、《管理科学》等。
3.报纸报纸是指定期出版的,报道时事新闻为主的出版物。
【云南大学】信息检索期末复习重点
【云南大学】信息检索期末复习重点第一篇:【云南大学】信息检索期末复习重点云南大学信息检索重点第一章一、检索策略定义:在处理信息需求提问实质的基础上确定检索途径、检索词语并明确各词语之间的逻辑关系,查找步骤、系统输出顺序等方面的科学安排,与检索效果密切相关。
二、检全率与检准率1.检全率及其影响:检全率=(检出的相关信息数/信息库中相关信息总数)x100%2.检准率及其影响:检准率=(检出的相关信息数/检出的信息总数)x100% 影响检出文献的检索效果的质量。
三、检索模型1.布尔检索模型(1)定义:布尔检索模型采用布尔代数和集合论的方法,用布尔表达式表达用户提问,通过对文献表示与提问式的逻辑运算来检索文献。
(2)优点:简单、易理解、易实现、能处理结构化提问(3)缺点:A.布尔检索式的非友善性,即构建一个好的检索式是不容易的。
尤其是对复杂的检索课题,不易套用布尔检索模型。
B.易造成零输出或过量输出。
检索输出完全依赖布尔提问式与系统倒排挡中的文献匹配情况,输出量较难控制。
C.无差别的组配元,不能区分各组配元的重要程度。
D.匹配标准存在某些不合理的地方。
由于匹配标准是有或无,因此,对于文献中表因此的数量没有评判,都一视同仁。
E.检索结果不能按照重要性排序输出。
2.向量检索模型(1)定义:向量检索是以向量的方式确定检索内容的方法,系统中的每一篇文献和每个提问均用等长的向量表示。
(2)优点:A.采用自动标引技术维文献提供标引词B.改变了布尔检索非“1”即“0”的简单判断,标引词和文献的相关程度可在【0,1】闭区间中取值,使标引和检索者都可比较灵活地定义组配元(标引词)与文献的关系深度,改变了布尔检索模型僵化的特点。
C.由于以其相似的程度作为检索的标准,可从量的角度判断文献命中与否,从而使检索更趋于合理。
D.检索结果可按提问的相关度排序输出便于用户通过相关反馈技术修正提问,控制检索量。
E.布尔模型的逻辑关系依然可以使用,保留了直观性和方便性。
信息检索与利用复习资料(整理2016.1)
信息检索与利用复习资料(一)、名词解释1、INTERNET(因特网):Internet:因特网。
泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的一个大型网络。
采用TCP/IP协议。
2、SCI: SCI是科学引文索引的英文缩写首字母。
SCI是一个引文数据库,收录全世界出版的数、理、化、农、林、医、生命科学、天文、地理、环境、材料、工程技术等自然科学各学科的核心期刊。
3、报刊:报刊是指报纸和期刊的总称,是属于连续出版物,它具有统一的题名,定期或不定期以连续分册形式出版,有卷期或年月标识,并且计划无限期连续出版。
报纸以刊载新闻和评论为主,期则围绕某一学科和某些学科或某一研究对象,由多篇文献资料编辑而成。
4、标准文献。
广义的标准文献包括标准的原始文件及检索工具书等。
狭义的标准文献仅指带有标准号的标准、规范、规程等技术标准。
5、超文本:超文本是在普通文本的基础上增加了链接功能的一种文本。
用户只要用鼠标点击页面上有特殊颜色或有下划线的文字时,就会出现新的解释或访问更多的信息。
6、分类途径:是指按文献内容的学科分类体系查找文献信息的途径。
一般说来,一种检索工具的编制都须按学科建立自己的分类体系,其收录的文献按分类目录中的排序进行编排,这样的编排的结果可将同一学科的文献集中,便于按学科查找文献。
7、技术档案:指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有保密性和内部使用的特点。
8、检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等。
它是根据检索的需要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言。
9、竞争情报:竞争情报是20世纪80年代在国际上迅速发展起来的一种信息业务,是关于竞争环境、竞争对手和竞争策略的情报研究。
信息检索与利用++复习提纲
信息检索与利⽤++复习提纲注:考试时,务必带上2B铅笔、橡⽪擦,签字笔考试题型:填空、简答、单选、多选、判断单选、多选、判断,请在答题卡上作答,第⼀章绪论1、了解信息素养的概念,掌握信息素养的具体内容概念:具有确定、评价和利⽤信息,成为独⽴的终⾝学习者的能⼒内容:信息意识、信息知识、信息能⼒、信息道德2、了解信息、知识、情报和⽂献四个概念;掌握他们之间的关系概念:信息:信息是⽤来消除随机不定性的东西知识:经过思维加⼯的信息情报:⼈们为解决某⼀特定的问题⽽搜索、传递有特定效⽤的知识或信息⽂献:记录有知识的⼀切载体关系:包含关系、转化关系、交叉关系3、⽂献信息资源按物质载体和记录形式的划分类型⼿写型/印刷型/缩微型/声像型/机读型信息资源⽂献信息资源按加⼯深度不同的划分类型零次/⼀次/⼆次/三次⽂献⽂献信息资源按出版形式的⼏种划分类型图书(ISBN)、期刊(ISSN/CN)、报纸、科技报告、学位论⽂、⽂献会议、专利⽂献、标准⽂献(ISO /GB)、政府出版物、产品资料、技术档案图书、期刊的类型及特点图书:分类:阅读性⽤书、参考⼯具书、检索⼯具书特点:内容全⾯系统,基础理论性强,论点成熟可靠。
不⾜之处在于图书撰写、编辑、出版所需要的时间长,传递信息速度慢,内容相对陈旧期刊:分类:学术性/技术性刊物、检索⾏刊物、其他类型刊物特点:信息量⼤,品种多,出版周期短,报道速度快,连续出版,内容新颖,能够及时反映最新研究动态,反映国内外当前的科技⽔平第⼆章检索基础知识1、⼴义信息检索的含义包含信息的存储和检索两个过程。
信息检索是将信息按照⼀定的⽅式组织并存储在数据库中,⽤户根据需要,利⽤检索⼯具按照⼀定的⽅式从数据库中查找所需的信息的过程。
2、按检索对象划分,信息检索的类型及其特点⽂献检索、事实性信息检索、数据型信息检索、声频与视频检索3、信息检索系统及计算机检索系统的构成信息检索系统:检索⽂档、检索设备、系统规则、操作⼈员计算机检索系统:脱机检索系统、光盘检索系统、联机检索系统、⽹络检索系统4、数据库结构字段、记录、⽂档、帮助⽂件不同⽂献类型的主要字段:存取号字段、基本索引字段、辅助索引字段5、信息检索原理(检索语⾔是(标引者和检索者之间的沟通桥梁)信息索引和存储过程、信息的需求分析和储存过程6、检索语⾔的类型按标识的组配⽅式:先组式语⾔、后组式语⾔按表达信息的特征:描述外部特征语⾔、描述内容特征语⾔按规范化程度:⾃然语⾔、受控语⾔7、主题检索语⾔按照选词⽅式不同,可分为哪3种。
网络信息检索与利用参考试题与答案复习进程
网络信息检索与利用一、名词解释题:网络信息资源:是将文字、图像、声音、动画等各种形式的信息,以数字化形式存储并借助计算机与网络通讯设置发布,收集、组织、存储、传递、检索和利用信息资源。
www:信息检索数据库:是至少有一个文档组成并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。
联机检索:指用户利用计算机联合通过通讯网络与世界各地的信息检索系统联机,从检索系统的数据库中查找出所需信息的过程。
它允许用户以智能机对话,联机会话,这样交互的方式直接访问检索系统及数据库、检索是实时在线进行。
查全率:是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例。
查准率:是指检出文献中合乎需要的文献的数量占检出文献的全部数量。
关键词:关键词又称自由词,它属于自言语言范畴。
关键词是直接来自文献本身,能够反映文献主题概念,具有实际检索意义的词语。
以搜索引擎为代表的基于关键词的检索工具能够利用全文索引技术。
布尔逻辑检索:又称布尔代数是指使用,and,or,not等运用符,查找含有某种词语特定主配形式的网页。
搜索引擎:是一个可以用文件名查找文件的系统。
元搜索引擎:是一种基于搜索引擎的网络检索工具。
它是将多个搜索引擎集合在一起,通过一个统一的检索界面接收并处理用户的查询提问。
在进行检索时调用一个或者多个独立搜索引擎的数据库。
桌面元搜索引擎:顾名思义,桌面元搜索引擎不是通过网上调用方式在线使用,而是直接在用户的计算机上进行,相当于用户自己拥有一个元搜索引擎,所以称之为桌面元搜索引擎。
All-in-One式元搜索引擎:又称搜索引擎元目录,它将主要的搜索引擎集中起来,并按类型或检索问题等编排组织成目录帮助导引用户根据检索需求来选择适用的搜索引擎。
联合书目数据库:联合目录是揭示报道若干个文献收藏单位的文献入藏情况,汇总若干个单位馆藏的书目信息的目录。
参考信息:是指人名、地名、机构、事件、统计数据等一类数据,事实信息,是人们的工作研究和日常生活中经常要查考、引用的信息。
川大信息检索及利用复习资料整理
川⼤信息检索及利⽤复习资料整理四川⼤学信息检索与利⽤⽂史类⼀、图书馆服务与资源介绍1、四川⼤学图书馆,由⽂理、⼯学、医学、江安四个分馆组成。
川⼤图书馆主页的数据库:超星、CNKI、维普、万⽅、SCI、SpringerLinker2、索取号:索取号是某种图书或期刊在图书馆中位置的代号,是图书馆进⾏藏书组织、排架、流通和清点的主要依据之⼀,同时也是读者查找⽂献资源的依据。
绝⼤多数的图书馆使⽤分类排架号作为索取号。
⼀般根据⽂献类型的不同,称图书的索取号为索书号、期刊的索取号为索刊号。
(1)索书号:我馆索书号标签粘贴在书脊距底部约⼀⼨的位置。
本馆索书号由以下两个部分构成:中图法分类号;同类区分号。
(2)索刊号过刊索刊号粘贴或烫印在书脊距底部约5cm的位置,现刊索刊号粘贴或⼿写在期刊封⾯下部。
3、《中图法》分类(5个基本部类,22个基本⼤类)A 马克思主义、列宁主义、⽑泽东思想、邓⼩平理论B 哲学、宗教C 社会科学总论;F 经济N ⾃然科学总论;T ⼯业技术(TB ⼀般⼯业技术)Z 综合性图书4、与望江、华西分馆的借还书(1)读者在就近分馆凭有效借阅证提交借书申请单;(2)四个⼯作⽇内读者申请的图书由图书所属分馆传递到提交借书申请单的分馆,读者到提交借书申请单的分馆凭借书申请单和有效借阅证办理借阅⼿续;(3)读者申请的图书在该分馆保留两个⼯作⽇,两个⼯作⽇后读者未来取书,该书被送回图书所属分馆。
1.3 信息检索的概念和作⽤1、信息检索的概念信息检索通常是指从以⼀定⽅式组成的信息集合中,查找特定⽤户所需信息的⽅法与过程。
⼴义的信息检索包括信息的存储与检索。
2、信息检索的基本原理(1)信息检索是⽂献交流的重要环节;(2)⽂献存储的可逆性是信息检索的基础3、信息检索的类型⽂献检索数据检索事实检索1.4 信息检索语⾔信息检索语⾔的概念是⼈们在加⼯、储存及检索信息时所使⽤的标识符号。
信息检索语⾔的分类⾃然语⾔受控语⾔⼏种常⽤的分类语⾔中图法(中国图书馆分类法);杜威⼗进分类法DDC1.6 信息检索⼯具和检索系统计算机信息检索的类型:参考数据库;源数据库/联机检索系统(如DIALOG);光盘数据库系统;⽹络信息检索系统1.7 信息检索效果及评价查全率查准率漏检率误检率其他第2章信息检索技术及其应⽤1、布尔算符:⽤来规定检索概念或检索词之间相互逻辑关系的算符。
信息检索与利用期末复习
第一章1、IP地址:网络协议地址,是分配给主机的一个32位地址,由4个字节组成。
分为动态IP地址和静态IP地址两种。
动态IP地址指的是每次连线所取得的地址不同;静态IP地址是指每次连线均为同样固定的地址。
如目前教室的无线上网就是动态IP地址,每次所取得的地址不同。
2、IP地址的分类:(1)A类地址第1字节为网络地址,其它3个字节为主机地址。
网络地址的最高位必须是“0”A类地址范围:1.0.0.1—126.255.255.254私有地址和保留地址:①10.X.X.X是私有地址(所谓的私有地址就是在互联网上不使用,而被用在局域网络中的地址)。
范围(10.0.0.0-10.255.255.255)②127.X.X.X是保留地址,用做循环测试用的。
(2)B类地址第1字节和第2字节为网络地址,其它2个字节为主机地址。
网络地址的最高位必须是“10”B类地址范围:128.0.0.1—191.255.255.254。
B类地址的私有地址和保留地址①172.16.0.0—172.31.255.255是私有地址②169.254.X.X是保留地址。
如果你的IP地址是自动获取IP地址,而你在网络上又没有找到可用的DHCP(动态主机设置协议)服务器。
就会得到其中一个IP。
(3)C类地址第1字节、第2字节和第3个字节为网络地址,第4个个字节为主机地址。
另外第1个字节的前三位固定为110。
C类地址范围:192.0.0.1—223.255.255.254。
C类地址中的私有地址:192.168.X.X是私有地址。
(192.168.0.0-192.168.255.255)(4)D类地址不分网络地址和主机地址,它的第1个字节的前四位固定为1110。
D类地址范围:224.0.0.1—239.255.255.254(5)E类地址也不分网络地址和主机地址,它的第1个字节的前五位固定为11110。
E类地址范围:240.0.0.1—255.255.255.2543、DNS(域名服务系统):是一种基于分布式数据库的系统,采用客户/服务器模式完成主机名称与IP地址之间的转换。
信息检索期末复习资料.doc
信息检索一. 名词解释1.索引(P150):索引是将书籍、期刊等文献所刊载的论文题目、作者,以及所讨论的或设计的学科主题、名词术语、所引用的参考文献等,根据一定的需要,经过分析分别摘录出來,注明其所在书刊的页码,按一定的原则和方法排列起来的一种检索工具。
2.回溯检查法:又称追溯法、引文法、引证法,是一种跟踪杳找的方式。
即以文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。
通过回溯法所获得的文献有助于对课题的主题背景和立论依据等内容有更深的理解。
该方法获得文献针对性强、数量较多,在没有检索工具或检索工具不齐备的情况F,利用此法能够获得一些所需要的文献资料。
3.可视化:将数据库中不可见的语义关系以图像的形式可视化显示,并表达用户检索过程。
一个可视化的环境为用户展示更丰富、更直观的信息,一个透明的检索过程使检索更容易、更有效。
它包括检索过程的可视化和检索结果的可视化。
可视化信息检索技术缩短了用户理解信息的时间,提供了感觉和思考Z间的有效反馈机制,它代表着信息检索的未来,将会取代以布尔逻辑为基础的、传统的信息检索系统。
4.自动标引:是指直接通过计算机的操作处理,自动实现赋予检索标志的活动。
分为自动主题标引和H动分类标引,即根据计算机内信息(标题、摘要或全文),借助算法自动给出反应主题内容的标引词和自动分配分类号。
5.全文扫描:是以从文本文档中找出与查询表示的字符串完全一致的部分为目的,检索结果返回包含查询字符串的文本及其位置的检索技术。
6.查全率:查全率是指从检索系统检出的与某课题相关的文献信息数最与检索系统屮实际与该课题相关的文献信息总量Z比。
对于数据库检索系统,杳全率为检索出的款目数与数据库屮满足用户检索式需求的款目数Z比;而对于互联网信息检索系统来说,文献总量是很难计算的,甚至连估算都困难。
在这里人为因素的影响比较大。
相对査全率二(专业人员检出文献的数量数/全部实际检出文献集合并集中文献数量)*100%7.图像信息抽取:是指从数字图像中抽取包括基于文本的特征(说明,注释等关键词)和视觉特征或底层特征(颜色,文理,形状等),作为图像的特征描述,支持信息检索。
信息检索与利用复习.doc
第一章绪论1、了解信息、知识、情报和文献四个概念,掌握他们Z间的关系P7掌握情报和文献的定义,情报的属性、文献的四个要素,及广义理解何为信息、文献P6①信息:信息是自然界、人类社会及思维活动中普遍存在的现彖,是一切存在方式以及它们Z间的相互关系、相互作用等运动状态的表达。
信息特征:客观性、吋效性、共享性、价值型、传递性。
②知识:知识是人们在改造世界的实践中所获得的认识和经验的总和,是人的大脑通过思维重新组合系统化的信息集合。
③情报:情报就是为了解决一个特定的问题所需要的激活了的、活化了的特殊知识和信息。
基本属性:知识性、传递性、效用性④文献:记录有知识的一切载体。
文献是用文字、图形、符号、声频、视频等记录手段,将信息记录或描述在一定的信息载体上有其特定的表现形式并能起到存储和传递信息情报和知识作用的-切载体。
棊木要素:知识内容、物质载体、记录符号和记录手段⑤关系:包含关系:信息包含知识、悄报、文献转化关系:文献可转化为情报交叉关系:情报、信息和文献存在交叉关系2、文献信息资源按物质载体和记录形式的划分类型P9-10文献信息资源按加工深度不同的划分类型P17-18文献信息资源按出版形式的儿种划分类型,各种类型文献的二次文献项目(或称形式特征,或指具体每种类型在数据库中的字段)、内容特点(重点:图书、期刊)、有代表性的号码(ISBN、ISSN、专利申请号(专利号)、标准GB、ISO)等P10-17①按物质载体和记录形式的划分类型:手写型、印刷型、缩微型、声像型、机读型②加工深度分:零次文献、一次文献(数据库中授主要的,期刊、论文、图书中的专著、部分学位论文、科技报告、专利说明书、会议论)、二次文献(所有手工检索工具如全国报刊索引题录型)、三次文献(参考工具书、字典、词典名录百科全书图录年鉴表谱手册)③出版形式分:图书(阅读性图书、参考工具书)、期刊、报纸、特种文献(科技报告、会议文献、专利文献、标准文献、学位论文、政府出版物、产品资料、技术档案)④ISBN国际标准书号、ISSN国际标准刊号、CN国内标准刊号、ISO国际标准编号、GB国家标准编号第二章检索基础知识1、广义上,文献信息检索的概念P41及按检索的信息对象划分的类型P43文献信息检索:依据一定的方法,从大量信息集合中,查出特定的相关信息的过程。
检索与利用复习资料
信息检索与利用复习题一、判断题1.在bing的视频搜索结果中,用户无需点击视频,只需要将鼠标放置在视频上,便可播放视频的精华片段。
2.在搜索引擎中,为了精确搜索,防止自动分词,可采用“+”来实现。
3.在构建关键词时,我们尽量不要用自然语言,而要从自然语言中提炼关键词。
4.在信息检索时查询词表述准确是获得良好搜索结果的必要前提。
5.目前的搜索引擎能很好的处理自然语言。
6.用户可以通过Google图书搜索在线阅读任何一本搜索到的图书。
7.二次检索是指在第一次检索结果不符合要求时,重新选择检索条件再次进行检索。
8.解决读者需求的无限性和馆藏的有限性的矛盾,唯一有效的方法就是在图书馆间建立合作机制,实现资源共享。
9.索引与目录的主要区别在于:目录是对某一种出版物作整体的著录,索引可将文献所包括的若干信息分析摘录出来作为排检标识。
10.在信息社会中,一个人如果不具备良好的信息素养、没有掌握现代信息技术的基础知识和基本技能,就会成为“信息盲”。
11.信息素养由信息意识、信息能力、信息道德三个方面内容构成,其中,信息道德是前提,信息能力是保证,信息意识是准则。
12.在撰写学位论文的时候,为了照顾到论文的新颖性可以不考虑其观点的实际意义。
13.将撰写论文的作者的署名顺序颠倒对作者的署名著作权没有侵害。
14.搜索引擎与普通网站不同的是提供一个包含搜索框的页面,它不是一个WWW网站。
15.搜索引擎的命中率、准确率、查全率都比较高。
16.由于人工干预过少,而且搜索引擎大多采用自然语言标引和检索,搜索引擎检索结果中会有很多冗余信息。
17.在搜索引擎中输入“项目管理”和输入““项目管理””检索结果是不一样的。
18.在搜索引擎中常用的截词符是星号“*”,通常使用右截断。
如输入comput*,将检索出computer、computing、computerized等词汇。
19.通用搜索引擎,如google、baidu、bing、yahoo,并不能囊括所有的网页。
数字信息检索与利用复习资料
1、信息检索的概念、类型?广义的信息检索是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程。
狭义的信息检索是指从存储的信息集合中快速获取各种需要的信息。
信息检索全称:信息存储与检索。
存储是基础,检索是目的类型:1、按照检索对象的不同,早期信息检索分为:1>文献检索:以文献为检索对象的一种相关性检索。
2>事实检索:检索结果是事实结论的信息检索(确定性检索)。
3>数据检索:检索结果是数据的信息检索(确定性检索)。
2、新的三分方法:文本检索、数值检索、声频与视频检索。
2、阐述信息检索的基本原理?是对信息集合与需求集合的匹配与选择。
通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。
3、检索语言的含义及作用?含义:检索语言是应文献信息的加工,存储和检索的共同需要而编制的专门语言,是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。
简言之,检索语言是用来描述信息源特征和进行检索的人工语言,又叫信息检索标识。
作用:(1)标引文献信息内容及其外表特征,保证不同标引人员表征文献的一致性;(2)对内容相同及相关的文献信息加以集中或揭示其相关性;(3)使文献信息的存储集中化,系统化,组织化,便于检索者按一定的排列次序进行有序化检索;(4)便于将标引用语和检索用语进行相符性比较,保证不同检索人员表述相同文献内容的一致性,以及检索人员与标引人员对相同文献内容表述的一致性;(5)保证检索者按不同需要检索文献时,都能获得最高查全率和查准率。
4、信息检索的方法有哪几种?(具体例子)1、工具法又称常用法,是指直接利用检索系统(工具)检索文献信息的方法。
它又分为顺查法、倒查法和抽查法。
(1)顺查法这是一种依照时间顺序,按照检索课题所涉及的起始年代由远及近、由过去到现在查找信息的方法。
《信息检索与利用》全面知识点
《信息检索与利用》课程复习绪论一一一、在人类漫长的发展历程中,物质、能源和信息三种资源支配着人类最基本的生产活动。
物质--向人类提供材料及生活必需品信息---向人类提供知识和智慧能源--- 向人类提供动力二、人类历史上发生的五次信息技术革命:第一次是语言的产生;第二次是文字的出现;第三次是造纸术和印刷术的发明;第四次是电报、电话、电视的问世;第五次信息技术革命是电子计算机和现代通讯技术的结合。
三、信息素质及其内涵信息素质的概念:(1)利用大量的信息工具及信息源,使问题得到解决或解答的技能。
(2)要成为具有信息素质的人,他必须能够确定何时需要信息,并且具有检索、评价和有效利用信息的能力。
信息素质的内涵包括:(信息意识:是指人们对信息的敏感程度;信息能力:发现、评价、利用和交流信息的能力信息道德:在信息活动中应遵循的道德规范)四、(一)信息检索的意义:(1.信息检索是获取知识的有效途径2.信息检索是创新型人才应具备的基本技能3.信息检索是继承借鉴前人成果的主要手段)(二)信息检索的作用(1.信息检索能够避免重复研究和走弯路;2.信息检索有助于节约时间、提高科研效率3.信息检索是科学决策的必要前提)第一章信息与信息资源第一节信息的基本知识-----信息可是当代社会使用最多、最广、最频繁的词汇之一,它普遍存在于自然界、人类社会以及人类思维活动之中。
信息的内涵丰富、形式多样,具有物质和能量资源所不具备的独特性质和专门功能。
一、信息的概念(P6)二、信息的特征(1. 信息的普遍性和客观性2. 信息认识的主观性3. 信息的依附性4. 信息的可传递性(四要素:信源、信道、信息、信宿)5. 信息价值的不定性6. 信息的共享性)信息传递四要素:信源(信息的发出体)、信宿(信息的接收体)、信道(信息的传递媒介)、信息。
三、信息的功能(1. 资源功能;2. 组织管理功能;3. 中介功能;4. 消除不定性(解惑)功能;5. 传播功能四、信息与知识、文献的关系1.知识(Knowledge)知识是人类对客观事物的认识和经验的总和,是人类对客观事物规律性的认识,是信息中最有价值的部分。
信息检索与利用期末复习
信息检索与利用期末复习 Revised by BETTY on December 25,2020《信息检索与利用》考试题型说明:一、判断题(1×10)二、单选题(1×20)客观题要涂答题卡。
三、填空题(2×5)四、简答题(12×3)五、实践题(12×2)信息检索与利用客观复习题一、判断题1.在构建关键词时,我们尽量不要用自然语言,而要从自然语言中提炼关键词。
(对)2.在信息检索时查询词表述准确是获得良好搜索结果的必要前提。
(对)3.目前的搜索引擎能很好的处理自然语言。
(错)4.用户可以通过Google图书搜索在线阅读任何一本搜索到的图书。
(错)5.二次检索是指在第一次检索结果不符合要求时,重新选择检索条件再次进行检索。
(错)6.解决读者需求的无限性和馆藏的有限性的矛盾,唯一有效的方法就是在图书馆间建立合作机制,实现资源共享。
(对)7.关键词语言的最大优点是能用计算机进行自动抽词标引,它适合于计算机自动编制各种类型的词索引。
(对)8.信息素养由信息意识、信息能力、信息道德三个方面内容构成,其中,信息道德是前提,信息能力是保证,信息意识是准则。
(错)9.搜索引擎与普通网站不同的是提供一个包含搜索框的页面,它不是一个WWW网站。
(错)10.用搜索引擎google检索专利和期刊的全文比用中国国家知识产权局专利数据库、《维普中文科技期刊数据库》等数据库的查全率和查准率都要高。
(错)11.GB/T 16159-1996,汉语拼音正词法基本规则[S].北京:中国标准出版社,1996.该文献类型为标准文献。
(对)12.在搜索引擎中输入“项目管理”和输入““项目管理””检索结果是不一样的。
(对)13.在搜索引擎中常用的截词符是星号“*”,通常使用右截断。
如输入comput*,将检索出computer、computing、computerized等词汇。
(对)14.通用搜索引擎,如google、baidu、bing、yahoo,并不能囊括所有的网页。
信息检索复习提纲及答案
信息检索复习提纲及答案第一篇:信息检索复习提纲及答案“信息获取与利用”复习大纲1.什么是信息素养?简述评判是否具备信息素养的标准是什么?结合自己的实际工作,谈谈提高信息素养的途径。
答:指个人“能认识到何时需要信息,和有效地搜索、评估和使用所需信息的能力”。
标准:⑴能够独立决定所需信息种类和程度。
⑵能够高效地获取所需信息。
⑶能够根据现有的知识背景和评价标准对信息及其来源进行评价及遴选。
⑷能够有效地利用信息达到某一特定的目的。
⑸能够在信息利用过程中遵守相关的法律法规。
途径:⑴通过网络搜索⑵信息检索课⑶参加“图书馆利用系列讲座”等信息实践活动。
2.信息、知识、情报的概念?举例说明概念间的区别和联系文献?答:信息,由事物发出的消息、指令、数据等所包含的内容。
如花的生长方向。
知识,是人类社会实践的总结,是人的主观世界对于客观世界的概括和如实反映。
如每天吃一个苹果有利健康。
情报,是激活了、活化了的知识,是为特定目的服务的信息。
如搜索汽车替代燃料时,获得有关乙醇汽油的信息就是情报。
3.文献有那些类型?将文献划分成这些类型的依据是什么?答:纸张文献、缩微文献、电子文献、音像文献。
依据知识内容、记录载体、记录方式。
4.科技文献的作用是什么? 答:⑴科技进步的阶梯。
⑵传递科技信息或知识。
⑶加速科学技术的进步,促进了社会的发展。
5.比较图书和期刊,他们各自有哪些特征,其特点和用途是什么?答:图书特点,内容系统、全面、成熟、可靠,但时效性较差。
用途,对范围较广的问题获得一般知识、或对陌生的问题获得初步了解。
特征,书名、著者、出版社名称、出版地点、出版时间、图书总页数、ISBN。
期刊特点,品种多、数量大、出版周期短、报道速度快、内容新颖、及时反映当前科技水平。
用途,是科技人员吸取成果、掌握进展、了解动态、开阔思路的重要参考文献。
特征:论文题名、著者、期刊刊名、卷号、期号、起止页号、ISSN。
6.特种文献有哪几种类型,简述其中任意两种的特点。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息检索与利用期末复习材料信息检索与利用期末复习材料第一章1、信息素养的具体内容:信息意思、信息知识、信息能力、信息道德。
2、搜商:人们借助工具获取新知识的能力。
3、信息:信息是事物运动状态和运动方向的表达。
信息不是事物本身,而是由事物发出的消息、指令、数据等所包含的内容。
4、知识:知识就是经过思维加工(总结、处理、加工)了的信息。
5、情报:情报是人们为解决某一特定的问题而搜索、传递有特定效用的知识或信息。
6、情报的基本属性:知识性、传递性、效用性。
7、文献:文献是人们记录、积累、传播和继承知识的最有效手段。
凡是记录有信息或知识的一切载体均为文献。
8、信息、知识、情报与文献关系:包含关系、转化关系、交叉关系。
(范围最广)信息人脑加工知识记录载体文献口头、实物情报9、文献的划分类型(1)按文献的物质载体和记录方式划分:手写型信息资源、印刷型信息资源、微缩型信息资源、声像型信息资源、机读型信息资源。
(2)按文献的出版形式和内容划分:图书(M)、期刊(J)、报纸(N)、特种文献(灰色文献){科技报告(R)、学位论文(D)、会议文献(C)、专利文献(P)、标准文献(S)、政府出版物、产品资料、技术档案}。
(3)按加工程度划分:零次文献(最原始文献):私人笔记、私人信件、手稿、实验记录、工程图纸、论文草稿、设计草稿。
一次文献(原始文献):个人专著、大多数阅读性图书、期刊论文、科技报告、专利文献、会议文献、学位论文、技术档案。
二次文献(检索性文献、检索工具):目录、题录、索引、文摘、机读型书目数据库。
三级文献(参考性文献):综述、专题述评、学科年度总结、进展报告、数据手册、百科全书、年鉴、名录、图录、表谱、指南。
10、零次文献、一次文献、二次文献和三次文献之间的关系:零次文献是最原始的信息资源,多数没有进入出版、发行和流通渠道,不易收集,但它是生成一次文献信息资源的主要素材;一次文献是最主要的信息资源,是生成二次文献和三次文献的基础,是信息检索和利用的主要对象;二次文献是一次文献的集中提炼和有序化,是信息检索的主要工具;三次文献是把分散的零次文献、一次文献、二次文献,按专题或知识的门类进行综合分析、重新组合、加工而成的文献,是人们查考数据信息和事实信息的主要信息资源。
11、图书概念广义:书籍、期刊、画册等出版物的总称。
狭义:图书是指由出版社出版的,页数在49页以上(不包括封面和封底)的印刷品。
功能:对大范围问题获得一般性知识;对陌生的问题有一个基本了解;对熟悉问题进行历史性的全面系统的回顾。
主要外表特征:国际标准书号(International Standard Book Number,简称ISBN)。
★公开出版的图书都有ISBN。
12、图书之参考工具书(三次文献)定义:供人们解决疑难问题或提供查阅参考的一定特殊类型的图书。
类型:(字典、词典)、百科全书、年鉴、手册、名录、(图录、图谱)、(年表、历表)。
世界三大百科全书:《不列颠百科全书》、《美国百科全书》、《科利尔百科全书》。
13、期刊:期刊是一种定期或不定期的连续性出版物。
外表特征号码:国际标准刊号(简称ISSN号)和国内统一刊号(简称CN 号)。
14、报纸:报纸是以刊载新闻和评论为主的定期连续性出版物。
15、专利文献(1)概念广义:专利文献是指所有与专利有关的各种文献资料。
狭义:专利说明书。
(2)★专利法明文规定申请专利时不得事先讲内容发表为论文。
(3)我国授予专利权的三个条件(专利的特点):新颖性、创造性、实用性。
(4)专利的基本特性:专有性、地域性、时限性(具有年限)。
(5)专利类型:(6)专利申请号:第3位数(2003年10 月以后第5位数)表示不同的专利类型: 1表示发明专利;2表示实用新型专利;3表示外观设计专利。
16、特征号码: GB 我国的强制性国家标准,具有法律属性。
GB/T 我国的国家推荐性标准。
GB/Z 我国的标准化指导性技术文件。
第二章1、信息检索的概念:广义:信息的存储和检索。
狭义:指依据一定的方法,从已经组织好的大量有关信息集合中,查找并获取特定的相关信息的过程。
2、信息检索的类型按照检索的对象(或检索结果)划分:(1)文献检索(相关性);(2)事实型信息检索(确定性);(3)数据型信息检索(确定性);(4)声频与视频检索。
3、信息检索系统的类型按手段划分:手工检索系统、计算机检索系统。
按内容划分:目录、题录、文摘、索引、全文信息检索系统、多媒体信息检索系统。
目录:是以一个完整的出版物或收藏单位作为著录单元的检索工具。
题录:是以内容上独立的文献单元(如一篇文章或书中的某一章节)作为著录的基本单元。
文摘:是在题录的基础上,在每条著录款项后边再加上文献内容的摘要。
4、计算机检索系统的组成:硬件、软件、数据库。
5、数据库结构:字段、记录、文档。
(关系:字段⊂记录⊂文档)字段:数据库中最基本的信息单元。
主题性字段(表达文献内容特征的字段):基本索引字段。
非主题性字段(表达文献外表特征的字段):辅助索引字段。
记录:由若干个字段组成,是计算机可存取的基本单元。
文档:文献数据库的结构一般由三个文档组成,即顺排文档(数据库的核心文档)、倒排文档和索引文档。
6、信息标引:分类标引:赋予信息分类号标识的标引过程。
主题标引:赋予信息主题词标识的标引过程。
7、信息检索的基本原理:信息检索是对信息集合与需求集合的匹配与选择。
8、检索语言含义:用于描述信息系统中信息的内容特征及外部特征和表达用户信息提问的人工语言。
类型(按表达信息的特征划分):外部特征语言、内容特征语言(分类语言、主题语言)。
主题检索语言的特点:直观性、专指性、灵活性。
9、主题语言的类型(按照主题词的选词方式划分):标题词语言(规范化、先组式)、叙词语言(规范化、后组式)、关键词语言(非规范化、后组式)。
标题语言:以标题作为表达文献内容和检索依据、完全先组式规范化的检索语言。
10、规范化处理:指对于具有语言语义关系的词语,按照一定的要求进行选择并限定其内容含义,以保证语词具有单义性,即一个主题词表达某种概念的唯一性,不能出现一词多义或多词一意现象。
11、分类语言的优、缺点:优点:(1)较好地体现学科的系统性;(2)较好地反映各类目间的纵向层次关系;(3)分类语言是图书馆图书组织排架的依据;(4)查全率较高。
缺点:(1)直线性(难以实现交叉表达);(2)需要熟悉分类法,较难用;(3)适应性差,修改困难。
12、《中国图书馆分类法》:当今国内图书馆使用最广泛的分类法体系,简称《中图法》。
五个基本部类(22基本大类):马列主义、毛泽东思想、邓小平理论,哲学,社会科学(9大类),自然科学(10大类),综合性图书。
标记符号:英文字母与阿拉伯数字相结合的混合制代码。
等级划分:分类号位数没增加一位,分类级别便低一级。
13、国内外常用的分类法有哪些?第三章1、布尔逻辑算符(1)逻辑与:用“and”或“*”连接检索概念。
特点:缩小检索范围、提高查准率。
逻辑或:用“or”或“+”连接检索概念。
特点:扩大检索范围、提高查全率。
逻辑非:用“not”或“—”连接检索概念。
特点:缩小命中文献范围,提高检索专指度。
(2)执行顺序:①同级运算自左向右进行。
(只有一种符号的情况)②多种混合使用,执行顺序为:逻辑非、逻辑与、逻辑或。
③有括号的情况下,先执行括号内的运算。
2、截词检索算符类型(1)按照截词符的位置划分:前截词、后截词、前后截词、中间截词。
(2)按截断字符数划分:有限截断(?)、无限截断(*)。
★无限截词符“*”不能作为中间截词符。
作用:(1)无限截词符:①前截词:检索*computer可以检索出数据库索引文档中储存的以computer 结尾的词。
②后截词:检索computer*可以检索出数据库索引文档中储存的以computer 结尾的词。
③前后截词:检索*computer*可检索出含有computer词干的所有词汇的文献。
(2)有限截词符:一个“?”只能代表0~1个字符,n个“?”可以代表0~n个字符。
例:输入检索词computer?可检出computer和computers的文献。
输入检索词computer???可检出computer、computers、computerize的文献。
输入检索词work??可以检索出含有work、works、worker的文献。
中间截词:wom?n可检出woman和women的文献。
3、位置算符(1)(W)与(nW)算符:(W)算符:①(W)算符是with的缩写,可简写为()。
②(W)算符具严格限制了检索词相邻和前后位置关系。
两检索词之间除可以有一个空格、一个标点符号或一个连字符外,不得夹有任何其他单词或字母,并且两检索词的顺序不能颠倒。
例:biological(W)control相当于检索biological control.CD (W) ROM相当于检索CD ROM或CD-ROM.(nW)算符:允许在连接的两个检索词之间插入最多n个单元词,并且两检索词的顺序不能颠倒。
例:wear (1W) material相当于检索wear materials、wear of materials 等。
(2)(N)与(nN)算符:(N)算符:两检索词之间除可以有一个空格、一个标点符号或一个连字符外,不得插入任何其他单词或字母,但两检索词的前后顺序可以颠倒。
例:robot (N) control表示可以检索出robot control或者control robot的文献。
(nN)算符:(nN)表示两词间可插入最多n个词,并且检索词的前后顺序可以颠倒。
例:control (1N) system表示可以检索出control system、control of system、control in system、system of control、system without control等词语的文献。
★检索结果范围:A+B > A*B > A (nN) B > A ()B。
4、字段检索(与实验(具体数据库)结合)P525、短语检索算符:短语检索算符用双引号(“”)表示,短语检索表示检索出与“”内形式完全相同的短语,主要用于提高检索的精度和准确度。
5、搜索引擎定义:搜索引擎是查找互联网上信息资源的工具,也称网络检索工具。
检索方式:分类检索、关键词检索。
分类(按工作方式进行划分):索引型搜索引擎、元搜索引擎、目录式搜索引擎。
6、第三章 第二节 P54~P597、信息检索流程:分析检索需求,选择检索字段、选择检索工具,确定检索途径、选择检索词,构建检索提问式,实施检索并调整检索提问式,输出检索结果。
8、 P63 看一看9、检索表达式的构建 P66 (参照课题分析P303)10、习题 P72第五章 专利及专利文献(见PPT )1、专利概念2、专利基本特性(独占性、时间性、地域性)3、专利类型4、我国授予专利权的基本条件(新颖性、创造性、实用性)5、专利号(申请号)组成6、可供检索专利的数据库或网站7、检索平台通用规则(掌握一个检索平台(或数据库),可从哪几个方面入手)P808、三大中文数据库平台运算符配备情况P839、运算符在维普数据库平台不同检索方式中表现形式P83第九章1、评价信息检索效率的指标:查全率、查准率。