信息检索

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
40、广义的 专利具有三个方面的含义:专利权、专利发明和专利文献。
二、 按信息的表现形式划分:(1)文献型信息源;(2)非文献型信息源。非文献型信息源包括电子信息源、数值型信息源、声像型信息源、多媒体信息源以及实例与口头信息源。
6、信息出版类型:是指记录有知识的文献出版类型。
7、信息检索:是指将信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户的需要找出有关信息的过程。它的全过程又称为信息存储与检索。
19、主题语言类主要有标题词语言、叙词语言(后组式)、关键词语言和单元词语言等。它们统称为主题法系统。
关键词(非规范化)语言指在文献标题、摘要或正文中出现的,对表达文献内容具有实质意义,能作为检索入口的,起关键性描述作用的词汇。
20、检索语言的特点:检索语言不同于自然语言,它所表述的概念只是一种解释,不允许一词多义、多词一义而使概念的表述模糊不清。
25、数据库的结构:数据库是以文档的形式组织起来的。(1)记录(record):文档的基本组成单位。记录是作为一个单位来处理的有关数据的集合,是对某一实体的属性进行描述的结果。 例如文献的题名、作者、发表时间、语种、分类号、主题词等;(2)字段(field):是记录的下级数据单位,用来描述实体的某一属性。 例如文献号字段、题名字段、作者字段、出版字段、语种字段、文摘字段、主题词字段、分类号字段等;每个字段的具体内容成为字段值或属性值。字段的设计决定了检索点的数量。(3)文档(file)若干个记录构成的信息集合称为文档。
32、常用基本检索字段:(1)TI(题名字段):找出题名中含有world-wide-web的记录(用法举例:S world(w)wide(w)web/TI);(2)AB(文摘字段):找出文摘中含有Academic Library记录(S Academic(w)Library/AB);(3)DE(主题词字段):找出主题词字段中含有Internet的记录(S Internet/DE)。
分类语言是用分类号码来表达各种概念。
18、《中图法》:全称《中国图书馆分类法》,是我国一部大型的综合性图书分类法,它的主体是它的类目表,包括简表、详表、辅助表和编制说明,此外还有索引。《中图法》采用“五分法”形成五大部类。《中图法》属于等级列举式分类法。
主题语言用词语来表达各种概念,将各种概念按字序排列。(从事物本身出发进行检索)
1、文献:为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录在唱片上,或存储在磁盘上。这种附着在各种载体上的记录统称为文献。
2、文献由四要素构成,即文献信息、文献载体、符号系统和记录方法。
3、信息、知识和文献三者之间的关系:由信息、知识和文献的概念可知,三者之间是密切相关的。信息是物质存在的方式、形式和运动规律的表征。人脑对事物属性的感知形成信息;人们对信息集合加工、整理形成系统化,表现形成人类社会实践的知识;知识被记录在载体上形成文献,文献被人类广泛传播、运用在理论和实践中又产生新的信息、知识和文献。如此循环,不断创新,形成各种各样的新知识,从而推动人类社会前进。由此可见,信息、知识、文献在社会系统中表现出一种不间断的延续性。
4、具有信息素质的人主要具有以下几个方面的能力:(1)运用信息工具;(2)获取信息;(3)处理信息;(4)生成信息;(5)创造信息;(6)信息增效;(7)信息协作;(8)信息免疫。
5、信息资源的构成可从不同的层次和角度来划分:
一、按照信息的出版和加工形式划分:1 图书;2 报刊;3 会议文献;4 专利文献;5 科技报告;6 学位论文;7 技术档案;8 产品资料;9 标准文献;10 政府出版物。
词汇是登录在分类表、词表中的全部标识。语法是指如何创造和运用标识来正确表达文献内容和信息需要,以有效的实现信息检索的整套规则。
17、检索语言 按其反应信息 内、外部特征的不同可分为:分类语言、主题语言、名称语言和代码语言四大类。
分类语言和主题语言特点是表示文献实质意义的内容特征标识;名称语言和代码语言特点是表示文献外表特征的标识。
一、 按照信息加工层次划分:按信息加工程度可将信息分为一次文献、二次文献、三次文献。(1)一次文献即以作者本人的生产与科研工作成果为依据而撰写并已公开发行进入社会流通使用的原始文献。例如专著、学术论文、科技报告、会议论文、专利文献、学位论文等;特点:具有学术上的新观点、新发明、新技术、新成果,提供了新的知识信息,是创造性地劳动结晶,有直接参考、借鉴和使用的价值,是人们检索和利用的主要目标。(2)二次文献即将大量、分散、无序的一次文献收集起来。按照一定的方法进行整理、浓缩和加工,使之系统化而形成各种目录、索引和文摘,即编制成具有多种检索途径的检索工具。二次文献又称为检索性文献;仅是对一次文献进行系统化的压缩,无新的知识产生,具有汇集性,检索性的特点。(3)三次文献即根据一定的目的和需求,在大量利用一次、二次文献的基础上,对有关知识进行综合、分析、提炼、重组而再生的信息资源。例如词典、手册、百科全书、年鉴、各种教科书及综述等。具有综合性高、针对性强、系统性好、知识信息面广的特点。
常用的布尔逻辑算符有:逻辑或“or”、逻辑与“and”、逻辑非“not”三种。
(1)逻辑或“or”:在检索表达式中通常用“+”表示。使用逻辑或 可使检索命中结果的范围扩大,达到了扩检的目的,从而提高查全率。
(2)逻辑与“and”:在检索表达式中常用“*”来表示。增强了查找的专指性,可提高查准率。
33、常用辅助检索字段:文献类型(字段标识符:DT)(用法举例:S DT=review);杂志名称(JN)(S JN=new york times);语种(LA)(S LA=french);出版日期(PD)(S PD=960412);出版年(PY)(S PY=1997);销售额(SA)(S SA=>5m);更新日期(UD)(S UD=9999)。
38、《工程索引》的出版形式:EI按照载体形式分为印刷版、光盘版和网络版三种形式。
39、专利:(是指在建立了专利制度的国家,某一发明创造由发明人或设计人向专利主管部门提出申请,经审查批准,授予在一定年限内享有独占该发明创造的权利,并在法律上受到保护,任何人不得侵犯。)
这种受法律保护、技术专有的权利,称为专利。
(3)逻辑非“not”:在检索表达式中通常用“—”来表示。用来排除指定的某类信息,以达到提高查准率的目的。
28、截词检索:主要是利用检索词的词干或不完整的词型进行检索,其方法是在词干后可能变化的字符处加上截词符号“?”。
29、截词方式:无限截词和有限截词两种。
30、位置检索是检索词在原始信息中相对位置的限定性检索。位置检索由位置算符表达。
26、按数据库包括的信息内容可分为:(1)参考数据库:包括 书目数据库 和指南数据库;(2)源数据库;(3)混合数据库。
27.检索技术:是指结构化信息和非结构化信息中获取满足检索要求的信息的技术与方法。
27、常用的检索技术:布尔逻辑检索、截词检索、位置检索加权检索、全文检索、超文本检索等。
8、信息检索的基本原理:对信息集合与需求集合的匹配与选择。1
9、信息检索的基本方式可分为传统信息检索和现代信息检索。传统信息检索,简称“手检”;现代信息检索,简称“机检”。
10、信息检索的研究范围包括一切与信息存储与检索有关的系统、过程、理论和方法。
11.信息检索系统是由一定的设备和信息集合构成的,面向一定的用户,具有信息采集、组织、存储、选择和传播等功能。
(1)(W)——“With”:表示两侧的检索词必须前后邻接,顺序不得颠倒,两词之间不能插入任何词,但允许空格或连字符号。
(2)(nW)——“n Word”:表示两侧的检索词之间最多允许插入n个词,但两个检索词的词序不允许颠倒。
(3)(N)——“near”:表示两侧的检索词必须前后紧相邻,中间不能插入其他字符。但两词次序可颠倒。
(4)(nN)——“n Near”:表示两侧的检索词之间最多可拥有n个单词,且检索词的次序可颠倒。
(5)(S)——“Subfield”:要求参加运算的检索词必须出现在同一自然句中,两词词序不受限制,词之间可含任意数量的词。
31、DIALOG系统是目前世界上最大的国际性联机检索服务机构。
35、中国知网共有“初级检索”、“高级检索”、“专业检索”及“期刊导航”四种检索方式。原名为:中国期刊网
36、《中国期刊全文数据库》提供的检索项(检索途径)有:篇名、主题、关键词、摘要、作者、第一作者、单位、刊名、参考文献、全文、年、期、基金、中图分类号、ISSN、统一刊号。
37、美国《工程索引》,简称EI。EI是世界上著名的三大检索工具之一,也是国内外工程技术人员常使用的一种检索工具。
14、每种检索工具
检索工具的结构:编辑说明与使用凡例部分、分类表和主题词表部分、正文部分、索引部分、附录 5部分组成的。
15、检索语言,又称标引语言、索引语言,信息检索语言等,是根据检索需要而编制的一种人工语言。检索语言是信息检索与信息存储的一种约定语言。
16、施应注意的问题:(1)先国内后国外;(2)检索时多选几个同义词、近义词;(3)巧妙地利用上下位词的关系;(4)尽量避免从字面出发选择检索词;(5)变换检索词的词序。
24、对检索结果的分析评价指标有:(1)查全率:查全率是对所需信息被检出程度的量度;(2)查准率:查准率是衡量检索系统拒绝非相关信息的能力。(3)相关性。是用户判断信息与信息需求之间关系的标准。
11、计算机信息检索系统根据内容不同可划分为:联机检索系统、光盘检索系统 和网络检索系统。
12、检索工具按用途可分为两大类:指示型检索工具(二次文献)和提供具体信息的参考型检索工具(三次文献)。
13、检索工具按编著方式可分为:(1)目录型检索工具。目录主要报道实有的文献或收藏文献的情况,以一个完整的出版单位作为著录的基本单位。此类检索工具对于查找、索取原始文献具有重要作用;(2)题录型检索工具。题录是用来描述某一文献的外表特征并由一组著录项目构成的一条文献记录。题录通常以一个内容上独立的文献单元为基本著录单位。题录实质上是一种不含文摘正文的文摘款目,在揭示文献内容的深度方面,题录比目录做得深入一些,但又比文摘款目浅;(3)文摘型检索工具。文摘是指对文献的内容简洁而又正确的摘录,供人们浏览和查用,使读者能以较少的时间和精力掌握有关文献的基本内容而进行系统查找。文摘型检索工具是系统报道、积累和检索科技文献的主要工具。(4)索引型检索工具。包括内容检索和篇章检索。其主要特点是加工简单,报道量大。以快和全占有一定的优势。
34、截词检索方法:(1)无限截词:找出所有以transport为词根的记录,transportation,transporting,transported,transportable等均可检出(样例:S transport?);(2)有限截词:找出以transport为词根或后面仅有三个字母的词,例如,transporting,transport(S transport???)。(3)词间截词
21、检索语言的功能是通过检索语言标引文献的主题概念,不仅能简明地提示文献所包含的信息内容及其外表特征,而且还能将同一主题概念的文献集中在一起,使文献的存储集中化、系统化、组织化,以便于进行有规律的检索。
22、检索程序包括:(1)分析课题;(2)选择检索系统和数据库;(3)确定检索途径和检索词;(4)构建检索表达式;(5)检索并调整检索策略;(6)输出检索结果。
相关文档
最新文档