信息检索复习大纲
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息检索复习大纲
第一章
1.、信息的含义:信息是客观事物经过感知或认识后的再现。
2、知识的含义:知识是人们通过客观实践对客观事物及运动过程和规律的认识。
3、文献的含义:文献是记录有知识的一切载体
知识、载体、记录是构成文献的三个基本要素。
4、信息资源的含义:信息资源是经过人类筛选、组织、加工,并可以存取和能
够满足人类需求的各种媒介信息的集合。
5 、图书:图书是作者围绕一个中心主题进行研究和探索,比较成熟的、定型的,
而不定期出版的出版物。
6、连续出版物的概念:连续出版物是一种具有统一名称、固定版式、统一开本、
连续编号,汇集多位著者的多篇著述,定期不定期编辑发行的出版物。
7、学位论文是大学生或研究生为取得学位资格而提交的学术论文。
8、会议文献主要是指在国内外各类会议上宣读或交流的论文、报告或其他有关
资料。
9、专利文献是实行专利制度的国家和地区及国际性专利组织在审批专利过程中
产生的官方文件及其出版物的总称。
10、标准文献是为了在一定范围内获得最佳秩序,经协商一致制定并由公认机构
批准,共同使用和重复使用的一种规范性文件(GB/T20001-2000)。
11、信息素质的含义:利用大量的信息工具及主要信息源使问题得到解答的技术
和技能。
信息素质的内涵包括三个方面:信息意识、信息能力、信息道德。
12、信息能力的含义:指人们有效利用信息技术和信息工具获取信息、加工处理
信息以及创造和交流新信息的能力。
主要包括以下内容:信息需求分析和表达能力、信息获取能力、信息分析和处理能力、信息利用能力
13、互联网的应用包括:信息获取、交流沟通、网络娱乐、商务交易。
第二章
1、信息检索广义概念:是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,全称“信息的存储与检索”。
2、信息检索过程::(1)分析检索需求;(2)确定检索标示;(3)选择检索系统和检索工具;(4)实施检索操作;(5)索取原始文献。
3信息检索按检索对象内容划分包括:文献检索、数据检索、事实检索、多媒体检索。
4、手工信息检索直接发源于图书馆的参考咨询工作和文摘索引工作。
5、分类语言是一种按学科范畴和体系来划分事物的语言,它是以数字、字母符
号对类目进行标识的一种语言体系,也称分类法。
主要包括体系分类语言和组配分类语言两种。
6、主题检索语言是指描述文献主题的语词标识并按字顺序列排检的检索语言。
类型:标题词语言、单元词语言、叙词语言、关键词语言
(1)标题词语言是用规范化的自然语言词做标题,直接表达文献主题概念,按照标题字顺排列,并用参照系统显示标题之间关系的一种主题法。
(2)叙词语言又称主题词语言,是以表达文献主题内容的概念单元为基础,经过规范化处理,可以进行逻辑组配的一种主题语言。
是一种后组式的人工语言。
7、网络信息检索语言是自然语言,自然语言是指直接取自文献本身,不经过加工和规范的语言。
8、布尔逻辑检索:and/or/not
①逻辑“或”(OR)运算符:也可用“+ ”代替,基本作用是扩大检索范围,增加命中文献量,提高文献的查全率。
②逻辑“与”(AND)运算符:也可用“*”代替,基本作用是对检索词加以限定,逐步缩小检索范围,提高检索结果的查准率。
③逻辑“非”(NOT)运算符:也可用“—”代替,基本作用是缩小检索范围,但并不一定能提高文献命中的准确性,一般只起到减少文献输出量的作用。
“
9、位置检索:(位置检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的关系,并且可以不依赖叙词表而直接使用自由词的检索方法。
)
(1)(W)—With
(W)表示在此算符两侧的检索词必须按此前后的顺序排列,顺序不许颠倒,而且两个检索词之间不许有其他的词或字母,但允许有空格和标点符号。
如,information(W)retrieval可检索出information retrieval, information-retrieval.
(2)(nW)—nWord
(nW)表示在此算符两侧的检索词之间允许插入n个(最大数量)实词或虚词(非用词),两个检索词的词序不能颠倒。
例如,electronic(1W)resources,可检索出electronic resources,electronic information resources。
(3)(N)__Near
由(N)连接的检索项在记录中出现的顺序可以调换,即查找两个连在一起的单词. 例如,junior(N)high可检索出junior high, high junior.
(4)(nN)__nNear
(nN)表示两个词位置可以颠倒,两个词间插入词的最多数目是n个.
10、查全率:检出的符合要求的相关文献占全部相关文献的比例。
(漏检率)
11、查准率:检出的符合条件的相关文献占检出的全部文献的比例。
(误检率)
12、检索策略定义:检索策略是为实现检索目标而制定的全盘计划和方案,是对整个检索过程的谋划和指导。
第三章
1、检索工具的含义:检索工具是指用以存储、报道和为查找信息线索提供依据的工具。
2、检索工具特点:1、在内容上具有完整性;
2、在编排方法上具有易检性;
3、在目的功用上具有查考性。
3、书目的含义:是对文献信息进行著录并按照一定的次序编排而成的一种揭示与报道文献的工具。
4、索引的含义:索引将书刊内容中所论及的篇名、语词、主题等具有检索意义的项目分别摘录出来,注明出处,按照一定的方法加以编制,供人查考的检索工具。
5、世界著名引文索引(1955年美国费城科学信息研究所ISI研制开发):
SCI-科学引文索引。
“越查越旧,越查越新,越查越深”。
科学引文索引建立的宗旨
SSCI-社会科学引文索引
A&HCI-艺术与人文科学引文索引
6、文摘的含义:文摘是以简明扼要的文字摘述文献的主要内容,注明出处,并按一定方法给予编排,以供人们查阅的兼有报道作用的文献检索工具。
7、参考型检索工具特点:(1)内容的权威性;(2)信息的密集型;(3)条目的简明性;(4)编排的特殊性
8、(辞书的含义:汇集词语及事物名称,并以字或词立目,加以注音和解释文字,按一定的方式编排起来,供人们查考的一类工具书。
)
著名辞书举要:(1)《说文解字》东汉中期著名学者许慎编纂。
我国历史上第一部系统地分析字形、解释字义的字书。
(2)《康熙字典》中国古代字书发展史上第一部明确以“字典”命名的字书,是中国古代字典的代表作。
9、类书是采辑古籍中的片段或整篇资料,按类别或韵目加以编排,以供寻检、征引古代文献之用的工具书。
类书具有以下特点:
(1)在分类体系中陈列记录已有知识的资料。
(2)“分类”和“陈列”,是中国古代类书的核心要义。
(3)“区分胪列,靡所不载”。
(4)“事以类聚,事类相从”。
类书的功用:(1)系统收集参考资料;(2)查考词语与典故出处;(3)校勘考证古籍,辑录古籍佚文
10、政书的含义:是主要记载典章制度沿革变化及政治、经济、文化发展状况的
史书。
检索政书的主要工具是《十通索引》
11、“十通”:《通典》、《通志》、《文献通考》、《续通典》、《续通志》、《续文
献通考》《清朝通典》、《清朝通志》、《清朝文献通考》、《清朝
续文献通考》
12、年鉴是系统汇集上一年度内重要事件、学科进展及各项统计资料,逐年编辑、连续出版的以供人查阅利用的参考工具书。
年鉴的功能:提供时事动态消息
提供各学科研究信息
提供统计数据资料
提供实用的指南性资料
提供综述及回溯性资料
提供书刊论文线索
13、百科全书的含义:是汇总、浓缩人类所有知识门类或某一知识门类全部知识的大型参考工具书。
百科全书特点:(1)概述知识条目化;(2)条目编排词典化14、表谱的含义:表谱是查考历史大事、历史年月日与人物生卒以及官职、地域沿革的参考工具书。
它包括年表、历表和专门性表谱。
第四章
1、善本的含义:宋明时期,一般把精加校勘的书本称为善本。
1911年以前形成的各种图书称为古籍
2、《四库全书》分为经、史、子、集四部
3、“十三经”:中国封建社会儒家十三部经典著作的统称。
《周易》、《诗经》、《尚书》——“易、诗、书”;
《周礼》、《仪礼》、《礼记》——“三礼”;
《春秋左传》、《春秋公羊传》、《春秋谷梁传》——“三传”;
《论语》、《孟子》、《尔雅》、《孝经》——“论、孟、尔、孝”。
4、Google图书搜索中的图书主要有两个来源:出版商和图书馆。
5、电子图书的概念:电子图书(e-book)是指利用计算机阅读平台或手持阅读
设备阅读的数字化图书。
6、数字图书馆含义:数字图书馆是以统一的标准和规范为基础,以数字化的各
种信息为底层,以分布式海量资源库群为支撑,以职能检索技术为手段,以宽带高速网络为传输渠道的,将丰富多彩的知识领域信息传递到千家万户的虚拟图书馆。
第五章
1、核心期刊含义:核心期刊,指那些信息密度大,文载率、引文率及利用率相
对较高,代表该学科现有水平和发展方向的期刊。
2、数据库类型:(1)文献性数据库;(2)事实性数据库;(3)数据型数据库
3、总结中国期刊全文数据库和中文科技期刊数据库(课件)
4、引文索引的主要作用:(1)通过文献间的引用和被引用关系,了解某一学术
问题或观点的起源、发展、修正及最新的研究进展。
(2)评价科学文献、学术期刊和专著的学术水平的参考工具
(3)作为科研机构和科研人员绩效评价的参考工具。
(4)作为文献检索的一种工具。
5、CSSCI主要从来源文献和被引文献两个方面向用户提供信息。
第六章
1、特种文献的含义:特种文献是一种介于图书与期刊之间的似书非书、似刊非
刊的文献类型,通常在出版发行方面或获取途径方面比较特殊,因而称为特种文献。
2、会议文献的含义:会议文献主要是指在国内外各类会议上宣读或交流的论文、
报告或其他有关资料。
按会议文献出版时间分为会前文献、会间文献和会后文献。
会议文献的特点:(1)内容新颖丰富、学术水平高。
(2)信息传递及时、速度快。
(3)会议类型较多,命名复杂,文献分散。
(4)会议文献出版形式多样、出版发行灵活,通常多以书、期刊/不定期连续出版物和科技报告3种形式出版。
3、专利文献是实行专利制度的国家和地区及国际性专利组织在审批专利过程中
产生的官方文件及其出版物的总称。
特点:(1)资料新颖。
(2)内容广泛。
(3)实用性强。
(4)分类逐渐趋向统一,格式标准化。
首先将与发明专利有关的全部技术领域划分为八个部,部号分别用大写英文字母A到H来表示。
各部按等级形式再细分为大类、小类、主组、分组,形成五级分类的结构形式。
4、世界著名的科技报告是美国的四大报告:PB(Office of Publication Board)报
告;AD(ASTIA Documents)报告;NASA报告;DOE报告
5、标准文献的含义:标准是为了在一定范围内获得最佳秩序,经协商一致制定
并由公认机构批准,共同使用和重复使用的一种规范性文件(GB/T20001-2000)
6、类型
(1)按标准制定的主体分为:国家标准;区域标准;行业标准;地方标准;
企业标准
(2)按标准的成熟程度分:强制型标准和推荐型标准
7、标准文件检索途径:分类途径、主题途径和号码途径
第七章
EI、SI、SSCI总结
第八章
1、网络信息资源的特点:
●数量巨大,增长迅速
●内容丰富,形式多样
●结构复杂,分布广泛
●开放互动,共享性强
●传播迅速,利用方便
●更新速度快,动态性强
●信息使用成本低
●质量参差不齐,良莠不一
●分散无序,缺乏管理
●稳定性差,精确度低,缺乏安全保障
2、搜索引擎技术原理:(1)信息搜集(搜索器)
(2)信息处理(索引器)
(3)信息查询(检索器)
(4)信息输出(用户接口)
3、搜索引擎特点:支持全文检索
检索功能较为全面,检索方法多样
检索结果按相关性排序
查询速度快,维护更新及时
支持关键词检索和分类目录浏览查询
4、搜索引擎方法:
●布尔逻辑检索
●词组检索
●截词检索
●位置检索
●字段检索
●区分大小写检索
●自然语言检索
●多语种检索
●概念检索
●过滤检索
第九章
1、学术论文概述:学术论文也称科学论文、科研论文、研究论文,是对某一学科领域中的问题进行探讨、研究,并将形成的科学研究成果进行系统表述的文章。