信息检索复习资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息检索第一讲
一、基本概念
1、信息:生物以及具有自动控制系统的机器,通过感觉器官和相应的设备与外界进行交换的一切内容。信息具有五个基本特种:普遍性、依附性、传递性、信息价值的不定、共享性
2、知识:是人们对客观事物的认识和经验总和。
3、文献:是用文字、图形、符号、音频、视频等技术手段记录人类知识的一种载体。
4、情报:是指运用一定的形式,传递给用户,并产生效益的知识或消息。具有:知识性、传递性、效益性
5、信息资源
广义上是指信息活动中各种要素的总称,既包含信息本身,也包括信息相关的人员、设备、技术和资金等因素;
狭义上是指各种载体和形式的信息的集合,包括文字、音像、印刷品、电子信息、数据库等。
文献是最主要的信息资源。
一、信息类型
1、按照加工程度:
零次信息:草稿、笔记、会议记录等
一次信息:期刊论文、专利说明、会议论文、科技报告、学位论文
二次信息:目录、索引、文摘、新书通报等
三次信息:词典、名录、手册、年鉴、书目、评论、专著、教科书、论文丛集、百科全书等
2、按照出版形式以及载体:
图书
连续出版物:期刊、报纸、年度出版物等
特种文献:科技报告、会议文献、政府出版物、专利文献、标准文献、公司产品资料、学位论文、档案资料等
1)图书:
ISBN 国际标准书号
例如:ISBN978-7-302-20062-8
在参考文献列表里,图书著录格式如下
著者.书名[M]. 版本. 出版地:出版者,出版时间.
(多作者用逗号分开,超过3个者用“等”)
叶继元.信息检索导论.北京:高等教育出版社,1995.
2)期刊:
是最重要的信息源。
国际标准刊号( ISSN )
期刊著录格式:
作者. 题名[J].刊物名称,年代,卷数(期数):页数
刘志强.我国农业生态环境可持续发展评价及对策[J].农业系统科学与综合研究,2001,17(3):24~26.
核心期刊:少数刊载某一学科大量高质量专业论文的期刊。
三、我国信息系统体系结构
图书馆系统(高校图书馆、公共图书馆、科学研究系统图书馆)、科技信息服务系统、档案系统、专利系统、标准系统
图书馆系统主要服务方式有:
文献外借服务(如个人外借、预约借书、馆际互借等)、
文献阅览服务、
文献复制服务、
信息咨询与检索服务、
用户教育与辅导、
信息研究服务、
网上信息服务(如网上公共目录查询、网上预约服务、网上咨询服务、利用电子邮件提供信息服务、文献传递服务)
信息检索第二讲
1、信息检索的概念
狭义的信息检索是指依据一定的方法,从已经组织好的大量有关文献信息集合中,查找并获取特定的相关文献信息的过程。
广义的检索包括信息的存储和检索两个过程
2、信息检索的作用
信息检索是获取知识的捷径
信息检索是科学研究的向导
信息检索是终身教育的基础
3、信息检索的类型:文献检索、全文检索、数据检索、事实检索、多媒体检索、图像检索、超文本检索
4、检索语言的作用
•组织文献信息的著手点
•检索文献信息的入口
检索语言主要由文献特征构成。
1)描述文献的外表特征:题名、责任者、标准编号(ISBN、ISSN、专利号等)、出版社、出版时间、参考文献、分类号
2)描述文献内容特征:学科分类、主题、观点、见解、结论
5、检索方法
常规法和引文法
常规法包括:顺查法、倒查法、时间抽样法
引文法包括:追溯法和检索引文法
6、检索途径:
一般来讲分为:主题途径、分类途径、著者途径和其他途径。
1)主题途径:
是采用反映文献主题概念的检索词作为检索入口的一种检索途径,也是最常用、最重要的检索途径。
主题词就是表达主题概念的词汇。广义主题词包括关键词、主题词、标题词、叙词。
2)分类途径:
分类途径就是人们常说的分类号检索。这种检索是根据信息内容的学科分类来进行的。一般说来,可以提高查全率。
3)著者途径:
著者途径是指根据已知文献著者来查找文献的途径,它根据的是著者索引,包括个人著者索引和机关团体索引,排列规则是“姓+名”次序。
7、信息检索的程序
是指根据课题要求,选择相应的信息检索工具及系统,采用适当的途径及技术,查找所需文献信息的过程。信息检索的程序一般可以分为:
1)分析研究课题
2)选择检索工具或数据库
3)确定检索途径
4)编制检索式
5)实施检索
6)原始文献的获取
8、计算机检索技术
布尔逻辑算符组配检索
逻辑“或”(和)
→→扩大查找范围
用符号“or”或“+”表示,其逻辑表达式为:
A or
B 或 A+B
其意义为检索记录中凡含有检索词A或检索词B,
或同时含有检索词A和B的,均为命中文献。
逻辑“与”
→→缩小查找范围
用符号“and”或“*”表示,其逻辑表达式为:
A *
B 或 A and B
其意义为检索记录中必须同时含有检索词A和B的文献,才算命中文献。逻辑“非”
用符号“not”或“-”,其逻辑表达式为:
A not
B 或 A-B
其意义为:检索记录中含有检索词A,但不能
含有检索词B的文献,才算命中文献。
注:a检出的相关文献量
b检出的不相关文献量
c未检出的相关文献量
1. 查全率
查全率(R )= ——×100%
查全率是对所需信息被检出程度的信息量指标。
2. 查准率
查准率(P )= ——×100%
查准率是衡量拒绝非相关信息的指标。
9、影响检索效率的因素
数据库质量(客观因素)
1)数据库搜集信息的数量与质量
2)对每条信息揭示的深度与广度,著录标引的质量(字段的数量,主题词的信息标引网罗度)
3)检索途径及检索字段的数量