川大信息检索与利用复习资料整理分析解析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
四川大学信息检索与利用文史类
一、图书馆服务与资源介绍
1、四川大学图书馆,由文理、工学、医学、江安四个分馆组成。
川大图书馆主页的数据库:超星、CNKI、维普、万方、SCI、SpringerLinker
2、索取号:
索取号是某种图书或期刊在图书馆中位置的代号,是图书馆进行藏书组织、排架、流通和清点的主要依据之一,同时也是读者查找文献资源的依据。绝大多数的图书馆使用分类排架号作为索取号。
一般根据文献类型的不同,称图书的索取号为索书号、期刊的索取号为索刊号。
(1)索书号:
我馆索书号标签粘贴在书脊距底部约一寸的位置。
本馆索书号由以下两个部分构成:中图法分类号;同类区分号。
(2)索刊号
过刊索刊号粘贴或烫印在书脊距底部约5cm的位置,
现刊索刊号粘贴或手写在期刊封面下部。
3、《中图法》分类(5个基本部类,22个基本大类)
A 马克思主义、列宁主义、毛泽东思想、邓小平理论
B 哲学、宗教
C 社会科学总论;F 经济
N 自然科学总论;T 工业技术(TB 一般工业技术)
Z 综合性图书
4、与望江、华西分馆的借还书
(1)读者在就近分馆凭有效借阅证提交借书申请单;
(2)四个工作日内读者申请的图书由图书所属分馆传递到提交借书申请单的分馆,读者到提交借书申请单的分馆凭借书申请单和有效借阅证办理借阅手续;
(3)读者申请的图书在该分馆保留两个工作日,两个工作日后读者未来取书,该书被送回图书所属分馆。
1.3 信息检索的概念和作用
1、信息检索的概念
信息检索通常是指从以一定方式组成的信息集合中,查找特定用户所需信息的方法与过程。广义的信息检索包括信息的存储与检索。
2、信息检索的基本原理
(1)信息检索是文献交流的重要环节;
(2)文献存储的可逆性是信息检索的基础
3、信息检索的类型
文献检索数据检索事实检索
1.4 信息检索语言
信息检索语言的概念
是人们在加工、储存及检索信息时所使用的标识符号。
信息检索语言的分类
自然语言受控语言
几种常用的分类语言
中图法(中国图书馆分类法);杜威十进分类法DDC
1.6 信息检索工具和检索系统
计算机信息检索的类型:
参考数据库;源数据库/联机检索系统(如DIALOG);光盘数据库系统;网络信息检索系统
1.7 信息检索效果及评价
查全率查准率漏检率误检率其他
第2章信息检索技术及其应用
1、布尔算符:用来规定检索概念或检索词之间相互逻辑关系的算符。
逻辑“与”:AND(或*);逻辑“或”:OR(或+);逻辑“非”:NOT(或–)
2 位置算符/词位算符:用于限定词与词之间的位置关系,以提高查准率。
当检索词为词组形式时,或两个检索词之间可能被其他词或标点符号隔开时,均应使用位置算符。
(1)W - With
①W是With的缩写,表示在此算符两侧的检索词必须按输入时的前后顺序排列,不能颠倒。所连接的词之间除可以有一个空格、标点或连接号外不得夹有任何其他单词或字母。
例:intelligent (W) robot?
②Wn( 或nW) 表示在此算符两侧的检索词必须按输入时的前后顺序排列,不能颠倒。但允许在连接的两个词之间最多插入n个单元词。
例:intelligent w1 robot*
(2)N - Near
①N是Near的缩写,表示此算符两侧的检索词必须紧密相连,所连接的词之间不允许插入任何其他单词或字母。但词序可以颠倒。
例:intelligent NEAR robot*
②Nn (或nN)表示在两个检索词之间最多可插入n个单词,且两词的词序任意。
例:intelligent N1 robot*
3、截词检索:
截词是指将检索词在适当的地方截断,截词检索是用截断词的一个局部进行的检索,凡是满足这
个截词所有字符(串)的记录,系统都为命中。
截词检索在西文数据库中广泛使用。是在词干后可能变化的位置加上截词符号。检索词的单复数形式,同一词英、美不同拼法,词根相同的词都可用截词检索。这样既可减少检索词的输入量,又可扩大查找范围,提高查全率。
①按截词位置分:前截断、后截断、中截断;
②按截词的字符数量分:非限制截断、限制截断。
注:表示截词的截断符号,各检索系统有不同的规定,没有统一标准。
(1)后截断
后截断是在检索词词干后面加截词符,表示不限制或限制词尾可变化的字符数,即查找词干相同的所有词。从检索性质上讲,后截断是前方一致检索。
①非限制截断:是在检索词词干后面加一个截词符,表示不限制词尾可变化的字符位数,即查找词干相同的所有词。即允许其后可带有任何字符且数量不限。
例:comput? 相当于查找compute、computing、computerized、computationally……
注:不宜将词截得过短,否则容易造成误检。
②限制截断:是在检索词词干后面加若干个截词符,表示限制可变化的字符数。
例:fib?? 相当于查找fiber 或fibre ……
(2)中截断(通配符或屏蔽)
是把截断符号置于一个检索词的中间,对词中间出现变化的字符数加以限定。一般中截断仅允许有限截断。
例:organi#ation, 可检索到包含organization和organisation的记录。
①一个?,代表零个或任意个字符。
例:colo?r 可检索到包含color、colour、colonizer、colorimeter的记录。
②一个? 和数字,其中的数字代表可替换的字符数。
例:colo?1r, 只能检索到包含colour的记录。
4、字段检索:指定检索词出现的字段,被指定的字段也称检索入口,检索时,系统只对指定字段进行匹配运算,提高了效率和查准率。
西文数据库,字段检索常用代码来表示,如:作者AU,机构名称CS,文摘AB,题名TI,关键词KW。
四、学位论文数据库
1、学位论文是本科生和研究生从事学习和科学研究活动的学术论文。
(1)与一般论文的写作比较,质量要求更高,结构更为严谨。
(2)与期刊论文的检索比较,有以下特殊的检索字段(入口):导师、第一导师、导师单位、论文级别、学科专业名称、学位授予单位等。