第2次课知识点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第2讲知识点:
1、文献标引简称标引。针对文献的情报内容及某些外表特征,赋于文献检索标识的过程。
2、文献特征
内容特征(即内部特征)主要包括:分类号(中图分类号、专利分类号、标准文献分类号等)、主题词、关键词、摘要、主题等。
外部特征主要包括:书名、刊名、篇名、作者、机构名称、单位名称、出版年代、出版地点、出版机构、ISBN、ISSN、专利号(与专利分类号区分开来)、标准号(与标准分类号区分开来)、索书号等。
3、检索语言的两大类:分类法和主题法,分类法侧重于族性检索,主题法侧重于特性检索
4、主题法
实现主题词检索需利用专门的主题词表(如《汉语主题词表》)对文献进行主题标引,即赋予一篇文献若干个“主题词”,这些主题词是经过规范化处理的,属于人工语言。例如:自行车、单车、脚踏车这三个词在汉语主题词表中,规定只用“自行车”这一规范化的语词作为主题词。对于含有单车、脚踏车这些语词的文献,一律用“自行车”进行标引。
用户在具有主题词检索功能的数据库中检索时,只要采用“自行车”这一个规范化的主题词,能就检索到所有任意含有自行车、单车、脚踏的文献。
主题检索语言:是使用一组名词术语作为检索标识的一类信息检索语言。它侧重于特性检索。
与分类检索语言用分类号作为检索标识所不同的是,主题检索语言是用语词作为检索标识的。实现主题词检索需利用专门的主题词表(如《汉语主题词表》)对文献进行主题标引,即赋予一篇文献若干个“主题词”,这些主题词是经过规范化处理的,属于人工语言。
5、关键词检索虽然也属于主题检索,但关键词是自然语言,它没有经过规范化的处理。
中文数据库都不能实现规范化的主题词检索,“主题”字段,不等同于“主题词”字段,该“主题”字段是指在篇名、关键词、摘要这三个字段中的任何一个字段中检索。
6、《中国图书馆分类法》,简称中图法:国内95%以上的图书馆都采用它。中图分类法以学
科属性作为分类依据,分五大部类和22个基本大类,按字母顺序和数字大小的顺序查找。
采取的是汉语拼音字母与阿拉伯数字相结合的混合编码制度,例如:弹簧的中图分类号是“TH135”。
分类号X56 的类名是什么?
检索步骤:图书馆主页——馆藏目录——选分类号、输入X56——检索,结果显示:“食物污染及其防治”
7、索书号:图书馆藏书排架用的编码,通过索书号能准确找到图书在书架上的位置。我馆
的索书号是由中图分类号加上著者号(同种书区分号)组成的。如:TK42/L73。我馆的索书号是由中图分类号加上著者号组成的。TK42是“柴油机”这一类名的中图分类号,L73是著者号。L是著者刘瑞林的姓“刘”的首字母。
8、国际专利分类表(分类法)简称IPC,主要是对发明和实用新型专利文献进行分类。
IPC采用等级结构形式,由部、大类、小类、主组、分组逐层展开的体系构成整个分类
表。
9、分类检索语言的优点:分类语言强调知识的系统性,方便人们按学科、专业系统检索有
关文献,能够达到族性检索,可以获得较高的查全率。
10、布尔逻辑关系:逻辑与:缩小检索范围,提高查准率;逻辑或:扩大检索范围,提高查
全率;逻辑非:缩小检索范围,提高查准率。
布尔逻辑关系组配
①逻辑与:组配表交叉关系和限定关系的词;
②逻辑或:组配表同义词或表并列关系的词;
③逻辑非:组配表不包含或排除关系的词;
布尔逻辑运算顺序:()> NOT > AND > OR
11、截词检索:用截断的词的一个局部进行检索,并认为凡满足这个词局部中的所有字符(串)
的文献,都为命中的文献。目的是为了扩大检索范围,提高查全率。按截断的位置分为前截词、中间截词、后截词。不同的数据库使用的截词符不一样。多数数据库中截词符用星号*,*表示零到多个字符。
①前截词:表示前方截断,后方一致。如:*computer,结果中可能有:computer、
multicomputer、supercomputer、microcomputers、minicomputer等。
②中间截词:表示中间截断,前后一致。如:sul*ate,结果中可能有:sulphate(英式写
法)、sulfate(美式写法)。
③后截词:表示后方截断,前方一致。如:computer*,结果中可能有:computer、computerize、
computerized、computerization。
12、常用的检索方法
顺查法:是指按照事物或现象发展变化的自然过程来查找,也就是从远及近查,用于了解某一事物发展的脉络,主要用于研究面较宽的课题或综述类课题。
追溯法(引文法):通过文献后附有的已知参考文献(引文)中提供的线索来查找文献的一种方法
13、计算机检索步骤主要包括:明确检索要求和检索目标;分析检索课题;确定检索词;选
择数据库;确定检索式;调整检索策略;选择检索结果的输出格式;评价检索效果。
14、评价检索效果的最重要的指标:查全率和查准率
查全率(也叫检全率):检出的相关文献量与检索系统中相关文献总量的比率,
查准率(也叫检准率):检出的相关文献量与检出文献总量的比率
漏检率:漏检相关文献量与检索系统中相关文献总量的比率。
误检率:检出不相关的文献量与检出文献总量的比率。
查全率、查准率、漏检率、误检率的计算
例如:若利用某文献检索系统查找有关文献时,检出的文献总篇数为100篇,经审查确定其中与检索需求相关的只有60篇,假设在该系统中共有相关文献80篇.
检全率=60/80=75%; 检准率=60/100=60% 漏检率=(80-60)/80=25%;
误检率=(100-60)/100=40%。
15、影响查全率的因素主要有:
数据库是否选用齐全,单个数据库收录文献是否齐全;提取的检索词是否齐全;检索系统是否具有截词功能;检索系统是否具有模糊检索功能;检索字段选用是否恰当;逻辑组配是否恰当(该用逻辑或的时候是否用了逻辑与)。
影响查准率的因素主要有:
检索词的专指度够不够;逻辑组配是否恰当(例如:该用逻辑与的时候是否用了逻辑或);
检索系统是否具备逻辑“非”功能;是否采用位置检索;检索系统是否具有精确检索功能;
检索字段选用是否恰当(例如:该用“篇名”字段检索时是否用了“全文”字段)。
16、检索词的选择:①对相同概念的检索词要进行扩展,如要考虑同义词、简称、俗称等作为并列意义的检索词。②为保证查全,检索词要切分到不能切分为止,例如:“石榴皮多酚”,应切分成两个词:石榴皮、多酚。否则会遗漏诸如:“石榴皮总多酚”、“石榴皮中的多酚”等类似的检索结果。③一般而言,表宽泛概念的词不作为检索词,例如:研究、应用、技术、发展等。④有的检索词是由数据库指定的,而不是由作者提取的。例如,在CNKI中国学术期刊网络出版总库中检索某作者发表的核心期刊,核心期刊用Y表示。如:FI=陆森林and HX=Y
17、通过“我的图书馆”向本馆荐购图书的方式有三种:分类荐购----“征订分类浏览”荐购;
目录荐购-----“征订目录浏览”荐购;读者自荐。
18、图书馆主页涉及考点:
数据库的类型(文摘、全文、英文的还是中文的、某字段代码如AU、AB等所代表的字段是什么…)、互连网还是在校园网内使用,这些均上图书馆主页查看具体数据库
19、《中国标准文献分类法》:
国际标准分类号采用的全是数字。例如:硅树脂这一类的国际标准分类号是:“71.100.15”。
适用于所有标准文献的分类,既适用于国内标准文献的分类,也适用于国际标准文献的分类。