文献检索课件-第二章
数据库文献检索PPT课件
➢第一章 概述
➢1.1 信息、知识、文献、情报 ➢1.2 文献的等级与主要类型 ➢1.3 主要文献信息源及其特点
1.2 文献的等级与主要类型
二、文献的主要类型
按照不同的标准,文献可以划分为不同 的类型
———————————————————————————
区别标准
➢1.1 信息、知识、文献、情报 ➢1.2 文献的等级与主要类型 ➢1
二、文献的主要类型
印刷型 印刷型文献是以纸质材料为载体,以印
刷为记录手段而形成的文献形式,是目前整 个文献中的主体。
特点:是不需要特殊设备,可以随身携 带,随处随时阅读。但存贮密度小,体积 大,占据空间大,不便于保存。
➢第一章 概述
➢1.1 信息、知识、文献、情报 ➢1.2 文献的等级与主要类型 ➢1.3 主要文献信息源及其特点
1.2 文献的等级与主要类型
二、文献的主要类型
缩微型 缩微型文献是以感光材料为载体,以照
相为记录手段而形成的一种文献形式,包 括缩微胶卷、缩微平片、缩微卡片等。
特点:体积小,便于收藏和保存,价格 便宜等,但阅读需要有较复杂的阅读设备 来支持。
➢第一章 概述
➢1.1 信息、知识、文献、情报 ➢1.2 文献的等级与主要类型 ➢1.3 主要文献信息源及其特点
1.2 文献的等级与主要类型
二、文献的主要类型
声像型 声像型文献是以磁性和感光材料为介质
记录声音、图像等信息的一种文献形式。 特点:存取快捷,可闻其声,见其形,
易理解。
➢第一章 概述
➢1.1 信息、知识、文献、情报 ➢1.2 文献的等级与主要类型 ➢1.3 主要文献信息源及其特点
文献类型
同济大学文献检索课件
第一节 计算机信息检索的发展
计算机信息检索是利用计算机查找出符合读者所需信 息的过程。 计算机信息检索的发展史 脱机信息检索阶段(20世纪50年代中期到60年代中 期) 联机信息检索阶段(20世纪60年代中期到70年代初 期) 跨国联机信息检索阶段(20世纪70年代中期至今) 光盘信息检索阶段(20世纪80年代中期至今) 网络信息检索阶段(20世纪90年代至今)
第二节 计算机信息检索的基础知识
一、计算机信息检索系统的构成
物理构成 :计算机硬件、软件、数据库 数据库构成:文档(File) 、记录(Record) 、字段(Field)
数据库
文档1
文档2
文档3
…
记录1
记录2
记录3
…
字段1
字段2
字段3
…
逻辑构成 :信息采集与建立数据库子系统、标准化子系 统、用户子系统
(SO)European Journal of Human Genetics advance online publication, 27 September 2006; doi:10.1038/sj.ejhg.5201711. PMID: 17003842 [PubMed - as supplied by publisher]
(AB)Pulmonary arterial hypertension is a progressive disease, characterised by increased proliferation of
pulmonary artery smooth muscle cells, vasoconstriction and remodelling of the vascular wall leading to right heart failure and death. The idiopathic form is rare (idiopathic arterial primary hypertension (IPAH); formerly PPH, MIM#. untranslated region in exon 7 (g.8129T>C) was observed in five patients. It appeared in 46% of the control group. The frequency of this alteration in the coding region of the VIP gene could therefore not be correlated with the appearance of IPAH. Apart from the importance of VIP signalling, genetic and/or environmental modifiers might therefore contribute to the development and perpetuation of the disease.
文献检索第二章
A
7
数据检索 :指以数值或图表表示的数据为检索对象。在检索 工具中存贮着大量的数值型数据,如各种统计数据、人口数据、 气象数据、企业或财政数据、科学技术常数等,并提供一定的 运算推导能力。它是一种确定性检索,用户通过检索可获取经 过核实、整理的数据信息。可以借此进行定量分析。而该种检 索工具系指有关参考工具书。
A
4
二、文献信息检索的基本原理
文献信息检索原理,简言之,就是检索提问标识与存贮在 检索工具中文献的标引、标识进行比较,如果两者一致,或者 工具中文献的标引标识包括了检索提问的标识,那么包含标引 标识的工具中的文献线索、数据或文献等就输出(即检索出) 这种文献信息表明为命中或切题的。
早期的文献信息检索,主要根据文献的外表和内容的特征,
采用手工方式实现检索。随着计算机技术迅猛发展,引进
了文献信息的检索,文献检索逐渐进入机械化、计算机化
新阶段,提高了检索速度,拓展了检索领域。
A
5
三、文献信息检索的类型
1.按其存贮内容与检索的对象划分
文献信息 线索检索
按其存贮内 容与检索的
对象划分
事实检索
数据检索 全文检索
A
6
文献信息线索检索 :检索工具中存贮的是目录、题录、文 摘、索引等二次文献信息,用户通过检索所得到的是有关课题 的一系列文献信息线索 。
根据一定方法,从已经存贮好的有关大量文献信息
集合中,查出特定的相关文献信息的全过程。具体而言,
就是依据特定课题的要求,利用各种检索工具如目录、
文献检索-第二章 文献检索基本知识(100829)(包括第三章)
二、检索语言的种类
1、按表达文献特征划分
描述文献外部特征 检索语言 描述文献内容特征
学科分类—分类索引
描述 文献 内容 特征
研究对象—主题索引
所包含的关键词—关键词索引
分析单元性概念—叙词索引、单元词索引 分子式、结构式—分子式索引、结构 式索引 地理位置等特种内容—经纬度索引等 特种索引
2、按结构划分 分为分类语言、主题语言、代码语 言、引文语言。
第二节 检索语言
一、检索语言的定义:
从上节“检索原理”可以看出, 必须有同样的检索标识系统(即检索 语言)来标引文献特征和检索提问, 这是文献检索成败的关键。这就要求 信息标引人员和信息用户应当具有必 要的检索语言的基本知识。
文献检索时,检索标识和用户提 问都需要用一定的语言来表达,这种 标引人员表达检索标识和信息用户(检 索者)表达检索提问所共同采用、共同 理解的语言,就是信息检索语言。
②叙词语言 它是以叙词作为文献内容标识和检 索依据的一种主题语言。叙词是从文献 的题目,摘要或正文中抽取出来,用以 表达文献基本内容的概念单元。叙词受 词表控制,词表中词与词之间无从属关 系,都是相互独立的概念单元。检索时, 利用这些概念单元组配起来,表达一个 复杂的概念。叙词语言特别适用于计算 机检索。
③关键词语言 它是以关键词作为文献内容标识和检 索依据的一种主题语言。关键词是从文献 的题目、正文或摘要中直接抽取出来,未 经规范化处理的自由词汇。关键词不受词 表控制,标引文献时根据文献内容选择恰 当的词汇进行组配,以表达文献的内容特 征。
第三节
检索工具基础知识
一、什么是检索工具? 检索工具是积累和查找文献线索的 工具。它报导文献的存在,揭示文献 的内容,帮助科技人员鉴定和选择文 献、开发和利用文献资源。检索工具 具有存贮和检索两方面的功能。
第二章 文献信息检索基础
理的名词术语,具有单一性、组配性好的特 点。
(2)分类语言:直接体现知识分类的等
级制概念标识系统;如中图分类号、杜威 十进制分类法等。
《中国图书馆图书分类法》即《中图法》
《中国图书馆图书分类法》
体现学科的系统性,反映事物的从属、 派生关系,并从上至下、从总体到局部 层层划分,展开,是一种等级分明的语 言。分为五大部类,22个大类,分别用 22个大写字母表示(其中除掉L、M、W、 Y)。
1.前方一致
也叫后截断,将截词符置于一个字符串的后面,以表示其后的有限或无 限个字符的检索。
无限截词
如: ? Physic? 可检出physic、physical、physican、physicalism
有限截词
截断两个字符
中间有 空格
如:? physic?? 可检出physic、physical、physican 截断一个字符 如:? cat? ? 可检出cat、cats
2.3 综合法
综合法又称为循环法,它是把上述两种方法
加以综合运用的方法。综合法既要利用检索 工具进行常规检索,又要利用文献后所附参 考文献进行追溯检索,分期分段地交替使用 这两种方法。即先利用检索工具(系统)检 到一批文献,再以这些文献末尾的参考目录 为线索进行查找,如此循环进行,直到满足 要求时为止。 综合法兼有常用法和追溯法的优点,可以查 得较为全面而准确的文献,是实际中采用较 多的方法。
能包含特征B。可以缩小检索范围,有利于提高查 准率。 A – B(逻辑非)
例:自由分配方面的文献(排除海南大学师生的著作) 提问式::(关键词=‘自由分配’) not (单位=‘海南大学')
三、位置算符
也叫邻近检索, 在检索词之间使用, 规定算符两边的检索词出现在记录中
文献信息检索ppt课件
和B的文献,才算命中文献。
例
3、逻辑“非”
————————————————
AB
用符号“not”或“-”,其逻辑表达式为: A not B 或 A-B
其意义为:检索记录中含有检索词A,但不能 含有检索词B的文献,才算命中文献。
例
逻辑提问式(布尔逻辑组配):
计算机检索的基本技术,主要通过逻辑运算 符(布尔算符)“与(and,*)”、“或 (or,+)”、 “非(not,-)”等将检索词连接 的提问式。
注意:优先级为not, and, or,用括号保证优 先权;运算符两侧必须各有一个空格(半角)。
实例:
膜法提取甘露醇中的微生物污染控制 (膜法+膜集成)*甘露醇*(细菌污染+微生物污 染)
写出以下检索词,并用上述布尔逻辑符写出检 索式:
固氮和固碳的生化机理或基因机制
(二)、位置算符
在检索词之间使用,规定算符两边的检索词出现 在记录中的的位置,以提高检准率。比如:如果 不用with位置算符,则词组可能被系统识别为逻辑 运算,protein disulfide isomerase(蛋白质二 硫键异构酶)可能被识别成“protein AND disulfide AND isomerase”。尤其是出现数字等 符号时不易识别成词组。
AB
用符号“or”或“+”表示,其逻辑表达式为:
A or B
或 A+B
其意义为检索记录中凡含有检索词A或检索词B,
或同时含有检索词A和B的,均为命中文献。
例:
2、逻辑“与”
————————————————
AB
用符号“and”或“*”表示,其逻辑表达式为:
A*B
文献检索PPT课件
2020/10/13
8
§2.应用科技文献的重要性
1.科技文献对促进科学发展的重要作用; 2.科技文献对促进国民经济发展的重要 作用; 3.科技文献对提高科学研究水平的重要作用。
2020/10/13
9
§3.学习科技文献检索方法的重要性
2020/10/13
11
查全率:利用检索系统进行某一课 题检索时,检索出的相关信息量(w)与该系统 信息库中存储的相关信息量(x)的比率称为查 全率(R),用公式可以表示为:
R=w/x×100% 查准率:利用检索系统进行某一课 题检索时,检索出的相关信息量(w)与检出信 息总量(m)的比率称为查全率(R),用公式 可以表示为: P=w/m×100%
2020/10/13
14
§1.科技图书
1. 教科书与专著 2. 字典、百科全书与年鉴
2020/10/13
15
§2.期刊
1.原始论文期刊: 杂志;学报;公报、通报、快报 一次文献:指以作者本人的研究工作或 研制成果为依据撰写,以公开发行进入社 会流通使用的专著、学术论文、专利说明 书、科技报告等。
2020/10/13
16
2.检索工具期刊: 文摘;索引;题录和目录 二次文献:是对一次文献信息进行
整理、加工的产品。即把大量的、分散 的、无序的一次文献信息资源收集起来, 按照一定的方法进行整理、加工, 使之系统化而形成的各种目录、索引 和文摘。
2020/10/13
17
3.综述性论文期刊: 评论杂志 三次文献:是根据一定的目的和需求,
2020/10/13
3
本课程教学要介绍的三个章节:
文献检索PPT课件完整版
文献
概念:记录有知识的一切载体。 四大要素:内容、载体、记录符号、记
录方式
关系
信息>知识>情报,这三者可以被 记录,储存,传递。
知识是系统化了的信息(不一定知 道,了解),通过交流,传递→情报 (被理解了的知识),通过思维决策→ 新的知识。
载体是信息、知识、情报的负载物, 当这三者一旦固化在载体上 称为文献。
编排方法:字顺、类序、自然顺序。 类型:检索工具书,参考工具书。
事实数据型信息检索
事实数据库定义:p75-76 数值数据库定义:P76 分类:学科范围,内容和编排体例。 数据库实例:1、物竞化学品数据库 ppt
2、国研网 ppt
按内容和编排体例
字典,词典(辞典):p76 在线辞海 百科全书:p78 类书:p79 政书:p80 年鉴:p80 中国年鉴网 ppt 名录:p82 机构名录 ,人名录 ppt,地名录 手册:p82 传记:p83 中国人物传记网 ppt 数表、公式:p83 图表:p83 图录、年表、历表、专门性表谱、网上图谱
概念 特征 ISBN
图书
概念
由出版社(商)出版的不包括封面和封底 在内的49页以上的印刷品,具有特定的书 名和著者名,编有国际标准书号,有定价 并取得版权的出版物称为图书。(广义/狭 义,学科划分,文种划分,用途划分。)
特点
内容比较系统,全面,成熟,可靠,出版 周期长,传递信息速度较慢,内容新颖性 较弱。具有书名、作者、出版社、出版时 间、页码、价格,标准编码。
ppt
课外作业:图书馆六楼,翻阅参考工具书,具体了解工具书 的编排和检索。
机构信息检索
机构类型: 院校科研机构检索:工商企业机构检索:
《文献检索》第二章文献信息检索基础知识2
取;有的信息需要支付馆际互借的费);
b 确定搜集所需要的信息需要付出的时间 与精力; c 确定搜集所需要的信息和理解其内容是 否需要应用新的语种和技能(例如:信息是以 非中文/英文的语种表达信息内容的,要了解 其内容,则需要先学习一门新的语言;或是理 解信息内容需要应用到还未学过的学科知识)。
2.4.2 信息检索方法
5、在外文数据库中检索有关“儿童的天才教育” 方面的文献 (Infant or child or children) AND gifted education Gifted children AND Education
练习:计算查全率、查准率
相关信息 检出信息量 未检出信息量 20 10 非相关信息 30 1540
检索方法可以从已经掌握的一篇最新文献入手, 查找到它所引用的文献,再依据这些查出的文献, 查找到它们所引用的文献。如此反复,即可获得大 量的文献信息。
(3)循环法 是常用法与回溯法的结合,即先利用检索 工具查找出一批有用的文献,然后利用这些文 献所附的参考文献或原文中涉及的重要线索进 行追溯查找。
②倒查法 利用选定的检索工具, 由近及远地逐 年进行查找的检索方法。
特点: 以“查准”为主
宜于新的研究课题 较节省时间, 效率较高。
③抽查法 是在课题研究所处的发展高峰期的 若干年中进行查找。
特点: 快速检索的课题 较高的检索效率 前提是必须事先了解课题研究发展 的历史背景。
(2)回溯法
回溯法又称追溯法、引文法,是利用文 献末所附的参考文献或引用文献,由近及远 地进行追踪查找。
查全率
67%
查准率
40%
检索表达式主要有逻辑表达式、截词表达
式等 。
2.4.4.1逻辑表达式
文献检索课件word版
大纲第一章文献信息基本知识第二章文献信息检索原理第三章中文工具书介绍第四章计算机信息检索第五章光盘检索第六章Internet网络检索第七章搜索引擎第八章网上数据库介绍第一章文献信息基本知识第一节文献的概念和功能一、文献的定义信息:信息是客观事物存在的方式或运动状态,以及关于客观存在方式或运动状态的陈述。
知识:知识是人们对客观事物存在和运动规律的认识。
文献:任何人类的知识用文字、图形、符号、声频、视频的手段记录下来的东西。
统统可称为文献。
文献也可称为固化在一定载体上的知识。
二、文献的功能存贮知识的功能;传递和交流信息的功能;保存知识的功能第二节文献的分类一、按文献载体的形式划分:刻写型,印刷型,缩微型,视听型,电子型二、按文献的级别划分:1.一次文献又称原始文献,是以著者本人的研究工作或研究成果为依据撰写创作的论著、论文、技术说明等。
创造性、原始性、分散性2.二次文献是人们把大量的、分散的、无序的一次文献收集起来,按照一定的方法进行加工、整理,使之系统化便于查找而形成的文献。
汇集性、检索性、系统性3.三次文献是选用大量有关的文献,经过综合、分析、研究而编写出来的文献。
综合性、价值性、针对性4.零次文献三、按文献的出版形式划分1.图书2.期刊3.会议文献4.学位论文5.研究报告6.专利文献7.政府出版物8.标准文献9.产品样本10.技术档案第三节文献资源的发展趋势及国内文献资源的分布一、世界文献资源的发展趋势1.文献资源数量急剧增长;2.文献资源的文种繁多;3.文献资源的载体形式趋向多样化;4.文献资源的出版分散;5.文献资源的内容交叉重复;6.文献资源的有效使用寿命缩短。
二、国内文献资源的分布1.文献资源类型的分布:①图书和期刊;②专利、档案、标准文献;③会议文献、科技报告、政府出版物和产品目录等特种文献2.文献资源收藏系统的分布①公共图书馆系统②高校图书馆系统③科技文献信息系统3.国内文献资源的地理分布第二章文献信息检索原理第一节文献信息检索原理一、文献信息检索的定义信息检索(Information Retrieval)(广义上):将信息按一定的方式组织和存储起来,并根据用户的需要找出有关的信息的过程和技术。
文献检索第二章:书目数据库及参考工具书
检索技术及其实现——检域限制
• • • • • • • • • • • 检域限制也称字段限制,包括前缀限制符和后缀限制 符。如对DIALOG系统而言,前缀限制符有: AU= 限查特定作者 JN= 限查特定刊名 LA= 限查特定语种 PN= 限查特定专利号 PY= 限查特定年代 后缀限制符例如: /TI 限在题目中查 /AB 限在文摘中查 /DE 限在叙词标引中查 目前大多数检索系统提供菜单式检索,只需选择字段, 不需要记住及输入字段代码。
文献检索的基本步骤
• (6)索取原始文献。检出结果通常是文献线 索,还不是原始文献。为了索取原始文献, 还须进行两项工作: • a.辩识文献款目,包括文献类型、来源 、出版物名称等; • b.查找原始文献的收藏单位,先从本单 位、本地区入手,利用馆藏目录和联合目录 (联网目录),找到原始文献收藏单位,即 可通过借阅、复制或网上传送、馆际互借等 途径获得资源检索
即通过检索系统,采用一定的技术手段,根据一定的准 则,在数据库或其他网络电子资源中找出相关的信息。 简单的说是一个信息存取的过程,诗人、计算机和网络 共同作用完成的。
文献检索的基本步骤
• (1)确定检索方向。这是使检索获得满意 结果的先决条件,为此必须弄清所需信息 的诸特征,如学科归属、主题概念、时间 界限、文献类型、国别和语种等。 • (2)确定检索方法。一般有三种方法: a.正文法——从主题、分类、作者等途径 查找。 b.引文法:又叫追溯法,即着眼于文献所 附的参考或引用文献目录。(SCI) c.交替法:正文法和引文法交替使用。
其他免费资源
• • • • • 免费电子图书 专利文献 报纸 事实数据 专业学术导航
网上资源的检索工具——搜索引擎
•格意义上算不上是真正的搜索引擎,仅仅是按 目录分类的网站链接列表而已。用户可以不用进行关键词查询 ,仅靠分类目录也可找到需要的信息。最具代表性有搜狐、新 浪、网易搜索等 。 • 元搜索引擎。
第2章 文献信息检索的方法和途径ppt课件
整理版课件
22
5. 实施检索并调整检索策略
6. 索取原始文献 当查到研究课题的相关 信息后,判定是否符合检索需要,如符 合需要,则要准确记录下题名、作者、 出处、以获取原始文献。
介绍内容:
计算机检索概念和发展历程 计算机检索的基本技术 计算机检索步骤 计算机检索的发展趋势
整理版课件
29
2.3.1 计算机检索概念和发展历程
计算机检索概念
计算机检索:是通过计算机(单机、网 络)可以查找、利用各种信息资源。
包括图书馆的公共书目(OPAC--Online Public Access atalogue)、各种联机数据 库、Internet上的信息资源等。
整理版课件
35
(6) Web信息资源检索(90年代末-)
进入90年代后,随着网络技术的发展,尤其是 互联网的迅猛发展,使计算机检索进入一个崭 新的时期。检索方法更简单,检索结果更全面
2.3.2 数据库检索
概念
数据库就是在计算机存储设备上按一定方式 存储的相互关联的数据集合。是计算机技术与 信息检索技术相结合的产物,是现代重要的信 息资源,也是信息检索的重要资料来源。
技术档案
整理版课件
4
➢网络信息资源: (数据库)存在于网络中, 通过上网获取。
特点:丰富、覆盖面广,超文本、超媒 体、集成地提供信~息,来源分散、无序、 难以控制,方便、及时、快速和交互性。
优越性:廉价,新颖、深入,广泛、直 接交流,非正式和自由发表的园地。
文献检索与利用 ppt课件
《中国分类主题词表》
馆藏书目:
四. 信息检索的关键技术
信息抽取:对文本中包含的信息进行结构化处理,以表格的形式加以组织。
输入的是原始文本,输出的是固定格式的信息点。信息以统一的形式集成在 一起,便于查找和比较。
文本分类与聚类:分类--基于统计或规则,根据文本的内容或结构特征,
将文本自动分到已知的类别中。聚类:将文本集合分组成多个类或者簇,使 得同一个簇中的文本内容具有较高的相似度,二不同簇中的文本内容差别较 大。分类一般需要训练,聚类不用。
• 信息检索是对信息项(information items)进行表 示(representation)、存储(storage)、组织 (organization)和存取(access)。
• 狭义的信息检索
根据特定的需求,利用某种检索工具,按照 一定的方法与步骤,从大量文献中查找出符 合用户需求的信息与文献的过程。 (information search)
自动文摘:是一种压缩技术,目标是从信息源中提取出重要且不冗余的信息, 并以简介、浓缩、全面的方式呈现出来。
链接分析:用来分析网页的重要程度、如A链接向B,那么可以认为B中包含
A认为有价值的资源。
分布式信息检索:多台计算机、多个处理器大规模检索 Web信息检索:处理Internet信息的检索。
教学目的与意义
• Why --- 为什么学习信息检索 • What --- 什么是信息检索 • How --- 怎样进行信息检索 • Where --- 在哪里进行信息检索 • How-to-better --- 如何提高检索效率效果
教学目的与意义
• Knowledge 了解相关知识
• Skill
• 第三章 信息检索系统的评价 • 第四章 文本操作技术 • 第五章 文本索引和搜索
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)准确
关键词表述准确是获得良好检索结果的必要前提。提
高关键词的准确性,需要注意两个方面:一是避免错别字;
二是避免有歧义的字、词。
• 作为关键词同时应避免最常用的词;
• 即使需要使用这些常用词,需加以限定; • 对于简单、通俗,容易产生歧义的关键词,也应该加一些 限制性的修饰词; • 采用搜索语法组合关键词,也可有效地提高搜索质量。
2.3 计算机检索的技术
2.3.1 布尔逻辑检索 2.3.2 截词检索 2.3.3 字段检索 2.3.4 位置检索 2.3.5 限制检索
2.3.4 位置检索
概括地说,位置检索是一类针对自然语言文本中检索 词之间特定位置关系而进行的检索匹配技术。位置检索允 许用户使用自然语言作为检索入口,并可深入到原文的章、 节、段、句等文本范围内进行信息的查找和匹配。
(4)选择多个关键词 关键词数量太少,不能准确地限定检索范围, 可能会得出大量的检索结果;太多则可能不被搜 索引擎识别,也会影响搜索效果。 每个搜索引擎对关键词数量的要求和态度不 同。
(5)根据网页特征选择查询词
很多类型的网页都有某种相似的特征。 • 例子一,要去“黄山”旅游,想了解一下相关事宜早作准
(2)力求简练
目前的搜索引擎在处理自然语言方面的能力 不是很强,因此在提交搜索请求时,用户最好把 自己的想法提炼成简单的,而且与希望找到的信 息内容主题关联的查询词。
关键词一般不能选没有检索意义的助词、介
词、连词、形容词或副词等,而多选用名词、短 语。
(3)具有代表性
也就是说,关键词要能成为被查询事物的典 型标志,时间、人物、地点一般可以成为增加关 键词代表性的有效限制因素。 另外,多用专业术语和专业名词,专业术语 和专业名词作为关键词所检索出来的结果一般与 搜索的主题相关性很大。
重庆中考数学试卷 filetype:doc
文献检索课件 filetype:ppt
在进行限制检索时,还需要考虑到以下几点:
(1)尽量使用“高级搜索”选项;
(2)细化查询; (3)网页快照; (4)搜索引擎的工具条;
高级搜索
细化查询
网页快照
搜索引擎的工具条
2.4 引文、跨库检索
常用位置运算符 按照两个检索词出现的顺序和距离,可以有多 种位置算符。对同一位置算符,检索系统不同, 规定的位置算符也不相同。以美国Dialog联机检 索系统使用的位置算符为例,介绍常用的几种位
置算符。
ProQust学位论文全文数据库属于之一。
(1)“(W)”算符
“W”是“with”的缩写。这个算符表示其两 侧的检索词必须紧密相连,除空格和标点符号外, 不得插入其他词或字母,两词的词序不可以颠倒。 “(W)”算符还可以使用其简略形式“()”。
(1)准确
关键词表述准确是获得良好检索结果的必要前提。提
高关键词的准确性,需要注意两个方面:一是避免错别字;
二是避免有歧义的字、词。
• 作为关键词同时应避免最常用的词;
• 即使需要使用这些常用词,需加以限定; • 对于简单、通俗,容易产生歧义的关键词,也应该加一些 限制性的修饰词; • 采用搜索语法组合关键词,也可有效地提高搜索质量。
备。
• 例子二,查找诗人李白的个人资料。
经常总结搜索实践中各类网页的特征现象,并应用到
查询词的选择中,就会使得搜索变得准确而高效。
2.2.2 关键词选择的技巧
(1)高频词法; (2)善用“搜索提示”; (3)巧用“相关搜索”; (4)搜索语法的灵活运用。
• • • • • •
科学膳食 营养科学 科学饮食 幼儿饮食营养 健康营养饮食 饮食卫生和营养
了提高检索的准确率。
字段分为主题字段和非主题字段。
字段类型
由于各检索系统提供的字段检索符号及字段 代码可能各不相同,在具体检索时,如果使用检 索命令方式,应认真阅读系统的说明文件,以便 选择合乎系统语法要求的符号或代码。
用户也可以通过菜单选择方式进行字段检索, 这样,只需要从检索界面上设置的字段列表中选 择相应字段位置就可以了,从而不必对系统的检 索语法进行大量记忆。
(2)年代; (3)作者; (4)同根词。 需要注意的是,使用后截词有可能检出无关 词汇。尤其是在使用无限后截词时,如果所选字 符串(或词干)太短,会造成大量误检,或是发 生溢出,导致检索失败。
(2)前截词检索 与后截词检索相对,前截词检索是将截词符 号置放在一个字符串左方,以表示其左的有限或 无限个字符不影响字符串的检索。
中国知网
A——晶体生长
B——计算机模拟
万方数据库
A——晶体生长
B——计算机模拟
2.3 计算机检索的技术
2.3.1 布尔逻辑检索 2.3.2 截词检索 2.3.3 字段检索 2.3.4 位置检索 2.3.5 限制检索
2.3.2 截词检索
所谓截词(Word Truncation),是指检索者 将检索词汇在他认为合适的地方截断;而截词检 索,则是指使用被截断的词汇进行检索匹配,并 认为凡满足这个词局部中所有字符(串)要求的 记录,都为命中结果。 目前,各检索系统中使用的截词符号互不相同, 也没有统一的规定,我们下面举例中使用“*”表 示不限截断,使用“?”表示有限截断。
(2)“(nW)”算符 “(nw)”是“nWord”的缩写,表示此算符 两侧的检索词之间允许插入n个词,顺序不可颠倒, 而且检索词之间不允许有其他的词或字母,但允 许有空格或连字符号。
(3)“(N)”算符 “N”是“near”的缩写。这个算符表示其两 侧的检索词必须紧密相连,除空格和标点符号外, 不得插入其他词或字母,两词的词序可以颠倒。
(1)准确
关键词表述准确是获得良好检索结果的必要前提。提
高关键词的准确性,需要注意两个方面:一是避免错别字;
二是避免有歧义的字、词。
• 作为关键词同时应避免最常用的词;
• 即使需要使用这些常用词,需加以限定; • 对于简单、通俗,容易产生歧义的关键词,也应该加一些 限制性的修饰词; • 采用搜索语法组合关键词,也可有效地提高搜索质量。
(4)“(nN)”算符
“(nN)”算符表示允许两词插入最多为n个其他词, 包括实词和系统禁用词。允许词序发生颠倒。
(5)“(F)”算符
“F”算符是“field”的缩写。这个算符表示其两侧 的检索词必须在同一字段(例如同在题目字段或文摘字段) 中出现,词序不限,中间可插入任意检索词项。
(6)“(S)”算符 “(S)”算符是“sub-field/sentence”的 缩写。这个算符表示运算符的两侧的检索词只要 出现在记录的同一字段内(例如,在文摘中的一 个句子就是一个字段),此信息即被命中。要求
• 2.4.1 引文检索 • 2.4.2 跨库检索
2.4.1 引文检索 引文检索,就是指对文章的参考文献进行的 检索,是从学术论文中引证关系入手进行检索的 一种方法,是利用被引文献来查找原文献的检索 途径。
来
源 文
献 施引著者 或来源作者
前截词和后截词一样,也存在隐含的“逻辑或” 运算。在有些情况下,前、后截词检索还可以结 合起来使用。
目前,检索系统中的前截词检索还是比较少 见的。
(3)中截词检索
中截词检索又称“通用字符法”或“内嵌字 符截断”,也有称为“屏蔽”的。这种截词是把 截词符号置放在一个检索词的中间,而不是左右 两侧。一般来说,中截词只允许检索词的有限截
超星数字图书馆
A——网络
B——发展
逻辑或(OR)
用逻辑“或”运算符将同一字段内两个被检 索词(A或B)进行组配并检索的检索方式称逻辑 “或”检索,其检索结果将包括所带有A或B两个 检索中任意一个检索词的记录。
同时包含检索词A长
B——计算机模拟
中国知网
A——晶体生长
断。
2.3 计算机检索的技术
2.3.1 布尔逻辑检索 2.3.2 截词检索 2.3.3 字段检索 2.3.4 位置检索 2.3.5 限制检索
2.3.3 字段检索
通过限制检索词在命中结果记录中出现的位 置(主要指记录的不同字段位置)来实现的。从 本质上说,字段检索仍属于布尔检索的范畴,可 以认为是一种受限的布尔检索,其主要目的是为
B——计算机模拟
万方数据库
A——晶体生长
B——计算机模拟
超星数字图书馆
A——网络
B——发展
逻辑非(NOT)
用逻辑“非”运算符将同一字段内两个被检索 词(A非B)进行组配并检索的检索方式称逻辑 “非”检索,其检索结果将包括所有带A检索词而 不带B检索词的记录。
维普期刊资源
A——晶体生长
B——计算机模拟
被连接的检索词必须同时出现在记录的同一句子
中(同一字段),不限制它们在此字段中的相对
词序,中间插入词的数量也不限。
2.3 计算机检索的技术
2.3.1 布尔逻辑检索 2.3.2 截词检索 2.3.3 字段检索 2.3.4 位置检索 2.3.5 限制检索
2.3.5 限制检索
为了提高查准率,将检索限制在网页(记录)的一个 特定部分或几个部分进行的检索,称之为范畴检索,也就 是限制检索。 (1)site:按网域搜索
截词检索的分类
截词检索有多种不同方式,一般按照截断的 位置来分,截词可分为后截断、前截断和中截断。 (1)后截词检索
即将截词符号置放在一个字符串右方,以表 示其右的有限或无限个字符不影响该字符串的检 索匹配。
Science Direct数据库
归纳起来,后截词主要使用在以下四个方面:
(1)词的单复数;
(2)inurl:按URL搜索
(3)intitle:按网页标题搜索 (4)link:按链接搜索 (5)filetype:按文件格式查找文件
关键字 site:网站域名
inurl:关键词1 关键词2
intitle:三峡文化