第三章 文献检索技巧
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
英美拼法:behavi*r 检出 behaviour、 behavior 单复数形式: wom?n 检出 woman、 women 词根相同: comput* 检出 compute、computed、 computing、 computer、 computers、computerize…
按截词的位置分:
单选择检索字段,也可输入检索字段符来限定检索字段。 例如:AU=Smith,表示要查找著者Smith发表的文献。
词组检索:使用
“ ” 双引号将检索词组锁定,进行精确查找。
匹配度选择:“精确匹配”与“模糊匹配”
第三节 文献检索流程
文献检索 分析检索课题 选择检索工具 确定检索词 构建检索提问式 上机检索并调整检索策略 输出检索结果
3.确定检索词
检索词选择技巧Ⅰ :排除重复概念
例:项目“河豚毒素的液相色谱分析” 从该项目名称上看,其主要概念为“河豚毒素”、“液相色谱”和 “分析”, 但由于液相色谱本身就是一种 分析方法,它隐含了“分析”这一概念。 ——主要概念:河豚毒素、液相色谱
检索词的选择技巧 Ⅱ :找出隐含概念
例:项目“唐山综合防灾研究” 唐山:由于唐山是一个城市,该项目实际为“城市综合防灾的研究” 灾害:地震、洪水、火灾 研究:决策支持系统、专家系统 所采用的研究手段是决策支持系统和专家系统。 ——主要概念:城市、地震、洪水、火灾 、决策支持系统、专家系统
(2)选用意义明确的词语,少用概念泛而检索意义不大的词。
——策略、性能、研究、技术、高效、先进…… (×) (3)尽量使用规范化的表述。——选各学科的专用术语、规范用语。 (4)避免使用过长的词组和短语。 (5) 同义词、近义词、缩略词。 (6)英文检索词中的禁用词:包括介词、冠词、代词、连接词、某些形容词 或副词等。AN、AND、BY、FOR、FROM、OF、TO、THE、WITH
A not B 或 A-B 表示检出含有A词,但同时不含有B词的记录。 逻辑“非”可以缩小检索范围,增强检索的准确性。
此运算符用于排除那些含有某个特定检索词的记录,但如果使用不
当将会排除有用文献,从而导致漏检,应慎用。
III. Find A or B not C
使用逻辑算符时应注意的事项:
1.三种算符可同时在一个检索式中使用,也可单独使用。 2.逻辑算符的优先级为:NOT>AND>OR 3.在逻辑组配时,算符的两侧必须各留有一个空格。
其扩展为(nN),表示其两侧的检索词之间最多可插入n个词, 位置可颠倒。 例如:“computer(N)network”,其检中记录可包含
“computer network”或“network computer”。
3.字段级位置算符
表示两侧的检索词必须出现在同一字段中,词序不限。
不同系统使用的符号各不相同。
※注意:
截词符要紧接在词干后面,截词符和词干之间不能有空格!! apple: ap*le ap_*_le ap?le ap_?_le
正确 错误
(三)位置算符
为了提高检索的广度和准确度,常常需要对检索词之间的
位置关系加以限定。位置算符可限定算符两边的检索词出现在 记录中的位置,用以检索出含有检索词且检索词之间的位置也
Field:“air(F)pollution”表示air与pollution必须在同一个段落中出现
Same:“Ad=(CAS same Shenzhen ) ”表示CAS 与 Shenzhen 必须同时 出现在地址字段中
(四)其他检索技术:
字段限定:指将检索词限定在某个或某些字段中。可通过下拉菜
据库对应不同的位置算符,以SCI、EI为例,其位置算符是NEAR/x。
NEAR/x可查找由该运算符连接的检索词之间相隔指定数量的单词的记录。 用数字取代x可指定将检索词分开的最大单词数。
只使用NEAR而不使用/x,系统将查找检索词彼此相隔不到15个单词的记录。
NEAR连接的检索词可以颠倒顺序。 例如:
(复合材料---纳米复合材料)
③使用字段限定,将检索词限定在某个或某些字段范围内。 (全文→文摘/关键词)
④用NOT运算符,排除一些无关的检索项。(慎用)
5.调整检索策略
检索结果输出的篇数过少,甚至为零。
考虑扩大检索范围,提高查全率。调整方法如下:
①选全同义词并用OR与原词连接后加入检索式。
②降低检索词的专指度,从词表或检出文献中选一些上位词或相关词。 ③减少AND运算,删去一些次要的概念组面。 ④进行截词检索。 ⑤取消某些过严的限制符,如字段限制符等。
组织与存储
文献检索
检索
2.基本原理
检索过程实际上是比较、 匹配(match)的过程,检 索提问只要与数据库中的信息 特征标识及其逻辑组配关系相 一致,则“命中”,即找到了 符合要求的信息。
第二节 检索技术
(一)布尔逻辑算符
1.逻辑“与”(and或*):是指两个概念的交集。
A and B 或 A * B表示检出同时含有A、B两个检索词的记录。 逻辑“与”检索增强检索的专指性,缩小检索范围。
截词,是指在检索词的适当位置截断。截词检索就是用截
断的词的一个局部进行的检索,并认为凡满足这个词局部中的
所有字符(串)的文献,都为命中的文献。
截词检索是一种提高查全率,防止漏检的检索技术,尤其
在英文检索中被广泛使用。
常用的截词符号(即截词符,也称通配符)有: “* ” 表示截断无限个字符,即无限截断; “?”表示截断一个字符,即有限截断。
符合特定要求的记录。
control system control system 可检出 system control
control communication system
control(W)system 只可检出
control system
1.with:A(W)B
表示其两侧的检索词必须按前后顺序出现在记录中,不能颠倒, 且两词之间不允许插入其他词,只可能有一个空格、标点或连接号。
(3)合理选择检索字段:一般情况下首先选择主题字段进行检索;需查非
常密切的相关文献时,部分检索词可选择在标题字段检索; (4)构建英文检索式时,正确使用截词符与位置算符,以达到最佳检索效 果。
5.调整检索策略
检索结果输出的篇数过多。
考虑缩小检索范围,提高查准率。调整方法如下: ①进一步限定主题概念,用AND连接一些相关检索项。 ②提高检索词的专指度,更多地采用下位词或下位类。
英文检索词的获取 收集中文文献中的英文关键词写法; CNKI翻译助手 http://dict.cnki.net/
试查相关英文数据库,扩展来自百度文库变更检索词。
例: TiO2纳米复合材料的制备与合成的研究 TiO2 nanometer nanoparticle nanofilm composite composites prepare preparation synthesize synthesis
(1)后截断。截去某个词的后部,前方一致。最常用。 如:child*能检出child,children,children’s
(2)前截断。截去某个词的前部,后方一致。 如:*computer能检出minicomputer,microcomputer
(3)中间截断。截取某个词的中间部分,两边一致。 如:organi??tion能检出organization,organisation
并列概念
2. 数据库的选择 (1)合适的主题范围 (2)合适的数据库类型、年度范围
学科:图书情报学 2000年后
EI,SCI等检索数据库
原检索式: digital library and document retrieval
并列概念 document retrieval / information retrieval / bibliographic retrieval 同义词 digital library / virtual library / electronic library
修改检索式
(document retrieval or information retrieval or bibliographic retrieval) and (digital librar* or electronic librar* or virtual librar*)
I. Find A and B and C
2.逻辑“或”(or或+):是指两个概念的并集。 A or B或 A+B表示检出所有含有A词或者B词的记录。 逻辑“或”检索扩大了检索范围,提高查全率。
此运算符适于连接有同义关系或相关关系的词。
II. Find A or B or C
3.逻辑“非”(not或—):表示从两个概念中除去交叉的部分。
第三章 文献检索技巧
覃 雪 qinxue@dlut.edu.cn
第一节
文献检索的基本概念
第二节
第三节
检索技术
文献检索流程
第一节 文献检索的基本概念
1.定义
文献检索是指从众多的文献中通过检索工具或检索系统,迅速、 准确地查找出与用户提问有关的文献信息线索的行为、方法和过程。
组织与存储:是对数据进行标引的过程。 对信息进行著录、标引、整序,编制检 索工具和建立检索系统的过程。 检索:是指面向信息需求而进行高 度选择性的查找过程。
其扩展为(nW),n=1~9,表示其两侧的检索词之间最多可插 入n个词,但位置不能颠倒。 例如:“light(4W)rail”表示light与rail之间最多可插入4个词, 但位置不能颠倒。
2.near:A(N)B 表示其两侧的检索词前后位置可以颠倒,在两词之间不允许插入 其他词,只可能有一个空格、标点或连接号。
优先算符
优先算符用()表示,在含有多个运算的检索式中,可以用 ()将需要优先运算的部分括上,系统会优先运算()中的 部分,然后在按照not, and, or的顺序进行运算。 如: (behaviour or behavior) and human
※逻辑算符的优先级为()>NOT>AND>OR
(二)截词算符
示例课题:数字化图书馆的文献检索服务
1.分析课题: 数字化图书馆+文献检索 digital library and document retrieval
扩展:同义词
digital library virtual library electronic library document retrieval information retrieval bibliographic retrieval
intelligent (near/0) robot intelligent robot / robot intelligent
economic (near/2) recovery economic recovery / recovery of the economic / recovery from economic troubles
1.分析检索课题
分析检索课题,明确信息需求。
可以从以下几个方面进行:
(1)检索内容的确定:分析课题的主题内容、所属学科性质 (2)检索范围的确定:包括文献类型、时间范围、语种等。
(3)充分利用已有文献:可以利用相关文献后面所附的参考文
献进行“滚雪球式”的检索。
2.选择检索工具
应该从以下几个方面考虑:
syntheses
4.构建检索提问式
检索式
=
检索词
+
连接组配符号
逻辑运算符(logical operator)
优先算符(priority operator) 通配符(wildcard character)、截词算符 位置算符(proximity operator)
英文检索式
位置算符:限定检索词之间的位置关系,以提高检索的广度和准确度。每个数
(1)数据库收录的信息内容所涉及的学科范围: 综合内容数据库,专业内容数据库
(2)数据库收录的文献类型、语种:中、外文期刊数据库、
专利文献/标准文献/会议文献/学位论文数据库 (3)数据库所提供的检索途径、检索功能和服务方法
3.确定检索词
(1)提取有关课题实质内容的关键词。
——通常从课题的主要概念,即课题名称、采用的具体技术或方法、新颖性 中提取。
4.构建检索提问式
(1)使用逻辑“或”运算符将主题词与同义词进行组配,以提高查全率。 如,检索与“激光”有关的文献:激光 OR 镭射 OR 莱塞 (2)使用逻辑“与”运算符将不同概念进行组配,以提高检索结果的专指 性,继而提高查准率。 如,检索 “激光在生物学领域的应用”相关文献: (激光 OR 镭射 OR 莱塞)AND 生物学
按截词的位置分:
单选择检索字段,也可输入检索字段符来限定检索字段。 例如:AU=Smith,表示要查找著者Smith发表的文献。
词组检索:使用
“ ” 双引号将检索词组锁定,进行精确查找。
匹配度选择:“精确匹配”与“模糊匹配”
第三节 文献检索流程
文献检索 分析检索课题 选择检索工具 确定检索词 构建检索提问式 上机检索并调整检索策略 输出检索结果
3.确定检索词
检索词选择技巧Ⅰ :排除重复概念
例:项目“河豚毒素的液相色谱分析” 从该项目名称上看,其主要概念为“河豚毒素”、“液相色谱”和 “分析”, 但由于液相色谱本身就是一种 分析方法,它隐含了“分析”这一概念。 ——主要概念:河豚毒素、液相色谱
检索词的选择技巧 Ⅱ :找出隐含概念
例:项目“唐山综合防灾研究” 唐山:由于唐山是一个城市,该项目实际为“城市综合防灾的研究” 灾害:地震、洪水、火灾 研究:决策支持系统、专家系统 所采用的研究手段是决策支持系统和专家系统。 ——主要概念:城市、地震、洪水、火灾 、决策支持系统、专家系统
(2)选用意义明确的词语,少用概念泛而检索意义不大的词。
——策略、性能、研究、技术、高效、先进…… (×) (3)尽量使用规范化的表述。——选各学科的专用术语、规范用语。 (4)避免使用过长的词组和短语。 (5) 同义词、近义词、缩略词。 (6)英文检索词中的禁用词:包括介词、冠词、代词、连接词、某些形容词 或副词等。AN、AND、BY、FOR、FROM、OF、TO、THE、WITH
A not B 或 A-B 表示检出含有A词,但同时不含有B词的记录。 逻辑“非”可以缩小检索范围,增强检索的准确性。
此运算符用于排除那些含有某个特定检索词的记录,但如果使用不
当将会排除有用文献,从而导致漏检,应慎用。
III. Find A or B not C
使用逻辑算符时应注意的事项:
1.三种算符可同时在一个检索式中使用,也可单独使用。 2.逻辑算符的优先级为:NOT>AND>OR 3.在逻辑组配时,算符的两侧必须各留有一个空格。
其扩展为(nN),表示其两侧的检索词之间最多可插入n个词, 位置可颠倒。 例如:“computer(N)network”,其检中记录可包含
“computer network”或“network computer”。
3.字段级位置算符
表示两侧的检索词必须出现在同一字段中,词序不限。
不同系统使用的符号各不相同。
※注意:
截词符要紧接在词干后面,截词符和词干之间不能有空格!! apple: ap*le ap_*_le ap?le ap_?_le
正确 错误
(三)位置算符
为了提高检索的广度和准确度,常常需要对检索词之间的
位置关系加以限定。位置算符可限定算符两边的检索词出现在 记录中的位置,用以检索出含有检索词且检索词之间的位置也
Field:“air(F)pollution”表示air与pollution必须在同一个段落中出现
Same:“Ad=(CAS same Shenzhen ) ”表示CAS 与 Shenzhen 必须同时 出现在地址字段中
(四)其他检索技术:
字段限定:指将检索词限定在某个或某些字段中。可通过下拉菜
据库对应不同的位置算符,以SCI、EI为例,其位置算符是NEAR/x。
NEAR/x可查找由该运算符连接的检索词之间相隔指定数量的单词的记录。 用数字取代x可指定将检索词分开的最大单词数。
只使用NEAR而不使用/x,系统将查找检索词彼此相隔不到15个单词的记录。
NEAR连接的检索词可以颠倒顺序。 例如:
(复合材料---纳米复合材料)
③使用字段限定,将检索词限定在某个或某些字段范围内。 (全文→文摘/关键词)
④用NOT运算符,排除一些无关的检索项。(慎用)
5.调整检索策略
检索结果输出的篇数过少,甚至为零。
考虑扩大检索范围,提高查全率。调整方法如下:
①选全同义词并用OR与原词连接后加入检索式。
②降低检索词的专指度,从词表或检出文献中选一些上位词或相关词。 ③减少AND运算,删去一些次要的概念组面。 ④进行截词检索。 ⑤取消某些过严的限制符,如字段限制符等。
组织与存储
文献检索
检索
2.基本原理
检索过程实际上是比较、 匹配(match)的过程,检 索提问只要与数据库中的信息 特征标识及其逻辑组配关系相 一致,则“命中”,即找到了 符合要求的信息。
第二节 检索技术
(一)布尔逻辑算符
1.逻辑“与”(and或*):是指两个概念的交集。
A and B 或 A * B表示检出同时含有A、B两个检索词的记录。 逻辑“与”检索增强检索的专指性,缩小检索范围。
截词,是指在检索词的适当位置截断。截词检索就是用截
断的词的一个局部进行的检索,并认为凡满足这个词局部中的
所有字符(串)的文献,都为命中的文献。
截词检索是一种提高查全率,防止漏检的检索技术,尤其
在英文检索中被广泛使用。
常用的截词符号(即截词符,也称通配符)有: “* ” 表示截断无限个字符,即无限截断; “?”表示截断一个字符,即有限截断。
符合特定要求的记录。
control system control system 可检出 system control
control communication system
control(W)system 只可检出
control system
1.with:A(W)B
表示其两侧的检索词必须按前后顺序出现在记录中,不能颠倒, 且两词之间不允许插入其他词,只可能有一个空格、标点或连接号。
(3)合理选择检索字段:一般情况下首先选择主题字段进行检索;需查非
常密切的相关文献时,部分检索词可选择在标题字段检索; (4)构建英文检索式时,正确使用截词符与位置算符,以达到最佳检索效 果。
5.调整检索策略
检索结果输出的篇数过多。
考虑缩小检索范围,提高查准率。调整方法如下: ①进一步限定主题概念,用AND连接一些相关检索项。 ②提高检索词的专指度,更多地采用下位词或下位类。
英文检索词的获取 收集中文文献中的英文关键词写法; CNKI翻译助手 http://dict.cnki.net/
试查相关英文数据库,扩展来自百度文库变更检索词。
例: TiO2纳米复合材料的制备与合成的研究 TiO2 nanometer nanoparticle nanofilm composite composites prepare preparation synthesize synthesis
(1)后截断。截去某个词的后部,前方一致。最常用。 如:child*能检出child,children,children’s
(2)前截断。截去某个词的前部,后方一致。 如:*computer能检出minicomputer,microcomputer
(3)中间截断。截取某个词的中间部分,两边一致。 如:organi??tion能检出organization,organisation
并列概念
2. 数据库的选择 (1)合适的主题范围 (2)合适的数据库类型、年度范围
学科:图书情报学 2000年后
EI,SCI等检索数据库
原检索式: digital library and document retrieval
并列概念 document retrieval / information retrieval / bibliographic retrieval 同义词 digital library / virtual library / electronic library
修改检索式
(document retrieval or information retrieval or bibliographic retrieval) and (digital librar* or electronic librar* or virtual librar*)
I. Find A and B and C
2.逻辑“或”(or或+):是指两个概念的并集。 A or B或 A+B表示检出所有含有A词或者B词的记录。 逻辑“或”检索扩大了检索范围,提高查全率。
此运算符适于连接有同义关系或相关关系的词。
II. Find A or B or C
3.逻辑“非”(not或—):表示从两个概念中除去交叉的部分。
第三章 文献检索技巧
覃 雪 qinxue@dlut.edu.cn
第一节
文献检索的基本概念
第二节
第三节
检索技术
文献检索流程
第一节 文献检索的基本概念
1.定义
文献检索是指从众多的文献中通过检索工具或检索系统,迅速、 准确地查找出与用户提问有关的文献信息线索的行为、方法和过程。
组织与存储:是对数据进行标引的过程。 对信息进行著录、标引、整序,编制检 索工具和建立检索系统的过程。 检索:是指面向信息需求而进行高 度选择性的查找过程。
其扩展为(nW),n=1~9,表示其两侧的检索词之间最多可插 入n个词,但位置不能颠倒。 例如:“light(4W)rail”表示light与rail之间最多可插入4个词, 但位置不能颠倒。
2.near:A(N)B 表示其两侧的检索词前后位置可以颠倒,在两词之间不允许插入 其他词,只可能有一个空格、标点或连接号。
优先算符
优先算符用()表示,在含有多个运算的检索式中,可以用 ()将需要优先运算的部分括上,系统会优先运算()中的 部分,然后在按照not, and, or的顺序进行运算。 如: (behaviour or behavior) and human
※逻辑算符的优先级为()>NOT>AND>OR
(二)截词算符
示例课题:数字化图书馆的文献检索服务
1.分析课题: 数字化图书馆+文献检索 digital library and document retrieval
扩展:同义词
digital library virtual library electronic library document retrieval information retrieval bibliographic retrieval
intelligent (near/0) robot intelligent robot / robot intelligent
economic (near/2) recovery economic recovery / recovery of the economic / recovery from economic troubles
1.分析检索课题
分析检索课题,明确信息需求。
可以从以下几个方面进行:
(1)检索内容的确定:分析课题的主题内容、所属学科性质 (2)检索范围的确定:包括文献类型、时间范围、语种等。
(3)充分利用已有文献:可以利用相关文献后面所附的参考文
献进行“滚雪球式”的检索。
2.选择检索工具
应该从以下几个方面考虑:
syntheses
4.构建检索提问式
检索式
=
检索词
+
连接组配符号
逻辑运算符(logical operator)
优先算符(priority operator) 通配符(wildcard character)、截词算符 位置算符(proximity operator)
英文检索式
位置算符:限定检索词之间的位置关系,以提高检索的广度和准确度。每个数
(1)数据库收录的信息内容所涉及的学科范围: 综合内容数据库,专业内容数据库
(2)数据库收录的文献类型、语种:中、外文期刊数据库、
专利文献/标准文献/会议文献/学位论文数据库 (3)数据库所提供的检索途径、检索功能和服务方法
3.确定检索词
(1)提取有关课题实质内容的关键词。
——通常从课题的主要概念,即课题名称、采用的具体技术或方法、新颖性 中提取。
4.构建检索提问式
(1)使用逻辑“或”运算符将主题词与同义词进行组配,以提高查全率。 如,检索与“激光”有关的文献:激光 OR 镭射 OR 莱塞 (2)使用逻辑“与”运算符将不同概念进行组配,以提高检索结果的专指 性,继而提高查准率。 如,检索 “激光在生物学领域的应用”相关文献: (激光 OR 镭射 OR 莱塞)AND 生物学