第三章信息检索
第三章 信息检索基本知识
信息论的奠基人 申农在《通信的数学 理论》中把信息定义 为:“信息是用来消 除不确定的东西。”
控制论创始人
维纳在《信息控制论》 一书中指出:“信息是 人与外界相互作用过程 中相互交换的内容和名 称。”
―信息”的定义之所以呈现多样化,主要有三方 面的原因 : 第一,信息本身的复杂性。它是一个多元化、 多层次、多功能的综合物; 第二,信息科学是一门新兴学科,是一门“大” 学科,它有许多分支学科,它的内涵与外延 不很确切,而且随着社会、经济和科学技术 的发展处于不断发展之中; 第三,人们出于不同的研究目的或使用目的, 从不同的角度或层次出发,对“信息”必然 作出不同的理解与解释。
4.从信息观的角度理解,知识是人类通过信息 对自然界、生物界、人类社会运动规律的认识 和概括,是一种特定的人类信息,它是对信息 进行提炼、深化、抽象化、系统化的结果,是 信息中最有价值的部分。知识是信息的一部分。 知识必须要有充分、可靠的经验性证据, 并且要经过理性的合理加工。
(二)知识的特性 1.实践性 社会实践是一切知识产生的基础和检验知 识的标准,科学知识对实践有重大指导作用。 2.规律性 人们对事物的认识是一个无限的过程,人 们获得的知识在一定层面上揭示了事物及运动 过程的规律性。 3.渗透性 随着知识门类增多,各种知识可以相互渗透, 形成许多新的知识门类,形成科学知识的网状 结构体系。
四、文献 (一)文献的定义 1.国际标准化组织《文献情报术语国际标准》: 文献是存储、检索、利用或传递记录信息的过 程中,可作为一个单元处理的、在载体内、载 体上或依附载体而存储有信息或数据的载体。 2.国家标准《文献著录总则》:文献是记录有知 识的一切载体。 北大教授王子舟《图书馆学是什么》:是指专门 记录、传播有知识的一切载体。 南大教授沈固朝《信息检索(多媒体)教程》: 记录有人类精神信息的、且便于存贮或传递的 人工固态附载物
第三章 信息检索的基本知识
1、逻辑“或”(和) 、逻辑“
————————————————— A
B
用符号“ 或 表示, 用符号“or”或“+”表示,其逻辑表达式为: 表示 其逻辑表达式为: A or B 或 A+B 其意义为检索记录中凡含有检索词A或检索词 , 其意义为检索记录中凡含有检索词 或检索词B, 或检索词 或同时含有检索词A和 的 均为命中文献。 或同时含有检索词 和B的,均为命中文献。
分 析 课 题
检索词: 检索词: : :
富营养化(水华), ),处理 富营养化(水华),处理 治理,修复), ),湖泊 (治理,修复),湖泊
ቤተ መጻሕፍቲ ባይዱ
, ,
,
检索工具: 检索工具:
1. 2. 3. 4. 5. 6. 7. 8. 中文科技期刊全文数据库(维普) 1989中文科技期刊全文数据库(维普) 1989-现在 中国科技成果数据库(万方) 1986中国科技成果数据库(万方) 1986-现在 中国期刊全文数据库(同方) 1979中国期刊全文数据库(同方) 1979-现在 中国优秀博硕士学位论文全文数据库(同方)1999中国优秀博硕士学位论文全文数据库(同方)1999-现在 中国学位论文文摘数据库(万方) 1989中国学位论文文摘数据库(万方) 1989-现在 中国学术会议论文全文数据库(万方) 1995中国学术会议论文全文数据库(万方) 1995-现在 中国重要会议论文全文数据库(同方) 2000中国重要会议论文全文数据库(同方) 2000-现在 中国重大科技成果数据库(万方) 1990中国重大科技成果数据库(万方) 1990-现在
中图分类法
中图法》 个基本部类, 《中图法》分 5个基本部类,将知识门类分为 哲学” 社会科学” 自然科学” “哲学”、“社会科学”、“自然科学”三大部 马克思主义、列宁主义、 类。马克思主义、列宁主义、毛泽东思想是指导 我们思想的理论基础,作为一个基本部类, 我们思想的理论基础,作为一个基本部类,列于 首位。此外,考虑到图书本身的特点, 首位。此外,考虑到图书本身的特点,对于一些 内容庞杂,类无专属, 内容庞杂,类无专属,无法按某一学科内容性质 分类的图书,概括为“综合性图书” 分类的图书,概括为“综合性图书”,作为一个 基本部类,置于最后。 22个大 基本部类,置于最后。在此基础上扩展为 22个大 类。 标记符号采用拉丁字母与阿拉伯数字相结合的混 合号码制。 合号码制。
第三章图书信息的检索
Company Logo
【期刊论文】王健等.金生宝胶囊治疗22例HIV感
染者的临床研究[J].中国中医基础医学杂志,
2000,6(7):33-35.
斜体字代表论文的篇名,“[J]”是文献类型标识符, journal代表期刊论文。该论文发表在《中国中医基础医学杂志》 上。“2000,6(7):33-35.”则表明论文所登载的卷期号和页 码,表示为:2000年出版的第6卷第7期第33-35页。
电子图书、电子期刊、学位论文检索
网络信息资源检索(搜索引擎)
前面课程回顾
信息的来源叫做【信息源】。信息源可按 不同的方法 分类描述,比较常见的分类方法
有如下【三种】:
1、按信息的【载体形式】划分(电子文献 等); 2、按信息【加工的级别】划分(四次文献); 3、按信息的【发布形式】划分(十大文献信 息源等)
有电子化)。
电子图书还有一部分只有电子版,没有纸本版,
在网上大家可以用搜索引擎找到这样的电子图 书。 电子图书正在逐步发展成为比较主要的数字信 息资源。
图书馆的电子图书资源
书生之家电子图书
超星数字图书馆
方正阿帕比电子教参书
“读秀”学术搜索
什么是读秀?
读秀是由海量全文数据及资料基本信息组成的
【优先算符】
例如:( ,在实际查 询时,真正的关键字是“知识经济”或“信息经济”。 以上四种操作符可互相结合使用,但有一定的执行先后次序,其 【优先顺序】依次为:括号、NOT、AND、OR
知识or信息)and经济
布尔逻辑(语言)检索
布尔逻辑语言的应用,是文献信息检索的一个重要方法。其【运 算符有三种】1.AND(逻辑与),指两个概念的交集;2.OR(逻 辑或),指两个概念的并集;3.NOT(逻辑非),指两个交叉概念 中去除交叉的部分。
信息检索 第3章 中文主要信息资源检索系统
轻工 纺织
建筑 建材
环境 《环境科学文摘》
《馆目:环境污染与保护》
《汽车文摘》 《公路运输文摘》 《水陆运输文摘》 《造船文摘》 《中目:船舶工程》 《外目:造船工程》 交通 《中目:公路、水陆运输》 《铁道文摘》 运输 《中目:铁路》 《专利文献通报:汽车 》 《专利文献通报:包装、搬运、储存》 《外目:航空与航天》 《航空发动机文摘》 航天 《馆目:交通运输、航空航天》
WEB版(网上包库)、镜像站版、光盘版、流量计费。
四川农业大学图馆网站简介
◆
点击
各种类型的电子文献资源: 中外文期刊、图书及特种文献
读者查询 点击:
四、中国期刊全文数据库信息检索
1. 登录检索系统
鼠标接触
点击: 外网或本地镜像
CNKI中国知识资源总库
点击
选择单一数据库 或选择多个数据库进行跨 库检索
《电工文摘》 《中目:电力电工、原子能》 水利 《外目:电力》 《中目:水利水电》 电力 《外目:水利水电》 《中文电子科学文摘》 《电子科技文摘》 电子 《中国无线电电子科技文摘》 《计算机应用文摘》 学 《国外电子科学文摘》 《专科文献通报:电子技术》 《馆目:无线电电子学与自动化技术》
计算 《专利文献通报:计算机和信息存储》 机 《计算机应用文摘》 《中国纺织文摘》 《纺织文摘》 《皮革文摘》 《造纸文摘》 《中目:轻工、纺织》 《外目:轻工业》 《外目:粮油食品》 《外目:制糖工业》 《馆目:轻工、纺织》 《专利文献通报:纺织》 《专利文献通报:生活日用》 《专利文献通报:造纸、印刷、装帧》 《建筑机械文摘》 《中目:建筑工程》 《中目:建筑材料》 《外目:建筑材料》 《外目:建筑水利工程》 《馆目:建筑水利工程》 《城市文献通报》
第3章-搜索引擎及网络信息检索
3.2 典型的搜索引擎
• • • • 1. Google 2)Google的搜索语法 Google的基本检索算符是:空格、减号和大写英文“OR”。 逻辑“与”(and)用空格表示。用减号“-”表示逻辑 “非”。注意:这里的“+”和“-”号,是英文字符,而不 是中文字符的“+”和“-”。此外,操作符与关键字之 间,不能有空格。 • Google不支持通配符,如“*”、“?”等,关键字后面的 “*”或者“?”会被忽略掉。Google对英文字符大小写不 敏感,“GOD”和“god”搜索的结果是一样的。Google的 关键字可以是词组(中间没有空格),也可以是句子,但 是,用句子做关键字,必须加英文引号。
• • • • • le检索题目含有“清华大学”、“研究生”的doc格式的文件,应该 输入___: A. intitle:清华大学 研究生 site: filetype:doc B. ti=清华大学 研究生 site: filetype:doc C. intitle=清华大学* 研究生*site=*filetype=doc D. intitle:(清华大学 研究生) site: filetype:doc 8.同样检索式(例如输入:玉米 提取 乙醇)分别用本章介绍的科技信境外中国古典诗词的网上英文资料。提示:参考和比较下列方法的查 询结果: (1)在Yahoo中选择分类目录Arts & Humanities(艺术与人文科学)〉 Literature(文学),输入关键词classical Chinese Poetry检索。 (2)在Google输入:中国古典诗词的网上英文资料 (3)在Google输入:(中国 古 诗词 英文)or classical.3 搜索引擎的检索技巧
• • • • 3.3.1常规的检索技巧 1.分类查询 2.关键词查询 一般来说,首次检索时不要把条件限制得 过于严格,最好是检索出一些结果后再使 用其
第三章 信息检索教程
举例:期刊2
23
期刊著录格式
24
期刊的著录
写出下面期刊文献著录:
25
小节练习1
1. 什么是文献著录? 2.文献著录的结果是—— 3. 既著录主要项目,还著录全部选择项目的著录级次称为—— 4. 既著录主要项目,还著录部分选择项目的著录级次称为——
26
3.2 机读目录与元数据
3.2.1 机读目录
43
3.2.3 都柏林核心元数据和机读目录的比较
1. 著录的对象不同
DC与 MARC的 3. 著录的主体不同 比较 4. 著录的详简程度不同
5. 标识的方法不同
2. 数据的形式不同
44
小节练习2
1、什么是机读目录,一条CNMARC机读目 录的组成? 2、头标区数据元素: 00123cbm1#2200277###52## 其中c、b、m、1分别表示什么? 3、什么是元数据?
12
图书的著录(参考文献著录规则)
13
14
图书著录中的文献类型标志
常用文献类型用单字母标识,具体如下: (1)期刊[J](journal) (2)专著[M](monograph) (3)论文集[C](collected papers) (4)学位论文[D](dissertation) (5)专利[P](patent) (6)技术标准[S](standardization) (7)报纸[N](newspaper article) (8)科技报告[R](report)
CNMARC记录
记录头标区
地址目次区
数据字段区
记录分隔符
注:各字段数据元素及其标准详细情况参见教材P83-87
33
ISO-2709的机读目录标准
信息检索课件第3章
文本信息检索的应用场景
01
02
03
搜索引擎
搜索引擎是文本信息检通过分析用 户历史行为和兴趣,为用 户推荐相关内容,如新闻 推荐、电商推荐等。
学术领域
学术领域中,研究人员可 以通过文本信息检索快速 查找相关论文、研究成果 等。
查询条件最相似的图像。
图像信息检索的关键技术
1 2
特征提取算法
特征提取算法是图像信息检索的核心技术之一, 常用的算法包括颜色直方图、SIFT、SURF等。
特征匹配算法
特征匹配算法用于比较不同图像之间的相似度, 常用的算法包括欧氏距离、余弦相似度等。
3
索引技术
索引技术可以提高图像信息检索的效率,常用的 索引技术包括哈希索引、B树索引等。
特征提取是视频信息检 索中的核心技术之中提取出关键帧和 图像特征,以便后续的 相似度计算和检索排序。
相似度计算是另一个关 检索排序是根据相似度 视频摘要技术则是对整
键技术,它通过比较不 计算结果,按照相关度 个视频内容进行概括和
同视频之间的特征信息, 对视频进行排序,以便 总结,以便用户快速了
图像信息检索的应用场景
搜索引擎
搜索引擎是图像信息检索 的重要应用场景之一,用 户可以通过搜索引擎查找 符合特定条件的图片。
电子商务
电子商务网站可以利用图 像信息检索技术为用户提 供更加精准的商品推荐服 务。
文化创意产业
在文化创意产业中,图像 信息检索技术可以帮助用 户快速查找相关艺术作品、 文物等。
THANKS.
智能化发展
利用人工智能技术提升信息检索的智 能化水平,如自然语言处理、深度学 习等。
个性化服务强化
通过更精细化的用户画像和个性化推 荐算法,提高信息检索的个性化服务 能力。
文献信息检索 第三章
The end
A
B
运算顺序:先算“ 然后是“ 运算顺序:先算“与”和“非”、然后是“或” 混合运算, 电脑) 混合运算, (计算机 OR 电脑) AND 软件 NOT 硬件
二、计算机信息检索技术-6
2.截词检索
前截词(后方一致)。 :?computer )。例 computer, ① 前截词(后方一致)。例:?computer, 可检索出computer mirocomputer, computer, 可检索出computer,mirocomputer, 后截词(前方一致)。 )。例 instruction? ② 后截词(前方一致)。例:instruction? 可检索出instruction instructions, instruction, 可检索出instruction,instructions, instructional 中间截词。 wom? 可检索出woman woman, ③ 中间截词。 例:wom?n,可检索出woman, women。 women。 colo???? ????r 可检索出colour colour, colour, colo????r,可检索出colour,colour, colonizer。 colonizer。 前后截词。 :?Plane Plane? ④前后截词。 例:?Plane? 可检索出 airoplane,planes, “airoplane,planes,plane
4.限制检索 为提高查全率和查准率, 为提高查全率和查准率,需要一些缩小或 约束检索结果的方法, 约束检索结果的方法,称之为限制检索 用这种方法可将检索过程限定在特定的范 或字段)中进行。 围(或字段)中进行。 前缀写法: JN=,LA= TI= =,LA (1)前缀写法:例:JN=,LA= TI= 后缀写法: /DE,/DF—叙词 叙词; (2)后缀写法:例:/DE,/DF 叙词;/ID, /IF—标引词;/TI――题目;/AB――文 标引词;/TI――题目;/AB―― /IF 标引词;/TI――题目;/AB――文 摘。
第三章 文献信息检索基本原理及方法
标题词语言关键词语言单词语言叙词语言检索语言
主题语言 由于不同概念相交就会 形成一个新概念, 形成一个新概念,这个 新概念是组配前各概念的 下位概念。 电子” 下位概念。如:“电子”和 信息”组配产生电子信息。 “信息”组配产生电子信息。 同级词间不同概念并 组配结果,可提高查准率。 组配结果,可提高查准率。 列也会形成一个新概 念,这个新概念是组配 前各概念的上位概念。 前各概念的上位概念。 数字计算机” 如“数字计算机”和“模 拟计算机” 拟计算机”组培后得 到“计算机”这一新的 计算机” 是不同级词间的组配, 是不同级词间的组配,是用 上位概念。组配结果, 上位概念。组配结果, 时间、 时间、空间和学科范围某一 提高查全率。 提高查全率。 方面的属性进行限定的一种 概念关系。 建筑物” 概念关系。如:“建筑物”为 主体事物, 设计” 主体事物,“设计”为某个方 组配结果被限定为“ 面,组配结果被限定为“建 筑物设计”这个新概念, 筑物设计”这个新概念,组配 结果可使检索到的文献专指度 和查全率提高。 和查全率提高。
3.1.1 文献信息检索的基本含义 一、文献信息检索的基本含义
“检索”即“查找”之意。信息检索,是将信息按照一定的方式 检索”即“查找”之意。信息检索 信息检索,是将信息按照一定的方式 组织、存储起来,并针对用户的需要查找所需信息的过程。因此信 息检索包含了信息的存储和检索两个不可分的部分。我们通常所说 的信息检索是指狭义的信息检索,即从检索工具和检索系统中查找 所需信息的过程及其所采取的一系列方法和策略。
手工检索和计算机检索的关系:手检是基础,机检是发展方向。 手工检索和计算机检索的关系:手检是基础,机检是发展方向。
3.1.2 文献信息检索的类型 按检索要求划分: 按检索要求划分: 相关性检索——是系统不直接回答用户所提出的 相关性检索 技术问题本身,而是只提供与之相关的文献供用 户参考。 确定性检索——是以数据或事实为检索对象,系 确定性检索 统要直接问答用户提出的技术问题,即直接提供 用户需要的确切的数据或事实。
信息检索课件 第3讲 信息检索的基本知识
教学目标
本章将介绍手工和计算机检索的基 本知识,让读者了解检索的一般程序, 本知识,让读者了解检索的一般程序, 包括如何分析问题、如何获取原文、 包括如何分析问题、如何获取原文、何 谓检索语言、 谓检索语言、常用的检索技术和检索方 法有哪些、如何对信息检索评价。 法有哪些、如何对信息检、引文法(跟踪法) 、引文法(跟踪法) 文献之间的引证和被引证关系揭示了文 献之间存在的某种内在联系, 献之间存在的某种内在联系 , 引文法就 是利用文献后所附的参考文献、 是利用文献后所附的参考文献 、 相关书 目 、 推荐文章和引文注释查找相关文献 的方法。 的方法 。 这些材料指明了与用户需求最 密切的文献线索, 密切的文献线索 , 往往包含了相似的观 思路、 方法, 具有启发意义。 点 、 思路 、 方法 , 具有启发意义 。 循着 这些线索去查找, 这些线索去查找 , 不仅利用了前人的劳 动成果, 省却了很多时间和精力, 动成果 , 省却了很多时间和精力 , 而且 可能在原来的基础上有新的发现。 可能在原来的基础上有新的发现。
一、一般检索方法 1.“拉网法”(广度优先法) 拉网法” 广度优先法) 拉网法 在不了解查询某一专题信息的URL地 在不了解查询某一专题信息的 地 址时,可从提供信息总目的Web 页面开 址时,可从提供信息总目的 始浏览, 沿着专题链接层层查找, 始浏览 , 沿着专题链接层层查找 , 直至 找到有关的内容为止。 找到有关的内容为止 。 然后保存这个页 面的URL, 转向另一个分支 。 这种方法 面的 , 转向另一个分支。 可以迅速获得较多的相关地址, 可以迅速获得较多的相关地址 , 然后进 行筛选。 就使用引擎而言, 行筛选 。 就使用引擎而言 , 国外专家也 建议先用链接页面多、 建议先用链接页面多 、 响应时间快的引 擎。
第三章 网络信息检索
第三章网络信息检索第一节网络信息检索的基本方法1、布尔逻辑检索逻辑检索是一种比较成熟、较为流行的检索技术。
逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符,主要的运算符有:(1)逻辑―与‖逻辑―与‖用AND(或﹡)表示。
检索词A、B若用逻辑―与‖相连,即A AND B(A*B),则表示同时含有这两个检索词才能被命中。
例如,要检索儿童教育的文献,检索逻辑式可表示为:child AND education(2)逻辑―或‖逻辑―或‖用OR(或+)表示。
检索词A、B若用逻辑―或‖相连,即A OR B(A+B),则表示只要含有其中一个检索词或同时含有这两个检索词的文献都将被命中。
例如,要检索―计算机‖或―机器人‖方面的文献,检索逻辑式可表示为:computer OR robot. (3)逻辑―非‖逻辑―非‖用NOT(AND NOT,BUT NOT)(或-)表示。
检索词A、B若用―非‖相连,即A NOT B(A-B),则表示被检索文献在含有检索词A而不含有检索词B时才能被命中。
例如,要检索有关―能源‖方面的文献,但涉及―核能‖方面的文献不要,检索逻辑式可表示为:energy NOT nuclear(energy –nuclear)。
1、搜索引擎的定义搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具,简言之,搜索引擎就是一种在因特网上查找信息的工具。
用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果反馈给用户。
搜索引擎一般都有固定的显示格式,内容详简程度不一,常常带有URL、题名、标题、关键词、摘要(文本描述摘录)、超链接文件大小、检索结果总数、相关度估计、评论等。
搜索引擎的检索结果一般按查询的相关程度进行排列,最相关的通常排在最前面。
2、搜索引擎的常用检索方法(1)简单搜索(simple search)指输入一个单词(关键词),提交搜索引擎检索后反馈结果。
它也叫单词搜索。
第3章_搜索引擎及网络信息检索
网和常青藤等。
优点:准确性高。
23
3.1.4 主题搜索引擎的关键词语法规则 3、检索式的运算符号
1) 使用逻辑运算算符
第3章 搜索引擎及网络信息检索
3.1 基本知识
3.2 典型的搜索引擎 3.3 搜索引擎的检索技巧 3.4 免费学术资源检索与利用
1
3.1 基本知识
3.1.1 基本概念
3.1.2 搜索引擎的优点和缺点 3.1.3 搜索引擎的类型
2
3.1.1 基本概念 1.搜索引擎
搜索引擎是Internet上的一种网站,它的主要任务
2) 使用位臵算符 3) 使用字段限定
24
3.1.4 主题搜索引擎的关键词语法规则
1) 使用逻辑运算算符 搜索引擎基本上都支持“与”、“或”、“非”、 括号或引号等逻辑运算符号,不同的搜索引擎使用的 逻辑符不完全相同。 • “AND” 在中文搜索引擎都可以用空格代替; • “NOT” 有时可以用减号代替,格式如: “关键词A - 关键词B”,减号前面要有空格。B”。Google直接用 “OR”表示,格式是“关键词A OR 关键词B”。
38
3.4 免费学术资源检索与利用
DOAJ开放获取期刊目录 DOAJ (Directory of Open Access Journals)是由瑞 典隆德大学图书馆 2003 年 5 月推出的开放获取期刊的 检索系统。DOAJ 按期刊的学科主题分为 17 类,包括 Ag riculture and Food Sciences , Arts and Architect ure , Biology and Life Sciences , Business and Economics , Chemistry , Earth and Environmental Sciences , General Works , Health Sciences , H istory and Archaeology , Languages and Literatur es , Law and Political Science , Mathematics an d Statistics , Philosophy and Religion , Physic s and Astronomy , Science General , Social Scie nces , Technology and Engineering 。 / 39
第三章 电子图书与书目信息检索
3.1 电子图书概述
• 3 类型
按载体材料划分:
电子图书阅读器;PC电子图书; 网络(在线)电子图书;光盘电子图书
按存储格式划分:
图像格式,文本格式,多媒体格式
常见电子图书格式
3.2 电子图书信息检索
• 典型电子图书数据库介绍
• 超星数字图书馆 • 方正Apabi电子图书 • 美星外文数字图书馆
超星数字图书馆
1 概述
• 超星数字图书馆成立于1993年,是国家“863”计划中国数字图书馆示 范工程项目,长期致力于纸张图文资料数字化技术开发及相关应用与 推广,是国内专业的数字图书馆解决方案提供商和数字图书资源提供 商。 • 超星数字图书馆有丰富的电子图书资源提供阅读,涵盖中图法22大类, 包括文学、历史、法律、军事、经济、科学、医药、工程、建筑、交 通、计算机、环保等。超星数字图书馆目前已制作完成200万种电子 图书,可供用户使用120多万种,其中2003年以后的新书近 30万种, 年加工能力为20万种(1亿页),保证每年加工适合高校使用的图书 为5~8万册,每天仍在不断的增加与更新。 • 超星电子图书采用国际领先算法和图像压缩技术,在保证图像质量的 前提下占用最小的空间,图像清晰,保证图书的原貌,文字识别正确 率达到98%以上,二次利用相对较为方便,是全国乃至全球最大的中 文图书网站。
其他重要电子图书数据库简介
• Springer-Link电子图书数据库 • 施普林格在线电子图书系列(Springer eBook Collection)是由世界著名的科技出版集团——德国施普 林格(Springer-Verlag)推出的全球最大规模,最具综 合性的电子版科技及医学(STM)图书,通过Springer LINK系统提供在线服务。Springer-Link在线电子图书系 列涵盖Springer全系列的图书产品,包括专题著作、教科 书、手册、地图、参考文献、丛书等,涉及人文、科技以 及医学领域的13个学科,并有两个特色图书馆——中国在 线科学图书馆和俄罗斯在线科学图书馆。
信息检索第三章EI
印刷版EI 编排结构与著录
正文:即文摘部分,是EI的主体。由一些文摘 条目组成,并以规范主题词为标目。主题词取 自规范词表。1992年以前使用《工程标题词 表》,1993年起使用《EI叙词表》
印刷版EI (月刊、年刊) 索引
月刊索引:著者索引、主题索引
年刊索引:著者索引、主题索引、 工程出版物索引
附录
EI文摘正文著录格式
叙词
COMPUTER AIDED INSTRUCTION
文…摘…号…
文献篇名
文摘内容
009057 Current situations and future directions of
intelligent CAI research/development . This pa-per
• PL以连续出版物的缩写题名字母为序编排。
• 著录内容包括:连续出版物的缩写题名、连续出 版物的全称、计算机识别代码与ISSN号。 • PL的主要作用:通过EI文摘正文给出的刊名缩 写查找连续出版物(期刊)的全称,从而通过查 找馆藏目录,获取原文。
J Inf Image Manage① Journal of Information and image Management② JIIMDW③
第三章 外文检索工具
常用外文检索工具
美国《工程索引》 英国《科学文摘》 美国《科学引文索引》 美国《科技会议录索引》
3.1 美国《工程索引》EI
1 概述 2 印刷版EI编排结构与著录 3 EI标题词表与叙词表 4 EI检索方法及检索示例
EI 概 述
• 美国《工程索引》 (The Engineering Index),简称EI • 1884年创刊,由美国工程信息公司编辑
第三章信息检索的基本理论
第三章信息检索的基本理论目的要求了解信息检索系统的概念;了解手工信息检索系统的类型;熟悉手工信息检索系统的结构;掌握手工信息检索系统的著录格式和常用的手工信息检索系统的信息检索方法。
掌握计算机信息检索系统的构成和类型;掌握信息检索语言的基本类型;掌握信息检索原理。
第一节信息检索系统一、信息检索系统的概述信息检索系统是指由一定的设备和信息集合构成,具有一定存储、检索与传送技术设备,提供一定的存贮与检索方法及检索服务功能的工作系统。
简单地说,信息检索系统即信息的存贮和检索的系统。
广义:信息检索系统是包括了从信息采集到检索全过程的服务体系。
狭义:信息技术系统就是用户检索信息时所使用的检索工具。
信息检索系统具有输入功能、存贮功能、处理功能、输出功能及控制功能。
根据信息存贮和检索所设备和手段的不同,信息检索系统可分为两大类型,即:手工信息检索系统和计算机信息检索系统。
目前,信息检索系统已从传统的手工检索系统发展到计算机网络信息检索系统。
二、手工信息检索系统1、手工信息检索系统的类型书本式检索工具(期刊式检索工具、单卷式检索工具、附录式检索工具)和卡片式检索工具。
期刊式检索工具:指在一个题名之下,定期连续发行的一种检索工具。
它具有及时性、连续性和稳定性的特点。
例如各种文摘杂志、索引刊物、连续的馆藏目录等。
这种形式的检索工具,及时反映新出版、新发表、新入藏的文献信息,它随着新文献的不断出现而不断连续出版,保持与文献的平行发展关系。
因此科研工作者为了掌握和了解本学科的科研动态,定期查阅期刊式检索工具是一种非常有效的方法。
同时由于期刊式检索工具的连续性的特点,不少期刊式检索工具,每到一定时间累积后,对于回溯检索极为方便。
单卷式检索工具:这种检索工具多数是以一定的专题内容而编印的,选题一般具有独立的意义。
它专业性强,收集的文献比较集中,往往积累反映一个相当长时间的文献,并以特定范围的读者作为对象。
单卷式检索工具收录文献一般比较全面系统,排列组织比较切合专业研究的需要,因此,对于专题文献检索比较方便,使用价值较高。
第三章文献信息检索的基本知识
第三章文献信息检索基本知识随着信息技术的发展,互联网的应用得到广泛普及,信息环境发生了相当大的变化,应用现代化技术手段获取各种信息、知识成为高等院校师生与广大科技工作者的一种必备知识和技能。
为此,首先就必须了解文献信息检索的基本知识。
第一节信息检索的基本原理一、信息检索的概念信息检索(Information Retrieval)全称为“信息存储与检索”(Information Storage and Retrieval),其概念有广义和狭义之分。
广义上认为,信息检索包括文献信息的存储和检索两个方面,即一个完整的信息检索系统由信息存储子系统和信息检索子系统两部分组成。
信息存储子系统:首先对一定数量的信息进行筛选,把能够描述文献信息的外部特征和内部特征进行加工、整理,使之有序化,形成信息特征标识集合,然后将之存储在某种载体上,编制成为检索工具或建立一个数据库。
信息检索子系统:根据信息用户的特定需求,对用户需求进行主题分析,利用一定的检索方法和检索技术,对存储子系统中的特征标识进行比对,把需要的文献线索或知识信息从系统中查找出来的过程,即信息检索。
这就是通常人们所说的信息检索过程,也就是狭义上的信息检索。
信息存储与信息检索是意义不同却又相互联系、相互依存、不可分割的两个过程。
信息存储是为了检索,信息检索又必须先有信息存储。
如果没有存储,检索就无法实现;没有检索,信息存储也就变得没有意义。
所以说存储是检索的前提和基础,检索是存储的目的。
信息检索系统的工作原理如图3-1所示。
图3-1 信息检索系统的工作原理二、 信息检索的类型信息检索可以按不同的划分标准划分为不同的类型。
(一)、 根据检索内容划分根据检索信息内容不同可划分为文献信息检索、事实信息检索和数据信息检索。
1、文献信息检索(document retrieval ):是以文献(包括目录、索引、文摘等二次文献或全文)为检索对象,查找有关文献的出处和收藏处等信息,都属于文献信息检索范畴。
第三章 信息检索基本方法
3.2.3 截词检索
通常用“ *”表示无限阶段,用“?”表示有限阶 段。 无限截词符“*”,代表零至无数多个字母; computer* computer;computered ;computering; 有限截词符“?”,只能代表一个字母; teen? teens 例如: *chemi* chemical、chemist、chemistry、 electrochemistry、electrochemical、 physicochemical、thermochemistry
引文检索语言就是根据上述原理, 以引文为标识标引或检索文献,而 引文标识的全体就构成了引文检索 语言。 例如著名的《科学引文索引》 (SCI)、《社会科学引文索引》 (SSCI)、《艺术与人文科学引文索 引》(A&HCI)就是使用的这种引文 检索语言。
2.根据组配方式划分
先组式语言 事先用固定关系组配好,并编制在词表中, 标引人员和用户使用时必须根据词表选用 组配好的主题标识进行操作。例如体系分 类法和标题词法都属于此类。
(n)算符near:
(n)要求被连接的检索词必须紧密相连,词之间除 允许有空格、标点、连字符外,不得夹单词或字 母,词序不限; (Nn)表示两个检索词之间最多可以夹N个词(N为 自然数1、2、3…),且词序任意。 例如:information(n)retrieval
information retrieval 、 retrieval- information, economic(2n) recovery economic recovery 、 recovery from economic troubles
• •
•
引文途径
两种操作方法: 一是利用检索工具如SCI,通过被引用 文献入手,查找引用文献; 二是通过引用文献(来源文献)入手, 直接利用文献结尾所附的参考文献, 查找被引用文献。
第三章_信息检索步骤
在文章的发表过程中,可能存在着“二八定理”。对 该“领军人物”或课题组进行全方位检索,收获将很大。 因此在实际操作过程中我们除用关键词途径检索外,也可 根据自己已找到或导师推荐阅读的某相关文章的作者(研 究机构)进行搜索,通常同一作者(研究机构)研究的方 向都围绕一个中心,先看所著的一篇论文,然后再搜其他 的,得到的很可能就是所研究问题的延续或另外一种解决 办法。
第四步:评价信息
——在对不同信息源进行检索之后,取得的文献信 息数量可能相当庞大,内容也有相互重复甚至冲
突的地方。这就需要有一定的评价方法对信息进
行筛选,找到那些来源可靠,内容相关且详尽的
文献,剔除错误、过时、不相关的信息。
1
信息检索五步走
第五步:分析、利用信息
筛选后的检索结果来源广泛,内容涉及方方面面。如 何有效组织整理,以提炼出一个综合性的信息内容, 完成报告的编撰是这一步骤的主要工作。 此时选用相关的工具将检索结果有效组织,将极大减 少工作量。同时进一步通过阅读确定:哪些信息是切 合需要的?哪些信息表述内容之间存在冲突,需要进 一步考察?并依据相关规范正确引用文献资源,最终 形成文字性的研究成果。
信息获取的思路
如果需要查找中文文献则更为方便 中国知网、维普、万方都提供文摘检 索,收录量都比较大,为稳妥起见有条件 的也要每个库都检索一遍
3
信息获取的思路
对于没有条件检索以上文摘库的读者,一 个比较好的办法是在Google Scholar里查, 有线索了再去查全文 也可根据自己课题学科选择相应的几个全 文数据库进行检索
3
需要一 般性、数 据库无法 获取全文
网页
数据库
印刷型资源
但无论选择哪种方式 都是首先获取题录信息,然后获取全文这样一个过程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概
述
中国期刊全文数据库由清华同方数据公司制作,
的学术会议论文,部分文献均有少量回溯。每年增加
论文约百万余篇。
检索技术
* 表示匹配任意0个或多个字符,例如:计算机*研究, 表示查找包括“计算机研究”、“计算机软件研究”、 “计算机辅助设计研究”等的记录。
^ 表示匹配输入字符串的开始或结束位置,例如: ^小麦,表示查找以小麦打头的记录;研究^,表示 查找以研究结尾的记录。 布尔运算符:and or not
第三章 中文信息检索
第一节 第二节 第三节 第四节 第五节 第六节 第七节 中文检索工具概述 中文科技期刊数据库 中国期刊全文数据库 万方数据资源系统 人大复印资料数据库 电子图书 图书馆书目查询
第一节 中文检索工具概述
一、中文检索工具发展概述
二、中文检索工具的编排 三、中文检索工具常用的检索途径
同名作者功能默认关闭, 选中既打开(只有在选择 了作者、第一作者检索入
口时才生效)。输入作者
姓名检索时会提示同名作 者的单位列表,选择想要 的单位,点击页底的确定
即可精确检出(如果不全
选,一次最多只能选择五 个位)。
杨长平
检索区
3.期刊范围
期刊范围分为全 部、重点和核心 期刊,默认为全
部期刊,可选择
存储检索结果记录,以备过后查看。
保存题录
保存题录
保存题录
工具书
工具书
数字搜索
数字搜索
学术定义
学术定义
学术定义
翻译助手
翻译助手
翻译助手
学术趋势
学术趋势
一 二 三 四
概述 检索技术 检索方法 结果处理
概 述 ———————————————
万方数据股份有限公司是国内第一家以信息服务
3.会议论文全文数据库: 该库收录了1998-2004年国家一级学会在国内组 织召开的全国性学术会议近7000余个会议,45万余篇 会议论文全文,是目前国内收录会议数量最多的会议 论文数据库。
概 述 ———————————————
4.中国标准全文数据库
本库收录了国内外的大量标准,包括中国国家发 布的全部标准、某些行业的行业标准以及电气和电子 工程师技术标准;收录了国际标准数据库、美英德等 的国家标准,以及国际电工标准;还收录了某些国家 的行业标准。
为核心的股份制高新技术企业,是在互 联网领域,
集信息资源产品、信息增值服务和信息处理方案为一 体的综合信息服务商。 按照资源类型来分,万方数据资源可以分为全文 类信息资源、文摘题录类信息资源及事实型动态信息 资源。全文资源包括会议论文全文、学位论文全文、 法律法规全文、期刊论文全文。
概 述 ———————————————
简单检索
点击
简单检索
复合检索(1)
二次检索
点击
复合检索(1)
二次检索
重新输入 检索词
点击
复合检索(1)
二次检索
在同一字段检索
复合检索(1)
二次检索
在不同字段检索
复合检索(2)
输入检索式
在同一字段检索
复合检索(2)
输入检索式
在不同字段检索
高级检索
在数据库检索区,通过点击“高级检索”,
数据库》始建于1988年,由万方数据联合国内近百
家信息机构共同开发。
概 述 ———————————————
7.外文文献数据库
包括“外文期刊”和“外文会议论文”。 “外文期刊”主要收录了1995年以来世界各国出版 的12000多种重要学术期刊;“外文会议论文”主要 收录了1985年以来世界各主要学协会、出版机构出版
范围检索。
杨长平
检索区
检 索 入 口
用鼠标点击“检索入口”下拉菜
单,有九个检索入口供选择。选
定某一检索入口后,可在检索输 入框输入检索词,点击“检索”
按钮后,即实现相应的检索。
检索区
* 系统默认的年限为2000-2006,也可以在任意年度之间 限定。
* 系统提供了模糊和精确检索方式的可选项,默认模糊检
括按数据库分类浏览和按期刊浏览。
资源浏览
资 源 分 类 导 航 区 资源简介区
检 索 区
资源浏览
按数据库分类浏览
资源浏览
按数据库分类浏览
资源浏览
按数据库分类浏览
资源浏览
直 接 输 入 检 索 词
按数据库分类浏览
资源浏览
按数据库分类浏览
收录1994年以来的期刊8200余种,内容覆盖自然科学
和社会科学的各学科。 覆盖范围:理工A(数理化天地生)、理工B(化 学化工能源与材料)、理工C(工业技术)、农业、医 药卫生、文史哲、经济政治与法律、教育与社会科学 、
电子技术与信息科学.
产品形式:WEB版、光盘版、专题全文数据库
CNKI的检索方式:
索。只有在选定关键词、刊名、作者、第一作者和分类号 这5 个字段进行检索时,精确检索功能才生效。
* 在进行题录下载时,系统提供了“当前记录”、“标记
记录”和“全部记录”的可选项,系统默认的是“当前记 录”。
导航区
简单检索
传 统 检 索
复合检索
二次检索
直接输入检索式
简单检索
简单检索
显示检索结果
即可进入高级检索页面。高级检索提供了两种
方式供读者选择使用:向导式检索和直接输入
检索式检索。
高级检索
向导 式检索
直接输 入检索式
杨长平
高级检索(1)
向导式检索
向导式检索为读者提供分栏式检索词输入 方法。可选择逻辑运算、检索项、匹配度外,
还可以进行相应字段扩展信息的限定,最大程
度的提高了“检准率”。
打印
打印题录或文摘
打印
打印全文
加入电子书架
我的电子书架保存的是在检索结果页面勾选“加入电子书架” 中的文章,最多能保存100条信息。
加入电子书架
电子书架中保存的文章可整理、删除。
第三节 中国期刊全文数据库
一、概述 二、检索方法 三、下载、保存 四、辅助功能
概 述
CNKI(National Knowledge Infrastructure)概述
中文检索工具发展概述
1.印刷本:到1965年,我国出版的检索刊物共计 139种;1990年156种。
2.文献数据库:我国文献数据库的建设从80年代
初期开始,到1991年底,在国家科委信息司注册的各 类数据库为806个,共计5000万条记录。据1995年有关 部门的统计资料,我国有各类数据库1200多个。
首 页
概 述 ———————————————
1.学位论文全文数据库: 该库收录了自1980年以来我国自然科学领域博士、 博士后及硕士研究生论文,其中全文60万多篇。每年 稳定新增15万篇左右。 2.数字化期刊子系统: 该库有全文期刊近5000余种,内容涉及各专业, 自然科学较多。
概 述 ———————————————
在系统首页中点击“跨库检索”导航栏目链接进 入万方数据资源标准镜像系统跨库检索页面。系统提 供了两种检索界面,分别是“经典检索界面”和“专 业检索界面”。
跨库检索
检索 入口区
变更检 索范围区
经典检索界面
跨库检索
专业检索
比高级检索
功能更强大, 但需要检索 人员根据系
统的检索语
法编制检索 式进行检索。
5. 中文检索工具的优点
6. 我国检索刊物体系的弊端
中文检索工具的编排
1. 统一的分类法 《中国图书资料分类法》
2. 统一的主题词表
《汉语主题词表》 3. 著录
《检索刊物条目著录规则》
中文检索工具常用的检索途径 1.分类途径 2.著者途径 3.主题途径
第二节 中文科技期刊数据库
一、数据库简介 二、检索方法 三、检索结果的处理
分类检索
期刊导航
期刊导航-1
直接输入刊名进行检索
期刊导航-1
期刊导航-1
期刊导航-2
按分类进行检索
期刊导航-2
检索结果处理
1 2 3
下载 打印 加入电子书架
题录下载
传统检索的下载方式,每次最多200条。
题录下载
题录下载
快速、高级、分类检索的下载方式
题录下载
全文下载
打印
打印题录或文摘
高级检索(1)
向导式检索
高级检索(1)
向导式检索
高级检索(2)
输入检索式
高级检索(2)
输入检索式
高级检索(2)
输入检索式
分类检索
1 在分类表中选 择分类,将勾选 的分类添加到右 边“所选分类” 方框中。 2 如果要删除某 一所选分类,可 在点击该分类后 直接双击删除。 3 在检索框处选 择检索入口,输 入检索条件,在 所选分类中进行 再限制检索。
快速检索
快速检索
传统检索
检索区
导航区
概览区 细览区
检索区
1.同义词
同义词功能默认关闭, 选中既打开(只有在 选择了关键词检索入 口时才生效)。例: 输入关键词“马铃薯” 检索时会提示“春马 铃薯、土豆、洋芋” 等是否同时选中作为 检索条件,就可以有 选择的扩大检索的命 中范围。
检索区
2.同名作者
一、数据库简介
中文科技期刊数据库是科技部西南信息中心重庆维
普资讯公司出版发行的综合性文献数据库。89--99年收 录自然科学、工程技术等领域期刊7000余种,2000年起 收录自然科学、工程技术等领域以及社会科学等中文期 刊8000余种,其中含港台核心期刊200余种;每年新增数