第三章网络信息检索工具
第三章计算机检索原理自动化
4.4.3 (S),意思是subfield或sentence, 它表示连结的两个检索词要在同一个子 字段或同一句话中出现。如:S computer (s) library是要求computer 和 library在同一个句子中出现S cs=wuhan (s)university 是要求wuhan和 university在cs字段中的 同一个子字段出现。 4.4.4(F),意思是field,表示连结的两个 词要在同一个字段中出现。如:S fieldbus (f)multimedia是要求fieldbus 和 multimedia在同一个字段中出现。
以上是计算机中常用的位置算符,但并非 所有的系统都可用,不同的检索系统有其自己 的规定。
5.计算机检索策略的制定及调整
1. 概念的选取 (1)核心概念的选取:
变温条件下煤层损伤与瓦斯运移的热流固 耦合模型
(2)发掘隐含概念: 并购—剥离、拍卖;石质文物的保护 (3)考虑同义词:保护conservation, preservation,protection (4)使用规范的用语:行业术语,用词表来规范:单车-自行车 (5)排除不必要的概念:使用专业数据库或通用词 (6)使用准确的代码:标准号、专利号、产品代码
4.4 位置算符
位置算符是用来规定检索词之间的位置 关系的算符: 4.4.1.(w), (nW), 意思是with, 表示它连 结的两个词前后位置确定,中间插词不 能超过0-n个。 (w)也写作(),实际上 是 (0W),表示连接的两个词必须紧密相 连,中间不能插词,但是中间可以加连 字符。如:S motor (W)lorry, 可以检出 motor-lorry和motor lorry。
第三章 计算机检索原理
第三章 信息检索的基本知识
1、逻辑“或”(和) 、逻辑“
————————————————— A
B
用符号“ 或 表示, 用符号“or”或“+”表示,其逻辑表达式为: 表示 其逻辑表达式为: A or B 或 A+B 其意义为检索记录中凡含有检索词A或检索词 , 其意义为检索记录中凡含有检索词 或检索词B, 或检索词 或同时含有检索词A和 的 均为命中文献。 或同时含有检索词 和B的,均为命中文献。
分 析 课 题
检索词: 检索词: : :
富营养化(水华), ),处理 富营养化(水华),处理 治理,修复), ),湖泊 (治理,修复),湖泊
ቤተ መጻሕፍቲ ባይዱ
, ,
,
检索工具: 检索工具:
1. 2. 3. 4. 5. 6. 7. 8. 中文科技期刊全文数据库(维普) 1989中文科技期刊全文数据库(维普) 1989-现在 中国科技成果数据库(万方) 1986中国科技成果数据库(万方) 1986-现在 中国期刊全文数据库(同方) 1979中国期刊全文数据库(同方) 1979-现在 中国优秀博硕士学位论文全文数据库(同方)1999中国优秀博硕士学位论文全文数据库(同方)1999-现在 中国学位论文文摘数据库(万方) 1989中国学位论文文摘数据库(万方) 1989-现在 中国学术会议论文全文数据库(万方) 1995中国学术会议论文全文数据库(万方) 1995-现在 中国重要会议论文全文数据库(同方) 2000中国重要会议论文全文数据库(同方) 2000-现在 中国重大科技成果数据库(万方) 1990中国重大科技成果数据库(万方) 1990-现在
中图分类法
中图法》 个基本部类, 《中图法》分 5个基本部类,将知识门类分为 哲学” 社会科学” 自然科学” “哲学”、“社会科学”、“自然科学”三大部 马克思主义、列宁主义、 类。马克思主义、列宁主义、毛泽东思想是指导 我们思想的理论基础,作为一个基本部类, 我们思想的理论基础,作为一个基本部类,列于 首位。此外,考虑到图书本身的特点, 首位。此外,考虑到图书本身的特点,对于一些 内容庞杂,类无专属, 内容庞杂,类无专属,无法按某一学科内容性质 分类的图书,概括为“综合性图书” 分类的图书,概括为“综合性图书”,作为一个 基本部类,置于最后。 22个大 基本部类,置于最后。在此基础上扩展为 22个大 类。 标记符号采用拉丁字母与阿拉伯数字相结合的混 合号码制。 合号码制。
第三章图书信息的检索
Company Logo
【期刊论文】王健等.金生宝胶囊治疗22例HIV感
染者的临床研究[J].中国中医基础医学杂志,
2000,6(7):33-35.
斜体字代表论文的篇名,“[J]”是文献类型标识符, journal代表期刊论文。该论文发表在《中国中医基础医学杂志》 上。“2000,6(7):33-35.”则表明论文所登载的卷期号和页 码,表示为:2000年出版的第6卷第7期第33-35页。
电子图书、电子期刊、学位论文检索
网络信息资源检索(搜索引擎)
前面课程回顾
信息的来源叫做【信息源】。信息源可按 不同的方法 分类描述,比较常见的分类方法
有如下【三种】:
1、按信息的【载体形式】划分(电子文献 等); 2、按信息【加工的级别】划分(四次文献); 3、按信息的【发布形式】划分(十大文献信 息源等)
有电子化)。
电子图书还有一部分只有电子版,没有纸本版,
在网上大家可以用搜索引擎找到这样的电子图 书。 电子图书正在逐步发展成为比较主要的数字信 息资源。
图书馆的电子图书资源
书生之家电子图书
超星数字图书馆
方正阿帕比电子教参书
“读秀”学术搜索
什么是读秀?
读秀是由海量全文数据及资料基本信息组成的
【优先算符】
例如:( ,在实际查 询时,真正的关键字是“知识经济”或“信息经济”。 以上四种操作符可互相结合使用,但有一定的执行先后次序,其 【优先顺序】依次为:括号、NOT、AND、OR
知识or信息)and经济
布尔逻辑(语言)检索
布尔逻辑语言的应用,是文献信息检索的一个重要方法。其【运 算符有三种】1.AND(逻辑与),指两个概念的交集;2.OR(逻 辑或),指两个概念的并集;3.NOT(逻辑非),指两个交叉概念 中去除交叉的部分。
课件:第三章 常用检索工具
Scopus数据库 ——检索结果输出
➢ 支持导出、下 载、查看引文、 查看施引文献 等多种显示方 式
➢ 注意导出记录 的格式依参考 文献的类型确 定
Scopus数据库
➢ 支持对检索 记录进行多 个方面的分 析,如:机 构、主题、 作者、国别、 出版年、来 源出版物、 文献类型的 筛选
——检索结果分析
➢1973年,社会科学引文索引(Social Sciences Citation Index, SSCI)的问世,其学科覆盖范围扩展到了社会科学;
➢1978年推出的艺术与人文引文索引(Arts & Humanities Citation Index,A&HCI)又将其内容扩展到了艺术人文领 域。
Web of Science 平台 ——SCI创始人Eugene Garfield
Scopus数据库 ——数据库概况
➢ Scopus是目前全球规模最大的文摘和引文数据库,由总部设在荷 兰阿姆斯特丹的Elsevier公司出版.Elsevier是一家经营科学、技术 和医学信息产品及出版服务的世界一流出版集团
➢ Scopus涵盖了由5000多家出版商出版发行的文献,可以检索到 1966年以来16500种同行评审期刊,其中包括1200种开放存取期 刊,以及集成网络资源的专利信息库
➢ 支持二次检索
➢ 对检索结果可以按文献 来源、关键词再分类
➢ 可以按学科、年代、作 者、机构等分组浏览
➢ 可以按主题、发表时间、 被引次数、下载次数分 别排序
中文常用检索工具 ——中国知网输出检索结果
➢ 支持查新格式、 多种参考文献 管理软件格式、 自定义等输出 格式
➢ 支持复制到剪 贴板、打印、 导出等输出 方式
Web of Science 平台 ——检索结果页面
现代信息检索教程第三章(中文10春)
检索方法 全国报刊索引》编排方式是按类编排, 《全国报刊索引》编排方式是按类编排,同时每期后 面附有著者索引, 面附有著者索引,因此该检索工具的检索途径主要有分 类途径和著者途径。 类途径和著者途径。 检索有关国内“音乐事业”的文献。 例:检索有关国内“音乐事业”的文献。 检索工具《全国报刊索引》哲社版2008 12期 2008第 ①检索工具《全国报刊索引》哲社版2008第12期 检索途径: ②检索途径:分类途径 检索过程:查分类目录,一级类艺术J ③检索过程:查分类目录,一级类艺术J,二级类为 J6音乐,其下又有三级类J69音乐事业,页码P295,翻 J6音乐 其下又有三级类J69音乐事业 页码P295, 音乐, 音乐事业, 到该处浏览, P295得 篇文献是切题的。 到该处浏览,在P295得3篇文献是切题的。 检索结果: 篇相关文献,顺序号为:081217152、 ④检索结果:得3篇相关文献,顺序号为:081217152、 081217153、 081217154。 081217153、 081217154。
返回目 录
4.其它重要百科全书 钱伯斯百科全书》 《钱伯斯百科全书》、《美国学术百科全 世界图书百科全书》 书》、《世界图书百科全书》、《计算机 科学与技术百科全书》、《柯克-奥斯莫化 科学与技术百科全书》 柯克工大全》)、《布罗克豪斯百科全书》 工大全》)、《布罗克豪斯百科全书》、 拉鲁斯大百科全书》 《拉鲁斯大百科全书》、《苏联大百科全 书 》 等。
返回目 录
百科全书(Encyclopedia) 二、百科全书(Encyclopedia) 百科全书是汇总浓缩人类所有知识门类或某一知 识门类的全部知识、 识门类的全部知识、按辞典形式编排的大型参考 工具书。以其知识广博、资料精确、释文严谨、 工具书。以其知识广博、资料精确、释文严谨、 文字简明、体例严密, 文字简明、体例严密,以及兼具多种参考工具书 功能的特质,被称为“工具书之王” 功能的特质,被称为“工具书之王”、“精简的 没有围墙的大学” 图书馆” 图书馆”、“没有围墙的大学”,是参考工具书 中最重要的类型, 中最重要的类型,已成为衡量一个国家科学文化 发展的尺度之一。 发展的尺度之一。
第三章 信息检索教程
举例:期刊2
23
期刊著录格式
24
期刊的著录
写出下面期刊文献著录:
25
小节练习1
1. 什么是文献著录? 2.文献著录的结果是—— 3. 既著录主要项目,还著录全部选择项目的著录级次称为—— 4. 既著录主要项目,还著录部分选择项目的著录级次称为——
26
3.2 机读目录与元数据
3.2.1 机读目录
43
3.2.3 都柏林核心元数据和机读目录的比较
1. 著录的对象不同
DC与 MARC的 3. 著录的主体不同 比较 4. 著录的详简程度不同
5. 标识的方法不同
2. 数据的形式不同
44
小节练习2
1、什么是机读目录,一条CNMARC机读目 录的组成? 2、头标区数据元素: 00123cbm1#2200277###52## 其中c、b、m、1分别表示什么? 3、什么是元数据?
12
图书的著录(参考文献著录规则)
13
14
图书著录中的文献类型标志
常用文献类型用单字母标识,具体如下: (1)期刊[J](journal) (2)专著[M](monograph) (3)论文集[C](collected papers) (4)学位论文[D](dissertation) (5)专利[P](patent) (6)技术标准[S](standardization) (7)报纸[N](newspaper article) (8)科技报告[R](report)
CNMARC记录
记录头标区
地址目次区
数据字段区
记录分隔符
注:各字段数据元素及其标准详细情况参见教材P83-87
33
ISO-2709的机读目录标准
《信息检索教案》课件
《信息检索教案》PPT课件第一章:信息检索概述1.1 信息检索的定义解释信息检索的概念和意义强调信息检索在学术研究和日常生活的重要性1.2 信息检索的类型介绍不同类型的信息检索方法,如手工检索、计算机检索等解释各种检索方法的优缺点和适用场景1.3 信息检索的流程介绍信息检索的基本步骤,如确定检索需求、选择检索工具等提供实用的检索技巧和策略,帮助学生更有效地获取信息第二章:检索工具与数据库2.1 检索工具的类型介绍不同类型的检索工具,如目录、索引、文摘等强调各种检索工具的特点和适用场景2.2 数据库的类型介绍不同类型的数据库,如文献数据库、全文数据库等解释各种数据库的优缺点和适用场景2.3 检索工具与数据库的选择提供选择检索工具和数据库的依据和方法强调选择合适的工具和数据库对信息检索的重要性第三章:网络信息检索3.1 搜索引擎的使用介绍搜索引擎的概念和原理讲解如何有效地使用搜索引擎进行信息检索3.2 学术搜索引擎的使用介绍学术搜索引擎的概念和特点讲解如何利用学术搜索引擎获取学术信息3.3 社交媒体与网络信息检索介绍社交媒体在信息检索中的应用强调社交媒体在获取实时信息和社交网络分析中的价值第四章:信息检索技巧与策略4.1 检索关键词的选择讲解如何选择合适的检索关键词提供关键词选择的方法和技巧4.2 布尔逻辑检索介绍布尔逻辑检索的概念和原理讲解如何运用布尔逻辑提高检索效果4.3 短语检索与位置算符介绍短语检索和位置算符的概念和用法强调短语检索和位置算符在精确检索中的重要性第五章:信息检索实践与应用5.1 学术研究中的应用讲解信息检索在学术研究中的重要性演示如何利用信息检索进行文献综述和实证研究5.2 日常生活中的应用讲解信息检索在日常生活中的应用案例强调信息检索对提高生活质量的重要性5.3 信息检索的道德与法律问题介绍信息检索中的道德和法律问题,如版权、隐私等强调信息检索时应注意的道德和法律规范第六章:特定信息类型的检索6.1 图像和多媒体信息的检索介绍如何检索图像和多媒体信息演示使用图像搜索引擎和多媒体数据库的技巧6.2 统计数据的检索讲解如何检索统计数据介绍使用政府统计网站和专业统计数据库的方法6.3 专利信息的检索介绍如何检索专利信息演示使用专利数据库进行检索的步骤和技巧第七章:信息评估与批判性思维7.1 信息评估的标准讲解评估信息质量的标准和原则强调批判性思维在信息评估中的重要性7.2 识别信息源的可靠性介绍如何识别和评估信息源的可靠性分析不同类型信息源的可信度和偏见7.3 信息批判性思维的实践讲解如何运用批判性思维分析信息演示通过信息检索进行批判性思维实践的案例第八章:信息素养与终身学习8.1 信息素养的概念解释信息素养的内涵和外延强调信息素养在现代社会的重要性8.2 培养信息素养的策略介绍培养个人信息素养的策略和方法强调终身学习在维持和提升信息素养中的作用8.3 信息素养的实践应用讲解信息素养在个人和专业生活中的应用演示如何利用信息素养解决实际问题第九章:信息检索的未来趋势9.1 与信息检索介绍在信息检索中的应用探讨如何改变信息检索的方式9.2 大数据与信息检索讲解大数据对信息检索的影响探讨大数据时代信息检索的新挑战和新机遇9.3 未来信息检索技术的发展趋势预测未来信息检索技术的发展方向强调终身学习的重要性以适应不断变化的技术环境第十章:综合实践与案例分析10.1 综合实践项目设计设计一个综合实践项目,要求学生应用所学信息检索技能提供项目实施步骤和评估标准10.2 案例分析与讨论提供几个案例分析,要求学生应用信息检索技能解决问题鼓励学生进行讨论,分享他们的思考和经验10.3 课程总结与展望总结整个课程的重点和难点展望信息检索领域的发展前景,鼓励学生持续学习和探索重点解析本文教案主要涵盖了信息检索的概述、检索工具与数据库的选择、网络信息检索、信息检索技巧与策略、信息检索实践与应用、特定信息类型的检索、信息评估与批判性思维、信息素养与终身学习、信息检索的未来趋势以及综合实践与案例分析等十个章节。
第三章 网络信息检索
第三章网络信息检索第一节网络信息检索的基本方法1、布尔逻辑检索逻辑检索是一种比较成熟、较为流行的检索技术。
逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符,主要的运算符有:(1)逻辑―与‖逻辑―与‖用AND(或﹡)表示。
检索词A、B若用逻辑―与‖相连,即A AND B(A*B),则表示同时含有这两个检索词才能被命中。
例如,要检索儿童教育的文献,检索逻辑式可表示为:child AND education(2)逻辑―或‖逻辑―或‖用OR(或+)表示。
检索词A、B若用逻辑―或‖相连,即A OR B(A+B),则表示只要含有其中一个检索词或同时含有这两个检索词的文献都将被命中。
例如,要检索―计算机‖或―机器人‖方面的文献,检索逻辑式可表示为:computer OR robot. (3)逻辑―非‖逻辑―非‖用NOT(AND NOT,BUT NOT)(或-)表示。
检索词A、B若用―非‖相连,即A NOT B(A-B),则表示被检索文献在含有检索词A而不含有检索词B时才能被命中。
例如,要检索有关―能源‖方面的文献,但涉及―核能‖方面的文献不要,检索逻辑式可表示为:energy NOT nuclear(energy –nuclear)。
1、搜索引擎的定义搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具,简言之,搜索引擎就是一种在因特网上查找信息的工具。
用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果反馈给用户。
搜索引擎一般都有固定的显示格式,内容详简程度不一,常常带有URL、题名、标题、关键词、摘要(文本描述摘录)、超链接文件大小、检索结果总数、相关度估计、评论等。
搜索引擎的检索结果一般按查询的相关程度进行排列,最相关的通常排在最前面。
2、搜索引擎的常用检索方法(1)简单搜索(simple search)指输入一个单词(关键词),提交搜索引擎检索后反馈结果。
它也叫单词搜索。
信息检索网络信息资源检索
第二节 搜索引擎概述
导航栏内栏目有:医学继续教育、会议、资源中心、 患者教育、图书馆、讨论区。医学教育为其特色栏目。 也提供多种数据库检索:Medscape是检索自身网站 的资源;Medline是美国国立医学图书馆提供的覆盖全 球近4800种医学期刊的全文数据;Druginfo是 FirstDatabank和美国医师协会提供的最大的药物数 据库,可查询20万种药物的使用剂量、毒副作用、使用 注意事项等内容。
第三章 网络信息资源检索
第一节 第二节 第三节
网络信息资源概述 搜索引擎概述 网络免费信息资源检索
第一节
网络信息资源概述
网络信息资源定义和特点 网络信息资源的类型
第一节
网络信息资源概述
一、网络信息资源定义和特点 1.网络信息资源的定义
网络信息资源是指以电子数据形式将文字、图像、 声音、动画等多种形式的信息存放在光、磁等非印刷 载体中,并通过网络通信、计算机或终端等方式再现 出来的信息资源的总和。
提供根据疾病名称、所属学科和内容性质(会议报告、 杂志文章的全文或摘要等)的英文着个字母的分类检索 (The Medscape Index)。在主页的首页可直接进入临 床管理系列(Clinical Management Series)、杂志全 文(Journals)、实用指南(Practice Guidelines)、指 南进展、杂志扫描、会议摘要和时间表、专家提问和讨论、 临床挑战等栏目。
(4)用户服务组信息资源
各种各样的用户服务组,保罗 新闻组信息资源、电 子邮件信息资源、邮件列表、专题讨论组等,都是因 特网上最受欢迎的信息交流形式。他们都是由一组对 某一特定主题有共同兴趣的网络用户组成的电子论坛, 用户以邮件形式进行网上交流和讨论。用户服务组信 息资源是一种丰富、自由和开放性的资源。
第三章 检索工具 PPT课件
《科学引文索引》(Science Citation
Index, SCI)
SCI以《期刊目次》(Current Content)作为数据源,目前自然 科学数据库有五千多种期刊,其中 生命科学辑收录1350种;工程与 计算机技术辑收录 1030种;临床 医学辑收990种;农业、生物环境 科学辑收录950种;物理、化学和 地球科学辑收录900种期刊。
个人著述书目:专门收录某一作者的 全部著述,兼收别人研究该作者的生 平和著述的图书资料的目录。如“鲁 迅研究资料汇编”
联合目录:反映图书在全国或某地区 若干个图书馆的收藏情况的目录。如 “中国丛书综录”
索引
也叫题录,是以单篇或单份文献为著 录的基本单位的检索工具,题录主 要揭示、报道文献的外表特征,但 其著录格式于目录有所不同。索引 在我国历史上又叫“通检” 、“备 检” 、“玉键” 、“韵编” 、 “针线” 、“引得”等。
索引的参照系统(syndetic system): 包括各种参照、标目注释、索引使用说明 与凡例等内容。
索引的类型
主题词索引(Subject Index):主题词是从文 献中抽出的代表该文献的词或词组,并且经过了 规范化处理。
关键词索引(Keyword Index):从文献中抽 出的词未经规范化。
书目
书目是图书或报刊目录的简称,目录 是指以一件或一种完整的出版物,如 一本书、一份科技报告、一种期刊等 作为著录基本单位的检索工具。一般 目录主要揭示、报道这些单位出版物 的外表特征。书目在中国历史上又叫 “录” 、“书录” 、 “志” 、 “略” 、“簿” 、“考” 、“提要” 等。
书目的类型
书目之书目:将书目 、 索引 、 文 摘汇集在一起而编成的一种特殊的 书目类型。如“中国历代书目丛刊”
3第三章 检索工具
手册
手册是汇集经常需要参考的文献,资料和 手册是汇集经常需要参考的文献, 专业知识的工具书. 专业知识的工具书. 手册有综合性的(如《各国概况》,《中 各国概况》 手册有综合性的( 华人民共和国资料手册》 华人民共和国资料手册》); 有专业性的( 外国文学手册》 有专业性的(如《外国文学手册》,《常 用药物手册》 用药物手册》 ); 常识性的( 家庭日用大全》 常识性的(如《家庭日用大全》).
知识词典
百科词典 汇集各学科重要的术语和概念,加以概括解释, 汇集各学科重要的术语和概念,加以概括解释, 提供最基本的知识.百科词典的性质接近百科全书. 提供最基本的知识.百科词典的性质接近百科全书. 专科词典 收集一个学科或专门领域的术语,概念,专 收集一个学科或专门领域的术语,概念, 学科或专门领域的术语 名,加以解释,系统地反映专业知识的概要.所提供的知 加以解释,系统地反映专业知识的概要. 识往往比百科词典更为详细. 中国经济大词典》 识往往比百科词典更为详细.如《中国经济大词典》, 宗教词典》 《宗教词典》. 也是一种专科词典, 人名,地名,书名等 专名词典 也是一种专科词典,以人名,地名,书名等 为对象,只介绍有关专名的概况,提供事实和资料. 为对象,只介绍有关专名的概况,提供事实和资料.如 中国画家大词典》 中国名胜词典》 《中国画家大词典》,《中国名胜词典》,《世界地名词 典》. 字典,词典还可以按语种分为单语词典和多语词典. 字典,词典还可以按语种分为单语词典和多语词典.多 语词典中以双语词典为主, 语词典中以双语词典为主,是两种语言词汇对照的翻译词 大英汉词典》 现代俄汉双解词典》 典.如《大英汉词典》,《现代俄汉双解词典》.
二,检索工具实例
1,目录
目录是指对产品或图书的简要介绍.当然,也可 以是对一本书内容的简要描述. 目录是最早出现的一种检索工具.
《网络信息的获取》教案设计
《网络信息的获取》教案设计第一章:网络信息检索基础1.1 教学目标1. 了解网络信息检索的基本概念和原理;2. 掌握常用的网络信息检索工具和技巧;3. 学会评估和筛选网络信息。
1.2 教学内容1. 网络信息检索的定义和作用;2. 网络信息检索的基本原理;3. 常用网络信息检索工具的使用方法;4. 网络信息检索技巧的运用;5. 评估和筛选网络信息的能力培养。
1.3 教学方法1. 讲授法:讲解网络信息检索的基本概念和原理;2. 演示法:展示常用网络信息检索工具的使用方法;3. 实践法:学生实际操作练习网络信息检索技巧;4. 讨论法:学生分享评估和筛选网络信息的经验。
1.4 教学评估1. 课堂问答:检查学生对网络信息检索基础知识的掌握;2. 实操练习:评估学生在实际操作中运用网络信息检索技巧的能力;3. 小组讨论:评估学生在讨论中分享评估和筛选网络信息的能力。
第二章:搜索引擎的使用2.1 教学目标1. 了解搜索引擎的基本概念和原理;2. 掌握常用搜索引擎的使用方法;3. 学会优化搜索引擎的搜索结果。
2.2 教学内容1. 搜索引擎的定义和作用;2. 搜索引擎的基本原理;3. 常用搜索引擎的使用方法;4. 优化搜索引擎搜索结果的技巧;5. 搜索引擎使用的注意事项。
2.3 教学方法1. 讲授法:讲解搜索引擎的基本概念和原理;2. 演示法:展示常用搜索引擎的使用方法;3. 实践法:学生实际操作练习搜索引擎的使用技巧;4. 讨论法:学生分享优化搜索引擎搜索结果的经验。
2.4 教学评估1. 课堂问答:检查学生对搜索引擎的基本知识的掌握;2. 实操练习:评估学生在实际操作中运用搜索引擎的使用技巧的能力;3. 小组讨论:评估学生在讨论中分享优化搜索引擎搜索结果的能力。
第三章:网络数据库的使用3.1 教学目标1. 了解网络数据库的基本概念和原理;2. 掌握常用网络数据库的使用方法;3. 学会在网络数据库中进行信息检索和筛选。
第三章 中文重要检索工具及其利用(修改版)
第三章中文检索工具及其利用由于文献的类型多种多样,人们对文献检索的角度、深度和广度的要求各异,因此产生了多种多样的用以报道、存贮和查找文献的工具,即检索工具。
一、检索工具概论(一)国内印刷本检索工具的发展解放以前,文摘刊物已经有了“中国化学摘要”。
解放后,我国科技文献检索体系逐渐发展起来。
1956年,中国科学技术情报研究所成立,开始组织力量翻译苏联的文摘杂志,1956年出版了《机械制造文摘》和《冶金文摘》。
十年动乱,我国检索刊物体系遭到严重破坏,检索刊物几乎全部停刊。
1979年后检索刊物无论在品种上和数量上都有了较快的发展,进入九十年代以后,我国科技文献刊物开始走向逐步完善,无论是在收录的文献内容和类型,报道的学科专业范围,检索手段和方式,检索工具的类型和出版形式,文献著录、标引标准化等方面都大有改进。
整个体系基本上按报道国内文献和国外文献分成两个系列。
其类型按收录范围划分为综合性检索刊物和专业类检索刊物。
按揭示文献方式划分为题录和文摘。
国内较有影响的检索型刊物如:《全国总书目》、《全国新书目》、《全国报刊索引》、《中国石油文摘》、《石油与天然气文摘》、《中国专利公报》等。
1992 年,中国科技信息研究所重庆分所首次推出《中文科技期刊篇名数据库》只读光盘。
此后,很多编辑出版检索刊物的单位,采取刊库合一的办法,既用计算机编辑出版检索刊物,又建立和扩充相应的数据库。
目前,我国的检索刊物已经发展壮大,并且揭示层次越来越深,检索平台越来越易用,数据量也越来越大,并且都向网络化方向发展。
(二)检索工具的基本知识及职能1、检索工具的职能✧存贮职能:存贮就是把有关文献的特征著录下来,使文献从分散到集中、由无组织到系统化的过程。
也是由一次文献到二次文献的过程。
✧检索职能:检索工具应提供一定的检索规律,使检索者可以按照一定的检索方法检出所需要的文献。
由于检索工具具有参考性、概括性和易检性.故人们一直很重视文献检索工具的使用,常称它为“案头顾问、书海指南”等。
信息检索第三章EI
印刷版EI 编排结构与著录
正文:即文摘部分,是EI的主体。由一些文摘 条目组成,并以规范主题词为标目。主题词取 自规范词表。1992年以前使用《工程标题词 表》,1993年起使用《EI叙词表》
印刷版EI (月刊、年刊) 索引
月刊索引:著者索引、主题索引
年刊索引:著者索引、主题索引、 工程出版物索引
附录
EI文摘正文著录格式
叙词
COMPUTER AIDED INSTRUCTION
文…摘…号…
文献篇名
文摘内容
009057 Current situations and future directions of
intelligent CAI research/development . This pa-per
• PL以连续出版物的缩写题名字母为序编排。
• 著录内容包括:连续出版物的缩写题名、连续出 版物的全称、计算机识别代码与ISSN号。 • PL的主要作用:通过EI文摘正文给出的刊名缩 写查找连续出版物(期刊)的全称,从而通过查 找馆藏目录,获取原文。
J Inf Image Manage① Journal of Information and image Management② JIIMDW③
第三章 外文检索工具
常用外文检索工具
美国《工程索引》 英国《科学文摘》 美国《科学引文索引》 美国《科技会议录索引》
3.1 美国《工程索引》EI
1 概述 2 印刷版EI编排结构与著录 3 EI标题词表与叙词表 4 EI检索方法及检索示例
EI 概 述
• 美国《工程索引》 (The Engineering Index),简称EI • 1884年创刊,由美国工程信息公司编辑
(网络资源与信息检索)第三章 期刊信息检索与获取
期刊图书信信息息的的检检索索与与获取获取
内容要点
❖一、期刊的基础知识 ❖二、期刊的检索与获取 ❖三、期刊论文的检索与获取
▪ (一)文献检索的程序 ▪ (二)手工检索工具 ▪ (三)期刊论文数据库 ▪ (四)文献检索效果评价
三、期刊论文信息的检索
要查找有关“搜索引擎个性化信息服务技 术”的文章或“民营企业人力资源管理”的资料 ,我们更多的是需要查找期刊论文信息。
样本 若课题属尖端技术:科技报告
分析检索课题
确定检索的时间范围 分析已知信息
比如知道某国在该领域处于领先,可以该国为 重点。
某科学家在该领域成就显著,可以以此人为检 索线索。
2.选择检索方法
常用法
- 顺查法 - 倒查法 - 抽查法
追溯法 综合法(也称分段法)
2.选择检索方法
常用法
✓ 顺查法 从远及近查,用于了解某一事物发展的全过程
般也很多。因此,只要针对发展高峰进行抽查,就能查 获较多的文献资料。
2.选择检索方法
要求查全----则用顺查法; 要求快、新----则用倒查法; 掌握了课题的发展阶段特点----则用抽查法。
2.选择检索方法
追溯法(引文法)
以文献后面附着的参考文献为线索而查找相关文献的一 种方法。在没有检索工具或检索工具不完整时可借助此获 得相关文献。
缺点:查全率、查准率较低,易误检漏检
2.选择检索方法
综合法(也称分段法)
又称循环法或分段法,是交替使用“追溯法”和“常用法 ”来进行检索的综合方法。即首先利用检索工具查出一批 文献资料,再利用这些文献资料所附的参考文献追溯查找 相关文献。如此交替、循环使用常用法和追溯法,不断扩 检,直到满足检索要求为止。 优点在于:当检索工具缺期、缺卷时,也能连续获得所需 年限以内的文献资料。
第三章信息检索的基本理论
第三章信息检索的基本理论目的要求了解信息检索系统的概念;了解手工信息检索系统的类型;熟悉手工信息检索系统的结构;掌握手工信息检索系统的著录格式和常用的手工信息检索系统的信息检索方法。
掌握计算机信息检索系统的构成和类型;掌握信息检索语言的基本类型;掌握信息检索原理。
第一节信息检索系统一、信息检索系统的概述信息检索系统是指由一定的设备和信息集合构成,具有一定存储、检索与传送技术设备,提供一定的存贮与检索方法及检索服务功能的工作系统。
简单地说,信息检索系统即信息的存贮和检索的系统。
广义:信息检索系统是包括了从信息采集到检索全过程的服务体系。
狭义:信息技术系统就是用户检索信息时所使用的检索工具。
信息检索系统具有输入功能、存贮功能、处理功能、输出功能及控制功能。
根据信息存贮和检索所设备和手段的不同,信息检索系统可分为两大类型,即:手工信息检索系统和计算机信息检索系统。
目前,信息检索系统已从传统的手工检索系统发展到计算机网络信息检索系统。
二、手工信息检索系统1、手工信息检索系统的类型书本式检索工具(期刊式检索工具、单卷式检索工具、附录式检索工具)和卡片式检索工具。
期刊式检索工具:指在一个题名之下,定期连续发行的一种检索工具。
它具有及时性、连续性和稳定性的特点。
例如各种文摘杂志、索引刊物、连续的馆藏目录等。
这种形式的检索工具,及时反映新出版、新发表、新入藏的文献信息,它随着新文献的不断出现而不断连续出版,保持与文献的平行发展关系。
因此科研工作者为了掌握和了解本学科的科研动态,定期查阅期刊式检索工具是一种非常有效的方法。
同时由于期刊式检索工具的连续性的特点,不少期刊式检索工具,每到一定时间累积后,对于回溯检索极为方便。
单卷式检索工具:这种检索工具多数是以一定的专题内容而编印的,选题一般具有独立的意义。
它专业性强,收集的文献比较集中,往往积累反映一个相当长时间的文献,并以特定范围的读者作为对象。
单卷式检索工具收录文献一般比较全面系统,排列组织比较切合专业研究的需要,因此,对于专题文献检索比较方便,使用价值较高。
第三章文献信息检索的基本知识
第三章文献信息检索基本知识随着信息技术的发展,互联网的应用得到广泛普及,信息环境发生了相当大的变化,应用现代化技术手段获取各种信息、知识成为高等院校师生与广大科技工作者的一种必备知识和技能。
为此,首先就必须了解文献信息检索的基本知识。
第一节信息检索的基本原理一、信息检索的概念信息检索(Information Retrieval)全称为“信息存储与检索”(Information Storage and Retrieval),其概念有广义和狭义之分。
广义上认为,信息检索包括文献信息的存储和检索两个方面,即一个完整的信息检索系统由信息存储子系统和信息检索子系统两部分组成。
信息存储子系统:首先对一定数量的信息进行筛选,把能够描述文献信息的外部特征和内部特征进行加工、整理,使之有序化,形成信息特征标识集合,然后将之存储在某种载体上,编制成为检索工具或建立一个数据库。
信息检索子系统:根据信息用户的特定需求,对用户需求进行主题分析,利用一定的检索方法和检索技术,对存储子系统中的特征标识进行比对,把需要的文献线索或知识信息从系统中查找出来的过程,即信息检索。
这就是通常人们所说的信息检索过程,也就是狭义上的信息检索。
信息存储与信息检索是意义不同却又相互联系、相互依存、不可分割的两个过程。
信息存储是为了检索,信息检索又必须先有信息存储。
如果没有存储,检索就无法实现;没有检索,信息存储也就变得没有意义。
所以说存储是检索的前提和基础,检索是存储的目的。
信息检索系统的工作原理如图3-1所示。
图3-1 信息检索系统的工作原理二、 信息检索的类型信息检索可以按不同的划分标准划分为不同的类型。
(一)、 根据检索内容划分根据检索信息内容不同可划分为文献信息检索、事实信息检索和数据信息检索。
1、文献信息检索(document retrieval ):是以文献(包括目录、索引、文摘等二次文献或全文)为检索对象,查找有关文献的出处和收藏处等信息,都属于文献信息检索范畴。
计算机信息检索
二、原生(born-digital)数字资源
例如:《新物理学杂志》New journal of physics /EJ/njp
电子报纸(electronic newspaper)
将电子技术应用到涉及报刊出版、发行、利用的全过 程 重要电子报纸举例 纽约时报() 华盛顿邮报() 泰晤士报() 人民日报() 光明日报() 中国日报() 8点报(/)
示两个词不可以互换顺序,二者之间可插入0-n个词 如:智能机器人(w/3)控制,可检出“智能机器人 控制”,“智能机器人行为控制”等
N/n(near/n):两词相邻,N/n表示两个词可以互换
顺序,二者之间可插入n个词 如:智能机器人(n/3)控制,可检出“智能机器人控 制”,“控制算法对智能机器人的影响”等
脱机信息检索 Off-line Retrieval
定义:又称批式检索,是指用户将检索要求送往检索 中心,由专职操作计算机的人员进行检索,再将检索 结果返回给用户的一种检索方式。 优点:①批处理可同时进行多项检索 ②检索费用低 缺点:①缺乏用户与系统的直接交流,检索要求表达 不清,影响检索质量。②时间上的延迟。
联机数据库检索 Online Retrieval
定义:用户利用计算机终端设备,通过通讯线路或网 络,在联机检索中心的数据库中进行检索并获得信息 的过程。 优点:① “人机对话”方式使检索者能随意更改检索 策略,从而达到很高的检全率和检准率。 ② 消除了时间上的延迟。 ③ 保证检索者获得最新、最及时的文献信息 缺点:①检索费用高:如Dialog系统; ②检索技术较为复杂,难以成为普及型的检索 手段。
光盘数据库检索 CD-ROM Searching
类型:单机检索与联机光盘检索。 定义:联机光盘检索指把单用户系统发展成多用户的 局域网系统,通过网络(如校园网)连接多个用户终 端,用服务器管理多组光盘数据库及其检索系统 优点:储量极大,体积微小,要求设备简单,使用方 便、易于操作,检索费用低。 缺点:①更新周期慢、时差长,文献新颖性不够 ②同一时间只能一人使用,资源浪费较大。光 盘网络可以解决这个问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章网络信息检索工具【知识框架】信息检索的一般流程网络经贸信息资源的概念与类型网络资源查询方法及检索工具▪按检索机制分:目录型(Subject directory, catalogue)索引型:搜索引擎(Search Engine)混合型(Hybrid tools)▪按检索内容分:综合型专题型特殊型▪按包含检索工具数量分:单一型(Singular search tools)集合型(Collective search tools):元搜索引擎(Metasearch Engine或Megasearch Engine 目录型检索工具(Subject directory catalogue)搜索引擎(Search Engine)▪单一搜索引擎▪集成搜索引擎检索工具的工具——指南类检索工具和元搜索引擎▪(一)网络资源指南(Resource Guide)也称学科门户SIG▪(二)元搜索引擎集合式搜索引擎、索引式搜索引擎▪(三)手工检索工具的“工具书指南”、网址簿网络版参考咨询工具(Reference Tools)智能搜索代理和搜索软件补充教材第二章:检索工具与语言检索策略【主要内容】1、信息资源检索的一般流程分析问题▪问题分类▪分析已知和欲知信息▪分析需求主题▪广泛利用文献▪选择检索范围选择检索工具▪熟悉各种检索工具从检索工具中查找所需信息获取原文2、网络信息资源的概念和类型1)按传输方式分:●WWW●FTP●Usenet/Newsgroup●LISTSERV/Mailing List●Telnet●Gopher●WAIS2)按内容加工一次加工信息▪网上图书、期刊、报纸、专利、政府出版物、会议资料等 二次加工信息▪文摘索引数据库、搜索引擎、网站导航等三次加工信息▪百科全书、手册指南等参考型网站3)格式与后缀3、网络检索工具的分类按检索机制分:▪目录型(Subject directory, catalogue)▪索引型:搜索引擎(Search Engine)▪混合型(Hybrid tools)按包含检索工具数量分:▪单一型(Singular search tools)▪集合型(Collective search tools):元搜索引擎(Metasearch Engine或Megasearch Engine4、目录型检索工具(Subject directory catalogue)1)网络资源目录这是一种独立型检索工具,网站自身包含可检索的数据库。
网络资源目录又称网站目录、分类站点目录、专题目录或主题指南、站点导航系统、主题词典型检索工具等。
这是一种将网络资源搜集后,按某种分类法进行组织整理,并和检索法集成在一起的信息检索方式。
特点:▪人工设计和编制的、供检索的等级结构式目录(指南、导航系统)▪所收录资源经过鉴选和组织▪减少了检索中的噪音,提高了检索的准确性▪数据库的规模相对较小▪新颖性不强,(会有“死链接”dead link)▪用户要熟悉其分类体系目录型检索工具比较适合于查找综合性、概括性的主题概念,或对检索准确度要求较高的课题原理:网络资源目录一般:▪采用人工方式采集网络信息;▪通常以某种分类体系为依据,将网络信息资源分为若干领域的主体范畴,然后再细分为各学科专题目录。
网络资源目录的分类通常采用主题分类法、学科分类法、体系分类法。
一个网络资源目录包括许多层,第一层是总目录,将网络资源分成若干领域的主题范畴,然后链接到第二层专题目录,再链接到第三层子目录,依次而下,直至具体的信息资源,形成一个由信息链组成的树状结构。
有代表性的目录型检索工具:Yahoo 分类目录检索;开放目录项目(Open Directory Project ,简称ODP);5、搜索引擎(Search Engine)特点:-收录、加工信息的范围广、速度快;-检索功能强,一般可称为网络资源的关键词索引;-检索时直接输入关键词或词组、短语,无需判断类目归属,比较方便;-标引过程缺乏人工干预,准确性较差-检索误差(噪音)较大搜索引擎适合于检索特定的信息,及较为专、深、具体或类属不明确的课题工作过程:单一搜索引擎的结构一般由三部分构成:信息采集、索引数据库、用户检索。
用户所熟悉的只是占搜索引擎很小部分的人机交互界面——用户通过这一界面输入需要检索的信息,系统则反馈给用户相关的信息。
构成搜索引擎主要内容的是不为用户熟悉的后台部分,即作为搜索软件程序的“Robot”、“Crower”、“Spider”。
这类程序能自动地在网上漫游,从一个或一组URL开始访问,并进行本地索引,同时记录该URL所指的HTML文件中所有的新的URL链接,不停地以找到的URL为起点进行本地索引,直到再没有满足条件的新的URL地址或超出了某些限制。
自动采集信息是搜索引擎的主要功能。
自动索引程序要对HTML文档中的超文本标记进行分析,提取出符合用户需要的主要内容,并存放在信息库中。
这些软件会定期或不定期地拷贝所访问的国际互联网主机的内容,然后由提供检索服务的公司或单位统一进行标引和组织。
自动索引程序将采集和标引的信息汇集成索引数据库,并随时顺着链接跟踪网上新加入的主页,为其建立索引,这是搜索引擎提供检索服务的基础。
不同检索工具的数据库一般根据各自的信息资源采集的范围和侧重点设计而成,分类体系差别较大,没有统一的、严格的标准,收录的范围不一样,规模也不一样。
数据库收录的内容一般有:网站的名称、标题、网址URL、网页的长度、相关的超文本链接点、关键词、内容简介或摘要等。
工作原理:搜索引擎通常使用两种技术实现信息检索。
▪一是使用网站分类技术,即把网站进行树状的归类,对每个网站都有简略的描述(如雅虎)。
其优点是为网络信息导航带来方便;缺点是这种描述不能深入到网站内部,造成信息丢失。
•二是使用全文检索技术,全文处理的对象是文本,通过网页抓取程序对大量网页数据建立由字(词)组成的倒排索引,以便使用户用关键词对文档进行查询,系统则返回含该关键词的网页。
6、单一搜索引擎的结构单一搜索引擎的结构一般由三部分构成:信息采集、索引数据库、用户检索.7、检索工具的工具——指南类检索工具和元搜索引擎1)网络资源指南(Resource Guide)网络资源指南,一般被称为指南类检索工具, “网络检索工具的工具”,是为用户筛选质量好、效率高、符合需求的网络检索工具,并指出检索途径和方法的网络指南。
特点:网络指南多为大范围的网络链接,一般不直接提供检索结果,但却为人们检索其他各类网络信息提供重要的检索入口。
这类指南可以克服搜索引擎检索结果杂乱的弱点,通过对网络专业信息资源的挖掘、采集、加工、整理和序化重组,形成一个专门为专业用户服务的信息资源指南,使检索更为系统、有序、快捷。
这类指南使用的名称也多种多样,如虚拟图书馆的“咨询中心”、资源链接中心、资源索引(Resources Index)等。
2)学科信息门户学科信息门户,亦称门户网站、信息门户(Subject Information Gateway),是将特定学科领域的信息资源、工具和服务集成为整体,为用户提供可靠的网络学科信息导航、方便的信息检索和服务入口。
作用:通常为用户提供对因特网上信息和应用的“密集”访问方式,将来自不同信息源的信息集中在一个页面上,帮助用户通过统一的入口检索不同网站的信息,而无需逐个访问单独的网站。
这种信息组织方式,再加上个性化服务和各种附加服务(如公共信息、邮件、信息订阅等),逐渐演变成为网络信息检索的又一高质量工具。
特点:1)在线提供对若干站点和文档的链接;2)通过人工筛选信息;3)智能地产生包括注解和评论在内的内容描述信息(如元数据),有的提供信息的分类和主题标引;4)智能地构建分类浏览结构;5)支持手工构建单个信息资源的(书目)元数据。
与搜索引擎的比较:学科信息门户:▪主要不是通过自动化手段来获取和组织信息,而是采用人工选择和标引保证信息的质量,使之在数量上少而精;▪在信息组织上采取分类浏览结构;▪在检索手段上不仅支持传统的基于数据库的字段检索、截断检索等功能,还支持在主题词表、后控词表支持下的智能检索.3)元搜索引擎元搜索引擎又称为集合式搜索引擎、索引式搜索引擎,它将多个搜索引擎集成在一起,并提供一个统一的检索界面。
当用户发出检索请求后,通过转义在多个单一搜索引擎中查询,对查询结果进行处理(归并、删除重复、校验连接、按相关度排列结果),然后返还给用户。
换言之,这是一种“引擎的引擎”,或“引擎指南”,使用户能在更广的范围内,更方便快捷地进行检索。
这类搜索引擎的代表是WebCrawler、InfoMarket等。
元搜索引擎的类型:元搜索引擎可分为三种类型:搜索引擎目录、多元搜索引擎和多元搜索引擎的其他衍变形式。
搜索引擎目录▪这是一种采用关键词检索、非独立型的检索工具。
▪它把主要的搜索引擎集中在一起,并按类型或检索问题编排组织成目录,帮助用户根据需要来选择适合的搜索引擎。
搜索引擎目录集中罗列检索工具,使用户能方便地选择相应的工具进行检索,检索的还是某一搜索引擎的数据库,与普通单一搜索引擎的检索是一样的。
常用的搜索引擎目录有ALL-in-one、CUSI、iTools!、悠游、北极星等;还有:iTools: /;百度常用搜索导航:/life/;多元搜索引擎▪这也是一种采用关键词检索、非独立型的检索工具。
多元搜索引擎将多个搜索引擎集成在一起,提供一个统一的检索界面,并将一个检索提问同时发给多个搜索引擎,同时检索多个数据库。
用户输入检索式后,检索工具将其译码,将检索式同时传送到几个搜索引擎,再将检索结果统一汇集整理后提交给用户。
较有代表性的元搜索引擎:Dogpile: Metacrawler: /: 万纬搜索: /多元搜索引擎的其他衍变形式▪(1)“一站式搜索引擎”(one-stop search engine)没有多元搜索引擎的调度机制和显示机制,因此不能综合显示结果。
在编制原理上它与网络资源目录的原理极为相似,在一级标题下列出二级标题,甚至三级标题。
用鼠标点击各级标题得到搜索该主题的搜索网页或网站,然后再根据网站的检索原理进行检索。
这种检索工具除可采用标题检索外,还可以使用关键词进行检索。
这类检索工具主要有:▪Web-search( )、▪ ( )、▪ ( )等。
▪(2)链接多个搜索引擎的搜索引擎的工作原理是用户在检索框中输入检索式后,检索式同时在几个搜索引擎上运行,然后在一祯屏幕上显示出在几个搜索引擎上检索的结果。
与上述多元搜索引擎不同的是,它不是利用显示机制综合检索结果,而只是列出搜索引擎的名称及网址,并在搜索引擎下列出检索结果。
这类检索工具有:Dogpile ()等.8、网络版参考咨询工具(Reference Tools)书目类检索工具有报道出版信息的出版商网站、在版书目数据库、出版在线;报道文献收藏信息的数字图书馆目录、联机目录。