信息检索教程(第二版) 教学课件 王立清 著 分章节版 009 信息检索教程第九章
合集下载
信息检索通用教程教学课件ppt

1-3 基本方法
信息检索原理图
1-3 基本方法
2. 常用技术 布尔逻辑检索(Boolean Search) 截词检索(Truncation Search) 限制检索(Limitation Search) 位置检索(Position Search) 加权检索(Weight Search)
1-3 基本方法
原理原理信息存储与检索信息存储与检索信息检索信息检索信息的存储与检索之间的相符性信息的存储与检索之间的相符性113基本方法基本方法信息检索原理图信息检索原理图113基本方法基本方法常用技术常用技术布尔逻辑检索布尔逻辑检索booleansearchbooleansearch截词检索截词检索truncationsearchtruncationsearch限制检索限制检索limitationsearchlimitationsearch位置检索位置检索positionsearchpositionsearch加权检索加权检索weightsearchweightsearch基本方法基本方法常用技术常用技术布尔逻辑检索布尔逻辑检索booleansearchbooleansearch布尔逻辑算符图示布尔逻辑算符图示逻辑与逻辑非逻辑或逻辑异检索工具方法与步骤检索工具方法与步骤选择检索工具方法与途径实施检索过程评价检索结果修正调整检索策略分析检索问题13基本方法113基本方法基本方法检索工具方法与步骤检索工具方法与步骤11分析检索课题分析检索课题22选择检索工具方法与途径选择检索工具方法与途径33实施检索过程实施检索过程44修正或调整检索策略修正或调整检索策略bb11分析检索课题分析检索课题要查找的是什么类型的问题
书目、索引、 文摘等
各类字典、词 典、百科全书 等 类书、政书、 年鉴、手册、 名录、表谱、 图录等 丛书、总集、 资料汇编、综 述、方志等
《信息检索第二章》PPT课件

– TCP是传输控制协议,处理由于路径不同及 其它可能原因造成的数据包颠倒、数据丢失、 数据失真等问题。
– IP是网际协议,利用路由算法解决路由选择 的问题。
精选ppt
17
Internet 的管理
• 2.IP地址: 是Internet上每台主机和用户终端的识别标 识。 IP地址在全球范围内都是唯一的。 IP 地址的表示:211.83.48.13
精选ppt
5
第二部分 考试说明与实施要求
• 考核的能力层次表述:
• 大纲在考核目标中,按照“识记”、“理解”、“应用” 三个能力层次规定其应达到能力层次要求。各能力层次为 递进等级关系,后者必须建立在前者的基础上,其含义是:
• 识记:能知道有关的名词、概念、知识的含义,并能正确 认识和表述,是低层次的要求。
• 3、阅读完每章教材后,认真完成老师布置的作业, 要求熟练掌握!并独立完成老师安排的4套复习模 拟题,注意答题技巧和答题方法。
精选ppt
9
考试大纲要求掌握的章节
• 第一章 因特网信息资源(8分) • 第二章 因特网信息检索概论(17分) • 第三章 搜索引擎(17分) • 第四章 目录型网络检索工具(14分) • 第五章 元搜索引擎(14分) • 第六章 多媒体信息检索(11分) • 第七、八章 学术信息的网上检索与获取(11分) • 第九章 参考信息的网上检索(8分)
• (二)、多项选择题
• 1、下列属于因特网信息资源的是( )。
• A.WWW信息资源
B.RSS信息资源
C. FTP信息资源
• D. 用户服务组信息资源 E.Telnet信息资源
• (三)、名词解释题
• 1、布尔逻辑检索
• (四)、简答题
– IP是网际协议,利用路由算法解决路由选择 的问题。
精选ppt
17
Internet 的管理
• 2.IP地址: 是Internet上每台主机和用户终端的识别标 识。 IP地址在全球范围内都是唯一的。 IP 地址的表示:211.83.48.13
精选ppt
5
第二部分 考试说明与实施要求
• 考核的能力层次表述:
• 大纲在考核目标中,按照“识记”、“理解”、“应用” 三个能力层次规定其应达到能力层次要求。各能力层次为 递进等级关系,后者必须建立在前者的基础上,其含义是:
• 识记:能知道有关的名词、概念、知识的含义,并能正确 认识和表述,是低层次的要求。
• 3、阅读完每章教材后,认真完成老师布置的作业, 要求熟练掌握!并独立完成老师安排的4套复习模 拟题,注意答题技巧和答题方法。
精选ppt
9
考试大纲要求掌握的章节
• 第一章 因特网信息资源(8分) • 第二章 因特网信息检索概论(17分) • 第三章 搜索引擎(17分) • 第四章 目录型网络检索工具(14分) • 第五章 元搜索引擎(14分) • 第六章 多媒体信息检索(11分) • 第七、八章 学术信息的网上检索与获取(11分) • 第九章 参考信息的网上检索(8分)
• (二)、多项选择题
• 1、下列属于因特网信息资源的是( )。
• A.WWW信息资源
B.RSS信息资源
C. FTP信息资源
• D. 用户服务组信息资源 E.Telnet信息资源
• (三)、名词解释题
• 1、布尔逻辑检索
• (四)、简答题
信息检索之课件文稿演示

省图馆藏 书目查询 系统
2021年3月6日星期六
湖北民族学院《信息检索》(Information Retrieval )系列课件
3-16
检索方法
2021年3月6日星期六
湖北民族学院《信息检索》(Information Retrieval )系列课件
3-17
普通检索界面
2021年3月6日星期六 北京交通大学出版社《信息检索教程》(Information Retrieval Textbook)系列课件 3-18
随着现代计算机技术的发展,大多数图书馆都已 建成馆藏书目数据库,并进而发展成基于计算机网络 的联机公共目录检索系统(OPAC)。读者利用OPAC系 统,在任何地方都可以方便地查询图书馆的书刊信息, 使馆藏书目走出图书馆,实现了更广泛地服务于公众 的目的。
3-2
OPAC系统一般设置题名、责任者、主题词、分 类号、索取号、ISBN/ISSN号、出版社等字段,输入 检索词即可检索。系统执行后将逐条显示命中书刊的 基本信息,单击某个题名则进一步显示详细的书目信 息和馆藏及流通信息,读者可据此前往图书馆借阅。
由于图书馆的藏书数量相当庞大,而读者不可能 尽知每本图书的准确书名,因此在使用OPAC时,可 先通过题名、责任者、主题词等途径找出若干所需图 书,然后从这些图书的分类号入手,通过分类途径浏 览、查寻,最终找到自己最需要的图书。
2021年3月6日星期六
湖北民族学院《信息检索》(Information Retrieval )系列课件
湖北民族学院《信息检索》(Information Retrieval )系列课件
ห้องสมุดไป่ตู้
3-2
1 书刊目录检索系统
书目即书刊目录的简称。它是将图书、期刊按一 定规则著录、并有序编排而成的检索工具,它记载书 刊的题名、著(译)者、版本、出版地、出版者、出版 年、文献内容等信息。
信息检索教程第二章

7
布尔逻辑关系
布尔逻辑运算符 布尔逻辑运算式 与(AND) ) A and B (A * B) ) A和B都出现的 和 都出现的 记录 或(OR) ) A or B (A + B) ) 非(NOT) ) A not B (A - B) )
含义
A和B有一个出 只出现 而不出 和 有一个出 只出现A而不出 的记录 现或两个都出现 现B的记录 的记录
13
二、信息检索语言的作用
信息检索语言用于标引信息的主题, 信息检索语言用于标引信息的主题,简明而有 效地揭示出信息的内容及其外表特征。 效地揭示出信息的内容及其外表特征。 信息检索语言通过对信息的标引,对大量信息 信息检索语言通过对信息的标引, 进行系统化和组织,使有规律的检索成为可能。 进行系统化和组织,使有规律的检索成为可能。 信息检索语言为准确输出所需信息提供了前提。 信息检索语言为准确输出所需信息提供了前提。
5
二、信息检索的类型(续) 信息检索的类型(
3. 按检索系统的工作方式可以划分为脱机检索、 按检索系统的工作方式可以划分为脱机检索、 联机检索、光盘检索、国际互联网检索等。 联机检索、光盘检索、国际互联网检索等。
脱机检索(OffRetrieval) 脱机检索(Off-line Retrieval) 联机检索(OnRetrieval) 联机检索(On-line Retrieval) 光盘检索(CDRetrieval) 光盘检索(CD-ROM Retrieval) Retrieval) 国际互联网检索(Internet Retrieval)
20
第三节 信息检索的基本程序与方法
一、信息检索的基本程序 信息检索的基本程序是信息检索工 作中的一个重要环节, 作中的一个重要环节 , 是提高信息检索 效率的必要前提。 效率的必要前提 。 信息检索通常可以按 下面四个步骤依次进行, 下面四个步骤依次进行 , 即 : 分析研究 课题、 选择检索工具、 制定检索策略、 课题 、 选择检索工具 、 制定检索策略 、 查阅原始文献。 查阅原始文献。
布尔逻辑关系
布尔逻辑运算符 布尔逻辑运算式 与(AND) ) A and B (A * B) ) A和B都出现的 和 都出现的 记录 或(OR) ) A or B (A + B) ) 非(NOT) ) A not B (A - B) )
含义
A和B有一个出 只出现 而不出 和 有一个出 只出现A而不出 的记录 现或两个都出现 现B的记录 的记录
13
二、信息检索语言的作用
信息检索语言用于标引信息的主题, 信息检索语言用于标引信息的主题,简明而有 效地揭示出信息的内容及其外表特征。 效地揭示出信息的内容及其外表特征。 信息检索语言通过对信息的标引,对大量信息 信息检索语言通过对信息的标引, 进行系统化和组织,使有规律的检索成为可能。 进行系统化和组织,使有规律的检索成为可能。 信息检索语言为准确输出所需信息提供了前提。 信息检索语言为准确输出所需信息提供了前提。
5
二、信息检索的类型(续) 信息检索的类型(
3. 按检索系统的工作方式可以划分为脱机检索、 按检索系统的工作方式可以划分为脱机检索、 联机检索、光盘检索、国际互联网检索等。 联机检索、光盘检索、国际互联网检索等。
脱机检索(OffRetrieval) 脱机检索(Off-line Retrieval) 联机检索(OnRetrieval) 联机检索(On-line Retrieval) 光盘检索(CDRetrieval) 光盘检索(CD-ROM Retrieval) Retrieval) 国际互联网检索(Internet Retrieval)
20
第三节 信息检索的基本程序与方法
一、信息检索的基本程序 信息检索的基本程序是信息检索工 作中的一个重要环节, 作中的一个重要环节 , 是提高信息检索 效率的必要前提。 效率的必要前提 。 信息检索通常可以按 下面四个步骤依次进行, 下面四个步骤依次进行 , 即 : 分析研究 课题、 选择检索工具、 制定检索策略、 课题 、 选择检索工具 、 制定检索策略 、 查阅原始文献。 查阅原始文献。
信息检索教程第二版

信息检索教程第二版
20xx年中国人民大学出版社出版的图书
01 内容提要
03 文章节选
目录
02 图书目录 04 作者介绍
基本信息
《信息检索教程第二版》是2008年中国人民大学出版社出版的图书,ISBN是11。
内容提要
内容提要
《信息检索教程》为普通高等教育“十一五”国家级规划教材。
主要内容包括信息检索概念和原理、信息检索系统、信息检索效果、检索语言、信息著录和标引、印刷型工 具书检索、计算机检索概述、联机检索、络信息检索、特种文献检索等。尤其对络环境下检索语言的发展、络信 息检索的特点和方法、络信息检索工具、络数据库等进行了重点解析。修订后的本教材继续为读者提供完整的信 息检索理论框架,同时补充丰富了信息检索领域新进展的相关内容,新增了信息检索的实践案例,努力突出基础性 强、实用性好、新颖性明显、结构清晰、适用面广等特点。
图书目录
图书目录
第1章信息检索基础 引子 1.1信息概述 1.2信息检索的概念和原理 1.3信息检索系统 1.4信息检索方法 1.5信息检索效果 案例 关键术语 思考题 第2章检索语言
文章节选
文章节选
5.2.2.5
百科全书的类型百科全书按内容范围分,有综合性百科全书和专科专题性百科全书。前者如《中国大百科全 书》、《简明不列颠百科全书》等;后者如《社会科学百科全书》、《中国企业管理百科全书》、《中国农业百科 全书》、《中国医学百科全书》、《中国旅游百科全书》、《集邮百科全书》等。
谢谢观看
按地区范围分,有国际性百科全书和地域性百科全书。前者如英、美、法、德等国有名的大百科全书,力图反 映世界文化遗产和现代成就,具有国际性;后者侧重反映某一地域、某一国家、某一省的各种情况,如《亚洲百科 全书》、《加拿大...
20xx年中国人民大学出版社出版的图书
01 内容提要
03 文章节选
目录
02 图书目录 04 作者介绍
基本信息
《信息检索教程第二版》是2008年中国人民大学出版社出版的图书,ISBN是11。
内容提要
内容提要
《信息检索教程》为普通高等教育“十一五”国家级规划教材。
主要内容包括信息检索概念和原理、信息检索系统、信息检索效果、检索语言、信息著录和标引、印刷型工 具书检索、计算机检索概述、联机检索、络信息检索、特种文献检索等。尤其对络环境下检索语言的发展、络信 息检索的特点和方法、络信息检索工具、络数据库等进行了重点解析。修订后的本教材继续为读者提供完整的信 息检索理论框架,同时补充丰富了信息检索领域新进展的相关内容,新增了信息检索的实践案例,努力突出基础性 强、实用性好、新颖性明显、结构清晰、适用面广等特点。
图书目录
图书目录
第1章信息检索基础 引子 1.1信息概述 1.2信息检索的概念和原理 1.3信息检索系统 1.4信息检索方法 1.5信息检索效果 案例 关键术语 思考题 第2章检索语言
文章节选
文章节选
5.2.2.5
百科全书的类型百科全书按内容范围分,有综合性百科全书和专科专题性百科全书。前者如《中国大百科全 书》、《简明不列颠百科全书》等;后者如《社会科学百科全书》、《中国企业管理百科全书》、《中国农业百科 全书》、《中国医学百科全书》、《中国旅游百科全书》、《集邮百科全书》等。
谢谢观看
按地区范围分,有国际性百科全书和地域性百科全书。前者如英、美、法、德等国有名的大百科全书,力图反 映世界文化遗产和现代成就,具有国际性;后者侧重反映某一地域、某一国家、某一省的各种情况,如《亚洲百科 全书》、《加拿大...
信息检索教程 教学课件 冯惠玲 王立清 著 第二章 检索语言

检索需要而创制的人工语言,又称情报语 言、情报存储与检索语言、文献语言、文 献工作语言、索引语言、标引语言、标引 符号、标识系统等。
二、检索语言的基础
(一)概念逻辑 概念逻辑,是一种科学思维方法,通
过明确各种概念及其相互关系而揭示事物 的本质属性及各种事物之间的联系与区别。
(二)知识分类
知识分类包括事物分类和学科分类。 它是对千差万别的事物作系统研究的重要 方法,是对各种事物之间的区别和联系从 本质上、原理上进行揭示的重要手段,对 信息的系统化具有重要的价值。
(一)《汉语主题词表》 《汉语主题词表》是我国第一部大型的
综合性的叙词表,由中国科技信息研究所 和北京图书馆负责主持,1975年开始编制, 1980年正式出版。
(二)《中国分类主题词表》
《中国分类主题词表》是在《中图法》 编委会主持下,经全国40个单位160位专家 学者的共同努力,历时8年编制而成的,于 1994年6月正式出版。
教材其余课件及动画素材请查阅在线教务辅导网 在线教务辅导网: QQ:349134187 或者直接输入下面地址:
第二章 检索语言
第一节 检索语言的概念和基础
一、检索语言的概念 传统意义上的检索语言仅指根据信息
第四节 主题检索语言
一、主题检索语言概述
主题检索语言又称主题法。它采用语 词直接作为文献主题标识,按字顺排列主 题标识,提供各种检索词语的途径。
(一)主题检索语言的类型
1.标题词语言 2.单元词语言 3.叙词语言 4.关键词语.直观性好 3.灵活性强
二、标题词法和单元词法
(一)关键词法的原理和特点
关键词法是适应目录索引编制过程自 动化的需要而产生的,出现比较早,广泛 使用却是近二三十年的事。
二、检索语言的基础
(一)概念逻辑 概念逻辑,是一种科学思维方法,通
过明确各种概念及其相互关系而揭示事物 的本质属性及各种事物之间的联系与区别。
(二)知识分类
知识分类包括事物分类和学科分类。 它是对千差万别的事物作系统研究的重要 方法,是对各种事物之间的区别和联系从 本质上、原理上进行揭示的重要手段,对 信息的系统化具有重要的价值。
(一)《汉语主题词表》 《汉语主题词表》是我国第一部大型的
综合性的叙词表,由中国科技信息研究所 和北京图书馆负责主持,1975年开始编制, 1980年正式出版。
(二)《中国分类主题词表》
《中国分类主题词表》是在《中图法》 编委会主持下,经全国40个单位160位专家 学者的共同努力,历时8年编制而成的,于 1994年6月正式出版。
教材其余课件及动画素材请查阅在线教务辅导网 在线教务辅导网: QQ:349134187 或者直接输入下面地址:
第二章 检索语言
第一节 检索语言的概念和基础
一、检索语言的概念 传统意义上的检索语言仅指根据信息
第四节 主题检索语言
一、主题检索语言概述
主题检索语言又称主题法。它采用语 词直接作为文献主题标识,按字顺排列主 题标识,提供各种检索词语的途径。
(一)主题检索语言的类型
1.标题词语言 2.单元词语言 3.叙词语言 4.关键词语.直观性好 3.灵活性强
二、标题词法和单元词法
(一)关键词法的原理和特点
关键词法是适应目录索引编制过程自 动化的需要而产生的,出现比较早,广泛 使用却是近二三十年的事。
信息检索教程(第二版) 教学课件 王立清 著 分章节版 004 信息检索教程__第四章

0
普通高等教育”十一五”国家级规划教材
信息检索教程
王立清 主编
第4章 参考工具书概述
伴随着社会的发展,文 献资源与日俱增。由于个 人能力所限,人们不可能 掌握全部的知识。参考工 具书正好充当了助手的作 用。作为一种特殊的图书, 工具书一直得到人们的青 睐。
本章要点
●介绍与分析参考工具书的概念 ●叙述我国工具书的产生与发展 ●分析参考工具书的功能与特点 ●阐述参考工具书的种类 ●介绍参考工具书的结构及排检方
该系统提供关键词检索,支持通配符检索、布尔逻辑 检索、词组检索、自然语言检索,还可以使用圆括号确定 检索符运算的优先次序。该系统也可以提供多种浏览功能, 包括字顺浏览、世界地图浏览、时间浏览和主题浏览。
13
第4章 参考工具书概述
4.3.2.3 百科全书网() 它是一个可免费浏览百科全书的网站,向读者提供
该系统可以方便地查找各种类型的工具书,整个体系 的编排也很符合用户查询工具书的习惯,而且,题录标引 也比较规范,对于部分工具书还直接提供了全文阅读。
12
第4章 参考工具书概述
4.3.2.2 《不列颠百科全书》网络版 ()
Encyclopedia Britannica Online是《不列颠百科全 书》的在线版。有功能强大的检索功能和按照主题字顺排 列的浏览功能;以及其它相关产品等。该工具书两周更新 一次,需付费使用,但任何读者都可以申请3天的免费试 用。
3第4章参考工具书概述413参考工具书的功能查检资料答疑解难指引门径辅助治学提示线索提供参考汇集知识传承文化4第4章参考工具书概述414参考工具书的特点内容丰富概括性强编排特殊便于查检准确可靠权威性强5第4章参考工具书概述421参考工具书的种类根据不同的标准将其划分42参考工具书为不同的类型
普通高等教育”十一五”国家级规划教材
信息检索教程
王立清 主编
第4章 参考工具书概述
伴随着社会的发展,文 献资源与日俱增。由于个 人能力所限,人们不可能 掌握全部的知识。参考工 具书正好充当了助手的作 用。作为一种特殊的图书, 工具书一直得到人们的青 睐。
本章要点
●介绍与分析参考工具书的概念 ●叙述我国工具书的产生与发展 ●分析参考工具书的功能与特点 ●阐述参考工具书的种类 ●介绍参考工具书的结构及排检方
该系统提供关键词检索,支持通配符检索、布尔逻辑 检索、词组检索、自然语言检索,还可以使用圆括号确定 检索符运算的优先次序。该系统也可以提供多种浏览功能, 包括字顺浏览、世界地图浏览、时间浏览和主题浏览。
13
第4章 参考工具书概述
4.3.2.3 百科全书网() 它是一个可免费浏览百科全书的网站,向读者提供
该系统可以方便地查找各种类型的工具书,整个体系 的编排也很符合用户查询工具书的习惯,而且,题录标引 也比较规范,对于部分工具书还直接提供了全文阅读。
12
第4章 参考工具书概述
4.3.2.2 《不列颠百科全书》网络版 ()
Encyclopedia Britannica Online是《不列颠百科全 书》的在线版。有功能强大的检索功能和按照主题字顺排 列的浏览功能;以及其它相关产品等。该工具书两周更新 一次,需付费使用,但任何读者都可以申请3天的免费试 用。
3第4章参考工具书概述413参考工具书的功能查检资料答疑解难指引门径辅助治学提示线索提供参考汇集知识传承文化4第4章参考工具书概述414参考工具书的特点内容丰富概括性强编排特殊便于查检准确可靠权威性强5第4章参考工具书概述421参考工具书的种类根据不同的标准将其划分42参考工具书为不同的类型
文献信息检索ppt

或
A-B
其意义为:检索记录中含有检索词A,但不能
含有检索词B的文献,才算命中文献。
例
逻辑提问式(布尔逻辑组配):
计算机检索的基本技术,主要通过逻辑运算符(布尔算符) “与(and,*)”、“或(or,+)”、 “非(not,-)”等将检索词连 接的提问式。
注意:优先级为not, and, or,用括号保证优先权;运算符 两侧必须各有一个空格(半角)。
(三)、通配符(截词检索)
截词检索,就是将截词符如“*”、“?” 等等,放在检索词中检索者认为合适的地 方截断,用截断的词的一个局部进行检索,并认为凡满足这个词局部中的所有字符(串) 的文献,都为命中文献。多用于外文检索,因为西文语言的特点是构词灵活,在词干上 前缀或后缀就可以派生出许多新的词汇。
文第 献 信 息 检二 索 技 术章
第一节 文献信息检索技术
检索方式
1
命令式检索:用逻辑运算符、位置算符及其他检索符号,把不同的检索词连接起来进 行检索的一个种方式,如数据库中的专业检索。适用于专业人员。
2
菜单式检索:一种通过窗口菜单进行检索的简单、易操作的检索方式。现各数据库的 高级检索、初级检索都属于菜单式检索,是最常用的检索方式,适用于一般读者检索。
把相似度较高的文献集中在一起形成一个个的文 献类的检索技术。
八、匹配方式 P37-38
1
前方一致:检出文献的相关字段前方和检索词一致,如:检索词为“世界贸易组织”,可检出《 世 界贸易组织概论 》,检不出《 大学世界贸易组织教程 》
2
精确检索:表示检索词和检出文献的相关字段完全一致,如检索词为“世界贸易组织”,可检出 《 世界贸易组织》,检不出《 大学世界贸易组织教程 》和《 世界贸易组织概论 》
信息检索原理课件

专利文件主要收藏在国家专利局文件馆,上海科技信息研究所、 中国科技信息研究中心等也部分收藏。
原则文件主要收藏国家技术监督局及各部、省、市旳技术监督局。 国家技术监督局收藏了全部国内技术原则和世界发达国家旳技术原则。 学位论文除收藏于学位授予单位外,国家图书馆、中国科技信息研究
所、中科院文件中心是国家法定旳学位论文收藏单位。
检索工具根据不同旳划分原则可分为不同旳类型: 根据信息旳检索方式划分,有手工检索工具、机械检索工具。 根据信息旳收录范围划分,有综合性检索工具、专业性检索 工具和单一性检索工具。 根据信息载体形式划分,有课本式、卡片式、缩微式和磁性 材料。 根据著录信息旳格式划分,有目录、题录、文摘、搜索引擎。
②信息检索系统
假如检索目旳不是很明确,或者只是经过对按学 科进行分类旳大量资料进行阅读,就能够选择分类检 索。假如想对某一主题旳资料进行迅速旳查找,就能 够选择初级般检索。假如进行较深旳专业性查找,就 能够选择高级检索。
④构造检索策略
构造检索策略涉及三方面内容:选择检索途径、拟定检索词、利用检索技术。 选择检索途径:在利用检索工具或检索系统查找信息时,要拟定检索旳入口, 即经过哪种检索途径来查找文件旳线索。常用旳检索途径有分类检索途径、主题 检索途径、著者检索途径、序号检索途径及专科途径。分类途径是按照学科分类 体系和事物性质作为检索标识来检索信息旳一种途径。主题途径是以代表文件内 容实质旳,经过规范化旳名词或词组作检索标识来检索信息旳一种途径。著者途 径是根据已知著者姓名来查找该著者刊登旳信息旳一种途径。号码检索途径是以 文件信息特有编号特征,并按编号顺序编排和检索信息旳途径。专科途径是根据 学科特点尤其设置旳便于专科性检索旳一种途径。一般说,假如对要检索文件信 息旳专业学科分类比较明确,常使用分类途径;若对所查专业学科分类不了解或 多涉及多种学科,则多使用主题途径;在已知著者旳名称旳情况下,著者途径是 最佳旳选择;若已知文件信息旳序号,涉及专利号、ISBN号、ISSN号、登记号等, 则选择序号途径。 拟定检索词:检索词能够是一种单元词,体现一种单一概念;也能够是一种 或多种词组,体现多种概念。检索词能够由检索顾客提出,也能够在数据库中旳 受控词表(主题词表、分类表等)中选择,在人工检索语言和自然检索语言并用 旳数据库中,最佳先浏览一下主题词表、叙词表和分类表,两者并用,以确保查 全查准。 利用检索技术:用布尔逻辑检索技术、位置逻辑检索技术、截词检索技术和
原则文件主要收藏国家技术监督局及各部、省、市旳技术监督局。 国家技术监督局收藏了全部国内技术原则和世界发达国家旳技术原则。 学位论文除收藏于学位授予单位外,国家图书馆、中国科技信息研究
所、中科院文件中心是国家法定旳学位论文收藏单位。
检索工具根据不同旳划分原则可分为不同旳类型: 根据信息旳检索方式划分,有手工检索工具、机械检索工具。 根据信息旳收录范围划分,有综合性检索工具、专业性检索 工具和单一性检索工具。 根据信息载体形式划分,有课本式、卡片式、缩微式和磁性 材料。 根据著录信息旳格式划分,有目录、题录、文摘、搜索引擎。
②信息检索系统
假如检索目旳不是很明确,或者只是经过对按学 科进行分类旳大量资料进行阅读,就能够选择分类检 索。假如想对某一主题旳资料进行迅速旳查找,就能 够选择初级般检索。假如进行较深旳专业性查找,就 能够选择高级检索。
④构造检索策略
构造检索策略涉及三方面内容:选择检索途径、拟定检索词、利用检索技术。 选择检索途径:在利用检索工具或检索系统查找信息时,要拟定检索旳入口, 即经过哪种检索途径来查找文件旳线索。常用旳检索途径有分类检索途径、主题 检索途径、著者检索途径、序号检索途径及专科途径。分类途径是按照学科分类 体系和事物性质作为检索标识来检索信息旳一种途径。主题途径是以代表文件内 容实质旳,经过规范化旳名词或词组作检索标识来检索信息旳一种途径。著者途 径是根据已知著者姓名来查找该著者刊登旳信息旳一种途径。号码检索途径是以 文件信息特有编号特征,并按编号顺序编排和检索信息旳途径。专科途径是根据 学科特点尤其设置旳便于专科性检索旳一种途径。一般说,假如对要检索文件信 息旳专业学科分类比较明确,常使用分类途径;若对所查专业学科分类不了解或 多涉及多种学科,则多使用主题途径;在已知著者旳名称旳情况下,著者途径是 最佳旳选择;若已知文件信息旳序号,涉及专利号、ISBN号、ISSN号、登记号等, 则选择序号途径。 拟定检索词:检索词能够是一种单元词,体现一种单一概念;也能够是一种 或多种词组,体现多种概念。检索词能够由检索顾客提出,也能够在数据库中旳 受控词表(主题词表、分类表等)中选择,在人工检索语言和自然检索语言并用 旳数据库中,最佳先浏览一下主题词表、叙词表和分类表,两者并用,以确保查 全查准。 利用检索技术:用布尔逻辑检索技术、位置逻辑检索技术、截词检索技术和
《信息组织检索二》PPT课件

即“在包含search 或 retrieval的文本中,不存在 sequential,但必须有algorithm这一索引项的文本”
精选PPT
33
运用逻辑优先级
❖ NOT 的优先级最高,其次是AND,最后是OR。
❖ 可以用括号改变运算顺序。
not and
精选PPT
or
34
2、截词(truncation)检索
❖ 左截词检索——又称“后方一致检索”,允许词前端有若干变化。如: 检索式“*magnetic”, 可以检索出 electromagnetic、paramagnetic等。
精选PPT
36
中间截词检索
❖ 又称“屏蔽”。允许检索词中间某个字符有变化(英 美单词拼写差异或单复数的不同等)。如:
❖ 检索式“organi?ation”, 可以检索出organization, organisation 等。
精选PPT
21
回溯法——
❖ 又称追溯法、引文法。以文献后面所附的参 考文献为线索,逐一追溯查找相关文献的方 法。该法获得文献的针对性比较强,尤其在 没有检索工具或检索工具不齐备的情况下较 实用。
精选PPT
22
循环检索法——
❖ 又称交替法、综合法。即利用回溯法和常规法交替 检索的方法。先利用检索工具查找,得出一批相关 文献,再利用回溯法按所附参考文献扩大检索线索。
精选PPT
17
❖ 近年来,信息抽取的处理对象已经扩展到图像、视 频、音频等其他媒体类型的数据。
❖ 目前的研究侧重于:利用机器学习技术增强系统的 可移植能力、探索深层理解技术、篇章分析技术、 多语言文本处理技术、Web信息抽取等。
精选PPT
18
❖ 信息抽取技术对搜索引擎、信息安全、企业智能信 息系统等许多应用领域具有相当重要的作用。
精选PPT
33
运用逻辑优先级
❖ NOT 的优先级最高,其次是AND,最后是OR。
❖ 可以用括号改变运算顺序。
not and
精选PPT
or
34
2、截词(truncation)检索
❖ 左截词检索——又称“后方一致检索”,允许词前端有若干变化。如: 检索式“*magnetic”, 可以检索出 electromagnetic、paramagnetic等。
精选PPT
36
中间截词检索
❖ 又称“屏蔽”。允许检索词中间某个字符有变化(英 美单词拼写差异或单复数的不同等)。如:
❖ 检索式“organi?ation”, 可以检索出organization, organisation 等。
精选PPT
21
回溯法——
❖ 又称追溯法、引文法。以文献后面所附的参 考文献为线索,逐一追溯查找相关文献的方 法。该法获得文献的针对性比较强,尤其在 没有检索工具或检索工具不齐备的情况下较 实用。
精选PPT
22
循环检索法——
❖ 又称交替法、综合法。即利用回溯法和常规法交替 检索的方法。先利用检索工具查找,得出一批相关 文献,再利用回溯法按所附参考文献扩大检索线索。
精选PPT
17
❖ 近年来,信息抽取的处理对象已经扩展到图像、视 频、音频等其他媒体类型的数据。
❖ 目前的研究侧重于:利用机器学习技术增强系统的 可移植能力、探索深层理解技术、篇章分析技术、 多语言文本处理技术、Web信息抽取等。
精选PPT
18
❖ 信息抽取技术对搜索引擎、信息安全、企业智能信 息系统等许多应用领域具有相当重要的作用。
信息检索教程(第二版) 教学课件 王立清 著 分章节版 005 信息检索教程第五章

28
Thank You!
29
教材其余课件及动画素材请查阅在线教务辅导网 在线教务辅导网:
QQ:349134187
或者直接输入下面地址:
0
普通高等教育”十一五”国家级规划教材
信息检索教程
王立清
主编
第5章 参考工具书使用
(5)查当代报刊
《中文核心期刊要 目总览》(第2版)
7
第5章 参考工具书使用
5.1.1.2 索引
索引是把一种或多种文献中具有检索意义的内容,
如字、词、句、人名、地名、书名、篇名、主题等摘录
下来,按一定顺序加以编排并注明出处以供查检的工具。
索引的类型多种多样,可以从不同的角度来划分。 按照编排方法或检索途径,索引可分为书目索引、篇目 索引、字句索引、主题索引、分类索引、专名索引和引 文索引。
百科全书是汇集各学科或某一学科的专门术语、重要 名词,以词典的方式进行编排,对每一词目都加以全面系 统而又客观简明的阐述,并对新的研究成果加以反映的大 型工具书。百科全书涉及各个领域,其内容之丰富、规模 之宏大、检索功能之完备是其他工具书所不及的。在各类 工具书中,百科全书堪称 “工具书之王”。 特点是:1. 概括性 2. 权威性 3. 易用性
18
第5章 参考工具书使用
百科全书的作用
1. 提供各种资料 2. 帮助系统求知
19
第5章 参考工具书使用
百科全书举要
《中国大百科全书》
《简明不列颠百科全书》 《简明中华百科全书》
20
第5章 参考工具书使用
5.2.3 手册
5.2.3.1 手册的定义和特点 手册是汇集某一方面经常需要查考的基本知识和数据 资料,系统地加以编排,以供读者随时翻检的一种工具书。 手册的名称很多,有指南、便览、要览、一览、必读、必 备、大全、宝鉴等。手册主要有如下特点: 1.实用性 2.灵活性 3.资料性
信息检索课件第4章

本作业要求从天网大学课程在线上下载一部指定的视频教程。这也将是本课程
期末考试的必考题目之一,请用心掌握下述操作技巧。
2013
用天网妹子搜索到的大学课程 在线
2013
大学课程在线项目理念
来源于如下一些理想中的场景:
场景一: 新疆石河子大学计算机系讲授《计算机体系结构》的张
老师对他的学生说:关于“指令流水线部分”的内容请大家 点播“大学课程在线”上北京大学李老师相关的视频,我们 的答疑时间是本周星期四。
的文件: 如文本文件、二进制的可执行程序、科学论文、图像文件、压缩文件、
声音文件等。因此有大量有价值的信息资源存储在Internet网上的FTP服务器上, 获
取这些资源也是信息检索的一项内容。
2013
4.1.2FTP的工作原理
FTP(File Transfer Protocol) 是 TCP/IP 协议的一种, 它是在Internet网上使用最广
泛的一种服务, 它可被用来在两台位于Internet网上的计算机之间传输文件, 它是一
种实时的联机服务, 使用时, 用户应首先登录到对方的主机上, 登录成功后, 可以进
行文件搜索和文件传送的操作, 如列文件目录, 改变当前目录, 设置传送参数等。
2013
4.1.3什么是P2P
P2P在IT界最初的含义是Peer-to-peer(点对点)。现在P2P已经被更广泛的 理解为Point-to-Point, PC-to-PC等等。 简单来说,P2P就是指数据的传输不再通过服务器,而是网络用户之间直接 传递数据 。
2013
作业4 迅雷在线搜索
本作业要求,对2006年最火爆的“明星学者” 易中天先生的力作:CCTV百家讲坛《易中天品 三国》在迅雷上进行搜索,将这套系列视频教 程的总目录列出来(据说有30多集),按演讲 顺序编号,并附上资源发布站点的屏幕抓图, 以使读者能够方便地下载自己需要的讲座内容。
信息检索技术PPT课件

从形式上分 正式主题词 非正式主题词
按按照照选选词词方方式式的的不不同同划划分分
2020/3/21
标题词 单元词
叙词 关键词
13
2.1.2 主题语言
标题词语言
最早使用的主题语言之一,以规范化的自然语义作为标识 来表示文献涉及的主题概念。其中表达主题的词语称为标题词
单元词语言
从文献内容中抽选出来的最基本的词汇,将代表最一般、 最基本的、不可再分割的概念的词作为单独标引文献的单位 单元词是构成标题词的组件,绝大部分单元词都不是具体的标题。
检索词A和检索词B用“与”组配,检索式为:
A AND B,或者 A * B
它表示检出同时含有A、B两个检索词的记录。
例:图书馆教育 library AND education
2020/3/21
21
2.3.1 布尔逻辑检索 逻辑“或”
一种具有概念并列关系的组配,用“OR” 或“+”或“|”算符表示
检索词A和检索词B用“或”组配,检索式为:
2020/3/21
23
2.3.2 截词检索
定义:用给定的词干做检索词,用以检索出含有该词干的全部检索词的记录。 又称为通配符,不同的检索系统中使用的符号不同, 通常用“*”、“?” 来表示。
方式:后截断、前截断、中间截断 代码: *—无限截断 ?—有限截断
作用:扩大检索范围、提高查全率、减少检索词的输入量、节省检索时间等作用。
2.1.3 代码语言、自然语言
代码语言
是指对事物的某方面特征,用某种代码系统来表示和排列事物 概念,从而提供检索的检索语言。 通常用数字、字母或用它们结合的形式或以分段的方式来表示 其各部分的含义。 适用:科技报告、专利文献
按按照照选选词词方方式式的的不不同同划划分分
2020/3/21
标题词 单元词
叙词 关键词
13
2.1.2 主题语言
标题词语言
最早使用的主题语言之一,以规范化的自然语义作为标识 来表示文献涉及的主题概念。其中表达主题的词语称为标题词
单元词语言
从文献内容中抽选出来的最基本的词汇,将代表最一般、 最基本的、不可再分割的概念的词作为单独标引文献的单位 单元词是构成标题词的组件,绝大部分单元词都不是具体的标题。
检索词A和检索词B用“与”组配,检索式为:
A AND B,或者 A * B
它表示检出同时含有A、B两个检索词的记录。
例:图书馆教育 library AND education
2020/3/21
21
2.3.1 布尔逻辑检索 逻辑“或”
一种具有概念并列关系的组配,用“OR” 或“+”或“|”算符表示
检索词A和检索词B用“或”组配,检索式为:
2020/3/21
23
2.3.2 截词检索
定义:用给定的词干做检索词,用以检索出含有该词干的全部检索词的记录。 又称为通配符,不同的检索系统中使用的符号不同, 通常用“*”、“?” 来表示。
方式:后截断、前截断、中间截断 代码: *—无限截断 ?—有限截断
作用:扩大检索范围、提高查全率、减少检索词的输入量、节省检索时间等作用。
2.1.3 代码语言、自然语言
代码语言
是指对事物的某方面特征,用某种代码系统来表示和排列事物 概念,从而提供检索的检索语言。 通常用数字、字母或用它们结合的形式或以分段的方式来表示 其各部分的含义。 适用:科技报告、专利文献
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
18
第9章 网络信息检索概述
9.3 网络信息 检索相关标准
9.3.1 网络信息检索标准Z39.50
Z39.50 是一种 Client/Server 体系结构下描 述客户机检索服务器上数据以及获得检索结果 的数据结构与交互规则的协议,是网络中的应 用层协议,定义了客户机与服务器之间数据交 换标准。
19
14
第9章 网络信息检索概述
网络信息检索与传统信息检索相比,呈现出新的特点: 1.检索的对象得到了极大的丰富 2.检索的空间得到了极大的扩展 3.检索趋于简单方便
15
第9章 网络信息检索概述
网络检索与其他类型的计算机检索形式相比,也存在 一些不足,主要有: 1.信息查准率比较低 2.检索带有一定的盲目性 3.各种检索工具的检索方法不统一,造成了用户使用
第9章 网络信息检索概述
9.3.1.1 Z39.50概况
Z39.50起源于20世纪70年代美国国会图书馆、OCLC(Online Computer Library Center)、研究图书馆信息网络(Research
Libraries Information Network)等的书目数据库系统互联项目。
12
第9章 网络信息检索概述
Internet 还有大量的会议信息、学位论文、技术标 准、科技政策法规、产品样本目录、科技报告、统计数据、 电子论坛、科技新闻、组织机构、通讯讨论组和数据库等, 其分布特征主要体现在以下两个个方面:
离散性
不均衡性
13
第9章 网络信息检索概述
9.2 网络信息检索原理与方法
9.2.1 网络信息检索原理
9.2.1.1 网络信息检索及其特点
网 络 信 息 检 索 ( NIR-Networked Information Retrieval)代表着网络时代获取信息的重要方向。网 络信息检索指通过一定的方法,从已存储的网络信息 中查找与用户提问相关的信息的过程。它是计算机检 索的发展和延伸,是一种基于 Internet 的新型的信息 检索方式。
三维虚拟 影像信息
6
第9章 网络信息检索概述
按照人类信息交流的方式划分 :
正式出版信息 半正式出版信息 非正式出版信息
7
第9章 网络信息检索概述
按照信息的加工程度划分:
一次网络信息资源 二次网络信息资源Βιβλιοθήκη 三次网络信息资源8
第9章 网络信息检索概述
按照网络信息的内容和用途划分 :
普通型
专门资料型
数据资料型
9.1 网络 信息资源分布
3
第9章 网络信息检索概述
网络信息资源与传统信息资源相比,有着明显的优势:
1. 数量巨大,增长迅速
2. 内容丰富,形式多样 3. 结构复杂,分布广泛 4. 开放互动,共享性强 5. 传播快速,利用方便
6. 更新速度快,动态性强
7. 信息使用成本低
4
第9章 网络信息检索概述
的不便
16
第9章 网络信息检索概述
9.2.1.2 网络信息资源检索的原理 当前的网络信息通讯多采用客户端/服务器结构。
网络
数据库 用户界面 网络客户端 网络服务器 数据库 网络服务器 数据库
网络信息检索的基本模型
17
第9章 网络信息检索概述
9.2.2 网络信息检索方法
在Internet上查找信息,主要是要找到提供信息源的 服务器。 在网上检索信息资源的基本方法如下: 1.直接浏览——网址查询 2.利用网络资源目录 3.利用以关键词检索为主的搜索引擎 4.查询网络文献数据库 5.查询网上图书馆
教材其余课件及动画素材请查阅在线教务辅导网 在线教务辅导网:
QQ:349134187
或者直接输入下面地址:
0
普通高等教育”十一五”国家级规划教材
信息检索教程
王立清
主编
第9章 网络信息检索概述
●分析网络信息检索的原理及方法
●简述了网络信息检索的相关标准 ●探讨网络信息检索的发展趋势
第9章 网络信息检索概述
9.1.1 网络信息资源的特点
网 络 信 息 资 源 ( Network Information Resources )指可在 因特网上发布、查询与存取利用的 信息资源的总和。它包括在 Internet 这个平台上可以获得的一 切信息资源,如数据库、电子图书、 电子期刊、电子报纸和其他的网站、 网页等。
互联网已经在网民生 活中占据一定的地位。互 联网上的信息已是海量, 搜索引擎则是网民在汪洋 中搜寻信息的工具,是互 联网上不可或缺的工具和 基础应用之一。在当前网 络环境下,网络信息检索 已成为人们获取信息的最 重要方式。
2
本章要点
●介绍网络信息资源的概念
●阐述网络信息资源的特点与类型 ●论述网络信息资源的分布
即时资料型
9
第9章 网络信息检索概述
按照信息的表现形式划分 :
全文型
数值型
书目文献型
实时活动型
10
第9章 网络信息检索概述
按照传输协议的不同分: WWW信息资源 Telnet信息资源
FTP信息资源
网络论坛
Gopher信息资源
11
第9章 网络信息检索概述
9.1.3 网络信息资源的分布
Internet现已成为全世界最大的信息资源库,网络信 息资源可谓浩瀚无边,内容涉及各个方面。 1. 政府信息 2. 教育科研信息 3. 网上出版物 4. 网络数据库 5. 电子论坛和电子会议 6. 网上专利信息
网络信息资源的缺点: 1. 网络信息质量参差不齐,良莠不一 2. 分散无序,缺乏管理 3. 稳定性差,精确度低,缺乏安全保障
5
第9章 网络信息检索概述
9.1.2 网络信息资源的类型
依据不同的划分标准,可以对网络信息资源做出如下 的分类: 按网络信息资源的媒体形式分 :
文本信息 图片信息 音频信息
视频信息
在国家信息标准化组织(National Information Standards Organization,NISO)的支持下开始了这一方面的标准化研究工作,
于1988年推出第一个版本Z39.50-1988,即图书馆应用系统信息检
索服务定义与协议规范(Information Retrieval Service Definition and Protocol Specifications for Library Applications)。