信息检索PPT(北航)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分类语言
• 作用:
1. 反映知识的分类或社会实践活动的职
能分工,具有较好的系统性。 2. 把同一学科、同一专业、同一职能活 动的文献集中在各个类目之下,满足 族性检索(类检索)需要。
分类语言
• 分类语言的具体表现形式是分类表,如在 国内图书馆常用的《中国图书馆分类法》。 • 分类表的作用: 指导存储文献,正确标引出分类号 适用于从分类的角度检索某一类的文献
排序:将它们系统地排列到检索工具或系统中去 供读者查找。
信息存储
信息源 主题分析
存储标识
概念转换
信息集合
目录文摘索引编制
3 信息的检索
信息的检索过程: • 按照同样的主题词表或分类表分析检索需 求,形成检索提问标识。依据信息存储时
所形成的检索途径,从信息集合中查找与
检索提问标识匹配的信息特征标识。
2.2 文摘检索系统
• 文摘检索系统:用于对信息题录和文摘的 检索,检索结果一般是文献的来源信息。 • 常用文摘检索系统:工程索引(EI)、引 文索引(SCI)、科技会议录索引(ISTP)
文摘检索系统
EI数据库(图书馆主页-电子资源-文摘数据库-EI )
检索词
选择字段
文摘检索系统
检索结果
√ √
施称为信息检索系统。
例如:中国期刊网(CNKI)、在线公共目录 检索系统(OPAC)、工程索引(EI)
2 检索系统分类
检索系统分类:
目录检索系统
检索系统 全文检索系统
文摘检索系统
2.1目录检索系统
• 目录检索系统:用于对出版物进行报道和 对图书资料进行科学管理。 • 常用目录检索系统:在线公共目录检索系 统(OPAC)、中国高等教育文献保障系统 (CALIS)联合目录公共检索系统。
光盘检索
• 光盘检索有单机检索和联机检索两种。 • 单机检索系统自成系统,由普通计算机、 光驱、数据库光盘以及相应的检索软件和 驱动软件构成,提供单个用户使用。 • 联机检索系统在光盘网络的环境下运行, 受到光盘塔和局域网的支撑,在局域网内 提供多个用户使用,由服务器管理。
网络检索
• 基于搜索引擎技术的网络检索时随着互联 网的兴起和普及而出现的。 • 网络搜索引擎是当今网络检索工具的主流, 不仅提供文本检索,还可以提供图像、图 形、音频、视频、动画等多媒体检索。
文献整序
• 将杂乱无章的替代文献(二次文献)按一 定的顺序(通常按学科类目)排列,并编 制各种索引的过程。
• 经过文献替代和文献整序后,完成了文献 存储的过程。
文献特征标识与检索提问标识的匹配
• 信息检索的过程就是文献特征标识与检索 提问标识两者匹配的过程 • 为了实现这种匹配,标引人员和检索人员 必须采用一种共同的语言,即检索语言。
全文检索系统
CNKI 附加的资源
CNKI的期刊导航
核心期刊导航
外语类的核心刊
检索系统小结
全文检索系统
用户提问
目录检索系统
馆藏信息
收藏地
全文
文摘检索系统
来源信息
三、检索语言
• 检索语言基础知识 • 检索语言的分类 • 检索运算符
检索语言
信息检索语言是用来描述信息的内容特 征和形式特征以及表达信息用户的语言。 它是根据文献信息的存储和检索的需要而 编制的一种人工语言,又称检索标识。它 把信息的存储与检索联系起来使信息的标 引者和检索者取得共同理解,从而实现检 索目的。是沟通信息存储和信息检索的桥 梁和纽带,也是信息用户获取所需信息全 过程得以顺利实现的保证。
数据(值)检索
• 是指查找用户所得特定数据的检索。目标是检索出 可以直接使用的数据或数值,例如查找各种统计数 据、图像、图标、图表、数学表达式、化学分子式、 设备型号、技术参数等。譬如,检索“尼罗河的长 度是多少”。 • 数据检索是一种确定性检索,主要是利用各种词典、 手册、百科全书、年鉴等参考工具书进行.也可以 利用各种参考型数据库进行检索。
分类语言
A B C D E F G H I J K N O P Q R S T U V X Z 马克思主义、列宁主义、毛泽东思想 哲 学 社会科学总论 政治、法律 TB 一般工业技术 军 事 TD 矿业工程 经 济 TE 石油、天然气工业 文化、科学、教育、体育 TF 冶金工业 语言、文字 TG 金属学、金属工业 文 学 TH 机械、仪表工业 艺 术 TJ 武器工业 历史、地理 TK 动力工程 自然科学总论 TL 原子能技术 数理科学和化学 TM 电工技术 天文学、地球科学 TN 无线电电子学、电信技术 生物科学 TP 自动化技术、计算技术 医药、卫生 TQ 化学工业 农业科学 TS 轻工业、手工业 工业技术 TU 建筑科学 交通运输 TV 水利工程 航空航天 环境科学、劳动保护科学 综合性图书
目录检索系统
• 检索结果
多库检索
组合检索
目录检索系统
• CALIS(http://opac.calis.edu.cn/simpleSearch.do)
信息素养
目录检索系统
• 检索结果
显示馆藏信息
查看第二本的馆藏地
馆藏地信息
其他的目录检索系统
• 全国联合目录网上系统 http://159.226.100.141/index.jsp • 国家科技图书文献中心 http://www.nstl.gov.cn/ • 中国科学院图书馆 http://159.226.100.4/search*chx/
信息检索的种类
按照检索对象,把信息检索分为: 文献检索
数据检索
事实检索
文献检索
• 是指查找用户所需文献的线索或者原文的检索。 如查找某一主题的相关文献,对某研究课题立项 的文献查新,或从事新产品开发时需要查找有关 最新研究动态等。 • 文献检索是一种相关性检索,检索结果是某一专 题的文献线索(文摘、题录),一般要经过阅读文摘 后才能决定取舍。文献检索主要是利用二次文献 进行,如各种载体形式的目录、题录、文摘、索 引等。文献检索是信息检索中最基本、最重要的 类型。 文献检索是信息检索的核心和和主体部分,是 最常用的一种检索。文献检索分为数目检索和全 文检索。其目标是检索出原始文献或原始文献的 替代品。
目录检索系统
• 北航图书馆的OPAC(http://202.112.134.140:8080/opac/)
OPAC检索主界面
检索结果
著录信息与馆藏地信息
著录信息
分类浏览书目
点击相关学科,可以查看图书类目
期刊导航
目录检索系统
• 国家图书馆联机公共目录查询系统 (http://opac.nlc.gov.cn/F)
信息检索(information retrieval): 是按照一定 方式从信息集合中或数据库中查找所需信息 的具体过程。
广义信息检索:包括信息存储与查找两个过程 狭义信息检索:指信息的查找。
广义信息检索基本原理
信息存储过程
信 息 资 源
信 息 搜 集
信 息 分 析
信 息 表 达
词 语 转 换
检索 语言
检索语言
外部特征
书名/刊名 著者名/团体著者 出版事项 代码/序号
内部特征 分类语言 分类表 主题语言 主题词表
检索语言的分类
按构成原理划分
分 类 语 言
主 题 语 言
分类语言
• 分类语言:是以号码为基本字符,用分类 号和类目表达文献主题概念的检索语言。
• 特点:是用分类号表达各种概念,根据概 念之间的关系,把它们组织成一个逻辑体 系。
数据库
检索结果
信 息 用 户
信 息 需 求
需 求 分 析
需 求 表 达
词 语 转 换
信息检索过程
引例
例如: 《车用替代燃料与生物智能》
书的信息存储过程 U473 交通运输类U U473/12
U
汽车用燃料、润 滑料类 U473 书的信息检索过程 U473/12
2 信息的存储
信息的存储过程: • 按照检索语言(主要是主题词表和分类表)
文摘检索系统
2.3 全文检索系统
• 全文检索系统:全文也包括内容简短的事
实和数据,全文检索系统集文摘检索与全
文提供于一体。 • 常用的全文检索系统:中国知网(CNKI)、 Science Direct
全文检索系统
CNKI(图书馆主页-电子资源-全文数据库 -CNKI)
全文检索系统
• 检索结果
1 检索语言的基础知识
概念 检索原理 检索 语言 作用
检索语言的基础知识
• 信息检索语言:
用于描述信息系统中信息的内容特征 和外表特征,并可以表达用户提问的一种 专门语言。
• 作用:信息存储
检索语言
信息检索
检索语言的基础知识
文献存储子系统 文献检索子系统
信息群
待标文献
用户群
用户提问 主题概念
著 录 标 引 过 程
分类语言
• 国内: 《中国图书馆分类法》 《科学院图书馆分类法》 《人民大学图书馆分类法》 • 国外: 《杜威十进分类法》(Dewey Decimal Classification and Relative Index) 《美国国会图书馆分类法》(Library of Congress Classification)
信息的检索
信息需求
主题分析
检索标识
概念转换
信息集合
目录文摘索引
信息检索原理
文献替代
文献整序 文献特征标识与检索提问标识的匹配
文献替代
• 一次文献的文献特征标识(外部特征和内 容特征)按一定的标准格式著录成它的替 代文献(二次文献)的过程。
• 著录项目与格式:
• 中图分类号 • 题名/著者(著者所在单位 邮政编码)//刊名/主办单位.—出版年, 卷(期).—所在页码 • 文摘……。图x表x参x(文摘员)
基本大类
分类语言
TN03 08 索书号
分类语言
• 索书号
英 日俄德
文种号 ( E , J, R, G )
TN03 08
分类号(A,B,C,D,E,F,G,H,I,J,K,N,O,P,Q,R,S,T, U,V,X,Z) 种次号
事实检索
• 是指以特定的事实为检索对象的一种检索。如查找 某一名人、机构的基本情况;某一事件发生的时间、 地点、过程等。如,检索“长江哪一年汛期的水位 最高”。 • 事实检索和数据检索一样,也是一种确定性检索, 所不同的是需要对检索出来的数据进行较为复杂的 对比、分析、推理后,方可得出结论。可利用百科 全书、手册、年鉴、名录及相关数据库等参考工具 进行检索。
信息检索的种类
按照计算机检索技术划分 • 联机检索 • 光盘检索 • 网络检索
联机检索
联机检索是以联机检索提供商为中心,提供商研制 自己的软件,建立自己的联机检索系统,用户利 用检索系统终端,通过专用的或公用的电话线路 等数据通讯网络与利用检索系统相连,按照提供 商所指定的各项检索规则进行检索。 联机检索系统由主机系统、数据库、通讯设备和终 端设备组成。 著名的联机检索系统有:OCLC、Dialog、STN等。 DIALOG系统:目前世界上最大的商业性国际联 机检索系统,拥有450多个数据库,其中也包括若 干医药卫生数据库。
信息海洋冲浪的基本方法与技巧
—“掌握”航海工具箱
主要内容
工具箱——信息检索
工具箱——检索系统
工具箱——检索语言
一、信息检索
信息检索的概念 信息的存储过程 信息的检索过程
1 信息检索概念——引例
汽车燃料
中国图书馆分类法
交通运输类(U)
中国图书馆分类法
汽车用燃料、润滑料类 (U473)
信息检索概念
检索种类
• 计算机检索 指人们在计算机或计算机检索网络的终 端机上,使用特定的检索指令、检索词和 检索策略,从计算机检索系统的数据库中 检索出需要的信息,继而再有终端设备显 示或打印的过程。
二、检索系统
检索系统的概念
检索系统的分类
1 检索系统的概念
• 信息检索系统:
由一定的设备和信息集合构成的服务设
及其使用规则对每条原始信息进行处理,
形成一系列信息特征标识,组成一条记录。
许多条记录形成有序的信息集合。
文献存贮过程
标引:为纳入检索工具或系统的每一种期刊或 每一篇文献等标引检索标识。
著录:将文献的有关特征标识著录下来,形成一 条条文献线索。著录是遵循1983年我国颁布的中 华人民共和国《检索期刊条目著录规则》 ( GB3793—83)中的规定对文献的著录项目和 格式。
主题分析
主题概念
主题分析
概念ቤተ መጻሕፍቲ ባይዱ换
特征标识
检索语言
概念转换
检索标识
编制目录文摘索引
目录数据
查找
编 制 检 索 策 略 过 程
信息集合
检索原理
信息检索的原理:
• 用检索标识与信息的存储标识相比较,若
取得一致,则为匹配,即可得到命中文献。 • 信息存储 信息检索
检索语言
2 检索语言的分类
按照描述信息的特征分