第2章信息检索原理与技术

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 各种图书目录、期刊目录 • 国内外著名的题录和文摘有《全国
报刊索引》、《工程索引》(EI)、 《科学引文索引》(SCI)等。
全文信息检索是利用各种全文系统获 取有关的全文信息。
例如:中国科技期刊全文数据库
数据和事实检索是利用各种参考工具 书获取有关的确定性数据或事实信息。
例如:各种百科全书、年鉴、手册等。
例如:查找有关“城市生态环境及 可持续发展”方面的国内外信息有那
些?
检索工具: 中文科技期刊数据库、万方数据资源系统、 EI等。
全文信息检索
以论文或专利说明书的全文为检索对 象,也是相关性检索。特点:是在书目 信息检索基础上更深层次的内容检索。
例如:检索由侯果山撰写,发表在 小说评论,2009,(S1)“浅谈《红楼梦》 与《家》的相似之处” 一文。
示例 课题名称:相变储能纤维的制备
一、检索目的和要求: 目的:科技立项 要求:国内外有无 1.相变储能纤维制备的研究报道; 2.已采用的制备方法有哪些?
2.2.ຫໍສະໝຸດ Baidu 信息检索语言
检索语言又称标引语言, 是系统存储和检索时共同 使用的一种约定语言,以 达到信息存储和检索的一 致性,提高检索效率。
检索语言的类型
分类语言 主题语言
体系分类语言 组配分类语言 混合分类语言 标题词语言 关键词语言 叙词语言 单元词语言
体系分类语言
体系分类语言是按学科逻辑分类的 原理,运用概念划分的方法,按知 识门类从总到分,从上到下,层层 划分,逐级展开组成分类表,并以 分类表来标引、存储信息和检索信 息。特点是体现学科的系统性,反 映事物的平行、隶属和派生关系, 有利于从学科的角度进行族性检索, 达到较高的查全率。
黑龙江省计算机软件工程技术研究中心 江苏省计算机软件工程研究中心 中山大学计算机软件研究所 云南省计算机软件技术开发研究中心 计算机软件国家工程研究中心 武汉大学计算机软件工程研究所 贵州大学计算机软件与理论研究所 浙江大学计算机软件研究所
小结:
书目信息检索是利用各种目录、题录 和文摘工具获取有关信息的线索。 例如:
《中图法》第四版分类体系组成及结构
《中图法》T 工业技术及环境科学 大类简表(二级类目表)
TB 一般工业技术 TD 矿业工程 TE 石油、天然气工业 TF 冶金工业 TG 金属学与金属工艺 TH 机械、仪表工业 TJ 武器工业 TK 能源与动力工程
TL 原子能技术 TM 电工技术 TN 无线电电子学、电信技术 TP 自动化技术、计算机技术 TQ 化学工业 TS 轻工业、手工业 TU 建筑科学 TV 水利工程
事实信息检索
以事项为检索对象,检索 结果是有关某一事物的具体 答案,也是一种确定性检索。 一般利用字词典、年鉴、百 科全书、手册等为检索工具。
示例
问题:国内计算机软件的研究机构? 检索工具:中国企业、公司及产品数据库 中油油气勘探软件国家工程研究中心有限公司 四川省嵌入式计算机软件技术重点实验室 信息产业部实时计算机系统及应用重点实验室 电子科技大学嵌入式实时计算研究所
检索工具:中国期刊全文数据库
数据信息检索
以具有数量性质并以数值形式表示的 数据为检索对象,是一种确定性检索。 检索的结果是经过测试和评价过的各种 数据,可用于比较分析和定量分析。它 一般以数据大全、手册、年鉴等为检索 工具。
示例
2008年申请中国发明专利和 获得授权发明专利的国家有哪些?
检索工具 中国统计年鉴
关键词语言
关键词语言是一种主题语言(采 用表达某一事物或概念的名词术语 标引、存储和检索的一种语言)。 它是直接从原文的标题、摘要、全 文中,研究课题中抽选出来的具有 实质意义的、未经规范化处理的自 然语言词汇作为存储和检索依据的 一种检索语言。
示例 一
海岸带湿地变化及其对生态环境的影响
关键词:
2. 信息检索原理及技术
2.1 信息检索概述 2.2 信息检索原理 2.3 信息检索方法 2.4 信息检索技术
2.1 信息检索概述
2.1.1信息检索的含义 2.1.2信息检索的实质 2.1.3信息检索的类型和特点
2.1.1 信息检索的含义
信息检索通常是指从任何方式 组成的信息集合中,查找特定用户 在特定时间和条件下所需信息的方 法与过程。因此,完整的信息检索 应包括以下两个方面:
示例二
食品中常见病原菌快速检测
提问特征(关键词)
食品、食物 病原菌 检测
2.1.3 信息检索的类型和特点
1. 书目信息检索 2. 全文信息检索 3. 数据信息检索 4. 事实信息检索 5. 小结
书目信息检索
以标题、作者、原文来源、摘要及收藏地点为检 索对象,是一种相关性检索。特点:检索结果不直接 解答课题用户提出的技术问题,只提供与之相关的线 索。一般以目录、索引、文摘数据库为检索工具。
2.2 信息检索原理
2.2.1 信息检索效率 2.2.2 信息检索系统 2.2.3 信息检索语言
2.2.1 信息检索效率
信息检索效率是评价一个检 索系统性能优劣的质量标准,它 贯穿于信息的存储和检索的全过 程。其评价指标主要是:
查全率 查准率
2.2.2 信息检索系统
信息检索系统是拥有一定 的存储、检索技术装备、存 储有各种信息,并能为用户 检索所需信息的服务工作系 统。目前常用的是手工检索 系统和计算机检索系统。
海岸带
湿地 生态环境
示例 二
高性能纤维的制备和研究 关键词:
纤维 制备
2.3 信息检索方法
2.3.1 信息需求分析 2.3.2 制定检索策略 2.3.3 实施检索策略
2.3.1 信息需求分析
信息需求是人们在客观或主 观上就课题所需信息的要求,是 人们检索信息的基本出发点,也 是评价检索效果的依据。它包括 两个方面(参见教材24页) 1. 明确检索的目的和要求 2. 对主题进行分析
1. 信息标引和存储过程 2. 信息的检索过程
2.1.2 信息检索的实质
将描述特定用户所需信息的提问 特征,与信息存储的检索标识进行 异同的比较,从中找出与提问特征 一致或基本一致的信息。提问特征 是指从欲检索课题中选择出能代表 信息需求的主题词、关键词或分类 号等。
示例一
区域发展中的生态环境特征研究 提问特征(关键词) 1.区域发展 生态环境 2.区域 生态 环境
相关文档
最新文档