1 信息检索概述 武大黄如花
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
➢ 提高检索者的检索水平
Any Questions?
Forthcoming: 网络信息检索的基本方法
1 信息检索的含义
➢ 广义的信息检索
➢ information storage ➢ information retrieval百度文库
➢ 狭义的信息检索
➢ information retrieval
信息检索的常用术语
➢检索词:用户输入的字、词、字符或短语 ➢检索式:检索提问表达式 ➢检索策略:是对查询的全面策划,在操作
2 信息检索的种类
➢ 根据检索手段的不同 ➢ Manual retrieval ➢ Disc retrieval ➢ Online retrieval ➢ Web-based retrieval
➢ 根据检索对象形式 ➢ document retrieval ➢ data retrieval ➢ fact retrieval
编辑出版形式
标准文献 技术档案
产品资料
3 信息检索的原理
4 信息检索语言
《中图法》等级分明的科学系统
O
一级类目
数、理、化
O1 O3 O4 O6 O7 …… 二级类目
数学 力学 物理 化学 晶体
O11 O12
O13 ……
三级类目
古典数学 初等数学 高等数学
O121 O122
O123 O124
四级类目
➢ 查准率是系统在进行某一检索时, 检出的相关信息量与检出的信息总 量的比率
查全率:R =
被检出相关文献量 相关文献总量
被检出相关文献量 查准率:P =
被检出文献总量
未检出相关文献量 漏检率:M =
相关文献总量
被检出非相关文献量 误检率:N =
被检出文献总量
提高检索效果的措施
➢ 选择质量较高的检索系统
上主要指数据库的选择和检索式的编制 ➢前者选择数据库资源,后者实现检索目标 ➢一般也直接将检索式视为搜索策略
➢信息素质的含义
➢信息素养(information literacy)又称信息 素质,由美国信息产业协会主席保罗·车可 斯基(Paul Zurkowski)在1974年首先提出
➢他定义为:“利用大量信息工具及主要信 息源使问题得到解答的技术和技能。”
第一章 信息检索概述
Outline
➢信息检索的基本概念 ➢信息检索的历史 ➢信息检索模型 ➢信息检索系统的结构与评价
第一节 信息检索的基本概念
➢
More refined and abstract
Wisdom Knowledge Information
Data
Information Hierarchy
算术 初等代数 初等几何 三角
➢ 国内外常用的叙词表:
➢我国的《汉语主题词表》 ➢美国国会图书馆主题词表(LCSH) ➢英国《科学文摘》使用的《INSPEC叙词表
》
➢美国《工程索引》使用的《COMPENDEX 叙词表》
第二节 信息检索的历史
➢手工检索(1876-1945) ➢机械信息检索 (1945—1954) ➢脱机批处理检索(1954-1965) ➢国际联机检索 (1965-) ➢光盘检索(1980-) ➢网络检索(1991--) ➢后四者统称为计算机信息检索 ➢多种方法并存,网络检索最有发展前景
信息资源的有关概念
➢ 文献(literature,document) ➢ 信息资源(information resource)
➢electronic resources(电子资源) ➢virtual resources(虚拟资源) ➢ digital resources(数字资源 ) ➢networked resources, WWW resources,
➢后来又将其解释为“人们在解答问题时利 用信息的技术和技能”。
➢Librarians’ Information Literacy Annual Conference (LILAC ),2005-,国际会 议
➢国际图联(International Federation of Library Associations and Institutions , IFLA)发布《信息素质评价指南》,促进 发展中国家信息素质教育
➢UNESCO 与IFLA信息素质教育的中长期合 作项目
➢UNESCO :An Analysis of Information Literacy Education Worldwide
➢PISA蕴含的意义
➢在这个迅速变化的时代,学生不可能在学 校里学到将来所需的每一种知识和技能, 必须在具备阅读、数学、科学等方面基础 的前提下,努力培养自己的学习能力。学 会如何学习(learn how to learn),将比学 会事实(learn to know)更为重要。
web-based resources, resources on the Internet(网络资源) ➢online resources(联机资源)
信息源
记录型
实物型
智力型
零次
载体形式
式
印刷型 缩微型 声像型 电子型
图书
一次信息
期
刊
处理级别
二次信息 三次信息
报 专利文献
纸
会议文献
科技报告
学位论文
第三节 信息检索的模型
➢ 浏览型模型
➢ 扁平式模型 ➢ 结构导向模型 ➢ 超文本模型
➢ 基于内容的检索型模 型
➢ 集合论模型 ➢ 代数论模型 ➢ 概率论模型
第四节 信息检索系统的结构与评价
➢ 信息检索系统的含义
➢ 信息检索系统的类型 ➢ 信息检索系统的物理结构 ➢ 信息检索系统的逻辑结构
评价信息检索系统效果的指标
➢查全率(Recall Factor,R) ➢查准率(Precision Factor, P) ➢漏检率(Omission Factor) ➢ 误检率(Noise Factor) ➢新颖率 ➢检索速度
重要指标
➢ 查全率是系统在进行某一检索时, 检出的相关信息量与系统信息库中 相关的信息总量的比率。