信息检索的基本原理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图书馆胡小莉
目录
第一节信息检索的涵义及类型
第二节信息与信息源
第三节信息检索途径与步骤
第四节信息检索效果的评价
4123
学习目的和要求
1、掌握信息检索的基本概念和类别
2、掌握常用的布尔逻辑、截词、位置检索等检索技术
3、了解信息检索的基本流程
第一节信息检索的涵义及类型
信息检索的涵义
广义:是指将信息按一定的方式组织和存储起来, 并根据信
息用户的需要找出有关信息的过程和技术。全称为“信息存
储与检索”。
狭义:是指该过程的后半部分,即从信息集合中找出所需要
的信息的过程, 相当于人们通常所说的信息查寻。
信息检索的原理:就是将读者(用户)的信息需求与存贮在信息集合体中的信息进行比较和选择,即匹配(match)的过程。即对信
息集合与需求的匹配与选择。
检索与查找的区别
检索查找、搜索、搜寻英文Retrival或Retrieval search
过程和方法有一定的策略,是
系统的查找资料随机或更随意一些。
技能需要一定的专门知
识和技能
简单,任意词用途课题或专题日常生活
结果检索前通常不知道
会有什么结果
通常知道结果效率迅速、准确一般
如果不刻意区分:你完全可以认为它们没有区别!
信息检索的类型
根据信息检索信息形式不同,分为:
分类检索内容
文本检索(自然语言检索)不对文献进行任何标引,直接通过计算机以自然语言中的词语匹配查找的系统。
多媒体检索能够支持两种以上媒体的数据库检索,
查找含有特定信息的多媒体文献的检
索。
超文本检索用超链接的方法,将各种不同空间的文
字信息组织在一起的网状文本。我们日
常浏览的网页上的链接都属于超文本。
信息检索的意义及目的
1、信息检索是获取新知识的捷径,节省学习者的时间
。
据估计,现在全世界每年出版的图书有80万种以上,科技期刊8
万种以上;发表期刊论文大于600万篇以上;公开的专利说明书
100多万件;国际会议文献1万多件;美、英、德、日等国产生的
科技报告达20万件左右。科技文献浩如烟海,具备一定的信息检
索能力才能查找出有用的科技信息。
信息检索的意义及目的
2、信息检索是科学研究的向导,避免重复研究或走弯
路。
美国在实施“阿波罗登月计划”中,对阿波罗飞船的燃料箱进行压力实验时,发现甲醇会引起钛应力腐蚀,为此付出了数百万美元来研究解决这一问题,事后查明,早在十多年前,就有人研究出来了,方法非常简单,只需在甲醇中加入2%的水即可,检索这篇文献的时间是10多分钟。
在科研开发领域里,重复劳动在世界各国都不同程度地存在。据统计,美国每年由于重复研究造成的损失,约占全年研究经费的38%,达20亿美元之巨。日本有关化学化工方面的研究课题与国外重复的,大学占40%、民间占47%、国家研究机构占40%,平均重复率在40%以上;我国的重复率则更高。
信息检索的意义及目的
2、信息检索是终身教育的基础
学校培养学生的目标是学生的智能:包括自学能力、研究能力、思维能力、表达能力和组织管理能力。
联合国教科文组织提出,教育已扩大到一个人的整个一生,认为唯有全面的终身教育才能够培养完善的人,可以防止知识老化,不断更新知识,适应当代信息社会发展的需求。
第二节信息与信息源
一、信息
(一)什么是信息?(Information)
信息论的奠基人,美国数学家克劳德·香农(Claude E. Shannon):“信息是用来消除不确定性的东西。”
控制论的创始人,美国科学家维纳(N. Wiener):“信息是人们在适应外部世界并使这种适应反作用于外部世界的过程中,同外部世界进行相互交换的内容的名称。”
中国学者钟义信:“信息是事物运动的状态与方式,是物质的一种属性。”
信息爆炸
客观性载体性
传递性
可塑性
时效性
信息的使用周
期越来越短
可以进行加工和
处理
必须依附于
一定的载体
才能流通和
传递
是实现信息资
源共享的基础
共享性
可被多个用户
使用
信息
可被感知、获取、传
递和利用
(二)信息的特征
二、信息源
信息源,顾名思义,就是信息的来源。联合国教科文组织出版的《文献术语》将其定义为:个人为满足其信息需要而获得信息的来源。
类型存在方式特点
口语信息源交谈、聊天、授课、讨论等方
式传递快、互动性强、但稍纵即逝、久传易出差异
体语信息源手势、表情、姿态等方式直观性强、生动丰富、印象深刻、富有
感染力
实物信息源以实物如文物、产品样本、模
型、碑刻、雕塑等形式表示直观性强、感受实在、信息量大,但需要通过知识、智慧、经验和工具挖掘大量隐含的信息
文献信息源以文字、图形、符号、声频、
视频等方式记录在各种载体上
的知识和信息经过加工、整理,较为系统、准确、可靠,便于保存与利用,但也存在信息相对滞后、部分信息尚待证实的情况。
(一)零次信息源不借助实物媒体,通过直
接交流所获得的的信息来源。包括口头交谈、参观、现场交流、听演讲、听报
告会等。