什么是信息检索

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
音像文献:以磁性材料、光学材料为记录载体,利用专门的机械电子设备记录与 显示声音或图像的文献。 磁盘和光盘文献:使用软盘、硬盘等载体记录文献,可存储文字、图像、声音等 信息形式。
13
—绪论
文献信息源→文献的分类
按出版或加工形式
分成专著、报纸、期刊、专利文献、标准文献、会议文献、产品样本、档案资料、 “灰色”文献和各种工具书。
17
—绪论
文献信息源→主要的文献信息源 IV
会议文献
会议文献指在各种会议上宣读和交流的论文、报告和其他有关资料。传统会议文 献多以会议录的形式出现,英文常用Transactions表示在会议上发表的论文,用 Proceedings表示会议的记录和会后整理出版的会议文献。会议文献的特点是专业 性强、内容新、学术水平高、出版发行较迅速。会议文献大部分是本学科领域内 的新成果、新理论、新方法等,且经过会议审查、推荐,经过专家学者提问、讨 论、评价、鉴定,可靠程度相当高。
期刊
期刊是一种具有固定名称、定期或按宣布的期限出版、并计划无限期出版的连续 出版物。期刊具有出版迅速、内容新颖、能迅速反映科学技术研究成果的新信息。 期刊还具有连续性的特点,因而能够为报导不断发展的知识提供良好的条件。 期刊作为重要的信息源还体现在世界上所有主要检索工具都以期刊为主要收录对 象(超过90%),使得人们可以比图书更快更方便地查找所需资料。
按生产加工层次
一次文献(Primary Literature):人们对自然和社会信息进行首次加工而成的文字 记载,是文献信息源的主要部分。数量庞大、内容分散、无系统性、不便于管理 与传播。 二次文献(Secondary Literature):对一次文献进行加工、整理、提炼和压缩, 按其外部特征和内容特征进行序化,形成一种新的文献形式。 三次文献(Tertiary Literature):利用二次文献,选择有关的一次文献加以分析、 综合而编写出来的第三个层次的文献形式(包括专题报告、综述、进展、手册、 百科全书、年鉴等工具书)。
6
—绪论
知识与信息
OCED对知识的分类
1、Know-What:关于事实的知识;
2、Know-Why:自然原理和规律方面的科学理论,形成于专门研究机构 和大学等;
3、Know-How:指做某些事情的技艺和能力,企业的技术情报和商业信 息被归入这一类信息。 获取知识的途径 1、直接来源于产生信息的客观事物; 2、通过信息载体或媒介。
20%
实验
15%
3
—绪论
信息的涵义 I
经济学 信息是与物质、能量相并列的客观世界的三大要素之一,是为管理和决策 提供依据的有效数据。 心理学 信息是存在于意识以外的事物,它存在于自然界、印刷品、硬盘及空气之 中。
新闻学 对事物运动状态的陈述,是物与物、物与人、人与人之间的特征传输。 哲学 能被其他事物感知的,表征该事物特征的信号内容即为该事物向其他事物 所传递的信息。
19
—绪论
文献信息源→主要的文献信息源 VI
政府出版物
政府出版物指由政府机构制作出版、或由政府机构编辑并授权指定出版商出版的 文献,可分为行政性文献(包括宪法、司法文献);科学技术文献,指政府部门 出版的科技报告、标准、专利文献、科技政策文献、公开后的科技档案、经济规 划等。 常见的政府出版物有:报告、公报、通报、会议录、统计资料、地名词典、官员 名录等。
14
—绪论
文献信息源→主要的文献信息源 I
图书
图书是记录和保存知识、表达思想、传播信息的最古老、最主要的手段,便于存 放、携带、阅读可不受时间、空间、设备限制,这使得图书在过去、现在和将来 都是人类社会最主要的信息交流媒介之一,通过图书可了解图书作者对某个专门 问题的研究或对实践经验的系统论述。图书的生产过程较长,从写作到出版,要 通过核对、鉴别、筛选、提炼、校对等多道程序,出版周期较长。
15
—绪论
文献信息源→主要的文献信息源 II
报纸
报纸是出版周期最短的定期连续出版物。报纸的基本特点是内容新,涉及面广、 读者众多、影响面广。及时性是报纸区别于图书与期刊的最主要特征,有的新闻 时差仅几小时。报纸能体现信息传播的连续性和完整性:人们可以从报纸上得知 即将发生什么事(预测),正在发生什么事(报道),对最后结束的的反馈信息 (综述)、以及发生的事意味着什么(分析、评论)。报纸的缺点是材料分散、 知识不够系统、信息分布零散。
专利文献
专利文献指记录有关发明创造信息的文献,蕴涵着技术信息、法律信息和经济信 息。广义的专利包括专利申请书、专利说明书、专利公报和专利检索工具,以及 一切与专利有关的资料。狭义的专利仅指各国专利局出版的专利说明书。 由于构成专利起码要符合新颖性、先进性和实用性三个条件,因此专利反映的发 明都是首先取得、在此之前不曾发表过的有关文献,在技术上有独到之处并有实 际应用价值。
4
—绪论
信息的涵义 II
在信息论理论角度,将信息定义为用来减少随机不确定性(Uncertianty) 的东西,信宿未收到消息前并不明确信源将发出什么消息,只有在收到消 息后才能消除信源的不确定性。
信息的定义多元化的成因
1、信息本身的复杂性,信息是多元化、多层次、多功能的综合物。
2、信息学科是一门新兴学科,它的许多分支学科仍随着社会、经济、科 学技术的发展而发展,其内涵与外延并不明确。
科技报告
科技报告指对科学、技术研究成果的报告或研究进展的记录,按内容可分为基础 理论研究和工程技术两方面。按存储划分可分为报告书、技术札记、论文、备忘 录、通报、技术译文等。按流通范围分为绝密报告、机密报告、秘密报告、非密 报告、解密报告。密级较高的报告多属于国防工业、军事和尖端技术成果。 · 迅速反映新的科技成果 · 内容多样化 · 基本上都是一次文献
信息认知: 对信息和信息活动的了解和看法,其中最重要的是评价 性 的认知; 信息意识 信息情感: 人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏惑性、 人们在感受信息的过程中,逐渐形成的反映需求关系的 内心体验; 选择能力和消化吸收能力。有无信息意识决定着人们捕捉、判断和利用信 信息行为倾向: 息的自觉程度,而信息意识的强弱对能否挖掘出有价值的信息、对文献获 个体在信息活动中表现出来的行为趋向,是信息行为的 取能力的提高起着关键的作用。 心里准备状态。
16
—绪论
文献信息源→主要的文献信息源 III
标准文献
狭义的标准指按规定程序制定、经公认的权威机构批准的一整套特定范围内必须 执行的规格、规则、技术要求等规范性文献;广义的标准指与标准化工作有关的 一切文献,包括标准形成过程中的各种档案、宣传推广手册及其他出版物等。 标准文献具有约束力、时效性和针对性的特点。
wk.baidu.com12
—绪论
文献信息源→文献的构成:记录方式、载体
记录方式
指将表达信息的符号系统通过特定的技术手段使其附着在一定的文献载体上。
文献载体
纸质文献:以纸张为载体通过一定的符号系统记录(书写、印刷)信息内容。
缩微文献:以感光材料为载体、用缩微照排技术制成的文献复制品,使用阅读机 进行阅读。易于保存、复制、转化成其他文献形式。
产品样本
产品样本指厂商向客户宣传和推销其产品而印发的介绍产品情况的文献,包括产 品目录、单项产品样本、产品说明书、企业介绍和广告性文献。 与专利文献相比,样本介绍的大多是已经投产或正在销售的产品,工艺已经成熟, 而专利文献中所介绍的产品多属未定型、未成熟的产品。产品样本的产品和技术 信息较为完整:性能、特征、参数、型号等有关信息在专利信息中并不存在。
2
—绪论
课程安排
章节 绪论、基本知识
内容 信息的涵义、种类、知识、信息源、信息服 务。
课时(%) 15% 30% 20%
检索基础与检索 方法
资料检索 网络信息检索
分析、选择、确定检索入口、获取、检索语 言、认识检索工具、检索方法。 书刊检索工具、论文资料检索工具、网络书 刊资料检索工具、专业资料检索。 Internet基础知识、超文本、浏览器、搜索 引擎、专业搜索工具等。 传统书刊资料检索、网络书刊资料检索、搜 索引擎、专业搜索工具实验
获得的信息能否转化为知识,是否充分、完整转化,取决于接收主体的认 知能力。
7
—绪论
知识创新、信息意识
创新 个体的知识来源于对客观世界的观察和探索,又来源于其他个体(包括前 人)的知识。为此,必须阅读科学文献,掌握有关的思想、事实、理论和 方法等信息,在此基础上进行进一步的分析、综合和研究,才能有所创新。
8
—绪论
信息源
信息的来源。人们在科研活动、生活、生产经营和其他一切活动中所产生 的成果和各种原始记录,以及对这些成果和原始记录加工整理得到的成品。
按对信息源的加工层次和集约程度分层
•一次信息源:所有物质、能量均为一次信息源。
•二次信息源:主要存在于人的大脑中,传播、咨询、决策等领域所依赖的。 •三次信息源:包括口头信息源、体语信息源、文献信息源、电子信息源、实物信息 源。 •四次信息源:是文献信息源和实物信息源的集约化和系统化
10
—绪论
文献信息源→文献的构成:文献信息
•经人类加工(筛选、归纳、整理)后记录下来的信息。 •文献所表达的信息内容虽然与符号本身没有必然联系,但文献信息的传递必须通 过人工符号系统(文字、标识符号、声像信号等)来实现。因此对文献信息的摄 取方式和吸收的程度必然受到这种人工符号的制约。 •文献信息是一种相对固化的信息,如纸质印刷品所传递的信息是无法变动的。 •文献所传递的信息是人对客观世界的反映,因而不一定完全符合客观世界表现出 的信息内容,这种“歪曲”、“失真”的程度因人们的认识水平、立场观点、方 法和时代的因素的不同而异。 •文献信息和载体的关系,即具有不可分割性,又具有相对独立性,也就是说,信 息内容不会因为载体形式的改变而改变,不同的信息载体可以传播同一内容的信 息。
—绪论
绪论
1
—绪论
为什么是信息检索
信息素质(Information Literacy) 认识各种信息源并检索、评价和使用信息的综合能力,是信息社会劳动 者必须掌握的终身技能。 文献资源检索课程 1984年教育部作出的全国高校大学生必须普遍开设文献检索和利用课程。 课程目标 满足高校“宽口径、厚基础、重素质教育”的改革目标。
3、人们出于不同的研究和使用目的,从不同的角度和层次出发,对信息 概念作出不同的解释。
本体论
认识论
5
—绪论
信息的种类
按信息产生的客体性质 •自然信息
•生物信息
•机器信息 •社会信息 按信息所依附的载体 •文献信息 •口头信息 •电子信息
科技信息 经济信息 政治信息 军事信息 文化信息 …………
以文字、符号、声音、图像为编码,并经人们 筛选、归纳和整理后记录下来的人类精神信息
灰色文献
灰色文献一般被看作是非公开出版物。具体指不公开刊登在报刊上的会议文献、 政府文献、学位论文、科技报告、技术档案、工作文件、产品资料、企业文件、 内部刊物等。 具有流通渠道特殊、出版形式多样的特点,有特殊的参考价值。
18
—绪论
文献信息源→主要的文献信息源 V
档案文献
档案文献指国家机构、社会组织以及个人从事政治、军事、经济、科学、技术、 文化、宗教等活动直接形成的具有保存价值的各种文字、图表、声像等不同形式 的历史记录,是完成传达、执行、使用或记录现行使命而备留查考的文件材料。 档案的内容广泛、形式多样、材料来源庞杂。
11
—绪论
文献信息源→文献的构成:符号系统
•图画:最早出现的文献信息符号,具有较强的直观性,信宿无须接受文字训练便 可与信源沟通。 •文字:是有声语言信息的书面表达形式,由图画演变而来。文字可弥补图画难以 表达的抽象思维信息的缺陷。但文字的特点——高度概括性、使用随意性、音义 双重性也往往导致词不达意、一音多义、一语多音的现象,给信息交流带来误解。 这说明人工符号永远只能是接近表述信息的原意。 •声像:指留在唱片、磁带上的音频信息和拍摄在胶卷、磁带上的视频信号。通过 一定的播放设备方可展现信息的内容。 •电磁信息符号:指计算机可读磁盘或光盘上的信息符号。这类型信息符号必须通 过计算机相关设备的解码方可提供给人类。
9
—绪论
文献信息源→文献的涵义
ISO/DIS5127 为了把人类知识传播开来和继承下去,人们用文字、图形、符号、音频、 视频等手段将其记录下来,或写在纸上,或晒在蓝图上、或摄制在感光片 上、或录制在唱片上、或存储在磁盘上。这种附着在各种载体上的记录统 称为文献。 GB3792.1-83 记录有知识的一切载体。
相关文档
最新文档