信息检索概论

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


会议文献有会前和会后两个类,会前文献又称预 印本,会后文献是会议结束后的正式出版物,又 称会议录。 科学上的许多新发现、新观点、新成果都是在学 术会议上首次发表的。因此会议文献具有较高的 学术参考价值,是一种重要的信息资源。
ISTP(科技会议录索引)、中国重要会议论文全 文数据库、万方--中国学术会议论文全文库

将文字、图画或其他符号书写或印刷于纸张上的具有完整


装帧形式的非连续出版物。图书是文献中最古老、最重要 的一类。 图书范围较广,包括专著、科普读物、教科书、丛书、文 集、工具书等。 图书的内容一般比较成熟、系统、全面。 图书的著录特征(外部特征)有:书名、作者、版次、出 版社、出版年、国际标准书号(International Standard Book Number,简称ISBN)、图书定价等。


数量庞大、种类繁多,是最基本的信息资源,是 科技文献的主体,也是信息检索的主要对象。
3. 二次文献

按一定的方法对一次文献进行整理加工,使之有 序化而形成的文献。
超星电子图书馆、读秀图书搜索

参考工具书,简称工具书


作为工具使用的一种特殊类型的图书
用特定的编制方法,将大量分散在原始文献中的知识、理 论、数据、图表等,用简明扼要的形式,全面、系统地组 织起来,供人们迅速查检资料线索和解决疑难问题。

类型很多,主要有字典、词典、手册、百科全书、名录 (人名录、地名录、机构名录)等。
三、加工深度划分 1. 零次文献

还没有形成一次文献的非出版物

如实验记录、设计草图、论文草稿、谈话记录、 会议记录、内部档案等
2. 一次文献

又称原始文献(简称原文,现多称全文)。 作者以自己的经验和研究成果为依据而撰写的、 未经加工的原始文献,不论其载体形式或出版类 型如何。 包括大部分期刊论文、科技报告、专利文献、会 议文献、学位论文等。 特点是具有新颖性、创造性、价值性和分散性等。

1. 文献的概念

国际标准化组织的《文献情报术语国际标准》:在存贮、 检索、利用或传递记录信息的过程中,可以作为一个单元 处理的,在载体内、载体上或依附载体而存贮有信息或数 据的载体。 我国国家标准:文献是记录有知识的一切载体。 一些专家:文献是以文字、图形、符号、声频、视频、数

字化等手段记录和传播知识的载体。
1. 信息的概念

在不同的学科领域中其概念不同

《辞海》:信息是指对消息接受者来说预先不知道的报 道。 《简明自然辩证法词典》:信息一般泛指我们听说的消 息、情报、指令、数据、信号等有关周围环境的知识。 一些专家:信息是可供人们参考的事实和思想。



可以理解为:信息是指信息资源(各种载体)中 所包含的事物事件的事实、思想或知识,即信息 载体中传递的内容,信息系统传输和处理的对象。

信息:组成信息资源的原料;
人:信息资源的生产者和利用者; 符号:生产信息资源的媒介和手段; 载体:存储和利用信息资源的物质形式。


就本课程而言,将信息资源等同于文献
按表达方式和载体划分 口语信息资源 讲演、授课、讨论 体语信息资源 表情、手势、姿态、表演、舞蹈 实物信息资源 样品、模型、雕塑 文献信息资源

电子出版物的问世是信息时代的重要标志,极大 地提高了信息的传递速度,加速了社会信息化的 进程。 优点:信息容量大、出版周期短、易更新、方便 检索、易复制、可交互性、可共享。 缺点:阅读需要一定的设备,其长期保存问题以 及版权问题等还没有得到解决。


二、按照文献的出版形式划分 1. 图书(Book)


4. 学位论文

著者为取得专业资格的学位而提出的,介绍他的发现与某种结 论的调查或研究文献。 包括博士论文、硕士论文和学士论文 都是就某一专题进行研究所作的总结,对问题的论述比较详细、 系统,具有一定的独创性,对科研有一定的参考价值。


ห้องสมุดไป่ตู้
质量参差不齐
一般不公开出版,仅由学位授予单位和国家指定单位收藏。 PQDD、中国博士/优秀硕士学位论文全文数据库、万方--中国 学术会议论文全文库… …

更广义的理解:含有知识内容的信息载体就是文献。
2. 构成要素



构成文献内核的知识信息; 负载知识信息的物质载体; 记录知识信息的符号和技术。


经人类开发与重新组织后的信息称信息资源。信 息资源是信息世界中对人类有价值的那一部分信 息,是附加了人类劳动的、可供人类利用的信息。 构成信息资源的基本要素
人类用文字、数据、图像、声频、视频等方式记录在一定 载体上的信息资源。只要这些载体不损坏或消失,文献信 息资源就可以跨越时空无限循环地为人类所利用,还可以 按人类的需求整理成具有优化结构的文献信息资源体系。
本门课程研究的主体
一、按照载体材料、存储技术和传递方式划分 1. 印刷型



以纸张为载体,通过手写、油印、铅印、胶印、影印、静 电复印等手段,将文字固化在纸张上所形成的文献。 是传统文献的基本形式,也是目前文献的主要形式,包括 各种图书资料、连续出版物(期刊、报纸等)、学位论文、 专利、标准、会议文献、政府出版物及其复印品等。 优点:阅读方便,流传广泛,价格便宜。 缺点:信息存储密度低,占据空间较大,笨重,不易保存。

电子出版物内容丰富,类型多。

按信息存储介质划分,主要有软磁盘与光盘两大类; 按出版物类型划分,主要有电子期刊、电子图书、电子 报纸、电子名录、电子地图、各种联机信息库和光盘数 据库或磁带、软盘等产品;

按媒体的信息结构组织形式划分,主要有文本型出版物、 超文本出版物、多媒体出版物以及超媒体出版物等。
10.技术档案

技术档案是指生产建设活动中形成的对具体事物 对象的真实记录材料,包括任务书、协议书、技 术指标、审批文件、研究计划、方案大纲、技术 措施、调查材料、试验和工艺记录等。技术档案 是生产建设和科技工作的重要文献。

技术档案一般由参与该技术活动的单位收藏,通 常为内部使用,不公开出版发行,有些有密级限 制,因此在参考文献和检索工具中极少引用。
2. 缩微型

以感光材料为载体,以印刷型文献为母体,采用光学摄影 技术,将文字、图形、图像按规定比例缩小记录的文献形 式。如缩微卡片、平片、胶卷等。 优点:信息存储密度高,体积小,平均可以节约存储空间 95%以上,易于传递,并且保存期较长,不易损坏和变质。


缺点:必须借助缩微阅读机阅读,不便携带。
7. 标准文献

经过公认的权威当局批准的标准化技术规定。主 要为有关工业产品和工程建设的质量、规格和检 验方法的技术规定文件。 类型


按使用范围分为:国际标准、区域标准、国家标准、部
颁标准或行业标准、企业标准。 按其内容分为:基础标准、产品标准、方法标准、安全 与环境保护标准等。 按其成熟程度分为:正式标准、试行标准、指导性技术 文件、标准化规定等。 按其约束性程度分为:强制性标准和推荐性标准。


期刊论文(文献)的著录格式包含
作者 论文的篇名(题名、题目、标题) 期刊名称即刊名(外文刊名一般用缩写) 卷号、期号、年、月、起止页码


期刊上刊载的论文大多数是原始文献,包含许多 新成果、新水平、新动向 从期刊上得到的科技信息约占信息来源的65%以上


CNKI--中文期刊全文数据库、维普、ScienceDirect、 IEEE、SCI、EI … …

单行本和汇编本(图书形式)两种出版发行方式

其标志性著录项目有:标准号。例如,GB1—90 (中国国家标准) 万方--中外标准数据库

8. 政府出版物

政府部门及其专门研究机构发布或出版的文献, 分为行政性和科技性两大类。

行政性文件包括政府报告、会议记录、法令、条 约、决议、规章制度、调查统计资料等;科技性 文件包括科研报告、科普资料、科技政策、技术 法则等。
6. 专利文献

专利申请人向自己国家或国外的专利局提出申请 保护某项发明时所呈交的一份详细的技术说明, 经专利局审查,公开出版或授权后所形成的文献。 专利说明书在内容上具有广泛性、详尽性、实用 性、新颖性、独创性。



技术信息的主要来源
国家知识产权局专利数据库、中国专利信息网、 万方--中国专利数据库、DII 、美国专利、欧洲专 利… …
5. 科技报告(Technical Report)

国家政府部门和科研生产单位关于某项研究成果的总结报 告,或是研究过程中的阶段进展报告。 特点是各篇单独成册,统一编号由主管机构连续出版。 比期刊论文新颖专深、详尽、可靠,出版周期短、报道速 度快,能反映一个国家或某一学科领域的科研水平,是一

种不可多得的信息资源。

NTIS:收录国际著名的报告是美国的四大报告,即PB (Publishing Board)报告、AD(ASTIA Documents)报告、
NASA(National Aeronautics and Space Administration)报告
和DOE(Department of Energy)报告… …
2. 连续出版物(Searial Publication) (1)期刊(Periodical)

又名杂志(Journal或Magazine),刊名一般不变


定期出版的汇集许多个著者论文的连续出版物
出版频率较短,有周刊、旬刊、半月刊、月刊、 双月刊、季刊、半年刊等 有连续编号,如年份、卷号(Vol)、期号(No) 公开发行的期刊都有国际标准连续出版物号 (International Standard Serial Number,ISSN)
可再生 信息经过处理后,可以其他形式再生。 可压缩 可以用不同的信息量来描述同一事物。


可利用 具有一定的实效性和可利用性。
可共享 可以被多个用户共同享用。

人类通过信息对自然界、人类社会及思维方式与 运动规律的认识与概括,是人的大脑通过思维重 新组合和系统化了的信息,是信息中最有价值的 部分。 知识来自于信息,知识是信息的一部分。 知识一经产生,就以声像信息、实物信息、文献 信息的形式加以传播。

词典:汇集各科名词和术语,进行科学的解释,作出恰当的定义。 手册:汇集某一范围内的基本知识和数据。 百科全书:又称大全,系统地汇集一定领域范围内的全部知识的大 型参考工具书。将搜集到的专门术语、重要名词分列条目,加以详 细的叙述和说明,并附有参考文献。综合性百科全书(如《大英百 科全书》)和专业性百科全书。
(2)报纸

每期版式基本相同的、以报道新闻及其评论为主 的一种定期出版物。

包括日报、隔日报、三日报、周报、旬报等
出版周期更短,信息传递更及时 CNKI--中国重要报纸全文数据库

3. 会议文献(Conference Paper)

在国内外各种学术会议上发表的文献,如论文、 记录、发言、评述以及总结等。
2. 信息的特征

可量度 可采用某种度量单位进行度量,并进行信息编码。 可识别 可采取直观识别、比较识别和间接识别等多种方式来把 握。 可转换 可以从一种形态转换为另一种形态。 可存储 人脑、人类发明的文字、摄影、录音、录像以及计算机。 可处理 人脑、计算机。



可传递 语言、表情、动作、报刊、书籍、广播、电视、电话等。
3. 声像型

以磁性材料或感光材料为存储载体,借助特定的设备采用 磁录技术和光录技术直接记录声音信息和图像信息所形成 的文献,如录音带、录像带、唱片、幻灯片等。 优点:直观性强,易于接受,在传递信息知识方面有着不 可替代的优势。


缺点:需要借助一定的设备。
4. 电子型

采用电子手段,利用计算机及现代通信方式提供 信息的一种新型文献。
特点是具有正式性和权威性,通过政府出版物可 以了解国家的有关科技、经济发展政策以及有关 研究状况,有助于正确地确定科研方向,选择课 题。

9.产品样本


产品样本也称作产品目录、产品说明书、产品手 册等,是厂商对定型产品的性能、构造、原理、 用途、规格、使用方法和操作规程等所做的具体 说明。 产品样本的特点是技术上较成熟、数据可靠、图 文并茂、形象直观,有助于了解有关领域的生产 动态和发展趋势,是进行技术革新、开发新产品、 设计、订货等方面不可缺少的信息源。
相关文档
最新文档