信息检索概论
合集下载
信息检索概论PPT课件
期刊
Chun,Lu,and n, “Dynamic Analysis of Clamped Laminated Curved Panels” Composite Structures 30.4. (1995):389-396
ISSN 的含义(International Standard Serial Number)
第一章 信息检索概论
内容简介
1.1 信息素养教育 1.2 文献信息的基本概念 1.3 文献信息的类型与特点 1.4文献信息的分布规律
1.1信息素养
Information Literacy
也称信息素质或信息文化,是全球一体化、 全球信息化大环境下需要人们具备的一种基本能 力。
信息素养这一概念是美国信息产业协会主席保 罗·泽考斯基(Paul Zurkowski)于1974年在提 出的。
【实例】在《EBSCO》数据库的期刊论文著录格式如下: China Investment:Which Way To Profit? By: Wang Yong ; Chen Wen.Beijing Review,11/6/2003,Vol.46 Issue 45,p10,4p, 1c;(AN 11588866)
3.图书类型 阅读用书:包括教科书、专著、文集等。 参考工具书:是供人们释疑解难、翻检查考的出
版物。
【实例】《中国大百科全书》、《四库全书》、 《古今图书集成》、《大英百科全书》
检索用书: 是以图书形式刊行的书目、题录、文 摘等,是供人们查找一定范围内信息线索的出版 物。
【实例】《四库全书总目提要》、《中国国家书 目》、《全国总书目》、《全国新书目》
report,
Sci-Tech
proceedings (Pro.) specification
lj文献检索-第一章信息检索概论
出版形式 期刊式、单卷式、附录式
选择时应注意 ◆根据课题的学科性质、所需的文献类型选择合适的检索系统。 ◆根据所具备的条件选择手工检索工具或计算机检索数据库。 ◆选择报道及时、收录文献全面、索引系统完备的检索系统。 ◆既要选择使用综合性的检索工具,也应注意选择使用专业 性以及单一文献类型的检索工具。
② 追溯法
利用最新发表或已知文献(最好是切合课题的综述性文章) 后面所附的参考文献为线索,由近及远追溯查找。
这种方法是不少科技人员常用的方法,方便实用,但效 率不高,盲目性大,会产生漏检,且不易查到最新文献。
③ 循环法 此法又称分会分段法,是常用法和追溯法结合的方法。
先利用检索工具查出一批有关文献,再利用这些文献所附 的参考文献和原文中涉及的线索追溯查找。这样分段交替进 行,直到取得满意的效果。
44科技文献检索语言科技文献检索语言44科技文献检索语言科技文献检索语言检索语言分类检索语言主题检索语言等级体系分类法语言组配分类法语言关键词检索语言叙词检索语言标题词检索语言单元词检索语言代码检索语言引文检索语言等级体系分类等级体系分类中国图书馆图书分类法中国图书馆图书分类法中图法中图法体系分类语言是按照一定的观点体系分类语言是按照一定的观点以科学分类为基础以科学分类为基础以文献内容的学科性质为对象以文献内容的学科性质为对象运用概念划分的方法运用概念划分的方法按照按照知识门类的逻辑次序知识门类的逻辑次序从总到分从总到分从一般到具体从一般到具体从低级到从低级到高级高级从简单到复杂从简单到复杂层层划分层层划分逐级展开的一个层垒制号逐级展开的一个层垒制号码体系码体系
§2、科技文献 三大要素:知识信息内容、信息符号、载体材料。 十大科技文献:图书、期刊‖专利、技术标准、科技报告、会议 文献、学位论文、政府出版物、产品样本、档案 科技文献的分类: ⑴ 按文献出版的载体形式 (carrier) 印刷型、缩微型、声像型、 机读型、数字化型 (2)按出版形式: 图书、连续出版物、特种文献 (3)按文献出版的内容、性质(文献的级别) ①零次文献 ②一次文献 (原始文献) ③二次文献 (检索工具) ④三次文献 (综述、工具书等)
信息检索概论(续1文献综述)
局限
语义网和本体理论的应用需要大量人力和时 间投入,且技术成熟度有待提高。
03
信息检索评价
信息检索评价的定义和目的
定义
信息检索评价是对信息检索系统的性 能和效果进行评估的过程,旨在衡量 系统是否满足用户的信息需求。
目的
信息检索评价的目的是提高信息检索 系统的质量和效率,优化系统性能, 为用户提供更好的信息检索服务。
学术搜索引擎
Google Scholar、PubMed、Scopus等是学术研究领域常用的信息检索工具,它们能 够提供广泛的学术资源,包括期刊论文、会议论文、专利等。
学术数据库
如Web of Science、CNKI等,收录了大量的学术论文和数据,为学者提供全面的学术 信息检索服务。
信息检索在企业中的应用
应用
在信息检索中,NLP用于分析文本内容,提 取关键词、实体和语义关系。
局限
自然语言处理技术仍面临诸多挑战,如歧义 消解、语义角色标注等。
机器学习在信息检索中的应用
概念
机器学习是使计算机系统从数据中自 动学习并改进性能的技术。
应用
在信息检索中,机器学习用于构建自 动分类、聚类和排序模型,提高检索 效果。
信息检索评价的实践和案例
实践
在实际应用中,许多机构和组织都开展了信息检索评价工作,如图书馆、情报机构、搜索引擎公司等 。他们通过评价信息检索系统的性能,不断优化系统,提高服务质量。
案例
谷歌搜索引擎是一个典型的信息检索系统,它通过不断优化算法和提高服务质量,成为全球最受欢迎 的搜索引擎之一。谷歌搜索引擎采用多种方法进行信息检索评价,包括实验法、调查法和用户反馈法 等,以确保其系统性能和效果达到最佳。
信息检索概论(续1文献综述)
第一章信息检索概论
2.类型
• 根据信息检索目的的不同,信息检索可 分为:
(1)数据检索:包括数值形式和非数值形式的 数据。 (2)事实检索:以事实为检索目的的检索。 (3)文献检索:以文献为检索目的的检索,或 者检索文献的出处,或检索文献的摘要,或 全文检索,主要是对文献来源的检索。
3.关系
• 文献检索在信息检索中占主导地位。
信息检索理论与方法
张 辉 huizh@ 山东大学管理学院
• 教材:
张辉.信息检索与利用.济南. 山东人民出版社
• 参考书
1. 王知津·工程信息检索教程· 北京:机械工业出版社, 2009 2. 叶继元·信息检索导论· 北京:电子工业出版社, 2009 3. 叶鹰·信息检索 · 北京:高等教育出版社,2004 4. 沈固朝 ·网络信息检索 · 北京:高等教育出版社, 2004
指检索和获取原始信息. 注意:①掌握检索工具的使用方法,了解检 索 工具的结构、编排原理、著录格式; ②做好检索记录工作。
八、信息检索评价
• 检索系统评价
– – – – – – 信息源评价 信息组织管理 系统功能评价 输出结果评价 用户接口 系统技术支持
• 检索效果评价
检索效果评价
• 查全率是从量度上考查所需信息的被检出率, 以此考查检索工具库满足用户检索需求的完 备程度。 查全率=被检出的相关信息 / 相关信息(检出 +遗漏)×100% • 查准率是衡量检索系统拒绝非相关信息的能 力。 查准率=被检出的相关信息 / 被检出信息(相 关+不相关)×100%;
三、信息源(信息类型)
• 信息源是指个人为满足其信息需要而获 得信息的来源。
• 信息源包括个人信息源、实物信息源、 文献信息源
信息检索概论
3
信息素养标准
决定所需信息的范围。 有效地获取所需信息。 严格评价信息及其相关资源。 把所选信息融合到个人的知识库中。 有效运用信息达到特定目的。 运用信息同时了解所涉及的经济,法律和社 会范畴,合法和合理地获得和利用信息。
4
你能做到吗?
1.检索专利DE19500122的相关或同族 专利: 2.了解牛津大学社会学教授威尔逊指导 的研究生论文: 3.了解一下2010到2011年在美国召开的 有关行政管理的学术会议: 4.阅读《法律和市场经济》电子图书的 全文: 5.检索2006到2011年间哈佛大学作者发 表论文,并按照学科进行统计分析:
5
你能做到吗?
6.发表在《河南档案》杂志上,有关电 子政务对行政公文带来的影响的文献: 7.查找有关生产医药产品的中国企业信 息: 8.专利号是FR10313875的专利原文: 9.检索城市建筑设计的外文期刊全文: 10.要查找汽车尾气中二氧化硫含量的相 关标准;
6
你该怎么办?
18
回去
三、检索方式
1. 根据信息的存储媒体和检索技术手段的不同, 信息检索可分为: 手工检索:通常使用的是一些印刷载体的工具书和检索期刊,检索过程由人 脑和手翻书刊的配合来完成的,匹配是人脑的思考、比较和选择。 计算机检索: 使用的是检索系统。系统包括计算机设备、终端、通信设施、 数据库和检索、应用软件等。
课后作业
本讲要点:信息检索、文献检索、计算机检索的基本概念和 原理,各出版类型文献的特点,检索工具的类型和作用,计算机 检索技术。 16
第一节
信息检索基本概念
一、信息、知识、文献的概念
1. 信息 ( information ):p2-3
信息检索概论续文献综述
06
结论和展望
对现有研究的总结和评价
信息检索技术的发展
随着计算机技术和网络技术的飞速发展,信息检索技术也在不断进步,从 早期的基于关键词的检索到现在的基于语义的检索,检索效果不断提高。
信息检索技术的应用领域
信息检索技术已经广泛应用于各个领域,如图书馆、档案馆、 博物馆、企业、政府等,为人们提供了便捷的信息获取方式。
探索多媒体检索技术的新 方法
多媒体检索技术是信息检索领 域的一个新兴方向,未来需要 进一步探索多媒体检索技术的 新方法,实现对图像、音频、 视频等多媒体信息的有效检索 。
加强信息检索技术的应用 研究
信息检索技术的应用研究是推 动信息检索技术发展的重要途 径之一,未来需要进一步加强 信息检索技术的应用研究,探 索新的应用领域和应用模式。
相似度度量与匹配
定义图像和音频之间的相似度度量方法,如欧氏 距离、余弦相似度等,实现不同模态信息之间的 匹配与检索。
多模态融合技术
探索图像、音频等不同模态信息之间的互补性, 通过多模态融合技术提高检索性能。
基于视频的信息检索技术
视频结构化处理
研究如何将视频内容分解为可管 理的片段或镜头,便于后续的特 征提取和索引建立。
视频特征提取与表
示
针对视频数据的特性,提取时空 域上的特征,如光流、运动矢量 等,用于描述视频内容。
视频语义理解
借助深度学习等技术手段,对视 频内容进行高层次的语义理解, 如场景识别、行为识别等,提高 视频检索的准确性和效率。
跨模态信息检索技术
模态间映射与转换
研究如何将不同模态的信息映射到同一语义 空间,实现跨模态信息的相互转换和理解。
用户隐私和安全问题
用户隐私问题
第一章 文献信息检索概论
2、文献检索的原理
文献检索原理是:将检索提问标识与存贮 在检索工具中的标引标识相比较,两者一 致或信息标识包含着检索提问标识,则含 有该标识的信息就从检索工具中输出;
对信息的著录是按一定规则对信息的外表 特征和内容特征加以简单明确的表述,信 息的标引是对其内容按一定的分类表或主 题词表给出分类号或主题词;
按文献加工程度分:有一次文献、二次文 献、三次文献。
一次文献:以作者本人取得的成果为基本素 材面创作的论文、报告等,经公开发表或 出版的各种文献。习惯上称为原始文献。
• 如期刊论文、科技报告、会议论文、专利 说明书、学位论文、技术标准等。 • 特点:具有新颖性、创造性(是人类创造 性劳动成果)和先进性(内容上是新成果, 新发明); • 缺点:数量大,分布散,难以查找。
检 索 结 果
反 馈
3、文献源类型
按文献载体分:有纸介型文献、缩微型文 献、机读型文献、声像型文献
纸介型文献:是以纸张为载体。它又可分 为手抄型和印刷型两种。
其优点是传递知识方便灵活、广泛,保存 时间相对较长;缺点是存储密度小,体积 庞大。
缩微型文献:以感光材料为载体,通过光 学摄影方式将文献的影像固化在感光材料 上形成的一类文献。 如缩微胶卷、缩微平片等。
记录符号
文字已不再是表达思想的唯一手段,图形、 声频、视频等同样成为表达思想、传递感 情的重要手段。总的说来,文献中的符号 系统指图画、文字、公式、图表、编码、 声像和电磁信息等。
记录手段
按记录方法分可有手工记录、机械记录、光记录、 电记录、声记录和磁记录。其中最常见的是印刷。 随着科技的发展,文字记录可以转变为数据记录, 并用电子方法存贮到磁介质上去。此外,还有光 学字符识别(Optical Character Recognition,简 称OCR)技术就代表了这种崭新的技术,它通过 光学方法对字符、标记表示的书面数据进行自动 识别,转换成机器可以处理的信息,这样就实现 了纸质文献信息向电子信息的转换,而且可以通 过不同接口装置向不同设备输入数据,这些设备 进而与通信网络相连,实现远距离数据传送。
信息检索教程第1章 概论
三次文献也称参考性文献,是在一、二次 文献的基础上,经过综合分析而编写,采用科 学的方法对文献的内容进行深度的加工、编写 而形成的文献,是知识高度浓缩、重组的结果, 这些文献具有较高的实用价值。
三次文献的主要特点如下。
(1)综合性 (2)针对性 (3)价值性
5.三个级次文献的关系
文献经过作者的创作,文献工作者 的整理、加工和压缩,文献研究者的综 合、分析和创造,使文献从一次文献到 二次文献,再演化为三次文献,使文献 的形式和内容由分散到集中,由无序到 有序,由博而精地对知识信息进行不同 层次的加工过程,这就是文献的链式结 构。 其文献系统结构如图1-3所示。
零次文献主要特点如下。
(1)客观性 (2)分散性 (3)不成熟性
零次文献的类型包括:口头交谈、 参观展览、参加报告会、听取经验交流 演讲、实验的原始记录、工程草图等。
2.一次文献
一次文献是人们直接以自己的生产、科 研、社会活动等实践经验为依据生产出来的 文献,也常被称为原始文献,其所记载的知 识信息比较新颖、具体、详尽。
2.文献的要素
根据文献的定义可看出,文献是由 知识内容、物质载体、记录符号、记录 手段4个基本要素构成的。
3.文献的特征
(1)知识性 (2)传递性 (3)物质载体性 (4)人工记载性 (5)再生性与积累性
1.1.5 信息、知识、情报与文献的关系
信息、知识、情报、文献4个概念既有 区别又有联系。它们的转换过程如图1-1所 示。 这几个基本概念之间的关系如图1-2所 示。
图1-1 信息、知识与情报转换框图
图1-2 几个基本概念之间的关系
1.2 文献信息源的类型特点
1.2.1 按文献的加工深度来划分
依据文献传递知识、信息的质和量 的不同以及加工层次的不同,人们将文 献划分为零次文献、一次文献、二次文 献及三次文献。
三次文献的主要特点如下。
(1)综合性 (2)针对性 (3)价值性
5.三个级次文献的关系
文献经过作者的创作,文献工作者 的整理、加工和压缩,文献研究者的综 合、分析和创造,使文献从一次文献到 二次文献,再演化为三次文献,使文献 的形式和内容由分散到集中,由无序到 有序,由博而精地对知识信息进行不同 层次的加工过程,这就是文献的链式结 构。 其文献系统结构如图1-3所示。
零次文献主要特点如下。
(1)客观性 (2)分散性 (3)不成熟性
零次文献的类型包括:口头交谈、 参观展览、参加报告会、听取经验交流 演讲、实验的原始记录、工程草图等。
2.一次文献
一次文献是人们直接以自己的生产、科 研、社会活动等实践经验为依据生产出来的 文献,也常被称为原始文献,其所记载的知 识信息比较新颖、具体、详尽。
2.文献的要素
根据文献的定义可看出,文献是由 知识内容、物质载体、记录符号、记录 手段4个基本要素构成的。
3.文献的特征
(1)知识性 (2)传递性 (3)物质载体性 (4)人工记载性 (5)再生性与积累性
1.1.5 信息、知识、情报与文献的关系
信息、知识、情报、文献4个概念既有 区别又有联系。它们的转换过程如图1-1所 示。 这几个基本概念之间的关系如图1-2所 示。
图1-1 信息、知识与情报转换框图
图1-2 几个基本概念之间的关系
1.2 文献信息源的类型特点
1.2.1 按文献的加工深度来划分
依据文献传递知识、信息的质和量 的不同以及加工层次的不同,人们将文 献划分为零次文献、一次文献、二次文 献及三次文献。
01.信息检索概论
26
1.3.1-2 知识与文献
知识:是人类对信息、对客观事物规律的认识,它是人们在社会实践 中积累起来的经验。人们对事物由表及里、由现象到本质、由感性到理性 的认识深化,便形成了知识。知识是信息内容的组成部分。 文献:我国《国家标准文献著录总则》对文献有如下定义: 记录有 知识的一切载体。
17
< 2 > Index/Abstract databases
1. Ei Village2 2. INSPEC-China 3. Web of Science (SCI+ISTP+DII) 4.CSA(Aerospace+Advanced Materials+BMBE+NTIS+MEDLINE) 5. OCLC FirstSearch 6. BIOSIS Previews 7. PQDD(B) 8. LWW 9. CCC(CALIS外文期刊目次数据库) 10.万方数据资源系统 11. 社会科学引文索引(UN:seul PW:seul)
24
信息的特点
信息具有时效性、传递性、可扩充性、可替代性和共享性
1.时效性:指信息发出、收到利用的时间间隔及其效率,也包括信息本身更新的速度。时效
性是信息的重要特征。如果信息传递很慢,那么再有用的信息常常也会失去其应 用的价值。
2.传递性:信息借助于物质载体才能进行传递,其渠道如下:
编码: 把要传递的信息用语言、文字、图形、公式、代码、符号、音频、视频等表 达形式,形成可传递的信息。 译码:把传递的信息转换成可接收的信息。
18
<3> E-book and EDT
1. 中国高等学校学位论文数据库(万方博硕士论文数据库 >10万篇) 2. PQDD国际博、硕士学位论文数据库 (>4万篇) 3. 超星电子图书(>40万册) 4. Apabi电子图书(>1.8万册) 5.金图国际外文原版图书(1000种) 6. Safari Technical Books Online
信息检索概论
❖ 实践性,该课程是一门技术方法课,它必须在理 解基础知识的同时,对已有的各种检索系统进行 文献、事实、数据的查找训练,只有强化实践环 节,才能把理论知识联系到实践中去应用。
任务
❖ 概括地说:了解信息需求及问题所在,制定 信息检索策略,评价信息并根据实际用途, 去伪存真、去粗取精,科学地组织信息、使 用信息,将信息融化到现有知识结构中。
❖ 3 常用中文数据库的使用——如何获取 ❖ 4 常用外文数据库的使用——如何获取
如何学?
❖ 弄清检索工具的结构和工作原理,是学好本课 程的关键。
① 手工检索工具:编排结构、著录格式和索引体系。 ② 数据库:数据的记录格式,数据库的字段格式以及提供
的检索入口。 ③ 工作原理主要指检索工具的标识系统,亦即文献加工组
第二讲:信息检索基础知识
一、信息检索
1.信息检索的定义
信息检索或情报检索,是指将文献信息按一定的方式组 织和储存起来,并能根据用户的需要取出所需特定信息的整 个过程。它的全名为信息存储与检索。从广义上讲,信息检 索包括了信息的存贮过程和检索过程,它不仅仅指信息的具 体检索程序和方法,同时也指信息库及其检索系统的建立 (即现代信息管理学里的信息组织)。
狭义的信息检索是指信息的查找,即从信息库中找出所 需要的信息的程序和方法。
信息检索基础知识
2. 信息检索的类型 (1) 数据检索 → 文献中的数据(计算公
式、分子式) (2) 事实检索→ 文献中的事实 (3) 文献检索→文献(文献线索、文摘)
二、文献的类型及其分布
1. 文献的定义
凡是用文字、图形、符号、声频、视频记录下 来,具有存贮和传递知识功能的一切载体都称为文 献。
2. 文献的类型 按载体形式分 按出版形式分 按加工层次分
任务
❖ 概括地说:了解信息需求及问题所在,制定 信息检索策略,评价信息并根据实际用途, 去伪存真、去粗取精,科学地组织信息、使 用信息,将信息融化到现有知识结构中。
❖ 3 常用中文数据库的使用——如何获取 ❖ 4 常用外文数据库的使用——如何获取
如何学?
❖ 弄清检索工具的结构和工作原理,是学好本课 程的关键。
① 手工检索工具:编排结构、著录格式和索引体系。 ② 数据库:数据的记录格式,数据库的字段格式以及提供
的检索入口。 ③ 工作原理主要指检索工具的标识系统,亦即文献加工组
第二讲:信息检索基础知识
一、信息检索
1.信息检索的定义
信息检索或情报检索,是指将文献信息按一定的方式组 织和储存起来,并能根据用户的需要取出所需特定信息的整 个过程。它的全名为信息存储与检索。从广义上讲,信息检 索包括了信息的存贮过程和检索过程,它不仅仅指信息的具 体检索程序和方法,同时也指信息库及其检索系统的建立 (即现代信息管理学里的信息组织)。
狭义的信息检索是指信息的查找,即从信息库中找出所 需要的信息的程序和方法。
信息检索基础知识
2. 信息检索的类型 (1) 数据检索 → 文献中的数据(计算公
式、分子式) (2) 事实检索→ 文献中的事实 (3) 文献检索→文献(文献线索、文摘)
二、文献的类型及其分布
1. 文献的定义
凡是用文字、图形、符号、声频、视频记录下 来,具有存贮和传递知识功能的一切载体都称为文 献。
2. 文献的类型 按载体形式分 按出版形式分 按加工层次分
研究生-信息检索概论
究问题的要求来评价信息及其来源,提取出权威
性的、经典的和具有创新理念的观点及其它发 现,同时能在构建新的假设中查找补充所需信 息,对新旧信息进行整合和综述。4)能有效地利用信Fra bibliotek达到某一特定的目的
有效地利用信息意味着为达到某一特定的 目的,在信息查找、获取、评价、补充的知 识积累基础上,将文献中的主要观点、思想 及相应事实数据等应用于自己有利于目的实 现的表现形式,如学位论文、调查报告等, 以此来与他人进行有效的交流。
概念间的关系:知识来源于信息,情报是特 定的知识。
情报 知识 信息
信息、知识、情报、文献四者的关系
认识
激活
信息
知识
情报
检索 记录
文献
3. 信息源 个人为满足其信息需要而获得信息的来源
3.1 信息类型 保存性:正式与非正式 时间:先导(天气预报)、实时(现场直播)、滞后(报纸) 表现形式:文字、图像、数值、语音 出版类型:图书、期刊论文、科技报告、专利文献、会议文献 政府出版物、学位论文、标准文献、产品样本、科技档案
同时,信息的传递,在广义上来讲,包含反馈。(例)
依存性:信息总是依附于一定的物质载体而存在,需要某种 物质承担者。信息必须依附于一定的物质形式上(如声波、 电磁波、纸张、化学材料、磁性材料等),不可能脱离物质 而单独存在。 相对性:客观上信息是无限的,但对于信息用户来说,人们 实际获得的信息问题有限的。同一信息对不同认知水平的用 户所产生的作用和有效性也不同。 可加工性:信息可以加工处理,可以压缩、扩充和叠加,也 可以变换形态。在流通和使用过程中,经过综合、分析、再 加工,大量的原始医药信息可以变成医学文摘数据库和
其他:检索速度、检索方便性与检索成本也是需要 考虑的因素。
性的、经典的和具有创新理念的观点及其它发 现,同时能在构建新的假设中查找补充所需信 息,对新旧信息进行整合和综述。4)能有效地利用信Fra bibliotek达到某一特定的目的
有效地利用信息意味着为达到某一特定的 目的,在信息查找、获取、评价、补充的知 识积累基础上,将文献中的主要观点、思想 及相应事实数据等应用于自己有利于目的实 现的表现形式,如学位论文、调查报告等, 以此来与他人进行有效的交流。
概念间的关系:知识来源于信息,情报是特 定的知识。
情报 知识 信息
信息、知识、情报、文献四者的关系
认识
激活
信息
知识
情报
检索 记录
文献
3. 信息源 个人为满足其信息需要而获得信息的来源
3.1 信息类型 保存性:正式与非正式 时间:先导(天气预报)、实时(现场直播)、滞后(报纸) 表现形式:文字、图像、数值、语音 出版类型:图书、期刊论文、科技报告、专利文献、会议文献 政府出版物、学位论文、标准文献、产品样本、科技档案
同时,信息的传递,在广义上来讲,包含反馈。(例)
依存性:信息总是依附于一定的物质载体而存在,需要某种 物质承担者。信息必须依附于一定的物质形式上(如声波、 电磁波、纸张、化学材料、磁性材料等),不可能脱离物质 而单独存在。 相对性:客观上信息是无限的,但对于信息用户来说,人们 实际获得的信息问题有限的。同一信息对不同认知水平的用 户所产生的作用和有效性也不同。 可加工性:信息可以加工处理,可以压缩、扩充和叠加,也 可以变换形态。在流通和使用过程中,经过综合、分析、再 加工,大量的原始医药信息可以变成医学文摘数据库和
其他:检索速度、检索方便性与检索成本也是需要 考虑的因素。
检索概论
2.2.1
信息检索效率
信息检索效率是评价一个检索 系统性能优劣的质量标准, 系统性能优劣的质量标准,它贯穿 于信息的存储和检索的全过程。其 于信息的存储和检索的全过程。 评价指标是 查全率 查准率
查全率
利用数据库进行某一课题检索, 利用数据库进行某一课题检索,检 出的相关信息量 (w)与数据库中存储 的相关信息量 (X)的比率称为查全率 (R),用公式表示如下: ),用公式表示如下: 用公式表示如下 R= ( W/X ) ×100% 是未知数, 注:由于“ X ”是未知数,所以该指 由于“ 标只是定性指标。 标只是定性指标。
查准率
利用数据库进行某一课题检索, 利用数据库进行某一课题检索, 检出的相关信息量( 检出的相关信息量(w)与检出信息 总量(M)的比率称为查准率(P ), 总量( 的比率称为查准率( 用公式表示如下: 用公式表示如下: )× P=( W/M )×100%
举例
如果一个检索系统中与某一课题有关的 假定,恒定), ),实际 信息共 250 条( X,假定,恒定),实际 检出 400 条( M,可变),其中相关信息 可变),其中相关信息 ), 200条 可变), ),此次检索效率可计 为 200条(W,可变),此次检索效率可计 算为: 算为: 80%(假定) R = [200/250] × 100%= 80%(假定) 50%(实际) %(实际 P = [200/400] × 100%= 50%(实际)
叙词语言
叙词语言是以自然语言为基础,概念组配 叙词语言是以自然语言为基础, 为原理, 为原理,经过规范化处理的最小概念单元为信 息存储和检索依据的一种检索语言。 息存储和检索依据的一种检索语言。它吸收了 其它检索语言的优点,如:体系分类语言的等 其它检索语言的优点, 级关系,编制了词族表; 级关系,编制了词族表;标题词语言的规范化 处理方法和参见系统,编制了叙词表; 处理方法和参见系统,编制了叙词表;关键词 语言的轮排方法和单元词语言的组配原理。 语言的轮排方法和单元词语言的组配原理。
第一章-文献信息检索概论
• 如期刊论文、科技报告、会议论文、专利 说明书、学位论文、技术标准等。
• 特点:具有新颖性、创造性(是人类创造 性劳动成果)和先进性(内容上是新成果, 新发明);
• 缺点:数量大,分布散,难以查找。
• 二次文献: 报道和查找一次文献的检索工 具书、书刊。
• 它是按照一定的目的对一定范围或学科领 域的一次文献进行鉴别、筛选、分析、归 纳、加工整理重组,使之有序化后出版的 文献。如各种索引、题录、文摘。形式上 有卡定义为文献是记录有知识的一切载体。
• 文献的基本构成要素
第一,知识内容 第二,记录载体 第三,记录符号 第四,记录手段
• 随着生产力的发展,存贮和表达人们思想的物质 载体不同了,从金石、竹简、羊皮、丝帛、纸张 发展到用感光介质和磁性介质。从非人工材质的 泥版、岩石、石板、兽骨、木板、竹片、 兽皮、 树叶、桦树皮等到各种人工材质,如无机材质 (陶、砖瓦、瓷,玻璃等)、金属材质(青铜、 铁、铝、金银等)、高分子材质(帛、纸、胶片、 醋酸纤维等)、复合材质(磁带、光盘等)。纸 质文献已经多得不便于快速传输信息、高效查阅 和高密度存贮了,于是其他介质的文献应运而生, 这些文献主要包括:纸质文献具有价格低廉、质 地柔软、易于书写、携带和收藏等其它一些载体 所无法比拟的性能而成为文献家族的主干。
• 特点:汇集性、工具性、系统性
• 三次文献:根据二次文献提供的线索,选 用大量一次文献,根据一定的需要和目的 进行筛选、分析、综合和浓缩而再出版的 文献。
• 如词典、手册、指南、年鉴、百科全书、 大全、综述、工具书目录、书目之书目、 专题述评、进展报告等。
• 特点:综合性、 价值性、 针对性
/
• 序号途径:
• 许多文献除普通的外表特征外,还具有序 号特征,如,专利文献有专利号、标准文 献有标准号、馆藏文献有索书号。序号索 引一般按照文献序号的大小顺序排列。
• 特点:具有新颖性、创造性(是人类创造 性劳动成果)和先进性(内容上是新成果, 新发明);
• 缺点:数量大,分布散,难以查找。
• 二次文献: 报道和查找一次文献的检索工 具书、书刊。
• 它是按照一定的目的对一定范围或学科领 域的一次文献进行鉴别、筛选、分析、归 纳、加工整理重组,使之有序化后出版的 文献。如各种索引、题录、文摘。形式上 有卡定义为文献是记录有知识的一切载体。
• 文献的基本构成要素
第一,知识内容 第二,记录载体 第三,记录符号 第四,记录手段
• 随着生产力的发展,存贮和表达人们思想的物质 载体不同了,从金石、竹简、羊皮、丝帛、纸张 发展到用感光介质和磁性介质。从非人工材质的 泥版、岩石、石板、兽骨、木板、竹片、 兽皮、 树叶、桦树皮等到各种人工材质,如无机材质 (陶、砖瓦、瓷,玻璃等)、金属材质(青铜、 铁、铝、金银等)、高分子材质(帛、纸、胶片、 醋酸纤维等)、复合材质(磁带、光盘等)。纸 质文献已经多得不便于快速传输信息、高效查阅 和高密度存贮了,于是其他介质的文献应运而生, 这些文献主要包括:纸质文献具有价格低廉、质 地柔软、易于书写、携带和收藏等其它一些载体 所无法比拟的性能而成为文献家族的主干。
• 特点:汇集性、工具性、系统性
• 三次文献:根据二次文献提供的线索,选 用大量一次文献,根据一定的需要和目的 进行筛选、分析、综合和浓缩而再出版的 文献。
• 如词典、手册、指南、年鉴、百科全书、 大全、综述、工具书目录、书目之书目、 专题述评、进展报告等。
• 特点:综合性、 价值性、 针对性
/
• 序号途径:
• 许多文献除普通的外表特征外,还具有序 号特征,如,专利文献有专利号、标准文 献有标准号、馆藏文献有索书号。序号索 引一般按照文献序号的大小顺序排列。
第二讲+计算机信息检索概论
什么是计算机信息检索:
♦ 从文献信息的角度来看,就是将大量的
文献资料或数据进行加工处理,按一定 的格式存储在磁盘上,建成计算机可读 文献资料档,即机读数据库;并利用计 算机对这些文献资料档查询所需的文献 或数据的检索方式。因此,计算机信息 检索系统的构成从广义上讲包括信息存 储和信息检索两个方面。
(主要概念主题词)
(期刊出版地)
(参考文献数) (复合字段:TA,PY,VI,IP,PG) + + +
四、计算机信息检索数据库的种类
按照信息特征划分: ♦ ①书目检索数据库: 文献的目录、题录或文摘
♦ ②数值型或事实型数据库
如:常数、标准、各种生理指标等。
♦ ③全文检索数据库
如:CNKI《中国期刊网专题全文数据库》
联机公共书(Online Public Access Catalogue, OPAC)
书 目 数 据 库
文 摘 索 引
数 据 事 实 数 据 库
全 文 数 据 库
全 文 数 据 库
全 文 数 据 库
五、计算机信息检索的步骤
♦ (一)、分析检索课题、明确检索要求
1. 检索的目的和范围: 学科范围,年代范围,文献类 型,出版类型,文 献信息的语种。 2. 检索内容主题分析:主要概念及相互关系 隐含概念和核心概念
字段名称 注释 属性 著者文摘 文摘 + 地址 (第一著者地址) (第一著者省市名) 原文出处 (译文原文出处) 著者 索取号 (医情所会议、汇编内部编码) 国内代码 (国内期刊代码) 分类号 特征词 + 资助类别 资助编号 ISSN (国际期刊代码) 内部代码 (医情所期刊内部代码) 语种 (缺省值为中文) 会议地点 主题词 +
信息检索概论课件
信息检索概论课件
1. 信息概论
• 1.2信息的特性
(7) 可共享性 与物质、能量不同,信息没有排他性,它可以共享。
信息检索概论课件
1. 信息概论
• 1.3 信息的作用
(1)信息是人类认识客观世界及其发展规律 的基础
人类的认识器官,包括感觉器官和思维器 官,对各种渠道的信息进行接收,并通过思 维器官将已收集到的大量信息进行鉴别、筛 选、归纳、提炼、存贮而形成不同层次的感 性认识和理性认识。
第一章 信息检索概论
• 1. 信息概论 • 1.2信息的特性
(1) 普遍性 信息是事物运动的状态和状态变化的方式(本体论,的反 映—认识论),因此,只要有客观事物的存在,只要客观事物 在不断地运动,就会有它们运动的状态和状态变化的方式, 也就存在着信息,所以信息是普遍存在的,信息具有普遍性。 (2)传递性 信息在事物之间的相互联系必定在信息流动中发生。信息 的传递性表现在人与人之间的消息交换,人与机器、机器与 机器之间的信息交换,动物与植物的信号交换。信息的传递 和流通过程是一个重复使用的流通过程,在这一过程中,信 息的占有者不会因传递信息而失掉信息,一般说来,也不会 因多次使用而改变信息的自身价值。
• 3 信息源
3. 1 信息源的类型 信息源的类型可依不同的标准划分如下:
3.1 . 3 按信息表现形式划分 可以划分为文字信息、图像信息、数值数据信息和语音信。
其中数值数据信息是“信息的数字形式”或“数字化的信息 形式”。狭义的“数据”是指有一定数值特性的信息,如统 计数据、测量数据以及计算机中区别于程序的计算数据。广 义的数据是指在计算机网络中存储、处理、传输的二进制数 字符编码,文字信息、图像信息、语言信息以及从自然界直 接采集的各种自然信息等均可转换为二进制数码,网络中的 数据通信、数据处理和数据库等就是广义的数值数据信息。
1. 信息概论
• 1.2信息的特性
(7) 可共享性 与物质、能量不同,信息没有排他性,它可以共享。
信息检索概论课件
1. 信息概论
• 1.3 信息的作用
(1)信息是人类认识客观世界及其发展规律 的基础
人类的认识器官,包括感觉器官和思维器 官,对各种渠道的信息进行接收,并通过思 维器官将已收集到的大量信息进行鉴别、筛 选、归纳、提炼、存贮而形成不同层次的感 性认识和理性认识。
第一章 信息检索概论
• 1. 信息概论 • 1.2信息的特性
(1) 普遍性 信息是事物运动的状态和状态变化的方式(本体论,的反 映—认识论),因此,只要有客观事物的存在,只要客观事物 在不断地运动,就会有它们运动的状态和状态变化的方式, 也就存在着信息,所以信息是普遍存在的,信息具有普遍性。 (2)传递性 信息在事物之间的相互联系必定在信息流动中发生。信息 的传递性表现在人与人之间的消息交换,人与机器、机器与 机器之间的信息交换,动物与植物的信号交换。信息的传递 和流通过程是一个重复使用的流通过程,在这一过程中,信 息的占有者不会因传递信息而失掉信息,一般说来,也不会 因多次使用而改变信息的自身价值。
• 3 信息源
3. 1 信息源的类型 信息源的类型可依不同的标准划分如下:
3.1 . 3 按信息表现形式划分 可以划分为文字信息、图像信息、数值数据信息和语音信。
其中数值数据信息是“信息的数字形式”或“数字化的信息 形式”。狭义的“数据”是指有一定数值特性的信息,如统 计数据、测量数据以及计算机中区别于程序的计算数据。广 义的数据是指在计算机网络中存储、处理、传输的二进制数 字符编码,文字信息、图像信息、语言信息以及从自然界直 接采集的各种自然信息等均可转换为二进制数码,网络中的 数据通信、数据处理和数据库等就是广义的数值数据信息。
第一章信息检索概论
附的参考文献跟踪查找的方法,可扩大检索范围 (4)分段法(循环法):利用检索系统查到一
批文献资料,又利用这些文献资料所附的参考文 献追溯查找,即交替使用“追溯法”和“常规法” 来进行检索的综合检索方法。
三、信息检索的过程、类型、方法、
途径和程序
2、计算机检索 (1)定题服务:根据用户的需求,事先将确定
或 ISBN7-144-00316-X/TP·340
国际标准书号(ISBN)
(6)13位的国际标准书号
于2007年启用的13位的ISBN
ISBN978-7-115-18521-1/C 新的ISBN实际上就是现在的EAN号 (European Article Number, 即欧 洲商品号)
978代表图书
三、文献的分类
(6)学位论文 A、含义:是著者为获得某种学位而撰写的科学 论文 B、博士论文具有较高的参考价值:一般偏重于 理论;附有大量的参考文献;借此可以看出有关 专题的发展过程和方向 C、学位论文一般不出版发行,而是保存在授予 学位单位的图书馆里
第一章 信息检索概论
第二节 信息检索
一、信息检索的概念
技资料目录》、《中国科技期刊数据库》。
三、文献的分类
4、三次文献 (三级文献)
(1)含义:是选用大量有关的文献,经过综合、分 析、研究而编写出来的文献。通常围绕某个专题, 利用二次文献检索搜集大量相关文献,对其内容 进行深度加工而成。
(2)例如:综述、评论、评述、进展、动态等 (3)作用:充分利用反映某一领域研究动态的综述
据的过程,信息检索是由系统中出信息数据的过程 )
输入加工
信息数据库
检索加工
原 始
子系统
信
息
量
批文献资料,又利用这些文献资料所附的参考文 献追溯查找,即交替使用“追溯法”和“常规法” 来进行检索的综合检索方法。
三、信息检索的过程、类型、方法、
途径和程序
2、计算机检索 (1)定题服务:根据用户的需求,事先将确定
或 ISBN7-144-00316-X/TP·340
国际标准书号(ISBN)
(6)13位的国际标准书号
于2007年启用的13位的ISBN
ISBN978-7-115-18521-1/C 新的ISBN实际上就是现在的EAN号 (European Article Number, 即欧 洲商品号)
978代表图书
三、文献的分类
(6)学位论文 A、含义:是著者为获得某种学位而撰写的科学 论文 B、博士论文具有较高的参考价值:一般偏重于 理论;附有大量的参考文献;借此可以看出有关 专题的发展过程和方向 C、学位论文一般不出版发行,而是保存在授予 学位单位的图书馆里
第一章 信息检索概论
第二节 信息检索
一、信息检索的概念
技资料目录》、《中国科技期刊数据库》。
三、文献的分类
4、三次文献 (三级文献)
(1)含义:是选用大量有关的文献,经过综合、分 析、研究而编写出来的文献。通常围绕某个专题, 利用二次文献检索搜集大量相关文献,对其内容 进行深度加工而成。
(2)例如:综述、评论、评述、进展、动态等 (3)作用:充分利用反映某一领域研究动态的综述
据的过程,信息检索是由系统中出信息数据的过程 )
输入加工
信息数据库
检索加工
原 始
子系统
信
息
量
第2讲信息检索概论
是用分类号来表达各种概念的, 分类检索语言是用分类号来表达各种概念的,并将各种 概念按学科性质进行分类和系统排列。 概念按学科性质进行分类和系统排列。 目前,国内外常用的分类法《中国图书馆分类法》 目前,国内外常用的分类法《中国图书馆分类法》 中图法)、 中国科学院图书分类法》 科图法)、 )、《 (中图法)、《中国科学院图书分类法》(科图法)、 美国国会图书馆图书分类法》 LC) 《美国国会图书馆图书分类法》(LC)等都是以体系分类 法为主。 法为主。 是用词语来表达各种概念的, 主题检索语言是用词语来表达各种概念的,并将各种概 念按字顺排列。 念按字顺排列。 主题检索语言包括标题词语言 单元词(又称元词 标题词语言、 又称元词) 主题检索语言包括标题词语言、单元词 又称元词 语 言、叙词语言和关键词语言
例题】使用——检索中国专利:CN03250961.8苗间 检索中国专利: 【例题】使用 检索中国专利 CN03250961.8苗间 除草机构密封传动箱。 除草机构密封传动箱。 A.维普中文科技期刊数据库 B.图书馆馆藏查询 A.维普中文科技期刊数据库 B.图书馆馆藏查询 C.中国人民大学报刊全文数据库D.中国国家知识产权 中国人民大学报刊全文数据库D. C.中国人民大学报刊全文数据库D.中国国家知识产权 大 局专利数据库 E.中国国家科技图书文献中心 中国国家科技图书文献中心(NSTL) E.中国国家科技图书文献中心(NSTL)
图2-2 EI的一例文摘 的一例文摘
3、索引型检索工具
索引一般是附在专著或年鉴、 索引一般是附在专著或年鉴、百科全书等工具书 之后以及收录内容较多的二次文献之后,按主题词、 之后以及收录内容较多的二次文献之后,按主题词、人 地名、事件、概念等内容要项编排, 名、地名、事件、概念等内容要项编排,按其内容可分 为主题索引、分类索引、关键词索引、引文索引。 为主题索引、分类索引、关键词索引、引文索引。
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 信息的概念
在不同的学科领域中其概念不同
《辞海》:信息是指对消息接受者来说预先不知道的报 道。 《简明自然辩证法词典》:信息一般泛指我们听说的消 息、情报、指令、数据、信号等有关周围环境的知识。 一些专家:信息是可供人们参考的事实和思想。
可以理解为:信息是指信息资源(各种载体)中 所包含的事物事件的事实、思想或知识,即信息 载体中传递的内容,信息系统传输和处理的对象。
7. 标准文献
经过公认的权威当局批准的标准化技术规定。主 要为有关工业产品和工程建设的质量、规格和检 验方法的技术规定文件。 类型
按使用范围分为:国际标准、区域标准、国家标准、部
颁标准或行业标准、企业标准。 按其内容分为:基础标准、产品标准、方法标准、安全 与环境保护标准等。 按其成熟程度分为:正式标准、试行标准、指导性技术 文件、标准化规定等。 按其约束性程度分为:强制性标准和推荐性标准。
会议文献有会前和会后两个类,会前文献又称预 印本,会后文献是会议结束后的正式出版物,又 称会议录。 科学上的许多新发现、新观点、新成果都是在学 术会议上首次发表的。因此会议文献具有较高的 学术参考价值,是一种重要的信息资源。
ISTP(科技会议录索引)、中国重要会议论文术语,进行科学的解释,作出恰当的定义。 手册:汇集某一范围内的基本知识和数据。 百科全书:又称大全,系统地汇集一定领域范围内的全部知识的大 型参考工具书。将搜集到的专门术语、重要名词分列条目,加以详 细的叙述和说明,并附有参考文献。综合性百科全书(如《大英百 科全书》)和专业性百科全书。
(2)报纸
每期版式基本相同的、以报道新闻及其评论为主 的一种定期出版物。
包括日报、隔日报、三日报、周报、旬报等
出版周期更短,信息传递更及时 CNKI--中国重要报纸全文数据库
3. 会议文献(Conference Paper)
在国内外各种学术会议上发表的文献,如论文、 记录、发言、评述以及总结等。
种不可多得的信息资源。
NTIS:收录国际著名的报告是美国的四大报告,即PB (Publishing Board)报告、AD(ASTIA Documents)报告、
NASA(National Aeronautics and Space Administration)报告
和DOE(Department of Energy)报告… …
单行本和汇编本(图书形式)两种出版发行方式
其标志性著录项目有:标准号。例如,GB1—90 (中国国家标准) 万方--中外标准数据库
8. 政府出版物
政府部门及其专门研究机构发布或出版的文献, 分为行政性和科技性两大类。
行政性文件包括政府报告、会议记录、法令、条 约、决议、规章制度、调查统计资料等;科技性 文件包括科研报告、科普资料、科技政策、技术 法则等。
将文字、图画或其他符号书写或印刷于纸张上的具有完整
装帧形式的非连续出版物。图书是文献中最古老、最重要 的一类。 图书范围较广,包括专著、科普读物、教科书、丛书、文 集、工具书等。 图书的内容一般比较成熟、系统、全面。 图书的著录特征(外部特征)有:书名、作者、版次、出 版社、出版年、国际标准书号(International Standard Book Number,简称ISBN)、图书定价等。
6. 专利文献
专利申请人向自己国家或国外的专利局提出申请 保护某项发明时所呈交的一份详细的技术说明, 经专利局审查,公开出版或授权后所形成的文献。 专利说明书在内容上具有广泛性、详尽性、实用 性、新颖性、独创性。
技术信息的主要来源
国家知识产权局专利数据库、中国专利信息网、 万方--中国专利数据库、DII 、美国专利、欧洲专 利… …
2. 信息的特征
可量度 可采用某种度量单位进行度量,并进行信息编码。 可识别 可采取直观识别、比较识别和间接识别等多种方式来把 握。 可转换 可以从一种形态转换为另一种形态。 可存储 人脑、人类发明的文字、摄影、录音、录像以及计算机。 可处理 人脑、计算机。
可传递 语言、表情、动来自、报刊、书籍、广播、电视、电话等。
超星电子图书馆、读秀图书搜索
参考工具书,简称工具书
作为工具使用的一种特殊类型的图书
用特定的编制方法,将大量分散在原始文献中的知识、理 论、数据、图表等,用简明扼要的形式,全面、系统地组 织起来,供人们迅速查检资料线索和解决疑难问题。
类型很多,主要有字典、词典、手册、百科全书、名录 (人名录、地名录、机构名录)等。
5. 科技报告(Technical Report)
国家政府部门和科研生产单位关于某项研究成果的总结报 告,或是研究过程中的阶段进展报告。 特点是各篇单独成册,统一编号由主管机构连续出版。 比期刊论文新颖专深、详尽、可靠,出版周期短、报道速 度快,能反映一个国家或某一学科领域的科研水平,是一
可再生 信息经过处理后,可以其他形式再生。 可压缩 可以用不同的信息量来描述同一事物。
可利用 具有一定的实效性和可利用性。
可共享 可以被多个用户共同享用。
人类通过信息对自然界、人类社会及思维方式与 运动规律的认识与概括,是人的大脑通过思维重 新组合和系统化了的信息,是信息中最有价值的 部分。 知识来自于信息,知识是信息的一部分。 知识一经产生,就以声像信息、实物信息、文献 信息的形式加以传播。
信息:组成信息资源的原料;
人:信息资源的生产者和利用者; 符号:生产信息资源的媒介和手段; 载体:存储和利用信息资源的物质形式。
就本课程而言,将信息资源等同于文献
按表达方式和载体划分 口语信息资源 讲演、授课、讨论 体语信息资源 表情、手势、姿态、表演、舞蹈 实物信息资源 样品、模型、雕塑 文献信息资源
三、加工深度划分 1. 零次文献
还没有形成一次文献的非出版物
如实验记录、设计草图、论文草稿、谈话记录、 会议记录、内部档案等
2. 一次文献
又称原始文献(简称原文,现多称全文)。 作者以自己的经验和研究成果为依据而撰写的、 未经加工的原始文献,不论其载体形式或出版类 型如何。 包括大部分期刊论文、科技报告、专利文献、会 议文献、学位论文等。 特点是具有新颖性、创造性、价值性和分散性等。
电子出版物的问世是信息时代的重要标志,极大 地提高了信息的传递速度,加速了社会信息化的 进程。 优点:信息容量大、出版周期短、易更新、方便 检索、易复制、可交互性、可共享。 缺点:阅读需要一定的设备,其长期保存问题以 及版权问题等还没有得到解决。
二、按照文献的出版形式划分 1. 图书(Book)
电子出版物内容丰富,类型多。
按信息存储介质划分,主要有软磁盘与光盘两大类; 按出版物类型划分,主要有电子期刊、电子图书、电子 报纸、电子名录、电子地图、各种联机信息库和光盘数 据库或磁带、软盘等产品;
按媒体的信息结构组织形式划分,主要有文本型出版物、 超文本出版物、多媒体出版物以及超媒体出版物等。
1. 文献的概念
国际标准化组织的《文献情报术语国际标准》:在存贮、 检索、利用或传递记录信息的过程中,可以作为一个单元 处理的,在载体内、载体上或依附载体而存贮有信息或数 据的载体。 我国国家标准:文献是记录有知识的一切载体。 一些专家:文献是以文字、图形、符号、声频、视频、数
字化等手段记录和传播知识的载体。
数量庞大、种类繁多,是最基本的信息资源,是 科技文献的主体,也是信息检索的主要对象。
3. 二次文献
按一定的方法对一次文献进行整理加工,使之有 序化而形成的文献。
10.技术档案
技术档案是指生产建设活动中形成的对具体事物 对象的真实记录材料,包括任务书、协议书、技 术指标、审批文件、研究计划、方案大纲、技术 措施、调查材料、试验和工艺记录等。技术档案 是生产建设和科技工作的重要文献。
技术档案一般由参与该技术活动的单位收藏,通 常为内部使用,不公开出版发行,有些有密级限 制,因此在参考文献和检索工具中极少引用。
2. 连续出版物(Searial Publication) (1)期刊(Periodical)
又名杂志(Journal或Magazine),刊名一般不变
定期出版的汇集许多个著者论文的连续出版物
出版频率较短,有周刊、旬刊、半月刊、月刊、 双月刊、季刊、半年刊等 有连续编号,如年份、卷号(Vol)、期号(No) 公开发行的期刊都有国际标准连续出版物号 (International Standard Serial Number,ISSN)
期刊论文(文献)的著录格式包含
作者 论文的篇名(题名、题目、标题) 期刊名称即刊名(外文刊名一般用缩写) 卷号、期号、年、月、起止页码
期刊上刊载的论文大多数是原始文献,包含许多 新成果、新水平、新动向 从期刊上得到的科技信息约占信息来源的65%以上
CNKI--中文期刊全文数据库、维普、ScienceDirect、 IEEE、SCI、EI … …
4. 学位论文
著者为取得专业资格的学位而提出的,介绍他的发现与某种结 论的调查或研究文献。 包括博士论文、硕士论文和学士论文 都是就某一专题进行研究所作的总结,对问题的论述比较详细、 系统,具有一定的独创性,对科研有一定的参考价值。
质量参差不齐
在不同的学科领域中其概念不同
《辞海》:信息是指对消息接受者来说预先不知道的报 道。 《简明自然辩证法词典》:信息一般泛指我们听说的消 息、情报、指令、数据、信号等有关周围环境的知识。 一些专家:信息是可供人们参考的事实和思想。
可以理解为:信息是指信息资源(各种载体)中 所包含的事物事件的事实、思想或知识,即信息 载体中传递的内容,信息系统传输和处理的对象。
7. 标准文献
经过公认的权威当局批准的标准化技术规定。主 要为有关工业产品和工程建设的质量、规格和检 验方法的技术规定文件。 类型
按使用范围分为:国际标准、区域标准、国家标准、部
颁标准或行业标准、企业标准。 按其内容分为:基础标准、产品标准、方法标准、安全 与环境保护标准等。 按其成熟程度分为:正式标准、试行标准、指导性技术 文件、标准化规定等。 按其约束性程度分为:强制性标准和推荐性标准。
会议文献有会前和会后两个类,会前文献又称预 印本,会后文献是会议结束后的正式出版物,又 称会议录。 科学上的许多新发现、新观点、新成果都是在学 术会议上首次发表的。因此会议文献具有较高的 学术参考价值,是一种重要的信息资源。
ISTP(科技会议录索引)、中国重要会议论文术语,进行科学的解释,作出恰当的定义。 手册:汇集某一范围内的基本知识和数据。 百科全书:又称大全,系统地汇集一定领域范围内的全部知识的大 型参考工具书。将搜集到的专门术语、重要名词分列条目,加以详 细的叙述和说明,并附有参考文献。综合性百科全书(如《大英百 科全书》)和专业性百科全书。
(2)报纸
每期版式基本相同的、以报道新闻及其评论为主 的一种定期出版物。
包括日报、隔日报、三日报、周报、旬报等
出版周期更短,信息传递更及时 CNKI--中国重要报纸全文数据库
3. 会议文献(Conference Paper)
在国内外各种学术会议上发表的文献,如论文、 记录、发言、评述以及总结等。
种不可多得的信息资源。
NTIS:收录国际著名的报告是美国的四大报告,即PB (Publishing Board)报告、AD(ASTIA Documents)报告、
NASA(National Aeronautics and Space Administration)报告
和DOE(Department of Energy)报告… …
单行本和汇编本(图书形式)两种出版发行方式
其标志性著录项目有:标准号。例如,GB1—90 (中国国家标准) 万方--中外标准数据库
8. 政府出版物
政府部门及其专门研究机构发布或出版的文献, 分为行政性和科技性两大类。
行政性文件包括政府报告、会议记录、法令、条 约、决议、规章制度、调查统计资料等;科技性 文件包括科研报告、科普资料、科技政策、技术 法则等。
将文字、图画或其他符号书写或印刷于纸张上的具有完整
装帧形式的非连续出版物。图书是文献中最古老、最重要 的一类。 图书范围较广,包括专著、科普读物、教科书、丛书、文 集、工具书等。 图书的内容一般比较成熟、系统、全面。 图书的著录特征(外部特征)有:书名、作者、版次、出 版社、出版年、国际标准书号(International Standard Book Number,简称ISBN)、图书定价等。
6. 专利文献
专利申请人向自己国家或国外的专利局提出申请 保护某项发明时所呈交的一份详细的技术说明, 经专利局审查,公开出版或授权后所形成的文献。 专利说明书在内容上具有广泛性、详尽性、实用 性、新颖性、独创性。
技术信息的主要来源
国家知识产权局专利数据库、中国专利信息网、 万方--中国专利数据库、DII 、美国专利、欧洲专 利… …
2. 信息的特征
可量度 可采用某种度量单位进行度量,并进行信息编码。 可识别 可采取直观识别、比较识别和间接识别等多种方式来把 握。 可转换 可以从一种形态转换为另一种形态。 可存储 人脑、人类发明的文字、摄影、录音、录像以及计算机。 可处理 人脑、计算机。
可传递 语言、表情、动来自、报刊、书籍、广播、电视、电话等。
超星电子图书馆、读秀图书搜索
参考工具书,简称工具书
作为工具使用的一种特殊类型的图书
用特定的编制方法,将大量分散在原始文献中的知识、理 论、数据、图表等,用简明扼要的形式,全面、系统地组 织起来,供人们迅速查检资料线索和解决疑难问题。
类型很多,主要有字典、词典、手册、百科全书、名录 (人名录、地名录、机构名录)等。
5. 科技报告(Technical Report)
国家政府部门和科研生产单位关于某项研究成果的总结报 告,或是研究过程中的阶段进展报告。 特点是各篇单独成册,统一编号由主管机构连续出版。 比期刊论文新颖专深、详尽、可靠,出版周期短、报道速 度快,能反映一个国家或某一学科领域的科研水平,是一
可再生 信息经过处理后,可以其他形式再生。 可压缩 可以用不同的信息量来描述同一事物。
可利用 具有一定的实效性和可利用性。
可共享 可以被多个用户共同享用。
人类通过信息对自然界、人类社会及思维方式与 运动规律的认识与概括,是人的大脑通过思维重 新组合和系统化了的信息,是信息中最有价值的 部分。 知识来自于信息,知识是信息的一部分。 知识一经产生,就以声像信息、实物信息、文献 信息的形式加以传播。
信息:组成信息资源的原料;
人:信息资源的生产者和利用者; 符号:生产信息资源的媒介和手段; 载体:存储和利用信息资源的物质形式。
就本课程而言,将信息资源等同于文献
按表达方式和载体划分 口语信息资源 讲演、授课、讨论 体语信息资源 表情、手势、姿态、表演、舞蹈 实物信息资源 样品、模型、雕塑 文献信息资源
三、加工深度划分 1. 零次文献
还没有形成一次文献的非出版物
如实验记录、设计草图、论文草稿、谈话记录、 会议记录、内部档案等
2. 一次文献
又称原始文献(简称原文,现多称全文)。 作者以自己的经验和研究成果为依据而撰写的、 未经加工的原始文献,不论其载体形式或出版类 型如何。 包括大部分期刊论文、科技报告、专利文献、会 议文献、学位论文等。 特点是具有新颖性、创造性、价值性和分散性等。
电子出版物的问世是信息时代的重要标志,极大 地提高了信息的传递速度,加速了社会信息化的 进程。 优点:信息容量大、出版周期短、易更新、方便 检索、易复制、可交互性、可共享。 缺点:阅读需要一定的设备,其长期保存问题以 及版权问题等还没有得到解决。
二、按照文献的出版形式划分 1. 图书(Book)
电子出版物内容丰富,类型多。
按信息存储介质划分,主要有软磁盘与光盘两大类; 按出版物类型划分,主要有电子期刊、电子图书、电子 报纸、电子名录、电子地图、各种联机信息库和光盘数 据库或磁带、软盘等产品;
按媒体的信息结构组织形式划分,主要有文本型出版物、 超文本出版物、多媒体出版物以及超媒体出版物等。
1. 文献的概念
国际标准化组织的《文献情报术语国际标准》:在存贮、 检索、利用或传递记录信息的过程中,可以作为一个单元 处理的,在载体内、载体上或依附载体而存贮有信息或数 据的载体。 我国国家标准:文献是记录有知识的一切载体。 一些专家:文献是以文字、图形、符号、声频、视频、数
字化等手段记录和传播知识的载体。
数量庞大、种类繁多,是最基本的信息资源,是 科技文献的主体,也是信息检索的主要对象。
3. 二次文献
按一定的方法对一次文献进行整理加工,使之有 序化而形成的文献。
10.技术档案
技术档案是指生产建设活动中形成的对具体事物 对象的真实记录材料,包括任务书、协议书、技 术指标、审批文件、研究计划、方案大纲、技术 措施、调查材料、试验和工艺记录等。技术档案 是生产建设和科技工作的重要文献。
技术档案一般由参与该技术活动的单位收藏,通 常为内部使用,不公开出版发行,有些有密级限 制,因此在参考文献和检索工具中极少引用。
2. 连续出版物(Searial Publication) (1)期刊(Periodical)
又名杂志(Journal或Magazine),刊名一般不变
定期出版的汇集许多个著者论文的连续出版物
出版频率较短,有周刊、旬刊、半月刊、月刊、 双月刊、季刊、半年刊等 有连续编号,如年份、卷号(Vol)、期号(No) 公开发行的期刊都有国际标准连续出版物号 (International Standard Serial Number,ISSN)
期刊论文(文献)的著录格式包含
作者 论文的篇名(题名、题目、标题) 期刊名称即刊名(外文刊名一般用缩写) 卷号、期号、年、月、起止页码
期刊上刊载的论文大多数是原始文献,包含许多 新成果、新水平、新动向 从期刊上得到的科技信息约占信息来源的65%以上
CNKI--中文期刊全文数据库、维普、ScienceDirect、 IEEE、SCI、EI … …
4. 学位论文
著者为取得专业资格的学位而提出的,介绍他的发现与某种结 论的调查或研究文献。 包括博士论文、硕士论文和学士论文 都是就某一专题进行研究所作的总结,对问题的论述比较详细、 系统,具有一定的独创性,对科研有一定的参考价值。
质量参差不齐