第三章 信息检索基本知识
第三章 计算机检索基础知识
![第三章 计算机检索基础知识](https://img.taocdn.com/s3/m/272da106763231126edb11f4.png)
算机的输入输出装置进行检索,用磁带作存储介质,一般为 连续的顺序检索方式。检索部门把许多用户的检索提问汇总
到一起,进行批量检索,然后把检索结果通知各个用户,用
户不直接接触计算机。
联机检索(on-line retrieval)
60年代末,由于计算机软硬件技术的不断提高,出现了一台主机带 多个终端的联机信息检索系统。联机检索是用户利用终端设备,通 过通信网络或通信线路与检索系统联机,进行“人机对话”,从检 索中心的数据库及时查找所需要的文献信息过程。 80年代,发达国家的一些计算机信息联机检索系统,通过卫星通信
注意:这是一种可以不依赖主题词表而直接使用自由词进行检索的技术方法。不同的检 索系统其位置算符的表示方法不尽相同。
截词检索
截词检索就是把检索词截断,取其中的一部分,在加
上截词符号一起进行检索。
• 主要用于检索词的单复数、词性的词尾变化、词根相同的一类词, 以及同一词的拼法变异等。 • 从本质上说,截词算符是一种逻辑“或”的关系。
对信息内容特征进行标引和对信息外部特征进行著录,形成 一条信息题录,并根据信息内容作出摘要,然后将上述检索标识 与著录项目一并填入工作单,就完成了数据库建设的“数据前处 理”工作。
数据库及其编排结构
• 数据库的类型
• 数据库的构成 • 数据库的记录格式 • 数据库的编排结构
数据库的类型
按照信息处理层次划分:
A AND B:检索词A和检索词B同时出现在一条记录中。 • 其作用是缩小检索范围,提高查准率。
例如:查有关“人口控制”的文献,检索式可写成: 人口 AND 控制
逻辑或(OR)
A OR B:记录中出现检索词A或检索词B或两词同时出现 在一条记录中。 • 其作用是扩大检索范围,提高查全率。
信息检索的基本知识
![信息检索的基本知识](https://img.taocdn.com/s3/m/05646305eff9aef8941e0653.png)
文献、数据、事实检索三者区别 数据检索与事实检索,都是要检索 出包含在文献中的信息本身,是确定性 的检索,检索结果是可以直接利用的。 文献检索,则是要检索出包含所需 信息的文献,是相关性检索,检索结果 经过分析研究后才能确定是否能用。
3 文献的类型
♦ 3.1 按文献的载体分
3.1.1 书写型文献:古旧文献和未经复印的手稿以及技术 书写型文献: 档案之类的资料。 档案之类的资料。 3.1.2 印刷型文献 3.1.3 缩微型文献 3.1.4 声像型文献 3.1.5 机读型文献 (电子出版物) 电子出版物) 3.1.6 网络出版物
(2)知识 知识 是人类认识的成果或结晶, 是人类认识的成果或结晶,包括经验知识和理 论知识。 论知识。 (3)情报 情报 人们为了一定的目的搜集的有使用价值的新知 识或新信息。情报具有知识性、传递性。 识或新信息。情报具有知识性、传递性。 情报的本质必须是知识,没有一定的知识内容, 情报的本质必须是知识,没有一定的知识内容, 就不能成为情报。 就不能成为情报。 知识必须经过传递才能成为情报。 知识必须经过传递才能成为情报。 (4)文献 文献 用文字、图形、符号、声频、视频等技术手段, 用文字、图形、符号、声频、视频等技术手段,记 录有知识的一切载体。 录有知识的一切载体。
5 文献检索的意义
♦ 1)通过文献检索课程的教学,学校可以培养
学生的情报意识和获取新知识的能力。 ♦ 2)通过文献检索课程的学习,学生能够学会 利用图书馆,提高自学能力。 ♦ 3)掌握了文献检索的方法和技能,将大大地 缩短收集情报的时间,提高利用文献的准确率。 ♦ 4)通过运用文献检索的方法和技能,学生可 以不断更新知识,提高自身综合素质,更好地 迎接新世纪的挑战。
第一章
信息检索的基本知识
第三章 信息检索的基本知识
![第三章 信息检索的基本知识](https://img.taocdn.com/s3/m/091366c30c22590102029d11.png)
1、逻辑“或”(和) 、逻辑“
————————————————— A
B
用符号“ 或 表示, 用符号“or”或“+”表示,其逻辑表达式为: 表示 其逻辑表达式为: A or B 或 A+B 其意义为检索记录中凡含有检索词A或检索词 , 其意义为检索记录中凡含有检索词 或检索词B, 或检索词 或同时含有检索词A和 的 均为命中文献。 或同时含有检索词 和B的,均为命中文献。
分 析 课 题
检索词: 检索词: : :
富营养化(水华), ),处理 富营养化(水华),处理 治理,修复), ),湖泊 (治理,修复),湖泊
ቤተ መጻሕፍቲ ባይዱ
, ,
,
检索工具: 检索工具:
1. 2. 3. 4. 5. 6. 7. 8. 中文科技期刊全文数据库(维普) 1989中文科技期刊全文数据库(维普) 1989-现在 中国科技成果数据库(万方) 1986中国科技成果数据库(万方) 1986-现在 中国期刊全文数据库(同方) 1979中国期刊全文数据库(同方) 1979-现在 中国优秀博硕士学位论文全文数据库(同方)1999中国优秀博硕士学位论文全文数据库(同方)1999-现在 中国学位论文文摘数据库(万方) 1989中国学位论文文摘数据库(万方) 1989-现在 中国学术会议论文全文数据库(万方) 1995中国学术会议论文全文数据库(万方) 1995-现在 中国重要会议论文全文数据库(同方) 2000中国重要会议论文全文数据库(同方) 2000-现在 中国重大科技成果数据库(万方) 1990中国重大科技成果数据库(万方) 1990-现在
中图分类法
中图法》 个基本部类, 《中图法》分 5个基本部类,将知识门类分为 哲学” 社会科学” 自然科学” “哲学”、“社会科学”、“自然科学”三大部 马克思主义、列宁主义、 类。马克思主义、列宁主义、毛泽东思想是指导 我们思想的理论基础,作为一个基本部类, 我们思想的理论基础,作为一个基本部类,列于 首位。此外,考虑到图书本身的特点, 首位。此外,考虑到图书本身的特点,对于一些 内容庞杂,类无专属, 内容庞杂,类无专属,无法按某一学科内容性质 分类的图书,概括为“综合性图书” 分类的图书,概括为“综合性图书”,作为一个 基本部类,置于最后。 22个大 基本部类,置于最后。在此基础上扩展为 22个大 类。 标记符号采用拉丁字母与阿拉伯数字相结合的混 合号码制。 合号码制。
信息检索基础知识考点整理
![信息检索基础知识考点整理](https://img.taocdn.com/s3/m/1ffd1f2afe00bed5b9f3f90f76c66137ee064f07.png)
信息检索基础知识考点整理●2.1 信息检索的概念与原理●2.1.1 信息检索的概念(重要)●2.1.2 信息检索的原理●信息检索原理就是将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配,选取两者相符或部分相符的信息予以输出●信息检索的类型●1.文献检索●2.数据检索●3.事实检索●2.1.3 信息检索的意义/作用(重要)●1.信息检索是有效利用信息资源,实现其最大价值的科学方法●2.信息检索是再学习的工具,是获取知识的有效途径●3.信息检索能有效地提高科研工作的效率,节省人力、物力及时间●2.1.4 信息检索的历程●1.手工检索●2.计算机检索●2.2 信息检索系统(重要)●2.2.1 信息检索系统的概念●1.信息检索系统的含义●2.信息检索系统的工作原理●2.2.2 信息检索系统的构成●1.信息选择子系统●2.信息索引子系统●3.词表管理子系统●4.用户接口子系统●5.匹配子系统●2.2.3 信息检索系统的分类●1.手工检索系统●1.书本式的手工检索系统●2.卡片式的手工检索系统●2.计算机检索系统●1.硬件●2.软件●3.数据库●1.参考数据库●1.书目数据库●2.指南数据库●2.源数据库●1.数值数据库●2.文本—数值数据库●3.全文数据库●4.术语数据库●5.图像数据库●6.多媒体数据库●2.3 信息检索方法(重要)●1.直接浏览法●直接查找法●2.常用法●顺查●倒查●抽查●3.追溯法●4.综合法(分段查找法、循环法、交替法)●2.4 信息检索效果(重要)●2.4.1 信息检索效果评价●信息检索效果的概念●1.检索结果有效性评价●2.检索系统实用性的评价●3.检索费用—效率评价●信息检索效果评价对于信息检索系统的建设和发展的意义●信息检索效果评价的核心问题是建立一套切实可行的评价指标●1.查全率和查准率●2.误检率和漏检率●3.响应时间●其他与检索效果相关的指标●2.4.2影响信息检索效果的因素●1.标引的质量●2.检索途径的数量●3.检索策略的优劣●4.检索人员的素质。
第三章 文献信息检索基本原理及方法
![第三章 文献信息检索基本原理及方法](https://img.taocdn.com/s3/m/48d6a989d0d233d4b14e6946.png)
标题词语言关键词语言单词语言叙词语言检索语言
主题语言 由于不同概念相交就会 形成一个新概念, 形成一个新概念,这个 新概念是组配前各概念的 下位概念。 电子” 下位概念。如:“电子”和 信息”组配产生电子信息。 “信息”组配产生电子信息。 同级词间不同概念并 组配结果,可提高查准率。 组配结果,可提高查准率。 列也会形成一个新概 念,这个新概念是组配 前各概念的上位概念。 前各概念的上位概念。 数字计算机” 如“数字计算机”和“模 拟计算机” 拟计算机”组培后得 到“计算机”这一新的 计算机” 是不同级词间的组配, 是不同级词间的组配,是用 上位概念。组配结果, 上位概念。组配结果, 时间、 时间、空间和学科范围某一 提高查全率。 提高查全率。 方面的属性进行限定的一种 概念关系。 建筑物” 概念关系。如:“建筑物”为 主体事物, 设计” 主体事物,“设计”为某个方 组配结果被限定为“ 面,组配结果被限定为“建 筑物设计”这个新概念, 筑物设计”这个新概念,组配 结果可使检索到的文献专指度 和查全率提高。 和查全率提高。
3.1.1 文献信息检索的基本含义 一、文献信息检索的基本含义
“检索”即“查找”之意。信息检索,是将信息按照一定的方式 检索”即“查找”之意。信息检索 信息检索,是将信息按照一定的方式 组织、存储起来,并针对用户的需要查找所需信息的过程。因此信 息检索包含了信息的存储和检索两个不可分的部分。我们通常所说 的信息检索是指狭义的信息检索,即从检索工具和检索系统中查找 所需信息的过程及其所采取的一系列方法和策略。
手工检索和计算机检索的关系:手检是基础,机检是发展方向。 手工检索和计算机检索的关系:手检是基础,机检是发展方向。
3.1.2 文献信息检索的类型 按检索要求划分: 按检索要求划分: 相关性检索——是系统不直接回答用户所提出的 相关性检索 技术问题本身,而是只提供与之相关的文献供用 户参考。 确定性检索——是以数据或事实为检索对象,系 确定性检索 统要直接问答用户提出的技术问题,即直接提供 用户需要的确切的数据或事实。
计算机检索基本知识
![计算机检索基本知识](https://img.taocdn.com/s3/m/5fdf22d2b14e852458fb5716.png)
3、私营公司 例如:英国Derwent Derwent公司 例如:英国Derwent公司 美国Knight Ridder公司 Knight美国Knight-Ridder公司 Mead Data Contral OVID公司 OVID公司 Information, Silver Platter Information,Inc. 传统新闻/ 4、传统新闻/出版机构 例如: 德国Springer Springer出版社 例如: 德国Springer出版社 美国Join Wiley电子出版公司 美国Join Wiley电子出版公司 荷兰Elsevier Elsevier科学出版社 荷兰Elsevier科学出版社
数据库类型: 数据库类型:
按存储数据的类型分:数值型、事实型、词典型、书目型、 按存储数据的类型分:数值型、事实型、词典型、书目型、 全文型 按存储的介质分: 按存储的介质分: 光盘数据库:数据存储在计算机的光盘或光盘塔上, 光盘数据库:数据存储在计算机的光盘或光盘塔上,因而存 储量有限, 储量有限,更新速度慢 网络数据库:数据存储在服务器的硬盘上,存储量大, 网络数据库:数据存储在服务器的硬盘上,存储量大,更新 速度快
文章号 001 002 ……
篇名 asd bys vcx
文章号 001 002 ……
作者 Li Wang deng
文章号唯一, 文章号唯一,且 索引文档与主文 档的文章号一一 对应
索引文档1 索引文档1: 篇名索引 篇名索引
索引文档2 索引文档2: 作者索引 作者索引
文章号
篇名 asd bys vca
输出端),网络(或通信电缆),数据库存储服务器 输出端),网络(或通信电缆),数据库存储服务器 ),网络 ),
服务器(数据库终端) 服务器(数据库终端)
信息检索知识点
![信息检索知识点](https://img.taocdn.com/s3/m/721e7bacba0d4a7303763a49.png)
计算机检索1.信息素养(信息素质、信息能力):作为具有IL(information literacy)能力的人,必须能够充分地认识到何时需要信息,并有能力去有效地发现、检索、评价和利用所需要的信息,从而具有终身学习的能力,总能够为任何任务和决策找到所需信息。
2.信息检索广义:指将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。
包括存储和检索两个过程。
狭义:从信息集合中找出所需信息的过程。
信息查找(Information Search,Information Seeking)2.1信息现状分析1)信息爆炸导致文献量急剧增加,容相互渗透,语种增多;文献分布异常分散;文献寿命愈来愈段;2)由于条件限制,人们吸收和利用信息的能力并未得到相应的提高。
3.检索的作用1)促进智力资源的开发;2)协助管理者做出正确的决策;3)帮助科研人员借鉴前人的研究成果,避免重复劳动;4)信息检索是知识更新的手段。
4.数据库类型(1):作为图书馆数字资源的数据库特指为科学、教学、学习所需各种参考资料的集合,以数据库的形式管理和利用。
自建数据库:馆藏目录(OPAC),本校学位论文数据库。
商业性数据库:数据库商、出版商和其他机构以商业化方式提供的各种电子资源,图书馆需要支付一定的费用购买数据库的使用权再提供给一定的读者群。
免费数据库:开放获取资源、机构典藏和其他免费的网络资源。
5.数据库类型(2)从收录文献的容分,有综合性数据库和专业性数据库之分;从收录文献的类型分,有图书数据库、期刊数据库、学位论文数据库、报纸数据库、会议文献数据库、专利文献数据库、标准数据库等;从提供文献的形式分,有全文数据库、文摘数据库、引文数据库;各数据库举例:专业数据库:Petroleum Abstract(PA)、EnCSciFinder Schoiar(CA) 综合性数据库:读秀、Scopus、EI、SCI特定文献类型,如图书、期刊、学位论文等:超星、EIsevier ScienceDirect、PQDT全文数据库:CNKI、维普、SPE摘要性数据库:EI、PA引文数据库:Web of Science、CSSCI(中文社会科学引文索引)6.Science Citation Index Expanded(SCI-E)是个什么样的数据库?它是ISI检索平台中Web of Science核心合集中的一个子库它是一个摘要型数据库它是一个引文数据库它是一个期刊数据库它收录的学科围包括科学、技术的各学科7.查文献应该如何选择数据库?学科专业:有专业型数据库时,首选专业型数据库;数据量:选择数据量大的;文献类型:根据研究的需要。
计算机检索基本知识(一)
![计算机检索基本知识(一)](https://img.taocdn.com/s3/m/ba8ad1d95022aaea998f0f3a.png)
特点:检索精确 适用:熟悉学科发展,熟悉检索方法
多个检索项,支持逻辑组配
【技术】逻辑组配 逻辑匹配又称布尔逻辑检索,是通过布尔 逻辑算符来实现的,这些运算符能把一些 具有简单概念的检索词(或检索项)组配 成为一个具有复杂概念的检索式,用以表 达用户的检索要求。是当今检索理论中最 成熟的理论之一,也是构造检索表达式最 基本、最简单的匹配模式。 逻辑运算符有三种:与、或、非
选择数据库
【技术】跨库检索
跨库检索,在几个数据库之间进行的检索。 优势:跨库检索使用方便,一次检索可在多个子 数据库查询 劣势:为了实现跨库检索,只能在数据库间寻找 共性,牺牲各个数据库的特色。
《中国学术期刊全文数据库》为我们提供了“跨 库检索”和“单库检索”两种模式
跨库检索的默认检索界面与跨 库初级检索界面基本相同
时间:1999年-博士论文
12月31日,累积硕士 学位论文全文文献37 硕士论文 万多篇。 时间:1999年--
学位论文的重要性 学位论文是高等院校或研究机构的学生为 取得各级学位、在导师指导下完成的科学 研究、科学试验成果的书面报告。 重要的内部文献,保存在各大学中。内容 专深,有一定的新颖性、独创性。 是一种非常有参考价值的文献信息源。 学位论文的整体水平要高于期刊论文 学文论文为内部文献,获取比较困难
登陆注意事项: 1、“中国知识资源总库”实行IP控制,校 园网以外不能使用
2、有并发用户限制400人
出现“最大并发用户数已满”的提示时,请耐心等待
了解一个数据库应该从以下三个方面入手
数据库内容: 可以从这个数据库中得到什么 数据库检索: 如何利用这个数据库 结果处理: 如何处理得到的结果
中文数据库
信息检索的基本知识
![信息检索的基本知识](https://img.taocdn.com/s3/m/08d5ec9dd0f34693daef5ef7ba0d4a7302766c23.png)
信息检索的基本知识:
“检索(Retrieval)”即“查找”之意。
1950年莫尔斯(Calvin N.Mooers)在《把信息检索看做是时间性的通讯》中,首次提出“信息检索”(Information Retrieval)一词。
信息检索亦称情报检索、文献检索。
通俗地说,信息检索就是信息用户为处理解决各种问题而查找、识别、获取相关的事实、数据、知识的活动及过程。
我们可以这样定义“信息检索”:从信息集合中迅速、准确地查找出所需信息的程序和方法。
这里所说的信息集合指的是有组织的信息整体。
它可以是数据库的全部记录,也可以是某种检索工具,还可以是某个图书馆的全部馆藏。
信息检索也就是从数据库、检索工具以及馆藏中查找所需信息的活动。
第三章文献信息检索的基本知识
![第三章文献信息检索的基本知识](https://img.taocdn.com/s3/m/15c55987dd3383c4bb4cd2d4.png)
第三章文献信息检索基本知识随着信息技术的发展,互联网的应用得到广泛普及,信息环境发生了相当大的变化,应用现代化技术手段获取各种信息、知识成为高等院校师生与广大科技工作者的一种必备知识和技能。
为此,首先就必须了解文献信息检索的基本知识。
第一节信息检索的基本原理一、信息检索的概念信息检索(Information Retrieval)全称为“信息存储与检索”(Information Storage and Retrieval),其概念有广义和狭义之分。
广义上认为,信息检索包括文献信息的存储和检索两个方面,即一个完整的信息检索系统由信息存储子系统和信息检索子系统两部分组成。
信息存储子系统:首先对一定数量的信息进行筛选,把能够描述文献信息的外部特征和内部特征进行加工、整理,使之有序化,形成信息特征标识集合,然后将之存储在某种载体上,编制成为检索工具或建立一个数据库。
信息检索子系统:根据信息用户的特定需求,对用户需求进行主题分析,利用一定的检索方法和检索技术,对存储子系统中的特征标识进行比对,把需要的文献线索或知识信息从系统中查找出来的过程,即信息检索。
这就是通常人们所说的信息检索过程,也就是狭义上的信息检索。
信息存储与信息检索是意义不同却又相互联系、相互依存、不可分割的两个过程。
信息存储是为了检索,信息检索又必须先有信息存储。
如果没有存储,检索就无法实现;没有检索,信息存储也就变得没有意义。
所以说存储是检索的前提和基础,检索是存储的目的。
信息检索系统的工作原理如图3-1所示。
图3-1 信息检索系统的工作原理二、 信息检索的类型信息检索可以按不同的划分标准划分为不同的类型。
(一)、 根据检索内容划分根据检索信息内容不同可划分为文献信息检索、事实信息检索和数据信息检索。
1、文献信息检索(document retrieval ):是以文献(包括目录、索引、文摘等二次文献或全文)为检索对象,查找有关文献的出处和收藏处等信息,都属于文献信息检索范畴。
《信息检索基础知识》课件
![《信息检索基础知识》课件](https://img.taocdn.com/s3/m/86a8d1e7dc3383c4bb4cf7ec4afe04a1b171b042.png)
03
信息检索系统
信息检索系统的构成
信息检索系统由信息源、信息组织与 检索方式、信息检索工具、用户界面
和信息利用等部分构成。
信息源是信息检索系统的物质基础, 包括各种类型的文献、网页、社交媒
体等。
信息组织与检索方式是信息检索系统 的核心,通过关键词、分类、主题等 方式对信息进行组织和检索。
信息检索工具是信息检索系统的手段 ,包括搜索引擎、数据库、图书馆等 。
05
信息检索的未来发展
信息检索技术的发展趋势
语义理解技术
随着自然语言处理技术的不断进步,信息检 索将更加注重对用户查询的语义理解,以提 高检索的准确性和相关性。
个性化检索
个性化检索技术将更加成熟,能够根据用户 的兴趣、偏好和行为习惯,为用户提供更加 精准和个性化的检索结果。
多模态检索
多模态检索技术将实现文本、图像、音频和 视频等多种媒体信息的融合检索,满足用户 对多媒体信息检索的需求。
自然语言处理
自然语言处理是信息检索中不可或缺的技术之一,它利用计算机对自然语言文本进行分析和处理,以 实现自然语言文本的自动识别和机器理解。
自然语言处理技术包括分词、词性标注、句法分析、语义分析等,这些技术能够将自然语言文本转换为 计算机可识别的格式,以便进行后续的信息检索和文本挖掘。
自然语言处理技术的应用范围广泛,例如在搜索引擎中实现自动纠错、自动完成、智能推荐等功能,以 及在智能客服中实现自动问答、智能回复等功能。
源。
网络信息检索阶段
随着计算机技术的发展,人们开始利用计算 机进行信息检索,出现了各种基于计算机技 术的检索工具和数据库。
智能信息检索阶段
随着人工智能技术的发展,智能信息检索逐 渐成为新的发展趋势,它能够更加智能地理 解用户需求,提供更加精准的信息服务。
信息检索的基本知识
![信息检索的基本知识](https://img.taocdn.com/s3/m/d8baf8bdb8d528ea81c758f5f61fb7360a4c2b7b.png)
信息检索的基本知识
信息检索是一种重要的技术,它用于从大量的数据中提取所需信息。
以下是一些信息检索的基本知识:
•索引:信息检索的首要步骤是构建索引。
索引是一个按关键字组织的数据结构,用于快速定位和访问文档。
•关键字:关键字是进行信息检索的基本单位。
它们可以是单个词或短语,根据检索目的和搜索引擎的功能来确定。
•搜索引擎:搜索引擎是信息检索的核心工具。
它利用索引和算法来找到与用户查询相关的文档,并按相关性排序。
•查询:用户通过查询向搜索引擎提供信息需求。
查询可以是简单的关键字、短语,也可以是复杂的语句。
•相关性:搜索引擎根据文档与查询的匹配程度计算相关性。
相关性分数用于确定排名,从而决定返回给用户的搜索结果顺序。
除了以上基本知识,信息检索还涉及更多高级技术:
•倒排索引:倒排索引是一种常用的索引结构,它将关键字映射到包含这些关键字的文档列表中,以支持快速的搜索。
•词频和权重:搜索引擎通常根据关键字在文档中出现的频率和位置,以及其他因素来计算关键字的权重。
•自然语言处理:信息检索利用自然语言处理技术来理解用户查询和文档内容,以提高搜索效果。
•评估和优化:为了提供更好的搜索结果,搜索引擎需要不断评估和优化算法,以适应不断变化的用户需求和文档集合。
总结起来,信息检索是一门复杂而关键的技术,它在数字化时代具有重要意义。
了解信息检索的基本知识对于学习和使用搜索引擎、开发相关应用都非常有帮助。
信息检索基本知识
![信息检索基本知识](https://img.taocdn.com/s3/m/dd130286d0d233d4b14e6993.png)
叙词
•叙词是主题语言的高级形式。是以较正规和正式的 科学名称为基础组织而成一种主题法检索标识系统。 •由在概念上不可再分的基本概念单元词汇组成,检 索时可以利用这些单元词进行组配,以表达一个复杂 的概念。
•如课题: 太阳能热水器研究 汉语主题词表中正式主题词是太阳能利用、太阳 能加热等代替。
标题词
中国图书馆图书分类法
• 简称《中图法》,由中国图书馆图书分类法编辑委 员会编。1975年科学技术文献出版社出版第一版。 • 使用字母与数字相结合的混合号码,基本采用层累 制编号法。 • 《中图法》主要供大型图书馆图书分类使用。另外 为适应不同图书信息机构及不同类型文献分类的需 要,它还有几个配套版本:《中国图书资料分类 法》、《中国图书馆图书分类法(简本)》和 《〈中国图书馆图书分类法〉期刊分类表》等。 • 自1988年起,中国出版图书的标准书号中采用《中 图法》的大类号。
关规定和格式撰写的,能完整而真实地反映其所从事科 研活动的技术内容和经验的特种文献。具有内容翔实、 具体完整,技术含量高,实用意义大,便于交流,时效 性好等特点。做好科技报告工作可以提高科研起点,大 量减少科研工作的重复劳动,节省科研投入,加速科学 技术转化为生产力。
•会议文献:指学术会议文献。
•学位论文:是高校研究生、毕业生为获得学位进行 科学研究而写出的学术性论文中,常含有独创性的学 术性文献资料。 •专利文献:专利是与产业活动密切相关的,实用性 非常强。根据专利的技术水平和应用情况,其类型有 invention(发明)、utility patent(实用新型)、和 design patent(外观设计)等。
3:信息检索的基本知识
![3:信息检索的基本知识](https://img.taocdn.com/s3/m/8b6185aaf524ccbff1218483.png)
查找“广告”“媒 介”的中英文词源、 词义。
计算机检索
根据用户的需求,利用计算机检索系统,从存储 在计算机里的大量数据中检出所需要信息的一种检 索手段。 计算机检索的特点:检索方便快捷、检索功能强 大、获得的信息类型多、检索范围广泛。 计算机检索经历了脱机检索、联机检索、网络检 索几个阶段。
广义理解:存 取
狭义理解:取
信息检索的类型:
文献检索 数据检索
事实检索
按检索对象的性质划分
超文本检索
多媒体检索
超媒体检索 手工检索
• 按检索方式划分
计算机检索
文献检索(Document Retrieval)
定义:是以文献为检索对象,从文献集合中查找出特定文献 的过程。 下列几例均属于文献检索。 1、如查找一本图书-《白轮船》
是限定检索词在数据库记录中出现的字段 范围的一种检索方法。将检索过程限制在 特定的字段中,提高了查全率和查准率。 每个字段都有一个两个字母表示的字段代 码。
限制检索字段代码列表
字段代码 AB AU CS DT 字段名称 Abstract Author Corporate source Document Type 文摘 作者 机构名称 文献类型
如physic* 可检出的词汇有: physic, physical, physically, physician, physicians, physicist, physicists, physics 如physic??可检出的词汇有: physic, physical, physics
字段限制技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息论的奠基人 申农在《通信的数学 理论》中把信息定义 为:“信息是用来消 除不确定的东西。”
控制论创始人
维纳在《信息控制论》 一书中指出:“信息是 人与外界相互作用过程 中相互交换的内容和名 称。”
―信息”的定义之所以呈现多样化,主要有三方 面的原因 : 第一,信息本身的复杂性。它是一个多元化、 多层次、多功能的综合物; 第二,信息科学是一门新兴学科,是一门“大” 学科,它有许多分支学科,它的内涵与外延 不很确切,而且随着社会、经济和科学技术 的发展处于不断发展之中; 第三,人们出于不同的研究目的或使用目的, 从不同的角度或层次出发,对“信息”必然 作出不同的理解与解释。
4.从信息观的角度理解,知识是人类通过信息 对自然界、生物界、人类社会运动规律的认识 和概括,是一种特定的人类信息,它是对信息 进行提炼、深化、抽象化、系统化的结果,是 信息中最有价值的部分。知识是信息的一部分。 知识必须要有充分、可靠的经验性证据, 并且要经过理性的合理加工。
(二)知识的特性 1.实践性 社会实践是一切知识产生的基础和检验知 识的标准,科学知识对实践有重大指导作用。 2.规律性 人们对事物的认识是一个无限的过程,人 们获得的知识在一定层面上揭示了事物及运动 过程的规律性。 3.渗透性 随着知识门类增多,各种知识可以相互渗透, 形成许多新的知识门类,形成科学知识的网状 结构体系。
四、文献 (一)文献的定义 1.国际标准化组织《文献情报术语国际标准》: 文献是存储、检索、利用或传递记录信息的过 程中,可作为一个单元处理的、在载体内、载 体上或依附载体而存储有信息或数据的载体。 2.国家标准《文献著录总则》:文献是记录有知 识的一切载体。 北大教授王子舟《图书馆学是什么》:是指专门 记录、传播有知识的一切载体。 南大教授沈固朝《信息检索(多媒体)教程》: 记录有人类精神信息的、且便于存贮或传递的 人工固态附载物
参加学术讨论会、参 观、访问、座谈、同行书信 往来等
利用正式出版物
(2)时效性 信息所反映的总是特定时刻事物运动 的状态和方式,当人们将特定时刻的信息 提取出来后,事物仍不停地运动着,这样 脱离了源物质的信息就会逐渐失去效用。 因此只有及时地将信息加工、收集、传递, 才能充分利用信息。(刻舟求剑,人们不能 两次踏进同一条河流) (3)共享性 信息的共享性是指同一内容的信息可以 在同一时间被两个或两个以上的用户分享, 其分享的信息量不会因分享用户的多少而 受影响、受损失。
(二)情报的特征 1.动态性 情报的生产和传递环境变幻多端,反复无 常,要想在竞争环境中立于不败之地,必须 及时获取动态的情报。 2.按特定方式传递 它是由情报机构或人员搜集、加工、制作 开发的活的知识和信息,按情报的运行规律 向特定的用户传递的。
3.为特定的目的服务 情报具有适应“特定需要”的个性特征。它 表示其用户所需的情报是有特定要求和指 向的。 4.常常带有效性和机密性。 情报具有“秘密”的个性特征,它的作 用和价值,为一般人所不知,也不宜公开。
(5)网络型文献 以数字形式存储在各种网络服务器(客户端) 上,通过网络传输、获取和利用的信息资源。 是电子型信息资源的一种。 主要有:联机杂志、电子杂志、数据库、电子 工具书、报纸、专利信息等 特点:传递网络化,检索功能强、途径多、速 度快,发行周期短、内容更新快、信息获取 及时。 缺点:安全性差,易受计算机病毒和黑客攻击 费用较高。
图书可以帮助人们比较全面系统地了解 某一特定领域中的历史和现状。可以作为人们 掌握某一学科专业领域基本知识的入门指导工 具或者是查检工具。 每一种图书一般都有惟一的标识既国际 标准书号—ISBN号。如: ISBN 7-302-06006-1/TP.3583 7-汉语区(语言区域代码)、 302-清华大学 出版社(出版社代号)、06006-图书出版流水 号(书顺号)、1-计算机校验码、TP -中图法 分类号、3583是TP类种次号
3.1996年国际经济合作与发展组织发表的《以 知识为基础的经济》报告中。将知识分为以 下几种类型(1)事实知识(Know-what),关 于事实的知识,这类知识通常近似地称为信 息;(2)原理ቤተ መጻሕፍቲ ባይዱ识(Know-why),关于自然原 理和规律方面的科学理论,这类知识大爽在 专业研究机构和大学里形成;(3)技能知识 (Know-how),做某些事情的技艺和能力,许 多企业的技术情报、商业秘密、技术诀窍或 专业技术;(4)人力知识(Know-who),到哪 里寻求知识的知识。 4.个人知识和社会知识:社会知识是个人知识 的源泉,而个人知识的不断积累又会产生新 知识,新知识进一步丰富了社会知识。
(4)客观性 信息是事物运动的状态和方式,是客观存 在的,是不以人的意志为转移的。它包含三层意 思:一是信息来源于物质,又不是物质本身,可 以脱离源物质相对独立地存在。二是它也来源于 精神世界,但又不限于精神的领域。三是它又是 具体的,可以被 人所感知、提取、识别,可以 被传递、存储、变换、 处理、显示、检索和利 用。 (5)普遍性 一切事物运动的状态和方式都是信息,而宇宙时 空中的事物是无限丰富的,因而它们所产生的信 息也必然是无限量的。
(6)存储性(依附性) 信息必须依附在一定的载体上才能被识别和使 用,并且随着人类社会的发展和科学技术进步, 信息的存储手段和存储介质都在不断改进,如 现在的存储介质有纸张、胶片、磁带、磁盘、 光盘、硬盘、阵列等
(7)扩散性
信息在时间上的传递体现了信息的 可存储性,信息在空间上的传递则体现 了信息的可扩散性。信息的传递使信息 可以通过多种渠道 和方式迅速广泛地扩 散开来,尤其在目前的网络环境下,信 息的扩散性就表现得更为明显
二、知识 (一)知识的概念(数不清的定义) 1.知识是人类在改造客观世界的实践中获得的 认识与经验的总结,是人的主观世界对客观世 界的摡括和反映,是人的大脑通过思维对客观 事物本质与规律性的认识和掌握。 2.知识是对事实或思想的一套有系统的阐述, 提出合理的判断或者经验性的结果,它通过某 种交流手段,以某种系统的方式传播给其他人。 (美国社会学家丹尼尔· 贝尔) 3.人类对客观世界的认识,是人类认识的成果 或结晶。
文献检索(信息检索)
第三章 信息检索基本知识 第一节 信息基本知识(信息、 知识、情报、文献基本概念及相 互关系 )
G252.7/160=2
第一节 信息、知识、情报、文献基本概念及相互关系 一、信息 (一 )信息的概念 据不完全统计,信息的定义有100多种,它们都 从不同的侧面、不同的层次揭示了信息的某些特征和 性质,但至今仍没有统一的、能为各界普遍认同的定 义。 在经济学家眼中,信息是与物质、能量相并列的 客观世界的三大要素之一,是为管理和决策提供依据 的有效数据。 对心理学家而言,信息是存在于意识之外的东西, 它存在于自然界、印刷品、硬盘以及空气之中。
(三)知识的类型 1.显性知识和隐性知识(知识的属性) 显性知识指用书面文字、图标和数学公式表示 的知识。 隐性知识是指工作诀窍、经验、思想、观点、 价值体系等 。它存在于人们的头脑中,不能明 确地观察到。 2.实体知识和过程知识(知识运动状态) 静态的观点来看,将知识看成一个个物质“实 体”,在管理“实体知识”的过程中,重点在 于识别、收集、组织、分析知识。 用动态的观点来看 ,将知识看成一个过程,持这 种观点,把注意力更多地集中于知识的共享、 创新、适应、学习、运用和沟通这一动态过程。
(三)信息的种类 按信息的的来源:自然信息、社会信息、知识 信息 按信息的学科内容和应用:政治信息、科技信 息、经济信息、军事信息、教育信息等 按信息所依附的载体:文献信息、口头信息、 电子信息、生物信息等 按信息的记录符号:语声信息、图像信息、文 字信息、数据信息等 按信息的加工层次:初始信息(感知信息、原 生信息)和再生信息(二次信息、三次信息)
(二)文献的构成 现代文献由四要素构成:文献信息(知识信 息)、文献载体、符号系统和记录方式(记录 手段),四要素缺乏任何一种都不可能形成文 献。 文献信息(知识信息)是文献的内容, 符号系统是信息的携带者,是指图画、文字、 公式、图表、编码、声像和电磁信息等。 文献载体是符号赖以依附的“寄主”,纸质、 缩微、声像、电子等 记录方式(记录手段)则是代表文献的符号进 入载体的方法和过程。(活字印刷雕版印刷、
4.继承性 每一次新知识的产生,既是原有知识的深化 与发展,又是更新的知识产生的基础和前提。 知识被记录或被物化为劳动产品后,可以世 代相传和利用。 5.信息性 知识来源于信息,是经人类认识、理解、重新 整合并系统化的信息,是信息的一部分。 6.意识性 知识是观念形态的东西,通常以概念、判断、 推理、假设、预言等思维形式存在,是由人 脑产生、认识和利用的。
(4)电子型文献 通过编码技术将信息转换为计算机可识别 的语言,并将信息记录在磁带、磁盘(计算机 磁盘、U盘、移动硬盘、数码设备等) 、光盘 等载体上的信息资源。通过计算机存取、处理 和阅读的信息资源。
主要有:电子图书,电子期刊,电子会议录等
特点:体积小,存储量大,存取速度快,可共 享 缺点:设备昂贵,保存条件较高、使用费用高
(2)缩微型文献 指以印刷型文献为母本,利用光学技术 将纸质文献按一定比例缩小存储在感光材料 上的一种文献。(缩微胶卷、缩微平片、缩 微卡片等),是印刷型文献另一种记录和阅 读形式。
特点:体积小易保存,存储密度高 缺点:借助阅读机才可阅读、使用
(3)声像型文献 指通过专门的设备,使用声、光、电、磁等 技术将信息以声音、图像等形式记录下来 的信息资源。 包括:唱片,录音带,录像带,电影胶片, 电视片、幻灯片等 特点:非文字形式的文献,直观形象 缺点:需要专门的设备。
激光照排、光盘刻录等)
(三)文献的类型 1.按文献载体划分 (1)印刷型文献 指通过油印、铅印、胶印、复印等各种印刷手 段将信息记录在纸张或其它载体(绢帛、木 板、铁皮等)上的信息资源 . (图书、期刊、 报纸、档案、技术标准、专利说明书、产品 说明书、广告等) 优点:使用方便,易于携带和阅读, 缺点:体积大,不易整理和保存。