数据和事实信息检索
信息检索的类型
信息检索的类型1、按照存储的载体和查找的技术手段进行划分(按检索的手段):(1) 手工检索:用人工方式查找所需信息的检索方式。
检索对象是书本型的检索工具,检索过程由人脑和手工操作配合完成,匹配是人脑的思考、比较和选择。
(2) 机械检索:利用某种机械装置来处理和查找文献的检索方式。
⏹穿孔卡片检索:穿孔卡片是一种由薄纸板制成的、用孔洞位置表示信息,通过穿孔或轧口方式记录和存储信息的方形卡片。
⏹缩微品检索:把检索标识变成黑白点矩阵或条形码,存储在缩微胶片或胶卷上,利用光电效应,通过检索机查找。
(3) 计算机检索是指把信息及其检索标识转换成电子计算机可以阅读的二进制编码,存储在磁性载体上,由计算机根据程序进行查找和输出。
检索的对象是计算机检索系统,针对数据库进行,检索过程由人与计算机协同完成,匹配由机器完成。
检索本质没变,变化的是信息的媒体形式、存储方式和匹配方法。
⏹脱机检索:成批处理检索提问的计算机检索方式。
⏹联机检索:检索者通过检索终端和通信线路,直接查询检索系统数据库的机检方式。
⏹光盘检索:以光盘数据库为基础的一种独立的计算机检索,包括单机光盘检索和光盘网络检索两种类型。
1983年首张高密度只读光盘存储器诞生;1984年美国、日本和欧洲开始利用CD-ROM存贮科技文献。
⏹网络检索:利用E-mail、FTP等检索工具,在互联网上进行信息存取。
手工检索查准率较高,查全率较低;计算机检索查全率较高,查准率较低。
2、按照存贮与检索的对象进行划分(按检索的结果):(1) 文献检索:以包含用户所需特定信息的文献为检索对象。
是指将文献按一定的方式存贮起来,然后根据需要从中查出有关课题或主题文献的过程。
文献检索是指以文献为检索的一种相关性检索。
相关性检索的含义是指系统不直接解答用户提出的问题本身,而是提供与问题相关文献供用户参考⏹书目检索:以文献线索为检索对象。
换言之,检索系统存贮的是书目、专题书目、索引和文摘等二次文献。
第三章 信息检索的基本知识
1、逻辑“或”(和) 、逻辑“
————————————————— A
B
用符号“ 或 表示, 用符号“or”或“+”表示,其逻辑表达式为: 表示 其逻辑表达式为: A or B 或 A+B 其意义为检索记录中凡含有检索词A或检索词 , 其意义为检索记录中凡含有检索词 或检索词B, 或检索词 或同时含有检索词A和 的 均为命中文献。 或同时含有检索词 和B的,均为命中文献。
分 析 课 题
检索词: 检索词: : :
富营养化(水华), ),处理 富营养化(水华),处理 治理,修复), ),湖泊 (治理,修复),湖泊
ቤተ መጻሕፍቲ ባይዱ
, ,
,
检索工具: 检索工具:
1. 2. 3. 4. 5. 6. 7. 8. 中文科技期刊全文数据库(维普) 1989中文科技期刊全文数据库(维普) 1989-现在 中国科技成果数据库(万方) 1986中国科技成果数据库(万方) 1986-现在 中国期刊全文数据库(同方) 1979中国期刊全文数据库(同方) 1979-现在 中国优秀博硕士学位论文全文数据库(同方)1999中国优秀博硕士学位论文全文数据库(同方)1999-现在 中国学位论文文摘数据库(万方) 1989中国学位论文文摘数据库(万方) 1989-现在 中国学术会议论文全文数据库(万方) 1995中国学术会议论文全文数据库(万方) 1995-现在 中国重要会议论文全文数据库(同方) 2000中国重要会议论文全文数据库(同方) 2000-现在 中国重大科技成果数据库(万方) 1990中国重大科技成果数据库(万方) 1990-现在
中图分类法
中图法》 个基本部类, 《中图法》分 5个基本部类,将知识门类分为 哲学” 社会科学” 自然科学” “哲学”、“社会科学”、“自然科学”三大部 马克思主义、列宁主义、 类。马克思主义、列宁主义、毛泽东思想是指导 我们思想的理论基础,作为一个基本部类, 我们思想的理论基础,作为一个基本部类,列于 首位。此外,考虑到图书本身的特点, 首位。此外,考虑到图书本身的特点,对于一些 内容庞杂,类无专属, 内容庞杂,类无专属,无法按某一学科内容性质 分类的图书,概括为“综合性图书” 分类的图书,概括为“综合性图书”,作为一个 基本部类,置于最后。 22个大 基本部类,置于最后。在此基础上扩展为 22个大 类。 标记符号采用拉丁字母与阿拉伯数字相结合的混 合号码制。 合号码制。
第六章__事实数据信息检索.
第二节 印刷型参考工具书简介
• 一、类型和作用
• (一)词、字典 • 词、字典是字、词或词语的某些成分、根据 一定编纂目的加以处理和编排,供人们查考的工 具书。就广义而言,词典分为语文词典和知识词 典(学科词典)两大类,前者词语的语言方面的 知识或本身的意义,后者提供词语的学科方面的 知识、即解释在专科领域内词语所代表的事物和 概念,作一定广度和深度的叙述。
• (四)手册
• 手册(Handbook, Manual)是一种便捷式参考书 (Ready Reference Book), 它的信息、知识密集,是些经常要查阅、 参考的资料和数据。手册内容及时修订,编排合理,使用 方便。科技手册是参考工具书中的一大门类,其内容广泛、 种类各异,。它有综合性手册和专业性手册之分,以专业 性为主。专业性手册包括:数据型手册、知识型手册、设 计手册以及产品手册等。数据型手册提供各种常数、参数、 计算公式、曲线、图表、图示、线路图等,是一种简明、 实用的检索工具。知识型手册以文字叙述为主, 阐述科学原 理、专业技术、物化性能等学科知识,也配有适当公式和 图表,它们既可检索,也可阅读。设计手册为科技人员、 专业设计人员提供所需知识和数据,是他们在工作中经常 使用的工具。产品手册具有产品说明书作用,介绍产品名 称 、 技 术 指 标 、 标 准 、 生 产 厂 商 等 。
• 类书与百科全书的区别
• 将类书视为古代百科全书未尝不可,但不能与现代百科全书相提 并论,正如西方现代百科全书与古代百科全书也远不是一回事了。 类书与百科全书相比,不同之处具体表现在下列方面: 一是编纂方式不同。类书是辑录原始资料,重在资料性,是原始 资料的汇集。百科全书是根据已有的资料进行加工整理,是对已有知 识的加工、整理和浓缩,反映了编纂者本人的知识水平。 二是编排方式不同。类书是根据原始资料分类进行编排,通过分 类编排反映原始资料之间的内部联系。百科全书则是以条目的字顺进 行编排,条目之间通过索引反映内部之间的联系。 三是内容有别。类书一般侧重于文史资料,而百科全书以反映人 类全部知识为己任,对自然科学方面的知识更为重视。 四是后期工作不同。类书编纂完成以后,一般很少进行补充或修 订。而百科全书有连续修订制度,一般每隔5到10年要进行一次全面 修订,保证知识的准确性。 此外,百科全书有完备的索引体系、部分条目有参考书目指引读 者进一步阅读等,也是类书不具备的。因此从根本上讲,类书与百科 全书不是同一种工具书。
名词解释(信息检索2017)
1、信息检索:将信息按一定的方式组织和存储起来,并根据用户需要找出相关文献的过程。
其中包括存与取两个环节,存即信息存储,是对信息进行收集、标引、描述、及组织,并对其特征化表达集加以整序,形成信息检索工具或检索系统的过程。
取即信息查找,是通过某种查询机制从检索工具或检索系统中查找出用户所需的特定信息或获取其线索的过程。
2、查全率:是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量信息检索系统检出相关文献能力的尺度,可用下面的公式表示:查全率=(检出相关文献量/系统中相关文献总量)*100%3、查准率:是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统精确度的尺度,可用以下公式表示:查准率=(检出相关文献量/检出文献总量)*100%4、漏检率:是指漏检相关文献量与在检索系统中相关文献总量的比率,是衡量信息检索系统漏检文献的尺度,可用下面的公式表示:漏检率=(漏检相关文献量/系统中相关文献总量)*100%5、跨库检索:可同时检索多个平台上的多种资源,输入一个检索式,便可以看到多个数据库的查询结果。
6、单库检索:在选定的单一数据库中进行检索。
7、经典论文优先:被引用数比较多,或者文章发表在档次比较高的杂志上等经典的、有价值的文献优先排在前面。
8、相关度优先:和查询的条件内容最相关的文献优先排在前面。
9、最新论文优先:发表时间比较新的文献优先排在前面。
10、精确匹配:检索结果中包含与检索词完全相同的词语11、模糊匹配:检索结果包含检索词或检索词中的词素12、顺查法是根据有关课题的起始年代利用选定的检索工具由远及近的进行逐年查找。
13、倒查法从最新时间查找起,直到满足检索要求为止。
14、抽查法是针对有关学科的发展特点,抽查某些特定时期的文献信息。
15、二次检索是指在前一次检索结果的范围内,继续进行检索。
16、定题检索SDI (selective dissemination of information)查找有关特定主题最新信息的检索。
信息检索---名词解释
一、名词解释信息检索:信息检索最普通的理解就是信息查找。
它是将信息按一定的方式组织起来,并根据信息用户的需求查找出有关的信息的过程和技术。
信息检索又叫做信息存储与检索(information storage and retri)。
信息检索可以分为事实检索、数据检索、文献检索。
特性检索:也称强相关性检索,强调向用户提供高度对口的信息。
强调检索的准确性,对检索结果的数量不作要求。
族性检索:也成弱相关性检索,强调向用户提供系统、完整的信息。
注重检索的全面性,要求检索出一段时间期限内有关特定主题的所有信息,对准确性要求较低。
特种文献:特种文献是一种不以书刊形式出版的文献,一般不公开发行,它包括专利文献、会议资料、科技报告、技术标淮、学位论文、政府出版物、产品样本及其说明书等。
其特点是内容涉及面广、种类多、数量大、报道快、参考价值高。
OPAC:联机图书馆公共检索目录,有开放的公共查询目录演化而来,是20世纪70年代末美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。
参考工具书:是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。
年鉴:是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。
手册:是汇集某一方面常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。
名录:是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。
搜索引擎:就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。
图书:论述或介绍某一领域知识的出版物。
期刊:期刊一般是指名称固定、开本一致的定期或不定期连续出版物。
信息检索概念及分类
信息检索概念及分类
一、概念
信息检索(Information Retrieval)是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。
狭义的信息检索仅指信息查询(Information Search)。
即用户根据需要,采用一定的方法,借助检索工具,从信息集合中找出所需要信息的查找过程。
广义的信息检索是信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户特定的需要将相关信息准确的查找出来的过程。
又称信息的存储与检索。
一般情况下,信息检索指的就是广义的信息检索。
二、分类
(一)按存储与检索对象划分,信息检索可以分为:
文献检索
数据检索
事实检索
以上三种信息检索类型的主要区别在于:数据检索和事实检索是要检索出包含在文献中的信息本身,而文献检索则检索出包含所需要信息的文献即可。
(二)按存储的载体和实现查找的技术手段为标准划分:
手工检索
机械检索
计算机检索
其中发展比较迅速的计算机检索是“网络信息检索”,
也即网络信息搜索,是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。
(三)按检索途径划分:
直接检索
间接检索。
文献检索 数据检索 事实检索
文献检索数据检索事实检索
文献检索是指通过各种检索工具和数据库来查找与特定主题或领域相关的学术文献,包括期刊文章、学位论文、会议论文等。
在进行文献检索时,可以使用一些专门的学术搜索引擎或者图书馆提供的在线数据库,如Google学术、PubMed、Web of Science等。
通过关键词、标题、作者、机构等信息进行检索,以获取相关的文献信息。
数据检索是指根据特定的需求,在各种数据资源中查找、筛选和获取所需的数据。
这些数据可以包括统计数据、实验数据、调查数据等。
数据检索的过程通常涉及到对数据库、数据仓库或者数据集进行查询和分析,以找到符合要求的数据,并且确保数据的准确性和可靠性。
事实检索是指通过各种途径查找和确认特定事件或现象的真实性和准确性。
在互联网时代,人们可以通过搜索引擎、社交媒体、新闻报道等渠道来获取相关的信息和事实,以验证特定事件或现象的真实性。
总的来说,文献检索、数据检索和事实检索都是在特定领域或
者特定需求下,通过各种途径查找和获取相关信息的过程。
在进行检索时,需要考虑到信息的来源、准确性和可靠性,以确保获取到的信息是真实、准确并且具有参考价值的。
信息检索与分析第3-5章
4.查找数值、公式、规格、条例、专业知识
• 查考数值、公式、规格、条例、专业知识的数据库主要有: • 1)中国科学数据库(http:// /) 由中国科学院创建。内容涵盖了多种学科,提供了大量具有重要 科学价值和实用意义的科学数据和资料。 • 2)贝尔斯坦/盖墨林化学数据库Beilstein/Gemlin Cross Fire • 3)物质的物理化学参数数据库 (/CUU/Constants/index. html)。 • 4)化学元素周期表(/chemistry/webelements/) 查找此类信息的印刷本参考工具书宜采用手册、表册。手册也有叫 “指南”、“便览”、“须知”、“大全”;包括综合性《读者百科 词典》、《世界知识手册》等和专科性《农业技术实用手册》、《世 界经济手册》等。此外,还有表册,如《常用数学公式大全》、《电 子学数据表与公式手册》。
• • • • • • 1.分类查询 2.关键词查询 3.多次查找 4.按照地域查询 5.查询最新信息 6.其它搜索技巧
1.Google高级检索技巧
• 1)短语检索 • 2)字段限定检索 (1) 限定网站 【实例】输入“金庸 site:”搜索中文教育科研网站() 上所有包含“金庸”的页面。 (2) 限定网页 【实例】输入“inurl:midi 沧海一声笑”查找MIDI曲“沧海一声 笑”。
(3)使用字段限定
• ① intitle title是网页的标题, intitle: A指所有搜索结果的title中都要包含“关键词A”。 • ② site site是限定在某类站点或某个网站内搜索。 例如“论坛搜索引擎 site: ”,是在sowang这个网站内搜索 “论坛搜索引擎”的网页。 • ③ filetype filetype是限定文件类型。 用法是“关键词A filetype:文件格式后缀名”。 如“个人年终总结 filetype:doc”,搜索结果全都是word文件的个人年 终总结。 • ④ inurl url就是地址栏里的域名等。 inurl常见的使用方式是“关键词A inurl:英文字符B”。 例如“搜索引擎 inurl:ssyq ”,是检索在url中含有ssyq的网页中关于 “搜索引擎”的信息。
3第三章 数据与事实检索(正式版)
第三章数据、事实检索(参考工具书)第一节参考工具书概述数据检索与事实检索是一种确定性信息检索,其使用的检索工具主要就是参考工具书,它能够直接回答用户的提问。
一、概念与类型参考工具书(Reference Book)是根据社会发展的需要,高度浓缩某一学科领域的知识信息,按照特定的检索方式编排而成的供人们查阅和参考的特殊类型的图书。
参考工具书不仅可以指引读书门径,而且还可以提供数据、事实和资料。
参考工具书主要有三个特点:第一,信息密集;第二,编排有序;第三,查考为主。
参考工具书种类繁多,依照不同的划分标准,可以划分为不同的类型。
如:(1)依据语种的不同,参考工具书可以分为中文参考工具书和外文参考工具书;(2)依据出版年代的不同,参考工具书可以分为古代、近代、现代参考工具书;(3)依据出版规模的不同,参考工具书可以分为大型、中型、小型参考工具书;(4)依据学科范围的不同,参考工具书可以分为综合性、专业性参考工具书;(5)依据学科性质的不同,参考工具书可以分为社科、科技参考工具书;(6)依据功能、性质的不同,参考工具书可以分为字典、辞典、年鉴、百科全书、手册、图谱、年表、历表等等。
二、参考工具书的选择选择参考工具书应注意的几个问题:第一,对口。
需要解决什么问题,就选择能够解决这类问题的参考工具书。
选择时还需注意:①语种对口,即选择使用你所熟悉的语种编值得参考工具书;②专业对口,即选择问题所在学科的综合性或专业性参考工具书。
第二,尽可能选择内容丰富、引证准确、材料可靠的大型综合性参考工具书。
第三,注意参考工具书版本的新旧。
版本的不同,材料的可靠性就不同。
第四,虽然参考工具书一般不反映编著者个人的思想观点,但也应该注意参考工具书的知识型、思想性、科学性和政治性。
对参考工具书的观点和思想倾向,应持分析的态度。
第五,尽可能选择排检方法熟悉、辅助索引齐全的参考工具书。
三、参考工具书的排检方法在使用参考工具书之前,必须了解其排检方法。
文献信息检索方法与技巧
3.2.2.4主要开放获取 主要开放获取(open access)网站 主要开放获取 网站
BioMed Central 包含了一百多种生物学和医学期刊 Public Library of Science 包括非盈利科学期刊和医学期刊 Pubmed Central 包括生命科学方面的期刊 SPARC /sparc/ 中国预印本服务系统
3.2 文献信息的检索
3.2.1图书信息的检索 OPAC:一个基于网络的书目检索系统,提 供本馆书目信息的检索服务。可通过internet 检索全世界各图书馆的书目信息。如:
中国国家图书馆OPAC, 美国国会图书馆OPAC, 清华大学图书馆OPAC,
(长春图书馆检索路径,IP限制) 龙源期刊
3.2.2 外文期刊检索 3.2.2.1英文期刊检索工具
收录期刊18,000种,免费 检索题录或文摘、最新期刊文献报道、文章订购、 原文传递 OCLC FirstSearch之ECO:收录期刊3100多种, 以页映像显示文章全部原始内容和图像 UML之Academic Research LIbrary(ARL):收录期刊 2300多种。可检索文摘和全文。 EBSCO学术信息|商业信息数据库 EL据库
3.2.7 学位论文的检索
国内:al Dissertation(PQDD)
国内
中文核心期刊要目总览:北大图书馆、高校图工委 编,收编包括社会科学和自然科学等各种学科类别 的中文核心期刊。 中国当代期刊总览 中国期刊大全 全国期刊联合目录: /union/index.jsp,中国科学 院文献情报中心牵头研建,是一个全国性的多文种 连续出版物联合目录数据库 全国报刊索引 1951--- 综合性 google学术搜索引擎: 可以检索维普、万方公司的期刊数据库题录
事实和数据型信息检索
国研网检索课堂练习
根据题目课堂练习
EPS数据平台
▪ EPS(Economy Prediction System)数据平台是 “数据库+统计 分析预测”的数值型数据库,拥有25万多个统计指标的时间序列, 数据总量超过40亿条。
数据库访问
EPS数据库课堂练习
根据题目课堂练习
万方数据知识服务平台
全文数据库 统计数据库 研究报告数据库 专题数据库 世经数据库
国研网统计数据库
统计数据库检索实例
▪ 下面我们以宏观经济数据库地区月度数据使用为例,查询北京、 天津和上海的食品价格指数和居住价格指数,时间选择为2016年 的3、4、5月。
国研网统计数据多维检索
显示统计数据结果
统计结果数据
统计数据结果图形
第七章 事实和数据▪ 在此处添加第一个项目要点 ▪ 在此处添加第二个项目要点 ▪ 在此处添加第三个项目要点
本讲提要
▪ 事实和数据型信息概述 ▪ 中文事实型数据库系统选介 ▪ 英文事实型数据库系统选介 ▪ 其他事实和数据库数据资源选介
事实和数据型数据库概念
事实型数据库是指以各种有检索和利用 价值的事实信息为存储对象的一类数据 库,数据库信息来源于百科全书、字词 典、人名录、机构名录等。
课后练习
本章其他内容
课后练习
▪ 作用
▪ 事实及数值数据库的作用大致相当于传 统的参考工具书
▪ 特点 ▪ 查询快、范围广
国务院发展研究中心信息网(国研网)
▪ 国务院发展研究中心信息网(简称“国研网”)创建于1998年,是由 国务院发展研究中心主管、北京国研网信息有限公司承办的大型 经济类专业信息平台。
国研网的五大数据库集群
信息检索四(数据与事实检索)
国际数据-主要国家(地区)月度数—指标 (贸易)地区(中国台湾)查询时间 案例7:要查世界卫生医疗情况? /----统计数据— —国际数据(国际组织网站)——世界卫生 组织——中文——数据与统计数字——世界 卫生统计报告——2013年报告全文
六、手册、指南——规格、条例、专业知识
案例2、请用英文准确地描述 J.k.Rowling这个人?她生于何时何
地?有哪些有影响的作品?获得哪 些成功? /--J.k.Rowling---search
五、年鉴
(一)、定义:系统汇集一年内的主要时 事文献、学科进展情况、研究成果及有 关统计资料,提供详尽事实、数据和统 计数字,反映近期政治、经济发展动向 及科学文化进步的年度出版物。
相对于专业性的百科全书来说,手册、 指南更实用,更偏向于回答“如何做” (how)的问题。很多手册都反映在权 威政府部门或组织机构的网页上。 案例8、如何报关,通关的代码都有哪 些,可以利用哪一种参考工具书或网站 资源?
Hale Waihona Puke 中国海关报关手册或者中华人民共和国
海关总署( /publish/po rtal0/)-----办事服务(服务指南) 案例9、我想去美国读书,想知道读什 么专业就业机会较多,并了解相关职业 的基本情况,可以利用? 美国劳工部编的《Occupational Outlook Handbook》( /ooh/)
七、名录—人物、机构名和地名信息检索工具
1、全球黄页::主要是查
找中国企业 2、世界买家网 /index.asp提供最 新国外买家信息,国外采购商信息,广交会采 购商,注册临时用户可查看10家进口商信息 ,正式用户可查看150家进口商信息。
三、语言性工具书——字词典
数据与事实检索
书目与索引(Bibliography and Index)
《美国大学词典》(American College Dictionary) 《简明牛津词典》(The Concise Oxford Dictionary of Current English,简
称COD) 《韦氏新版大学词典》(Webster’s Ninth New Collegiate Dictionary) 《韦氏新世界美语词典》(Webster’s New World Dictionary of the American
《科利尔百科全书》(Collier’s Encyclop国不列颠百科全书公司合作的版本 全书共20卷,1-18卷为条目正文,19-20卷为索引
年鉴(Almanacs,Yearbooks,Annual)
著名的年鉴
《世界年鉴》(The World Almanac and Book of Facts) 《联合国年鉴》(Yearbook of the United Nations) 《联合国统计年鉴》(United Nations Statistical
年表或表谱
年表或表谱是按照时间顺序记录大事的参考工具。主要有:
历史年表 自然科学年表 社会科学年表 反映某一领域特定事物的年表 政治人物年谱 科学家与作家年谱
图集(图录、图鉴、图谱、地图)
图鉴或图录是按照分类,汇集一系列图片以及简要文字说明,直观地反 映事物的工具书。包括地图集、历史图谱、文物图谱、人物图谱、艺术 (主要是绘画、雕塑作品)、科技图谱等。
第4章__数据与事实信息检索
).综合性百科全书 (1).综合性百科全书 ). 不列颠百科全书) ②《不列颠百科全书)(The New EncycloPedia Britannica)它是世界上公认有 ) 权威性的大型综合类百科全书, 权威性的大型综合类百科全书,原被誉为百科全 书之王,是历史最长、影响最大、 书之王,是历史最长、影响最大、最具权威的一 部综合性百科全书。即过去所称的《 部综合性百科全书。即过去所称的《大英百科全 年间世。 书》。自1768~1771年间世。已有二百多年的 ~ 年间世 历史了。最新版本是在1974年第 版基础上经 年第15版基础上经 历史了。最新版本是在 年第 过重大修订后于1985年问世的。全书由 部分组 年问世的。 过重大修订后于 年问世的 全书由4部分组 成,共32卷。 卷
2011年12月13日星期二 塔里木大学《文献信息检索与利用》 17
查检举例—(查地名资料 查检举例 查地名资料) 查地名资料
例2.查著名教堂“巴黎圣母院”的资料 .查著名教堂“巴黎圣母院” 选用《简明不列颠百科全书》查找该题。可利用3种途径: ①按汉语拼音顺序直接查找; ②利用第10卷《索引》中的“条目标题汉字笔画索引”查找; ③利用第10卷《索引》中的“条目标题外文(包括拼音)与汉文对照索 引”查找。均可查得:“巴黎圣母院 :最著名的中世纪哥特式大教堂, 以其规模、年代和在考古、建筑上的价值而著称。…”。
2011年12月13日星期二 塔里木大学《文献信息检索与利用》 11
查检举例—(古今中外的地名 查检举例 古今中外的地名) 古今中外的地名
例.查古都开封 如选用《中华人民共和国地名词典(河南省)》查找开封这 个地名,在该词典中查得:“开封市[Kaifeng Shi]北纬 340 2’~ 35000’,东经113052’~ 115002’。河南省辖市。 简称汴。在河南省东部,黄河南侧。面积……”。 查找古今中外的地名,可选用地名词典、地名录、《辞海》 及百科全书。《世界地名词典》、《中国古今地名大辞典》、 《中国名胜索引》、《中国历史地名小辞典》等等,都收录 了很多地名。
按照检索对象的不同 信息检索一般包括
从检索的对象性质来看,存在有三种类型的信息检索,即文献信息检索、数据信息检索和事实信息检索。
1)文献检索(Document Retrieval )即从一个文献集合中查找出专门包含所需信息内容的文献,是以文献为检索对象的信息检索类型。
文献检索结果提供的是与用户的信息需求相关的文献的线索或原文。
2)数据检索(Data Retrieval )以特定数据为检索对象和检索目的的信息检索类型。
包括数据图表,某物质材料成份、性能、图谱、市场行情、物质的物理与化学特性,设备的型号与规格等,是一种确定性检索。
3)事实检索(Fact Retrieval )是获取以事物的实际情况为基础而集合生成的新的分析结果的一类信息检索,是以从文献中抽取的事项为检索内容,包括事物的基本概念、基本情况,事物发生的时间、地点、相关事实与过程等。
检索参考工具书介绍
参考工具书简介参考工具书包括字词典、百科全书、年鉴、手册、名录、表谱、图录等类型,通常用于数据信息检索和事实信息检索。
一、字、词典字典、词典在英语中通称为dictionary,是人们经常使用的工具书。
汉语里,字和词是不同的概念,因此有字典和词典之分。
字典是汇集单字,注明其字形、读音、意义和用法;词典主要解释词语的概念、意义和用法。
字词典按所收内容分为语文性和知识性两大类。
(一)语文性字词典:主要供学习语言文字之用,又可分为综合性字词典和专门性字词典。
1、综合性字词典,对字的音、形、义和词汇的意义、用法全面加以解释。
如《新华字典》、《汉语大字典》、《王码字典》、《现代汉语词典》、《Oxford of English Language》等。
2、专门性字词典,只收某一类的字、词,或只解释字或词形、音、义的某个方面。
如《成语词典》、《汉语虚词词典》、《简明同义词典》、《中国民间方言词典》。
(二)知识性词典:知识性词典包括百科词典、专科词典。
1、百科词典,汇集各学科重要的术语和概念加以解释,提供最基本的知识。
如《辞海》、《中国百科大辞典》等。
2、专科词典,收录一个学科或专门领域的术语、概念、专名加以解释,系统地反映专业知识的概要。
专科词典所提供的知识往往比百科词典更为详尽。
如《哲学大辞典》、《中国艺术家辞典》、《中国古今地名大辞典》等。
此外,还可按语种划分为单语词典和多语词典。
如上述各种字(词)典都属于单语词典。
多语词典是两种或两种以上语种间的对译词典。
如《英汉大词典》、《汉英科技大辞典》等。
(三)字词典举例(1)《说文解字》,东汉许慎撰,中华书局1963年、1984年据清陈昌治改刻本缩印出版,这是我国第一部正规字典。
《说文解字》分为540个部首,汇集9353个当时通用汉字,另有重文1163个字。
每字首先说解字义,然后分析文字形体构造,最后注音。
《说文解字》是我国系统分析字形从而考究文字本义的重要著作,至今仍是研究古文字学和古汉语重要的工具书。
第二章信息检索基础知识
属后组式语言。
主题词
概念:通过文献所属学科的主题对文献进行检索, 是以主题词为检索标识,它是一种特性检索。 主题词是用来表达文献的主题概念的,经过规范化 主题词 处理的名词或词组。 如:出生缺陷-畸形 杵状指-骨关节病,继发肥大性
主题词表- 主题词表-单元词表
《WPI--规范化主题词表》
(WPI--LIST OF STANDARD THESAURUS TERMS)
是检索英国德温特公司专利文献的工具。按规范 词字顺排列。其著录格式见图
WPI-List of Standard Thesaurus Terms 1987 COBALT(3772)(1) COBALT@(3) CODON【87】(4) ELECTRIC(33892)(1) Electrical(2)
关键词 自然语言 单元词 标题词 叙词 语 言 言 语
分类语言
分类语言是运用概念划分的方 法,按文献内容所属学科、专 业性质的逻辑次序,以数字、 字母或数字与字母结合为基本 字符,以分类号为标识,用来 存储和检索文献的文献标识系 统。
分类语言的特点
主要特点就是按学科专业性质集中图书 区分不同性质的图书 集中性质相同的图书 相近的放在相近的位置 按照远近亲疏的关系把图书组成为一个 有条理的体系 提供从学科分类查找图书的途径
机械制造工艺系统学 / 张恩生,申铁固编著-上海交通 大学出版社 TH16/ Z31 机械设计学习指南 / 陶民华等编机械工业出版社 TH122-44/ T43 机械优化设计基础 / 张九明编著煤炭工业出版社 TH122/ Z32A 分类号+著者号TP393-62/J25
主题语言
主题语言是指以自然语言的字符为字符, 以名词性术语为基本词汇,用名词性术 语作为标识的一种信息标识系统。是主 题概念检索文献信息的检索语言。
文献检索第五讲-数据事实检索
Section
9: Molecular Structure and Spectroscopy Section 10:Atomic, Molecular and Optical Physics Section 11:Nuclear and Partial Physics Section 12:Properties Of Solids Section 13:Polymer Properties Section 14:Geophysics, Astronomy and Acoustics Section 15:Practical Laboratory Data Section 16:Health and Safety Information
3.
一些百科全书
网络版百科全书
1) MSN Encarta (Microsoft Corporation) 2) (Al) ……
• • • • •
Encyclopedia of environmental biology The encyclopedia of the biological sciences The Wiley encyclopedia of energy and the environment Encyclopedia of global environmental change HighBeam Encyclopedia (HighBeam™ Research, Inc. )
检索方法:
– 浏览:按内容的卷册、目次进行 – 检索:利用搜索引擎的简单/高级检索
三. 百科全书
人类一切知识门类或某一知识门类概 述性的著述。被誉为“工具书之王”。
综合性百科全书
旨在收集、整理人类所积累的一切学 科知识,涉及各个领域,兼收并蓄。
数据与事实信息检索ppt课件
2021精选ppt
3
5.1.2参考工具及其功能
参考工具书是指根据一定的社会需要,,广泛汇集 某一范围的知识文献信息,并按一定的方法编排,专为 人们解决疑难或检索有关数据型、事实型信息的工具书。
工具书特殊的用途决定了它的特点。首先工具书的 收录内容具有广泛性和完整性,它根据一定需要汇集了 各领域或某一领域的完整信息资料和最新的研究成果。 其次,工具书的概括性强且简明精确,它提供了原始信 息经过整序、浓缩、重组、综合后的数据型、事实型和 文献型的信息,文字简洁,数据准确,此外还有附图、 表格、图片等。第三,工具书有特定的编排方法,以方 便用户检索,这种编排方式反映了知识内容的内在联系, 用户在查阅时可以按字序、音序、形序、分类、主题、 关键词、年代、地区等多种途径检索相关信息。
数据与事实参考信息检索工具的功能主要类型与评价标准掌握百科全书专辑资料地理资料年鉴机构名录词典统计资料等各类型参考工具中有代表性的常用工具的收录特点和查找使用方法511数据与事实信息检索概述文献检索是信息检索中非常重要的一部分在科学研究和教育中占有特殊的地位
第5章 数据与事实信息检索
2021精选ppt
1.《传记索引》
2.《韦氏传记辞典》
3.《国际名人录》
4.《英国国家传记词典》
5.《美国名人录》
6.《科学家传记词典》
7.《中国人名大辞典》
8.《中国人物年鉴》
9.其他重要传记词典
5.3.3 传记资料检索网站
1.Marquis Who’s who ( )
(5)其他
2021精选ppt
23
5.7.2 重要的词典工具书
1.《韦氏新国际英语词典》
2.《芬华氏新标准英语词典》
3.《兰登书屋英语词典》
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
排检方式(编排特点和使用方法)
分类方式:按内容性质或学科体系进行分类编排 (手册、百科全书)
字序方式:按音序、形序或号码方式排列 (字、 词典;百科全书)
时空方式:按事情发生发展的时间顺序(时序法) 或地点顺序(地序法)编排正文内容 (大事年表;机构名录;地方志)
如Yahoo、Sohu网站
视频信息资源
录像带或激光视盘:新产品资料或公司、 企业的介绍宣传
用途:广告、和用户沟通 特点:
声、文、图并茂 动感和立体感强 新型的事实数据型信息源 增长速度快
报纸、专业性期刊和检索类刊物
报纸
对信息的传递时效快 内容新、涉及面广、量大 过于分散、可靠性差
主题检索:可利用“内容索引”可查找某一 条目、隐含于某一条目中比较重要的内容, 或利用《总索引》查找
2 《不列颠百科全书》 Encyclopedia Britannica
当今世界上声誉最高、最具权威 性的大型综合性百科全书之一, 著 名 的 英 文 三 大 百 科 全 书 ABC 之B。第一版首创于英国,在我 国习惯称为《大英百科全书》
《The Oxford English Dictionary》
例: Screen “屏幕”,在染色中应为“筛网”; Jacket “上衣”,在电气中为“(电解电容的)外壳”; Fat and Thin Fiber “胖瘦纤维” ,在纺织中应为“粗细纤维”
等
2 百科全书(Encyclopedia)
定义:
《科利尔百科全书》 (Collier’s Encyclopedia 简称EC)
1《中国大百科全书》
我国第一部大型综合性百科全书 1980~1993年出版,按学科分卷,包括66个学科和知识门
类,共74卷,收录了77859个条目,总字数逾1.25亿字,插 图约6万幅 各学科分卷一般由前言、凡例、学科概观性文章、分类目 录、条目正文、索引(条目汉字笔画索引、条目外文索引 (Index of Articles)和内容索引)和附表(大事年表、繁体字 和简化字对照表、外国人名译名对照表)构成
《百科索引》 2卷 1985年修订时增加
示例:利用《不列颠百科全书》15版修订本 查找“人工智能”方面的资料
利用《索引》,按英文主题词Artificial Intelligence字顺,在A~ K本的第101页找到下 列款目:“Artificial Intelligence 1:602:3a”。其中
网络信息资源
有数据和事实型数据库及以提供数据和事实信息 为主要内容的网站
包含字典、辞典、人名录、地理信息、年表、政府出 版品、工商机构、名录、统计资源、法规资源等信息 --便利实用
以搜索引擎,在网上进行数据与事实信息的检索 某些网站或搜索引擎分析与评估网上资源,对此
类信息资源设置相应的指南
《百科简编》(Micropaedia)10卷
12.42万条解释简要的小条目,按字顺编排,既可单 独使用,也可作全书的条目索引,条目释文后附有 大量的参见索引,指明《百科详编》的位置
《百科详编》(Macropaedia)19卷
全书的核心部分,可在此看到长篇学术性条目,具 有一定的权威性。共收录大条目4207条 ,按字顺编 排
各类数值信息 科学技术数据、社会资源数据、商业经济统
计数据
例:我国丝绸产品的生产消费及进出口情况 2009年杭州市总人口数等
计量单位的换算、运算公式、图谱、表格等 百科知识、人物、地理、机构信息等
例:钱学森的主要论著
商情信息、科技、法规信息等
例:上海、深圳股票市场每日变化情况
2、数据和事实信息检索的特点
文献检索
Information Retrieval
彭志勤
材料与纺织学院 材料工程系
第三讲 数据和事实信息检索
第一节 概述 第二节 数据和事实检索信息源 第三节 参考工具书 第四节 数据和事实型数据库 第五节 数据与事实免费网络检索
一、概述
1、数据和事实信息的内容
字、词或代码的含义
例:某一英文缩写或代码的含义 (Corp. 、HLB、FTIR…)
按地域范围分: 地区性年鉴,如: 《杭州年鉴》、《香港经济年鉴》) 国家性年鉴,如: 《中国经济年鉴》、《Britannica Book of Year》 世界性年鉴,如: 《世界经济年鉴》、《Statistical Yearbook》
《中国百科年鉴》--中国大百科全书出版社(1980年起) 出版的综合性年鉴,主要反映上一年度我国和世界各国重 大事件和各方面发展的新情况,为《中国大百科全书》各 卷的补充,主要由“概况”和“百科”两部分组成
汇集人类一切门类知识或某一门类知识的概述性著述。 集工具书之大成,囊括工具书的功能--“工具书之王” “下定义”+“解释”(what, when, where, how, why )
特点:
汇编性、概括性、系统性、检索性、可读性 内容注重“全”“精”“新”
类型:
按收录范围分: 综合性 、专业性 按部头大小分:大百科全书(>20卷)
在反映中国特色方面有明显的特征,论述的有关中国的内 容具有充分的权威性;自然科学和工程技术方面的内容所 占的比例达到50%以上,各学科条目的知识深度也较高, 接近于专业性百科全书
使用方法
分类检索:从“条目分类目录”按学科体系, 分类查找
字顺检索:每一卷内容是按条目名称的汉语 拼音顺序排列的,可按汉语拼音字顺,直接 查找正文条目
适合非专业人员、青年学生和 家庭使用,资料的深度、广度 均 不 及 EB、EA, 但 注 重 事 实 , 理论性阐述较少,可读性强, 东方资料较少
编排采取大中小条目相结合。 参考书目1.25万个,学习指南、 分析索引集中在第24卷
6《世界百科全书》 The World Book Encyclopedia
1:602:3a表示第1卷(《简编》),第602页,第3栏,位 置a,可以找到“人工智能”的条目
利用《类目》的目次表(Table of Contents)找 到相应的大类号及对应的页码,从而在正文中 找到此大类和《简编》中的位置
3《简明不列颠百科全书》
中国大百科全书出版社与美国不 列颠百科全书公司合作出版的中 文版
特点:人物、科学技术条目所 占篇幅较大,内容偏重美洲, 美国、加拿大的资料较丰富
条目按关键词顺序排列,最后 1卷为按字顺排列的索引,条 目之间有参见系统,并附有参 考书目
5《科利尔百科全书》 Collier’s Encyclopedia
大型的英文综合性百科全书, 著名的英文三大百科全书ABC 之C,共24卷,2.5万个条目, 插图1.7万幅
定义:专门解释文字的读音、意义、形体结构及用法
的工具书叫字典;专门解释词汇的概念、意义及用法的 工具书叫词(辞典)
分类
按语种分 单语词典 《现代汉语词典》《汉语大词典》 多语词典 《英汉词典》 缩略语词典
按内容分
专业类词典 《英汉纺织工业词汇》 综合类词典 《辞海》《中国百科大辞典》
编排: 按字(音)顺序排列正文内容
《世界大百科事典》 (日) 《Encyclopedia of Materials Science and Engineering》
(英国) 共8卷,1986年出版。第8卷是索引本,提供了作者、 主题索引 《中国企业管理百科全书》 《中国大学生百科全书》 收集了当代大学生关心的知识性条目7591条,有教育、 著名高校,科学研究等相关内容 《世界经济百科全书》(中) 《纺织百科全书》(Encyclopedia of Textile)
3 年鉴(Yearbook)
特点
按年出版,汇集某一年内的重大事件、数据、统计资 料等。用于查询某年内的数据和事实
类型
按内容范围分: 综合性年鉴,如: 《中国百科年鉴》、《世界知识年鉴》) 专业性年鉴,如: 《中国哲学年鉴》、《中国纺织工业年鉴》) 统计性年鉴,如: 《中国统计年鉴》、《中国人口统计年鉴》)
注:许多参考工具书都有两种或两种以上的排检方法,如先 按学科或专业分类,再按字序或其他方法排列
2、参考工具书举要
词(辞)典(Dictionary) 百科全书(Encyclopedia) 年鉴(Yearbook) 手册(Handbook) 名录(List)
1字、词(辞)典(Dictionary)
专业性期刊
信息源相对较为集中 传递较报纸晚
例:《纺织信息周刊》、《丝绸商情》
检索类刊物
信息量大,但时差较长 例:《市场与技术预测综览》(PROMT)-美国
三、 参考工具书
1、结构及排检方式
结构
序:介绍作者生平介绍或书的内容变更情况。 便于读者了解本书的使用价值
凡例说明:说明收录范围、使用方法。 指导读者如何使用本书
参考工具书
定义
是指把某一范围的知识或资料加以分析、综合或浓缩, 并按一定的方式编排,以备查阅、参考,用以解决事实 和数据方面疑难问题的图书
类型
字、词(辞)典、百科全书、年鉴、手册、机构名录和人 名录、指南、图谱和统计资料汇编等
特点
知识面广、汇编性强 信息密集、浓缩性强 便于检索、查考
全书共30卷,33141页,有 106421个条目,24709张插图。 其传统内容侧重人文学科,科技 方面占了全书40%的篇幅
/
内容
《百科类目》(Propaedia ) 1卷
把人类知识分为十大门类(part),每一门类下再细分 成部类(devision)、大类和细目,在每个细目之后, 注明引向《百科详编》的信息
外语词典的选用
语言类词典--普通学外语用,例:《新英汉词典》 英汉技术词典(汇)--专业用语、基本结构用语(如某词
后可跟什么词) 专业词典--某词经翻译后觉得不通顺,或用多个含义而无