数据和事实信息检索

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
字序方式:按音序、形序或号码方式排列 (字、 词典;百科全书)
时空方式:按事情发生发展的时间顺序(时序法) 或地点顺序(地序法)编排正文内容 (大事年表;机构名录;地方志)
注:许多参考工具书都有两种或两种以上的排检方法,如先 按学科或专业分类,再按字序或其他方法排列
2、参考工具书举要
词(辞)典(Dictionary) 百科全书(Encyclopedia) 年鉴(Yearbook) 手册(Handbook) 名录(List)
小百科全书( <10卷 )、百科词典 按地域观点分:世界性百科全书、
地域性百科全书、宗教和民族性百科全书
常用百科全书介绍
《中国大百科全书》
《不列颠百科全书》 (Encyclopedia Britannica 简称EB)
《美国百科全书》 (The Encyclopedia Americana 简称EA)
主题检索:可利用“内容索引”可查找某一 条目、隐含于某一条目中比较重要的内容, 或利用《总索引》查找
2 《不列颠百科全书》 Encyclopedia Britannica
当今世界上声誉最高、最具权威 性的大型综合性百科全书之一, 著 名 的 英 文 三 大 百 科 全 书 ABC 之B。第一版首创于英国,在我 国习惯称为《大英百科全书》
各类数值信息 科学技术数据、社会资源数据、商业经济统
计数据
例:我国丝绸产品的生产消费及进出口情况 2009年杭州市总人口数等
计量单位的换算、运算公式、图谱、表格等 百科知识、人物、地理、机构信息等
例:钱学森的主要论著
商情信息、科技、法规信息等
例:上海、深圳股票市场每日变化情况
定义:
汇集人类一切门类知识或某一门类知识的概述性著述。 集工具书之大成,囊括工具书的功能--“工具书之王” “下定义”+“解释”(what, when, where, how, why )
特点:
汇编性、概括性、系统性、检索性、可读性 内容注重“全”“精”“新”
类型:
按收录范围分: 综合性 、专业性 按部头大小分:大百科全书(>20卷)
特点
知识面广、汇编性强 信息密集、浓缩性强 便于检索、查考
数据和事实型数据库
数值型数据库
以数值为主要内容,存储 各类数值:如科学技术数据、社会资源数据、 商业经济、地理环境数据 运算公式、图谱、表格:如金融、证券系统数 据库中的货币兑换、化学物质结构数据库、生 物蛋白质序列数据库
参考工具书 数据和事实型数据库 网络信息资源 视频信息资源 报纸、专业性期刊和检索类刊物
参考工具书
定义
是指把某一范围的知识或资料加以分析、综合或浓缩, 并按一定的方式编排,以备查阅、参考,用以解决事实 和数据方面疑难问题的图书
类型
字、词(辞)典、百科全书、年鉴、手册、机构名录和人 名录、指南、图谱和统计资料汇编等
全书共分10卷内容,1~9卷为正 文及附录,10卷为索引
条目除中国部分外,主要是根据 新版EB的《百科简编》编译而成, 共收录条目71000余条约2400万字, 附图片5000幅
全书条目按汉语拼音顺序排列
4《美国百科全书》
The Encyclopedia Americana
美国出版的第一部大型综合性 百科全书,著名的英文三大百 科全书ABC之A,其内容权威 性仅次于EB,于1829~1833年 问世,已有近170年的历史。 目前全书共30卷册
1字、词(辞)典(Dictionary)
定义:专门解释文字的读音、意义、形体结构及用法
的工具书叫字典;专门解释词汇的概念、意义及用法的 工具书叫词(辞典)
分类
按语种分 单语词典 《现代汉语词典》《汉语大词典》 多语词典 《英汉词典》 缩略语词典
按内容分
专业类词典 《英汉纺织工业词汇》 综合类词典 《辞海》《中国百科大辞典》
共分20卷(包括索引1卷,可按汉语拼音排序、汉字笔画排序、英文排序、分类排 序等4种方式检索),共 11600余页,约2200万字,词条17200余条。共有彩色插 图20000余幅,图片包括照片、线条图、油画及水彩画、地图、示意图、曲线图、 图解等形式。2007 出版:RMB5800
其他百科全书介绍
3 年鉴(Yearbook)
特点
按年出版,汇集某一年内的重大事件、数据、统计资 料等。用于查询某年内的数据和事实
类型
按内容范围分: 综合性年鉴,如: 《中国百科年鉴》、《世界知识年鉴》) 专业性年鉴,如: 《中国哲学年鉴》、《中国纺织工业年鉴》) 统计性年鉴,如: 《中国统计年鉴》、《中国人口统计年鉴》)
特点:人物、科学技术条目所 占篇幅较大,内容偏重美洲, 美国、加拿大的资料较丰富
条目按关键词顺序排列,最后 1卷为按字顺排列的索引,条 目之间有参见系统,并附有参 考书目
5《科利尔百科全书》 Collier’s Encyclopedia
大型的英文综合性百科全书, 著名的英文三大百科全书ABC 之C,共24卷,2.5万个条目, 插图1.7万幅
《百科索引》 2卷 1985年修订时增加
示例:利用《不列颠百科全书》15版修订本 查找“人工智能”方面的资料
利用《索引》,按英文主题词Artificial Intelligence字顺,在A~ K本的第101页找到下 列款目:“Artificial Intelligence 1:602:3a”。其中
按地域范围分: 地区性年鉴,如: 《杭州年鉴》、《香港经济年鉴》) 国家性年鉴,如: 《中国经济年鉴》、《Britannica Book of Year》 世界性年鉴,如: 《世界经济年鉴》、《Statistical Yearbook》
全书共30卷,33141页,有 106421个条目,24709张插图。 其传统内容侧重人文学科,科技 方面占了全书40%的篇幅
http://www.britannica.com/
内容
《百科类目》(Propaedia ) 1卷wenku.baidu.com
把人类知识分为十大门类(part),每一门类下再细分 成部类(devision)、大类和细目,在每个细目之后, 注明引向《百科详编》的信息
《世界大百科事典》 (日) 《Encyclopedia of Materials Science and Engineering》
(英国) 共8卷,1986年出版。第8卷是索引本,提供了作者、 主题索引 《中国企业管理百科全书》 《中国大学生百科全书》 收集了当代大学生关心的知识性条目7591条,有教育、 著名高校,科学研究等相关内容 《世界经济百科全书》(中) 《纺织百科全书》(Encyclopedia of Textile)
文献检索
Information Retrieval
彭志勤
材料与纺织学院 材料工程系
第三讲 数据和事实信息检索
第一节 概述 第二节 数据和事实检索信息源 第三节 参考工具书 第四节 数据和事实型数据库 第五节 数据与事实免费网络检索
一、概述
1、数据和事实信息的内容
字、词或代码的含义
例:某一英文缩写或代码的含义 (Corp. 、HLB、FTIR…)
1:602:3a表示第1卷(《简编》),第602页,第3栏,位 置a,可以找到“人工智能”的条目
利用《类目》的目次表(Table of Contents)找 到相应的大类号及对应的页码,从而在正文中 找到此大类和《简编》中的位置
3《简明不列颠百科全书》
中国大百科全书出版社与美国不 列颠百科全书公司合作出版的中 文版
2、数据和事实信息检索的特点
涉及的学科范围、应用领域广泛 检索方式没有统一模式 直接面向问题回答咨询 对数据可靠性、客观性要求高 是确定性检索,不是文献线索的检索 检索范围主要包括各种数值、公式、事实
如:科技成果、市场动态、统计数据、人物传记、 机构名录
二、 数据和事实信息源
《The Oxford English Dictionary》
例: Screen “屏幕”,在染色中应为“筛网”; Jacket “上衣”,在电气中为“(电解电容的)外壳”; Fat and Thin Fiber “胖瘦纤维” ,在纺织中应为“粗细纤维”

2 百科全书(Encyclopedia)
以搜索引擎,在网上进行数据与事实信息的检索 某些网站或搜索引擎分析与评估网上资源,对此
类信息资源设置相应的指南
如Yahoo、Sohu网站
视频信息资源
录像带或激光视盘:新产品资料或公司、 企业的介绍宣传
用途:广告、和用户沟通 特点:
声、文、图并茂 动感和立体感强 新型的事实数据型信息源 增长速度快
编排: 按字(音)顺序排列正文内容
外语词典的选用
语言类词典--普通学外语用,例:《新英汉词典》 英汉技术词典(汇)--专业用语、基本结构用语(如某词
后可跟什么词) 专业词典--某词经翻译后觉得不通顺,或用多个含义而无
法确定 疑难词---《Webster’s Third New International Dictionary》、
适合非专业人员、青年学生和 家庭使用,资料的深度、广度 均 不 及 EB、EA, 但 注 重 事 实 , 理论性阐述较少,可读性强, 东方资料较少
编排采取大中小条目相结合。 参考书目1.25万个,学习指南、 分析索引集中在第24卷
6《世界百科全书》 The World Book Encyclopedia
《科利尔百科全书》 (Collier’s Encyclopedia 简称EC)
1《中国大百科全书》
我国第一部大型综合性百科全书 1980~1993年出版,按学科分卷,包括66个学科和知识门
类,共74卷,收录了77859个条目,总字数逾1.25亿字,插 图约6万幅 各学科分卷一般由前言、凡例、学科概观性文章、分类目 录、条目正文、索引(条目汉字笔画索引、条目外文索引 (Index of Articles)和内容索引)和附表(大事年表、繁体字 和简化字对照表、外国人名译名对照表)构成
事实型数据库
直接提供可用的事实,存储 既有数字又有文字的统计资料 纯文字的知识资料或信息:如人物传记数据库、 百科知识数据库、自然及社会资源统计数据库、 公共信息数据库
网络信息资源
有数据和事实型数据库及以提供数据和事实信息 为主要内容的网站
包含字典、辞典、人名录、地理信息、年表、政府出 版品、工商机构、名录、统计资源、法规资源等信息 --便利实用
在反映中国特色方面有明显的特征,论述的有关中国的内 容具有充分的权威性;自然科学和工程技术方面的内容所 占的比例达到50%以上,各学科条目的知识深度也较高, 接近于专业性百科全书
使用方法
分类检索:从“条目分类目录”按学科体系, 分类查找
字顺检索:每一卷内容是按条目名称的汉语 拼音顺序排列的,可按汉语拼音字顺,直接 查找正文条目
《百科简编》(Micropaedia)10卷
12.42万条解释简要的小条目,按字顺编排,既可单 独使用,也可作全书的条目索引,条目释文后附有 大量的参见索引,指明《百科详编》的位置
《百科详编》(Macropaedia)19卷
全书的核心部分,可在此看到长篇学术性条目,具 有一定的权威性。共收录大条目4207条 ,按字顺编 排
1、结构及排检方式
结构
序:介绍作者生平介绍或书的内容变更情况。 便于读者了解本书的使用价值
凡例说明:说明收录范围、使用方法。 指导读者如何使用本书
正文:主体部分 索引:引导读者查阅正文 附录:提供与本工具有关或无关的参考资料
排检方式(编排特点和使用方法)
分类方式:按内容性质或学科体系进行分类编排 (手册、百科全书)
报纸、专业性期刊和检索类刊物
报纸
对信息的传递时效快 内容新、涉及面广、量大 过于分散、可靠性差
专业性期刊
信息源相对较为集中 传递较报纸晚
例:《纺织信息周刊》、《丝绸商情》
检索类刊物
信息量大,但时差较长 例:《市场与技术预测综览》(PROMT)-美国
三、 参考工具书
相关文档
最新文档