第八章 事实与数值信息检索
事实和数据型数据库
第八章事实和数值型数据库第一节事实和数值型数据库概述在现代化图书馆的电子资源建设中,各种类型数据库的发展已经为图书馆的服务手段带来了飞跃性的变革。
数据库从存储的内容上可分为目录文摘数据库、全文数据库、事实型数据库、数值型数据库。
在图书馆电子资源建设的初期,二次文献数据库曾发挥了全面快速检索文献的作用,是电子资源的主要组成部分。
但随着文献信息的日益膨胀,面对INTERNET 网络信息的纷繁庞杂,用户越来越需要准确、真实、适用、具体、能够直接回答问题的针对性强的信息。
因此以一次信息(包括全文、事实、图形、数值信息)为主的源数据库已经成为数据库发展的主流,并将成为图书馆电子资源的发展重点。
以上几章中着重介绍了学术性文献库,在本章中我们将就另外两种目前具有重要的发展前途的数值型数据库及事实型数据库做一个概述性的介绍。
3.1事实数据库的发展历史如果从利用计算机作数据处理的角度来讲,则处理事实数据要比处理书目数据早得多。
但作为数据集合的数据库来讲,书目数据库的发展要比事实数据库的发展早一些。
最早的数据库是50年代的存于磁带上的书目库。
第一个事实数据库产生于1967年,是由美国Data 公司根据与俄亥俄律师协会的合同建立的俄亥俄法律法令全文库,收录有全美50个州的法律法令。
1968年,美国的Data Resource Inc公司成为第一家重要的数值数据库服务公司。
在70年代初期,事实数据库发展比较缓慢,其速度远远不及文献数据库的发展速度。
但由于事实数据库直接向用户提供原始情报,或经过加工存贮的“纯情报”,比如商业经济方面的数值数据库,直接向用户提供物价、产品规格、产值等方面的数据。
因此,越来越深受用户的欢迎。
自70年代中期以后,事实数据库迅速发展,没过多久其速度便赶上和超过了文献数据库的发展。
据统计,在1975年,欧洲只有51个事实数据库。
但到1985年,则猛增到1063个,平均每两年增加一倍。
1983年,世界数据库的总数为1845个,比1975年增加了38倍。
事实与数据检索
2010-11-22
CALIS建设项目学科馆员培训
1
手册
手册举例 《中华人民共和国资料手册》、《经济工作手 册》、《工程手册》、《农业数据手册》
2010-11-22 CALIS建设项目学科馆员培训 1
类书
类书举例
《北堂书抄》,隋末唐初虞世南撰,是现存最早的类 书。 《永乐大典》 《古今图书集成》,现存最大类书。 《艺文类聚》
2010-11-22
CALIS建设项目学科馆员培训
1
政书
类书是中国古代出现的典志体史书。是专门记载 典章制度的沿革变化和各项政治、经济、军事、 文化制度的演变和发展的书。 类书举例 “三通”
事实与数据检索
版权声明
CALIS三期建设项目享有复制、编辑、推广、 宣传等使用权
2010-11-22
CALIS建设项目学科馆员培训
1
培训目标
让读者了解事实与数据的检索,即主要是参考工 具书资源的检索及其利用 适用于本科生及初涉科研的研究生
2010-11-22
CALIS建设项目学科馆员培训
1
内容提纲
检索途径:条目分类目录;条目汉字笔画索引 ;条目 外文索引;内容索引 CALIS建设项目学科馆员培训 2010-11-22
1
著名百科全书举要 —其他百科全书网络资 源
网址:/ ,它是因 特网上最优秀的百科全书网站之一。它以美国 《简明哥伦比亚百科全书》为基础的免费电子百 科全书检索网站。 网址:/ ,网上优秀的免 费参考工具。
数据与事实信息检索-精选文档
• 其特点: 系统性 概括性 易检性 权威性 查考性
1.2 数字型参考工具书的类型
• 语言性数字工具书
即通常所说的语文词典、是以 普通词汇(与专业词汇相对而 言)为主要收录对象,侧重对 词义本身进行解释的工具书。
• 检索性数字工具书
又称线索性数字工具书,包括书目 数据库、文摘数据库、索引数 据库等。
数据库的使用方法
• 选择所需检索的数据库,将目录层层点开,点 击文章标题,即可浏览全文。 • 一般检索:在数据库主页上方是一般检索的对 话框。第一步选择并输入关键词(有四个检索字 段供选择:文章题目、文章全文、文章作者、文 章关键字);第二步选择数据库;然后单击搜索, 即可检索到所需文章。 • 高级检索:点击“检索中心”即可打开高级检 索界面,“条件选择”中,可进行栏目 (即数据 库)、时间、检索项目(即检索字段)选择;检 索词可用多个,并用逻辑算符相连,进行更为专 指的检索。
2.2 数据和事实型数据库举例
• 中国资讯行 中国资讯行(China INFOBANK)于2019
年在香港成立,是一家专门收集、处理及传 播中国商业、经济信息的香港高科技企业。 INFOBANK数据库已经拥有逾200亿汉字的信 息储备,信息范围涵盖19个领域、198个行业。 是目前全球最大的中文信息提供商之一。访 问网址: chinainfobank 或 bjinfobank( 教育网 镜像)
INFOBANK高校财经数据库系统 主要数据库:
中国经济新闻库 中国统计数据库 中国商业报告库 中国法律法规库 中国上市公司文献库 中国人物库 中国医疗健康库 English Publication 中国企业产品库 中国中央及地方政府机 构库 名词解释库
数据库使用方法
事实与数据的检索
中国年鉴网:
年鉴
常用的热门年鉴有:
《The Europa World Year Book=欧罗巴世界年鉴》 《The annual register : a record of world events =世 界大事年鉴》 《The Almanac of Cyprus 1999》 《中国统计年鉴》 《中国人口年鉴》 《中国经济年鉴》;《中国经济特区开发区年鉴》 《中国教育统计年鉴》;《中国电影年鉴》 《中国年鉴》;《世界知识年鉴》 《美国年鉴》等等。
百科全书
百科全书不同于词典等其他的工具书
词典等是对词语条目进行释义,而百科全书是 对条目作知识的介绍。 百科全书比其他工具书使用更多的图像来辅助 知识的介绍。 百科全书对条目的阐释也比其他工具书详细, 经常分成许多的小标题。
百科全书
百科全书的种类
大百科全书(20卷以上) 小百科全书 百科词典 综合性百科全书:主要以非专业读者为对象 专业性百科全书
名录、指南
人名录:who’s who。是传记资料中的常用工具 书之一。 常用的有:
《Who’s who in the world=世界名人录》
常用学术机构指南:
《世界社会科学机构指南》World Directory of Social Science Institutions 《国际研究中心指南》International Research Centers Directory. 《研究中心指南》Research Centers Directory.
名录、指南
机构名录:Directory。介绍各类机构的现状及职能,如 机构名称、产品及劳务提供等业务范围、负责人、通讯 联系等情况。 常用的有:
《World of Learning=学术世界》; World Learning= 《Directories in print=在版名录》; 《World directory of environmental organizations=世界环境组 织机构名录》; 《Major libraries of the world=世界主要图书馆指南》; 《World list of universities=世界大学名录》; 《Publishers‘ international ISBN directory=国际出版商名录》; 《中国企事业名录大全》; 《中国工商企业名录大全》;
文献检索 数据检索 事实检索
文献检索数据检索事实检索
文献检索是指通过各种检索工具和数据库来查找与特定主题或领域相关的学术文献,包括期刊文章、学位论文、会议论文等。
在进行文献检索时,可以使用一些专门的学术搜索引擎或者图书馆提供的在线数据库,如Google学术、PubMed、Web of Science等。
通过关键词、标题、作者、机构等信息进行检索,以获取相关的文献信息。
数据检索是指根据特定的需求,在各种数据资源中查找、筛选和获取所需的数据。
这些数据可以包括统计数据、实验数据、调查数据等。
数据检索的过程通常涉及到对数据库、数据仓库或者数据集进行查询和分析,以找到符合要求的数据,并且确保数据的准确性和可靠性。
事实检索是指通过各种途径查找和确认特定事件或现象的真实性和准确性。
在互联网时代,人们可以通过搜索引擎、社交媒体、新闻报道等渠道来获取相关的信息和事实,以验证特定事件或现象的真实性。
总的来说,文献检索、数据检索和事实检索都是在特定领域或
者特定需求下,通过各种途径查找和获取相关信息的过程。
在进行检索时,需要考虑到信息的来源、准确性和可靠性,以确保获取到的信息是真实、准确并且具有参考价值的。
事实与数据检索
• 中宏数据库
– 中宏数据库由国家发改委所属的中国宏观经济 学会、中国经济学奖管理委员会、中国宏观经 济信息网等权威机构联合研制。 – 中宏网的优势:有涵盖各个领域的专家网络, 有上传下达国务院、各部委、各省地市的信息 交换网络。
• 网站
中国统计信息网
• CNKI中国年鉴全文数据库
– 中国年鉴网络出版总库是目前国内最大的连续 更新的动态年鉴资源全文数据库。内容覆盖基 本国情、地理历史、政治军事外交、法律、经 济、科学技术、教育、文化体育事业、医疗卫 生、社会生活、人物、统计资料、文件标准与 法律法规等各个领域。
• 国泰安经济金融数据库 – 我校购买的数据库包括: CSMAR系列中国金 融经济数据库(国泰安数据服务中心数据) – 国泰安数据服务中心数据涵盖范围广泛,分类 明晰科学,主要包括公司情况、股票市场、基 金市场、债券市场、期货市场等各类数据。其 数据服务能根据用户的要求,方便快捷的检索 出一系列数据,并能灵活地以Foxpro、Excel、 TXT等格式输出,可供SAS、SPSS等统计软 件和Fortran、C、Pascal等高级语言直接调用。
• CNKI中国工具书网络出版总库
– 集成了近200家知名出版社的3000余部工具书, 类型包括语文词典、双语词典、专科辞典、百 科全书、图录、表谱、传记、语录、手册等, 约1500万个条目,70万张图片,所有条目均由 专业人士撰写,内容涵盖哲学、文学艺术、社 会科学、文化教育、自然科学、工程技术、医 学等各个领域。
广州统计信息网
中华人民共和国中央人民政府门户网站
/
广东省人民政府
事实与数据检索
网址:/ ,网上优秀的免
费参考工具。
2010-11-22
CALHale Waihona Puke S建设项目学科馆员培训 1类书
定义:类书是采辑古典文献资料,按类别或韵母 编排,以供查检引文典故用的工具书。
2010-11-22
CALIS建设项目学科馆员培训 1
百科全书
编排。百科全书收录的各种学科体系内容多以条 目的形式列举,其编排方式有以下几种:
按字顺编排: 这种编排以小条目字顺为序,类似字典的 编排,方便读者快速查找。《简明不列颠百科全书》 属于该编排方式。
按学科的分类体系编排: 该编排以学科分类的大条目为 序,每个条目以专题论文的形式系统全面地介绍这一 条目的相关内容。这类百科全书一般有分析索引进一 步揭示大条目中包含的具体内容,以方便读者的查找 使用。
书后所附的参考书目为各百科全书之冠,可以起到自 学的教育作用。
“学习指南”把条目内容与学校课程联系起来,比较 适合于各种图书馆、学校和家庭使用。
每年出版《科利尔百科年鉴》作为补充本。
2010-11-22
CALIS建设项目学科馆员培训 1
著名百科全书举要 —科利尔 百科全书
科利尔百科全书(Collier’s Encyclopedia, CE),这是一部20世纪新编的大型英语综合性百 科全书,是一部大众化的百科全书。是世界著名 的ABC三大百科全书之C。
事实与数据检索概述 常用检索工具的检索及利用
百科全书、类书、政书 手册 字词典 年鉴 名录 表谱 图录
2010-11-22
CALIS建设项目学科馆员培训 1
事实与数据检索概述
信息检索(共40张PPT)
本将主要内容
信息及相关概念
信息的分类
信息检索
信息检索语言
信息及相关概念
信息(Information)的概念
信息论的创始人克劳德·香农(Claude E. Shannon) 从通信系统理论的角度把信息定义为:信息是用来
消除不确定性的东西 。 控制论的创始人、美国科学家维纳(N. Wiener)
对信息的含义做了进一步的阐述 :信息是人们在适 应外部世界并使这种适应反作用于外部世界的过 程中,同外部世界进行互相交换的内容的名称 。 中国学者钟义信对信息的解释:信息是事物运动的状 态与方式,是物质的一种属性 。
普遍认同的一个概念-- 信息普遍存在于自然界、人类社会和思维领域中, 它是客观世界中各种事物变化和特征的反映, 是客观事物之间相互作用和联系的表征, 是客观事物经过感知或认识后的再现。
优点:存储密度高,,出版周期短、易更新,传递信息迅速,存取速 度快,可以融文本、图像、声音等多媒体信息于一体,信息共
享性好、易复制,识别和提取易于实现自动化
缺点:需借助计算机等先进技术设备才能阅读 此类文献有:电子图书、电子期刊、联机数据库、网络数据库、光盘数据库
二、按加工层次分:
¨一次文献(Primary Document): 通常是指原始制作,即作者以
文献信息的分类
信息的外延是一个纷繁的体系。按照
不同的标准和方法有不同的分类形式
文献分类总示意图
文献信息
此类文献有:电子图书、电子期刊、联机数据库、网络数据库、光盘数据库
检索系统将用户的请求与信息集合按中的加信工息进层行匹次配分运算,再将命中信息反馈给用户。按出版类型分
按检索对象的性质划分:事实检索、数据检索、文献检索 可检索(检索技术、规则等)
事实与数值型数据库资源检索
第四章事实与数据型数据库资源检索数据检索有广义和狭义之分。
事物除了质的规定性外,还有量的规定性,随着人类认识的发展,量作为事物的一个基本特征逐渐脱离了事物主体而形成一个独立领域,即各种数值,人们对各种数值需求的查询便构成了数据检索。
这里的数据是指进行各种统计、计算、科学研究或技术设计等所依据的数值,它包括两种类型:统计数据和科学数据。
统计数据是指人类社会和自然现象中各种事物的定量表述,科学数据是指各个领域中所用的参数、常数、理论数据、分子式、公式、产品规格、国家颁布的技术标准和施工定额等。
狭义的数据检索是利用相关的检索工具或检索系统查询有关数据,以获得某一问题量化的准确数值。
而在计算机技术中,通过编码输入到计算机中由计算机处理的所有字符都是数据,因此一切经过计算机处理的事实都称数据,广义的数据检索是指利用检索工具或检索系统查询一切经过计算机系统处理的内容,以获得对某一问题的解答。
在计算机检索系统中,事实检索与数据检索是同一关系。
在本章中,数据检索取狭义的解释。
事实检索是指在检索工具或检索系统中查询有关事件或实在情报,以求得对某一问题的解答。
如查事物的性质、定义、原理,查人物机构情况,查某事件发生的时间、地点、经过等。
数据和事实检索是要检索出包含在文献中的信息资源本身,是一种确定性检索,主要利用参考工具。
4.1 参考工具书4.1.1 参考工具书的定义与特点(1)定义参考工具书指能为读者提供各种所需的具体资料的工具书。
参考工具书按特定的方式汇编某学科或某范围的知识或资料,有的还附录了数量不等的备检资料以方便用户查检数据和事实信息,大都以图书的形式出版,属于三次文献,但在内容与编排方面,与普通图书有本质的区别。
(2)特点①知识性。
参考工具书在内容上具有信息密集的特点,涉及范围广泛,汇集了原始文献中有价值的数据事实。
它是在大量原始资料的基础上,对知识进行分类、整理、提炼、加工、浓缩和重组而形成的一种检索工具,内容较成熟、准确、可靠,本身便可提供用户所需的信息。
信息检索概念
(4)网络检索(Internet Retrieval)
1.2.1信息检索系统的概念
信息检索过程的实现要依靠特定的系统,这个系统就是信息检索系统。系统是由两个或两个以上既相互区别又互相影响的各种要素构成的统一整体,信息检索系统的构成包括六个要素:
(1)目标
联机检索系统也称国际联机检索系统,通常采用相对封闭的客户机/服务器模式,属于典型的主从式结构。如图1-3所示,联机检索系统通常由联机检索中心、通信设施、检索终端3个主要部分组成。
联机检索系统的特点是:
①检索范围广,数据库数量多,几乎涉及到各个学科领域,世界上公开出版发行文献的90%都可以通过几种主要的联机检索系统查到。
因此文档信息检索过程实际上涉及文档集的逻辑表示、用户查询表示、相似性匹配及其排序三个重要的处理。
信息检索模型主要从两个方面抽象地研究信息检索方法:一是确定在检索模型中如何表示构成检索系统的两个要素,即文档和检索式;二是确定在模型中如何定义和计算文档和检索式之间的关系。
检索模型的重要作用主要体现在以下几个方面:更精确地描述出文档与文档、文档与查询间的相关关系,使之能比较和计算;安排更合理、更便于检索的文档存储形式;在此基础上设计出合理的检索方
(5)方法
(6)人员
由此可见,信息检索系统由若干个相互作用的部分构成,各部分的功能互异,设计的目的也各不相同,但它们之间相互联系,共同实现系统的目标。狭义地讲,这个目标就是检索信息;广义地讲,则是提升用户的知识水平。通常认为,信息检索系统的任务是告知用户他所需要的信息在哪里。也就是说,信息检索系统并不告诉用户他所询问的主题(即不改变用户的知识结构),它只是告诉用户这一主题是否存在于数据库中,相关的文献都存在哪里。
《数据与事实检索》课件
VS
详细描述
学术论文的数据与事实检索需要关注学术 论文的质量、学术声誉和学术道德。在进 行学术论文的数据与事实检索时,需要使 用专业的学术搜索引擎和数据库,如 Google Scholar、PubMed等,以及学 术机构和图书馆提供的资源和服务。
案例三:社交媒体的数据与事实检索
总结词
社交媒体的数据与事实检索主要涉及社交媒 体平台上发布的数据和事实的获取、引用和 核实。
05
数据与事实检索的未来发展
数据与事实检索技术的发展趋势
自然语言处理技术的进步
随着自然语言处理技术的不断发展,数据与事实检索将更加智能 化,能够更好地理解用户需求,提供更准确的结果。
语义网和知识图谱的应用
语义网和知识图谱技术的发展将有助于数据与事实检索更深入地挖 掘和呈现信息,提高检索的精度和广度。
对比多个检索结果,综合分析信息, 确保获取的数据和事实准确可靠。
排序和筛选
利用排序和筛选功能,将检索结果按 照相关性、时间等进行排序和筛选。
04
数据与事实检索的案例分析
案例一:新闻报道的数据与事实检索
总结词
新闻报道的数据与事实检索是数据与事实检索中常见的一种类型,主要涉及新闻报道中 的数据和事实的获取、核实和引用。
详细描述
社交媒体的数据与事实检索需要注意社交媒 体平台的可信度、用户声誉和内容质量。在 进行社交媒体的数据与事实检索时,需要使 用专业的社交媒体搜索引擎和工具,如 Twitter Advanced Search、Facebook Graph Search等,以及关注权威人士和媒 体的发布。
案例四:政府公开数据的检索与分析
政府管理
教育培训
政府机构可以利用数据与事实检索技术更 好地收集、整理和分析数据,提高政府决 策的科学性和透明度。
网络检索课件 第8章 数据与事实型信息的网络检索
20
返回目录
8.2.1 数据与事实型数据库的定义、类型和特点 数据与事实型数据库的定义、
2. 数据与事实型数据库的类型
(4)手册(Handbook) )手册( ) 手册是汇集某一范围内基础知识和基本数据资料,以 便于人们在生产、科研、教学等具体工作过程中可经常查 证的实用便览型参考工具。手册的内容侧重于准确的数据、 表格、图形及公式等,并配有简要文字叙述,具有类目分 明、篇幅短小、实用性强等特点。 手册种类繁多,使用目的和使用对象也不尽相同。常 用的手册按其收录材料的侧重点大致可分为数据性手册、 设计手册、基本知识手册、产品手册、综合性手册5大类。
参考工具书主要由说明、目录、正文、附录和索引4部分组成。 (1)说明 ) 说明包括序跋和样例,序跋说明工具书的编篡宗旨、编篡过程、收录 范围、内容特点和使用价值等,置于书前称为“序”,置于书后称为 “跋”。样例则介绍工具书的编排体例和使用方法。 (2)目录 ) (3)正文 ) (4)附录和索引 ) 附录的作用是补充一些必要的知识,帮助理解正文,使分散在正文中 的知识系统化、条理化。附录通常包括大事记、计量单位换算表、人 名或地名译名表、年代表等。由于工具书正文只能按照一种方式编排, 即只提供一种检索途径,为增加检索途径以便从多个角度进行查找, 工具书后多附有各种索引,如别名索引、主题索引等。
1. 参考工具书的种类
参考工具书一般包括字典、词(辞)典、百科全书、年 鉴、传记资料、手册、名录、指南、表谱、图录、资料汇编 等。它们种类繁多,编排方式和用途也各不相同。
7
数据与事实型信息的网络检索
返回目录
8.1.2 参考工具书的主要类型、结构和排检方法 参考工具书的主要类型、
2. 参考工具书的结构
事实检索与数据检索
数据与事实检索的特点:
* 具有检索目的的唯一性。 * 具有检索结果的准确性。 * 具有检索手段的特殊性
参考工具书
著录大量具体而常用的科学 数据与事实,以备查用的工具书。 进行事实检索和数据检索 的工具
参考工具书的类型
从内容上分:综合性、专科性; 从功用上分:词典、百科全书、年鉴、手册、 名录、指南、表谱、地图集、 传记资料、地理资料等。
二、百科全书
1、定义
百科全书是汇集人类一切学科门类 (或某一学科门类)全部知识的最完备的 工具书。它包罗全部学科(或某一学科、 或几个学科)的基本知识和重要研究成果。 对每一种学科提供定义、原理、方法、历 史及现状、统计、参考文献等多方面的资 料。
2、特点
(1)知识详尽系统
(2)编者众多、编辑时间长
四、手册
1、定义: 汇集人们经常需要查考的文献资 料,以供随时查检的工具书。
2、特点: 以图表、数据为主,并附简要的 文字说明。正文之前通常有目次表, 正文之后有相关索引。出版形式灵活、 内容广泛、品种繁多。
3、类型 根据手册所选内容的不同,手册一 般可以分为综合性手册和专业性手册
其中,专科性手册可分为: (1)基本数据手册,如:《物理学手 册》、《数学手册》等; (2)基本知识手册,如:《焊接手册》、 《激光手册》、《网络互联故障排除 手册》等; (3)设计手册,如:《机械设计手册》 等; (4)产品手册,如:《使用新药手册》、 《电子器件数据手册》等
第一宇宙速度 词典
第 一 宇 宙 速 度
科学出版社名词室合编. 物理学词典 上、 下第3分册 力学【M】. 北京:科学出版社, 1988.12
综合词典
兼收社会科学、自然科学和工程 技术等各科名词和一般词语。例如: 《辞海》、《辞源》等。 在《中图法》的分类时,放入综 合类Z3中 例 《辞海》Z32 《辞源》Z32
数据与事实检索
书目与索引(Bibliography and Index)
《美国大学词典》(American College Dictionary) 《简明牛津词典》(The Concise Oxford Dictionary of Current English,简
称COD) 《韦氏新版大学词典》(Webster’s Ninth New Collegiate Dictionary) 《韦氏新世界美语词典》(Webster’s New World Dictionary of the American
《科利尔百科全书》(Collier’s Encyclop国不列颠百科全书公司合作的版本 全书共20卷,1-18卷为条目正文,19-20卷为索引
年鉴(Almanacs,Yearbooks,Annual)
著名的年鉴
《世界年鉴》(The World Almanac and Book of Facts) 《联合国年鉴》(Yearbook of the United Nations) 《联合国统计年鉴》(United Nations Statistical
年表或表谱
年表或表谱是按照时间顺序记录大事的参考工具。主要有:
历史年表 自然科学年表 社会科学年表 反映某一领域特定事物的年表 政治人物年谱 科学家与作家年谱
图集(图录、图鉴、图谱、地图)
图鉴或图录是按照分类,汇集一系列图片以及简要文字说明,直观地反 映事物的工具书。包括地图集、历史图谱、文物图谱、人物图谱、艺术 (主要是绘画、雕塑作品)、科技图谱等。
事实型数据库
基于 Wiki 技术的内容开放的知识库
5 网上免费数据库-年鉴 统计资料(4)
国家统计局 http:∥ 由中华人民共和国国家统计局和中国统计信息网共同制作。包括统 计动态、数据经纬、分析预测、法规制度等栏目 ,提供了国际统计年鉴 1996~ 2000年和中国统计年鉴 1996~2000年的年度数据、普查数据、 经济快讯、地方统计数据、统计法规、统计制度、统计标准、统计指标 等信息。该站点提供链接和检索功能。 浙江统计信息网 /
资源:中国千余种报章与期刊及部分合作伙伴,经
济专家及学者提供的专业信息内容,涉及19个领 域,194个行业。
3.4 中国资讯行(CHINA INFOBANK) 数据库(2)
简 单 检 索 界 面
• 检索举例1: 2000--2007年中国石油进口量
3.4 中国资讯行(CHINA INFOBANK) 数据库(3)
建设与维护:北京国研网信息有限公司、 国研信 息科技有限公司的控股子公司。创建于2001年4 月。
资源:以国务院发展研究中心的信息资源和专家 阵容为依托,整合中国宏观经济、金融研究和 行业经济领域的专家资源及其研究成果,并与 海内外众多著名的经济研究机构和经济资讯提 供商紧密合作,提供经济信息资源。
该网站设有浙江省情、统计数据、统计信息、统计公布、统计法规 等栏目,有地区生产总值、工业、农业国内贸易、财政金融、物价、居 民家庭收入等方面的最新统计数据。
中国科技统计 / 可检索有关科技统计数据
5 网上免费数据库-字典、词典、新
闻(5) 词霸在线 由金山公司推出 ,以现代英汉词典、现代英汉综合大词典、简明英汉词 典等为基础,是一个便捷的英汉、汉英、汉汉、日汉在线查词工具。
由彼得森公司出版的美国、加拿大大学和研究生院名录。
第8章 数据与事实信息检索
即通常所说的语文词典、是以 普通词汇(与专业词汇相对而 言)为主要收录对象,侧重对 词义本身进行解释的工具书。
• 检索性数字工具书
又称线索性数字工具书,包括书目 数据库、文摘数据库、索引数 据库等。
• 参考性数字工具书
包括数字型电子百科全书、类 书、年鉴、手册、专业辞典、 表谱、图录等等。这类数字型 工具书的共同特点是直接为读 者提供具体的知识与信息。
通的双向超文本链接,极大拓宽法律从业人士的参考领域。
• 修订沿革:通过对我国法律、法规的历次修订及相关法条异动 修订沿革:
情况的梳理,用户可回溯某条款的历史变动及相关法规、案例、论文 等资料。让用户在检索过程中,能综观法律的历史演变、把握法律变 革的脉搏。
• 英文法条(*需另购中英文在线数据库):英文法条是新开发的法
数据和事实型数据库的类型
• 从学科领域角度可以 将数据和事实型数据 库划分为 ——
事实数值型科学数据库 社会科学或综合参考类数 据库 商情数据库
• 从具体内容和编排体例 角度又可将事实型数据 库划分为 ——
百科全书、字(词)典 组织机构名录(指南) 传记资料 年鉴(统计资科) 手册 图像(图录/图谱) ……
• 翻译中心(/)依托先进的计算机智能翻译系统和专业的翻
译队伍,提供英语、日语、韩语、法语、德语、意大利、西班牙语等语种的翻 译;翻译领域涉及通讯、经济、法律、贸易、机械、化工、医学、文艺 等40余 种专业。包括在线各种语言的互译,在线词典、短语、句子的翻译,网页的翻 译等。
国研网主页
中宏网
中国宏观经济学会、中宏基金等机构共同发起,是 具有政府背景的宏观经济专业网站。 中宏网充分发挥其政策资源优势和专家优势,利用 中国宏观经济学会及中国宏观经济专项奖励基金学 术委员会的独特信息资源和专家资源,建构英特网 上的权威思想库和信息库,为各级政府研究决策部 门、 经济理论和实务工作者、中外投资者、企业和 个人提供多层面、人性化的特色服务。 中宏网还拥有专家长期积累的研究资料所建成的 “中宏研究数据库”,已涉及宏观形势、经济政策、 金融、产业、外资、统计等18大类,70余小类,目 前已有约20亿字。
源信息数据库事实与数据检索
支持对文本内容进行全文检索,提 高查全率和查准率。
03
02
嵌套查询
支持嵌套查询语句,实现更复杂的 检索逻辑。
语义检索
基于自然语言处理和语义分析技术, 实现更智能的检索功能。
04
检索结果排序与展示
排序方式
支持按相关度、时间、字段值等多种方式对 检索结果进行排序。
高亮显示
对检索结果中的关键词进行高亮显示,提高 用户阅读体验。
3
透明数据加密
在不影响数据库性能的情况下,实时加密数据库 中的敏感数据,防止未经授权的访问。
访问控制策略设计
01
基于角色的访问控 制(RBAC)
根据用户的角色分配不同的访问 权限,实现对数据库资源的细粒 度控制。
02
基于属性的访问控 制(ABAC)
根据用户、资源、环境等属性制 定访问控制策略,提供灵活且强 大的访问控制能力。
02 源信息数据库构建
数据来源与采集
多种数据来源
包括政府公开数据、企业公开数据、网络爬虫抓取数 据等。
数据采集技术
运用网络爬虫、API接口等技术手段,从各种来源高 效采集数据。
数据质量评估
在采集过程中对数据进行初步的质量评估,确保数据 的准确性和完整性。
数据清洗与整理
数据预处理
对采集到的数据进行去重、去噪、格式转换等 预处理操作。
本章节旨在介绍源信息数据库的 背景、目的以及在实际应用中的
重要性。
数据库简介
源信息数据库是一种集成了多个数据源的信息存储系统,能够对数据进行 清洗、整合和转换。
数据库通常包含结构化数据和非结构化数据,如文本、图像、音频、视频 等。
源信息数据库具有数据量大、更新快、安全性高等特点,需要专业的数据 库管理系统进行维护和管理。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在线字典、 在线字典、词典
• 韦氏词典
查词语的英文解释、同义词、 查词语的英文解释、同义词、反义词
• TheFreeDictionary /
在线字典、 在线字典、词典
在线字典、 在线字典、词典
事实和数据检索的含义
• 文献检索是一种相关性检索,获得的一般 是文献线索或者文献本身,我们在获得结 果后需要进一步阅读分析才能为我们所用。 而数据和事实型信息检索获得的结果是具 体的事实和数据等信息原始资料,可以直 接利用,是一种直接的确定性检索。 • 以检索学术文献为例,事实检索是要检索 出包含在文献中的具体信息;文献检索则 是要检索出包含所需要信息的文献。
在线百科全书
• 维基百科
在线百科全书 /
其他在线字典、词典
• • • • • • • • • • • 新华字典 / 海词词典 金山词霸在线翻译词典 /index.php FOLDOC计算机词典 / TigerNT / AmosWEB / 牛津英语在线词典 多语种翻译词典 / Your dictionary / 吕氏网上词典: 人物传略辞典 Biographical Dictionary /
《不列颠百科全书》 不列颠百科全书》
英文网站:
《美国百科全书》
• Encyclopedia Americana,简称 ,简称EA
– 它是美国出版的第一部大型综合性百科全书。在英 语百科中,论其内容的权威性仅次于《不列颠百 科》,为著名英语三大百科全书A、B、C中之A。 – 于1829-1833年问世,由美国四大百科出版商之一 Grolier公司出版,到现在已有170多年历史。 – 虽称“国际版”,但内容仍不免偏重美国和加拿大 的历史、人物和地理资料; – 内容范围偏重历史、地理和传记,约40%的条目是 传记,20%是地理。收有许多在其它百科中找不到 的美国古今人物。有历史意义的文献收录较丰富, 如“美国宪法”、“独立宣言”、“奴隶解放宣 言”、“华盛顿告别辞”等。 – 历史分世纪设条,给读者以全世界政治、社会和文 化的世纪总览,提供完整的历史背景情况。
事实和数据检索工具
• 所谓事实型检索工具 事实型检索工具,指广泛汇集某一领 事实型检索工具 域的文献信息,如名词术语、事件、人名 信息、地名信息、机构信息、产品信息等, 按一定方法编排,专供检索有关事实信息 和解难释疑的工具。如百科全书、年鉴、 手册、表谱、图录、名录等检索工具。
事实和数据检索工具
参考工具书
• 工具书的结构: 工具书的结构:
除普通图书的各要素外,工具书通常由以下六 部分构成: 1.序、跋(前言) 2.凡例(排检方法、著录规则、注意事项等) 3.目录 4.正文 5.辅助索引; 6.附录
参考工具书
• 类型(按出版方式分): 类型(按出版方式分):
–印刷型:是指以解释事实与数据为目的,以经 过组织的知识要点或数据图表为内容的出版物, 是图书的一种类型。常用的有:字、词典;百 科全书;年鉴;手册;名录等。 –电子型:指印刷型参考工具书的电子版本。如: 电子化字(词)典、辞典、电子百科全书、电 子手册等。 –网络版
事实和数据检索的含义
• 广义的事实检索既包括数值数据的检索﹑ 算术运算﹑比较和数学推导,也包括非数 值数据 (如事实﹑概念﹑思想﹑知识等) 的检索﹑比较﹑演绎和逻辑推理。 • 事实型信息检索 事实型信息检索:是以特定的事实为检索 目标,通过文献档案或参考工具书直接或 经分析综合得出事实或知识性的答案。 • 数据型信息检索 数据型信息检索:是以数据、图表、参数、 公式等为检索目标,利用有关参考工具书 进行检索的过程。
事实与数据信息检索
第二节 常用参考工具书简介
字典、词典 字典、
• 字典:是汇集单字,主要解释字的形体、读音、 含义及其用法,并按照一定方法编排,以便查阅 的工具书。 • 词典:是汇集词语,解释概念、词义和用法,并 按一定方式编排,供查检的参考工具。 • 字典词典一般包括正文、辅助说明、目录索引和 相关说明组成。字典、词典的正文一般按音序字 母或字顺排列;辅助说明可以了解该字典、词典 的编制目的、使用对象、取材范围、编排方法; 目录索引主要是方便查检;字典、词典后面附的 参考资料对事实、数据检索很有参考价值。
在线字典、 在线字典、词典
• 知识辞典 :/
在线字典、 在线字典、词典
• OneLook词典 :/ 词典
选择“ 选择“Find definitions”,得到含有该词定义的在线通用词典及专业词典列表; ,得到含有该词定义的在线通用词典及专业词典列表; 选择“ 选择“Find translations”,得到含有该词译文(其他语言)的在线通用词典及 ,得到含有该词译文(其他语言) 专业词典列表。支持通配符“*”、“?”。 专业词典列表。支持通配符“ ”
• 数值型检索工具 数值型检索工具,则指能够提供各类数值 信息(如各种科学数据、人口数据、管理 数据、金融数据、财政数据、商业数据等) 的检索工具,它们是进行各种统计分析、 定量研究、管理决策和预测的重要工具。 如各类统计年鉴、统计资料汇编和统计数 据库等。
参考工具书
• 概念: 概念:
是指根据人们的需要,把某一范围的知识或资 料加以分析、综合或浓缩,并按一定的排检方 法编排,以备查阅、参考,用以解决有关事实 和数据方面的检索工具。 • 主要包括:词典、百科全书、年鉴、手册、名录、 表谱、图录等。 • 查考性、概述性、易检性
参考工具书
• 特点: 特点:
(1)内容广泛、叙述扼要、概括性强、注重简明易 检的编排方式。 (2)编排方式有:字顺、分类。还有的按时间,如 历史年表;按地区,如地图集; (3)一般工具书在正文后都有索引,提供多渠道的 检索入口,如著者索引、书名索引,主题索引。 编制的索引越多,查找越方便。 (4)一般排列法包括字顺(alphabetical)和主题 (subject) 两种。
《科利尔百科全书》
• Collier’s Encyclopedia,简称 ,简称CE
– 这是一部20世纪新编的大型英语综合百科全书,为 著名的三大百科全书之C。 – 收录范围不象AE那样强调美国历史、人物、科技 等,而注重各科知识的综合平衡;适合于非专业人 员、青年学生、家庭使用和阅读的百科全书。 – 适用对象广泛;材料新颖及时;书后所附的参考书 目为各百科全书之冠,起到追溯研究的作用。 – 条目设计针对学校的课程,在物理学、生命科学、 地学、社会科学和人文科学方面提供了丰富的资料, 但深度和广度不如EB和EA。EC注重事实,理论性 阐述较少。
字典、词典 字典、
• 常用的有:《新华字典》、《汉语大字 典》、《古汉语常用字字典》、《中华大 字典》、《现代汉语词典》、《汉语大词 典》、《汉语成语大词典》、《牛津英汉 双解词典》、《汉英大词典》等。
《现代汉语词典》 现代汉语词典》
• 中国社会科学院语言研 究所词典编辑室编 • 特点是无论收录字、词 还是注音释义,都以现 代汉语为基本范围。 • 该词典以推广普通话、 促进汉语规范化为宗旨。
百科全书
• 类型:
按收录范围可分综合性、专科性百科全书; 按地区范围分国际、国家与区域性百科全书; 按读者对象可分成人、青年、少年、儿童百科全书;
百科全书以其释疑解惑的工具书功能以及全 面系统地提供知识的教育功能,我们可以利用百 科全书查阅各学科的概述、专名、术语、世界各 国的人物、历史、地理、团体、机构等等,成为 人们求学的“无墙大学”和“精细图书馆”。
《中国大百科全书》 中国大百科全书》
《不列颠百科全书》 不列颠百科全书》
• Encyclopedia Britannic ,简称 简称EB
–又称《大英百科全书》,是当代世界上声誉最高、 最有权威性的大型综合性百科全书之一,号称百科全 书之王。为著名英语三大百科全书A、B、C中之B。 – 该书原由英国不列颠百科全书出版社出版,现由位于 美国芝加哥的Encyclopaedia Britanniaca Inc出版。 – 由世界各国、各学术领域的著名专家学者(包括众多 诺贝尔奖得主)为其撰写条目。该书囊括了对人类知 识各重要学科的详尽介绍,和对历史及当代重要人物、 事件的详实叙述,其学术性和权威性为世人所公认。
百科全书
百科全书(Encyclopedia),来源于希腊文,约有 2000年的编纂历史了。目前全世界出版的大型综合性 的百科全书已有200多种。 • 定义:概述人类一切门类知识或某一学科知识的 完备的工具书。 • 内容:包括各学科或某学科的基本知识和重要研 究成果,对每一学科提供定义、原理、方法、历 史和现状、统计、书目等多方面的资料。被誉为 “工具书之王”。 • 特点:概述性、完备性、权威性
湖 北 经 济 学 院
Hubei University of Economics
事实与数据信息检索
本章主要内容
• 事实与数据检索概述 • 常用参考工具书简介 • 事实与数据检索方法
事实与数据信息检索
第一节 事实与数据检索概述
事实和数据检索的含义
• 根据检索对象形式的不同,信息检索可以 分为:文献型信息检索、事实型信息检索 和数据型信息检索。 • 文献型信息检索:是以文献为检索目标, 文献型信息检索 利用题录、索引、文摘等有关文献检索工 具,从存贮的文献集合中查找出所需特定 文献的过程。
《中国大百科全书》 中国大百科全书》
• 该书是我国第一部具有权威性大型综合百科全 书。 • 1978年开始编纂,1993年出齐。 1978年开始编纂,1993年出齐。 年开始编纂 年出齐 • 全书74卷(正文73卷,总索引1 全书74 74卷 正文73 73卷 总索引1 ),总条目77859条 总字数1.2 总条目77859 卷),总条目77859条,总字数1.2 亿多。全书有66个学科和知识门类, 66个学科和知识门类 亿多。全书有66个学科和知识门类, 对有关中国的内容作了比较充分、 对有关中国的内容作了比较充分、 权威的反映; 权威的反映;自然科学和技术方面 的内容所占比重较大字典、