第一章 信息检索的基础知识3
科技信息检索基础知识
N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术 U 交通运输 V 航天、航空 X 环境科学
• (2)中图法的标记符号
• 基本标记符号:采用拉丁字母与阿拉伯 数字相结合的混合制表记符号。
• 使用混合制标记符号比纯数字符号容量 大,并且可根据类别的需要灵活使用。 如“T工业技术”大类,范围广泛,内容 繁多,故采用双位拉丁字母标记。
4、世界上比较著名的分类法有:《美国国 会图书馆分类法》、《杜威十进分类 法》、《国际专利分类表》。
• 我国在图书情报系统广泛采用的有《中 国图书馆分类法》(简称《中图法》)、 《中国科学院图书馆图书分类法》(简称 科图法)、《中国人民大学图书馆图书分 类法》(简称人大法)。
5、《中图法》 ➢是目前我国最具有影响的大型综合性文
存储过程
检索过程
文献内容
主题分析 主题概念
文献描述
检索语言
检索需要
主题分析 主题概念
文献描述
检索标识
检索工具 结果
提问标识
二、信息检索的类型
1、信息检索根据检索(查找)对象的不同, 可以分为:
文献检索
事实或数据检索。
➢文献检索:是以文献为检索对象,从已 存储的文献库中查找到的是关于文献的 信息或文献全文。
2、根据检索方式可分为: 手工检索
计算机检索。
➢手工检索即是用人工来处理和查找所需 信息的检索方式。
➢计算机检索是利用计算机和一定的通信 设备查找所需信息的检索方式。
第四节 检索语言及其种类
一、检索语言及其作用
1、检索语言:又称标引语言、索引语言,信息 存储与检索语言。
➢ 即在文献存储时,根据文献内容特征和外表特 征按照一定的语言来表述,检索文献时的提问 也按照一定的语言来加以表达。这种在文献存 储和检索过程中,共同使用、共同遵守的语言, 就是检索语言。
信息资源检索基础知识
第一章信息资源检索基础知识一、填空题1.___________________________是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。
信息2.___________________________是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。
知识3.___________________________ 是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。
情报4.___________________________是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。
文献5.___________________________是指在国内外学术或非学术会议上发表的论文或报告。
会议文献6.___________________________是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。
学位论文7.___________________________是对文献内容和形式特征进行选择和记录的过程。
著录8.___________________________是指特定的数值型数据为对象的检索。
数据检索9.___________________________是指以特定的事实为目标的检索。
事实检索10.事实与数据检索工具主要依靠各类___________________________完成各种数据或事实的查询。
参考工具书11.按照结构原理,信息检索语言可以分为_____________________、____________________、___________________________等多种类型。
分类语言,主题语言,代码语言二、选择题1.下面哪项不是情报构成的三要素之一()。
文献信息检索基础知识
1
可编辑ppt
第1节 文献信息检索的基本概念
一、文献、信息、信息源 1.定义 文献:用文字、图形、符号、声频、视频等技术手段 记录人类知识的一种载体,或理解为固化在一定物质载体 上的知识。
信息:广义地说,信息就是消息。
指对接收者来说预先不知道的报道。(辞海)
是用来通信的事实,在观察中得到的数据、新闻和知 识。(韦氏字典)
10
可编辑ppt
第1节 文献信息检索的基本概念
专利文献(patent document)
专利文献是一切与专利制度有关的专利文件的统称, 如专利申请书和专利说明书、专利公报。
专利说明书是公开的文献,但只能由各国专利局发行, 它反映了当前最新的技术成果。
学位论文(dissertation, thesis) 是作者为获得某种学位而撰写的科学论文。博士论文 具有较高的参考价值: 一般偏重于理论,附有大量的参考文献,借此可以看 出有关专题的发展过程和方向。 学位论文一般不出版发行,而是保存在授予学位单位 的图书馆里。
6
可编辑ppt
第1节 文献信息检索的基本概念
科技图书(Book):对已有的研究成果或生产经验所 作的概括论述。
特点: 带有总结性、成熟定型;出版周期长,信息传 递慢;传授知识,而不是报道最新情报。
图书一般分为两类:
阅读型:教科书、专著等
工具型:字典、百科全书、年鉴、手册
科技期刊(journal, periodic) 特点:名称固定、有连续的卷、年月顺序号、出版周 期短,报道速度快、数量大,内容丰富。 据估计,从期刊获取的科技情报占整个情报来源的 60%-70%。
5
可编辑ppt
第1节 文献信息检索的基本概念
信息检索基础知识
第一章信息检索基础知识一.概述1.信息与文献信息知识的分类:已掌握的知识和需查询的知识。
信息的定义:信息是事物运动的状态与方式,是物质的一种属性,并且借助于一定的物质载体传输和储存。
这里有几个词组需说明:事物:泛指一切可能研究的对象(包括物质的和精神的)。
运动:泛指一切意义上的变化(机械运动、化学运动、思维运动和社会运动)运动方式:在时间上所呈现的过程和规律:运动状态:在空间上所展示的形状和态势。
信息已成为与物质、能量同样重要的三大资源之一。
信息是一种原料,人类接受外界大量信息后,经过实践活动和大脑的思维机制加工提炼后变成有用的知识(知识的认识程度)。
文献:将知识记录并保持在一定的载体上,就形成了文献。
文献信息是文献所表达的内载信息,以文字、符号、声像信息为编码的人类精神信息,也是经过人们筛选、归纳和整理后记录下来的信息。
科技文献是科学技术研究成果的记录,积累了许多有用的事实、数据、理论、方法和科学假设,反映了科学技术研究的进展和水平,是科学信息的主要来源。
2.信息的特点(1)普遍性;信息是无处不在,无时不在的,c从宏观的宇宙天体到微观粒子,从自然界到人类社会,万事万物都是信息的母体;(2)时效性:信息的获得和传送需要时间,信息反映的总是特定时刻事物的运动状态和方式,当人们获得信息后,它反映的是某段时间的事物,是一种历史纪录,如果传递很慢,信息就会失去应有的价值;(3)传递性:指信息的空间和时间效应,信息可以从一个地方传到另一个地方,从一个时期传到另一个时期;信息的传递决定了信息的可扩散性,信息是通过各种渠道、媒介传播和扩散;(4)共享性:信息在传播和使用的过程中,载体本身的信息并不因此而减少,信息资源的共享将极大地推进人类文明的发展;(5)可转换性:信息的物质载体形态是可以相互转移变换的;信息在一定条件下可以转化为物质、能量、时间、金钱、效益、质量等;(6)可伪性:在人们得到信息后,必须进行分析判断和筛选,以便正确享用信息。
医学文献信息检索--第一章 文献信息检索基础
零次文献
一次文献
科技文献层次结构
三次文献(浓缩的新的信息产品) 将知识重新组合,使知识序列化
二次文献(一次文献的替代品) 将分散的文献序列化 一次文献(初始的知识产品) 将知识以文字等形式固化 零次文献(创造知识的素材) 信息的直接记录或传递 研究活动(实验、观察、思考)
3.认识不同载体的文献
印刷型文献:纸质
实例:
中国核科技报告 China Nuclear Science and Technology Report 主办:《中国核科技报告》编辑部 周期: 半年 出版地:北京市 语种: 中英 开本: 16开 ISSN 1671-7430 CN 11-9253/TL 创刊年:1985
主题词检索途径
序号:N2
序号:N1 主题词:S1 著者:Au1 标题:t1 ……
著者倒排档
Au1:N1,N4 Au2:N3 Au3:N4 ……
著者检索途径
……
主文档和倒排文档的关系示意图
其它检索途径
四、文献信息检索系统的分类 1.书目型数据库
2.事实数值型数据库
3.全文型数据库
文献信息数据库
(4)三次文献(Tertiary Document):是科技人员围 绕某一专题,借助于二次文献,在充分研究与利用大量一 次文献的基础上,经过阅读、分析、归纳、概括,撰写而 成的新的文献。 表现形式主要有:综述(Review)、述评 (Comment)、进展(Progress、Advance)、现状 (Update)、发展趋势(Trend)等期刊文献和百科全 书、年鉴、手册等参考工具书。
⑤政府出版物
政府出版物:这是各国政府部门及其设立的专门
机构发表、出版的文件,分为行政性文件(如法 令.统计等)和科技文献(30%~40%)。
信息检索与利用(研究生2015)资料
第三章 中外文数据库的检索
4.4.4 专利的审查制度
(1)形式审查(登记制) (2) 实质审查 (3) 早期公开、延迟审查
中国发明专利的审批流程: 受理申请 →形式审查 →公布申请(自申请日起满 18个月) →实质审查(自申请日起三年内申请人 提出申请) →授权公告
第三章 中外文数据库的检索 4.4.5 专利文献的特点
第三章 中外文数据库的检索
专利数据库的检索 – 知识产权综合信息服务平台(外文专利无全文)
–
万方数据库中的专利技术类数据库,可检
索从1985年至今授理的专利。外文专利无全文。 国家知识产权局 / 不提供全文
信息检索与利用
陈新艳 trans2@
2015年11月
目录
第一章 信息检索基础知识 第二章 计算机信息检索方法
第三章 中外数据库的检索
第四章 网络信息的检索
第五章 科技论文写作与学术规范
第一章 信息检索基础知识
1. 信息、知识与情报 2. 信息检索 3. 文献的类型及其分布 4 检索途径、检索方法和检索步骤
第一章 信息检索基础知识
三、文献的类型及其分布
1. 文献的定义
凡是用文字、图形、符号、声频、视频记录下来, 具有存贮和传递知识功能的一切载体都称为文献。
2. 文献的类型
2.1 按文献的载体形式划分
(1) 印刷型:最基本的、最主要的传统文献 (2) 缩微型 (3) 视听型 (4) 机读形(电子型):发展方向
(1)新颖性 (2)先进性 (3)实用性 (4)广泛性 (5)详尽性 (6)完整性 (7)重复性 (8)时间性 (9)标准性
第三章 中外文数据库的检索
4.4.4.6 专利信息检索 获取专利信息的途径: 期刊、样本、商品、专利文献检索工具 《国际专利分类表》
信息检索复习课件
信息检索(第二篇)天津理工大学信息检索教研中心第一章信息检索基本知识介绍信息检索的基本知识,主要是让大家了解一些文献、信息、检索等常识,初步建立起信息意识。
♦第一节信息的基本知识♦第二节检索的基本知识第一章信息检索基本知识第一节信息的基本知识这一节的中心内容包括:信息、知识、情报信息与文献科技文献种类及特点第一章信息检索基本知识三者的关系信息与知识、文献的关系•信息是知识的基础,知识是信息的核心。
•文献是传播知识与信息的主要手段和途径。
•知识、载体、记录是构成文献的三要素。
•文献是获取信息的重要来源;信息与情报的关系•情报包含于信息,是信息的一部分。
信息知识情报文献第一章信息检索基本知识科技文献种类及特点依出版类型划分•图书、连续出版物、特种文献(科技报告、会议论文、学位论文、专利文献、标准文献、政府出版物、档案、产品样本等)依文献内容加工深度划分•零次文献、一次文献、二次文献、三次文献依文献载体划分•印刷型、缩微型、电子型、声像型(作业10练习总结的一个方面)各种信息源的特点♦书:系统、全面(历史悠久,多用于学习参考)♦刊:动态、量大、内容新、影响广(研究价值高,利用率高)♦报告:新颖、专深、具体(情报价值高、获取成本高)♦会议录:专业、及时、可靠(与科技期刊相似,利用率仅次期刊)♦学位论文:独创性强、水平参差♦专利:新颖、具体、题材广(经济和技术价值不容忽视)♦标准:系统性、指令(指导)性、时效性(可关注阶段性技术底线)♦政府出版物:权威性♦(Internet:综合性、交互性、包容性、即时性)♦一次文献:原始文献,新颖、具体。
如期刊、专利等♦二次文献:工具文献,汇集性、检索性。
如目录、题录、索引等♦三次文献:综述性文献,参考性、可检索性。
如年鉴、手册等♦零次文献:未公开文献,原始、详尽、具体。
如手稿、记录等(所用的方法:比较与分类,归纳与演绎)第二节检索的基本知识这一节的中心内容包括:信息检索检索语言检索工具检索方法、途径和步骤信息检索♦按存储和检索的内容划分–文献检索(过程、方法和策略)–资料检索(数据、数值检索)–事实检索–多媒体检索♦按检索手段划分–手工检索–计算机检索检索工具♦检索工具的形式–按加工程度划分•目录、题录、索引、文摘–参考工具书•百科全书、年鉴、手册、名录、字典、词(辞)典–按收录范围划分•综合性检索工具、专业性检索工具、单一性检索工具♦检索工具的内容结构–编辑使用说明、正文部分、索引部分、附录部分(产品说明书、网站帮助等可以参考此内容结构)检索工具的特点♦目录:以单位出版物为著录对象,按“种”为单位记录与报道。
第一章 文献信息检索基础知识
2. 微缩型
定义:以感光材料为载体,利用光学技术以缩微照相为记录手段,
如缩微胶卷、缩微胶片等。
优点:存贮密度大、体积小,便于保存和远距离传递; 缺点:不能直接阅读,必须借助缩微阅读机才能阅读。
著者
书名
代码
出版地
出版社
出版时间
Horst, R., Pardalos, P. M. 1994, Handbook of global optimization, Kluwer, Dordrecht.
10
(三)文献类型--按文献出版划分:
国际标准书号(International standard book number, ISBN) P7
ultrasound and pulsed-vacuum treatments on the dehydration kinetics, distribution and status of water in osmotically dehydrated strawberry: a combined NMR and DSC study[J],Food and Bioprocess Technology ,2014, 7(10): 2782-2792.
1.图书(Book)
定义:指对某一领域的知识进行系统阐述或对已有研究成果、技术
、经验等进行归纳、概括的出版物。包括专著、汇编、丛书等。
特点:图书的内容比较系统、全面,论点成熟、可靠,但传统印刷 业图书的出版周期较长,传递信息速度慢,电子图书的出版发行可
第一讲文献信息检索基础知识
(三)不同加工层次的文献信息
一次文献
二次文献
三次文献
按文献 的加工 深度分
一次文献
* 作者以自己的研究成果为基础创作或撰写, 并通过某种渠道而公开的文献;
* 对知识的第一次加工;具有创造性; * 大多数期刊论文、科技报告、学位论文、会
议文献、专利文献、技术档案等。
二次文献
* 对一次文献进行浓缩、整序及加工处理而成 的具有报道和检索作用的文献;
报纸
是以报道新闻及评论 为主,出版周期比期刊 更短,多为活页性连续 出版物。其特点是内容 丰富、信息量大、出版 迅速、发行量大、读者 众多。
科技报告
科技报告是科技工作者对科学、技术研究结果或研 究进展的记录。
科技报告的特点
(1)反映新的科研成果迅速; (2)内容多样化; (3)质量参差不齐; (4)保密性强; (5)每份报告独立成册,有连续编号。
第一讲文献信息检索基础 知识
第一节 信息与信息素养 第二节 科技文献的类型 第三节 信息检索与文献检索工具 第四节 信息检索原理 第五节 信息检索的方法和途径 第六节 信息检索常用技术及检索效果评价
第一节 信息与信息素养
一、信息的基本含义
1、图书馆学和情报学领域,信息被定义为事物 或记录。 2、综合学术界对信息的定义,可以认为信息是 以物质介质为载体,传递和反映世界各种事物存 在方式、运动规律及特点的表征。
美国信息产业协会主席保罗 . 泽考斯基(Paul Zurkowaski)1974年在美国全国图书馆与情报学委 员会上,最早提出了信息素养的概念,他把信息素 养概括为:“利用大量的信息工具及主要信息源使 问题得到解答的技术和技能。”
信息素养为什么重要
在科技飞速发展、信息资源激增的当今时代,信息 素养越来越显示其重要性
信息检索学习笔记
信息检索第一章信息检索的基础理论第一节基础概念一、信息概述(一)信息的定义:信息指的是事物的存在方式和运动状态,是对客观世界中各种事物变化和特征的反映,是客观事物之间相互作用和联系的表征,是客观事物经过感知或认识后的再现。
世界三大基本要素:信息物质能量(二)信息的特征1.客观性①信息来源于物质,又不是物质本身;它从物质的运动中产生出来,又可以脱离物质相对独立地存在。
②信息业来源于精神世界,但又不限于精神的领域。
③信息是具体的,并且可以被人所感知、提取、识别,可以传递、存储、变换、显示、检索和利用。
2.普遍性3.可存储性4.可传递性5.扩散性6.共享性7.时效性(三)信息的功能1.经济功能①运用信息可以使非资源转化为资源创造财富。
②使用信息取代劳动力、资金、材料等资源创造财富,实现经济效益倍增。
③直接让信息作为商品在市场流通中创造财富。
④通过信息进行科学决策,减少失误,创造财富。
2.管理与协调功能5M资源:人、财、物、设备、管理办法信息的管理与协调功能在组织活动中的作用:①传递整个组织的运行目的,有效管理5M资源。
②调节和控制物质流和能源流的数量、方向和速度。
③传递外界对系统的作用,保持组织的内部环境稳定。
3.选择和决策功能4.研究与开发功能二、知识1.知识的概念:知识是人类社会实践经验的总结,是人的主观世界对于客观世界的概括和如实反映,是人类对自然界、人类社会以及思维方式与运动规律的认识。
2.知识的类型①显性知识和隐性知识。
②实体知识和过程知识。
③核心知识和非核心知识。
三、情报1.情报的概念:情报是具有特定传递对象的特定知识货有价值的信息。
2.情报的特征①动态性②按特定的方式传递③为特定目的服务的④常常有一定的时效性和机密性3.情报的类型零次情报:私人笔记、手稿、设计草图、会议记录、口头言论等。
一次情报:调查报告、研究报告、科学论文、专利说明书、会议文献、专著等。
二次情报:书目、索引、文摘等三次情报:综述、专题评论、年度总结、研究进展报告、数据手册、专业年鉴等。
网络资源与信息检索(本科)讲课要点与考试重点
网络资源与信息检索(本科)讲课要点第一章信息检索的基础知识讲课要点:一、信息(一)基本概念(P1-2)1、信息:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就成为信息。
2、文献:大凡人类的知识用文字、图形、符号、声频、视频的手段记录下来的东西,统统可称为文献。
也可以称为固化在一定载体上的知识。
3、资料:固化在一定的实物或载体上的知识。
4、信息的传递渠道(二)信息的类型及特点(P4-7)从不同的角度信息可以分为不同的类型1、加工层次(请注意这三者的不同与联系)(1) 一次信息(原始文献)(2) 二次信息(检索工具)(3) 三次信息(参考工具)2、出版形式——图书、期刊、特种文献,结合教材P24-25的内容(请从基本概念、内容特点、著录特点三个方面着重掌握图书、期刊、会议、专利、标准、学位六种类型)3、物理类型——印刷型、缩微型、机读型、声像型4、按信息的性质划分P75、按信息所表征的服务对象划分P7二、信息检索(P2-4)(一)信息检索就是从大量的文献中查寻与信息提问所指定的课题(对象)有关的文献,或者是包含用户所需事实与消息的文献的过程。
它包括三个方面:数据检索、事实检索、文献检索数据检索、事实检索、文献检索三者中以文献检索为主。
数据和事实检索是检索出包含在文献中的具体情报;文献检索则是要检索出包含所需要情报的文献。
(二)文献检索及其类型1、定义:检索系统的建立及检索工具的组织和积累文献的查寻,利用检索工具检出与课题相关的文献。
2、直接检索是从通过阅读原始文献直接获取所需信息快捷、方便漏查率高3、间接检索是通过检索工具的指导再查找原始文献而获取所需信息。
系统、全面滞后? 为什么间接检索是一种更为科学的检索方法?三、检索工具(P8-11)(一)基本概念:按一定的学科、主题等进行搜集整理并给予文献的标志,是及时报道的二次文献,具有报道、存贮、检索的功能。
国开 药学信息检索1-8章自测题和答案
国开药学信息检索1-8章自测题和答案1. 概述国开药学信息检索是药学专业学习的重要内容之一,包含了1-8章的知识点。
本文将针对这些章节的自测题和答案进行讨论和解析。
2. 第一章:信息检索基础第一章介绍了信息检索的基本概念和原理,以及信息检索系统的组织结构和功能。
下面是该章节的自测题和答案:题目1:信息检索是指什么?答案:信息检索是根据用户的需求,在信息资源中查找并获取所需信息的过程。
题目2:信息检索系统的组织结构包括哪些部分?答案:信息检索系统的组织结构包括用户界面、查询处理、文档管理、索引和检索引擎等部分。
3. 第二章:文献检索的基本方法和技巧第二章介绍了文献检索的基本方法和技巧,包括关键词选择、文献数据库的选择和检索策略。
下面是该章节的自测题和答案:题目1:在文献检索中,为什么要选择合适的关键词?答案:选择合适的关键词有助于提高检索的准确性和效率,能够更好地匹配文献数据库中的索引词,从而找到相关文献。
题目2:文献数据库的选择有哪些因素需要考虑?答案:选择文献数据库时需要考虑其领域覆盖范围、更新速度、检索界面和检索功能等因素。
4. 第三章:中文文献数据库的检索方法和技巧第三章介绍了中文文献数据库的检索方法和技巧,包括关键词扩展、引文检索和限定词检索。
下面是该章节的自测题和答案:题目1:关键词扩展是指什么?答案:关键词扩展是在检索过程中通过添加相关的同义词、近义词或拓展词进行检索,以提高检索的全面性和命中率。
题目2:引文检索是如何进行的?答案:引文检索是通过查找某篇文献被其他文献所引用的情况,以发现与之相关的文献。
5. 第四章:英文文献数据库的检索方法和技巧第四章介绍了英文文献数据库的检索方法和技巧,包括关键词翻译、文献类型筛选和高级检索命令的应用。
下面是该章节的自测题和答案:题目1:关键词翻译是指什么?答案:关键词翻译是将中文关键词翻译成对应的英文词,以便在英文文献数据库中进行检索。
题目2:高级检索命令有哪些常用的?答案:常用的高级检索命令包括AND、OR、NOT、NEAR等,在检索过程中可以灵活运用以提高检索的精准度。
信息检索第一章
会议文献的特征:(a)一般带有会议特征的词,如 Conference(会议)、Congress(大会、集会);(b)有主 办会议的机构特征,如Society(团体)、Association (协 会);(c)有会议文献类型的特征,如会前出版的Paper (论文),会后出版的Proceedings(会议录)等等。根据 这些特征,可以判定上述文献来源于会议文献。 • 如: Range-free localization using dynamic hop size computation in wireless sensor networks Tay, Jeffrey H.S. (Department of Computer Science, National University of Singapore); Chandrasekhar, Vijay R.; Seah, Winston K.G. Source: 2006 IEEE International Conference on Industrial Informatics, INDIN'06, 2006 IEEE International Conference on Industrial Informatics, INDIN'06, 2007, p 126-131
二、信息检索的作用
• 1.有利于减少课题的重复研究、提高科 研成功率 • 2.有助于节约时间、提高科研效率 • 3. 是科学决策的必要前提。 • 4.有利于培养复合性、开拓性人才
• • • •
1. 科研中--为科研开路 2 .生产中--新产品开发的向导 3 . 技术贸易中--引进技术的参谋 4 .针对大学生,还要学会利用文献跟踪学 术动态、寻找科研课题、撰写毕业论文、 科技论文,申请专利。
信息检索第一章
信息检索第一章(没有重复标题,直接开始正文)信息检索第一章信息检索(Information Retrieval,简称IR)是指从大规模的、非结构化的信息集合中,快速找到满足用户需求的相关信息的过程。
本章将介绍信息检索的基本概念、原理以及常用技术,并分析其在实际应用中的重要性和挑战。
一、信息检索的概念和原理信息检索是一种通过计算机系统对文本数据进行搜索的技术。
它主要依靠关键词匹配和相似度评估来实现。
用户通过输入查询词(关键词),系统通过对预先建立好的索引进行搜索和匹配,最终返回与用户需求相匹配的文档列表。
信息检索的原理主要包括以下几个方面:1. 文档预处理:对文本数据进行分词、去除停用词、词干提取等操作,以便后续的索引构建和查询过程。
2. 索引构建:将预处理后的文本数据构建成索引,常用的索引结构包括倒排索引、向量空间模型等。
3. 查询处理:对用户输入的查询词进行处理,包括分词、查询扩展、相似度计算等操作。
4. 相似度计算:根据用户查询词和文档的关键词匹配程度、权重等,计算文档与查询的相似度。
5. 结果排序和评价:根据相似度,对返回的文档列表进行排序,并根据评价指标(如查准率、查全率等)评估检索效果。
二、信息检索的技术信息检索涉及多个技术领域,下面介绍其中一些常用的技术。
1. 分词技术:将连续的文本数据切分成单词或短语,是信息检索的基础步骤。
2. 查询扩展技术:根据用户查询词的意图,自动扩展查询词,以提高检索效果。
3. 相似度计算技术:常用的相似度计算方法包括余弦相似度、TF-IDF等。
4. 近似搜索技术:如基于编辑距离的拼写纠错、基于近似匹配的模糊搜索等,提高了检索的鲁棒性。
5. 排名算法:根据文档与查询的相似度,使用不同的排名算法对文档进行排序,以便用户更快地找到相关文档。
三、信息检索的应用和挑战信息检索在各个领域都有着重要的应用,包括互联网搜索引擎、文本分类与聚类、问答系统等。
它为用户提供了便捷、高效的信息查询服务,使得海量的信息得以充分利用。
出版专业实务-初级2020版-第一章-信息检索
东汉许慎编《说文解字》,首创部首编排法 是GB/T 13418-1992确认的汉子排序规则之一
(二)常用排检方法
4. 四角号码法
是GB/T 13418-1992确认的汉子排序规则之一 多用于编排汉语古籍索引
简称“中图法”
5. 中国图书馆分类法
是中华人民共共和国成立后编制的一种具有代表性的大型综合性图书分类法 5个基本部类、22大类
如《全国总书目》《全国报刊索引》
分经、史、子、集四部
6. 四部分类法
《四库全书总目》是四分法的典范
是我国古代图书分类的主要方法
第三节 数字化信息检索(一)是目前全球最大的中文搜索引擎 支持布尔逻辑检索、字段限制检索、短示和繁简中文查询等
一、网络检索工具
截词符号多用“?”或*
四、计算机检索技术与网络信息检索技巧
4. 限制检索 1. 选择核实的检索词
(二)网络信息检索技巧
2. 利用布尔逻辑运算符 3. 使用短语检索进行精确匹配
4. 利用高级检索
第四节 出版工作常用信息的检索方法
(1)利用“正史”艺文志、经籍志
(2)利用政书艺文志、经籍考
1. 古代著述的检索
2. 专业性百科全书:《社会科学百科全书》《中国文学百科全书》《世界历史百科全 书》《科学技术百科全书》《中国烹饪百科全书》《化工百科全书》等
3. 地域性百科全书:《北京百科全书》《黑龙江百科全书》《潮汕百科全书》等
是我国第一部现代大型综合性百科全书
1. 《中国大百科全书》
全书条目按条目标题的汉语拼音字母顺序排列
(二)百科全书的编排方式
条目之间靠参见系统相互联系,交叉而不重复
释文有长至十几万字的,也有仅百余字
大型百科全书的索引往往单独编为一卷或多卷
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§9 网络信息发布推广
课程简介§1 信息检索基础知识
§2 信息检索的工具
§3 科技信息检索
§4 特种文献检索
§5 网络信息资源
§6 网络信息检索
§7 搜索引擎技术原理
§8 中文搜索引擎技术
上机作业:
第2-7周星期三1:30-3:20 电教一层机房
信息检索(多媒体)教程沈固朝著
高等教育出版社
文献检索与利用
华芳著
清华大学出版社
第一章信息检索的基础知识第一节信息意识与信息素质
第二节信息源
文献信息源
电子信息源
第三节信息服务业
⏹国家经济信息系统
⏹信息咨询、中介及调查
服务业
⏹文献服务系统
一.信息意识:
信息意识是人们利用信息系统获取所需信息
的内在动因,具体表现为对信息的敏感性、选择
能力和消化吸收能力。
作为大学生,应具有这样一种信息意识:认识各种信息源的价值和信息机构提供的产品和服务,形成对信息的积极体验;经常注意并搜集各种载体的信息,积极利用包括图书馆在内的各种信息机构的服务,努力扩充知识面,主动地、有意识地去学习基本信息检索技能。
二.信息素质教育:
Information Literacy。
因特网上有500多个专门
的网站,1200万条网络信息涉及这方面的内容。
信息素质被定义为从各种信息源检索、
评价和使用信息的能力,是信息社会劳动者必须掌握的终身技能。
了解和掌握信息组织、检索和分析加工等一些图书馆学、情报学理论知
识和方法对于加强自身的信息素质是非常有用的,是信息素质教育中的一个
重要内容。
信息的来源。
一.文献信息源:
1.文献的涵义:
记录有知识的固态载体。
除了纸质文献外,常见的
其他介质的文献主要有:
●缩微文献;
●音像文献
●磁盘和光盘文献。
2.文献的分类:
①一次文献:是人们对信息进行
首次加工而成的文字记载;
如专著、报纸、期刊等。
这是文献信息源的主要部分,数
量极为庞大,由于在内容上是分
散的、无系统的,因此不便于管
理和传播。
②二次文献:是一次文献特征的汇集;
如书目、文摘等。
通过它们可以很方便地找到一次文献,
或了解一次文献的内容。
③三次文献:从一次文献中汲取重要
内容进行综合和概括而成;
如专题报告、进展、百科全书等。
便于人们高效率地了解某一领域的状况、
动态、发展趋势和有关情况。
3.主要的一次文献:
•期刊
•图书
•报纸•专利文献
全世界新技术的
90%-95%是通
过专利文献公诸
于世。
•会议文献
专业性强、内容新、学术水平高、出版发行较快。
成为了解本学
科领域内的新成果、新理论、新动向、新发现的重要信息源。
•“灰色文献”
非公开出版物;
是企业搜集市场信息的主要来源。
•学位论文
二.电子信息源:
1.数据库:
●信息更新速度快;
动态信息库已达到日更新和时更新
的程度,二次文献库的更新速度也比印
刷型检索刊物快,可按季度或半年更新,
而印刷型检索工具往往要一年;
●检索手段丰富;
由于数据库可以结合各种字段进行检索,其检索途径远比手工检索工具多得多。
这些特点使数据库应用渗透到一切领域,成为储存和传递信息的最有用的工具。
2.网络信息源:
其价值在于其所蕴含的海量的
信息资源和方便快捷的通信方式。
无论在服务内容、方式、广度、效果
和效益等方面,网络信息资源几乎胜过了
以往所有传统的信息资源,成为人们查找
信息的首选目标。
一.国家经济信息系统(SEIS)
由包括中央、省、市、县四个层次的信息中心所构成的纵向系统和由各部委信息机构所构成的横向系统两部分组成。
核心机构:
国家信息中心
二.信息咨询、中介及调查服务业
1.信息咨询服务业:
据抽样分析,每1元咨询费产生8.27元利税,创汇3.19元。
2.信息的中介服务:
主要通过信息交易市场、经纪人来实现的。
3.信息调查业:
调查内容排行榜:
市场销路调查(89.7%)
产品价格及促销调查(86.2%)、
产品包装设计调查(55.2%)、
商品知名度调查(51.7%)、
产品喜好研究(34.5%)、
广告效果跟踪调查(31.0%)、
产品评价的专家调查(27.6%)
广告投放前消费者调查(20.7%)。
私家侦探社以
“商务调查”、
“信息咨询”
为机构名称
三.文献服务系统:
大学生的信息搜集和利用技能
应首先表现在会利用这些文献
服务机构。
美国国家档案馆
明清两代的北京皇家档案库
——皇史宬
1.图书馆:
主要服务:
●阅览服务
●外借服务
●复制服务
●情报服务
①咨询②用户教育
③信息中介
●
视听服务
●科研成果查新服务
●翻译服务
很多图书馆都开设了电子
阅览室或网络查询中心。
举办放映会、报告会、讲座等。
编制题录、索引、简介、摘要
等二、三次文献
●数据库及网络信息服务
2.档案馆:
档案是具有保存价值的历史的原始记录。
档案馆提供档案原件查阅、档案编研服务。
①中央档案馆:
负责管理中央和国家机关的档案;
②第一历史档案馆:
负责管理明清时期形成的档案;
馆址:故宫西华门内,向社会开放。
③第二历史档案:
负责管理民国
时期形成的档
案。
馆址:南京,
向社会开放。
实例:人民英雄纪念碑建设始末(北京市档案馆)
3.专利服务
国家知识产权局网站(),“专利文献检索”系统。