文献信息检索基本原理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.1 文献信息检索的原理和意义
存储过程 文献内容 主题概念 信 息 检 索 语 言 文献特征标志 信 息 检 索 工 具
检索结果
检索过程
检索需求
主题概念
提问特征标志
2.2 检索语言
• 检索语言的概念和作用
检索语言( 检索语言(retrieval language)是一种人工语言,它 )是一种人工语言, 是各种信息组织、存储和信息检索时所用的一种语言。( 。(在 是各种信息组织、存储和信息检索时所用的一种语言。(在 文献信息存储于检索过程中共同使用、 文献信息存储于检索过程中共同使用、共同理解的统一的标 志) 检索语言的作用是标引文献内容、数据和其他信息, 检索语言的作用是标引文献内容、数据和其他信息,把 信息的内容特征及其外表特征简明而有效地揭示出来; 信息的内容特征及其外表特征简明而有效地揭示出来;是连 接标引人员和检索人员的思想桥梁, 接标引人员和检索人员的思想桥梁,是标引人员和检索人员 之间共同遵循的标准语言。 之间共同遵循的标准语言。保证了文献信息存储的集中化和 系统化,并使众多的文献信息高度的标准化、 系统化,并使众多的文献信息高度的标准化、集中化和系统 避免检索的漏检和误检,是有规律的检索成为可能。 化,避免检索的漏检和误检,是有规律的检索成为可能。
2.3 检索系统
• 检索系统概念
为了满足各种各样的信息需求而建立的一整套信息的收 整理、加工、存储和检索的完整系统。 集、整理、加工、存储和检索的完整系统。
• 检索系统的分类
1、手工检索系统 、 由手工检索设备(书本式目录、文摘、索引、 由手工检索设备(书本式目录、文摘、索引、卡片柜 )、检索语言 文献库等构成, 检索语言、 等)、检索语言、文献库等构成,以人工方式查询和提供文 献信息。 献信息。 (1)文献筛选子系统(2)词表子系统(3)标引子系统 )文献筛选子系统( )词表子系统( ) (4)查寻子系统(5)用户与系统间交互子系统(6)匹配子系 )查寻子系统( )用户与系统间交互子系统( ) 统
2.1 文献信息检索的原理和意义
• 文献信息检索的类型
1、按内容划分 、 (1)数据信息检索 ) (2)事实信息检索 ) (3)文献信息检索 ) 2、按组织方式分 、 (1)全文检索(2)超文本检索(3)超媒体检索 )全文检索( )超文本检索( ) 3、 按检索设备分(1)手工检索(2)计算机检索 、 按检索设备分( )手工检索( )
2.2 检索语言
(3)关键词检索语言 ) 出现在文献标题、文摘、 出现在文献标题、文摘、正文中对表达和揭示文献内容 具有实质意义的词语、关键词作为检索语言. 具有实质意义的词语、关键词作为检索语言 它是没有经过规范化处理的自然语言,属非受控语言 (Uncontrolled Language) (4)单元词检索语言 ) 从文献中抽取出来最基本的、 从文献中抽取出来最基本的、不能再分割的单元词语的 一种检索语言。 一种检索语言。 3、代码检索语言 、 对文献所论述事物的某一方面的特征, 对文献所论述事物的某一方面的特征,用某种代码系统 加以描述和标引的语言。 加以描述和标引的语言。
2.3 检索系统
2、计算机检索系统 、 计算机检索系统又称为现代化检索系统, 计算机检索系统又称为现代化检索系统,是利用计算机 技术、电子技术、网络技术等, 技术、电子技术、网络技术等,存储和检索在计算机或计算 机网络内的信息资源的检索系统,存储时, 机网络内的信息资源的检索系统,存储时,将大量的信息资 源按一定的格式输入到系统中, 源按一定的格式输入到系统中,加工处理成可供检索的数据 库。 计算机检索发展概况: 计算机检索发展概况: 世纪50年代中期 年代中期) (1)脱机检索阶段(20世纪 年代中期 )脱机检索阶段( 世纪 年代中期~60年代中期) 年代中期 世纪60年代中期 年代中期) (2)联机检索阶段(20世纪 年代中期 )联机检索阶段( 世纪 年代中期~70年代中期) 年代中期 世纪70年代 年代末) (3)光盘数据库检索阶段(20世纪 年代 )光盘数据库检索阶段( 世纪 年代~80年代末) 年代末 世纪90年代初 (4)网络化检索阶段(20世纪 年代初 今) )网络化检索阶段( 世纪 年代初~今
2.2 检索语言
(3)混合式分类检索语言 ) 既应用概念划分和概念原理, 既应用概念划分和概念原理,又应用概念分析和综合的 原理而编制的分类法。 原理而编制的分类法。 2、主题词检索语言 、 经过选择,用于表达文献信息内容的词语作为概念标志, 经过选择,用于表达文献信息内容的词语作为概念标志, 并将概念标志按字顺排列组织起来的一种检索语言。 并将概念标志按字顺排列组织起来的一种检索语言。 (1)标题词检索语言 ) 经过标准化处理的表达文献所论述或涉及的事物概念的 词、词组或短句作为标志的一种用检索语言。 词组或短句作为标志的一种用检索语言。 (2)叙词检索语言 ) 从文献中优选出来, 从文献中优选出来,经严格规范化处理的名词或名词词 通过组配来标示文献内容或主题的一种标志系统。 组,通过组配来标示文献内容或主题的一种标志系统。
2.2 检索语言
• 叙词(Descriptor)是指描述文献主题内容的规范词。即它 叙词( )是指描述文献主题内容的规范词。 是指从文献内容中抽出来的, 是指从文献内容中抽出来的,能概括表达文献内容基本概念 的并经过规范化的名词或术语。 的并经过规范化的名词或术语。 反坦克地雷” 反坦克武器 反坦克武器” 地雷” 如:“反坦克地雷”—“反坦克武器”和“地雷” 反坦克地雷 高空超音速飞机” 高空飞机 高空飞机” 超音速飞机” “高空超音速飞机”—“高空飞机”和“超音速飞机” 电子计算机” 电子 电子” 计算机” “电子计算机”—“电子”和“计算机” 运输飞机设计” 运输飞机 运输飞机” 飞机设计” “运输飞机设计”—“运输飞机”和“飞机设计” 叙词语言的特点: 叙词语言的特点:规范性和概念性 树林”同义规范为“森林” 如:“树林”同义规范为“森林” 模型(铸造)”“模型 数学) 模型( “模型(铸造)”“模型(数学)”词义规范
(2)组配分类检索语言 )
• 运用概念可分析和综合的原理,将可能构成文献主题的概念分析成为单 运用概念可分析和综合的原理, 元和分面,设置若干标准单元的类表。使用时,先分析标引对象的主题, 元和分面,设置若干标准单元的类表。使用时,先分析标引对象的主题, 根据主题分析的结果通过相应概念类目的组配表达主题内容, 根据主题分析的结果通过相应概念类目的组配表达主题内容,以这些类 目的标志组合,表示该项主题在分析体系中的次序。 目的标志组合,表示该项主题在分析体系中的次序。
2.3 检索系统
信息存储 原始信息 主题 分析 信息主题 检索语言 著录 标引 数据库记录及信息特征标志 计算机 检索结果 信息检索 信息需求 主题 分析 检索主题 选定 编制 检索提问及提问标志
2.3 检索系统
计算机检索的类型 (1)脱机检索(2)联机检索 )脱机检索( ) (3)视频数据检索(4)网络信息检索 )视频数据检索( )
2.1 文献信息检索的原理和意义
• 文献信息检索的原理
文献信息检索的全过程包括存储和检索两个过程 一、 存储过程就是按照检索语言将原始文献信息进行处 为检索提供经过整序的文献信息集合的过程。 理,为检索提供经过整序的文献信息集合的过程。 文献信息的存储包括对文献信息的著录、 文献信息的存储包括对文献信息的著录、标引以及编排 正文和所附索引等。 正文和所附索引等。 文献信息的著录, 文献信息的著录,是按照一定的规则对文献信息的外表 特征和内容特征简明扼要的表述 文献信息外表特征包括文献信息的著者、来源、卷期、 文献信息外表特征包括文献信息的著者、来源、卷期、 页次、年号、文种等。文献信息内容特征包括题名、 页次、年号、文种等。文献信息内容特征包括题名、主题词 和文摘。 和文摘。
2.1 文献Байду номын сангаас息检索的原理和意义
文献信息的标引, 文献信息的标引,就是文献信息的内容按一定的分类表 或主题词给出分类号或主题词。 或主题词给出分类号或主题词。 二、检索过程则是按照同样的检索语言(主题词或分类 检索过程则是按照同样的检索语言( 表)及组培原则分析课题,形成检索提问标志,根据存储所 及组培原则分析课题,形成检索提问标志, 提供的检索途径, 提供的检索途径,从文献信息集合中查找与检索提问标志相 符的信息特征标志的过程。 符的信息特征标志的过程。
2.1 文献信息检索的原理和意义
检索就是根据需要,利用一定的检索工具和检索手段, 检索就是根据需要,利用一定的检索工具和检索手段, 把所需要的文献线索或知识、 把所需要的文献线索或知识、信息从检索系统中查找出来的 过程。 过程。 • 文献信息检索是文献检索和信息检索两个概念的统一 文献检索是信息检索的一种类型,是指依据一定的方法, 文献检索是信息检索的一种类型,是指依据一定的方法, 按照一定方式将文献组织存储在某种载体上, 按照一定方式将文献组织存储在某种载体上,并利用相应的 方法或手段从中查出符合用户特定需要的文献的过程。 方法或手段从中查出符合用户特定需要的文献的过程。 信息检索是指依据一定的方法, 信息检索是指依据一定的方法,从已经组织好的有关大 量信息集合中查出特定的相关信息的过程。 量信息集合中查出特定的相关信息的过程。
第二讲 文献信息检索基本原理
2.1 文献信息检索的原理和意义
• 文献信息检索概念
文献信息检索,是指将信息按一定的方式组织和存储起来, 文献信息检索,是指将信息按一定的方式组织和存储起来, 并根据用户的需要找出有关信息的过程, 并根据用户的需要找出有关信息的过程,即从众多的文献信 息源中, 息源中,迅速而准确地查找符合特定需要的文献信息或文献 线索的过程。 线索的过程。 文献信息检索, 文献信息检索,广义上包括文献信息的存储和检索两个方 面。 存储, 存储,是指对一定数量的揭示文献特征的信息或从文献中 摘出的知识、信息进行组织、加工、 摘出的知识、信息进行组织、加工、整序并将之存储在某种 载体上,编制成检索工具或组织成检索系统。 载体上,编制成检索工具或组织成检索系统。
计算机信息检索的特点 (1)检索途径多(2)新颖性(3)高效性(4)灵活性 )检索途径多( )新颖性( )高效性( ) (5)广泛性 )
2.4 检索工具
• 检索工具的概念和特征
2.2 检索语言
• 检索语言种类
• 1、体系分类检索语言 、 按其所属的学科性质进行分类和排列, 按其所属的学科性质进行分类和排列,以阿拉 伯数字或拉丁字母和数字混合作为类目标志符号, 伯数字或拉丁字母和数字混合作为类目标志符号, 以类目的从属关系表达复杂概念及其在系统中的位 置,甚至还表示概念与概念之间关系的一种检索语 言。 (1)体系分类语言 ) 一种直接体现学科知识分类的等级制概念的标 识系统, 识系统,是通过概括性文献信息内容特征进行分类 的检索语言。 的检索语言。
2.2 检索语言
F 经济 F7 贸易经济 F71 国内贸易经济 F710 贸易经济理论与方法 F711 贸易经济结构、体制 ·1 资本主义所有制 ·2 商业的社会主义改造 ·3 社会主义所有制 ·4 商品调拨 F712 贸易计划于管理体制 …………………………….
选自《中国图书馆分类法》第四版
2.2 检索语言
2.3 检索系统
计算机信息检索的概念与原理: 计算机信息检索的概念与原理: 计算机信息检索是指以计算机技术为手段, 计算机信息检索是指以计算机技术为手段,通过计算机 软件技术、 软件技术、网络和数据库及通信系统等现代检索方式进行信 息检索的,检索过程是在人机的协同下完成的。 息检索的,检索过程是在人机的协同下完成的。 人们在计算机或计算机检索网络的终端上使用特定的检 索指令、检索词和检索策略, 索指令、检索词和检索策略,从计算机检索系统的数据库中 检索出所需信息,然后再由终端设备显示和打印的过程。 检索出所需信息,然后再由终端设备显示和打印的过程。
相关文档
最新文档