第二章:信息检索与整理

合集下载

第二章 信息检索

第二章 信息检索

2.检索技巧和提示
(1) 广泛浏览数据库 进入数据库前,需阅读数据库的说明,包括:出版、结构(权威性),出版类 型(期刊、会议、报告、专利…),文献类型(全文、文摘、题录…),收集年限,使 用权限,文献版本,服务方式(光盘、联机、专线、镜象、出国),连接方式,帐 号、密码,咨询联系等。现在许多数据库被组织到信息服务中心的web网页 上,并提供了有关介绍,应当充分地利用它们。
(1)积木型 积木型检索策略的含义是:把检索课题剖析成若干个概念面,先分别 对这几个概念面进行检索;在每个概念面中尽可能全和多地列举相关词 、同义词、近义词,并用布尔算符OR连接成子检索式,然后再用布尔算 符AND把所有概念面的子检索式连接起来,构成一个总检索式。 优点是:能够提供较明确的检索逻辑过程,以后容易检索和理解,还可 部分或全部地用作保留检索。一般地,“积木型”策略用于较复杂的检 索课题。 • 如“肺癌”与“吸烟”可以分成两个概念面,这两个概念面的各种形式 的检索词有: cancer smoker(s) • • carcinoma lung(s) cancer smoking cigar
(二)截词检索
截词检索:是指在检索时使用词的一个局部(某些 位置上的字符被截去)进行检索匹配,并认为凡满足这 个词局部中的所有字符要求的记录,都为命中结果。 截词检索需要使用专门符号(截词符),以指定截词 的具体位置与截断字符的数量。 • 按照截词位置的不同,截词检索分为: 右截词、左截词和中间截词三种。 例如:检索式 “wom?n”可检索到含有woman、women的结果。 截词检索实际上是一种隐含“逻辑或”的运算,能提 高查全率,扩大检索结果,是防止漏检的有力手段。
第二部分事实与数据检索工具
讨论事实、数据资源检索,其检索的对象是大量的、 常用的那些具体的科学技术数据和事实,如物理量、 物质特性、参数、规格等技术数据以及价格、产量、 公司名录、人名录等商业、经济等各种实用信息。 它们的检索工具包括:百科全书、年鉴、手册、词 典、机构指南和人名录、书目及书目指南等参考工 具。

第2章-信息检索模型

第2章-信息检索模型
▪ N: 文档集中文档总数
▪ 反文档频率用词项区别文档
例如:文档总数为1000,出现关键词k1文档为100
篇,出现关键词k2文档为500篇,出现关键词k3
文档为800篇
N=1000, n1=100, n2=500, n3=800
根据公式: idfi = log(N/ni) ,可计算出
idf1= 3 - 2 = 1
这里q dnf是提问式q旳主析取范式。可进一步简化表
达 为: q dnf =(1,1,1) or (1,1,0) or (1,0,0)
其中: (1,1,1) or (1,1,0) or (1,0,0)是q dnf旳三个合取
子项qcc,他们是一组向量,由相应旳三元组(k1 , k2 , k3)
旳每一种分量取0或1得到。
▪ 根据关键词旳出现频率计算相同度
• 例如:文档旳统计特征
▪ 顾客要求一种词项(term)集合,能够给每个词项附加权重
• 未加权旳词项: Q = database; text; information
• 加权旳词项: Q = database 0.5; text 0.8; information 0.2
由索引项构成向量空间
▪ 2个索引项构成一种二维空间,一种文档可能包括0,
1 或2个索引项
• di = 0, 0
(一种索引项也不包括)
• dj = 0, 0.7 (包括其中一种索引项)
• dk = 1, 2
(包括两个索引项)
▪ 类似旳,3个索引项构成一种三维空间,n个索引项
构成n维空间
么一种文档D就能够表达为D(t1,t2,…,tn),其中n就代表了检
索字旳数量。
▪ 特征项权重Wk(Term Weight):指特征项tn能够代表文档

第二章文献信息检索基本知识

第二章文献信息检索基本知识
54-16-089 (化学物质登记号)
运算符
1、布尔逻辑运算符(Boolean Operators) 2、通配符和截词符 3、字段限制符

1、布尔逻辑运算符 Boolean Operators
名 称
逻辑 与
逻辑 或
逻辑 非
运算符
AND * OR +
NOT -
逻辑关 系
举例
作用
限定 A AND B 缩小
需求分析
信息源
检索工具 检索方法
检索途径 检索标识
确定学 科范围、
主题概 念。
确定信 息源类 型、 语
种、时 间和空 间范围。
选择数据 库及其文 档、搜索 引擎及网 站。
选择检索 途径
及其检索 标识
制定检索 策略
调整检索 策略
查找文献 线索
索取原始 文献
检索提 问表达 式
根据检索 结果,扩 大或缩小 检索范围, 提高查全 率和查准 率。
以工程索引EI为例,通配符和截词符的检索 表达式及检索结果如下:
算符 *
$
含义
结果
利用它可以输入检索词的起始部分,而 实现一簇词的检索
自动取词根运算符
Alter*可命中 alter,alternando,altern ant,alternate,alternati ve等
$alter可命中 alter,alternate,alterna tive
用检索 工具查 找到文 献线索
馆藏文献借阅、 复制 全文数据库 网上获取 向作者索取
检索提问表达式=检索词+运算符
检索词
分为两类: 字词类:名词术语(如叙词或关键词),或者是个
人或机构名称。 如:行政管理、王平、西安邮电大学等。

第二章信息检索语言

第二章信息检索语言

D3 小说
D4 散文 ……
C3现代
C4当代 ……
分类语言的标记符号
标记符号:文献分类法中用以表示类目的代号, 又称分类号。 作用:它具有固定类目的位置,明确各个类目的 先后次序,在一定程度上显示类目之间的隶 属、并列关系以及描述某个类目的含义。 标记符号的要求 :
– – – – 容纳性 表达性 简短性 助记性
4.检索语言的类型
• 按规范程度分
– 自然语言 – 规范化语言
• 按组配方式分
– 先组式语言 – 后组式语言
• 按照描述信息特征划分
– 内容特征语言
• 分类语言/主题语言
– 外部特征语言
• 名称语言/著者语言/序号语言
二、分类语言
• 亦称体系分类语言,是以学科范畴和学科体 系为基础来划分事物的一种检索语言。在信 息存储和检索中,它是一种对信息内容的概 念进行逻辑分类和有规律地系统排列而构成 的检索语言,并以分类表(分类法)的形式体现。 • 分类语言最显明的特点是系统性,具有族性 检索的功能,有利于人们从学科专业的角度 进行全面性的检索。
等级列举式分类法
U448各种桥梁 U448.1 桥梁、按用途分 U448.11 人行桥 U448.12 两用桥 U448.13 铁路桥 …… U448.2 桥梁、按结构分
分面组配分类法
地区分面 E1 中国
E2 朝鲜
体裁分面 D1 诗歌
D2 戏剧
时代分面 C1 古代
C2 近代
E3 韩国
E4 日本 ……
• 同一著者的不同作品:
鲁迅:《热风》I210.4 L824 鲁迅:《华盖集》I210.4 L824/2 鲁迅:《两心集》I210.4 L824/3
• 版本不同:

第二章互联网信息资源检索概论总结

第二章互联网信息资源检索概论总结

②垂直搜索引擎 其特点是“专、精、深”,且具有行业色 彩,与通用搜索引擎的海量信息无序化相 比,垂直搜索引擎的信息量虽然小,但更 加专注、深入具体。 比如酷讯的机票检索和团800的团购导航。

2.1.2互联网信息检索的特点
1、无限检索范围,动态的检索对象 2、丰富的检索内容,新兴的检索领域 3、强大的检索工具,低廉的检索费用

2.2.3归类和聚类



根据分类知识的获取方法的不同,可以将文本自 动分类系统分为两种类型:基于知识工程的分类 系统和基于统计的分类系统。 基于知识工程的分类系统主要依赖语言学知识, 需要编制大量的推理规则作为分类知识,所以一 般不用。 基于统计的分类系统使用比较普遍,实现起来比 较简单,并且分类准确度也高,能够满足一般应 用的需求。
第2章
第2章 互联网信息检索概论
2.1互联网信息检索类型和特点 2.2互联网信息检索原理之一——信息组织 2.3互联网信息检索原理之二——信息查询 2.4互联网检索工具的性能评价

2.1互联网信息检索的类型和特点
2.1.1互联网信息检索的类型 2.1.2互联网信息检索的特点

2.1.1互联网信息检索的类型

常用的互联网信息检索模型各自的 优缺点是什么?
1.布尔运算模型 优点:原理简单易理解,容易在计算机上 实现,检索速度快。 缺点:最终给出的检索结果没有相关性排 序,不够精准,不能反应不同的索引项对 一个文档的重要程度的差异。

2、扩展布尔模型

优点:将非此即彼的相关判断方式改为计 算相似度。
2.2.4元数据

元数据被重视的原因:在过滤信息使用检 索工具时,所得到的检索结果太多,无法 一一浏览过滤,并且有时排在前面的搜索 结果又不是用户真正需要的。因此如何制 定一套数据描述格式来有效率的描述网上 的数字化信息资源成为一个重要课题,这 正是元数据日渐受到重视的原因。

第二章网络检索

第二章网络检索


2.1.3、网络信息资源的特点
(一)优点: 1.数量巨大,增长迅速 2.内容丰富,形式多样 3.结构灵活,分布广泛 4.开放互动,共享性强 5.传播快速,利用方便 6.更新速度快,动态性强
网络信息资源的特点
(二)缺点: 1.网络信息质量参差不齐,良莠不一 2.分散无序,缺乏管理
2.2 网络信息检索的方法


2、网上出版物
网上出版物是指在网络环境中编辑、出版、发行的出版物以 及印刷型出版物的网络版,包括网上图书、网上期刊、网上报 纸等。如今,通过Internet浏览、订阅电子期刊、报纸、图书 等已成为一种时尚,网络出版物的数量正急剧增加。如在中国 科技期刊网上可以免费查找《中国学术期刊》的题录。其中网
上参考工具书更是独树一帜,像一些百科全书、辞典、指南、
手册、文摘索引、目次表、名录等,这些网络版参考工具书使 用起来方便、快捷。目前因特网上有上万种电子期刊向网上用
户提供服务,其中很多是免费提供。
主要网上书店

中国图书网(/) 中华图书网(/)
短短的两年多时间内,设在北京大学的项目管理中心联合各参建
单位,建设了文理、工程、农学、医学四个全国文献信息中心, 华东、华中、华南等七个地区中心和一个东北地区国防信息中心, 建立了一系列国内外文献数据库,并开展了公共目录查询、信息 检索、馆际互借、文献传递、网络导航等网络化、数字化文献信 息服务,对保障"211工程"各高校的重点学科建设、培养高层次人 才、支持科研创新等发挥了重要的作用。
CALIS面向读者的服务功能主要有: (1)公共检索:可以在网上查找全国性或地区 性的书刊联合目录数据库,了解所需文献是否有及在 哪里收藏。也可以联机检索CALIS国内外各种类型的 文献数据库。 (2)馆际互借 (3)文献传递 (4)电子资源导航:对网上的电子资源进行收 集、加工和整序,形成虚拟图书馆资源,提供用户浏 览和查询。

文献检索(第二章 )

文献检索(第二章 )

特种文献
(1)图书
国际上通常把48页以上,不定期出版的印刷品称 为图书。我国国家标准对图书的定义是:“以印刷方 式单本刊行的出版物”。 特点: 内容比较系统、全面、成熟、可靠,有一定的 新颖性,但编辑出版时间过长,传递信息的速 度太慢,时间上难以满足获取最新科技信息的 要求。 图书一般分为两类: 阅读型:教科书、专著等 工具型: 字典、百科全书、年鉴、手册
(9)技术档案
指生产建设、科技部门和企事业单位针对具体的工 程或项目形成的技术文件、设计图纸、图表、照片等 各种原始记录原件及复制件。包括任务书、协议书、 技术指标、审批文件、研究计划、研究方案、试验记 录等。 技术档案是生产领域、科学实践中用以积累经验、 吸取教训和提高质量的重要文献。 技术档案具有保密和内部使用的特点,一般不易获 取,但它是一种重要的信息来源。
(6)标准文献
是为产品质量标准化、产品规格化和系列化、零 部件通用化而制订的技术规定、规范和准则。一个国 家的标准反映着这个国家的经济政策、技术水平、加 工工艺及标准化水平,它是一种重要的技术信息来源。 技术标准的制订工作一般是由主管部门完成的。 标准的新陈代谢十分频繁,随着技术水平的不断提 高,标准也需不断补充、修改,国际经济贸易的发展 又促使标准日趋国际化,因而标准文献体现了本技术 领域的发展水平,科技人员可以从中获取大量有价值 的信息。 标准文献的特点是:具有独立完整性和法律约束性。
(4)会议文献
是指在各种学术会议上发表的论文、报 告、讲演等文献,经编辑整理后的正式出版 物。 学术会议历来是人们交流研究成果的重要 场所。目前全世界每年大约要召开数千个学 术会议。会议种类繁多,有大会、会议、学 术讨论会、研讨会、讲习会、座谈会等。由 此产生了大量的会议文献。 会议文献是传播科技信息的重要渠道,许 多新的发现或发明往往最先披露于会议或会 议文献中。一些定期举行的学术讨论会往往 成为对前一时期研究成果的一次大检阅。某 些会议文献常常不在公开出版物上发表。 特点:学术性很强,代表了某一学科或专业领域的最新研究成果及 国内外的水平发展趋势

文献检索,信息检索(2)第二章 信息检索原理

文献检索,信息检索(2)第二章  信息检索原理
优点:可以检索到某学科或专业的所有文献,有较高 的查全率。
缺点:常常落后于当前研究现状,分类表相对呆板的 学科关系,使得确定前沿概念、跨学科概念或非常具 体概念的分类,较困难。用户差异性。
分类语言
中国图书馆图书分类法 美国国会图书馆分类法 杜威十进位分类法 IPC国际专利分类法
基本部类 马列毛邓 哲学
(2)多概念课题
并列概念课题,如“新闻宣传研究”
“计算机在人文社会科学方面的应用” 上位类分类方法,如“灰色系统理论”
应用性课题,如“计算机在人口预测方面的应用”、
2.主题语言
是直接以代表信息内容特征和科学概念的概 念词作为检索标识,并按字顺组织的一种检索语 言。 是以表达文献主 是从文献的内容 是从文献的题目
一、检索算符 逻辑与
(一)布尔逻辑算符
布尔逻辑组配运算是采用布尔代数中的 逻辑“与”逻辑“或”、逻辑“非”等算符,
将检索提问式转换成逻辑表达式,限定检索
词在记录中必须存在的条件或不能出现的条 件。凡符合布尔逻辑所规定的条件的文献, 既为命中文献。
布尔逻辑运算符
————————————
1、逻辑“或” 2、逻辑“与” 3、逻辑“非”
2、逻辑“与”
————————————————
Chinese AND litera0,000 网络100,000,000) 用符号“and”或“*”表示,其逻辑表达式为: A * B 或 A and B 其意义为检索记录中必须同时含有检索词A和B 的文献,才算命中文献。
4、记录级
检索词在数据库的同一记录中。
(C)—citation
表示两侧的检索词(或检索项)必须出现在同一记录中,词
序不限,中间词数量不限,其作用与布尔逻辑算符AND相同。

信息检索基础.ppt

信息检索基础.ppt
查全率 80% 查准率 88.9%
27
2.3 信息检索类型
1.文献检索
以索引、文摘或其他文献特征为主要检索对象 ,目的是运用检索系统查检出与某课题相关文献 检索,从而获取原始文献。
2.数据检索
以数据为检索对象,可直接选择专门的数据性 工具进行查检,从而得到数值性数据、图表、化 学结构式、计算公式等。
冠状动脉疾病 冠状动脉心脏病
主题词 冠状动脉疾病
治疗
文献
20
4. 著者检索
用文献的著者、编者、译者的姓名或机构团体名 称编制而成的索引。
按著者姓名字顺编排 书写格式 姓前(全称)、名后(缩写,即用首字
母)
如:Willian Henry Harrison →Harrison W H
Ren Shu Min → Ren SM
计算机检索系统
3
二、信息检索的原理
是将描述特定用户所需信息的提问特征,与 信息存储的检索标识进行异同的比较,从中找 出与提问特征一致或基本一致的信息。
本质是用户的信息需求与存储 在信息集合中的信息进行比较和 选择, 即匹配的过程。
4
主题
信息 文献的 分析 存贮 信息内容
主题
信息 检索者的 分析 检索 信息需要
18
3. 主题途径
主题词:是以自然语言为基础,以概念组配为 基本原理,并经过规范化处理,表达主题的最 小概念单元,作为信息存储和检索依据的一种 检索语言。
特 点: 词义、词类、词形规范保证词语与概念的唯一
对应关系,具有专指性。
19
检索举例:冠心病的治疗
自由词
冠心病
冠状动脉粥样硬化性心脏病 治疗
1. 直接浏览法
直接浏览法也称直接查找法,指检索者不依靠任何检 索工具或检索系统,从本专业最新核心期刊或其他文献中 直接阅读原文或浏览最新目次而获取文献的方法。这是一 种最常见的信息资源的获取方式。因为编制检索工具需要 时间,有的半年,甚至长达一年之久,直接浏览可以及时 获得最新文献。但利用这种方法查找的信息不全面、不系 统、且局限性较大,不能作为查找文献的主要方法。

第二章 信息检索基本方法与基本技术

第二章  信息检索基本方法与基本技术

2. 主题检索语言
• 标题词:经规范化处理的词或词组,先组式
语言
• 叙 词(单元词):经规范化处理的词或词
组,后组式语言,可自由灵活组配
• 关键词:未经规范化处理,直接从文献题名、
原文或文摘中选取的能反映原文主题内容的自 由词汇
二、检索工具
定义:检索工具是人们用来存储、报道和查找 文献的工具,它具有存储和检索的功能。
点击预约书刊可预约该书 预约图书:选定所需图书,输入证号、密码,执行预约 点击机读格式可查看该书的MARC信息
高级查询
• 在题名、著者、丛书名、主题词、出版社、 ISBN(书)、ISSN(刊)、索取号、起始年 代中填入自己确定的内容,其余的可以不填 写;选定语种(17种)和文献类型,然后进 行检索。 • 结果可检索到所需文献的题名、著者、出版 信息、索取号 • 查看选中图书的相关信息
图书馆信息查询系统
•书目查询 •读信者息 •新书通报:一个月内到馆的新书、馆藏 地,并可查看新书 •订购征询 •信息发布:预约到书列表、超期罚款、 超期催还、委托借阅到书列表
如何利用计算机进行检索
书刊查询
读者信息查询
图书馆主页的功能
信息发布功能:
图书馆最新服务动态、电子 资源试用等均及时在主页上发布。
一、信息检索原理
信息检索的原理(示意图)
存 储
特征化
表示
查 询
特征化
表示
信息 集合
选择与匹配
需求 集合
二、信息检索类型
手工检索 计算机检索 文献信息检索
• 信息检索(内容)
• 信息检索(工具手段)
数据信息检索
事实信息检索
第二节 信息检索语言与工具
一、信息检索语言

信息检索教程(第二章)

信息检索教程(第二章)

4
(b)按收录文献出版形式分
●图书目录 ●期刊目录 ●会议论文目录 ●标准目录等。
(c)按物质形式划分
●卡片目录 ●书本目录 ●机读目录 ●联机公共检索目录等。
5
(2)图书馆目录、OPAC和联合目录概述
①图书馆目录
定义:它主要提供馆藏资源的检索,又叫馆藏目录,它反映
了一个图书馆的文献收藏情况,是一种重要的检索工具。
26
常用法示例
27
追溯法示例
28
2.3.2检索途径
29
30
1.分类途径
图书期刊分类法
世界三大图书分类法
《杜威十进分类法》(DDC)(Dewey decimal Classification ) 《国际十进分类法》(UDC)(Universal Decimal Classification) 《国会图书馆图书分类法》(LCC)(Library congress classification)
定义:所谓文献检索的方法,即查找文献的方法。有以下三种: 常用法:直接利用文献检索工具或检索系统来查找文献的方法,是 一种常规的科学检索方法。又称工具法或直接法。分为顺查法 、倒查法和抽查法。 追溯法:是一种跟踪查找法。它不利用检索工具只是利用文献(尤其 是评述性论文或专著) 后面所附的参考文献进行逐一地追踪查 找原文。又称引文法。 综合法:是常用法和追溯法的综合。利用检索工具或检索系统进行 常规检索,再利用文献后所附参考文献进行追溯检索,分期分 段交替使用这两种方法,直到满足要求为止。可以查得较全面 较准确,尤其适用于那些过去年代内文献较少的课题。称循环 法、分段法或交替法。
22
2.2.2检索工具的鉴别与评价
1.信息收录范围与信息质量

第二章 图书信息检索

第二章 图书信息检索

2. A or B
3.A not B
① 逻辑与(逻辑乘) 用关系词AND或“*”表示,表示它所连接的两 个检索词必须同时出现在结果中才满足检索条件。
逻辑与用来缩小文献检索范围,提高查准率,是具有 概念交叉和限定关系的一种组配。
② 逻辑或(逻辑加) 用关系词 OR 或“ +” 表示,表示它所连接的 两个检索词中任意一个出现在结果中就满足检索条件。
• Author(作者) • Publisher(出版者) • Artery(流通渠道) • Buyer(即购买者) • Internet(网络) 收录:相关专业教参书 年度:1973-2007年 完全数字化的出版。
矿业工程数字图书
• 中国煤炭工业协会科技 文献信息咨询专业委员 会 • 煤炭行业(中国矿大) • 超星数字图书馆合作 • 收录全面 收录年度:1949年至今
电子图书
• 发展历程:Electronic Book、E-Book、eBook 20世纪40年代,科幻小说; 1968年,松下电器开始了电子照片液体显影液的研究 电泳 液晶; 1971年,古腾堡工程: 迈克尔哈特(伊利诺伊大学) 扫描和光学文字识别 约翰内斯古腾堡,德国15世纪 印刷商 卡内基梅隆大学; 1997年Eink(电子墨水)公司 化学、电子和物理 麻省剑桥; 亚马逊Kindle、OPPO公司Enjoy、汉王公司 20世纪80年代 国内电子图书开始生产; 2000年10月,世界上第一台阅读不耗电电子图书在天津问世; 2009年,Barnes & Noble推出Nook:墨水电子屏+液晶触摸屏; 彩色显示问题 2010年开始,美国苹果公司IPad、IPad2.。。。。; 2011年Google iriver,外观和技术与Kindle相似。

信息检索基础知识

信息检索基础知识

46
计算机信息检索系统工作流程

输入子系统——选择收集特定范围的信息资源、按系统 指定款式输入系统 处理子系统——处理加工经过鉴定、选择好的数据和信 息,使其成为易于存储和检索的形式。 存储子系统——将加工处理后的信息按某种规定有序聚 积在存储载体上以构成可检文档。 传输子系统——通过计算机与通信线路的连接,完成信 息编码的传递、转接、处理与接受。 输出子系统——根据用户需求有效输出各类最终信息产 品。 控制子系统——根据系统内外环境变化,适时调控,保 障系统的有效输入、有效存储、有效输出等环节的协调 运行。
16
三、计算机信息检索系统 2、计算机信息检索系统的类型
计算机单机信息检索系统(20世纪50年代 初——60年代中期) 计算机联机信息检索系统( 20世纪60年 代中——70年代中期) 计算机光盘信息检索系统( 20世纪70年 代中——80年代中期) 计算机网络信息检索系统( 20世纪80年
(期).页码
10
二、手工信息检索系统
5、几种常用的手工信息检索工具 《中国农业文摘》: 81年创刊、85年起分7个分册 刊期、类型:双月刊、文摘型 检索途径:分类、主题、著者 著录格式:分类号 顺序号 题目 /作者
// 刊名, -年,卷(期). -页码 文摘正 文…… 图x 表x 参x (文摘员)
23
一、信息检索语言概述
信息检索语言是人们在加工、存储
及检索信息时所使用的标识符号; 信息检索语言是索引款目所使用的 标识系统; 信息检索语言可以是对自然语言作 规范化处理后的词汇与技术语言, 也可以是某类事物及其某方面特征 的代码。
24
二、信息检索语言的基本类型
1、按构成原理分:

新第二章 信息检索基础知识

新第二章 信息检索基础知识

2.2 信息检索语言
三、主题语言
4.关键词语言
是指从文献标题、文摘、正文中抽离出来的,对表征文献主题 内容具有实质意义的语词,以关键词作为信息标识和检索依据的主 题语言。关键词没有固定的词表,因为对于同一个事物的概念,不 同作者甚至是同一个作者在不同的著作中用词都会不同,它是没有 经过规范化的自然语言词汇。 在检索中文医学文献中使用频率较高的《CMCC》数据库就是 采用关键词索引方法建立的。
2.5 计算机检索技术 四、词组检索
将固定词组或短语 看成单个词进行处理。
常用“ ”作为词组检索的运算符。
2.5 计算机检索技术 五、字段检索
对指定的一个或多个字段进行检索,从而提高查准率或查全率。
标题、作者、摘要、关键词、作者单位、文献来源、学位授予单位、 学位级别、会议信息、会址、会期、书名、出版地、出版年、专利号、报 告号、ISBN、ISSN等。
2.2 信息检索语言
一、信息检索语言的定义、作用和种类
4.分类:
篇名(题目) 著者名称 描述文献外表特征 文献序号 引用文献 等级体系分类语言 分类语言 组配分类语言 主题语言
检索语言
描述文献内容特征
代码语言
标题词语言 关键词语言 单元词语言 叙词语言 分子式索引 结构式索引 专利号索引等
2.2 信息检索语言
2.4 信息检索标识 一、检索标识的定义
检索标识即检索词,是指能表达检索课题主题概念和信息需 求的名词术语、分类号、名称、代码等的总称,包括主题词、 关键词、名称、分类号、分子式、专利号及各种号码。
2.4 信息检索标识 二、信息检索标识的类型
1.描述信息内容特征的检索标识: 分类、主题、代码(符号)。
2.5 计算机检索技术 一、布尔逻辑检索

第二章 信息检索语言

第二章 信息检索语言
款目主题词并按族首词的字顺和等级相结 合编排的一种索引。
二、《汉语主题词表 》

(2)范畴索引:
它又称为分类索引,是将主表的全部主题
词按照主题词的学科和词义范畴,划分若
干大类、二级类或三级类,每类之下按主
题词的汉语拼音字顺排列的一种索引。它 的分类是对主题词的分类。
二、《汉语主题词表 》

(3)英汉对照索引:
号分类法》。
二、信息检索语言的基本类型

C、混合分类语言:
它是结合体系分类语言和组配分类语言所形成的
检索语言。又因对两者的侧重点不同,混合分类
语言又可明显地分为体系—组配分类语言和组
配—体系分类语言。如《国际十进分类法》。
二、信息检索语言的基本类型


(三)检索语言按内容性质划分
2、主题语言
(1)含义:就是对表达信息主题内容特征的主 题词汇概念规范化处理所形成的检索语言。 (2)优点:由于主题词汇表达概念准确,所以 主题途径是检索信息的主要途径。


(3)类型:主题语言按照主题性质的不同,又 分为以下几种:
二、信息检索语言的基本类型

A、标题词语言:
它以标题词作为文献内容标识和检索依据。

2、《中图法》采用了许多辅助符号。
一、《中图法》


(四)特点
1、编制技术和编号方法比较先进、科学; 2、强调分类法的实用性,在层累制的基础上采 用八分法、借号法、双位法等方法,使得类号等 级分明、简短易记; 3、结构完善,使用配套,有相关索引和使用手 册,还有一系列不同类型的版本,为全国文献的 统一分编创造了条件; 4、有一个长设机构负责《中图法》的管理、修 订等工作。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

展示给用户的系统。
搜索引擎按其工作方式分为三种
全文搜 索引擎
目录索引 类搜索引
元搜索 引擎

第一节
信息与检索
三、搜索引擎及其分类
一种是拥有自己的检索程序,俗称“蜘 蛛”程序或“机器人”程序,并自建 网页数据库,搜索结果直接从自身的 数据库中调用。如:Google、 Fast/All The Web、Alta Vista、 Inktomi、Teoma、WiseNut等。国 内最著名的则是。活动三教学视频下载
一、获取的方法
自行 拍摄
查找获 取网上 资源
活动三
教学视频下载
二、方法与步骤
活动三
教学视频下载
与目的
幼儿教师在实际工作中,常常用于搜索不够精确而导致搜索结果条
目太多,系统化文字描
有完整明了的文献特征标志
必须包含多个有检索意义的文献特征标志。
全部条目科学的、按照一定规划地组织成为一个有机整体。 有索引部分,提供多种必要的检索途径。
第一节
信息与检索
三、搜索引擎及其分类
概念:搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信 息,在对信息进行组织和处理好,为用户提供检索服务,将用户检索相关的信息
国外搜索引擎 三、搜索引擎及其分类
一般资料 资料涉及非常冷僻的领域 特殊资料(其他主要引擎都查不到时) 产品或服务
第一节
信息与检索
搜索分类 试题搜索 网址
特色搜索引擎
功能介绍
问试题的问题,做试题的学问,题问365,专业试题 搜索引擎 视频服务平台,提供视频播放,视频发布,视频搜索, 视频分享 为影视爱好者提供最好的网络快播资源搜索 以10亿页中文资料为基础,为读者提供深入内容的章 节和全文检索、部分文献试读、参考咨询等多种功能 法律图书馆网是综合性的法律门户网站,是目前最专 业、最先进的法律法规数据库之一,客户遍布全国各 地,市场占有率遥遥领先 搜狗博客搜索是针对博客类结果的垂直搜索引擎,收 录了各大博客站点及独立博客 为你提供最佳搜索结 果,让你找歌不再是难题 本站既能搜索软件又能搜索驱动程序 提供电子地图浏览、地点搜索、公交自驾路线查询、 手机地图、实际导航、高清卫星图,城市仿真三维图 等多项服务
活动八
利用专业网站查找资料
一、活动任务与目的
幼儿教师在平时的工作中经常需要查找包括论文、期刊、文献、数
据等专业性资料。这就需要利用专业网站或数据库查找这些资料。
活动八
利用专业网站查找资料
(一)文献检索的网站分类 中国知网 搜索文献、论文等资料 超星读秀知识库 中国学位论文全文数据库 汇思智能学习平台 搜索英文相关资料 环球英语多媒体资料库 EBSCO全文数据库 文汇报1938-1999 搜索报刊资料 新民晚报1946-1999 人大报刊复印资料活动四使用高级搜索查找相关资料活动四
使用高级搜索查找相关资料搜索的结果中显示文本框中所有的主题 与关键词对 应的内容,相当于“+”和“and” 搜索结果中显示文本框中主题与关键词中任意一个 所对应的内容,相当于“or ” 搜索结果中显示不包括文本框中主题 与关键词对应 的内容,相当于“—” 限定要搜索网页的时间,如如最近一天、最近一周或 一个月等
3、在弹出 的页面中,图示中用文本框标志的内容就是图片URL地址,复
制即可。活动二使用识图搜索图像及相关信息4、在默认的【粘贴图片网址】的选项下,在搜索框中,粘贴图片的网址
单击【上传图片、搜索相关信息】步骤按钮。 2、左键选中本地图片或者网页上任何一张图片,同时按住左键不放,拖 动鼠标到识图页面提示的地方,松开左键,系统会自动进行识图搜索 (不支持I:
单击个人中心 我的课程
挑选我的课程
参加课程
用户可以在课程管理中看到自已正在 学产的课程、已经学习的课程、已收 藏的课程,还可以新建属于自已的课 程,让其人他用户进行学习。如右图:活动六的使用• 4、上传文档
• 单击【上传我的文档】 用户可以快速将自已的教学资
ppt(.pptx)、xls(.xlsx)、pot、pps、vsd、rtf、wps、et、dps库页面。活动六的使用(二)的主要功能
1、检索文档 两种方法:
源分享给其他用户,首先为自已文档设置标题 ,然后选择分类,选择可
见性。
注意:每次最多上传20份文档发,每份文档不超过20M(TXT使用
例:幼儿教师需要搜索“幼儿园唐诗宋词”的相关课件,可以进行以下 操作: (1)直接搜索 (2)分类搜索

三、 搜 索 引 擎 及 其 分 类
视频搜索 电影引擎 图书搜索
法律搜索 博客搜索 音乐搜索 软件搜索 地图搜索
/law /务与目的
• 图像---是幼儿教学过程中一种重要的学习资源,在实际教学工作 中,经常会遇到有图但无此图相关更识与技术
适用情况如下:
信息技术基础之——
信息检索与整理
学习目标
1 2
3
第一节
信息与检索
内容
内容
内容
第一节
信息与检索
一、信息检索的目的与过程
A
主要目的
获取所需要的信息,以消除 对事物的不确定性,提高人 们解决问题的能力。
B
教师目的
获取教育和教学的有关信息,
以消除教学过程中的不确定性,
提高教育和教学水平。
第一节
信息与检索活动二使用识图搜索图像及相关信息三、方法与从本地上传】,在电脑中选择需要搜索的图片,选择完成后,
系统会索结果。
二、方法与步骤
1、保证电脑有音频输入设备,准备好耳麦或话筒。
2、进入网站。
活动一
使用midomi搜索音乐
3、单击【Click and Sing or Hum】按钮
活动一
使用midomi搜索音乐 4、通过唱、哼或吹口哨,产生旋律,何持至少10秒以上,30秒后系统 会自动上传,稍等片刻,就会显示搜索结果。
LookSmart、About等。
第一节
信息与检索
三、搜索引擎及其分类
在接受用户查询请求 时,同时在其他多个 引擎上进行搜索,并 将结果返回给用户。 搜索结果排列方面, 有的直接按来源引擎 排列搜索结果,有的 则按自定的规则将结 果重新排列组合。 国内搜索引擎
元搜索 引擎张图片更完整的信息或者背后的相关信息时,如拍摄时间、
地点、背后的一些故事等。
2、用户手上已有一张图片,想要找这张图片的另一种形式,如一张尺寸
更大的、清晰度更高的、或是没有水印的原图、或是它的简笔画等。
3、想要了解这张图片还被哪此网站引用,还可以用于哪些用途。
4、想要了解一个不熟悉的人物的相关信息。
一是在搜索框中进行搜索------在用户登录后,直接在搜索栏中输入关键词, 在检索框中,可以直接检索文件的类型
二是通过分类进行检索------有时侯用户未必有明确的搜索对象,此时 用 户可以借助分类的方式 来搜索到自已所需要的资料。 2、多终端阅读
用户可以单击【下载客户端】按钮,下载手机应用
搜索目标(英文) 搜索引擎/目录索引 Google All The Web InfoSeek/WebCrawler/Vivisimo等多远引擎 Yahoo/Overture 国内搜索引擎 一般资料 古汉语(新浪(质量较高)步骤 (二)输入图片URL地址1、进入图片首页,输入需要搜索的图片名称。
活动二使用识图搜索图像及相关信息2、在显示的图片群里选择需要的图片,获取网上的图片地址,获取方法:
鼠标右键单击该图片,在弹出的页面中单击级搜索功能,可以快速、便捷、精确地搜索到所需的信息,
大大提/advance一条搜 索现在网页的什么位置是全文中 或是仅在标题中
每页搜索结果的条数,如10,骤 搜索一些有关于“童谣】中输入“童谣” 在【包含以下任意一个关键词】中输入“生动 有趣押韵” 在【不包括以下关键词】中输入“国外” 3、限定要搜索的网页的时间是“最近一年”,限定要搜索的网址 4、单击“一下”即可找到搜索结果。活动四
使用高级搜索查找相关资料活动六
的使用一、活动任务与目的享文
档的开放平台几个容。平台支持的文件类型有doc(.docx)、
一、信息检索的目的与过程 信息检索的一般过程是信宿相互匹配的过程,它是一个双向 活动,具体操作步骤如下:
根据检索目的初步确定检索的主题与关键词 确定检索算途径 索取原文
2
4
6
1
确定检索目的
3
选择检索系统
5
查找资料
第一节
信息与检索
二、检索工具概述 概念:检索工具是用于存储、查找和报道档案信息的 述工具,是目录、索引、指南等的统称。
活动一
使用midomi搜索音乐
一、活动任务与目的 音乐----是幼儿教学过程中的重要的学习资源。在实际教学中经常会遇到
只记得歌曲的部分旋律,从而无法搜索到这首歌曲的其他相关信息,如
歌名、曲谱、歌词、作者等,某此搜索工具可以解决这个问题,让搜索 音乐的成功率与准确率大提高。
活动一
使用midomi搜索音乐
搜索学位论文资料
二、关键知识与技术
中国博士学位论文全文数据库,可通过主题、 作者姓名、学位授予单位、学位授予年度以及 论文中包含的内容等直接进行搜索。
活动八
利用专业网站查找资料
二、关键知识与技术
(二)文献检索的方法 以某一篇论文所附录的参考文献为依据的 (1)追溯法 检视方法 (2)常用法 利用检索工具---分类索引和主题索引 (3)分段法 交替使用追溯法和常用法的检索方法
另一种则是租用其他引擎的数 据库,并按自定的格式排列搜 索结果,如Lycos引擎。
第一节
信息与检索
三、搜索引擎及其分类
目录 索引
算不上真正的 搜索引擎 按目录分类的网站链接表而已,用户完全可以 不用进行关键词(Keywords)查询,仅靠分 类目录也可找到需要的信息。 如:YAHOO雅虎、搜狐、新浪、网易、其它 著名的还有Opern Directory Project(DMOZ)、
相关文档
最新文档