标准信息检索的方法
信息检索与利用
信息检索与利用信息检索与利用随着数字化时代的到来,信息的数量和种类在不断增长,人们对于信息的需求也日益增强。
如何快速、准确、有效地获取所需信息,成为了信息时代的一大难题。
信息检索与利用成为破解这一难题的有效途径之一。
一、信息检索的概念及流程信息检索是指根据用户提出的检索词或检索式,在信息组织体系中寻找与之相关联的信息并找到其位置,提供用户预期的检索结果的过程。
信息检索可分为手动检索和机器检索两种方式。
手动检索是指通过人工筛选的方式进行检索,而机器检索则是在计算机或其他智能设备的支持下进行检索。
在信息检索过程中,我们需要遵循一定的流程,如图1所示。
图1 信息检索流程首先是明确检索目标。
明确检索目标是信息检索中最基本也是最关键的一步。
只有明确具体的检索目标,才能确定检索内容、检索方法和搜索策略。
第二步是制定检索策略。
搜索引擎检索策略是制定检索操作的指导方针和方法。
其中,关键词的选定和排列,是关键词检索的首要环节,直接影响检索结果的质量和检索速度。
接着是信息检索操作。
信息检索过程中必须要有一个有效的检索平台或检索工具。
通常,我们在搜索引擎、数据库或图书馆的数据库中进行检索。
在实际操作中,可以通过精细的查询语句进行检索,也可以通过分类、浏览等方式获取所需信息。
最后是反馈和评价。
通过反馈和评价,不仅可以对检索过程进行改进,还可以对检索结果进行分析、评价和处理。
同时,还可以通过反馈和评价获取更多更有价值的信息。
二、信息检索的方法信息检索方法根据检索策略的不同,主要可以分为以下几种。
1.关键词检索法关键词检索法,指的是以相关关键词为检索关键词组成查询语句,在检索工具中进行关键词检索的一种检索方法。
本方法适用于检索范围较广、目标较为明确的信息。
2.分类检索法分类检索法,是指根据先前设计好的分类知识体系,将信息按照分类学科进行归类,并在科学分类树中按照路径寻找所需信息的一种检索方法。
该方法适用于专业知识体系较为完善、信息明确的情况。
第三章 信息检索教程
举例:期刊2
23
期刊著录格式
24
期刊的著录
写出下面期刊文献著录:
25
小节练习1
1. 什么是文献著录? 2.文献著录的结果是—— 3. 既著录主要项目,还著录全部选择项目的著录级次称为—— 4. 既著录主要项目,还著录部分选择项目的著录级次称为——
26
3.2 机读目录与元数据
3.2.1 机读目录
43
3.2.3 都柏林核心元数据和机读目录的比较
1. 著录的对象不同
DC与 MARC的 3. 著录的主体不同 比较 4. 著录的详简程度不同
5. 标识的方法不同
2. 数据的形式不同
44
小节练习2
1、什么是机读目录,一条CNMARC机读目 录的组成? 2、头标区数据元素: 00123cbm1#2200277###52## 其中c、b、m、1分别表示什么? 3、什么是元数据?
12
图书的著录(参考文献著录规则)
13
14
图书著录中的文献类型标志
常用文献类型用单字母标识,具体如下: (1)期刊[J](journal) (2)专著[M](monograph) (3)论文集[C](collected papers) (4)学位论文[D](dissertation) (5)专利[P](patent) (6)技术标准[S](standardization) (7)报纸[N](newspaper article) (8)科技报告[R](report)
CNMARC记录
记录头标区
地址目次区
数据字段区
记录分隔符
注:各字段数据元素及其标准详细情况参见教材P83-87
33
ISO-2709的机读目录标准
信息检索的分类
信息检索的分类
信息检索是一种通过计算机技术实现的信息获取方式,它采用特定的搜索策略在大量
的信息资源中查找并提取相关的信息,并将其成果呈现给用户。
信息检索可以按不同的标
准进行分类,以下是常见的几种分类方式。
一、基于目的分类
根据信息检索的目的不同,可以将其分为两大类:一是用于学术研究的信息检索(包
括学术论文、科研报告、专著等学术性文献的检索);二是面向大众需求的信息检索(包
括新闻资讯、生活服务、娱乐娱乐等信息资源的检索)。
信息检索的数据源范围是信息检索的重要参数之一,通常分为以下三类:
1.全文检索:全文检索是指将整个文本作为检索对象,即将文本中的所有词语构成一
个关键词表,在该表中查找符合搜索条件的文本记录。
2.区域检索:区域检索是指将文本分成若干段落或区域,然后在这些段落或区域中进
行检索。
3.元数据检索:元数据检索是指利用文本资源的元数据进行检索,包括标题、作者、
创建日期、文件格式、主题分类等。
根据不同的检索目标,可以将信息检索分为两类:
1.内容检索:即检索某个主题、关键词等相关的文本内容。
2.地址检索:即找到与某个主题、关键词等相关的网址、链接等地址信息。
综上所述,信息检索根据目的、范围、技术和检索目标等不同标准可以分为不同类型,但是信息检索目的都是为了快速、准确获取所需信息,以满足不同用户群体的信息需求。
信息检索基础知识--标准文献检索
ISO与IEC标准号的组成 ISO与IEC标准号的组成
ISO:标准号+顺序号+年份 如:ISO 2995—1983 ISO类号:字母+数字 如:TC—60 IEC:IEC+顺序号&规格和技术规则等 文献的总称。它是记录人们在从事科学实验、 工程设计、生产建设、商品流通、即是转让和 组织管理时共同遵守的技术文件。 作用:它是鉴定工程质量、检验产品、控制指标 和统一试验方法的技术依据;是产品的维修的 依据;贸易中产品退货或索赔的根据;可以简 化设计、节省人力。
标准文献的种类
1.按标准文献使用范围分 (1)国际标准;(2)区域性的标准;(3) 国家标准;(4)专业标准;(5)公司 4 5 标准 2.从标准文献内容划分 (1)基础标准;(2)产品标准;(3)试 验标准;(4)术语标准;(5)安全标 准。
我国标准检索
我国标准由《标准化法》规定为四级:国家标准; 部(局、行)标准;地方标准;企业标准。 各级标准号:我国的标准代号用两个或三个汉语 拼音字母表示。如: 国:GB 2440—81 GB/T2440—81; 部:HG 3-1105-77; DB 42/ 1307-85; 企:Q/ ---- 10—81
国际、国外标准
标准号的基本结构: “标准代号+专业类号+顺序号+年代号” 例如:ANSI B5 . 45 — 1972 两大标准组织: 1. ISO标准:是“国际标准组织”的简称。ISO成 立于1947年,现有97个成员国。我国在1978年 参加该组织。ISO是联合国甲级咨询机构,是 目前世界上最大的国际性标准组织。 ISO每年制定500—700个标准。它下设18个技术 委员会(TC),4647个分委员会,1804个工作 组织。
信息检索
信息检索(Information Retrieval)(说明:1、本文仅介绍国内、网络、学术检索2、要学好信息检索,一定要多练习)学习要求:1、熟悉各类大型数据库的检索方法2、能够熟练搜索到网络上各类信息3、熟悉文中列出的网站,尤其是数学建模常用网站,能够检索到各类自己所需要的建模资料一、概念信息检索有广义和狭义之分,广义信息检索包括信息的存储(storage)和检索(retrieval)两个过程。
通常所说的信息检索是指狭义的检索,即依据一定的方法,从已经组织好的大量有关文献信息集合中,查找并获取特定的文献信息的过程。
两个重要指标:查全率、查准率(两指标相互抑制)。
信息素质的具体内涵包括:敏锐的信息意识;信息需求的能动性;有关信息源的知识;信息处理能力;对信息的理解与评价等内容。
二、信息检索的重要性1.掌握有效信息,避免科研重复2.提高信息素质,培养创新能力3.掌握可靠信息,进行科学决策文献检索--“不仅仅提供资料信息,更重要的是提供研究的思路”。
三、文献检索途径(部分)A.题名B.著者(作者)C.分类(中图法)D.主题E.关键词F.序号途径(如报告号、专利号、标准号、会议号等)ISBN号即国际标准书号(International Standard Book Number)。
其定长为10个数字,分四节,分别表示地域号、出版社号、该出版社出版图书的流水号及计算机校验位。
由ISBN号可知该书的语种区、出版社、流水号等出版信息。
G、摘要H、作者单位I、参考文献四、各类文献的检索方法与技巧信息按照出版形式和内容的不同,可分为图书、期刊、报纸和特种信息。
特种信息也叫灰色信息,包括学位论文、专利信息、标准信息、会议信息、科技报告、政府出版物、产品样品资料和档案,在收藏管理上往往与图书、期刊、报纸分开,分别管理。
(一)综合、全面的数据库(说明:下文各种特种信息大都也可在这些数据库中查到,将不再列出)1、中国知网(中国知识资源总库):/是全球领先的数字出版平台,全球信息量最大、最具价值的中文网,采用自主开发并具有国际领先水平的数字图书馆技术,建成了世界上全文信息量规模最大的"CNKI数字图书馆",现已发展成为集期刊杂志、博士论文、硕士论文、会议论文、报纸、工具书、年鉴、专利、标准、国学、海外文献资源为一体的、具体国际领先水平的网络出版平台,任何人、任何机构都可以在中国知网建立自己个人数字图书馆,定制自己需要的内容。
信息检索基本知识
T
TB TG TH TE …… TU TV
TB1
TB2
TB3
TB4
…… TB48 …… TB488
……
TB482
TB489
T—工业技术类中图法举例
以T-工业技术大类下的TP类展开下位类如下: T 工业技术 TP 自动化技术、计算机技术 TP3 计算技术、计算机技术 TP39 计算机应用 TP393 计算机网络 TP393.0 一般性问题 TP393.01 计算机网络理论 TP393.02 计算机网络结构与设计
二、文献信息源类型
文献可按不同的方法分类描述,比较常见 的分类方法有如下三种: 按信息的载体形式划分(印刷、胶片、 电子文献等); 按信息加工的级别划分(四次文献); 按信息的发布形式划分(十大文献信 息源等)
1、按文献的载体形式划分
• 印刷型(Printed form):以纸张为载体 • 缩微型(Microform):以感光材料为载体:胶片 • 声像型(Audio-Visual form):以声像记录材料为 载体:磁带 • 电子型(Machine Readable form):以计算机信息 存储设备为载体 :软磁盘、光盘、硬盘等
叙词
•叙词是主题语言的高级形式。是以较正规和正式的 科学名称为基础组织而成一种主题法检索标识系统。 •由在概念上不可再分的基本概念单元词汇组成,检 索时可以利用这些单元词进行组配,以表达一个复杂 的概念。
•如课题: 太阳能热水器研究 汉语主题词表中正式主题词是太阳能利用、太阳 能加热等代替。
标题词
• 国际十进分类法(UDC: UDC(Universal Decimal Classification)
又称为通用十进制分类法。是世界上规模最大、用户 最多、影响最广泛的一部文献资料分类法。原由比利 时人P.-M.-G.奥特莱和H.-M.拉封丹在《杜威十进分类 法》第6版的基础上编成。近百年来,UDC已被世界 上几十个国家的10多万个图书馆和情报机构采用。 UDC目前已成为名符其实的国际通用文献分类法。
网上标准信息检索
国外发达 国家标 准信 息的检 索途 径标准信息
中 图分类 号 :5 . 227
1 国 内标 准信 息的检 索
1 1 中 国 标 准 咨 询 网 t t  ̄/ w h at dr ci. . hp/ w w ca s na o t n a d n 印 ) 中 国标 准 咨 询 网 是 由 中 国 技 术 监 督 情 报 协 台 、 京 中 , 北
文献标识 码 : B
文章 编号 :08 37 (020 一O9 —0 10 — 9920)1 02 2
准、 A公安标 准、 G轻工标 准、 H石 油 标准 等几类 。用 户 G Q s 只要选择其中的一 类 , 然后 在检索框 中输入标 准号 、 准名 标 称, 即可获得该条标 准的全部信 息。另外 , 国际标准数 据库 和国外标准数据库的查询系统可提供 国际、 国外标准数据库
^ 目、 A w N I N、 r F D等 。 15 中 国 标 准 网 (u :/ ,, 硝 恤 n 一 中 国 标 准 hp / wm  ̄z )
标准文木服务 , 0 Ec IU等国际标 准文本服 务, 、s I 、 、 5 T A B、 DN、S E AT I A M SM等国外标准文本服务 . 量检定规程 、 量 计 计
I2 国 家 质 量 技 术 信 息 服 务 网 (l t/ w .b . ht / w w 【 p d
唧 ) 。国家质量技术信 息服务 网是 由北京铭 日创 意科技 有 限公司于 19 97年创办成立 , 是检索标 准信息、 计量 信息和质
量 信 息 的 专业 周站 。该 周 站 提 供 的 服 务 和 内容 有 : 内各 类 国
达国家标准等 l 5种数据库 的检索 服务 。 同时可 提供 多项 可供查询 的数据项 , 标准号 、 如 主题词 、 国际标 准分类号 、 采 用关系等 。另外该网站设有 “ 标准馆 “ 、 网上标准 图书 目录” 等栏 目, 用户 可通过浏览选 择 己所需要 的信息 l4 中国标准计量信息网 (t :/ .t 。 1 。 中 hp/ w s c【 Ⅲ】 t dr _ j 国标准计量信息 网 收录 了国家标 准 目录 ( 包括 国内标 准 目 录、 国家建设标准 目录 、 军标 目录 )行业标准 目录; 方标准 : 地
第二章 信息检索的基本知识
应用举例:
利用《中图法》在《全国报刊索引》中查找 有关“建筑抗震设计”方面的相关文献。 第一步:分析课题,按学科属性属于“T工业技术” 中的“TU建筑科学”大类。 第二步:查《中图法》确定分类号为:T工业技 术—TU建筑科学—TU3建筑结构—TU352.11抗震结 构。 第三步:根据《全国报刊索引》(科技版)的分 类目录给出的TU3建筑结构的页次,得到相关文献。 第四步:根据的出处索取原始文献。
第二章 信息检索的基本知识
主要内容
1.信息检索概述 2.信息检索原理及检索语言 3.信息检索系统与检索工具 4.信息检索的一般程序
2.1 信息检索概述
2.1.1信息检索的含义
信息检索(Information Retrieval)是指 将信息按一定的方式组织和存储起来,并根据用 户的需要找出有关信息的过程,又叫信息储存与 检索(Information storage and Retrieval), 这是广义的信息检索,如图2-1所示。狭义的信息 检索则是仅指该过程的后半部分,即从信息集合 中找出所需信息的过程。
内容特征 标题词 主题语言 关键词 叙词 描述文献外表特征的检索语言,例如篇名、著者姓名、文 献号等作为文献标识与检索依据直接明了,使用时较为简单。 而文献内容特征的语言,也就是分类语言和主题语言的原理和 使用方法是下面主要介绍的内容。
一条中文书目记录:
题名: 信息检索 作者: 徐天秀 出版项:北京:科学出版社,2006 页码: 320页 价格: CNY23.00 主题: 情报检索 索取号: G252.7/101 内容提要:本书是一本工具型书籍,提供的信息检索学科 范围广,内容尽量以最新版本为主,是一本适用性强的学 习信息检索方法和技巧的专著,尤其是本书配制的多媒体 光盘,为本课程的学习提供了便捷。 分类: G252.7
中外标准信息检索
面对质量认证事业的迅速发展的大好局面, 国际标准化组织ISO在1987年推出ISO9000 系列标准,已被百余个国家和地区采用。 ISO9000现象的出现的根本原因,是各国的 采购商和供应商对标准的普遍认同,并将符 合ISO9000标准的要求作为贸易活动中建立 相互信任关系的基石。
工作标准 是指对工作的责任、权利、范围、质量要求、程序、 效果、检查方法、考核办法所制定的标准。工作标 准一般包括部门工作标准和岗位(个人)工作标准。
强制性标准
强制性标准是法律发生性的技术,即在该法 律生效的地区或国家必须遵守的文件,包括 三类:保障人体健康的标准、保障人身和财 产安全的标准、法律和行政法规强制执行的 标准。 推荐性标准 推荐性标准是建议性的技术文件,即推荐给 企业或团体机构或个人使用的技术文件。
指导性标准:对标准化工作的原则和一些具体
举例:质量管理体系标准ISO9000
ISO9000是国际标准化组织ISO耗时10年制 订出来,并于1987年推出的全世界第一套 也是目前惟一的一套关于质量管理的国际 标准。它汇集了西方发达国家质量管理专 家的智慧和众多成功企业的经验,它的科 学性、适用性已得到国际社会的认可,并被 100多个国家、地区采用。ISO9000族标准 不仅被企业广泛采用,而且也被政府机关、 学校、医院、图书馆等组织所采用,成为 适用于各个行业和各种组织的质量管理体 系标准。
标准是为了在一定范围内获得最佳水平
一
什么是标准
的管理,对科学、技术和经济领域内具 有重复应用特征的事物所作的统一规定。
标准化的重要意义是改进产品、过程和服务
的适用性,防止贸易壁垒,促进技术合作。
GB/T 50280-1998 城市规划基本术语标准 GB/T 11061-1997 天然气中总硫的测定 氧化微库 仑法 ISO 1005-7-1982 铁路车辆材料 第7部分:牵引和 拖动的轮副 质量要求 GB/T 17002-1997 防伪印刷产品生产管理规范 GB 14544-1993 氯乙烯安全技术规程 GB 19296-2003 茶饮料卫生标准
9种常见的文献检索途径
9种常见的文献检索途径
常见的文献检索途径有:
1.直接法,也称为常用法,是直接利用检索系统(工具)检索文献信息的方法。
具体可以分为顺查法、倒查法和抽查法。
2.追溯法,不利用一般的检索系统,而是利用文献后面所列的参考文献,逐一追查原文(被引用文献),然后再从这些原文后所列的参考文献目录逐一扩大文献信息范围,一环扣一环地追查下去的方法。
3.循环法,也称分段法或综合法。
它是分期分交替使用直接法和追溯法,以期取长补短,相互配合,获得更好的检索结果。
此外,还有数据检索途径、图像检索途径、知识检索途径、语音检索途径、实体重构检索途径、领域本体知识检索途径等其他途径。
其中,数据检索途径是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法;图像检索途径是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法;知识检索途径是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法;语音检索途径是指针对项目的特点,选择有关
该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法;实体重构检索途径是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法;领域本体知识检索途径是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。
第五章标准文献信息检索zx
5.2.6 标准检索举例 (3)确定分类号: 利用《中国国家标准分类法》或者《中华人民共和国国家标准目 录及信息总汇2003》上的分类目录,确定题目的中标法分类号。 1)按题目内容,先确定大类,在《中华人民共和国国家标准目录 及信息总汇2003》的中标法一级大类表中选择相符的类号:A 部综合部,取类号A 。 2)在《中华人民共和国国家标准目录及信息总汇2003》,A部的二 级类目中查找。
国家标准专业分类目录
(2)第二部分《被废止的国家标准目录》 (3)第三部分《国家标准修改、更正、勘误通知信息》 (4)第四部分目录的索引
5.2.4 中国国家标准文献简介 《中国国家标准汇编》 收录我国正式发布的全部国家标准全文,按标准号编 号排序,分册出版。按标准号途径查找。修订标准另 出分册。
5.2.5 电子、网络标准信息检索 电子、 1.光盘检索工具 2.标准网站 (1)海南质量网 (2)中国标准咨询网/ (3)中国标准网 (4)标准信息服务网 (5)机械工业标准服务网 (6)国家标准化管理委员会 (7)标准网/ (8)福建质量信息网 (9)国家建筑标准设计网/ (10)中外标准
《中国标准全文服务系统》检索帮助包括 中国标准全文服务系统》 个性化检索、二次检索与显示格式选择、关联检索、分类浏
览。 按标准的“中国标准分类号(CCS分类)”检索 按标准的“国际标准分类号(ICS分类)”检索 标准全文浏览与内性化检索针对此库的特点,提供了直观、 方便、易用的组配检索入口,用户只需通过下 拉菜单点选所要检索的字段,输入相应检索词, 便可组配出比较复杂的检索表达式。
信息检索
2.按信息的加工级别划分
• 零次文献(实验记录、手稿、原始录音、谈话记录等) • 一次文献(图书、期刊论文、会议论文、科技报告、专
利、标准等)
• 二次文献 (目录、题录、文摘等) • 三次文献 (文献综述、年鉴、词典)
三次文献之相互关系
读者查找
一次文献
二次文献
三次文献
作者发表
三、 信息检索的技术与方法
信息检索的技术
• 布尔逻辑检索 • 截词检索 • 限制检索
(一) 布尔逻辑检索
• 布尔逻辑组配运算是采用布尔代数中的逻辑 “与”、逻辑“或”、逻辑“非”等算符,将 检索提问式转换成逻辑表达式,限定检索词在 记录中必须存在的条件或不能出现的条件。
• 凡符合布尔逻辑所规定的条件的文献,即为命中文献。
以事实作为检索对象,查找用户所需的描述性 事实,其检索对象为机构、企业、人物的基本 情况、历史变迁等。 百科全书、工具书
(二)信息检索的意义
1.节约研究人员的时间,避免重复劳动 科学研究具有继承和创造两重性,科学 研究的两重性要求科研人员在探索未知或 从事研究工作之前,应该尽可能地占有与 之相关的信息。信息检索是研究工作的基 础和必要环节,成功的信息检索无疑会节 省研究人员的大量时间,使其能用更多的 时间和精力进行科学研究。
1. 逻辑“与”(并且)
• 符号:“and” 或“*”表示 • 表达式:A*B 或者 A and B
• 意义:检索记录中必须同时含有检索词AB的 文献,才算命中文献 • 作用:增加限制条件,即增加检索的专指性, 以缩小提问范围,减少文献输出量,提高查 准率。
2. 逻辑“或”(或者)
• 符号:“or” 或 “+”表示 • 表达式:A OR B 或 A+B • 意义:检索记录中凡含有检索词A或含有检索 词B,或同时含有检索词A、B的,均为命中文 献文章。 • 作用:放宽提问范围,增加检索结果,起扩 检作用,提高查全率。
标准文献检索(国内、国外)
标准文献检索标准文献是按照规定程序编制并经过一个公认的权威机构(主要机关)批准的,供在一定范围内广泛而多次使用,包括一整套在特定活动领域必须执行的规格、定额、规划、要求的技术文件。
通常统称为“标准”。
标准文献与图书、期刊、专利、学位论文、技术报告、会议文献等完全不同,标准文献的制定要通过起草、提出、批准、发布等,并规定出实施时间与范围。
标准文献有利于企业或生产实现经营管理统一化、制度化、科学化。
标准文献反映的是当前的技术水平,国外先进的标准可以为我们提高工艺技术水平、开发新产品提供参照。
另外,标准文献还可以为进口设备的检验、装配、维修和配置零部件提供参考。
因此,标准文献可以说是世界重要的情报资源,它为整个社会提供了协调统一的标准规范,起到了解决混乱和矛盾的整序作用。
1.标准文献的种类与特点标准文献的分类可按其使用范围、内容和性质、成熟程度来划分。
按使用范围,可划分为:∙国际标准,指国际间通用的标准,如ISO、IEC等;∙区域标准,指世界某一地区通过的标准,如“全欧标准”等;∙国家标准,由国家标准化机构批准颁布的标准,我国的国家标准号是GB;∙专业标准,根据某专业范围统一的需要,由专业主管机构和专业标准化机构批准发布的标准;∙部门标准,由某个部门和企业单位等制定的适用于本部门的标准,如“部标准”、“企业标准”等;∙基础标准,在一定范围内,普遍使用或具有指导意义的标准。
按内容及性质,可划分为技术标准和管理标准。
技术标准包括基础标准、产品标准、方法标准、安全与环境保护标准;管理标准包括技术管理标准、生产组织标准、经济管理标准、行政管理标准、业务管理标准、工作标准。
按成熟程度,可划分为正式标准和试行标准两类(或称作强制性标准和推荐性标准)。
标准文献的主要特点是有固定的代号和专门的编写格式。
按照我国管理标准的有关部门的规定,我国标准的代号一般用两个大写汉语拼音字母表示。
企业标准则在大写拼音字母“Q”后加斜线“/”加企业代码表示。
信息检索
信息检索1.信息检索的概念。
狭义信息检索是指用户找出有关信息的过程。
广义信息检索是将信息按照一定的方式组织和存储起来,并根据用户的需求找出有关信息的过程。
2. 信息检索的类型(1)按照检索对象的不同划分早期分为:文献检索、事实检索、数据检索。
当前三分方法:文本检索、音频与视频检索、数值检索。
(2)按检索手段划分:手工检索、机器检索3.简述信息检索的基本原理信息检索的基本原理:对信息集合与需求集合的匹配与选择。
实现信息检索,主要涉及三个关键要素:信息集合、用户信息需求、匹配选择。
一、信息集合:信息集合是指有关某一领域的,经采集、加工的信息集合体。
二、需求集合:用户的信息需求是在社会实践活动中产生的。
当人们在完成某一任务或工作时,经常觉得缺少某些知识,这就产生了信息需求。
三、选择与匹配:要在信息集合中快速获取用户所需信息,需要信息检索提供一种匹配机制,能够把需求集合与信息集合依据某种相似性标准进行比较与判断,进而选择出符合用户需要的信息。
匹配机制至少包括两个要素:第一是匹配标准,即相似性标准;第二是执行匹配的动因。
4.计算机信息检索经历了脱机检索阶段、联机检索阶段、光盘检索阶段、网络检索阶段。
5.信息检索领域的主要研究问题有哪些?⑴信息检索理论:检索语言、检索模型、标引理论、相关性理论、知识组织与表示理论⑵信息检索工具/系统:信息检索系统的结构、功能、设计开发、管理运营、应用评价等⑶信息资源及其收集、加工:信息存储、数据库⑷检索技术与方法:文本检索技术、数值检索技术、音频与视频检索技术、网络搜索技术⑸用户研究与检索策略:用户的查询心理、检索需求及其类型、用户查询信息的行为特征等、用户信息需求分析、检索式构造、相关反馈方法、检索过程调整与控制等⑹其他密切相关的自动化处理技术:自动聚类与分类、自动摘要、信息可视化、信息过滤、信息提取、机器翻译、人机交互等。
信息检索的两种研究方式:以计算机为中心和以用户为中心,以计算机为中心的IR问题是主流。
文献检索与利用要点
情报的定义:运用一定的媒体(载体),越过空间和时间,传递给特定用户,解决具体问题所需要的特定知识和信息。
情报三要素:知识或信息、传递、效益。
信息的定义:信息是关于一切事物运动状态和运动方式的反映。
按信息来源可分为直接信息和间接信息。
直接信息是指从信息源获得的信息,具有迅速、及时的优点,但不宜收集和管理,因而其检索利用受到限制;间接信息是相对直接信息而言的,它不是直接从信息源获得,而是通过某种中介(往往是信息的载体)获得的,因而具有全面、系统等优点,也便于检索利用。
信息的特征:普遍性传递性依附性时效性共享性转换性可知性林业信息的特点:广博性综合性和离散性时效长地域性文献的定义:文献(Document):记录有知识的一切载体。
首先,必须具有信息或知识(应具有历史价值或学术价值);其次,必须具有用来表述信息或知识所使用的记录符号或语言符号;最后,必须具有用来记录信息和知识的载体。
从古代的甲骨文、陶文、竹简、纸到现在的光盘等。
知识(或信息)、记录和载体是构成文献的三个基本要素。
知识(或信息)决定文献内容,载体决定文献形态,记录则是构成文献的手段。
文献的类型:按文献的载体分,可分为:印刷型文献;声像型文献电子型文献网络型文献按文献加工层次分,可分为:零次文献,一次文献.二次文献.三次文献按出版形式分,可分为:图书国际标准书号(ISBN――International Standard Book Number),对任何一本图书来说都是唯一的.国际标准书号(ISBN)ISBN 978-7-5038-2565-0978——国际物品编码协会(EAN International)指定给国际标准书号(ISBN)系统的专用前缀码是978。
7――表示语种代码,此处代表汉语(0――表英语,1――表法语,2-代表德语)5038――表示出版社代码,允许取值范围为2-5位数字。
出版社的规模越大,出书越多,其号码就越短。
此处代表中国林业出版社2565――表示种次号,由出版社自己给出,而且每个出版社的书序号是定长的。
简述信息检索的步骤
信息检索的步骤1. 引言信息检索(Information Retrieval)是指根据用户需求从大规模的信息集合中获取相关信息的过程。
它是现代信息科学与计算机技术的重要研究领域,涉及信息的组织、存储、索引和检索等方面。
本文将从信息检索的步骤出发,全面探讨信息检索的过程及相关技术。
2. 步骤简述信息检索的步骤可以概括为以下几个阶段:问题定义、信息需求分析、信息检索、结果评价和反馈等。
下面将详细介绍每个步骤。
2.1 问题定义问题定义是信息检索的第一步,它要求明确用户的信息需求,并将其转化为可理解的检索表达式。
这一步骤在很大程度上决定了后续信息检索的效果。
在问题定义阶段,可以通过以下几种方式进行问题的描述和定义:•直接查询:用户直接使用自然语言描述问题,并转化为检索表达式。
•关键词提取:从用户的问题描述中提取关键词,作为检索的关键词。
•标准化查询:将用户的问题转化为标准查询语言,如SQL、SPARQL等。
2.2 信息需求分析信息需求分析是根据问题定义阶段得到的检索表达式,进一步分析并理解用户的需求。
在这一阶段,可以从以下几个方面进行分析:•目标信息类型:确定用户所需的信息类型,如文本、图片、视频等。
•信息来源:确定用户需要的信息来源,如数据库、互联网、图书馆等。
•检索范围:确定用户所需信息的时间范围、地理范围、作者范围等限定条件。
2.3 信息检索信息检索是根据用户的需求,在信息集合中进行检索,并返回满足用户需求的相关信息。
信息检索可以通过以下几个步骤实现:1.建立索引:根据信息集合的特征,建立相应的索引结构,用于加速检索过程。
2.查询处理:将用户的查询表达式与索引进行匹配,找出与查询相关的文档。
3.结果排序:根据文档与查询的相关度,对搜索结果进行排序,以便用户更好地获取相关信息。
4.结果呈现:将排序后的结果以适当的方式呈现给用户,如列表、摘要、图表等。
2.4 结果评价结果评价是对信息检索的效果进行评估和调整的过程。
信息的检索方法
信息检索方法包括以下几种:
分类法:将信息按照一定的规则和标准进行分类,从而方便用户进行查找和检索。
追溯法:利用已有文献所附的参考文献不断追踪查找的方法,在没有检索工具或检索工具不全时,此法可获得针对性很强的资料,查准率较高,查全率较差。
分段法:是追溯法和普通法的综合,它将两种方法分期、分段交替使用,直至查到所需资料为止。
逻辑运算:运用各种逻辑运算符号、位置逻辑算符、截词符及其它限制符号等来组配检索词,确定它们之间的关系,准确表达检索课题的内容。
截词检索:在合适位置截断检索词,再使用截词符处理,既能减少字符数目,也可提高检索的查全率。
位置检索:限定检索词之间相对位置的检索技术,包括位置关系和前后次序。
普通检索:利用书目、文摘、索引等检索工具进行文献资料查找的方法。
普通法又可分为顺检法和倒检法。
顺检法是从过去到现在按时间顺序检索,费用多、效率低;倒检法是逆时间顺序从近期向远期检索,它强调近期资料,重视当前的信息,主动性相关书籍强,效果较好。
追溯和分段检索。
此外,还有利用布尔运算符把各个检索词连接在一起,组成一个逻辑检索式,再由计算机进行相应逻辑运算,从而找出所需要信息的方法。
以及利用书目、文摘、索引等检索工具进行文献资料查找的方法。
行业标准怎么查
行业标准怎么查
首先,最直接的方法就是通过国家标准化管理委员会的官方网
站进行查询。
国家标准化管理委员会是我国标准化工作的主管部门,其网站上可以查询到各个行业的国家标准、行业标准、地方标准等。
在网站的首页,一般会有标准信息检索的入口,用户可以根据自己
的需求输入相关的关键词进行检索,就可以找到相关的标准信息。
其次,还可以通过一些专业的标准检索平台进行查询。
比如中
国标准在线、万方数据等,这些平台都提供了大量的标准文献资源,用户可以通过关键词、标准号等信息进行检索,找到自己需要的标
准文献。
另外,一些行业协会、行业组织也会发布行业标准,因此可以
通过这些机构的官方网站或者相关的会刊、期刊进行查询。
有些行
业协会会将自己行业内的标准进行整理和发布,这些标准对于行业
内的从业人员来说具有很高的参考价值。
此外,还可以通过图书馆、标准信息中心等途径进行查询。
一
些大型的图书馆和标准信息中心都会收集整理大量的标准文献,用
户可以前往这些机构进行实地查询或者借阅相关的标准文献,以满
足自己的需求。
最后,还可以通过一些专业的标准咨询机构进行咨询和查询。
这些机构通常会收集整理大量的标准文献,拥有专业的咨询团队,可以为用户提供标准咨询、标准解读等服务。
总的来说,查询行业标准的方法有很多种,可以根据自己的实际需求和情况选择合适的方法进行查询。
掌握行业标准对于企业来说可以提高产品质量,对于个人来说也可以提升专业技能,因此大家都应该重视起来,并且学会如何进行标准查询和应用。
希望以上介绍对大家有所帮助,谢谢!。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
标准信息检索一、标准文献检索的一般方法1、文献检索的概念①广义文献检索:一是存储;二是查找。
存储是指将收集到的文献加工、整理,使之有序集合。
②狭义文献检索:仅指查找过程。
2、检索工具①书本式:如期刊、目录。
②卡片式:逐渐淘汰。
③计算机:单机,联网。
3、检索方法①选定检索工具。
根据环境条件和个人习惯,选用手工或机械检索。
②确定检索途径。
如分类法,主题(中心)词法,标准代号,标准发布日期等。
③循坏扩展法收集相关标准。
如相关通用标准,原材料标准,测试方法标准等。
二、《中国标准文献分类法》1、《中国标准文献分类法》体系结构与类目划分用字母和数字混合组合类分标准。
一级类目为字母,共24个大类,从综合,农业林业……环境保护,依次用A ,B..…Z大写字母表示。
二级类目采用双位数字表示,每一大类下包括00—99共100个二级类目。
二级类目之间用分面标识,如B00/09 (农业林业综合)来划分,起范围限定作用。
2、中国标准文献分类标记一级:A综合;B农业、林业;C医药、卫生、劳动保护;D矿业….B农业、林业00/09农业、林业综合00标准化、质量管理01技术管理02维修管理04基础标准与通用方法05农业技术08标志、包装、运输、贮存09卫生安全、劳动保护30/39经济作物30经济作物综合31瓜果、蔬菜种植与产品32纤维作物与产品3、分类注意事项(1)在每一个大类内具有广泛指导意义的标准文献,这类标准一般集中列在二级类目的首要位置(如B00)o(2)通用标准相对集中,专用标准适当分散。
如通用紧固件入J机械类,航空用紧固件入V航空、航天类;起重、输送、装卸机械入J机械类、纺织机械入W纺织类、油漆入G 化工类,绝缘漆入K电工类。
(3)各类有关基本建设、环境保护、金属与非金属标准集中到P、Z、H、Q类,(4)大类交叉的,如农、林类与食品,小麦、大豆入B22, 面条,豆制品等入XII;纺织品与原料,皮棉入B32,棉纱入W12o番茄入B31,番茄酱入X26o(5)产品的零部件、工艺、工装、试验方法,凡没有单独设类的,一律随产品入同类。
如自行车的零部件标准入Y14。
(6)细读《分类法》中的“范围注解”栏目,按其指引说明入类。
如Y41香精、香料,“范围注解”中指明:“食用香精、香料入X44/46”。
4、国内标准于工检索工具书各级、各专业类的书本汇编目录和专业杂志。
2002年底总计:GB 20206项,行标27000项,备案地方标准5300项,备案企标100万项。
三、国际标准化组织(ISO)标准以及《国际标准分类法》1 ISO标准种类:©ISO推荐标准(ISO/R), 1972年以前制定的标准。
②ISO国际标准,经ISO全体成员协商,表决通过的正式标准。
③国际标准草案(DIS),在ISO中央秘书处注册后,送交全体成员团体投票表决的标准文件。
如有75%的赞成票,才能作为国际标准正式发布。
④ISO技术报告(ISO/TR),第一类技术报告——草案(DIS)未获通过,或者对能否得到普遍支持有怀疑时,将DIS作为技术报告岀版。
第二类技术报告一一对尚处于技术发展中的标准化课题,或将来可能达成协议的项目,技术委员会发布一份适当的技术报告。
•出版后两年内进行复审(或转为正式标准,或再延长使用两年,或予撤销)。
第三类技术报告一一无任何规定性的内容,但是一种很有参考价值的信息资料。
⑤ISO/IEC联合委员会(JTC1)制订的国际标准及其草案。
©ISO/IEC国际标准化模式(ISO/IEC ISP),与IEC联合发表的有关国际标准化的指导性框架文件。
⑦ISO/IEC技术趋势评估(ISO/IEC TTA),与IEC联合发表的关于某项技术发展趋势的指导性文件。
⑧ISO/IEC导则,关于标准化的指导性文件。
到2002年底,ISO已发布的国际标准共计13736项。
标准编号:ISO/TR 3818 : 1997标准代号标准序号制定年份2、I SO在制定标准内容方面的特点:①重视基础标准的制定,如术语、符号、图形、量和单位、标志、环境条件和试验、可行性评价、互换性和兼容性等。
②测试方法标准占有重要比例,现有将近一半是测试方法,产品标准很少。
主要目的是”为便利国际物资和服务的交流”。
③突岀安全卫生标准。
3.《国际标准分类法》(ICS)(1)简介国际标准曾用《国际十进分类法》(UDC)类分,因复杂, 故需要具备专门的知识和训练。
1992年,国际标准化组织信息委员会(ISO/INFCO)推出了一部标准文献专用分类法,称为国际标准分类法,简称ICS。
它为世界各国提供了一部分类管理与检索标准文献的重要工具,推动了标准信息在世界范围内的传播与交流。
根据ISO决定,ISO标准目录己从1994年起改用ICS 分类法,CEN(欧洲标准化委员会)决定,欧洲标准(CEN)分类与ICS接轨,德、法、英等发达国家都改用ICSo到目前, 世界上绝大多数国家和标准化组织都采用ICS分类法。
我国1996年开始在国家标准封面上用ICS代替UDC分类号。
(2)类的划分及其标识ICS是一部等级制分类法,用数字分段表示等级。
一级类目(大类)设41个,将41大类(一级类)再分为351个二级类;在351个二级类中,有127个被进一步细分成三级类。
有3/5 的二级类没设三级类。
如分类号” 65. 060. 60”表示葡萄栽培和酿酒设备类。
一级类号”65”表示农业,二级类号”65.060”表示农业机械、工具和设备。
例一、如要查番茄,查到”67”一食品技术,继续,查到”67.080”一水果蔬菜,继续,查到”67.080.20”一蔬菜及其加工。
在该类下可查到”ISO 5524: 1991 番茄冷藏和冷藏运输指南例二、如查葡萄酿酒设备,通过ICS分类目录查到”65.060.60”,即可在其分类号下查到:ISO5703:1979葡萄挤压机试验方法ISO7224:1983 捣碎泵试验方法(3)ICS分类特点一一灵活性一个标准可以入两个或更多的二级类或三级类,有利于多处检索。
如《ISO3477: 1981聚丙烯管与配件•密度•测定与规范》可入“23.020.20”塑料管和“23.020.45”塑料配件两个三级类中。
允许用户根据文献情况进行上位归类或扩类细分。
如果文献量少,入上一级;同一类文献量大而ICS没设三级类的,也可扩到三级细分。
四、国外先进标准及其手工检索工具.1.国外先进标准:①国际上有权威的国际性组织制定的标准,如联合国粮农组织(UNFAO),世界卫生组织(WHO)o食品法典委员会(CAC),国际种子检验协会(ISTA)o总计经国际标准化组织(ISO)确认的约40 余个国际标准组织发布的标准。
②国际上有权威的区域性组织制定的标准,如:欧洲标准化委员会(CEN),亚洲、大洋洲开放系统互联研讨会(AOW)等组织制定的标准。
③世界主要经济发达国家的国家标准,如美国(ANSI)、德国(DIN)、英国(BS)、日本国工业标准(JIS)、法国(NF)、意大利(UNI)、俄国(IOCT-P)o④国际上公认的行业性团体标准,如美国材料与试验协会标准(ASTM),美国石油协会标准(API),美国食品与药物管理局(FDA) 标准等。
⑤ 国际上公认的先进企业标准,如美国波音\IBM\HP\德国西 门子等。
2. 各国标准编号标记方式大同小异,一般是:标准发布组织 代号+标准序号+标准发布年代号。
女n ANSI(美) ANSI B 11.17-1996-------- P 代号字母类号数字类号 标准序号DIN EN 113-86 (双号标准) —等同采用欧盟EN 113-86字母类号数字类号标准序号3、手工检索工具① 《世界标准信息》,中文月刊,中国技术监督信息研究所编辑岀版,重点报道该所最近入藏的国外标准文献。
② 各国标准化组织出版的综合性目录,是年度累计的现行标准汇集。
如《DIN 技术规程通报》《日本工业标准目录》《英国标准目录》。
③ 专刊通报,如《DIN 技术规程通报》法国《博弈》日本《标准化杂志》NF (法) NF A 45 313 1984DIN (德)4、国外发达国家标准的基本情况。
标准级别:基本划分为国家标准,团体标准和企业标准, 标准本身不具有强制性。
标准的形式:包括标准,技术导则,标准案例,补遗和公告,近年来又出现了协议标准和事实标准等新形式(反映在跨国公司如微软等)。
①美国分联邦政府和非联邦政府(即各协会学会)标准体系,联邦政府体系标准数量约4.4万项,非联邦约5万项。
美制订标准的非联邦政府机构有600余个,且日见增多。
②法国标准(NF)由法国标准协会(AFNOR)下设的各技术委员会制定,标准文件分为:正式标准(HOM),试行标准(EXP 试行期5年),文献分册(FD),标准化参考文献(RE)o只有正式标准才属于法国国家标准。
③德国标准(DIN)有2万多项,有近200个专业团体,协会,民间组织和政府机构制定标准,有正式标准,暂行标准,双号标准之分(不加修改采用ISO.EN等团体标准)。
④日本有数百个专业团体,协会,行会承担日本工业标准(JIS,现有8000多项)和日本农林标准(JAS,现有500 多项)的制定,还制定了本行业用的团体标准约4500余项。
五、标准信息系统的建设1、标准信息系统建设的三项任务①标准信息资源的开发。
包括信息采集、加工、编目、存储等。
②应用子系统的开发。
包括各种服务的应用软件,如管理、查询、检索、过程通讯、电子岀版等。
③网络平台建设。
包括建立传输设施,形成通讯网络。
2、数据库的建立(狭义)①确定数据的录入格式和内容。
内容应包括标准号、题名、分类号、关键词、发布日期、作废及其被代替信息,页码,来源等。
②尽量采用快速的录入方式。
如扫描、磁盘、光盘输入等代替手工。
③建立规范的质量保证工作流程。
如进行双屏幕延迟性两次录入比较;复审校对,在预备库中完成查重等。
④数据库的维护。
如增加新数据,剔除旧数据。
量超过了预测后需要新的附加区;由于发展,增加新的字段或类型。
⑤建立数据库的安全系统。
防止不合法使用和破坏子系统正常运行,如设置密码和使用权限,电子身份确认,防火墙等。
系绒服勞窗口 [也 帮肋迫]|空財豪必口电口口昌 @ '雀耻亡机构代码爭务处理 n 条码成员管理□条码检测管理1•…D 标唯文献检素系绒 ;…亡1职员档案管理n 《新疆技术监督》业鸳管理□ 公众发布信息維护/r质L .▲标淮文献检索系统文鮒护国业势管理[印流通服务腔]业貓计迥WW帮助曲s.ssts te紳°s 媒IL i?i 蜃 製旺 -0Cny 1 I nrv- •恣 dZ. 羽®悴 Iff Kg t+ 匪如熬-m I 聘 要*••i>M、 1TT —a-*/r— i 曲 Ir□|nco-r —«雀 1*—* C-\Jco VLT> K £> L —co62-r —«cr»JU LUIn> ®l9 條◎ s- u翊 阻 ◎ &S S ) S密地Is確回画I-S-里-Ml脇礙J 亠爸J画e 3囂£•口宓 s s i s s i a s ss &i六、计算机检索步骤:(以区信息所为例)① 双击桌面图标SDMSo 进入“标准文献管理检索系统” 界面。