3信息需求及其表达4信息检索基础

合集下载

第一讲 信息检索 PPT课件

第一讲 信息检索 PPT课件

第一节 信息 知识 情报 文献
2.知识 知识是人类认识的成果或结晶,是系
统化信息的集合. 知识的属性:
意识性 信息性 实践性 规律性 继承性 渗透性
第一节 信息 知识 情报 文献
3.文献 知识借助于一定的语言形式或物化为某
种劳动产品的形式,就成为可以交流的 文献。 文献的三要素:知识、载体、纪录方式。 文献的属性:知识信息性、客观物质性、 人工纪录性、动态发展性等。 文字形式的文献变成数据形式即称之 为电子文献。
信息的重要性(二)
从知识层面上理解
知识经济建立在知识 材料、 消耗 不可 不可 利用与创新的基础上, 能源 性 共享 再生 知识创新需要大量的
信息做原料。
信息与材料、能源 被称为当今社会的三 大资源
信息
非消 耗性
可共 享
可再 生
二、信息意识和信息素质
信息意识:是人们对各种信息的自觉 心理反应。
第一节 信息 知识 情报 文献
4.情报 在英汉词典中,“information”可译
为“信息”,也可译为“情报”. 情报:人们在一定的时间内为了一定
的目的而传递的有使用价值的知识. 情报的属性:知识性、传递性、效用性。 情报交流:直接交流和间接交流
第一节 信息 知识 情报 文献
信息的重要性 从情报的层面上理解 1.信息决定战争的胜负 2.信息决定企业的兴衰 3.信息是领导决策的依据。
二、文献的出版类型
按出版类型文献划分以下十大类:
(1)图书 (2)期刊(3)会议文献 (4)科技报告 (5)专利文献 (6)学位论文(7)标准文献 (8)政府出版物(9)产品资料 (10)技术档案
二、文献的出版类型
1.科技图书(Sci-Tech book) 阅读类:科普读物、专著、文集等 工具类:百科全书、年鉴、手册、词典等。

信息检索

信息检索

中文书本式的检索工具
《国内总书目》--《全国新书目》《科技新 书目》:查找国内出版的图书目录 《外文新书通报》:查找国外新书目录 《全国报刊索引》:查找国内期刊论文的工 具 科技 文献书目型数据库检索系统 事实型数据库检索系统 数值型数据库检索系统 全文数据库检索系统
“逻辑或”的组配种类
同义词 同一个人多个姓名 通用的英文缩写 化学物名称 Eg:CAD
逻辑非
用于排除含有不需要概念的信息,可缩小所 检索信息的范围。 逻辑运算符:“NOT”、“-” 逻辑表达式:“A NOT B ”“A-B” 语义表示:被检索文献中含有A而不含有B
4字段(限制)检索
在检索系统中,数据库设置的可供检索的字 段通常有两种: 表达文献主体内容特征的基本字段 表达文献外部特征的辅助字段 基本字段包括篇目(TI)、文摘 (AB)…… 辅助字段包括作者(AU)、语种 (LA)……
4字段(限制)检索
为了缩小检索范围,可利用字段代码来限制检索词 出现的字段,以提高检索速度和命中率。 如: economic models in ti(表示只在题 目字段中查找文献) economic models in de(只在主题词中 查找) economic models in ab(只在文摘中查 找) au = Smith,J.C (查作者为Smith,J.C 的 文章) py = 1998(只查1998年的文章) la =Chinese (只查语种为中文的文献)
位置算符检索即运用位置算符表示两个检索 词间的位置。 如果说布尔逻辑算符是表示两个概念之间的 逻辑关系的话,位置算符表示的是两个概念 在信息中实际物理位置关系。
检索时会经常遇到这样的问题?

《信息检索与利用》形成性考核册参考答案-电大 2

《信息检索与利用》形成性考核册参考答案-电大 2

第一次作业一、填空题1、1984、信息意识、获取文献信息2、形成全民学习、终身学习的学习型社会3、自然、社会、客观性、普遍性、无限性、扩充性、转换性4、知识性、传递性、针对性5、知识内容、信息符号、载体材料、记录方式6、印刷型、缩微型、视听型、电子型、零次、一次、二次、三次7、ISBN、10、-、组号、出版社号、书序号、检验位二、名词解释1、P4情报:就是指为了解决一个特定问题从一定文献资料中提取或经过传递获得的知识。

2、P4知识:是人类通过信息对自然界、人类社会及思维方式与运动规律的认识与概括,是人的大脑通过思维重新组合和系统化了的信息,是信息中最有价值的部分。

3、P5文献:信息本身是看不见的,要使存在于客观世界的信息保留下来并加以传播和利用,就必须使信息依附在某种载体上,文献就是这种载体的主要表现形式。

4、P1信息意识:即人的信息敏感程度,是人们对自然界和社会的各种现象、行为、现论观点等从信息的角度理解、感受和评价。

5、P2信息能力:是指人获取信息、加工处理信息和利用信息的能力。

6、P6一次文献:依据作者本人的研究或研制成果创作的文献,即通常所说的“原始文献”、“第一手资料”。

7、P7教科书:系统归纳和阐述某学科现有知识和成果的教学用书。

8、P7工具书:供查找和检索信息和知识用的图书。

9、P9期刊:指采用统一名称,定期或不定期出版的汇集许多个某著者论文的连续出版物。

三、简答题1、P1信息意识的评价内容:(1)对信息科学的认识;(2)对信息的社会作用、经济价值的认识(3)对特定信息需求的自我识别;(4)能充分、准确地表达出对特定信息的需求。

P3信息道德的评价内容:(1)了解国家在信息及信息技术方面制定的相关政策、法律、道德规范;(2)在获取、使用信息资源时能遵守法规以及约定俗成的一些规则;(3)了解知识产权中的“合理使用”的规定,尊重原作;(4)了解影响信息资源的社会和政治问题。

2、P4从信息、知识和情报的定义可以看出,信息无处不在,信息的范围最大,信息中被人们认识的部分成为知识,而知识中被人们用来解决问题的部分成为情报。

网络信息资源检索4

网络信息资源检索4
现在大多数网络检索工具都是采用一种称为 Robot(又称为:Spider, Worms,Wanders等)的 网络自动跟踪索引程序。它实际上是一个在网络上检 索文件且自动跟踪该文件的超文本结构并循环检索被 参照的所有文件的软件。不同的自动索引软件所采用 的标引、搜索策略不同,自动索引软件搜寻、标引网 页的方式对信息检索的质量有直接影响。
第四章 Internet信息检索 1 2 3 4 网络信息检索的一般方法 网络信息检索工具 相关网络信息检索技术 搜索引擎及其原理
1 网络信息检索的一般方法
1.1 浏览
1.2 通过网络资源指南来查找信息 1.3 利用搜索引擎进行信息检索
1.1 浏览

(1)偶然发现。
这是在因特网上发现、检索信息的原始方法。
等功能。
2 网络信息检索工具
网络信息检索工具是指在因特网上提 供信息检索服务的计算机系统,其检索的 对象是存在于因特网信息空间中各种类型 的网络信息资源。
近来具一般是由自动索引程序、 数据库和检索代理软件组成的。
自动索引程序
即在日常的网络阅读、漫游过程中,意外发现一些
有用信息。这种方式的目的性不是很强,其不可预 见性、偶然性使检索过程具有某种探索宝藏的意味, 也许会充满乐趣,但也可能一无所获。

(2)顺“链”而行。
指用户在阅读超文本文档时,利用文档中的链接从一网
页转向另一相关网页。有些类似于传统文献检索中的“追溯 检索”,即根据文献后所附的参考文献目录去追溯相关文献, 一轮一轮地不断扩大检索范围。这种方式可以在很短的时间 内获得大量相关信息,但也有可能在“顺链而行”中偏离了
3、提供检索服务 用户输入关键词进行检索,搜索引擎从 索引数据库中找到匹配该关键词的网页;为 了用户便于判断,除了网页标题和URL外, 还会提供一段来自网页的摘要以及其他信息。

(完整版)信息管理学基础马费成习题重点

(完整版)信息管理学基础马费成习题重点

信息管理学基础(马费成)习题重点(精品课程)可以有很多方式的,没有固定答案,但实际工作中,要考虑实际来选择。

归结起来,主要有以下几种途径:一是使用信息管理系统,如OA系统、档案管理系统、人事管理系统、ERP 系统等;二是利用网络平台,如局域网、门户网站、VPN网络;三是使用沟通交流平台,如BBS、电子邮件、新闻组等方式、企业qq、飞信、rss订阅等;四是将其编纂成内部刊物、出版物;五是其他方式,如利用宣传栏、宣传板宣传,甚至有的更强的在公司厕所也宣传。

第一章信息与信息管理一、教学目的掌握信息、信息管理等基本概念,了解信息的特征及分类,关注信息化对社会经济发展的重要作用,明确信息管理的内容及任务,掌握信息管理的沿革及发展。

二、教学内容1.信息、信息管理等基本概念2.信息特征、性质、分类3.信息化的内容特征及重要作用4.信息管理的对象、内容、目标和任务5.信息管理的沿革与发展三、本章重点1.信息、信息管理等基本概念2.信息化的层次、阶段(三个层次,四个阶段)3.信息管理的内容任务4.信息管理的发展历程【重要概念】信息知识负熵语法信息语用信息语义信息信息流社会信息化信息社会GII “三金”工程信息管理文件管理信息资源管理知识管理【简答】1、如何理解通讯领域信息的含义?2、简述数据、信息、知识之间的关系。

数据+背景=信息数据是载荷或记录物理信息的物质符号。

信息+经验=知识信息能够转化为知识的关键取决于信息接受者对信息的理解能力3、简述信息的特征和分类。

普遍性和客观性、广延性和无限性、共享性、时效性、不可变换性和不可组合性对物质载体的独立性、对认识主体的相对性、传递性分类:按性质划分:语法信息、语义信息、语用信息4、试分述信息管理四个典型阶段。

传统管理阶段:这一阶段以信息源的管理为核心,以图书馆为象征。

以文献为主要载体,以公益性服务为主要目标技术管理阶段:这一阶段以信息流的控制为核心,以计算机为工具,以自动化信息处理和信息系统建造为主要工作内容。

第四章 信息检索模型

第四章 信息检索模型

向量空间模型
➢ 向量空间模型(Vector Space Model,VSM) 是由G·Salton等人在1958年提出的
➢ 代表系统
SMART( System for the Manipulation and Retrieval of Text)
➢ 这一系统理论框架到现在仍然是信息检索 技术研究的基础
D={d1, d2 , … , dm} 为了满足检索匹配所要求的快速与便利,文档di通常由
从文档中抽取的能够表达文档内容的特征项(如索引 项/检索词/关键词)来表示 设K={k1, k2 , … , kn} 为系统索引项集合 则di ={ωi1,ωi2 , … ,ωin} (ωij≥0) ωij→索引词kj在文档di中的重要性(权值weight)
相当于识别包含了一个某个特定term的文档
➢ 经过某种训练的用户可以容易地写出布尔查询 式
➢ 布尔模型可以通过扩展来包含排序的功能,即 “扩展的布尔模型”
布尔模型存在的问题
➢ 布尔模型被认为是功能最弱的方式,其主要问题在于不支 持部分匹配,而完全匹配会导致太多或者太少的结果文档 被返回 非常刚性: “与”意味着全部; “或”意味着任何一 个
模型中的问题
➢ 怎样确定文档中哪些词是重要的词?(索 引项)
➢ 怎样确定一个词在某个文档中或在整个文 档集中的重要程度?(权重)
➢ 怎样确定一个文档和一个查询式之间的相 似度?
索引项的选择
➢ 若干独立的词项被选作索引项(index keys) or 词表 vocabulary
➢ 索引项代表了一个应用中的重要词项 计算机科学图书馆中的索引项应该是哪些呢?
例如:文档的统计特性 ➢ 用户规定一个词项(key)集合,可以给每个词项附加权重

1-1信息检索基础知识

1-1信息检索基础知识

小 结
上述的十类主要文献中,除图书和期刊外,其 余八种被称为特种文献—非书非刊出版物,非大 量公开发行需特殊渠道获取,其使用价值往往大 于常规信息。
1.2 信息检索
1.2.1 信息检索概念 广义概念:将信息按一定的方式组织和存储起 来,并根据信息用户的需要找出有关的信息过 程,故全称:“信息的存储与检索”。 狭义概念:仅指上述过程的后半部分,即从信 息集合中找出所需要的信息的过程,相当于人 们通常所说的信息查寻(Information Search)。
标准文献(促进社会产品质量的三次文献) 1、标准:是对工农业和工程建设的质量、规格、基本单 位及其检验方法等方面由有权威部门批准的技术规定。 反映的技术工艺水平及技术政策,是从事生产建设和管 理的一种共同规范或依据。
2、 分为:国际标准( ISO ) 、国家标准(GB) 、
行业标准、企业标准 3 、进入各大标准制定机构网站进行检索
相关信息检索工作(职业)
• 1--技术部门(资料员)
• 2—业务部门(咨询员) • 3—专利代理
• 4—查新员
• 5 —市场开拓、商业情报 • 6—其他一切经常需要获取信息„„
参考教材:
1、网络信息检索与利用,隋莉萍等,清华大学出版社,2008.9 2、网络信息检索:工具方法 实践,沈固朝, 高等教育出版社, 2004.8 3、信息检索与利用教程,彭奇志,中国轻工业出版社, 2002.2 4、石油科技文献检索,谢昆、郭林根等,石油工业出版社,1999.12
• 重点要求
• 了解图书馆现有电子资源(各数据库收录内容)
• INTERNET基本知识 • Ei Compendex、Web of science (SCI)、ISTP、 Elsevier 、PQDD、UMI、中国学术期刊网、万方数 据库、dialog等文献数据库的收录内容及检索方法。

第1讲 文献信息检索基础知识

第1讲 文献信息检索基础知识

14
第二节
文献信息资源的类型、特点
(二)连续出版物
1.期刊(Journal Magazine) 是指采用统一名称定期或不定期的连续性出版物。 具有连续的卷、期号或年、月顺序号。 国际标准连续出版物编号:ISSN 国内统一刊号:CN
15
第二节
文献信息资源的类型、特点
2.报纸( Newspaper)
2.学位论文 (Dissertation) 高等学校和科研单位的学生为获取学位而提交的学术 论文。
17
第二节
文献信息资源的类型、特点
3. 专利文献(Patent Document)
指实行专利制度的国家,在专利申请、审批过程中所产生的专利 申请书、专利说明书以及官方文件或出版物。
4.标准文献 (Standards literature)
Z 综合性图书
36
中图分类号>文化、科学、教育、体育 (简表)
G4 教育
G40 教育学 G41 思想政治教育、德育 G42 教学理论 G43 电化教育 G44 教育心理学 G45 教师与学生 G46 教育行政 G47 学校管理 G48 学校建筑和设备管理 G51 世界各国教育事业 G52 中国教育事业 G53/57各国教育事业 G61 学前教育、幼儿教育 G62 初等教育 G63 中等教育 G64 高等教育 G65 师范教育 G71 职业技术教育 G72 成人教育、业余教育
4
第一节
二、知识的含义
信息、知识、文献与情报
是人类通过信息对自然界、人类社会以及思维方式与运动规律的 认识和掌握。
三、情报的含义 (1)定义:是指被传递的知识或事实,是运用一定的媒体(载 体),越过空间和时间传递给特定用户,解决科研、生产中的具 体问题所需要的特定知识和信息。 情报是为实现主体某种特定目的,有意识地对有关的事实、 数据、信息、知识等要素进行劳动加工的产物。 (2)属性:知识性、传递性、有用性。

信息检索文字题复习提纲(名词解释、举例、简答、论述)

信息检索文字题复习提纲(名词解释、举例、简答、论述)

信息检索文字题复习提纲(名词解释、举例、简答、论述)信息检索复习题1、信息检索的原理是什么?(1)广义信息检索原理:在存储过程中,专门负责信息检索系统和数据库建立的人从各种各样的信息资源中,收集有用的信息,对有用的信息进行主题内容的分析,找出能够全面、准确表达主题内容的概念,借助于检索语言(通常是检索词表)把分析出来的概念转换成检索系统所采用的词语,或者直接使用自然语言,再按照一定的规则和方式将这些有用的信息组织成可供件所用的数据库,并存储在一定的介质上。

(2)狭义信息检索原理:狭义信息检索的原理就是广义信息检索中信息检索过程的那部分原理。

信息检索基本原理中的核心部分就是用户所使用的检索词或者由检索词和运算符所组成的检索式与数据库中的检索词及其逻辑关系之间的比较和匹配机理。

两者相匹配的信息被检索出来(命中),不相匹配的信息被拒绝。

*2、信息检索有哪些工具?按处理信息手段分:手工检索工具、计算机检索工具。

按著录方式分:目录型(国家书目、馆藏书目、联合书目、专题书目)、题录型、文摘型(指示性、报道性、评论性)、索引型(主题索引、分类索引、著者索引)。

3、信息检索的途径和方法有哪些?(1)信息检索途径分类途径:按学科分类体系来检索文献信息。

从分类途径检索文献信息,主要是利用分类目录和分类索引。

它以知识体系为中心,比较能体现学科系统性,反映学科与事物的隶属、派生与平行关系,便于从学科所属的范围来查找文献资料,并可起到“触类旁通”的作用。

题名途径:是根据文献名称包括书名、刊名、篇名等来检索文献的途径。

一些检索系统中提供题名字顺检索途径,如书名目录、刊名目录、篇名索引等。

(2)信息检索方法追溯法:也称引文法,是利用综述或已经掌握文献所附的引文注释和参考文献目录作为线索逐一追查原文,再利用这些原文所附的参考文献目录逐一扩检,产生滚雪球效果。

直接法:又称常用法,是直接利用检索工具检索文献的方法。

它又分为顺查法(由远及近)、倒查法(由近及远)和抽查法(重点时间段进行)。

第二讲:信息检索基础知识与技巧

第二讲:信息检索基础知识与技巧

图形表示:
5各种不同的运算符 5.1布尔逻辑运算符
①逻辑与 常用表示符号: AND 或 * 含义:检出文献中必须同时包含被其连接的所 有词或词组。 作用:缩小检索范围,减少命中文献量,提高 检索结果的查准率。

5 各种不同的运算符 5.1布尔逻辑运算符
逻辑“与”应用举例

查找干旱对水稻基因表达影响方面的文章: 干旱AND 水稻AND 基因表达
O
P Q R S
数理科学和化学
天文学、地球科学 生物科学 医药、卫生 农业科学
G H I J K
T U V X Z
工业技术 交通运输 航空、航天 环境科学、安全科学 综合性图书
语言、文字 文学 艺术 历史、地理
《中图法》结构示意图
大多数图书馆的索书号由中图法的分类号和著者号两部分 构成。索书号是确定一本图书所在架位的依据。了解了索 书号,就能准确迅速地找到自己需要的图书。
5 各种不同的运算符 5.2 截词符

② 前截断 又称左截断,截词符放在被截词的左边。例如 输入*magnetic,可检索出: electro-magnetic, electromagnetic等。
5 各种不同的运算符 5.2 截词符
③ 中间截断 在检索词中间嵌入截断符号,允许检索词中间 有若干形式的变化。主要解决一些英美拼写不 同,单复数形式不同的词的输入。 如:输入wom *n 可检出: woman、women 输入defen * e 可检出: defence、defense

5 各种不同的运算符 5.1布尔逻辑运算符
优先处理算符() 在实际检索中,有时要调整逻辑运算符的运算 顺序,使某些算符优先进行逻辑匹配。用() 表示,它不是布尔逻辑算符,但常与布尔逻辑 运算符搭配使用。 用法:优先对()内的算符进行逻辑运算。

信息检索学习笔记

信息检索学习笔记

信息检索第一章信息检索的基础理论第一节基础概念一、信息概述(一)信息的定义:信息指的是事物的存在方式和运动状态,是对客观世界中各种事物变化和特征的反映,是客观事物之间相互作用和联系的表征,是客观事物经过感知或认识后的再现。

世界三大基本要素:信息物质能量(二)信息的特征1.客观性①信息来源于物质,又不是物质本身;它从物质的运动中产生出来,又可以脱离物质相对独立地存在。

②信息业来源于精神世界,但又不限于精神的领域。

③信息是具体的,并且可以被人所感知、提取、识别,可以传递、存储、变换、显示、检索和利用。

2.普遍性3.可存储性4.可传递性5.扩散性6.共享性7.时效性(三)信息的功能1.经济功能①运用信息可以使非资源转化为资源创造财富。

②使用信息取代劳动力、资金、材料等资源创造财富,实现经济效益倍增。

③直接让信息作为商品在市场流通中创造财富。

④通过信息进行科学决策,减少失误,创造财富。

2.管理与协调功能5M资源:人、财、物、设备、管理办法信息的管理与协调功能在组织活动中的作用:①传递整个组织的运行目的,有效管理5M资源。

②调节和控制物质流和能源流的数量、方向和速度。

③传递外界对系统的作用,保持组织的内部环境稳定。

3.选择和决策功能4.研究与开发功能二、知识1.知识的概念:知识是人类社会实践经验的总结,是人的主观世界对于客观世界的概括和如实反映,是人类对自然界、人类社会以及思维方式与运动规律的认识。

2.知识的类型①显性知识和隐性知识。

②实体知识和过程知识。

③核心知识和非核心知识。

三、情报1.情报的概念:情报是具有特定传递对象的特定知识货有价值的信息。

2.情报的特征①动态性②按特定的方式传递③为特定目的服务的④常常有一定的时效性和机密性3.情报的类型零次情报:私人笔记、手稿、设计草图、会议记录、口头言论等。

一次情报:调查报告、研究报告、科学论文、专利说明书、会议文献、专著等。

二次情报:书目、索引、文摘等三次情报:综述、专题评论、年度总结、研究进展报告、数据手册、专业年鉴等。

网络资源与信息检索(本科)讲课要点与考试重点

网络资源与信息检索(本科)讲课要点与考试重点

网络资源与信息检索(本科)讲课要点第一章信息检索的基础知识讲课要点:一、信息(一)基本概念(P1-2)1、信息:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就成为信息。

2、文献:大凡人类的知识用文字、图形、符号、声频、视频的手段记录下来的东西,统统可称为文献。

也可以称为固化在一定载体上的知识。

3、资料:固化在一定的实物或载体上的知识。

4、信息的传递渠道(二)信息的类型及特点(P4-7)从不同的角度信息可以分为不同的类型1、加工层次(请注意这三者的不同与联系)(1) 一次信息(原始文献)(2) 二次信息(检索工具)(3) 三次信息(参考工具)2、出版形式——图书、期刊、特种文献,结合教材P24-25的内容(请从基本概念、内容特点、著录特点三个方面着重掌握图书、期刊、会议、专利、标准、学位六种类型)3、物理类型——印刷型、缩微型、机读型、声像型4、按信息的性质划分P75、按信息所表征的服务对象划分P7二、信息检索(P2-4)(一)信息检索就是从大量的文献中查寻与信息提问所指定的课题(对象)有关的文献,或者是包含用户所需事实与消息的文献的过程。

它包括三个方面:数据检索、事实检索、文献检索数据检索、事实检索、文献检索三者中以文献检索为主。

数据和事实检索是检索出包含在文献中的具体情报;文献检索则是要检索出包含所需要情报的文献。

(二)文献检索及其类型1、定义:检索系统的建立及检索工具的组织和积累文献的查寻,利用检索工具检出与课题相关的文献。

2、直接检索是从通过阅读原始文献直接获取所需信息快捷、方便漏查率高3、间接检索是通过检索工具的指导再查找原始文献而获取所需信息。

系统、全面滞后? 为什么间接检索是一种更为科学的检索方法?三、检索工具(P8-11)(一)基本概念:按一定的学科、主题等进行搜集整理并给予文献的标志,是及时报道的二次文献,具有报道、存贮、检索的功能。

信息检索

信息检索

信息检索1.信息检索的概念。

狭义信息检索是指用户找出有关信息的过程。

广义信息检索是将信息按照一定的方式组织和存储起来,并根据用户的需求找出有关信息的过程。

2. 信息检索的类型(1)按照检索对象的不同划分早期分为:文献检索、事实检索、数据检索。

当前三分方法:文本检索、音频与视频检索、数值检索。

(2)按检索手段划分:手工检索、机器检索3.简述信息检索的基本原理信息检索的基本原理:对信息集合与需求集合的匹配与选择。

实现信息检索,主要涉及三个关键要素:信息集合、用户信息需求、匹配选择。

一、信息集合:信息集合是指有关某一领域的,经采集、加工的信息集合体。

二、需求集合:用户的信息需求是在社会实践活动中产生的。

当人们在完成某一任务或工作时,经常觉得缺少某些知识,这就产生了信息需求。

三、选择与匹配:要在信息集合中快速获取用户所需信息,需要信息检索提供一种匹配机制,能够把需求集合与信息集合依据某种相似性标准进行比较与判断,进而选择出符合用户需要的信息。

匹配机制至少包括两个要素:第一是匹配标准,即相似性标准;第二是执行匹配的动因。

4.计算机信息检索经历了脱机检索阶段、联机检索阶段、光盘检索阶段、网络检索阶段。

5.信息检索领域的主要研究问题有哪些?⑴信息检索理论:检索语言、检索模型、标引理论、相关性理论、知识组织与表示理论⑵信息检索工具/系统:信息检索系统的结构、功能、设计开发、管理运营、应用评价等⑶信息资源及其收集、加工:信息存储、数据库⑷检索技术与方法:文本检索技术、数值检索技术、音频与视频检索技术、网络搜索技术⑸用户研究与检索策略:用户的查询心理、检索需求及其类型、用户查询信息的行为特征等、用户信息需求分析、检索式构造、相关反馈方法、检索过程调整与控制等⑹其他密切相关的自动化处理技术:自动聚类与分类、自动摘要、信息可视化、信息过滤、信息提取、机器翻译、人机交互等。

信息检索的两种研究方式:以计算机为中心和以用户为中心,以计算机为中心的IR问题是主流。

新第二章 信息检索基础知识

新第二章 信息检索基础知识

2.2 信息检索语言
三、主题语言
4.关键词语言
是指从文献标题、文摘、正文中抽离出来的,对表征文献主题 内容具有实质意义的语词,以关键词作为信息标识和检索依据的主 题语言。关键词没有固定的词表,因为对于同一个事物的概念,不 同作者甚至是同一个作者在不同的著作中用词都会不同,它是没有 经过规范化的自然语言词汇。 在检索中文医学文献中使用频率较高的《CMCC》数据库就是 采用关键词索引方法建立的。
2.5 计算机检索技术 四、词组检索
将固定词组或短语 看成单个词进行处理。
常用“ ”作为词组检索的运算符。
2.5 计算机检索技术 五、字段检索
对指定的一个或多个字段进行检索,从而提高查准率或查全率。
标题、作者、摘要、关键词、作者单位、文献来源、学位授予单位、 学位级别、会议信息、会址、会期、书名、出版地、出版年、专利号、报 告号、ISBN、ISSN等。
2.2 信息检索语言
一、信息检索语言的定义、作用和种类
4.分类:
篇名(题目) 著者名称 描述文献外表特征 文献序号 引用文献 等级体系分类语言 分类语言 组配分类语言 主题语言
检索语言
描述文献内容特征
代码语言
标题词语言 关键词语言 单元词语言 叙词语言 分子式索引 结构式索引 专利号索引等
2.2 信息检索语言
2.4 信息检索标识 一、检索标识的定义
检索标识即检索词,是指能表达检索课题主题概念和信息需 求的名词术语、分类号、名称、代码等的总称,包括主题词、 关键词、名称、分类号、分子式、专利号及各种号码。
2.4 信息检索标识 二、信息检索标识的类型
1.描述信息内容特征的检索标识: 分类、主题、代码(符号)。
2.5 计算机检索技术 一、布尔逻辑检索

第四章 计算机信息检索

第四章 计算机信息检索

三.数据库
1.数据库的概念 数据库是按一定要求存贮在计算机中的相互关 联的数据集合。 数据库的发展是随着文献信息自动化管理的发 展而发展的。当今社会,随着信息量的剧增和计 算机的广泛应用以及人们对文献信息的迫切需求, 电子文献资源的产生与发展就成为必然。而数据 库建设是文献信息自动化管理的基础和核心,是 建立信息网络不可缺少的信息资源,是资源共享 的物质基础,是方便有效地为社会提供信息的重 要渠道。 因此,数据库的飞速发展是信息社会发展的 必然结果。
计算机信息检索
刘 锋
本课内容 一、计算机信息检索的基本知识 二、计算机信息检索系统的构成 三、计算机信息检索原理与技术 四、计算机信息检索策略 五、我校图书馆电子资源概况
一、计算机信息检索的基本知识
1.计算机检索的概念 计算机检索是指工作人员在电子计算 机或计算机检索网络的终端机上,使用特 定的检索指令或检索逻辑关系,由计算机 从数据库中检索出数据或文献的过程。 优势: 提高查全率、查准率,数据资源较全 面丰富,检索功能强,检索质量高,资源共 享 ,内容更新快,服务方式灵活方便。
一、布尔逻辑检索 二、截词检索 三、原文检索 四、加权检索和聚类检索 五、限制检索

六、区分大小写检索 七、短语检索(精确检索) 九、模糊检索 十、概念检索 十、相关检索
1、布尔逻辑检索
布尔逻辑是表达不同概念之间关系的符号逻辑 系统。 利用布尔逻辑运算符进行检索词或代码的逻辑 组配,是现代信息检索系统中最常用的一种方 法。 常用的布尔逻辑算符有三种,分别是逻辑或 “OR‖、逻辑与“AND‖、逻辑非“NOT‖。 用这些逻辑算符将检索词组配构成检索提问式, 计算机将根据提问式与系统中的记录进行匹配, 当两者相符时则命中,并自动输出该文献记录。

《信息检索》考试卷含答案(三套)

《信息检索》考试卷含答案(三套)

第一套《信息检索》考试卷(A)一、名词解释1.信息资源2.信息检索3.著录法4.关键词标引5.知识发现二、填空1.按组织方式分,信息检索有()、()、超媒体检索。

2.信息检索策略有两种方式即()和()。

3.表示主体的检索词有标题词、()、()关键词。

4.常用的逻辑运算符有:()、 OR或+、()。

5.信息检索工具常用的排检方法有字序法、()。

6.中国特有的工具书是()、()。

三、问答1. 信息检索的研究内容有哪些?2. 数据库有哪些类型?3. 搜索引擎的类型有哪些?四、论述1、试例说明传统检索型工具书和参考型工具书的使用。

2、如何利用检索工具查找历史类文献?第一套《信息检索》考试卷(A)答案一、名词解释(30%)1.信息资源。

是人类存储在载体(包括大脑)上的已知或未知的可利用的资源。

信息中的载体信息和主题信息资源的最基本的组成部分。

2.信息检索。

是从大量相关信息中利用人—机系统等各种方法加以有序识别与组织以便及时找出用户所需部分信息的过程。

3.著录法。

是对信息与文献的形式特征和内容特征进行分析、选择和记录的方法。

4.关键词标引。

使用非规范化的自然语言——关键词来表达文献或信息资源主题内容的过程。

5.知识发现。

是从数据中发现有用知识的整个过程,使多个步骤相互连接,反复进行人机交互的过程。

二、填空(20%)1.按组织方式分,信息检索有全文检索、超文本检索、超媒体检索。

2.信息检索策略有两种方式即手工检索策略和计算机检索策略。

3.表示主体的检索词有标题词、单元词、叙次、关键词。

4.常用的逻辑运算符有:AND或*, OR或+, NOT或-。

5.信息检索工具常用的排检方法有字序法、类序法。

6.中国特有的工具书是类书,政书。

三、问答(24%)1.信息检索的研究内容有哪些?检索理论研究、检索语言研究、数据库研究、著录法研究、检索系统研究、检索策略研究、检索服务研究。

2.数据库有哪些类型?传统数据库(情报数据库、图形数据库等);专门应用领域的数据库(统计数据库、工程数据库、空间数据库;新一代数据库(分布式数据库、多媒体数据库、面象对象数据库、实时数据库等)。

信息检索课程内容 (1)

信息检索课程内容 (1)
检索词:高中,英语,备课(教案,课件,教学资料,
教学参考,学习资料)
B.查询词的主题关联与简练
例如,查找“小学三年级关于时间的名人名言”
检索词:时间,名言
C.根据网页特征选择查询词
例如,免费下载《檀香刑》。
检索词:intitle:《檀香刑》免费下载
1)布尔逻辑检索
空格、“+”——逻辑与
“吉林省旅游资源”
2.访问检索需要的文献,找到文献后,可提交馆际互借或文献传递申请获取全文。
简介
CASHL是中国高校人文社会科学文献中心(China Academic Social Sciences and Humanities Library)英文翻译的缩写,中文名称为开世览文。它是在教育部的统一领导下,本着“共建、共知、共享”的原则、“整体建设、分布服务”的方针,为高校哲学社会科学教学和研究建设的文献保障服务体系,是全国唯一的人文社会科学文献收藏和服务中心。CASHL的宗旨是组织若干所具有学科优势、文献资源优势和服务条件优势的高等学校图书馆,有计划、有系统地引进和收藏国外人文社会科学文献资源,采用集中式门户平台和分布式服务结合的方式,借助现代化的网络服务体系,为全国高校、哲学社会科学研究机构和工作者提供综合性文献信息服务。
注:无论简单检索、高级检索,都可实现跨库检索
4.检索结果分析
分组排序
5.检索结果获取
免费浏览阅读器下载获取目录
6,阅读器使用
caj、pdf阅读器,复制、粘贴转换成word文档
练习题(小学教育)
1.查找我校赵慧君教授2010年以来发表的论文。
2.查找初等教育的核心期刊有哪些?
3.查找中小学教育核心期刊《中小学管理》/《课程·教材·教法》/《外国中小学教育》/《现代中小学教育》2015年以来收录的论文有哪些?

信息检索——专业信息素养训练综合检索报告A版

信息检索——专业信息素养训练综合检索报告A版

专业课程主题文献综合检索报告检索题目:变频调速系统的开展现状与前景展望:袁爽学号:2010133141 朱西2010133115王丽莎2010133105江琼2010133104丁大叶2010133128蜀粤20101331072013年4月7日一、课题分析1、学科领域:自动化2、课题容/信息需求表达:交流传动与控制技术是目前开展最为迅速的技术之一,这是和冉力电子器件制造技术、变流技术控制技术以及微型计算机和大规模集成电路的飞速开展密切相关。

通用变频器作为早个商品开场在国上市,是近十年的事,销售额逐年增加,于今全年有超过数十亿元〔RMB〕的市场。

其中.各种进口品牌居多,功率小至百瓦大至数千千瓦;功能简易或复杂;精度低或高;响应慢或快:有PG〔测速机〕或无PG;有噪音或无噪音等等。

对于许多用户来说,这十年中经历了屡次更新,现所使用的变频器大都属于目前最为先进的机型如果从应用的角度来说,我们的水准与兴旺国家没有什么两样。

作为国制造商,通过这十年来对国外的先进技术进展销化,也正在积极地进展国产变频器的自主开发.努力追赶世界兴旺国家的水平。

回忆近十年来国外通用变频器技术的开展对于深入了解交流传动与控制技术的走向,以及如何站在高起点上结合我国国情开发我国自己的产品应该说具有十分积极的意义.3、中英文关键词:电力电子功率器件、变频调速系统、开展、前景variable-frequency speed control system、development、prospect中文关键词:电力电子功率器件、变频调速系统、开展、前景英文关键词:Power Electronics、variable-frequency speed control system、development、prospect4、中英文逻辑检索表达式:A、A+B+C中文检索表达式:电力电子AND变频调速系统、变频调速系统AND开展、变频调速系统+开展+前景英文检索表达式:Power Electronics AND variable-frequency speed control systemvariable-frequency speed control system+development+prospect二、选择检索工具并检索;记录、整理检索结果1、检索工具及检索结果:〔1〕中国期刊网之中国期刊全文数据库〔1989-至今〕,检索结果97963 篇检索过程:初级检索:检索词变频调速〔篇名/关键词/摘要〕,检得45376 篇;二次检索:检索词变频调速开展〔篇名〕,检得4113 篇;三次检索:检索词变频调速系统的开展现状与前景展望〔篇名〕,检得4213 篇。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中国图书馆分类法的体系结构
大类( 22 个):
A 马克思主义、列宁主义、 毛泽东思想 B 哲学 C 社会科学总论 D 政治、法律 E 军事 F 经济
一个字母表示一个大类,称为一级类目
O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医学、卫生 S 农业科学 T 工业技术 TH 机械、仪表工业 TM 电子技术 TN 无线电电子学、电 讯技术 TP 自动化技术、 计算技术 TQ 化学工业 TS 轻工业、手工 业
结论:做科研、发明之前,应利用信息检索来避免重复的研究,从而少走弯 路。
2. 检索语言
2.1 定义
检索语言是文献信息存储和检索过程中共同使用
的一种专门语言,用于描述检索系统信息的内部及外
部特征和表达用户信息需求,是编制检索工具的依据。
2.2 类型——按照描述文献的基本特征划分
不同的检索语言构成不同的标目及索引系统,提供各种检索点(即检索途径)
查阅文献 计划思考 实验研究 书写报告
计划思考 15%
科 研 人 员 时 间 分 配 表
1.5 信息检索的意义
提高信息查询的效率
全世界每年出版的图书有80万种以上,科技期刊8万种以
上,发表期刊论文大于600万篇以上;公开的专利说明书100多
万件;国际会议文献1万多件;美、英、德、日等国产生的科 技报告达20万件左右。 具备一定的信息检索能力,才能在浩如烟海的文献中,快 速、有效地查找出有用的信息。
明确的因素:一个月内 不明确的因素:外观、用途、厂商品牌; 不十分明确的因素:①价格在15万元左右多大幅度(是10万-20万, 还是14万-16万);②较高的性价比是指在一定价格前提下哪些主要部 件的技术含量及其指标。
与咨询者沟通,进一步明确:
价格在14-17万元之间的家用三厢轿车,不限厂商国别的较知名 品牌,发动机、变速器、底盘、安全性四个方面要有独特技术或性能指 标较高,适当考虑油耗以及后期维护费用。
练习题
一、判断题:
1、信息需求的表达是信息需求由隐性向显性转变的一个过程。 (Y) 2、对信息需求进行合理的整理归纳有助于正确表达信息需求。 (Y) 3、信息需求的表达指的是书面表达。 (N) 书面表达、口头表达 4、信息需求是指对获取信息的需求。 (N) 获取、发布、交流、咨询
二、思考题:
日常生活中,你有没有过信息需求?请举一个
作用— (对馆员)将相同学科主题的书放一块,为图书排架提供依据
(对读者)可借此号准确地确定馆藏图书在书架上的排列位 置,是读者查找图书非常必要的代码信息。
练习题
选择题:
1、我馆馆藏图书的分类排架是依据(A ),它是基于(D)的分类体系。
A. 《中国图书馆分类法》 C. 概念 B.《杜威十进制分类法》 D. 学科
信息需求的表达方式 (1)口头表达:用户当面直接提出需求; (2)书面表达: 通过书信(E-mail)、即时交流工具(QQ.MSN等)等。
3. 信息需求的分析 (1)信息需求主题分析 (2)信息需求数量分析 查全率 R=A/C A—检出的相关信息量 C—全部的相关信息量(包括检出和未检出 的相关信息量) (3)信息需求质量分析 查准率 P=A/B A—检出的相关信息量 B—全部检出的信息量(包括检出的相关信 息量和非相关信息量) (4)信息需求的时间性分析 (5)信息需求信息源分析
2.3 常用检索语言
分类检索语言——基于学科的分类体系 国外:《杜威十进制分类法》
国内:《中国图书馆分类法》
《中国图书馆分类法》

《中国图书馆分类法》,简称《中图法》,是我国目前通 用的类分图书的工具,广泛应用于图书馆和情报部门。 我馆图书的分类、排架就是依据《中图法》。
读者掌握了这部分类法的相关知识,便能迅速、有效地查 寻我馆乃至全国各图书馆的馆藏。
1.4 信息检索的类型
按检索方式
手检与机检的比较
手检 检索特点 检索途径 检索时间 检索要求 报道内容 更新周期 检索效率 手翻眼看、大脑判断 较少 较慢 专业知识、外语、 检索工具知识 更新周期长 查准率较 机检 策略、查找、机器匹配 较多 较快 专业知识、外语、 机检系统知识 更新周期短、实时性强 查全率较高
二级类目
一级类目
U 交通运输 V 航空、航天
TN 无线电电子学、电 TS 轻工业、手工 讯技术 业
X 环境科学、安全科学 Z 综合性图书
中国图书馆分类法的体系结构
详表
以T-工业技术大类下TP类的展开举例说明:
T(一级类目) 工业技术 TP (二级类目) 自动化技术、计算机技术 TP1 自动化基础理论 … …… TP3 计算技术、计算机技术 TP30 一般性问题 TP31 计算机软件 … …… TP39 计算机的应用 TP391 信息处理 TP392 各种专用数据库 从上表看出分类号的变化体现了各学科体系的从属关系,分类号 位数每增加一位,则分类级别便低一级。 TP393 计算机网络
按检索方式划分
计算机检索
1.4 信息检索的类型—按检索方式
1)手工检索(Manual Retrieval):
也叫传统信息检索,是利用各种印刷型检索工具来查找文献的一种方法 手检的对象是目录、题录、文摘、索引等印刷型刊物。
2)计算机检索(Camputer-based Retrieval):
也叫现代信息检索,是利用计算机和网络来查找文献信息的检索方式。 机检的对象是机读信息,机读信息是以数据库(database)的形式存贮。
1.5 信息检索的意义
避免重复研究,少走弯路
例1:上海某研究所用了约十年时间研制成功“以镁代银”新 工艺,在进行技术鉴定时,查找科技情报资料,发现美 国早在1929年就已研究成功并申请了专利,而该专利的 说明书就收藏在当地的科技信息所。 例2:美国某轧钢厂一位化学家花了1万美元完成了一系列实 验,并解决了一个问题。当他不无得意地向一位图书馆 员朋友谈起此事时,朋友告诉他,有一份德国人的报 告,就是做的这同样实验,结论也相同,全部资料只需 要花费5美元。
1.5 信息检索的意义
对大学生来说 … …
通过检索和利用各种信息,可以 1)深化所学的知识; 2)开阔视野,拓宽知识面; 3)自学前人的知识、不断更新知识 4)是一切创新的入口与前提,贯穿于创新的始终。
1.5 信息检索的意义

对科研工作者来说 … …
书写报告 15%
查阅文献
40%
实验研究 30%
狭义——检索过程
即人们通常所理解的信息检索
1.2 信息检索原理
信息需求 用户 表达 信息 标 引 文献工作者
检索提问
信息标识
比较与匹配 评价/反馈
检索结果
1.2 信息检索原理之计算机信息检索
用户提问
匹配运算
数据库
命中结果
实质 — “匹配运算”
1.3 信息检索系统
概念:为满足信息需求而建立的一套信息收集、整理、加工、 存储和检索的完整系统。 构成:检索文档、检索设备、系统规则、作用于系统的人
2. 信息需求的表达
2.1 信息需求的归纳整理 (1)信息需求类型的归纳整理 (2)信息需求内容的归纳整理 (3)信息需求过程中可能利用的信息源的归纳 整理 (4)多种信息需求重要性的排序
【案例】:小汽车性价比信息调查 一位咨询者要求:“我准备在一个月内买车,请帮忙 调查一下15万元左右哪几款车的性价比比较高。”
占域名总数 比例 64.7% 29.6% 4.3% 1.3% 0.1% 100%
如何从信息的 海洋中获取我 需要的知识?
面对浩瀚的网络资源 … …
我们被信息的海洋包围着, 但是确被知识饿死了!
本章学习目的
◆学会选取——自己感兴趣的才去浏览; ◆学会过滤——快速去粗存精,文献检索课学习的重要意


《中图法》基本结构

(1)基本部类(5个)
(2)基本大类(22个):构成分类表的第一级类目。 (3)简表:由基本大类与由其展开下展开的类目表,是文献分类的真 正依据。
中国图书馆分类法的体系结构
马克思主义、列宁主义、毛泽东思想、邓小平理论 哲学 部类(5个) 社会科学 自然科学 综合性图书
义正在于此。 学会通过各种途径快速、有效地获取自己所需知识、 信息,为今后的学习和工作打下良好的基础。
1.信息检索概述 2.检索语言 3.检索途径与方法 4.计算机检索技术 5.信息检索步骤 6.检索效果评价
1. 信息检索概述
1.1 信息检索的概念
广义——包括存储和检索两个过程
存储过程:(文献工作者)采集文献→标引、著录→ 建成检索工具或检索系统 检索过程:(用户)借助检索工具或检索系统→查找 出所需信息的过程
咨询者满意而归
结论:对信息需求进行合理的整理归纳有助于正确表达信息需求, 从而获取所需的信息。
2.2 信息需求的表达
指通过一定的手段或渠道将自己的信息需求表示 出来,这是一个用户信息需求由隐性向显性转变的过 程。
隐性—头脑中思考的,没有归纳成文字的 显性—口头表达出的,或是写成文字,发表成论文 等的
日常生活中信息需求的例子。
第4章 信息检索基础

了解:信息检索的基础知识。


掌握:常用的计算机检索技术与方法。
运用:能根据信息需求,利用合适的信息源, 检索相关信息,筛查、综合检索结果,得到满 足信息需求的答案。
中国互联网发展趋势(1/3)

截至2010年6月,总体网民规模达到4.2亿,突破了4 亿关口。
中国互联网发展趋势(2/3)

自2002年1.6亿个网页开始,中国的网页规模一直保 持高速增长,2009年网页数达到336亿个。
中国互联网发展趋势(3/3)
中国分类域名数(截止2010年7月)
数量(个) CN COM NET ORG 其他 合计 7,246,686 3,318,655 477,117 147,220 15,907 11,205,585
相关文档
最新文档