计算机信息检索
计算机复习信息检索
![计算机复习信息检索](https://img.taocdn.com/s3/m/d70c1a8788eb172ded630b1c59eef8c75fbf9536.png)
计算机复习信息检索信息检索是指通过计算机技术,根据用户的需求,在大规模的信息资源中准确、快速地找到相关的信息。
在当今信息爆炸的时代,信息检索的重要性不言而喻。
本文将介绍信息检索的基本概念、技术和应用,并附带答案和解析。
一、信息检索概述信息检索是指通过计算机对大规模信息资源进行全文检索、关键词检索等方式,根据用户需求提供相关信息的过程。
其目标是提高检索准确性和检索效率,帮助用户快速获取所需信息。
信息检索系统由信息资源、检索模型、检索方法和用户界面等组成。
其中,信息资源包括数据库、文档集合等;检索模型包括向量空间模型、布尔模型等;检索方法包括倒排索引、词频统计等;用户界面提供检索接口供用户输入查询词,并显示检索结果。
信息检索的基本流程包括:用户输入查询词->检索系统进行查询处理->检索系统返回相关文档。
二、信息检索技术1. 关键词检索关键词检索是最常见的信息检索方式,用户通过输入关键词,检索系统根据关键词在信息资源中进行匹配,并返回相关文档。
关键词检索常用的算法有向量空间模型、TF-IDF算法等。
全文检索是指对文档集合中的全部文本进行检索,而不仅仅是关键词。
全文检索主要通过分词、建立倒排索引等技术来实现。
用户输入的查询词可以是一个短语或一句话。
3. 自然语言查询自然语言查询是指用户使用自然语言进行查询,而不是像关键词查询那样只输入几个词。
自然语言查询需要将用户的自然语言转化为计算机可处理的查询语言,如SQL语句。
4. 语义检索语义检索是一种基于语义理解的检索方法,通过对查询词的语义进行分析,实现更精准、准确的检索。
语义检索常用的技术有词义消歧、词向量模型等。
三、信息检索应用1. 搜索引擎搜索引擎是信息检索的最常见应用之一,在互联网上广泛使用。
搜索引擎通过爬虫程序对互联网进行爬取,建立庞大的索引库,并通过用户输入的查询词返回相关页面。
2. 文献检索在学术界和科研领域,文献检索是非常重要的工作。
计算机信息检索
![计算机信息检索](https://img.taocdn.com/s3/m/0b645a1352d380eb62946d0a.png)
中国科技信息研究所
中国科技信息研究所(ISTIC) 其网址是: 。 ISTIC是我国最大的一个科技信息服务 中心,向全国联机终端提供检索服务。
开发应用的数据库:
· 中国科技文献数据库(光盘) · 中国学位论文目录数据库(软盘、光盘) · 中国学术会议论文数据库(软盘、磁带、光盘、 联机检索) · 中国学术会议论文数据库(软盘、磁带、光盘、 联机检索) · 中国科技信息机构数据库(光盘、联机检索) · 西文文献目录数据库(联机检索) · 科技动态数据库(联机检索) · 科技声像资料联合目录数据库(软盘)
2.3国际互联网检索
2.3.1互联网检索特点 也称因特网,它具有全球性的分布结构、开放性的信 息环境及跨国界的信息流。互联网的检索可同时使用 网上多个主机,甚至所有主机的某种资源而并不需要 用户预先知道它们的具体地址。这就极大扩宽了其检 索的空间和信息量,包括各种文献信息资源及其指向 的网络页面。而传统的联机检索、光盘检索只局限在 对一台或几台主机上的特定数据库的检索。但在另一 方面,互联网信息庞杂,正式与非正式信息及其交流 渠道共存,信息缺乏有效的组织管理,因此很难用一 般意义上的查全、查准这些概念来衡量其检索。目还 没有一个对所有在线服务行之有效的简单检索模式。
2.1.2联机数据库的结构
数据库主要由“文档——记录——
字段”三个层次构成。
文档(File)
文档是数据库内容的基本组成形式。是由若干 个记录构成的信息集合。分顺排和倒排。 顺排:将数据库记录按记录号大小排列而成。 倒排:以记录的特征标识为排列依据,在后面列 出含此标识的记录号。 一个数据库一般含有一个顺排文档及数个倒排文 档。
中文数据库:
计算机基础信息检索
![计算机基础信息检索](https://img.taocdn.com/s3/m/c40e7f3f178884868762caaedd3383c4bb4cb40f.png)
多媒体信息检索技术应用
图像检索:通过图像内容进行 检索如图像识别、图像分类等
音频检索:通过音频内容进行 检索如语音识别、音乐识别等
视频检索:通过视频内容进行 检索如人脸识别、场景识别等
文本检索:通过文本内容进行 检索如关键词搜索、文本分类
等
多媒体融合检索:结合多种媒 体进行检索如跨媒体检索、多
媒体内容分析等
和准确性
移动化:适应 移动设备的发 展趋势提供更 便捷的检索服
务
社交化:结合 社交网络提高 信息传播和检
索的互动性
专业化:针对 特定领域提供 更专业的检索 服务满足不同
用户的需求
数据库信息检索 技术
数据库信息检索原理
检索方法:包括全文检索、 关键词检索、布尔检索等
数据库检索:通过数据库管理 系统(DBMS)进行数据查询 和检索
多媒体信息检索原理
多媒体信息检索技术分类
基于内容的检索:通过分析多媒体内容的特征进行检索 基于文本的检索:通过分析多媒体内容的文本信息进行检索 基于视觉的检索:通过分析多媒体内容的视觉特征进行检索 基于音频的检索:通过分析多媒体内容的音频特征进行检索 基于视频的检索:通过分析多媒体内容的视频特征进行检索 基于多模态的检索:综合利用多种特征进行检索
数据库信息检索技术发展趋势
智能化:利用人工智能技 术提高检索效率和准确性
集成化:将多种数据库技 术集成实现跨平台检索
安全性:加强数据加密和 访问控制保障数据安全
实时性:提高数据更新速 度实现实时检索
移动化:适应移动设备的 需求提供移动检索服务
云化:利用云计算技术实 现数据库资源的共享和优 化
多媒体信息检索 技术
信息检索技术:包 括文本检索、图像 检索、音频检索等
计算机信息检索范文
![计算机信息检索范文](https://img.taocdn.com/s3/m/f00d1a63443610661ed9ad51f01dc281e53a562d.png)
计算机信息检索范文计算机信息检索是指从大规模的计算机存储系统中通过用户提交的查询请求,找到并提供与查询请求相关的信息的过程。
计算机信息检索广泛应用于各个领域,包括Web引擎、图书馆信息检索系统、企业知识管理系统等。
下面我将就计算机信息检索的基本原理和技术进行详细介绍。
首先,对于查询处理,信息检索系统需要对用户查询进行预处理,包括词法分析、语法分析和查询规范化等。
词法分析是将查询转换为单词的序列,这些单词被称为检索词。
语法分析是通过解析用户查询中的语法结构,构建查询的语法树。
查询规范化是将查询转换为一致的形式,以便进行后续的索引匹配。
其次,索引建立是信息检索系统的关键步骤。
索引是一个数据结构,用于快速定位与用户查询相关的文档。
常用的索引结构包括倒排索引和正排索引。
倒排索引是将单词与其出现的文档进行关联,方便通过单词查询与之相关的文档。
正排索引是将文档与其包含的单词进行关联,方便通过文档查询包含的单词。
索引建立过程包括分词、词干化、停用词过滤和权重计算等步骤。
分词是将文档拆分成单词的过程。
词干化是将单词转换为其基本形式,以避免不同形式的单词导致的检索问题。
停用词过滤是去除常见单词,如“的”、“是”等,这些单词对于检索相关性没有意义。
权重计算是根据单词在文档中出现的频率和重要性,对文档进行打分。
最后,文档匹配是根据用户查询与索引进行匹配,找到与查询最相关的文档。
常用的文档匹配算法包括向量空间模型、概率模型和语言模型等。
向量空间模型将查询和文档表示为向量,通过计算向量之间的相似度来确定文档与查询的相关性。
概率模型基于统计方法,使用概率模型来计算文档与查询的相关概率。
语言模型基于文档中的单词出现的概率分布,通过计算文档与查询的匹配度来确定文档与查询的相关性。
除了以上三个基本步骤,计算机信息检索还涉及到一些其他的技术,如查询扩展、结果排序和评估方法等。
查询扩展是通过分析用户查询和相关文档,自动生成扩展查询,以获取更准确的检索结果。
简述计算机信息检索基本步骤
![简述计算机信息检索基本步骤](https://img.taocdn.com/s3/m/129c3408001ca300a6c30c22590102020640f25f.png)
简述计算机信息检索基本步骤计算机信息检索就像是一场奇妙的寻宝之旅,下面我就给大家唠唠这有趣的基本步骤。
咱开始的时候,就像是一个准备闯荡江湖的小侠客,要先明确自己的目标。
这目标得清晰得像刚擦过的玻璃一样,不能模模糊糊的。
比如说你想找关于“猫咪为什么总是追着自己尾巴跑”的信息,你可不能就大概想个“小动物的奇怪行为”,那范围可就大得像宇宙一样,你可能就迷失在信息的黑洞里啦。
有了目标之后呢,就像是知道了宝藏大致的方位。
接下来就要选对工具,这就好比你要去打仗,得选一把称手的兵器。
是用搜索引擎这个大宝剑呢,还是用专业数据库这个神秘的魔法棒?不同的问题得选不同的工具,要是拿个小勺子去挖宝藏,那可挖到猴年马月去喽。
选好工具之后,那就是要输入关键词啦。
这关键词可得讲究,就像是给宝藏守门的小精灵的咒语一样。
你要是乱念一气,小精灵可不会给你开门。
比如说“猫咪追尾巴原因”,这样精准的关键词就像三把正确的钥匙,能让你顺利地开启信息的大门。
然后就是等着计算机这个超级大脑开始工作啦。
它就像一个超级勤奋的小书童,在那巨大的知识仓库里疯狂翻找。
你就坐在那儿,感觉像是在等一个神秘的礼物被送过来。
当结果出来的时候,那场面就像是打开了一个装满惊喜的宝箱。
不过可别高兴得太早,这里面可能也夹杂着一些看起来像宝石其实是玻璃的假信息。
这时候你就得像一个精明的商人,仔细甄别,把那些不靠谱的信息像挑烂苹果一样扔掉。
有时候呢,你第一次搜索可能没找到特别满意的答案,这就像你在迷宫里转错了弯。
别怕,咱调整一下关键词,就像重新规划迷宫的路线一样,再试一次。
要是你发现有些信息特别有用,就像发现了超级稀有的宝藏,那你可以把它们标记或者保存下来。
这就好比把宝藏放进自己的小金库,以后可以随时拿出来欣赏或者继续研究。
在整个检索的过程中,也要小心那些看起来很诱人但是其实很危险的陷阱。
比如说一些来源不明的信息,就像外表漂亮但是有毒的蘑菇,可不能轻易相信。
计算机信息检索就是这样一个充满乐趣又有点小挑战的过程,只要掌握了这些步骤,就像拥有了一张通往知识宝库的通行证,能让你在信息的海洋里畅游无阻,找到那些真正对你有用的宝藏。
计算机信息检索
![计算机信息检索](https://img.taocdn.com/s3/m/b7b589b1e109581b6bd97f19227916888586b91f.png)
计算机信息检索在当今信息爆炸的时代,计算机信息检索成为了我们获取知识和信息的重要手段。
无论是在学术研究、工作还是日常生活中,我们都常常需要从海量的数据中迅速准确地找到所需的信息。
那么,究竟什么是计算机信息检索呢?简单来说,计算机信息检索就是利用计算机系统来查找和获取存储在数据库或网络中的信息。
它就像是一个超级智能的图书馆管理员,能够快速帮我们在庞大的信息库中找到我们想要的那本书或者那篇文章。
计算机信息检索的发展可以追溯到上世纪五六十年代。
早期的信息检索系统主要基于简单的关键词匹配,功能相对有限。
但随着计算机技术的不断进步,信息检索技术也得到了飞速发展。
如今,它已经成为了一个非常复杂和强大的领域,融合了数据库管理、自然语言处理、机器学习等多种技术。
计算机信息检索系统通常由以下几个部分组成:信息数据库、检索引擎、用户界面和检索策略。
信息数据库是存储各种信息的仓库,这些信息可以是文本、图像、音频、视频等多种形式。
检索引擎则是系统的核心,负责对用户的检索请求进行处理和分析,并在数据库中查找匹配的信息。
用户界面是用户与系统进行交互的窗口,它应该设计得简洁、直观,方便用户输入检索条件和查看检索结果。
检索策略则是用户为了获得准确检索结果而制定的一系列规则和方法。
在进行计算机信息检索时,我们首先需要明确自己的检索需求。
这就像是在出发旅行前要先确定目的地一样。
然后,我们选择合适的检索工具和数据库。
不同的数据库涵盖的信息范围和类型可能不同,比如有的侧重于学术文献,有的则更关注新闻资讯或商业数据。
接下来,我们要制定有效的检索表达式。
这可以是简单的关键词,也可以是更复杂的布尔逻辑表达式,比如“与”“或”“非”等操作符的组合。
例如,如果我们想查找关于“人工智能在医疗领域的应用”的信息,我们可以使用“人工智能”和“医疗”这两个关键词进行检索。
但如果我们想更精确地找到相关内容,可能会使用“(人工智能 AND 医疗)NOT机器人”这样的表达式,以排除一些不相关的结果。
简述计算机信息检索的主要途径
![简述计算机信息检索的主要途径](https://img.taocdn.com/s3/m/1b870324fe00bed5b9f3f90f76c66137ee064fcb.png)
简述计算机信息检索的主要途径计算机信息检索是指通过计算机技术,对大量的信息进行存储、组织、检索和提取,以满足用户对信息的需求。
在信息爆炸的时代,计算机信息检索成为人们获取信息的主要途径之一。
本文将从不同的角度介绍计算机信息检索的主要途径。
一、网络搜索引擎网络搜索引擎是计算机信息检索的主要途径之一。
通过搜索引擎,用户可以在互联网上检索到各种形式的信息,如网页、新闻、图片、视频等。
目前,谷歌、百度、必应等搜索引擎已经成为人们日常生活中必不可少的工具之一。
用户可以通过输入关键词,搜索引擎会根据算法对互联网上的信息进行索引和排序,展示给用户最相关的结果。
二、数据库检索数据库是存储和管理大量结构化数据的系统,也是计算机信息检索的重要途径之一。
通过数据库管理系统,用户可以对数据库中的信息进行检索。
数据库检索可以是基于关键词的,也可以是基于结构化查询语言(SQL)的。
用户可以通过输入条件或者SQL语句,从数据库中提取所需的信息。
数据库检索通常用于企业、政府等组织的数据管理和决策支持系统中。
三、文献检索文献检索是学术界和科研人员进行科学研究的重要途径之一。
通过文献检索工具,如Google Scholar、万方数据库等,用户可以检索到全球范围内的学术论文、会议论文、专利等文献信息。
文献检索可以根据关键词、作者、期刊等多种检索方式进行。
文献检索工具提供了方便的界面和高效的搜索算法,帮助用户快速找到所需的文献信息。
四、专业知识库专业知识库是某一领域专家或组织对特定领域知识进行整理和归纳形成的数据库。
专业知识库通常包含了该领域的基本概念、原理、方法等内容,并提供了详细的参考资料和相关文献。
用户可以通过专业知识库快速获取到某一领域的专业知识和最新进展,以支持自己的工作和学习。
五、社交媒体搜索随着社交媒体的普及,社交媒体搜索成为了人们获取信息的重要途径之一。
通过社交媒体搜索引擎,如微博、微信等,用户可以检索到社交媒体平台上的各种信息,如动态、评论、话题等。
计算机信息检索技术
![计算机信息检索技术](https://img.taocdn.com/s3/m/dd476378bdd126fff705cc1755270722182e5973.png)
计算机信息检索技术在当今数字化和信息化的时代,计算机信息检索技术成为了我们获取知识和信息的重要手段。
无论是在学术研究、商业决策、日常生活还是在各类专业领域,它都发挥着不可或缺的作用。
计算机信息检索,简单来说,就是利用计算机系统从大量的信息资源中查找出符合用户需求的特定信息。
它基于一系列的技术和算法,能够快速、准确地处理和筛选海量的数据。
让我们先来了解一下计算机信息检索的基本流程。
首先,用户需要明确自己的信息需求,并将其转化为计算机能够理解的检索表达式。
这可能包括关键词、短语、逻辑运算符(如“与”“或”“非”)等的组合。
然后,计算机系统会对已有的信息数据库进行搜索。
这些数据库可以是各种类型的,比如图书馆的馆藏目录、学术期刊数据库、网络搜索引擎的索引等。
在搜索过程中,系统会根据预先设定的算法和规则,对数据库中的每条记录进行匹配和评估。
最后,系统将符合检索条件的结果返回给用户,并按照一定的排序方式进行展示,通常是根据相关性、权威性或其他特定的标准。
为了实现高效的信息检索,有许多关键的技术和方法被应用。
其中,索引技术是非常重要的一项。
就像一本书的目录一样,索引可以帮助计算机快速定位到可能包含相关信息的位置。
常见的索引类型包括倒排索引,它将词语与包含这些词语的文档建立关联,从而大大提高了检索的速度。
在信息检索中,文本分类和聚类技术也有着广泛的应用。
文本分类是将文本按照预先定义的类别进行划分,比如将新闻文章分为体育、娱乐、科技等类别。
聚类则是将相似的文本自动分组在一起,无需事先定义类别。
这两种技术都有助于用户更有针对性地浏览和筛选检索结果。
另外,信息检索的准确性和相关性评估也是至关重要的。
如何确定哪些结果与用户的需求最相关,这涉及到复杂的算法和模型。
例如,常见的基于向量空间模型的方法,将文本和检索表达式都表示为向量,通过计算向量之间的相似度来评估相关性。
随着技术的不断发展,智能化的信息检索技术也逐渐崭露头角。
计算机信息检索
![计算机信息检索](https://img.taocdn.com/s3/m/87697086bceb19e8b8f6baba.png)
限制符: In (模糊限制) Heart in ti (篇名) 山西 in 地址 (ad) = (精确限制) LA = Chinese(语种) PY = 2009-2010(年限)
常见的基本索引字段
基本索引字段:反映文献的内容特征,这 些字段用于主题检索。
• 篇名 Title TI • 文摘 Abstract AB • 规范词 Descriptor DE
二.布尔逻辑检索 1.逻辑与:“AND”或“*”
定义:逻辑与是一种用于交叉概念或限定关系的 组配,检索结果必须同时满足逻辑算符前后所列的 条件。 作用:可缩小检索范围,提高查准率。 要求:运用时,把出现频率低的检索词置于“与” 的左端,可使否定答案尽早出现,节省机时。
A and B;A*B
A
B
Construction
光盘信息检索系统:数据存储在光盘(一种用激光记录 和读取信息的盘片),通过检索软件,利用计算机和光 盘驱动器进行检索。可形成光盘检索网络。
网络化(internet)信息检索系统:同联机检索系统的主 机和用户终端的主从关系不同,客户机和服务器是对等 的关系
四、计算机检索的发展
1954年 ,美国海军武器实验站图书馆在一台电子管计算机 上建立了世界上第一个计算机检索系统。 1950年代 末, IBM 公司利用一台IBM650计算机成功地编制出关键词索 引,并建立了世界上第一个定题情报检索(SDI,Selective Dissemination of information)系统,为用户定期检索和提 供一定主题的新到文献,并很快得到了推广应用。
3、逻辑“非”:NOT;not; 定义:表示两个概念的排除,即被检索文献在含 有检索词A而不含有检索词B时才被命中。
作用:用于排斥关系的组配,即从原来的检索范 围排除不需要的概念或影响检索结果的概念,提高 查准率。 注意:往往会把切题的文献给丢掉,运用时要非 常慎重。
计算机信息检索
![计算机信息检索](https://img.taocdn.com/s3/m/71d9df1e76c66137ee06193e.png)
二、数据库
1 数据库的定义及类型 (1)定义:
数据库是满足一定需求而收集的有序的数 据集合。
(2)数据库的类型
书目型数据库 字典型数据库 事实型数据库 全文型数据库 媒体数据库
书目型数据库
数据库中的记录主要是原始文献的书目信息。 例 如,原始文献的篇名、作者、文献出处、文摘、叙词 或关键词等等。
B
逻辑“或” :运算符“OR”或“+”
逻辑“或”组配是具有概念并列关系的一种组配。 例如 A or B,在文献检索中表示 A 一篇文献记录只要以两个检索项中的 任何一项标引或同时用两者标引, 这样的 “或”组配可以扩大检索范围,提高检全率。
B
文献
记录就被命中,组配的结果是同位概念,因而用逻辑
石油和天然气 petroleum OR natural gas
见下表
篇名
著者
. 文献学 王柏松 1 记录号 2 Inform John. S UCLC Liver Cancer 3 Wang H. Cancer Res.
字段 来源 语种 文摘 一条记录 SUMS ……… 中文
English ……… English ………
表中: 每一行是一条由若干信息组成的数据, 我们称之为一个——记录; 每一列就是一个记录的某一项信息, 我们称之为——字段。
逻辑“与” :运算符为“AND”或“*”
逻辑“与”组配是具有概念交叉关 A 系和限定关系的一种组配。 例如 A and B,在文献检索中表示一篇文 献记录既以检索项 A 标引又以检索项 B 标引, 这样 的文献记录才能被命中,因而用逻辑“与”组配可 以缩小检索范围,得到更确切的文献记录(提高检 准率) 。 太阳能 solar and energy
计算机信息检索
![计算机信息检索](https://img.taocdn.com/s3/m/ee1063d905087632311212bb.png)
一.名词解释1.信息检索:广义来说,指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程,包括“存”和“取”两个基本环节;狭义理解,一般只涉及“取”,信息检索也可称为“信息查询”或“信息查找”。
2.联机信息检索:指用户利用检索系统网络的终端设备,通过通信线路,运用一些特定的指令和检索策略与世界上的信息检索系统,进行质检的人机对话,从检索系统的数据库中查找出用户所需要的特定信息,并将检索结果与过程下载,显示和打印出来的过程。
3.CBR:基于内容的检索,指根据多媒体对象的听、视觉特征及其中蕴含的内容和语义特征进行检索,并希望能够借助于模式识别、语音识别、图像理解等相关领域的研究成果,对多媒体数据的听、视觉特征和语义特征进行自动(半自动)的分析、表达和组织。
4.网络信息源:指所有以电子数据的形式把文字、图像、声音、动画等多种形式的信息存贮在光、磁等非纸质介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。
5.搜索引擎:搜索引擎有广义与狭义之分。
广义的搜索引擎泛指网络上提供信息检索服务的攻击或系统。
狭义的搜索引擎主要是指利用网络自动搜索软件对INTERNET(主要是WEB)网络资源进行收集、组织并提供检索服务的一类信息服务系统。
6.URL:统一资源定位符(Uniform Resource Locator,缩写为URL)是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。
互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。
7. 顺排/倒排文档:文档的概念是指数据库内容的组织形式。
一般地说,一个数据库至少包括一个顺排文档和一个倒排文档。
(1)顺排档,也称为主文档、引文文档,它是按记录存取号的大小顺序排列记录而成的文档。
文档越是新,记录存入文档的时间越是晚,记录的存取号就越大。
(2)倒排挡,是指把数据库中记录的一切可检字段或属性值(称检索标识,如著者,主题词等,不包括存取号)抽出,按某种顺序(字母或数字顺序)重新加以组织后得到的特征标识文档。
计算机专升本中的计算机信息检索
![计算机专升本中的计算机信息检索](https://img.taocdn.com/s3/m/a2e4036c59fb770bf78a6529647d27284b7337a3.png)
计算机专升本中的计算机信息检索计算机专升本专业课程中的计算机信息检索是一门重要的课程。
计算机专业需要掌握信息检索的基本理论和技术,以提高信息检索的准确性、效率和用户体验。
本文将从计算机专业的需求、信息检索的基本原理和技术、以及未来的发展趋势三个方面来探讨计算机专升本中的计算机信息检索。
一、计算机专业对计算机信息检索的需求计算机专业从事与信息相关的工作,对于计算机信息检索的需求非常大。
首先,计算机专业需要掌握信息检索的基本原理和技术,以便能够快速、准确地从海量的数据中获取所需信息。
其次,计算机专业还需要了解信息检索系统的构建和维护方法,以提供更好的用户体验和服务。
因此,计算机专升本中的计算机信息检索课程对于培养学生解决实际问题的能力和适应信息社会的能力非常关键。
二、信息检索的基本原理和技术信息检索是从海量的文本、图像、音频和视频中找到满足用户信息需求的过程。
在计算机专升本的课程中,学生将学习以下几个方面的知识:1. 信息检索的基本原理:学生需要了解信息检索的基本概念,包括信息需求、信息资源、检索模型等。
理解这些基本概念对于后续的学习和实践非常重要。
2. 检索技术:在实际的信息检索中,学生需要了解和掌握各种检索技术。
比如,学生需要了解如何构建关键词索引、如何使用逻辑运算符进行检索、如何使用特定的查询语言进行检索等。
3. 评价和改进:信息检索的准确性和效率是评价一个信息检索系统好坏的重要指标。
学生需要学习如何评价一个信息检索系统,并提出改进的方法和策略,以提高检索的准确性和效率。
三、计算机信息检索的未来发展趋势随着人工智能和大数据技术的不断发展,计算机信息检索也在不断改进和创新,具有以下几个发展趋势:1. 智能化:未来的计算机信息检索系统将更加智能化,能够理解用户的信息需求,提供更加精准和个性化的检索结果。
通过机器学习、自然语言处理等技术的应用,计算机信息检索系统将具有更强的智能和自适应能力。
2. 多媒体检索:随着互联网上的多媒体数据不断增长,计算机信息检索也将向多媒体方向发展。
计算机信息检索技术
![计算机信息检索技术](https://img.taocdn.com/s3/m/21a37476a31614791711cc7931b765ce04087a50.png)
2.1 检索系统的功能模块
词表管理子系统——主要功能:管理维护系统中已有词表的结构、词汇,使它与标引、建库、检索等多个子系统相连接;支持用户的各种词汇查询操作;输出各种形式的词汇数据或词表产品等。
01
用户接口子系统——一般有5种界面风格:命令/指令语言(command language)、菜单选择(menu selection)、表格填充(form fill-in)、直接操纵(direct manipulation)、自然语言(natural language)。
F27 企业经济
F29 城市与市政经济
F3 农业经济
F4 工业经济
F7 贸易经济
F72 中国国内贸易经济
F73 世界各国国内贸易经济
F74 国际贸易
F75 各国对外贸易
F8 财政、金融
F81 财政、国家财政
F82 货币
F83 金融、银行
F84 保险
T 工业技术
(2)数据检索Data Retrieval
是指查找用户所需特定数据的检索。
例:我国第五次人口普查中全国汉民族的人数。
利用各种词典、手册、百科全书、年鉴、等参考工具书进行检索,也可以利用专门的数据库进行检索。
熔点、电阻系数,计算公式、数据图表,化学分子式等。
(3)事实检索Fact Retrieval 是将存储于检索系统中的关于某一事件发生的时间、地点、经过等信息查找出来的检索。它回答的问题诸如:“有哪些海外华人得过诺贝尔奖?” 工具:字典、词典(dictionary)百科全书(encyclopedia)年鉴(annual, yearbook, almanac)手册(handbook, manual)名录(biography)和书目指南(directory) 例:第三届全国ITAT教育工程就业职能大赛项目瑞萨超级MCU模型车大赛的比赛,福建工程学院学生的获奖情况。某同类汽车产品中,哪种牌号的销量
第四章 计算机信息检索
![第四章 计算机信息检索](https://img.taocdn.com/s3/m/0a676bf7c8d376eeaeaa3159.png)
三.数据库
1.数据库的概念 数据库是按一定要求存贮在计算机中的相互关 联的数据集合。 数据库的发展是随着文献信息自动化管理的发 展而发展的。当今社会,随着信息量的剧增和计 算机的广泛应用以及人们对文献信息的迫切需求, 电子文献资源的产生与发展就成为必然。而数据 库建设是文献信息自动化管理的基础和核心,是 建立信息网络不可缺少的信息资源,是资源共享 的物质基础,是方便有效地为社会提供信息的重 要渠道。 因此,数据库的飞速发展是信息社会发展的 必然结果。
计算机信息检索
刘 锋
本课内容 一、计算机信息检索的基本知识 二、计算机信息检索系统的构成 三、计算机信息检索原理与技术 四、计算机信息检索策略 五、我校图书馆电子资源概况
一、计算机信息检索的基本知识
1.计算机检索的概念 计算机检索是指工作人员在电子计算 机或计算机检索网络的终端机上,使用特 定的检索指令或检索逻辑关系,由计算机 从数据库中检索出数据或文献的过程。 优势: 提高查全率、查准率,数据资源较全 面丰富,检索功能强,检索质量高,资源共 享 ,内容更新快,服务方式灵活方便。
一、布尔逻辑检索 二、截词检索 三、原文检索 四、加权检索和聚类检索 五、限制检索
六、区分大小写检索 七、短语检索(精确检索) 九、模糊检索 十、概念检索 十、相关检索
1、布尔逻辑检索
布尔逻辑是表达不同概念之间关系的符号逻辑 系统。 利用布尔逻辑运算符进行检索词或代码的逻辑 组配,是现代信息检索系统中最常用的一种方 法。 常用的布尔逻辑算符有三种,分别是逻辑或 “OR‖、逻辑与“AND‖、逻辑非“NOT‖。 用这些逻辑算符将检索词组配构成检索提问式, 计算机将根据提问式与系统中的记录进行匹配, 当两者相符时则命中,并自动输出该文献记录。
第四章计算机信息检索
![第四章计算机信息检索](https://img.taocdn.com/s3/m/f5898f2ab80d6c85ec3a87c24028915f804d84e5.png)
逻辑与(and、*、空格等)
solar and energy solar * energy
逻辑或(or、+、| )
solar or energy solar + energy
逻辑非(not、-、^、!)
solar not energy solar - energy
例如:
1、“城市绿化” 检索式:城市绿化+(城市+北京+天津+上海+… )*
如solar和energy,它们的三种逻辑组 配关系分别为:
1、布尔逻辑检索
它是不同的单一主题概念,通过“布尔” 逻辑算符组配形成多主题概念的检索式。 常用的布尔逻辑算符有4种:逻辑与 (AND、*)、逻辑或(OR、+)、逻 辑非(NOT、-)、异或(XOR,不常 用)。
如solar和energy,它们的三种逻辑组 配关系分别为:
倒排文档
数据库的“索引”即是 它的倒排文档,它是将 著者倒排档 记录中一切可检索的标
倒排文档
主题倒排档 文种倒排档
识抽出,按某种顺序 著者 (如字顺,分类)重新
存取号 主题词 存取号 文种 存取号
排列而形成的文档。如 Han js 010003 基因 010003 China 010002
主题、著者、文种等倒
时间:20世纪50年代-60年代 检索人员→检索策略→成批检索→用户 不足:地理上的障碍;时间上的迟滞;封闭式的
检索
1.脱机检索
是采用单机进行存储和处理信息,回答检索提问 时,采用批处理方式。这种机检方式,人机不能 进行应答,必须由专职人员建立用户提问档,系 统定期进行检索。
时间:20世纪50年代-60年代 检索人员→检索策略→成批检索→用户 不足:地理上的障碍;时间上的迟滞;封闭式的
计算机信息资源检索方式
![计算机信息资源检索方式](https://img.taocdn.com/s3/m/e7737ad7846a561252d380eb6294dd88d0d23dc2.png)
计算机信息资源检索方式一、引言计算机信息资源检索是指利用计算机技术和网络通信手段,从庞大的信息库中获取所需信息的过程。
随着互联网的迅猛发展,计算机信息资源的数量和种类不断增加,有效地检索所需信息变得尤为重要。
本文将介绍几种常见的计算机信息资源检索方式,包括关键词检索、分类检索、专家检索和全文检索。
二、关键词检索关键词检索是最常见也是最基本的检索方式之一。
用户通过输入与所需信息相关的关键词,系统根据关键词与文档的匹配程度,返回相关的信息资源。
关键词检索具有灵活性和效率高的特点,但对用户的搜索技巧和关键词选择有一定要求。
为了提高搜索结果的准确性,用户可以使用逻辑运算符(如AND、OR、NOT)来组合多个关键词进行检索。
三、分类检索分类检索是按照一定的分类体系对信息资源进行分类和组织,用户通过选择相应的分类进行检索。
分类检索的优点在于能够提供结构化的搜索结果,使用户更容易找到所需信息。
常见的分类检索方式包括目录检索和标签检索。
目录检索是将信息资源按照一定的主题或领域进行分类,用户可以通过浏览目录层级来找到所需信息。
标签检索则是通过为信息资源打上标签,用户可以通过点击标签来检索相关内容。
四、专家检索专家检索是指通过与领域专家进行交流和咨询,获取所需信息的一种方式。
用户可以通过与专家进行面对面的交流,或者通过邮件、电话等方式向专家提问。
专家检索的优势在于可以获得专业的解答和指导,但也存在时间、地点和专家资源有限等问题。
五、全文检索全文检索是指通过对信息资源的全文内容进行分析和索引,实现对文本中关键词的检索。
与关键词检索不同,全文检索可以检索到文本中所有包含指定关键词的内容,而不仅仅是标题或摘要。
全文检索的优势在于能够提供更准确、更全面的搜索结果,但也需要消耗更多的计算资源。
六、其他检索方式除了以上几种常见的检索方式外,还有一些其他的检索方式。
例如,推荐系统可以根据用户的兴趣和偏好,主动推荐相关的信息资源;问答社区可以通过用户提问和回答的方式,提供有针对性的信息检索服务。
计算机信息检索
![计算机信息检索](https://img.taocdn.com/s3/m/c8a9c68502d276a200292e9b.png)
计算机信息检索一、名词解释1、信息资源:广义信息资源是指信息和与操作信息有关的物理设施、人力、机构、资金和运行机制等的总称。
狭义的信息资源是指信息本身极其载体的集合,也就是我们常说的信息源。
2、信息检索:从广义上理解,信息检索是指将信息按一定方式组织和储存起来,并根据信息用户的需要找出有关信息的过程。
所以它通常被称为“信息存储于检索”。
狭义的信息检索是指广义的信息检索的后半个过程,即从信息集合中找出所需要信息的过程,相当于人们所说的信息查检等。
3、搜索引擎:是指以一定的策略搜集互联网上的信息,在对信息进行和处理后,为用户提供检索服务的系统。
4、专利文献:是实行专利制度的国家,在接受申请和审批发明过程中形成的有关出版物的总称。
5、科技报告:也称技术报告或研究报告,它是科学研究工作和开发调查工作成果的记录或正式报告,这是一种典型的机关团体出版物。
二、填空题1.信息,物质和能量在客观世界中具有同等的重要性。
2.按信息检索的手段划分,信息检索可以分为传统信息检索和现代信息检索。
3.常用的逻辑运算符有and,or和not。
4.文献的三要素是知识,记录,载体。
5.搜索引擎分为全文搜索引擎、目录索引搜索引擎和元搜索引擎。
KI的中文全称是中国期刊网7.在CNKI检索系统中,如果排序方式选择“日期”,则发表日期最近的排在前面8.检索“潜艇中的非潜艇”,表达式可以写为潜艇not核潜艇9.计算机检索系统由硬件,软件和信息数据库三部分构成10.检索“打印机驱动程序”,表达式可以写为打印机and驱动三、简答题1、信息指示及文献之间的关系(第10页)2、全文型数据库的特点(第58页)3、“超星电子图书管“收藏资源的特点(第152—154页)4、“万字数字化期刊”收藏资源的特点(第121页)5、SCI,EI,SSCI的含义(第162—167)(有时间的同学可以再看一下26页的文献级次、44页的文献分类、59页的internet信息常用获取方式)。
计算机信息检索
![计算机信息检索](https://img.taocdn.com/s3/m/d239f80c4a7302768e9939ca.png)
计算机信息检索技术 检索技术
3.截词符
右截词 又叫后端截词,前端一致. 又叫后端截词,前端一致. chemi? 检索结果为chemical, chemist等。 检索结果为chemical, chemist等 如 又叫前端截词,后端一致。 左截词 又叫前端截词,后端一致。 ?physics检索结果为 检索结果为physics, biophysics等 如 ?physics检索结果为physics, biophysics等。 中间截词 如 wom?n 检索结果为woman, women等。 检索结果为woman, women等
计算机信息检索发展阶段
3.光盘检索(20世纪80年代中期至今) 3.光盘检索 20世纪 年代中期至今 光盘检索( 世纪80年代中期至今) 80年代末出现光盘网络,光盘网络的核心是光盘 80年代末出现光盘网络 年代末出现光盘网络, 光盘服务器和局域网技术, 塔、光盘服务器和局域网技术,它使多个用户能同 时检索同一大型光盘数据库,共享信息资源, 时检索同一大型光盘数据库,共享信息资源,检索 效率得到了很大提高。 效率得到了很大提高。
系统组成
1. 中央计算机——检索系统的核心部分。通过检 中央计算机——检索系统的核心部分。 ——检索系统的核心部分 索软件,中央计算机能够进行信息的贮存、 索软件,中央计算机能够进行信息的贮存、处 理和检索。 理和检索。 2. 通信网络——沟通检索系统终端与中央计算机 通信网络—— ——沟通检索系统终端与中央计算机 的桥梁。 的桥梁。 3. 检索终端——实现用户与检索系统“人机对话”。 检索终端——实现用户与检索系统“人机对话” ——实现用户与检索系统 4. 数据库——检索系统中的信息源。 数据库——检索系统中的信息源。 ——检索系统中的信息源
计算机信息检索系统的构成
![计算机信息检索系统的构成](https://img.taocdn.com/s3/m/4d46e66e182e453610661ed9ad51f01dc28157fc.png)
计算机信息检索系统的构成计算机信息检索系统是一种用于从大规模数据集合中快速、准确地检索和获取相关信息的系统。
它是由多个组成部分构成的,这些组成部分相互协作,以实现高效的信息检索和处理。
以下是计算机信息检索系统的主要构成部分:1. 用户界面:用户界面是用户与信息检索系统进行交互的窗口。
这可以是一个命令行界面、图形用户界面或者Web界面。
用户通过界面输入检索请求,浏览检索结果,并与系统进行交互。
2. 检索引擎:检索引擎是信息检索系统的核心组件。
它负责根据用户的检索请求在数据集合中快速查找并返回相关的信息。
检索引擎通常采用索引结构来优化检索速度,例如倒排索引和哈希索引。
3. 数据库管理系统:数据库管理系统(DBMS)用于存储和管理信息检索系统的数据集合。
它提供了数据的索引、存储和更新功能,并保证数据的一致性和完整性。
常见的DBMS包括关系型数据库、文档数据库和图数据库等。
4. 数据预处理模块:数据预处理模块用于对原始数据进行清洗、过滤、分词和标记等操作,以便于后续的索引和检索。
数据预处理模块还可以提取关键词、生成摘要和识别语义关系等功能,以提高检索的准确性。
5. 数据存储和索引:数据存储和索引是信息检索系统的基础。
它们负责将数据集合以适合检索的方式进行存储和组织,并构建索引以提高检索效率。
数据存储和索引可以基于文件系统、数据库或者分布式文件系统等技术实现。
6. 检索算法:检索算法决定了系统如何根据用户的检索请求计算并排序相关的文档或信息。
常见的检索算法包括向量空间模型、概率模型和基于机器学习的排序模型等。
检索算法可以根据不同的需求进行定制和优化。
7. 评估和反馈模块:评估和反馈模块用于评估检索结果的质量,并根据用户的反馈进行调整和改进。
通过用户的评价和点击行为等反馈信息,系统可以不断优化检索算法和模型,提供更准确和个性化的检索结果。
8. 网络通信和安全:网络通信和安全是计算机信息检索系统的重要考虑因素。
简述计算机信息检索的主要途径
![简述计算机信息检索的主要途径](https://img.taocdn.com/s3/m/90821e0e82c4bb4cf7ec4afe04a1b0717fd5b33b.png)
简述计算机信息检索的主要途径计算机信息检索是指通过计算机技术来获取与用户需求相关的信息的过程。
在互联网时代,信息爆炸性增长,人们面临着大量信息的困扰。
因此,计算机信息检索成为了解决这一问题的重要途径。
本文将从关键词检索、语义检索和推荐系统三个方面来阐述计算机信息检索的主要途径。
一、关键词检索关键词检索是最常见、最基础的信息检索方式。
用户通过输入关键词,在搜索引擎中进行搜索,搜索引擎通过索引技术将与关键词相关的网页进行匹配,并按照相关度进行排序展示给用户。
关键词检索的主要优点是简单快捷,用户只需输入几个关键词即可获取相关信息。
然而,关键词检索也存在一些问题,比如可能出现歧义,同一个关键词可能有不同的含义,导致搜索结果不准确。
针对这个问题,搜索引擎会通过自然语言处理和机器学习等技术进行相关性判断,提高搜索结果的准确性。
二、语义检索语义检索是一种更加智能化的信息检索方式,它通过理解用户的意图来获取相关的信息。
与关键词检索不同,语义检索更注重理解用户的查询意图,而不仅仅是匹配关键词。
语义检索利用自然语言处理、知识图谱和语义分析等技术,将用户的查询解析成语义表示,并与语料库中的语义进行匹配,从而提供更加准确的搜索结果。
语义检索的优点是能够理解用户的查询意图,减少歧义,提高搜索结果的准确性。
然而,语义检索的实现面临着挑战,因为自然语言的表达方式多样化,理解用户的真实意图并进行准确匹配是一个复杂的任务。
三、推荐系统推荐系统是一种根据用户的兴趣和偏好,主动向用户推荐相关信息的技术。
推荐系统通过分析用户的历史行为、兴趣标签和社交网络等信息,建立用户模型,并根据用户模型推荐相关的信息。
推荐系统可以帮助用户发现他们可能感兴趣但自己没有意识到的信息。
推荐系统的主要优点是个性化和精准性,能够根据用户的特定需求进行推荐。
然而,推荐系统也存在一些问题,比如可能会出现信息过滤的问题,用户容易陷入信息的“过滤泡泡”,无法接触到更广泛的信息。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节检索课的教学模型
购买化妆品的属性可对应所有文献课 的各索引系统:
A前提:买什么东西?哪个厂家生产?该产品叫什么?是 否有批准文号(法定)?使用该产品的市场反馈如何? 产品的发明人或生产者是谁? 该厂家的地理位置在 哪里?是否含有特殊的有效成分? B模型化的具体对应与索引: 买 什 么 东 西 ---------- 分 类 索 引 ( CLASSIFICATION INDEX) 该 产 品 叫 什 么 --- 主 题 索 引 或 轮 排 索 引 ( SUBJECT INDEX,PERMUTERM INDEX ) 哪 个 厂 家 生 产 ----- 单 位 索 引 或 团 体 索 引 ( UNIT INDEX,CORPORAT INDEX) 是 该 厂 家 的 哪 地 方 的 分 厂 生 产 ----- 地 理 索 引 ( GEOGRAPHIC INDEX)
①收费与否: Sohu、Sina、Chinaren、Google、Yahoo等搜索 引擎均是免费使用,而一些商业信息资源库发 dialog、STN等,维普、万方等则有偿使用,即 只有授权用方才可以使用。 ②信息专业程度不同: 从内容上看,Sohu、Sina、Google等提供综合性 较强的大量信息,其中不少信息是属于时效性 较短之公共信息,其中不少信息是属于时效性 较短之公共信息,而其本身信息的更新频率较 快,而对于针对性较强之专业信息需求和检索, 则是用与专业网站链接方式提供 dialog,STN,BRs等信息资源库则是以权威性而著 名,能提供方向性极强的专业需求,其本质的 资源和容量查一般较全面,这是一般搜索引擎
(1)工业革命 (2)信息化革命 (b) 统计数据: (1)每一分钟产生一本书 (2)每30秒产生一篇专利 (3)每15-16秒产生一篇论文 (4)每年全世界的图书总量: 图书近百万种 论文近数十万 专利近百万
论文近五百万 说明信息爆炸的事实 (c)科技文献 的有效期在缩短 一般文献的平均寿命为3-5年 一般经济类寿命较短只有1-4周 有些经济类信息的寿命仅90秒 (d)例:美国因信息不灵每年造成损失在30 亿以上,科技的成果的重复量达35% b科技文献分布异常分散 (a)体现在三个领域:分支学科,边缘学科 交叉学科 (b)体现在学科 的发展上: (1)传统学科的应用技术50%来自 别的学科 。 (2)新兴学科 的80%来自别的学科
(4)情报检索学习另一障碍为语言障碍 不少文献系统是以英文的形式出版 世界上70%的著名系统是英文的 五、情报检索思维之形成和巩固 用以下方式较有效: 学习--介绍--著录介绍--使 用与巩固—(尽快)实习(自己兴趣与课题 相关)
第二节计算机信息检索的的产 生和发展过程
A计算机联机检索产生的时代背景: a文献的数量急剧增长: (a)目前的处于科技的高速发展阶段:
第三节排名的国际上高校和研 究所依据
(1)目前国内的226(以前的386) (2)排名的国际上高校和研究所依据论文标准是: EI(Engineering Index) SCI(Science Citation Index) SR(Science Review) ISTP(International Science and Technology Proceeding ) (3)国际著名的刊物有Science,Nature (4)在管理上和科研中的应用
从案例看: (1)广州标致的引进与生产 (2)关于非典的知识产权(美国疾病控制中 心) (3)王选的策略及其经验 (4)中国目前的西药的局面和原由 (5)中国的中药的局面 (6)日本的发展和策略 (7)中国的手机的引进和电视机的发展 -----------------------袁隆平的分析 项目失败:永康厂,电池厂,健特生物 项目 成功:美菱,丰原生化,
第五节公共搜索引擎的信息搜索与 dialog等专业信息库之信息检索的比 对分析
随着计算机的普及和计算机技术的发展,电子手段进 行信息需求之检索成为一种非常重要的手段与工具。 然而由于计算机对各种计算机系统的了解不同和使用 不同,尤其在信息检索方面,如果严格用信息检索之 算标准,(如查全实、查准率等)看,则在使用效果 之差别较大,因此对不同检索工具予以了解,并且知 道彼此差异,将对检索大有裨益,目前信息检索中, 可以通过搜索引擎辅助定位,或者直接进入知名信息 资源系统,如国家图书馆,Dialog、STN等,虽然都可 以检索,但不具备地同等替代性,但是在检索效果和 性能上有较大区别。主要体现在以下几个方面:
是否有批准文号(法定)------专利号索引(PATENT INDEX) 使 用 该 产 品 的 市 场 反 馈 如 何 ? ------- 引 文 索 引 ( CITATION INEDEX) 产品的发明人或生产者是谁?-------作者索引或来源索引 (AUTHOR INDEX,SOURCE INDEX) 是 否 含 有 特 殊 的 有 效 成 分 ? ----- 化 学 物 质 索 引 ( CHEMICAL SUBSTRANCE INDEX,ALLOY INDEX ) 通过上面的变化,可将非常复杂枯燥的内容变得非常易 记且没有任何记忆负担,同时众多变化多样的系统变 成一个简单的模型,从学习指导和使用来说都使之变 得非常易懂,易学。 上述模型的核心是将许多的系统变成一个系统然后再变 成生活中易记的模型。该模型较宜非情报专业的学习 和初学者的学习。
个 公开将计算机用于检索。
(4)1965年美国医学图书馆用计算机编 制 医学文献检索刊物(医学索引)月度索 引。 b国际联机检索阶段:(1965—1972) (1)由于集成电路和计算机技术的产生和发展和数字通讯 技术的进步,促进了联机检索的发展。 (2)美国的LECKHEAD公司(洛克希德)于1965-1966年 建立了DIALOG系统(当时主要用电话联结)。 c 国际联机检索的发展和普及:(1973-1985) (1)卫星通讯: (2)光纤通讯: 使可通过联机终端,检索几年或几十年的各国资料。 一般以DOS专用软件较多。 d光盘版数据库的出现和WEB版数据库的出现: (1)1985年世界上首次出现了光盘数据库。 (2)1998年以后出现了WEB版数据库。
③检索表达方式和效率不同: Sohu、Sina、Chinaren、altarista本身有搜索 窗口,并能执行简单的分类检索,其搜索窗 口主要是输入关键字,而分类检索则是层级 分类只能进行简单运算,当然还有它检索途 径但较简单,从检索过程看,如果要对内容 表达较复杂之课题进行检索只有进行二次检 索,较难进行一步复合检索. 而在Dialog STN等信息资源库,可进行复合检 索式之检索,可执行Boll代数,截词算法, 位置算法及限定算法等,使一个内容的课题 可以用复合检索策略表达出来,并且使之运 行,各执行步骤和检索词及结果均有相应的 子集合,且可随时调用,因此运行检索表达 方式效率肯定较高,这是在使用中两种检索 工具最主要差别之一。
非情报专业情报学习思维的难点:
(1)情报学习模式是一种有别于其它学科学 习的思维模式 数学思维要求严密 诗歌思维要求想象力 信息检索思维要求(著录)格式学习和联结
(2)情报检索学习之困难在于: 局部文字描述整 体,静止文字描述联结和运动之困难。 a 主观:情报检索学习之困难在于调整至与之相应 的思维方式,其学习过程实际上是要求了解不 同的著录格式和构成之信息,并根据已有信息 和目标直接或间接地通过操作,使各个部分联 结起来,这会使著录格式之学习很枯燥, b客观:学习联结各著录格式之操作时,则显示文 字描述操作的局部性,文字描述图示之低效性, 尤其较复杂之著录格式在隔离不同之时空进行 讲解时,则更显困难。
案例: 前日大学生参军的访谈 中关村老总的谈话 全世界的成功者的持续十年的成功者概率是低 于10% 去年的中国富豪的命运 大学生的就业的基本的条件与学习内容 西方 的MAB和各国企业文化的不同与中国的 一致性 丁磊和张朝阳等,李嘉诚及其儿子的实例
为什么要学习计算机信息检索
第一:从内容分析看: (1)学生学习的本质: (2)学习内容的本质和作用 : (3)学习的原则: 由厚到薄---由薄到厚 (4)学习的自我延伸: (5)学生的自我社会延伸:A能力: B角色:心理与惯性 C再学习的角色和素质 要求 D学习的社会变通性
虽然是不同出版商出版,其彼此系统应有的 区别,但其检索功能和特性又使彼此似曾 相似,或者冠以不同名称,但功能相似。 如 : Ei 中 Subject Index 和 Sci 中 之 Permaterm Index 如: CA中GENERAL Subject Index和Chemical SubStance. 又如:WPI中的employee Index与 SCI中Source Index 与 MA和EI中Author Index等
(3)情报检索学习之困难第二为似曾相似之干 扰 情报检索学习过程中,可遇到多种检索系统如 SCi (Science Citation Index) Ei (Engineering Index) MA(Matal Abstract) WPI(World Patent Index) SA(Science Abstract)
c文献的寿命在缩短:
苏联:图书寿命:10-20年 科技报告 : 10年 学位论文:5—7年 期刊等连续出版物:3—5年 西方学者一般的观点: 80%-90%的文献周期在3-5年 B计算机通讯和高密度存储技术的发展为联 机信息检索的产生 和发展提供了物质基础。 3联机发展的四个阶段: a联机产生阶段: (1)50年代中期计算机处于电子管 阶段 (2)1954年美国海军军械中心(NOTS) 研制了计算机检索系统(雏形). (3)1961年美国化学文摘社在世界上第一