信息检索第三章
第三章 信息检索基本知识
信息论的奠基人 申农在《通信的数学 理论》中把信息定义 为:“信息是用来消 除不确定的东西。”
控制论创始人
维纳在《信息控制论》 一书中指出:“信息是 人与外界相互作用过程 中相互交换的内容和名 称。”
―信息”的定义之所以呈现多样化,主要有三方 面的原因 : 第一,信息本身的复杂性。它是一个多元化、 多层次、多功能的综合物; 第二,信息科学是一门新兴学科,是一门“大” 学科,它有许多分支学科,它的内涵与外延 不很确切,而且随着社会、经济和科学技术 的发展处于不断发展之中; 第三,人们出于不同的研究目的或使用目的, 从不同的角度或层次出发,对“信息”必然 作出不同的理解与解释。
4.从信息观的角度理解,知识是人类通过信息 对自然界、生物界、人类社会运动规律的认识 和概括,是一种特定的人类信息,它是对信息 进行提炼、深化、抽象化、系统化的结果,是 信息中最有价值的部分。知识是信息的一部分。 知识必须要有充分、可靠的经验性证据, 并且要经过理性的合理加工。
(二)知识的特性 1.实践性 社会实践是一切知识产生的基础和检验知 识的标准,科学知识对实践有重大指导作用。 2.规律性 人们对事物的认识是一个无限的过程,人 们获得的知识在一定层面上揭示了事物及运动 过程的规律性。 3.渗透性 随着知识门类增多,各种知识可以相互渗透, 形成许多新的知识门类,形成科学知识的网状 结构体系。
四、文献 (一)文献的定义 1.国际标准化组织《文献情报术语国际标准》: 文献是存储、检索、利用或传递记录信息的过 程中,可作为一个单元处理的、在载体内、载 体上或依附载体而存储有信息或数据的载体。 2.国家标准《文献著录总则》:文献是记录有知 识的一切载体。 北大教授王子舟《图书馆学是什么》:是指专门 记录、传播有知识的一切载体。 南大教授沈固朝《信息检索(多媒体)教程》: 记录有人类精神信息的、且便于存贮或传递的 人工固态附载物
文献信息检索第3章 习题与答案
第3章图书信息资源利用1.图书馆的类型有几种?试比较实体图书馆和网上虚拟图书馆为读者所提供的服务功能有何不同。
答:图书馆的类型:按其存在形式可分为实体图书馆和虚拟图书馆;按其职能分为其他类型图书馆:公共图书馆、科学与专业图书馆、高等学校图书馆、国家图书馆和版本图书馆、军队图书馆、工会图书馆、社区图书馆等。
实体图书馆和虚拟图书馆的不同:实体图书馆有空间距离及固定开馆时间的限制,虚拟图书馆无时间空间限制,读者可以通过Internet进入图书馆,任意浏览或下载电子文献,获得所需信息。
虚拟图书馆不单介绍本馆情况,更重要的是作为网上服务的窗口,引导读者使用图书馆的资源和服务,并帮助读者以最快的速度获得所需的信息。
此外,图书馆还可以利用HomePage收集有关信息源的网址,建立学科信息导航系统,帮助读者在茫茫的网上电子信息世界中漫游、检索所需的文献信息(特别是各种免费资料)。
2.什么是数字图书馆?比较传统图书馆、数字图书馆、移动图书馆的区别。
答:数字图书馆的定义:数字图书馆是在网络环境下,利用数字化技术手段,使用规范化的方法,整理加工信息资源,供用户使用的机构。
传统图书馆、数字图书馆、移动图书馆的区别:1)从历史继承性来看,数字图书馆是传统图书馆的发展。
传统图书馆的藏书以纸质印刷书刊资料为主,服务以图书为中心,通过卡片目录反映馆藏信息,通过读者到馆借阅和送书上门传递信息,整个工作以手工操作为主。
数字图书馆则在许多方面有别于传统图书馆,即信息资源由过去的“以藏为主”变成了“藏用结合,以用为主”;信息服务由被动服务、单一服务变成了主动服务、综合服务;书目管理由卡片式变成计算机管理;读者借阅由封闭型变成开放型;信息资料的储存由单一的印刷型变成纸质图书、缩微、电子出版物和网络储存相结合的多元化方式。
2)从信息资源建设来看,传统图书馆是数字图书馆的基础。
数字图书馆作为一种信息环境,离不开各个具体图书馆和信息机构的支持。
第三章 信息检索的基本知识
1、逻辑“或”(和) 、逻辑“
————————————————— A
B
用符号“ 或 表示, 用符号“or”或“+”表示,其逻辑表达式为: 表示 其逻辑表达式为: A or B 或 A+B 其意义为检索记录中凡含有检索词A或检索词 , 其意义为检索记录中凡含有检索词 或检索词B, 或检索词 或同时含有检索词A和 的 均为命中文献。 或同时含有检索词 和B的,均为命中文献。
分 析 课 题
检索词: 检索词: : :
富营养化(水华), ),处理 富营养化(水华),处理 治理,修复), ),湖泊 (治理,修复),湖泊
ቤተ መጻሕፍቲ ባይዱ
, ,
,
检索工具: 检索工具:
1. 2. 3. 4. 5. 6. 7. 8. 中文科技期刊全文数据库(维普) 1989中文科技期刊全文数据库(维普) 1989-现在 中国科技成果数据库(万方) 1986中国科技成果数据库(万方) 1986-现在 中国期刊全文数据库(同方) 1979中国期刊全文数据库(同方) 1979-现在 中国优秀博硕士学位论文全文数据库(同方)1999中国优秀博硕士学位论文全文数据库(同方)1999-现在 中国学位论文文摘数据库(万方) 1989中国学位论文文摘数据库(万方) 1989-现在 中国学术会议论文全文数据库(万方) 1995中国学术会议论文全文数据库(万方) 1995-现在 中国重要会议论文全文数据库(同方) 2000中国重要会议论文全文数据库(同方) 2000-现在 中国重大科技成果数据库(万方) 1990中国重大科技成果数据库(万方) 1990-现在
中图分类法
中图法》 个基本部类, 《中图法》分 5个基本部类,将知识门类分为 哲学” 社会科学” 自然科学” “哲学”、“社会科学”、“自然科学”三大部 马克思主义、列宁主义、 类。马克思主义、列宁主义、毛泽东思想是指导 我们思想的理论基础,作为一个基本部类, 我们思想的理论基础,作为一个基本部类,列于 首位。此外,考虑到图书本身的特点, 首位。此外,考虑到图书本身的特点,对于一些 内容庞杂,类无专属, 内容庞杂,类无专属,无法按某一学科内容性质 分类的图书,概括为“综合性图书” 分类的图书,概括为“综合性图书”,作为一个 基本部类,置于最后。 22个大 基本部类,置于最后。在此基础上扩展为 22个大 类。 标记符号采用拉丁字母与阿拉伯数字相结合的混 合号码制。 合号码制。
信息检索 第3章 中文主要信息资源检索系统
轻工 纺织
建筑 建材
环境 《环境科学文摘》
《馆目:环境污染与保护》
《汽车文摘》 《公路运输文摘》 《水陆运输文摘》 《造船文摘》 《中目:船舶工程》 《外目:造船工程》 交通 《中目:公路、水陆运输》 《铁道文摘》 运输 《中目:铁路》 《专利文献通报:汽车 》 《专利文献通报:包装、搬运、储存》 《外目:航空与航天》 《航空发动机文摘》 航天 《馆目:交通运输、航空航天》
WEB版(网上包库)、镜像站版、光盘版、流量计费。
四川农业大学图馆网站简介
◆
点击
各种类型的电子文献资源: 中外文期刊、图书及特种文献
读者查询 点击:
四、中国期刊全文数据库信息检索
1. 登录检索系统
鼠标接触
点击: 外网或本地镜像
CNKI中国知识资源总库
点击
选择单一数据库 或选择多个数据库进行跨 库检索
《电工文摘》 《中目:电力电工、原子能》 水利 《外目:电力》 《中目:水利水电》 电力 《外目:水利水电》 《中文电子科学文摘》 《电子科技文摘》 电子 《中国无线电电子科技文摘》 《计算机应用文摘》 学 《国外电子科学文摘》 《专科文献通报:电子技术》 《馆目:无线电电子学与自动化技术》
计算 《专利文献通报:计算机和信息存储》 机 《计算机应用文摘》 《中国纺织文摘》 《纺织文摘》 《皮革文摘》 《造纸文摘》 《中目:轻工、纺织》 《外目:轻工业》 《外目:粮油食品》 《外目:制糖工业》 《馆目:轻工、纺织》 《专利文献通报:纺织》 《专利文献通报:生活日用》 《专利文献通报:造纸、印刷、装帧》 《建筑机械文摘》 《中目:建筑工程》 《中目:建筑材料》 《外目:建筑材料》 《外目:建筑水利工程》 《馆目:建筑水利工程》 《城市文献通报》
现代信息检索教程第三章(中文10春)
检索方法 全国报刊索引》编排方式是按类编排, 《全国报刊索引》编排方式是按类编排,同时每期后 面附有著者索引, 面附有著者索引,因此该检索工具的检索途径主要有分 类途径和著者途径。 类途径和著者途径。 检索有关国内“音乐事业”的文献。 例:检索有关国内“音乐事业”的文献。 检索工具《全国报刊索引》哲社版2008 12期 2008第 ①检索工具《全国报刊索引》哲社版2008第12期 检索途径: ②检索途径:分类途径 检索过程:查分类目录,一级类艺术J ③检索过程:查分类目录,一级类艺术J,二级类为 J6音乐,其下又有三级类J69音乐事业,页码P295,翻 J6音乐 其下又有三级类J69音乐事业 页码P295, 音乐, 音乐事业, 到该处浏览, P295得 篇文献是切题的。 到该处浏览,在P295得3篇文献是切题的。 检索结果: 篇相关文献,顺序号为:081217152、 ④检索结果:得3篇相关文献,顺序号为:081217152、 081217153、 081217154。 081217153、 081217154。
返回目 录
4.其它重要百科全书 钱伯斯百科全书》 《钱伯斯百科全书》、《美国学术百科全 世界图书百科全书》 书》、《世界图书百科全书》、《计算机 科学与技术百科全书》、《柯克-奥斯莫化 科学与技术百科全书》 柯克工大全》)、《布罗克豪斯百科全书》 工大全》)、《布罗克豪斯百科全书》、 拉鲁斯大百科全书》 《拉鲁斯大百科全书》、《苏联大百科全 书 》 等。
返回目 录
百科全书(Encyclopedia) 二、百科全书(Encyclopedia) 百科全书是汇总浓缩人类所有知识门类或某一知 识门类的全部知识、 识门类的全部知识、按辞典形式编排的大型参考 工具书。以其知识广博、资料精确、释文严谨、 工具书。以其知识广博、资料精确、释文严谨、 文字简明、体例严密, 文字简明、体例严密,以及兼具多种参考工具书 功能的特质,被称为“工具书之王” 功能的特质,被称为“工具书之王”、“精简的 没有围墙的大学” 图书馆” 图书馆”、“没有围墙的大学”,是参考工具书 中最重要的类型, 中最重要的类型,已成为衡量一个国家科学文化 发展的尺度之一。 发展的尺度之一。
信息检索与利用-第三章
中国古代字书(字典、词典)
以字形为系——《说文解字》系统 继(东汉)许慎《说文解字》后,主要有晋吕忱《字林》、北魏江 式《古今文字》、南北朝梁顾野王《玉篇》、宋司马光的《类篇》、明 梅膺祚的《字汇》、清张自烈的《正字通》和张玉书等奉敕编纂的《康 熙字典》等。 以字音为系——韵书系统 韵书的特点是对汉字审音辨韵,依韵编排。主要有三国魏李登的 《声类》、晋吕静的《韵集》、南北朝梁周颙的《四声切韵》和沈约的 《四声谱》、隋陆法言的《切韵》、宋陈彭年等人的《广韵》和丁度等 人的《集韵》、金王文郁的《平水新刊礼部韵略》、元熊忠的《古今韵 会举要》、明乐韶风的《洪武正韵》、清李光地的《音韵阐微》等。 以字义为系——雅类系统 相传汉初学者缀辑周汉诸书旧文而成《尔雅》,是按事物性质将汉 字分门别类加以解释的字书,晋代郭璞和宋代邢昺为之注疏。有汉孔鲋 《小尔雅》和刘熙的《释名》(《逸雅》)、三国魏张揖《广雅》、宋 陆佃的《埤雅》和罗愿的《尔雅翼》、明朱谋玮的《骈雅》和方以智的 《通雅》、清吴王搢的《别雅》和史梦兰的《叠雅》等。
一、书 目
(二)书目的类型
古典书目:有官修书目、史志目录、私家书目、版本目录、推
荐书目等。 汉朝刘向在典校古籍时,撰有《别录》。后来,他的儿子刘歆以 《别录》为基础撰成《七略》,这是我国第一部分类目录。
一、书 目
现代书目:
1. 登记书目、通报书目、新书目录、推荐 性书目、书目之书目 2. 综合性书目、专题(学科)书目、地 方文献书目、个人著述目录 3. 馆藏目录、联合目录 4. 现行书目、回溯性书目、新书预告目 录、古籍目录 5. 图书目录、报纸目录、期刊目录、丛 书目录、方志目录、乐谱目录、非书资料目 录 6. 印刷型书目、机读目录、网络版书目
第三章 信息检索教程
举例:期刊2
23
期刊著录格式
24
期刊的著录
写出下面期刊文献著录:
25
小节练习1
1. 什么是文献著录? 2.文献著录的结果是—— 3. 既著录主要项目,还著录全部选择项目的著录级次称为—— 4. 既著录主要项目,还著录部分选择项目的著录级次称为——
26
3.2 机读目录与元数据
3.2.1 机读目录
43
3.2.3 都柏林核心元数据和机读目录的比较
1. 著录的对象不同
DC与 MARC的 3. 著录的主体不同 比较 4. 著录的详简程度不同
5. 标识的方法不同
2. 数据的形式不同
44
小节练习2
1、什么是机读目录,一条CNMARC机读目 录的组成? 2、头标区数据元素: 00123cbm1#2200277###52## 其中c、b、m、1分别表示什么? 3、什么是元数据?
12
图书的著录(参考文献著录规则)
13
14
图书著录中的文献类型标志
常用文献类型用单字母标识,具体如下: (1)期刊[J](journal) (2)专著[M](monograph) (3)论文集[C](collected papers) (4)学位论文[D](dissertation) (5)专利[P](patent) (6)技术标准[S](standardization) (7)报纸[N](newspaper article) (8)科技报告[R](report)
CNMARC记录
记录头标区
地址目次区
数据字段区
记录分隔符
注:各字段数据元素及其标准详细情况参见教材P83-87
33
ISO-2709的机读目录标准
信息检索课件第3章
文本信息检索的应用场景
01
02
03
搜索引擎
搜索引擎是文本信息检通过分析用 户历史行为和兴趣,为用 户推荐相关内容,如新闻 推荐、电商推荐等。
学术领域
学术领域中,研究人员可 以通过文本信息检索快速 查找相关论文、研究成果 等。
查询条件最相似的图像。
图像信息检索的关键技术
1 2
特征提取算法
特征提取算法是图像信息检索的核心技术之一, 常用的算法包括颜色直方图、SIFT、SURF等。
特征匹配算法
特征匹配算法用于比较不同图像之间的相似度, 常用的算法包括欧氏距离、余弦相似度等。
3
索引技术
索引技术可以提高图像信息检索的效率,常用的 索引技术包括哈希索引、B树索引等。
特征提取是视频信息检 索中的核心技术之中提取出关键帧和 图像特征,以便后续的 相似度计算和检索排序。
相似度计算是另一个关 检索排序是根据相似度 视频摘要技术则是对整
键技术,它通过比较不 计算结果,按照相关度 个视频内容进行概括和
同视频之间的特征信息, 对视频进行排序,以便 总结,以便用户快速了
图像信息检索的应用场景
搜索引擎
搜索引擎是图像信息检索 的重要应用场景之一,用 户可以通过搜索引擎查找 符合特定条件的图片。
电子商务
电子商务网站可以利用图 像信息检索技术为用户提 供更加精准的商品推荐服 务。
文化创意产业
在文化创意产业中,图像 信息检索技术可以帮助用 户快速查找相关艺术作品、 文物等。
THANKS.
智能化发展
利用人工智能技术提升信息检索的智 能化水平,如自然语言处理、深度学 习等。
个性化服务强化
通过更精细化的用户画像和个性化推 荐算法,提高信息检索的个性化服务 能力。
第三章 文献信息检索基本原理及方法
标题词语言关键词语言单词语言叙词语言检索语言
主题语言 由于不同概念相交就会 形成一个新概念, 形成一个新概念,这个 新概念是组配前各概念的 下位概念。 电子” 下位概念。如:“电子”和 信息”组配产生电子信息。 “信息”组配产生电子信息。 同级词间不同概念并 组配结果,可提高查准率。 组配结果,可提高查准率。 列也会形成一个新概 念,这个新概念是组配 前各概念的上位概念。 前各概念的上位概念。 数字计算机” 如“数字计算机”和“模 拟计算机” 拟计算机”组培后得 到“计算机”这一新的 计算机” 是不同级词间的组配, 是不同级词间的组配,是用 上位概念。组配结果, 上位概念。组配结果, 时间、 时间、空间和学科范围某一 提高查全率。 提高查全率。 方面的属性进行限定的一种 概念关系。 建筑物” 概念关系。如:“建筑物”为 主体事物, 设计” 主体事物,“设计”为某个方 组配结果被限定为“ 面,组配结果被限定为“建 筑物设计”这个新概念, 筑物设计”这个新概念,组配 结果可使检索到的文献专指度 和查全率提高。 和查全率提高。
3.1.1 文献信息检索的基本含义 一、文献信息检索的基本含义
“检索”即“查找”之意。信息检索,是将信息按照一定的方式 检索”即“查找”之意。信息检索 信息检索,是将信息按照一定的方式 组织、存储起来,并针对用户的需要查找所需信息的过程。因此信 息检索包含了信息的存储和检索两个不可分的部分。我们通常所说 的信息检索是指狭义的信息检索,即从检索工具和检索系统中查找 所需信息的过程及其所采取的一系列方法和策略。
手工检索和计算机检索的关系:手检是基础,机检是发展方向。 手工检索和计算机检索的关系:手检是基础,机检是发展方向。
3.1.2 文献信息检索的类型 按检索要求划分: 按检索要求划分: 相关性检索——是系统不直接回答用户所提出的 相关性检索 技术问题本身,而是只提供与之相关的文献供用 户参考。 确定性检索——是以数据或事实为检索对象,系 确定性检索 统要直接问答用户提出的技术问题,即直接提供 用户需要的确切的数据或事实。
信息检索课件 第3讲 信息检索的基本知识
教学目标
本章将介绍手工和计算机检索的基 本知识,让读者了解检索的一般程序, 本知识,让读者了解检索的一般程序, 包括如何分析问题、如何获取原文、 包括如何分析问题、如何获取原文、何 谓检索语言、 谓检索语言、常用的检索技术和检索方 法有哪些、如何对信息检索评价。 法有哪些、如何对信息检、引文法(跟踪法) 、引文法(跟踪法) 文献之间的引证和被引证关系揭示了文 献之间存在的某种内在联系, 献之间存在的某种内在联系 , 引文法就 是利用文献后所附的参考文献、 是利用文献后所附的参考文献 、 相关书 目 、 推荐文章和引文注释查找相关文献 的方法。 的方法 。 这些材料指明了与用户需求最 密切的文献线索, 密切的文献线索 , 往往包含了相似的观 思路、 方法, 具有启发意义。 点 、 思路 、 方法 , 具有启发意义 。 循着 这些线索去查找, 这些线索去查找 , 不仅利用了前人的劳 动成果, 省却了很多时间和精力, 动成果 , 省却了很多时间和精力 , 而且 可能在原来的基础上有新的发现。 可能在原来的基础上有新的发现。
一、一般检索方法 1.“拉网法”(广度优先法) 拉网法” 广度优先法) 拉网法 在不了解查询某一专题信息的URL地 在不了解查询某一专题信息的 地 址时,可从提供信息总目的Web 页面开 址时,可从提供信息总目的 始浏览, 沿着专题链接层层查找, 始浏览 , 沿着专题链接层层查找 , 直至 找到有关的内容为止。 找到有关的内容为止 。 然后保存这个页 面的URL, 转向另一个分支 。 这种方法 面的 , 转向另一个分支。 可以迅速获得较多的相关地址, 可以迅速获得较多的相关地址 , 然后进 行筛选。 就使用引擎而言, 行筛选 。 就使用引擎而言 , 国外专家也 建议先用链接页面多、 建议先用链接页面多 、 响应时间快的引 擎。
第三章 网络信息检索
第三章网络信息检索第一节网络信息检索的基本方法1、布尔逻辑检索逻辑检索是一种比较成熟、较为流行的检索技术。
逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符,主要的运算符有:(1)逻辑―与‖逻辑―与‖用AND(或﹡)表示。
检索词A、B若用逻辑―与‖相连,即A AND B(A*B),则表示同时含有这两个检索词才能被命中。
例如,要检索儿童教育的文献,检索逻辑式可表示为:child AND education(2)逻辑―或‖逻辑―或‖用OR(或+)表示。
检索词A、B若用逻辑―或‖相连,即A OR B(A+B),则表示只要含有其中一个检索词或同时含有这两个检索词的文献都将被命中。
例如,要检索―计算机‖或―机器人‖方面的文献,检索逻辑式可表示为:computer OR robot. (3)逻辑―非‖逻辑―非‖用NOT(AND NOT,BUT NOT)(或-)表示。
检索词A、B若用―非‖相连,即A NOT B(A-B),则表示被检索文献在含有检索词A而不含有检索词B时才能被命中。
例如,要检索有关―能源‖方面的文献,但涉及―核能‖方面的文献不要,检索逻辑式可表示为:energy NOT nuclear(energy –nuclear)。
1、搜索引擎的定义搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具,简言之,搜索引擎就是一种在因特网上查找信息的工具。
用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果反馈给用户。
搜索引擎一般都有固定的显示格式,内容详简程度不一,常常带有URL、题名、标题、关键词、摘要(文本描述摘录)、超链接文件大小、检索结果总数、相关度估计、评论等。
搜索引擎的检索结果一般按查询的相关程度进行排列,最相关的通常排在最前面。
2、搜索引擎的常用检索方法(1)简单搜索(simple search)指输入一个单词(关键词),提交搜索引擎检索后反馈结果。
它也叫单词搜索。
信息检索chapter3(2)
综合参考
一、信息检索语言 2、 分类语言
《人大法》同《中图法》的编制原则基本相同,都是按 照学科之间的内在联系,从总到分,从一般到具体逐级 展开,从而构成一个纲目分明的体系
一、信息检索语言 2、 分类语言
20世纪90年代中期,人们对分类语言应用于网络环境进 行了研究和实践,一些重要的分类法不仅应用于大型数 据库的分类标引与检索,也开始被广泛应用于网站目录 的组织 但是,网络资源内容更加丰富、数量更加庞大,信息的 分类也更加复杂
– 用“属”(S)(上位词)、“分”(F)(下位词)表示(下位概念 F)货币危机
同义关系
– 又称等同关系或代用关系 – 用“代”(D)、“用”(Y)表示
相关关系
– 又称类缘关系
– 用“参”(C)表示
一、信息检索语言 3、 主题语言
《汉语主题词表》
1980年正式出版 是我国第一部大型综合性汉语叙词表
– 同义关系、属分关系、相关关系
办法:采用参照系统来揭示主题词的语义关系
参照系统是以各种符号来反映的,主要有5种
– 属(S)、分(F)、参(C)、代(D)、用(Y)
等级关系 相关关系 同义关系
一、信息检索语言 3、 主题语言
主题词的组织
等级关系
– 又称属分关系
金融危机 (上位概念 S)经济危机 银行危机 信用危机 等同概念 (等同概念 D)国际收支危机 货币信用危机 金融风暴 (相关概念 C)风险评价 货贷风险 金融动荡 债务危机 风险管理
结构
一级类
四级类
五级类
F251.1 物资管理体制 F251.2 物资计划 F251.3 物资统计
信息检索第三章EI
印刷版EI 编排结构与著录
正文:即文摘部分,是EI的主体。由一些文摘 条目组成,并以规范主题词为标目。主题词取 自规范词表。1992年以前使用《工程标题词 表》,1993年起使用《EI叙词表》
印刷版EI (月刊、年刊) 索引
月刊索引:著者索引、主题索引
年刊索引:著者索引、主题索引、 工程出版物索引
附录
EI文摘正文著录格式
叙词
COMPUTER AIDED INSTRUCTION
文…摘…号…
文献篇名
文摘内容
009057 Current situations and future directions of
intelligent CAI research/development . This pa-per
• PL以连续出版物的缩写题名字母为序编排。
• 著录内容包括:连续出版物的缩写题名、连续出 版物的全称、计算机识别代码与ISSN号。 • PL的主要作用:通过EI文摘正文给出的刊名缩 写查找连续出版物(期刊)的全称,从而通过查 找馆藏目录,获取原文。
J Inf Image Manage① Journal of Information and image Management② JIIMDW③
第三章 外文检索工具
常用外文检索工具
美国《工程索引》 英国《科学文摘》 美国《科学引文索引》 美国《科技会议录索引》
3.1 美国《工程索引》EI
1 概述 2 印刷版EI编排结构与著录 3 EI标题词表与叙词表 4 EI检索方法及检索示例
EI 概 述
• 美国《工程索引》 (The Engineering Index),简称EI • 1884年创刊,由美国工程信息公司编辑
信息检索课件第三章
3.2.2 CNMARC数据字段区的构成 (二)字段
001 记录标识号; 100 通用处理数据; 101 文献语种(当文献存在语言文字时); 120 编码数据字段:测绘制图资料——一般性特征(仅限于测 绘制图资料); 123 编码数据字段:测绘制图资料——比例尺与坐标(仅限于 测绘制图资料); 125 编码数据字段:录音制品与印刷乐谱(仅限于乐谱等文 献); 191 编码数据字段:拓片(仅限于拓片资料); 200 题名与责任说明项(仅$a正题名为必备数据); 206 资料特殊细节项:测绘制图资料的数学数据(仅限于测绘 制图资料); 230 资料特殊细节项:电子资源特征(仅限于电子资源); 304 题名与责任说明附注(仅限于电子资源); 801 记录来源。 《信息存储与检索》
5. 若是“)”,则将 其紧前一个检索词所 在行的级位栏值加1; 若有多个“)”则级 位值连续减1
4. 若是“(”,则将 其后的检索词所在行 的级位栏值加1;若 有多个“(”则级位 值连续加1,级位初 值为0
《信息存储与检索》
3.3.1 表展开法 (2)展开表的生成
后处理算法:
1. 从最后一行条件满足指向栏往上推,如果遇 到空,则置入下面最临近的且级位小于该栏的 条件满足指向栏的内容,或最后一行条件满足 指向栏的内容 2. 从最后一行条件不满足指向栏往上推,如果 遇到空,则置入下面最临近的且级位小于或等于 该栏的条件不满足指向栏的内容,或最后一行条 件不满足指向栏的内容
《信息存储与检索》
3.3.1 表展开法 (2)展开表的生成 例:逻辑提问式(A+B)﹡(C+D)﹡E的展开表形式
地址
条件满足指向 条件不满足指向 级位 检索词代号 字段号 比较条件 检索词
第三章信息检索的基本理论
第三章信息检索的基本理论目的要求了解信息检索系统的概念;了解手工信息检索系统的类型;熟悉手工信息检索系统的结构;掌握手工信息检索系统的著录格式和常用的手工信息检索系统的信息检索方法。
掌握计算机信息检索系统的构成和类型;掌握信息检索语言的基本类型;掌握信息检索原理。
第一节信息检索系统一、信息检索系统的概述信息检索系统是指由一定的设备和信息集合构成,具有一定存储、检索与传送技术设备,提供一定的存贮与检索方法及检索服务功能的工作系统。
简单地说,信息检索系统即信息的存贮和检索的系统。
广义:信息检索系统是包括了从信息采集到检索全过程的服务体系。
狭义:信息技术系统就是用户检索信息时所使用的检索工具。
信息检索系统具有输入功能、存贮功能、处理功能、输出功能及控制功能。
根据信息存贮和检索所设备和手段的不同,信息检索系统可分为两大类型,即:手工信息检索系统和计算机信息检索系统。
目前,信息检索系统已从传统的手工检索系统发展到计算机网络信息检索系统。
二、手工信息检索系统1、手工信息检索系统的类型书本式检索工具(期刊式检索工具、单卷式检索工具、附录式检索工具)和卡片式检索工具。
期刊式检索工具:指在一个题名之下,定期连续发行的一种检索工具。
它具有及时性、连续性和稳定性的特点。
例如各种文摘杂志、索引刊物、连续的馆藏目录等。
这种形式的检索工具,及时反映新出版、新发表、新入藏的文献信息,它随着新文献的不断出现而不断连续出版,保持与文献的平行发展关系。
因此科研工作者为了掌握和了解本学科的科研动态,定期查阅期刊式检索工具是一种非常有效的方法。
同时由于期刊式检索工具的连续性的特点,不少期刊式检索工具,每到一定时间累积后,对于回溯检索极为方便。
单卷式检索工具:这种检索工具多数是以一定的专题内容而编印的,选题一般具有独立的意义。
它专业性强,收集的文献比较集中,往往积累反映一个相当长时间的文献,并以特定范围的读者作为对象。
单卷式检索工具收录文献一般比较全面系统,排列组织比较切合专业研究的需要,因此,对于专题文献检索比较方便,使用价值较高。
信息检索第三章信息著录和标引
第三章信息著录和标引信息著录的含义和标准一、信息著录的含义信息著录:简称著录,指在组织检索系统时对文献内容和形式特征进行选择和记录的过程。
著录对象是信息,著录结果是款目或记录。
款目:指依据一定的标准方法,对一种文献或信息源的内容价值物质形态进行描述而形成的一条记录。
款目由一条条著录项目组成。
著录项目:用于揭示文献内容和形式特征的记录事项。
信息著录的基本要求:①准确性。
要求著录结果准确全面客观的揭示文献或其它信息源的内容特征或形式特征②规范化。
要求信息著录坚持标准化原则,按照统一的著录项目,著录格式,标识符号进行著录。
二、信息著录的作用1、揭示功能:信息著录主要反映的是文献本身的特征,通过对文献全面系统的分析,揭示出其内容特征和形式特征,将其浓缩于只言片语中,从而表达文献的基本信息。
2、组织功能:信息著录后形成的款目或记录,是编制目录的基础,也是组织数据库数据的基本单元。
文献编目包括信息著录和目录组织两步。
信息著录是对文献内容特征形式特征进行选择记录后形成款目或记录。
目录组织是将这些款目或记录按照一定组织规则编排在一起最终形成检索工具或数据库。
3、检索功能:存储是检索的第一个阶段,即将表达文献特征的有检索意义的标识通过记录组织成手工检索工具或计算机数据库,而表达文献特征的标识需要通过著录和标引来完成。
作为信息著录结果的款目或记录,记载了表达文献特征的各种标识。
三、信息著录的标准《文献著录总则》旨在根据各种类型文献的共同特点,确定文献著录原则、内容、标识符号、格式等的统一规定。
具有指导作用为信息著录提供原则性框架,并不作为文献著录的直接依据。
1、著录项目:①题名与责任者项②版本项③文献特殊细节项④出版发行项⑤载体形态项⑥丛编项⑦附注项⑧文献标准编号及有关记载项⑨提要项2、著录级次:著录文献的详简程度,分为三级:①简要级次,款目仅著录主要项目②基本级次,著录主要项目同时还著录部分选择项目③详细级次,著录全部主要项目和全部选择项目。
第三章 信息检索基本方法
3.2.3 截词检索
通常用“ *”表示无限阶段,用“?”表示有限阶 段。 无限截词符“*”,代表零至无数多个字母; computer* computer;computered ;computering; 有限截词符“?”,只能代表一个字母; teen? teens 例如: *chemi* chemical、chemist、chemistry、 electrochemistry、electrochemical、 physicochemical、thermochemistry
引文检索语言就是根据上述原理, 以引文为标识标引或检索文献,而 引文标识的全体就构成了引文检索 语言。 例如著名的《科学引文索引》 (SCI)、《社会科学引文索引》 (SSCI)、《艺术与人文科学引文索 引》(A&HCI)就是使用的这种引文 检索语言。
2.根据组配方式划分
先组式语言 事先用固定关系组配好,并编制在词表中, 标引人员和用户使用时必须根据词表选用 组配好的主题标识进行操作。例如体系分 类法和标题词法都属于此类。
(n)算符near:
(n)要求被连接的检索词必须紧密相连,词之间除 允许有空格、标点、连字符外,不得夹单词或字 母,词序不限; (Nn)表示两个检索词之间最多可以夹N个词(N为 自然数1、2、3…),且词序任意。 例如:information(n)retrieval
information retrieval 、 retrieval- information, economic(2n) recovery economic recovery 、 recovery from economic troubles
• •
•
引文途径
两种操作方法: 一是利用检索工具如SCI,通过被引用 文献入手,查找引用文献; 二是通过引用文献(来源文献)入手, 直接利用文献结尾所附的参考文献, 查找被引用文献。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数字搜索
特色
• 以“一切用数字说话”为理念,CNKI数字搜索 向您提供数字知识和统计数据搜索服务,以数值 知识元、统计图片/表格和统计文献作为基本的搜 索单元。 • 数值知识元 是描述客观事物或者事件数值属性 (如时间、长度、高度、重量、百分比、销售额、 利润等)的知识单元。 • CNKI数字搜索覆盖各学科领域,从科学知识到财 经资讯,从大政方针到生活常识均包括。 • 除了来自CNKI五大全文数据库外,CNKI数字搜 索还实时采集中央和各地方统计网站和中央各部 委网站,每条搜索结果均有权威出处。
1.提供检索词,帮助查全 2.提高检索效率
中国期刊全文数据库标准检索
匹配: 精确:检索结果完全等同或包含与检索字/词完 全相同的词 语 模糊:检索结果包含检索字/词或检索词中的词 素。
检索表达式
• 例:查询北大的王少华老师2000年在首都经 济贸易大学学报发表的有关人力资源管理 或人才资源管理方面的文献
共被引、共引分析
• 除提供传统参考文献、引证文献推送外,直观化共引 及被引分析
H指数分析
文献分布
在线阅读
快速无插件!
• 每次看文献都要下CAJ浏览器?想一次看多篇?
• 丰富浏览方式
– 在线实时浏览—无插件,更便捷 – 文献重组汇编,可挑选文章组成“知网刊”汇编文集
• 多终端浏览
– 支持智能终端浏览,突破终端限制 – Android、IOS、Windows、MAC OS、
福州大学图书馆订购中文电子期刊
登入:福大图书馆主页-数据中心-电子期刊
CNKI
• 国家知识基础设施(National Knowledge Infrastructure,CNKI)的概念,由世界银 行提出于1998年。CNKI工程是以实现全社 会知识资源传播共享与增值利用为目标的 信息化建设项目,由清华大学、清华同方 发起,始建于1999年6月。CNKI工程集团 经过多年努力,采用自主开发并具有国际 领先水平的数字图书馆技术,建成了世界 上全文信息量规模最大的"CNKI数字图书馆 ",并正式启动建设《中国知识资源总库》 及CNKI网格资源共享平台,通过产业化运 作,为全社会知识资源高效共享提供最丰 富的知识信息资源和最有效的知识传播与 数字化学习平台。
电子期刊的分类: 按有无印刷版划分:期刊电子版和纯电子期刊
按学术性划分:学术性电子学报型和电子快报型 按期刊内容的组织形式:集中型和分布型
网上电子期刊的特点
优点:
出版周期短 生产成本降低,发行费用低,价格低廉 具有超文本链接功能 可提供作者、读者、编辑之间交互沟通 具备较强的搜索功能 期刊容量可不受限制
中国期刊全文数据库标准检索
中国期刊全文数据库标准检索
主题:在篇名、关键词、摘要 中进行检索。
词频: 指检索词在相应检索项中出现的频次,可从下拉列表中选择 。词频为空,表示至少出现1次,如果为数字,例如3,则表示 至少出现3次,以此类推,可选1-9。 词频控制的适用范围: 适用的字段:主题、摘要、全文、参考文献。
中国期刊全文数据库专业检索
2009 年以来发表在核心期刊,研究 RFID (无线射频)供应 链的文献有哪些?
检索词? 检索式?
内容检索词:RFID、无线射频、供应链
内容检索式: (RFID+无线射频)*供应链
控制检索词:核心期刊 2009-2014
结果处理
知网节
• 针对具体一篇文献分析与其相关的知识节 点,使知识从一点扩展到一个面。
2009 年以来发表在核心期刊,研究 RFID (无线射频)供应 链的文Leabharlann 有哪些?检索词? 检索式?
内容检索词:RFID、无线射频、供应链
内容检索式: (RFID+无线射频)*供应链
控制检索词:核心期刊 2009-2014
1
2
1、期刊来源类别多了一个选项:CSSCI(中文社会科学引 文索引) 2、结果处理可进行分析/阅读:分析就是针对多篇文献进行
第三章中文检索工具
电子期刊简介
CNKI(清华同方)数据库检索与利用
CNKI、维普、万方三种数据库比较
电子期刊
电子期刊(E1ectronic Journal)是指以 数字形式存贮在电子媒介上,并通过电 子媒介发行和阅读的连续出版物。也就 是将IT技术运用于期刊文献之中,供人 们借助计算机通讯网络进行阅读、检索 和打印的期刊。
查工具书
概念搜索
特色
• 不同于一般的网页和文献搜索等参考型搜索 引擎系统,CNKI知识元数据库搜索是一部不 断更新完善的CNKI知识元数据库词典,力求 为您提供最权威、最准确的CNKI知识元概念。 • CNKI天、建筑、工业技术、计算机等所有 学科和行业。您只需简单的输入和点击操作, 就可以得到想要查询词汇得准确定义,并且 可直接查询定义出处。
根据检索界面提供的信息写出其所表示的检索式
检索式:主题=(计算机辅助设计 OR CAD) AND 作者单位=?福州大学?
注释3:() 表示优先符,表示()中的检索式优先进行检索,检出结果后 再与其它检索式进行运算。 优先符常用于逻辑或中,有时候为了使检索式看起来更整齐,也会在同一字 段下的多个检索词前后使用(),但不会改变运算的先后顺序,正如数学的 算式中,只有加减使用()会改变运算结果,乘除使用()并不会改变运算 结果一样。 例如:主题=(福建*经济发展)and全文=环境保护
中国期刊全文数据库标准检索
最近词 在未输入任何检索词的情况下,点击图标 ,将 弹出一个窗口,记录本次登录最近输入的10个检 索词。点击您所需要的检索词,则该检索词自动 进入检索框中。
中国期刊全文数据库标准检索
检索词扩展:概念相关词扩展/形式相关词扩展 点击图标 ,将弹出一个窗口,显示以输入词为 中心的相关词;相关词可以三种方式自动添加到 检索框中:单词自动增加、多词自动增加、相关 词取代原输入词。 扩展词的作用
网上电子期刊的特点
• 缺点
技术还有待进一步成熟 期刊整体质量 版权、价格及支付问题 期刊的整理和存储问题
• 中文电子期刊的发展始于20世纪90 年代,经过十余年的发展,目前已经有 清华同方、维普、万方等三家电子 期刊出版商,累计出版电子期刊为 1.1万左右(不含重复),基本囊括 了主要的中文期刊,内容也包括了 全部的学科。
清华同方(CNKI)
学术不端文献检测系统
数字化学习研究
翻译助手
特色
• 不同于一般的英汉互译工具, CNKI翻译助手是 以CNKI总库所有文献数据为依据,它不仅为您提 供英汉词语、短语的翻译检索,还可以提供句子 的翻译检索。不但对翻译需求中的每个词给出准 确翻译和解释,给出大量与翻译请求在结构上相 似、内容上相关的例句,方便您参考后得到最恰 当的翻译结果。 • CNKI翻译助手汇集从CNKI系列数据库中挖掘 整理出的800余万常用词汇、专业术语、成语、 俚语、固定用法、词组等中英文词条以及1500余 万双语例句、500余万双语文摘,形成海量中英 在线词典和双语平行语料库。数据实时更新,内 容涵盖自然科学和社会科学的各个领域。
图形搜索
表格搜索
特色
• CNKI表格搜索旨在为您提供各个行业的专业表格数据,他 不同于一般意义的文字、网页或是图索结果更加专业、权威。 • CNKI表格查询库内容涵盖了文、史、哲、经济、数理科学、 航天、建筑、工业技术、计算机等所有学科和行业。您只 需简单的输入和点击操作,就可以得到想要查询的相关表 格,并且可直接查询表格出处。 • 2.表格搜索方式 • CNKI表格搜索现阶段只提供初级搜索,您只需要输入想要 查询的表格数据的相关信息就可以。比如,您想查看我国 人口增长趋势,那么直接输入“人口增长”,然后点击 “搜索”按钮即可。
Linux。。。
呈现选文献的列 表,点击跳转
支持多篇文献选定在线浏览 , 组成“知网刊”汇编文集
多篇
呈现选文献的列 表,点击跳转
10/9/2015
支持多篇文献选定在线浏览, 组成“知网刊”汇编文集
特色
• CNKI学术趋势是依托于cnki中国知识资源 总库中的海量文献和千万用户的使用情况 提供的学术趋势分析服务。通过关键词在 过去一段时间里的“学术关注指数”,您 可以知道您所在的研究领域随着时间的变 化被学术界所关注的情况,又有哪些经典 文章在影响着学术发展的潮流;通过关键 词在过去一段时间内的“用户关注指数”, 您还可以知道在相关领域不同时间段内哪 些重要文献被最多的同行所研读。
作者单位=北京大学 AND 作者=王少华 AND 刊名 =首都经济贸易大学学报 AND 关键词=(人力资源 管理 OR 人才资源管理) AND 年=2000
根据检索界面提供的信息写出其所表示的检索式
检索式:主题=信息检索 * 作者单位=?福州大学? 主题=信息检索 * 作者单位=“福州大学”
注释1:“”这里表示精确匹配或者完全匹配,即作者单位只能表示为福州大学, 而不能是福州大学材料学院、福州大学管理学院.......但如果表示为福州大学 材料 学院、福州大学 管理学院则可命中 注释2:截词符表示部分匹配,根据截词位置的不同,匹配的部分也不相同,具体 可见教材或课件,至于截词的符号,不同的检索系统使用各有不同,请在具体使 用时注意提示。在本门课程中作业中统一使用?表示。
分析
选择几篇文献 点击分析阅读按钮 可将其聚合分析, 延续知网节特色, 形象直观展示文献间关系
分析:文献互引图
A B,则A引用了B, 观察更形象引文关系图, 研究成果产出脉络
图例:B为选中文献(蓝色), A为B的参考文献(绿色),C 为B的引证文献(黄色),则箭 头关系为A<-B<-C,球大小 表示引用次数多少
2012 年发表在核心期刊,受基金项目资助,研究小微企业 (包括小型企业和微型企业)融资或贷款的文献有哪些?
检索词? 检索式?