1.3信息检索基础知识
信息检索的基本知识
文献、数据、事实检索三者区别 数据检索与事实检索,都是要检索 出包含在文献中的信息本身,是确定性 的检索,检索结果是可以直接利用的。 文献检索,则是要检索出包含所需 信息的文献,是相关性检索,检索结果 经过分析研究后才能确定是否能用。
3 文献的类型
♦ 3.1 按文献的载体分
3.1.1 书写型文献:古旧文献和未经复印的手稿以及技术 书写型文献: 档案之类的资料。 档案之类的资料。 3.1.2 印刷型文献 3.1.3 缩微型文献 3.1.4 声像型文献 3.1.5 机读型文献 (电子出版物) 电子出版物) 3.1.6 网络出版物
(2)知识 知识 是人类认识的成果或结晶, 是人类认识的成果或结晶,包括经验知识和理 论知识。 论知识。 (3)情报 情报 人们为了一定的目的搜集的有使用价值的新知 识或新信息。情报具有知识性、传递性。 识或新信息。情报具有知识性、传递性。 情报的本质必须是知识,没有一定的知识内容, 情报的本质必须是知识,没有一定的知识内容, 就不能成为情报。 就不能成为情报。 知识必须经过传递才能成为情报。 知识必须经过传递才能成为情报。 (4)文献 文献 用文字、图形、符号、声频、视频等技术手段, 用文字、图形、符号、声频、视频等技术手段,记 录有知识的一切载体。 录有知识的一切载体。
5 文献检索的意义
♦ 1)通过文献检索课程的教学,学校可以培养
学生的情报意识和获取新知识的能力。 ♦ 2)通过文献检索课程的学习,学生能够学会 利用图书馆,提高自学能力。 ♦ 3)掌握了文献检索的方法和技能,将大大地 缩短收集情报的时间,提高利用文献的准确率。 ♦ 4)通过运用文献检索的方法和技能,学生可 以不断更新知识,提高自身综合素质,更好地 迎接新世纪的挑战。
第一章
信息检索的基本知识
第三章 信息检索的基本知识
1、逻辑“或”(和) 、逻辑“
————————————————— A
B
用符号“ 或 表示, 用符号“or”或“+”表示,其逻辑表达式为: 表示 其逻辑表达式为: A or B 或 A+B 其意义为检索记录中凡含有检索词A或检索词 , 其意义为检索记录中凡含有检索词 或检索词B, 或检索词 或同时含有检索词A和 的 均为命中文献。 或同时含有检索词 和B的,均为命中文献。
分 析 课 题
检索词: 检索词: : :
富营养化(水华), ),处理 富营养化(水华),处理 治理,修复), ),湖泊 (治理,修复),湖泊
ቤተ መጻሕፍቲ ባይዱ
, ,
,
检索工具: 检索工具:
1. 2. 3. 4. 5. 6. 7. 8. 中文科技期刊全文数据库(维普) 1989中文科技期刊全文数据库(维普) 1989-现在 中国科技成果数据库(万方) 1986中国科技成果数据库(万方) 1986-现在 中国期刊全文数据库(同方) 1979中国期刊全文数据库(同方) 1979-现在 中国优秀博硕士学位论文全文数据库(同方)1999中国优秀博硕士学位论文全文数据库(同方)1999-现在 中国学位论文文摘数据库(万方) 1989中国学位论文文摘数据库(万方) 1989-现在 中国学术会议论文全文数据库(万方) 1995中国学术会议论文全文数据库(万方) 1995-现在 中国重要会议论文全文数据库(同方) 2000中国重要会议论文全文数据库(同方) 2000-现在 中国重大科技成果数据库(万方) 1990中国重大科技成果数据库(万方) 1990-现在
中图分类法
中图法》 个基本部类, 《中图法》分 5个基本部类,将知识门类分为 哲学” 社会科学” 自然科学” “哲学”、“社会科学”、“自然科学”三大部 马克思主义、列宁主义、 类。马克思主义、列宁主义、毛泽东思想是指导 我们思想的理论基础,作为一个基本部类, 我们思想的理论基础,作为一个基本部类,列于 首位。此外,考虑到图书本身的特点, 首位。此外,考虑到图书本身的特点,对于一些 内容庞杂,类无专属, 内容庞杂,类无专属,无法按某一学科内容性质 分类的图书,概括为“综合性图书” 分类的图书,概括为“综合性图书”,作为一个 基本部类,置于最后。 22个大 基本部类,置于最后。在此基础上扩展为 22个大 类。 标记符号采用拉丁字母与阿拉伯数字相结合的混 合号码制。 合号码制。
信息检索基础知识
信息检索基础知识嘿,朋友们!今天咱来聊聊信息检索基础知识,这可太重要啦!就好像你在一个超级大的图书馆里找一本书,要是没点方法,那不得晕头转向呀!咱先说关键词,这可是信息检索的核心呐!就好比是打开知识大门的钥匙。
你想啊,你要找啥东西,总得有个大概的描述吧,这描述的词语就是关键词啦!比如说你想找怎么做红烧肉,那“红烧肉”就是关键的关键词呀,你可别弄些乱七八糟不相关的词,那能找到才怪呢!然后呢,是检索工具。
这就像是你的寻宝地图,各种各样的搜索引擎、数据库就是咱常用的检索工具。
你得知道哪个工具适合找什么类型的信息。
好比你要找学术资料,那去一般的搜索引擎可能就不太靠谱,得去专业的学术数据库才行。
还有啊,检索策略也很重要呢!这就像你作战的计划。
你得想好怎么组合关键词,怎么扩大或缩小检索范围。
可不能一股脑地乱搜一通。
比如说你只搜一个词,可能出来的结果太多太杂,你都不知道该看哪个;但要是关键词组合得太死,又可能啥都搜不到。
这可得好好琢磨琢磨,就跟做菜放调料一样,得恰到好处。
再说说检索结果的评估。
你搜到了一堆信息,可别啥都信呐!就像你去市场买东西,还得挑挑拣拣呢!看看信息来源可靠不,内容准确不。
可别被那些不靠谱的信息给忽悠了。
我给你讲个例子吧,有一次我想找个修电脑的方法,结果搜到一个网页,上面说得头头是道,我就照着做,结果电脑差点报废!后来才发现那网页就是个不靠谱的家伙弄的。
所以啊,咱得有双火眼金睛,能分辨好坏。
信息检索就像是一场冒险,你带着关键词这个武器,拿着检索工具这张地图,制定好检索策略这个计划,去茫茫的信息海洋中寻找你想要的宝藏。
有时候可能一下子就找到了,有时候可能得费点周折,但别灰心,多试试总会有收获的。
你想想,要是没有信息检索的能力,那在这个信息爆炸的时代,不就像没头苍蝇一样乱撞吗?咱可不能这样,咱得学会利用好这些工具和方法,让自己在信息的海洋中畅游。
所以啊,朋友们,一定要重视信息检索基础知识啊,这可是咱在信息时代生存的必备技能啊!别小看它,学会了它,你会发现好多问题都能轻松解决,就像找到了万能钥匙一样!赶紧去试试吧!。
信息检索基础知识考点整理
信息检索基础知识考点整理●2.1 信息检索的概念与原理●2.1.1 信息检索的概念(重要)●2.1.2 信息检索的原理●信息检索原理就是将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配,选取两者相符或部分相符的信息予以输出●信息检索的类型●1.文献检索●2.数据检索●3.事实检索●2.1.3 信息检索的意义/作用(重要)●1.信息检索是有效利用信息资源,实现其最大价值的科学方法●2.信息检索是再学习的工具,是获取知识的有效途径●3.信息检索能有效地提高科研工作的效率,节省人力、物力及时间●2.1.4 信息检索的历程●1.手工检索●2.计算机检索●2.2 信息检索系统(重要)●2.2.1 信息检索系统的概念●1.信息检索系统的含义●2.信息检索系统的工作原理●2.2.2 信息检索系统的构成●1.信息选择子系统●2.信息索引子系统●3.词表管理子系统●4.用户接口子系统●5.匹配子系统●2.2.3 信息检索系统的分类●1.手工检索系统●1.书本式的手工检索系统●2.卡片式的手工检索系统●2.计算机检索系统●1.硬件●2.软件●3.数据库●1.参考数据库●1.书目数据库●2.指南数据库●2.源数据库●1.数值数据库●2.文本—数值数据库●3.全文数据库●4.术语数据库●5.图像数据库●6.多媒体数据库●2.3 信息检索方法(重要)●1.直接浏览法●直接查找法●2.常用法●顺查●倒查●抽查●3.追溯法●4.综合法(分段查找法、循环法、交替法)●2.4 信息检索效果(重要)●2.4.1 信息检索效果评价●信息检索效果的概念●1.检索结果有效性评价●2.检索系统实用性的评价●3.检索费用—效率评价●信息检索效果评价对于信息检索系统的建设和发展的意义●信息检索效果评价的核心问题是建立一套切实可行的评价指标●1.查全率和查准率●2.误检率和漏检率●3.响应时间●其他与检索效果相关的指标●2.4.2影响信息检索效果的因素●1.标引的质量●2.检索途径的数量●3.检索策略的优劣●4.检索人员的素质。
信息检索基础知识(一)
信息检索基础知识(一)一、信息检索的定义信息检索是指将信息按一定的方式组织起来,并根据信息用户的需要找出有关信息的过程。
由于有信息的组织存储做保障,这样的信息检索可以做到迅速、准确而又没有重大遗漏。
为了正确地选择检索工具,我们需要认识检索对象的特点。
按检索对象划分,信息检索可以分为文献检索、数据检索和事实检索。
其中文献检索是以文献为检索对象的线索。
例如,为撰写论文查找参考文献,为承担某项研究和工作查找可做参考的资料。
数据检索是以数据为检索对象的检索(主要指数值方面的一些信息)。
例如查找某人的电话号码,某年的人均国民生产总值,某种金属的熔点等。
事实检索是以事实为检索对象的检索。
例如要了解某个事件的过程,某人的生平,某个高校的专业设置等。
二、常用检索途径用于文献检索的途径很多,基于内部特征检索途径有分类检索和主题检索;基于外表特征检索途径有作者、团体作者、题名、代码、信息类型和语种等。
1.主题检索2.分类途径3.作者途径4.号码途径5.题名途径6.引文途径7.其他途径三、检索语言检索语言是用于描述信息系统中信息特征和表达用户信息提问的一种专门语言,是信息存储与检索共同遵循的规则。
只有检索提问标志和信息特征标志一致时,相关的文献才能被检索出来。
检索语言包括分类语言和主题语言,主题语言又可分为关键词语言、单元词语言、标题词语言和叙词语言。
(一)分类法语言1.中图分类法2.国际十进制分类法四、检索技术检索技术是指利用光盘数据库、联机数据库、网络数据库、搜索引擎等进行信息检索时采用的相关技术,主要包括布尔检索、截词检索、字段检索、词位置检索、加权检索等。
(一)布尔逻辑检索(二)截词检索(三)字段检索(四)词位置检索(五)加权检索五、信息检索的方法对于一般的信息用户,在信息检索中需要特别注意的问题有两个,这就是信息源的选择与检索词到的选择。
(一)选择信息源(二)检索词的确定。
文献信息检索
1.1 文献信息基本知识
• 声像型文献:也称为视听型文献,又称为声像资料、视听资料 和音像制品。它是以磁性材料或者感光材料为存储载体,借助 特定的机械设备直接记录声音信息和图像信息所形成的文献, 如录音带、录像带等。其特点是形象直观、逼真,但是使用时 需要借助一定的设备。
• 机读型文献:是通过一定的技术将文字、图像以及声音等转换 成二进制数字代码,记录在磁性介质或光记录介质载体上,采 用计算机进行阅读、浏览的文献载体。机读文献包括文摘、题 录及全文等各种类型数据库。其特点是一次加工,多次使用, 存储容量大,节省存放空间,易于实现资源共享,是一种很有 发展前途的文献类型。但是检索机读型文献时,必须借助电子 计算机。
• 产品资料:制造厂商为了宣传推销其产品而编制的以介绍产品 性能为主的资料。如产品目录、产品样本(集)、产品说明书、 产品总览和产品数据手册等。其内容大致为已定型产品的性能 与用途、结构原理、使用方法、操作规程和产品规格等。
1.1 文献信息基本知识
• 2.按文献信息的表现形式划分 8)科技档案是科学技术研究和生产建设部门在研究、生产和建
多样性:《韦氏大词典》(美国)注释信息为:信息是通信的 事实,是在观察中得到的数据、新闻和认识。(说明信息的表 现形式可以是数据、消息和新闻等,具有多样性。)
1.1 文献信息基本知识
文献信息资源的构成 可以从不同的角度或层面予以描述和划分,譬如从记录文献
的物质载体、文献信息的表现形态(文献类型)以及文献信息 被加工的详略程度等。 按文献信息的物质载体划分 • 刻写型文献:是指印刷术尚未发明之前的古代文献和当今尚未 付(交付的意思)印的手写记录,以及正式付印前的草稿。如 古代的甲骨文、金文、棉帛文、竹木文以及现如今的会议录、 手稿等。
信息检索基础知识
第一章信息检索基础知识一.概述1.信息与文献信息知识的分类:已掌握的知识和需查询的知识。
信息的定义:信息是事物运动的状态与方式,是物质的一种属性,并且借助于一定的物质载体传输和储存。
这里有几个词组需说明:事物:泛指一切可能研究的对象(包括物质的和精神的)。
运动:泛指一切意义上的变化(机械运动、化学运动、思维运动和社会运动)运动方式:在时间上所呈现的过程和规律:运动状态:在空间上所展示的形状和态势。
信息已成为与物质、能量同样重要的三大资源之一。
信息是一种原料,人类接受外界大量信息后,经过实践活动和大脑的思维机制加工提炼后变成有用的知识(知识的认识程度)。
文献:将知识记录并保持在一定的载体上,就形成了文献。
文献信息是文献所表达的内载信息,以文字、符号、声像信息为编码的人类精神信息,也是经过人们筛选、归纳和整理后记录下来的信息。
科技文献是科学技术研究成果的记录,积累了许多有用的事实、数据、理论、方法和科学假设,反映了科学技术研究的进展和水平,是科学信息的主要来源。
2.信息的特点(1)普遍性;信息是无处不在,无时不在的,c从宏观的宇宙天体到微观粒子,从自然界到人类社会,万事万物都是信息的母体;(2)时效性:信息的获得和传送需要时间,信息反映的总是特定时刻事物的运动状态和方式,当人们获得信息后,它反映的是某段时间的事物,是一种历史纪录,如果传递很慢,信息就会失去应有的价值;(3)传递性:指信息的空间和时间效应,信息可以从一个地方传到另一个地方,从一个时期传到另一个时期;信息的传递决定了信息的可扩散性,信息是通过各种渠道、媒介传播和扩散;(4)共享性:信息在传播和使用的过程中,载体本身的信息并不因此而减少,信息资源的共享将极大地推进人类文明的发展;(5)可转换性:信息的物质载体形态是可以相互转移变换的;信息在一定条件下可以转化为物质、能量、时间、金钱、效益、质量等;(6)可伪性:在人们得到信息后,必须进行分析判断和筛选,以便正确享用信息。
大一信息检索与利用考试知识点
大一信息检索与利用考试知识点信息检索与利用是信息科学与技术专业的一门重要课程,旨在培养学生对信息资源进行系统化检索和有效利用的能力。
本文将介绍大一信息检索与利用考试的相关知识点,帮助同学们更好地复习和备考。
一、信息检索基础知识1. 信息检索的定义和基本原理信息检索是指从大量信息中查找和获取所需信息的过程。
其基本原理包括信息需求分析、信息储存与组织、信息检索模型、检索评价等。
2. 关键词的选择和搜索策略在信息检索过程中,关键词的选择和搜索策略起着至关重要的作用。
学生需了解如何选择合适的关键词,并掌握常用的搜索策略,如布尔逻辑检索、通配符检索和短语检索等。
二、信息资源与检索1. 图书馆资源的检索与利用学生需熟悉图书馆资源的分类和编目规则,掌握常用图书馆资源的检索方法,如OPAC检索和图书馆数据库检索等。
2. 学术搜索引擎的使用学生需要了解学术搜索引擎的特点和使用方法,如Google学术、谷歌学术和百度学术等。
掌握高效的检索技巧,如使用引号搜索、高级搜索和文献引用等。
三、文献检索与阅读1. 文献检索的方法和工具学生需了解文献检索的常用方法和工具,如在线数据库检索、文献溯源和文献导航等。
可以根据具体需求选择合适的检索途径。
2. 文献综述的撰写和细节要求学生需要了解文献综述的撰写规范和细节要求,包括引言、方法、结果和讨论等部分的写作技巧和注意事项。
四、信息利用与知识管理1. 信息评估和筛选学生需要学会评估信息质量,判断信息的可信度和适用性,并掌握信息筛选和整理的方法,提高信息利用的效果。
2. 知识管理的基本理论和方法学生需了解知识管理的基本理论和方法,掌握知识管理工具的使用。
熟悉知识流程的各个环节,并学会运用相应的工具进行知识管理。
五、信息检索与利用的伦理问题1. 信息隐私和数据保护学生需了解信息检索与利用过程中产生的隐私问题和数据保护的重要性。
遵守信息伦理规范,保护用户隐私和信息安全。
2. 信息获取和版权保护学生需要了解信息获取的合法途径和版权保护的相关法律法规,学习在信息检索与利用过程中正确引用他人作品的方法和原则。
《信息检索基础知识》课件
03
信息检索系统
信息检索系统的构成
信息检索系统由信息源、信息组织与 检索方式、信息检索工具、用户界面
和信息利用等部分构成。
信息源是信息检索系统的物质基础, 包括各种类型的文献、网页、社交媒
体等。
信息组织与检索方式是信息检索系统 的核心,通过关键词、分类、主题等 方式对信息进行组织和检索。
信息检索工具是信息检索系统的手段 ,包括搜索引擎、数据库、图书馆等 。
05
信息检索的未来发展
信息检索技术的发展趋势
语义理解技术
随着自然语言处理技术的不断进步,信息检 索将更加注重对用户查询的语义理解,以提 高检索的准确性和相关性。
个性化检索
个性化检索技术将更加成熟,能够根据用户 的兴趣、偏好和行为习惯,为用户提供更加 精准和个性化的检索结果。
多模态检索
多模态检索技术将实现文本、图像、音频和 视频等多种媒体信息的融合检索,满足用户 对多媒体信息检索的需求。
自然语言处理
自然语言处理是信息检索中不可或缺的技术之一,它利用计算机对自然语言文本进行分析和处理,以 实现自然语言文本的自动识别和机器理解。
自然语言处理技术包括分词、词性标注、句法分析、语义分析等,这些技术能够将自然语言文本转换为 计算机可识别的格式,以便进行后续的信息检索和文本挖掘。
自然语言处理技术的应用范围广泛,例如在搜索引擎中实现自动纠错、自动完成、智能推荐等功能,以 及在智能客服中实现自动问答、智能回复等功能。
源。
网络信息检索阶段
随着计算机技术的发展,人们开始利用计算 机进行信息检索,出现了各种基于计算机技 术的检索工具和数据库。
智能信息检索阶段
随着人工智能技术的发展,智能信息检索逐 渐成为新的发展趋势,它能够更加智能地理 解用户需求,提供更加精准的信息服务。
信息检索和利用第讲信息基础知识
• 特点:有法律约束力,适用范围明确,是从事 生产、设计、管理、产品检验、商品流通、科 学研究的共同依据。
• 识别标准文献的主要依据有:标准级别、标准 名称、标准号、审批机构、颁布时间、实施时 间。
• 馆藏地:民用航空文献阅览室、期刊库 • 电子资源:万方(中外标准数据库)、IEL等
文献类型标识符 【J】:Journal,期刊 没有文献类型标识代码的看刊名信息、卷期信息
• 零次文献 (pre-primary document) :未经 出版发行的文献,如作者的手稿,谈话记录、 实验记录、书信……零次文献由于没有进入 出版、发行和流通这些渠道,一般不能作为 我们利用的文献类型。
13
1.2.2 按加工层次划分
一次文献是基础,是检索利用的对象 二次文献是检索一次文献的工具 三次文献是一次文献内容的高度浓缩
19
国际标准书号
(ISBN—International Standard Book Number)
国际标准号:ISBN 978-7–305–04836–4
图书类代码 地区号
书序码
978表示此物为图书,其后
出版社代码
校验码
第一区是国家、地区或语种,表明这本书是哪个国家出版的。
第二区是出版商代码,用于识别出版社,由各国出版主管机构分配。
6)学位论文 Doctor Dissertation
• 定义:学生为获得学位而撰写的学术性研究论 文。
• 特点:不公开发表,一般在本单位收藏和流通 • 馆藏地:明故宫图书馆民用航空阅览室 • 电子资源:PQDD/PQDT、国家科技文献中心、
南航博硕士论文全文数据库、中国期刊网、万 方
第二章信息检索基础知识
属后组式语言。
主题词
概念:通过文献所属学科的主题对文献进行检索, 是以主题词为检索标识,它是一种特性检索。 主题词是用来表达文献的主题概念的,经过规范化 主题词 处理的名词或词组。 如:出生缺陷-畸形 杵状指-骨关节病,继发肥大性
主题词表- 主题词表-单元词表
《WPI--规范化主题词表》
(WPI--LIST OF STANDARD THESAURUS TERMS)
是检索英国德温特公司专利文献的工具。按规范 词字顺排列。其著录格式见图
WPI-List of Standard Thesaurus Terms 1987 COBALT(3772)(1) COBALT@(3) CODON【87】(4) ELECTRIC(33892)(1) Electrical(2)
关键词 自然语言 单元词 标题词 叙词 语 言 言 语
分类语言
分类语言是运用概念划分的方 法,按文献内容所属学科、专 业性质的逻辑次序,以数字、 字母或数字与字母结合为基本 字符,以分类号为标识,用来 存储和检索文献的文献标识系 统。
分类语言的特点
主要特点就是按学科专业性质集中图书 区分不同性质的图书 集中性质相同的图书 相近的放在相近的位置 按照远近亲疏的关系把图书组成为一个 有条理的体系 提供从学科分类查找图书的途径
机械制造工艺系统学 / 张恩生,申铁固编著-上海交通 大学出版社 TH16/ Z31 机械设计学习指南 / 陶民华等编机械工业出版社 TH122-44/ T43 机械优化设计基础 / 张九明编著煤炭工业出版社 TH122/ Z32A 分类号+著者号TP393-62/J25
主题语言
主题语言是指以自然语言的字符为字符, 以名词性术语为基本词汇,用名词性术 语作为标识的一种信息标识系统。是主 题概念检索文献信息的检索语言。
信息检索与利用(1)
信息资源的类型
2、按信息加工层次分类(续2)
以上三级信息资源的关系: 零次信息是一次信息的素材; 一次信息是二次、三次信息的来源和基础; 二次、三次信息是对一次信息进行组织、加工、综合后形成的
标准的主要特点
(1)标准的制订、审批程序有专门规定,并有固定 的代 号,格式整齐划一; (2)一个标准一般只能解决一个问题; (3)时效性强; (4)不同种类、不同级别的标准在不同范围内执行; (5)有一定的法律效力和约束力; (6)有自身的检索系统。
中国标准概况
* 1957年中国成立了国家标准局,并于1958年颁布了第一批国家标准; * 1978年成立国家标准总局,1979年颁布“中华人民共和国标准管理条例” * 1978年中国标准化协会(CAS)加入了国际标准化组织(ISO) * 中国标准的等级:国家标准、行业标准、地方标准、企业标准 * 中国标准的分类:按《中国标准文献分类法》
会议信息
会议信息是指国内外各种学术会议上宣读或交流 的论文、报告、会议记录等信息资料
价值 会议信息是公布新研究成果的重要场所,大 约30%的科技成果首次公布在科技会议上 对本领域重大事件的首次报道率最高,一些 新的理论、方案和重要发现、发明等往往首 先在会议上发布并交流 及时全面了解有关领域发展情况的重要渠道
所谓“信息检索”主要是对二、三次信息的检索。
信息资源的类型 以信息的逻辑意义和利害关系划分
有益信息:对社会发展有积极作用的、能够消除人们对未知事物不 确定性的信息,它是人类社会的资源和财富。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
文摘的特点与作用
确定相关性,即帮助读者判断所检索到的文献是 否合乎需要,从而决定原始文献的取舍。 一定程度上代替原文。科技人员阅读了著录较为 详细的文摘之后,大体上就掌握了原文内容要 点,不必再阅读原文了。这一点,对于那些难索 取到原文的“难得文献”尤为重要。 大大节省了科技人员查找和阅读文献的时间。 帮助克服语言障碍。在一种检索工具中,无论原 始文献是什么语种,其文摘都被译为统一的一种 语言(一般为英语)。
3、截词符
将检索词截断,用检索词的词干部分进行检索。
一般按截词位置,可分为后方截词、前方截词、中 间截词(后截断、前截断、中间截断;右截断、左 截断、嵌入式截断)
按截断字符数:可分为有限截词(在词尾加有限个 截词符号,n个截词符号表示其后可添的字符数少 于等于n个)、无限截词(在词尾加一个截词符 号,表示其后可添加任意多个字符)。
每条记录揭示一种文献(书、刊) 例:馆藏目录里的一条记录。著录格式为:
题录
题录的含义
是描述文献外部特征的文献条目。 题录的著录对象一般是单篇文献。 通常每条记录揭示一篇文章。
相同点:著录格式
目录和题录
不同点:著录对象
目录
完整出版物
题录
单篇文献
文摘
文摘的定义
我国国家标准GB 3468-1983《检索期刊编 辑总则》定义:除题录部分外还对文献内 容作实质性描述的文献条目称之为文摘。 不仅描述文献的外表特征,而且还揭示文 献的内容特征。比题录多出摘要。 文摘是文献原文浓缩后的产物,是忠实于 原文内容的简要记录单元,能揭示文献的 内容特征。
分类语言也称分类法,它是用分类 号表达主题概念,依据知识分类将各主 题概念按学科性质进行分类和系统排列 成类目体系的标引语言。
•体系分类法
中国图书馆分类法 简称中图法
第四版
2010年8月 国家图书馆出版社
第五版
中图法简表
A 马克思主义、列宁主义、 N
毛泽东思想、邓小平理论
B 哲学、宗教
O
C 社会科学总论
……
C933 C934 C935
领导学 决策学 管理计划和控制
C936 管理组织学
C939 应用管理学
如何在书库内准确找出一本书? 书架的顺序
A
B …… X
Z
综合图书
环境、安全科学
………… 哲学宗教 马列毛邓
书架上图书的排序
I712 L315
I712 L471
中图分类号
种次号,依据作者/时间取号
6、获取原始文献
明确文献类型和出版物的全称后可以: 利用馆藏目录或联合目录查找所需文献的 收藏单位,进行借阅或复制; 通过网络数据库检索,直接得到原文; 通过网络获取; 利用图书馆的原文传递服务获得原文; 订购原文。
3.3 检索语言 检索语言
检索语言的定义和类型 分类语言 关键词语言
检索语言的定义和类型
关键词语言
关键词是选自文献题目、文摘乃至正文中具 有实质意义的语词,是不受词表控制的非规 范化语言。 确定课题关键词的步骤
分析课题,提取概念 整理概念,扩充同义词汇 运用分析所得词汇试查,确定课题适用的关键词
3.4 检索技术/检索算符
布尔逻辑算符 字段限定 截词符 位置算符
1、布尔逻辑算符
规定检索词之间的逻辑关系的算符,称为 布尔逻辑算符。布尔逻辑算符包括:
数据库中文摘例:
文摘必备的 著录项目
著者 摘要 篇名
出处
名词辨析:文摘和摘要
3.1 信息检索的原理、系统和效果评价
检索效果 指利用检索系统(或工具)开展检索服务 时所产生的有效结果。 克兰弗登 (Cranfield) 在分析用户基 本要求的基础上,提出了6项检索系统性 能的评价指标,分别是: 收录范围、查准率、查全率、响应时间、 用户负担、输出形式
3、分析检索概念
了解课题的背景知识
课题背景知识:
研究对象及其所属学科; 研究方法、材料工艺、应用领域、主要研究者等。
获取方式如:
询问专业人员; 阅读入门的相关文献(手册、百科全书、教科书、论文 等); 浏览网上相关信息。
3、分析检索概念
分析课题概念
主要概念
指课题研究的主要对象,包括:课题归属的专业学科名 称,涉及的具体原理、研究方法、材料工艺、应用领域等。 例如“甜味剂的过敏反应”,主要概念是“甜味剂”和 “过敏反应”
检索系统/检索工具
搜索引擎
二次文献
数据库(目录/题录、文ຫໍສະໝຸດ 、索引、全文)参考工具(字典、词典、百科全书等) 综述、述评等 三次文献
目录
目录的含义
是图书、期刊等出版物外表特征的揭示和报道。 是指导阅读和科学管理文献的重要手段。 文献的外表:特征(外部特征)包括题名、著者、 出处、卷期、页码、时间、文献类型、语种等 目录以完整的出版物(如一本书、一种期刊)作 为著录的基本单位,所以也可说是按某种顺序编 排的文献清单。如: 每个图书馆的馆藏目录,揭示该馆的馆藏情况 联合目录揭示多家图书馆的收藏情况
I712.4 B232
I75 C144
确定课题分类号的方法
单概念课题:课题涉及的主题概念只有一个。
了解分类表的体系结构,重点掌握大类的分布; 由大而小,逐步查找最接近于课题要求的类号。
多概念课题:涉及两个或以上概念的课题。
并列概念课题:涉及同一研究对象的几个方面或者涉及几个 并列研究对象的课题,凡是有主次者,应取其重点或主要 研究对象归类。例如,“新闻宣传研究”,如果侧重于 “新闻”,在《中图法》中取“G212新闻采访和报道”。 应用性课题:研究一种理论、方法等在某方面应用或对某方 面影响的课题,应在所应用或受影响的类目中查找。例 如,“计算机在人口预测方面的应用”的中图法类号应归 入“人口预测”所在的类号“C923”。 上位类分类方法:欲查课题在分类表中无符合要求的专指类 目时,可以归入它的紧邻上位类。
逻辑与(AND) 逻辑或(OR) 逻辑非(NOT)
逻辑与(AND)运算符
也可用“*”代替,组配用来表示不同检 索主题概念之间的相交。 含义:检出的记录必须同时含有所有的检 索词。 在实际检索中,不同概念组面之间以及同 一组面内的不同含义的词之间通常使用 AND算符。
以“communication AND satellite” 检索式为例:
逻辑“与”示意图 示意图中的阴影部分反映了“communication”和 “satellite”两词间使用AND算符后的运算结果。
逻辑或(OR)运算符
也可用“+”代替,表示主题概念之间的 同义、近义、相关或多个并列的检索概念 含义:检出记录中至少含有两个检索词中 的一个。 自动隐含逻辑“或”关系的情况:
广东工业大学信息检索教研室 Email: tsgwjs@
目录
第1章 绪论 第2章 信息与信息资源 第3章 信息检索基础 第4章 国内学术信息资源 第5章 国外学术信息资源 第6章 专利与标准信息资源 第7章 免费学术信息资源获取 第8章 在线参考工具 第9章 文献管理软件 第10章 信息评价、分析与利用
可用“-”代替。排除含有某些词的记录。 使用NOT以避免与词间的分隔符“-”混淆。 例如:检索“ PATENT not GERMAN” , 检索结果示意如下:
逻辑“非”示意图
2、检索字段限定
如何限定字段 限定检索字段的作用
检索字段:文献信息的特征
又称:检索项、检索入口、检索点、检索途径
如何限定字段
一般规律:查全率与查准率互逆。
3.2 检索步骤
分析课题 选择检索工具 分析检索概念 编制和调整检索式 阅读和记录文献线索 获取原始文献
1、分析课题
检索前对课题内容进行分析,明确检索目的。 分析课题需求: 查全型:开题、编写教材、基础研究或应用理论 研究的课题。 查准型:用户需要查询在科研、生产进行当中遇 到的非常专指或是细微的问题。 动态型:研究开发和应用新技术、新理论的课题。 查新型:指某项技术或新产品在研制开发完成 后,要对同类研究项目、或相关研究项目等有关 的专利及非专利文献资料对比分析所进行的检索。
第3章 信息检索基础
本章内容
3.1 检索原理、检索系统和检索效果 3.2 检索步骤 3.3 检索语言 3.4 检索技术
3.1 检索原理、检索系统和检索效果
检索原理
一 次
信 息
信 息
检
信息 特征
特 征
索
标识
信 息 检
检 索
索
结
检 索
检 索
语
检索 提问
工 具
果
课 题
提
言
标识
问
3.1 检索原理、检索系统和检索效果
检索语言的定义
存储信息与检索信息所使用的共同语言。
用来描述文献、组织文献记录,进行文献检 索的标识系统、行业语言。
文献信息
存储
检索
检索系统(数据库)
提问
(语言)
(语言)
检索语言的类型(按规范化程度划分)
人工语言
人为对标引词和检索词 加以控制和规范,使每个 检索词只能表达一个概念
自然语言
直接从原始信息中抽取出自 由词作为检索词的检索语言
2、选择检索系统
考虑与文献需求紧密结合、学科专业对口、 覆盖信息面广、报道及时、揭示信息内容准确、 有一定深度的检索系统。 全面性,是否与课题相关的内容都要检索; 针对性,检索系统与检索课题的学科一致; 专业性,选择与学科专业相关的检索系统,特 别注意跨学科领域内容; 权威性,尽量选用该学科的权威性检索系统; 了解检索系统收录的范围,包括时间跨度、地 理范围、文献语种、类型等。
P
D 政治、法律
Q
E 军事
R
F 经济
S
G 文化、科学、教育、体育 T