研究生信息检索概论

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
究问题的要求来评价信息及其来源,提取出权威
性的、经典的和具有创新理念的观点及其它发 现,同时能在构建新的假设中查找补充所需信 息,对新旧信息进行整合和综述。
4)能有效地利用信息达到某一特定的目的
有效地利用信息意味着为达到某一特定的 目的,在信息查找、获取、评价、补充的知 识积累基础上,将文献中的主要观点、思想 及相应事实数据等应用于自己有利于目的实 现的表现形式,如学位论文、调查报告等, 以此来与他人进行有效的交流。
7.2 情报检索语言 是一种人工语言,根据规则编制而成,规则预先 明确规定。由词汇和语法组成。
分类检索语言:中国图书馆学分类法,科图法 主题检索语言:MeSH,EMTree 代码检索语言
情报检索语言的特点(对比自然语言)
对文献内容加以标引,主题概念表达规范。 对相同及相关内容加以集中或揭示其相关性。 对大量情报加以系统化或组织化。 便于将标识用语和检索用语进行相符性比较。
信息需要的特征
信息需要的层次(重要):未知的信息需要、潜在的信息需要 和现实的信息需要。
通过对信息需要层次的理解,能够判断自己或他人的信息需 要的层次。
4.3 信息行为:信息的检索、选择和利用。
4.4 信息动机:是信息行为发生的根本动力。
在信息交流中,信息需要和信息动机促使信 息行为的发生,并完成信息的交流。
普遍性:信息是事物运动的状态和状态变化的方式。只要有 事物的地方,就必然的存在信息。信息在自然界和人类社会 活动中广泛、普遍存在。 传递性:信息在事物之间的相互联系必定在信息流动中发生。 信息的传递性表现在人与人之间的信息交换,人与机器、机 器与机器之间的信息交换,动物与植物间的信号交换。
信息的传递和流通过程是一个重复使用的流通过程,信 息的占有者不会因传递信息而失掉信息,也不会因多次使用 改变信息的自身价值。这一点与信息的共享性相关。
息的捕捉、分析、判断和吸收的敏感性。
信息能力:是人们有效快速的获取加工存储利用和 传递信息的能力。
信息道德:是指在整个信息活动中,信息创建者、 信息服务提供者和信息使用者所必须要遵守的社会 法律法规和行为准则。
5.2 美国大学与研究图书馆协会(ACRL)制定的高等教 育信息素养五大标准
1)能够独立决定所需要的信息种类和程度 独立意味着在获取信息资源的过程中个人可以
树状结构表(范畴表)
将全部主题词按内容分为15个类目,各类主题词按各主题词内涵范围 的大小逐级排列,形成树状结构。 上下位概念:上位词的范围大,下位词的范围小,扩展检索是指某主 题词所有下位主题词标引的全部文献都检出。
副主题词(关联词):使用时有明确规定,必须 遵循其定义与使用范围。
副主题词也有上下位关系,使用时应选择恰当, 以提高检全与检准率。
5)能够在信息利用过程中遵守相关的法律法 规
具备信息素养能力的人应了解与信息利用有关 的道德、法律和社会经济问题,并能遵守法律、规 章制度和有关获取与使用信息资源的行为规范。
知识产权与版权、信息法 、电子资源恶意下载 与非法使用 、正确引用 、信息的无偿服务与有偿 服务。
6 信息检索
6.1 信息检索概念 是从任何信息集合中识别和获取所需信息的 过程及其所采取的一系列方法和策略。
概念间的关系:知识来源于信息,情报是特 定的知识。
情报 知识 信息
信息、知识、情报、文献四者的关系
认识
激活
信息
知识
情报
检索 记录
文献
3. 信息源 个人为满足其信息需要而获得信息的来源
3.1 信息类型
保存性:正式与非正式 时间:先导(天气预报)、实时(现场直播)、滞后(报纸) 表现形式:文字、图像、数值、语音 出版类型:图书、期刊论文、科技报告、专利文献、会议文献 政府出版物、学位论文、标准文献、产品样本、科技档案
检索系统对包含的信息进行描述,形成记录,通 过这些描述提供检索途径,并使记录有序化。
检索途径的两个因素:检索标识和可检序列
检索标识:自然语言与情报语言
自然语言:情报检索中指文献作者或文摘提要的 作者原来使用的语言。 不足之处:由于是日常口头、书写所用的各种语 言。所以 (1)不能简洁与专指地表达概念(2) 语词与概念不能一一对应(3)不能反映概念之间 的关系(4)无法进行系统排列(5)标引用语与 自然语言的相符性差。
广义的信息检索包含信息存储与检索
6.2 信息检索类型
存储及内容:文献信息检索、数据信息检索、事实信息检索。 组织方式:全文检索、超文本检索和超媒体检索。
7 信息检索系统
7.1 信息检索系统
信息检索系统是信息检索的本质。信息检索系统 根据文献特征信息(题名、著者、出版者、出版 年、文献来源信息、文献原始编号、主题内容) 按照一定的逻辑组织文献。
1. 信息概论
人类在经历了农业社会、工业社会后,已经步入信息化 社会。物质、能源与信息已经成为社会发展的三大资源,人 类开始从主要依赖物质和能源的社会步入物质、能源和信息 三位一体的社会。
信息的概念 信息的特性 信息的作用
1.1 信息的概念
信息information
定义1:信息是物质运动规律总和,即不是物质,也不是能量。
分类法、主题法、题名法、关键词法、作者法、 机构法、组配法……
综合性、专业性、单一性 熟悉所在学科领域的 主要信息源
3)能够根据现有的知识背景和评价标准对信 息及其来源进行评价及遴选
在分析信息的基础上熟练地、批判性地评价信 息,有效吸收、存储和快速提取信息,能从所收
集的信息中概括出信息的中心思想,并能依据研
定义2:信息论的创始人申农(Shannon )认为:“信息是能 用来消除不确定性的东西”或“信息是确定性的增加” 。
定义3:信息是客观事物状态和运动特征的一种普遍形式。
信息的定义和分类都不确定,不同的定义从不同的角度帮助 理解信息。
1.2 信息的特性
信息区别于物质与能量,并具有与物质及能量同等的重 要作用,是因为其特性。物质与能量在使用过程中会被消 耗,但又遵守守恒定律;而信息在传递和使用过程是,可反 复使用,并可通过信息的加工处理而产生信息增值。
7.2.1 医学主题词表
常用 美国医学主题词表MeSH 荷兰医学文摘的主题情EMTree 中国中医药学主题词表 情报检索语言的特点(对比自然语言)
组成
字顺轮排表(索引)
是将主题词表中主题词和入口词按一定顺序(字顺等)排列而成。 入口词:款目词,包括主题词的同义词、近义词、缩略语、不同拼写 方式,倒装或顺装以及已经取消而意义相近的主题词。
产生次序和加工程度(重要):零次、一次、二次、三次信息 理解各层次信息的含义,根据各层次信息的特点能够判
断不同出版类型的信息、文献分别属于什么层次的信息和文 献。
4. 信息交流和信息素养
4.1 信息交流 噪音 去除噪音
信源--信道--处理与控制--信宿
反馈
4.2 信息需要 指人们在从事各项实践活动的过程中,为解决所遇到的问 题而产生的对信息的需求。是信息行为发生的基础。
医学 文献检索与利用
范晓磊 fxlnjmu.edu
教学进度:课程安排 教学大纲:课程性质和特点、要求与目标、教
学法等
信息检索基础
学习目标
1.掌握信息、情报、文献、知识的基本概念 2.了解文献的类型、特点 3.知道数据库的类型与结构 4.掌握信息检索的途径、步骤
5.理解检索式的编写与检索策略的调整 6.熟悉信息网络技术与网络信息检索
混合数据库:即包含书目记录又包含有全文记录的 文献数据库。
其他类型参见教材P31
几种主要的文献数据库P32-36 题录数据库 文摘数据库 图书馆馆藏目录数据库 全文数据库 光盘数据库 多媒体数据库 网络数据库(重要)
其他:检索速度、检索方便来自百度文库与检索成本也是需要 考虑的因素。
8 文献数据库与计算机检索技术
手工检索基本上用于对纸质文献的检索。而随着技 术的发展,文献被组织成各类型的数据库,计算机 检索技术也随之成为主流。
文献数据库:是指记录各种文献信息的数据库,计 算机可读、有组织的相关文献信息的集合。在文献 数据库中,文献信息以数字化方式,按一定的数据 结构,有组织地存储在计算机中,使计算机能够识 别和处理。
决定所需要的信息种类和程度,表现为主动学习、 自主吸纳知识的过程。
书、刊、学位论文、会议论文、专利、标准 背景信息—概念、事实、数据 摘要信息—题目、标题、文摘、参考文献 全文信息—观点、方法、结论、理论(电子、印刷的)
2)能够高效地获取所需信息
高效意味着能选用最适当的查找方法或检 索系统来建构完善的检索策略,获取所需信 息。
5 信息素养
5.1 信息素养(information literacy)概念
是指判断何时、何地需要信息,并有效的定位、 获取、评价和利用信息的一系列能力的总和。
包括:计算机素养、因特网素养、媒体素养、 图书馆素养、研究素养、批判性思考的能力。
信息素养主要体现在: 信息意识:是人们对信息需求的自觉反映,即对信
8.1 文献数据库类型
根据收录性质可分为:文献型、全文型、事实型。 文献数据库按内容分:
书目数据库(Bibliographic Databases) :存储文 摘、题录、目录等书目数据的一类数据库,又称为 二次文献数据库。
全文数据库(Full Text Databases) :以一次文献 形式直接提供文献全文。
传递性:没有被激活的知识只能发挥知识的价值, 而不能体现情报的价值。
效用性:情报最大的特点是可以发挥比其作为知识 更为巨大的作用。
文献:记录有知识的一切载体。 文献本身并不是知识,其包含的内容才是知 识。
文献要素:知识内容、信息符号、载体材料。 信息符号、载体材料和记录方式都影响知识 内容的获取和利用。
同时,信息的传递,在广义上来讲,包含反馈。(例)
依存性:信息总是依附于一定的物质载体而存在,需要某种 物质承担者。信息必须依附于一定的物质形式上(如声波、 电磁波、纸张、化学材料、磁性材料等),不可能脱离物质 而单独存在。 相对性:客观上信息是无限的,但对于信息用户来说,人们 实际获得的信息问题有限的。同一信息对不同认知水平的用 户所产生的作用和有效性也不同。 可加工性:信息可以加工处理,可以压缩、扩充和叠加,也 可以变换形态。在流通和使用过程中,经过综合、分析、再 加工,大量的原始医药信息可以变成医学文摘数据库和
7.2.2 检索结果评价
检索效率,是概括表示情报检索系统质量的概 念,可以说明对情报检索系统各项性能的满意程 度。包含检准率(查准率)与检全率(查全 率),它们之间的关系是互逆相关的。
检全率=检准文献/(检准的献+漏检文献) 漏检率=漏检文献/(检准的献+漏检文献) 检准率=检准文献/(检准的献+误检文献) 误检率=误检文献/(检准的献+误检文献)
1.3 信息的作用
信息在人类社会和科技发展中具有重要作用。
信息是人类认识客观世界及其发展规律的基 础。信息的基本功能,主要表现为信息的认 识功能。 信息是科学研究的必要备件。 信息是管理和决策的主要参考依据。 信息是社会发展的资源。
2. 知识、情报和文献
知识:来源于信息,存储于人类的大脑中。《现代 汉语词典》:知识是人们在改造世界实践中所获得 的认识与经验的总结。 知识包括:技术知识、科学知识、经验知识,关于 知识的知识,及对面临的问题做出判断并提出解决 方案的知识。 OECD的四类知识:what, why, how, who
时效性:由于信息的动态性,那么一个固定的信息 的使用价值必然会随着时间的流逝而衰减。在现代 社会中,信息的使用周期迅速缩短,信息的价值实 现也很大程度上取决于及时把握和运用信息(天气 预报、经济信息、股票大盘等)。不能及时地使用 最新信息,信息的价值就会随其滞后使用的时差而 差值或贬值。
可共享性:信息与物质,能量显著不同的是。信息 在传递过程中并不是“此消彼长”,同一信息可以在 同一时间被多个主体共有,而且还能够无限的复制、 传递,它可以共享。
显性知识(科学理论、数据公式、自然规律等)与 隐性知识(外科医生的经验、领导的决策能力、“我 爸是李刚”)
情报:是指传递着的在特定效用的知识。
《辞源》:“定敌情如何,而报于上官者”为情报。 《辞海》:“战时关于敌情之报告,曰情报。
知识性:根据知识的定义和特性,知识去除了糟粕 的信息,并且具有可实践性。
相关文档
最新文档