信息检索(2)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息素质
• 信息素质(Information Literacy 简称IL),又
称信息素养,简单地讲,信息素养是指个人“能认 识到何时需要信息,和有效地搜索、评估和使用 所需信息的能力”。 • 它包含了三个层面:
信息意识、信息能力、信息道德。
信息素质的内涵:
信息意识——对各种信息自觉的心理反映
信息能力——信息技术的应用能力搜索引擎 、Google搜索引擎 分类目录( Directory )
雅虎中国、搜狐、新浪、网址之家、 网易分类目录等 • 三大系列中文网站 • 四次文献 • 五大多媒体技术 • 十大文献信息资源
• 一个原则 • 两类搜索引擎 • 三大系列中文网站: • 三大中文门户网站—新浪、搜狐、网易 • 三大中文期刊数据库—清华库、维普库、万方库 • 三大中文数字图书馆—超星、方正、书生之家 • 四次文献 五大多媒体技术 十大文献信息资源
Company
LOGO
课程性质
《文献信息检索》课就其实质来说,是一门方 法课, 即通过讲授信息检索基础理论、信息检索 方法和各种中外文数据库的使用,提高同学们获 取信息的能力,主要是培养学生的情报信息意识 和提高检索技能。
Company
LOGO
一、信息素质
信息素养的概念
• To be information literate, a person must be able to recognize when information is
二、信息源
• 信息的来源叫做信息源。 • 信息源可按不同的方法分类描述,比较常见的分
类方法有如下三种:
• 1、按信息的载体形式划分(电子文献等); • 2、按信息加工的级别划分(四次文献); • 3、按信息的发布形式划分(十大文献信息源等)
(1)、按信息的载体形式划分信息源
• 1)印刷型(Printed form)
常用的印刷版的工具书都有索引,以便检索。
其他类型的手工检索工具——工具书
年鉴——查找事实或统计数据 百科全书——查找不熟悉的知识 手册——成熟稳定的知识,查找参数,公式等 辞书——词典或辞典,查找科技词汇的解释,或汉外 对照辞典 ,缩略语辞典。还有大量的专门性辞典。 年表——查找一些历史大事记录
《中图法》介绍
• 《中图法》——《中国图书馆分类法》,以学科来组织知 识,将全部知识领域划分为5个基本部类,22大类。
• 马克思主义、列宁主义、毛泽东思想、邓小平理论 • 哲学 • 社会科学 • 自然科学 • 综合性图书 • 在5个基本部类的基础上,按照从总到分,从一般到具体的
编排原则进一步展开,组成了22个基本大类:A、B、C、 D、E、F、… Z(L、M、W、Y) • 这就是俗称的《中图法》五部二十二大类。
②学术评价应遵循客观、公正、准确的原则, 如实反映成果水 平。
③学术论著的写作应树立法制观念,保护知识产权,要充分尊 重前人劳动成果 。
信息道德
学术法律规范: 《中华人民共和国著作权法》 合作创作的作品,其版权由合作者共同享有。 未参加创作,不可在他人作品上署名。 不允许剽窃、抄袭他人作品。 禁止在法定期限内一稿多投。 合理使用他人作品的有关内容。
前提:必须有检索工具 其次:途径和方法——桥梁、纽带 最后:检索者
• 信息检索发端于19世纪前期,主要以手工检索方 式为主,其发展速度较为缓慢,检索效率普遍不高。 到20世纪50年代,1951年世界上出现了最早的计算 机系统,这可称得上是信息检索发展史上的一个里 程碑。随着计算机技术的不断进步,进入20世纪90 年代,网络技术开始进入社会生活各个领域,计算 机检索也逐步由脱机检索、联机检索发展到如今 Internet环境下网络检索。
•
8% 48% 35% 9%
• 五、有利于专题文献查准和查全
•
检索工具——原始文献(线索)
• 六、克服专业语言和自然语言的障碍
Company
LOGO
五、检索语言
检索语言
• 是根据检索的需要而创造的人工语言, 用于描述检索系统中信息的内部特征和外 部特征并能表达用户信息提问的一种专门 语言。
标引文献与揭示文献内容的两种基本方法:
如何判断自己已具备了信息素质?
• 1、能够独立决定所需信息种类和程度。 • 2、能够高效地获取所需信息。 • 3、能够根据现有的知识背景和评价标准对信息 及其
来源进行评价及遴选。 • 4、能够有效地利用信息达到某一特定的目的。 • 5、能够在信息利用过程中遵守相关的法律法规。
Company
LOGO
needed and have the ability to locate,
evaluate, and use effectively the needed
information.
• 具有信息素养的人能够知道什么时候需要信息,能够 有效地获取、评价和利用所需要的信息。
•
——美国图书馆协会ALA, 1989
• 一个原则 • 两类搜索引擎 • 三大系列中文网站 • 四次文献: 零次文献
二次文献
• 五大多媒体技术 • 十大文献信息资源
一次文献 三次文献
• 一个原则 • 两类搜索引擎 • 三大系列中文网站 • 四次文献 • 五大多媒体技术:素材下载技术 素材转换技术
多媒体制作技术 素材发布技术 网页制作和网站发布技术 • 十大文献信息资源
信息检索活动的功用
一、利用信息检索工具,全面细致地搜索
前人的工作经验与成果,及时掌握事物的 最新动态及发展趋势;
二、提高工作效率,提高人们的自学能力、
科研能力、鉴赏能力;
三、避免重复劳动,规避风险,维护正当
权益;
信息检索活动的功用
• 四、节省检索文献的时间
• 文献检—科学实验—编写科研报告
一次文献 primary document 二次文献 secondary document 三次文献 Tertiary document 零次文献 最原始的资料
献加工深度划分
零次文献:普通网页,电子邮件等 文
一次文献:正式在期刊上发表的论文等 献
二次文献:数据库中的题录、目录等 三次文献:文献综述、进展报告等
Company
LOGO
六、检索工具
目录型检索工具
目录是图书、期刊等出版物外表特征的揭示和报道。它 以完整的出版物(如一本书、一种期刊)作为著录的基本单 位,所以也可以说它是按某种顺序编排的文献清单。是指导 阅读和科学管理文献的重要手段。
目录的著录对象一般是整本书或整种刊物
《全国总书目》揭示每年国内图书出版情况 每个图书馆的OPAC(联机公共目录)揭示该馆的馆藏 联合目录揭示许多家图书馆出版物收藏情况。
分类法
世界上有代表性的分类法:
1、《杜威十进制分类法》(Dewey Decimal Classification and Relative Index 简称DDC) 2、《国际十进制法》(Universal Decimal Classification,简称UDC)(被广泛应用于科学论文的分 类) 3、《美国国会图书馆图书分类法》(Library of Congress Classification,简称《国会法》或LC)(目 前广泛应用于北美大中型图书馆,特别是大学等学术性 图书馆 ) 4 、《中国图书馆分类法》
受控词在检索实践中具体体现为词表。词表在网络检 索工具中的应用主要体现在辅助选词以及检索式的扩展。
汉语主题词表
《汉语主题词表》是我国第一部大型综合性主 题词表。1979年出版,自然科学部分1991年 修订.收录正式主题词91158条,非正式主题词 17410条。
全表共分3卷10分册,由主表、词族索引、 范畴索引、英汉对照索引等组成。
•
信息查询、获取的能力
•
信息组织加工、分析能力
•
信息的有效利用、评估、
•
传播能力
信息道德——整个信息活动中的道德
•
规范
信息道德
学术道德规范—— (学术规范的核心部分,具体包括: )
①学术研究应坚持严肃认真、严谨细致、一丝不苟的科学态度。 不得虚报教学和科研成果,反对投机取巧、粗制滥造、盲目 追求数量不顾质量的浮躁作风和行为。
优点: 一、可以直接获取全文。 二、多数全文数据库提供全文字段检索, 这个有助于文献的查全。
手工检索工具
索引:
将文献中具有检索意义的事项(可以是人名、 地名、词语、概念、或其他事项)按照一定方式有 序编排起来以供检索的检索工具。
相对于目录,题录、文摘等类型的检索工具, 索引深入到文献的细节,涉及到具体的知识点。
主题法
1、自然语言(非规范语言):信息检索系统中使用的 标引词直接来自文献和用户提问而不加控制的一类检索语 言,主要有关键词语言。
自然语言的应用以计算机为前提,否则,自然语言检 索将难以实现。
2、受控语言(规范语言或人工语言):标引词来自文 献或者用户,并受到信息检索系统的控制的一类检索语言 的总称,又叫规范化语言。
• 十大文献信息资源
• 科技图书
• 科技期刊
• 特种文献( 科技报告 政府出版物
•
会议文献 标准文献
•
专利文献 科技档案
•
学位论文 产品样本 )
Company
LOGO
四、信息检索
什么是信息检索?
信息检索(Information Retrieval)
指对文献信息资料的查找与获得。 检: 即查找, 索: 即获得与索取。 也就是说,检索者利用检索工具按照文献编排 的特点,采取一定的途径、方法和步骤,将所需 文献资料查找出来,并加以利用。
文摘是文献原文浓缩后的产物,是忠实于原文内容的简要记 录单元。揭示文献的内容特征,在文摘的编写中不能加入编 写人员的主观见解和任何解释性说明,也不能对原文作任何 修改。
全文型检索工具
全文也包括内容简短的事实和数据。全 文性检索系统集文摘检索和全文提供于一体, 是近年来发展较快和前景较好的一类数据库。
1、分类法:按照文献资料的学科属性(分类法最有利于查全) 分类法的特征在于知识的系统性,不仅揭示图书的学科知识 内容,而且把有关同一学科内容的文献资料集中在一起,使学科 临近的文献排在相近的位置,根据各类图书之间的亲疏关系将藏 书组织成一个系统.
2、主题法:按照所论述的事物 将文献所论述的事物按照规范化的语言(主题词)的字顺进 行排检,从本质上讲,是用词语来揭示文献所阐释或研究的对象、 事物和问题。与分类法相比,从不同角度来揭示文献。
题录型检索工具
题录的含义
题录是描述文献外部特征的文献条目。文献的外部特征包 括题名、著者、出处、卷期、页码、时间、文献类型、语 种等著录项目。
题录的著录对象一般是单篇文献。
文摘型检索工具
文摘的定义
我国国家标准GB 3468-1983; 《检索期刊编辑总则》说明定 义:“除题录部分外还对文献内容作实质性描述的文献条目 称之为文摘”。
以纸张为载体 2)缩微型(Microform) 以感光材料为载体 3) 声像型(Audio-Visual form) 以声像记录材料为载体 4) 电子型(Machine Readable form) 以计算机信息存储设备为载体
(2)、按信息加工级别划分信息源
• 信息出版量的急剧增长,信息类型的多样化和 信息分布的离散状态,获取相关信息犹如大海 捞针。利用信息的可塑性,将信息处理为不同 等级。通常文献学上将其称为“三次文献”:
10)科技档案(scientific and technical archives)
Company
LOGO
三、网络检索的 六大方面
• 一个原则:选择合适的关键词,制定正确的检索 策略。
• 两类搜索引擎 • 三大系列中文网站 • 四次文献 • 五大多媒体技术 • 十大文献信息资源
• 一个原则 • 两类搜索引擎:全文搜索引擎(FullText Search Engine)
如何具备信息素质
• 你不可能一夜之间就具备信息素质。象培养阅
读、写作能力一样,你需要不断地从信息检索过程 中获得经验,在寻找,选择,评价你遇到的信息和 思想中,你的信息素质逐渐提高了。
第一层次:知道什么信息在什么地方(熟悉了解信息源) 第二层次:从检索系统中检索出信息(检索技术) 第三层次:信息选取与综合利用(信息增值)
(3)、十大信息源—按出版形式划分
1)图书(book)
2)期刊(journal)
3)科技报告(report)
特 4)会议文献(proceeding)
5)专利文献(patent)
种 6)学位论文 (dissertation)
文 7)政府出版物 (government publication)
献
8)标准文献(standards) 9)产品资料(product literature)