项目一:中国期刊全文数据库信息检索
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)题录(Title)
在目录的基础上发展起来的,描述文献各种特征的一条记录,通常 由文献的分类号、文献篇名、著者及其单位、文献来源、主题词等 项组成。
(3)索引(Index)
将某种信息集合(如目录、题录、文摘)中的一组相关信息,按照某 种顺序组织并指引给用户的一种指南。 包括:分类索引、主题索引、著者索引、专用索引、引文索引
项目实施-初级检索
初级检索:查 找袁隆平近5年学 术论文,并下载 阅读。
如图所示,“检索 项”选择“作者”, “检索词”为“袁隆 平”,检索年限为 “2006”到“2011” ,单击“检索”按钮 。
项目实施-初级检索
单击某论文的篇名,打开如图所示页面,该部分的信息属于二次文 献。这里可以选择下载caj格式或pdf格式的论文进行阅读。
相关知识-信息检索的评价
检索系统参量表 系统中相关信息总量(a+c) 检出的信息总量(a+b) 未检出的信息总量(c+d) 检出的相关信息量(a) 未检出的相关信息量(c)
系统中非相关信息总量(b+d)
检出的非相关信息量(b) 未检出的非相关信息量(d)
(1)查全率(Recall ratio),用R表示。指检出的相关文献量与检索系统中所有相关文献量的 比率,是衡量信息检索系统相关文献能力的尺度。 查全率=检出的相关信息量/系统中相关信息总量×100%=a/(a+c) ×100%
相关知识-信息检索的类型
1.按照检索对象的内容 数据信息检索:将经过选择、整理、鉴定的数值数 据存入数据库中,根据需要查出可回答某问题的数 据的检索。如统计数据、人口数据、国民生产总值 事实信息检索:将存储于数据库中的关于某一事件 发生的时间、地点、经过等情况查找出来的检索。 文献信息检索:将存储于数据库中的关于某一主题 文献的线索查找出来的检索。
(2)组配分类语言。用科技术语进行组配的方式来描述 文献内容。 (3)混合分类语言。是上面两者的结合。
相关知识-分类语言
《中国图书 馆图书分类 法》(中图 法)
基本部类
1.马列主义、毛 泽东思想 2.哲学 3.社会科学
基本大类
A. 马克思主义、列宁主义、毛泽东思想、邓小平理 论 B.哲学、宗教 C.社会科学总论 D.政治、法律 E.军事 F.经济 G. 文化、科学、教育、体育 H.语言、文字 I.文 学 J.艺术 K.历史、地理 N.自然科学总论 O.数理科学和化学 P.天文学、地 球科学 Q.生物科学 R.医药、卫生 S.农业科 学 T.工业技术 U.交通运输 V.航天、航空 X. 环境科学、安全科学 Z.综合性图书
项目实施-初级检索
单击“下载阅读CAJ格式全文”,打开如图所示对话框,单击【 保存】按钮保存文件至本地文件夹中。
项目实施-初级检索
双击文件名即可打 开文件进行阅读, 这种文件我们称之 为一次文献,如图 所示。注意,阅读 caj 、 kdh 格 式 的 文档资料需要事先 安装阅读器,如 CajViewer。
相关知识-检索语言的基本类型
相关知识-分类语言
分类语言是按学科范畴划分而构成的一种语言 体系,它集中反映学科的系统性、反映它们的 相关、从属、派生等关系,从总体到局部分层 、分面展开,形成分类体系。
(1)等级体系分类语言
《国际专利分类表》(IPC)、《杜威十进分类法》(DDC)、《美国国 会图书馆图书分类法》(LC)、《中国图书馆图书分类法》(中图法) 和《中国科学院图书馆图书分类法》(科图法)
4.自然科学
5.综合性图书
相关知识-分类语言
如,大学生常用分类号。
计算机类(TP3) 计算机语言TP312 网络TP393 等级考试TP3-44 英语类(H31) 词汇H313 语法H314 写作H315 阅读H319.4 口语听力H319.9 四六级考试H31-44 文学类(I) I22诗歌 I23戏曲 I24小说 I25报告文学 I26散文 历史地理类(K) 中国历史K2 人物传记K81或K82 地理K9
其中,文学类类目展开情况如下。 I文学 I2中国文学 I24小说 I247建国后作品 I247.4章回小说 I247.5新体长篇、中篇小说 I247.7新体短篇小说 I247.8故事、微型小说
相关知识-分类语言
如图所示,通过学校图书馆书目检索系统检索“分类号”为 “I247.8”的检索结果。
相关知识-分类语言
杜威十进分类法(Dewey Decimal Classification,DC或D来自百度文库C)
简本篇幅约为详本的10%,主要供中、小型图书馆使 用。1894年首次出版,已出13版。共分10个大类: 000总论;100哲学;200宗教 ;300社会科学;400 语言学;500自然科学;600技术科学;700美术; 800文学;900历史、地理。其详细的目录体系分类明 细表可见附录部分。
项目实施-分类检索
分类检索:查找2008年至今医药领域关于“癌症”的核心期刊论文。
将左侧的学科查询范围限定在“医药卫生”领域,然后单击“高级检索”按钮,同 时用“癌症”作为“主题”、“篇名”、“关键词”的检索词,限定这三个检索项 的“关系”为“并且”,年限为“2008”到“2011”,“范围”为“核心期刊”, 如图所示。单击“检索”按钮。下载和阅读论文的方法同上。
相关知识-信息检索的评价
提高检索效果的措施:
(1)提高检索系统的质量。 (2)提高检索人员素质,使得用户具备良好的使用检 索系统的能力,充分发挥检索系统的功能。 (3)根据不同的检索课题的需要,适当调整对查全率 和查准率的要求,比如要求查全率很高的查新工作,就 要放弃对查准率的苛刻要求。
相关知识-信息检索系统
信息检索系统(Information Retrieval System,简称IRS)是指根据特定的信息 需求而建立起来的一种有关信息收集、加工 、存储和检索的程序化系统,其主要目的是 为人们提供信息服务。 它是在一次文献的基础上,经过加工、这个 理、编辑形成的二次文献。信息检索系统的 基本功能是存储和检索信息。
相关知识-信息检索的类型
2.按照存储载体及检索手段方式
手工检索:以手工操作的方式,利用传统的印刷型检索 系统,来查找信息的检索。 机械检索:运用打孔机、分类机及光电效应等进行的检 索。 自动化检索:也称为计算机检索,是运用计算机和计算 机网络等现代化手段进行的检索,也是目前主要的检索 方式。
项目实施-专业检索
专业检索:查找1990年至今袁隆平为第一作者发表的篇名中包含“杂交 稻”的核心期刊论文。
单击“专业检索”按钮,如图所示,根据要求设置年限,“范围”为“核心期刊 ”,然后在文本框内输入检索式“题名=„杂交稻‟ and (第一责任人=袁隆平)”, 这里的符号均需要在英文输入法状态下输入,注意及时切换输入法。单击“检索 ”按钮。 检索结果如图所示。下载和阅读论文的方法同上。
《信息检索技术及应用》
项目一:中国期刊全文数据库信息检索
目录
项目描述 项目目标 项目实施 相关知识 思考题 上机实践 总结与反思
项目描述
《中国期刊全文数据库(CJFD)》是目前 世界上最大的连续动态更新的中国期刊全文 数据库,积累全文文献800万篇,题录 1500余万条,分九大专辑,126个专题文 献数据库。在学校网上图书馆进入中国期刊 全文数据库,检索相关文献,下载并阅读。
相关知识-信息检索系统
1.按正文的内容性质划分,可分为完全二次 信息检索系统和部分二次信息检索系统。 主要有目录、题录、索引、文摘等,如各种 印刷型检索系统和检索型文摘数据库。
相关知识-信息检索系统
(1)目录(Bibliography,Catalogue)
以完整的出版单元(如一种图书、一种期刊)为单位,按照一定次序 编排的对文献信息进行描述和报道的工具,也称书目。
相关知识-检索语言的概念
检索语言是用于描述检索系统中信息的内部 及外部特征和表达用户信息提问的一种专门 语言,检索的匹配正是通过语言的比较匹配 来实现的。检索语言也称索引语言、标引语 言、文献工作语言等。
相关知识-检索语言的作用
(1)对文献的信息内容及其外表特征加以 规范化的标引; (2)对内容相同及相关的文献信息加以集 中或揭示其相关性; (3)可使文献信息的存储集中化、系统化 、组织化,便于检索者按一定的排列次序进 行有序化检索; (4)便于将标引用语和检索用语进行相符 性比较。
相关知识-信息检索的评价
【案例1】在一个具有1000篇文献的试验性机检系统中检索某课 题,用一特定检索策略查该课题时输出文献60篇。经分析评估, 发现该系统中共有该课题相关文献50篇,检出的文献中实际相关 文献只有30篇,求查全率、查准率、误检率和漏检率。
依题意知:检出的相关文献a=30,检出的非相关文献b=30,未检出的相 关文献c=20, 故查全率: R=a/(a+c)×100%=30/(30+20)=60%; 查准率: P= a/(a+b)×100%=30/(30+30)=50%; 漏检率: O=100%-R=40%; 误检率: F=100%-P=50%。
(2)查准率(Precision ratio),用P表示。指检出的相关文献量与检出文献总量的比率,是衡 量信息检索系统精确度的尺度。
查准率=检出的相关信息量/检出的信息总量×100%=a/(a+b) ×100% (3)漏检率(Omission ratio),用O表示。指漏检的相关信息量与检索系统中所有相关信息 量的比率,是衡量信息检索系统漏检信息的尺度。
漏检率=未检出的相关信息量/系统中相关信息总量×100%=c/(a+c) ×100%=1-R (4)误检率(Fall-out ratio),用F表示。指检出的非相关信息量与检出的信息总量的比率,是衡量 信息检索系统误检信息程度的尺度。 误检率=检出的非相关信息量/检出的信息总量×100%=b/(a+b) ×100%=1-P
项目实施-高级检索
高级检索:查找2010年发表的篇名中包含“杂交稻”或“水稻” ,并且主题和关键词也包含“杂交稻”的核心期刊论文。
单击“高级检索”按钮,如图所示,将“杂交稻”和“水稻”设定为“篇名”的检 索词,这两个词的“关系”为“或者”,同时“主题”和“关键词”的检索词设定 为“杂交稻”,“篇名”、“主题”和“关键词”三个检索项的“关系”为“并且 ”,年限设定为“2010”到“2010”,“范围”为“核心期刊”。单击“检索”按 钮。下载和阅读论文的方法同上。
相关知识
1.1信息检索的概念、类型及评价 1.2信息检索语言 1.3信息检索方法、途径与步骤 1.4 CNKI概述
相关知识-信息检索的概念
信息检索,英文Information Retrieval,简 写IR。 信息检索(Information Retrieval)是指将信息 按照一定的方式组织和存储起来,并根据信息 用户的需求找出有关的信息的过程和技术。它 的全称应该叫“信息存储与检索”( Information Storage and Retrieval)。 狭义的信息检索则仅指该过程的后半部分,即 从信息集合中找出所需要的信息的过程。
项目目标
掌握信息检索系统的概念、类型及评价; 掌握初级检索、高级检索、专业检索及分类 检索; 掌握信息检索语言; 掌握信息检索方法、途径与步骤。
项目实施
在学校有效IP范围内或从VPN终端登录,从主页导航“ 图书资源”->“中文数据库”->“中国知网系列数据库 1” ->“中国期刊全文数据库”进入检索页面,如图所 示。
(4)文摘(Abstract)
通过描述文献各种特征,并介绍文献主要内容来报道文献的工具。
相关知识-信息检索系统
2.按物质形态划分 印刷型 电子型 其它类型的检索系统。
相关知识-信息检索系统
一个完整的检索系统的基本结构一般由五个 部分组成。 1. 编辑使用说明 2. 目次表 3. 正文部分 4. 索引 5. 附表