文献数据检索
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
文献数据检索
网络和搜索引擎的诞生曾被认为是一场声势浩大的媒介革命,因为它开辟了现代网络技术与传统检索结合的先例,而人肉搜索无疑又是这个时代最不可预测的典型产物。
虽然只有短短十年时间,却引发了来自社会各阶层的广泛关注和议论。
文献检索(Information Retrieval),是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索(Information Storage and Retrieval),这是广义的信息检索。
狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻(Information Search)。
文献检索(Information Retrieval),是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索(Information Storage and Retrieval),这是广义的信息检索。
狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻(Information Search)。
计算机信息检索是指以计算机技术为手段,通过光盘和联机等现代检索方式进行信息检索的方法。
与手工检索一样,计算机信息检索应作为未来科技人员的一项基本功,这一能力的训练和培养对科技人员适应未来社会和跨世纪科研都极其重要,一个善于从电子信息系统中获取信息的科研人员,必定比不具备这一能力的人有更多的成功机会,美国报道生活新方式的期刊POV 也将交互网络检索专家作为未来十大热门职业之一,这些情况都说明了计算机信息检索越来越重要,故值得大家对这一技术予以重视。
文献也是有等级分类的,主要有零次文献,指未经正式发表或未形成正规载体的一种文献形式。
如:书信,手稿,会议记录,笔记等,特点:客观性,零散性,不成熟性。
一般是通过口头交谈、参观展览、参加报告会等途径获取,不仅在内容上有一定的价值,而且能弥补一般公开文献从信息的客观形成到公开传播之间费时甚多的弊病;一次文献(primary document):是指作者以本人的研究成果为基本素材而创作或撰写的文献,不管创作时是否参考或引用了他人的著作,也不管该文献以何种物质形式出现,均属一次文献。
大部分期刊上发表的文章和在科技会议上发表的论文均属一次文献;二次文献(secondary document):是指文献工作者对一次文献进行加工、提炼和压缩之后所得到的产物,是为了便于管理和利用一次文献而编辑、出版和累积起来的工具性文献。
检索工具书和网上检索引擎是典型的二次文献;三次文献tertiary document):是指对有关的一次文献和二次文献进行广泛深入的分析研究综合概括而成的产物。
如大百科全书、辞典、电子百科等;零次文献也有研究者在以上分类基础上再加上零次文献,它是指未经过任何加工的原始文献,如实验记录、手稿、原始录音、原始录像、谈话记录等。
零次文献在原始文献的保存、原始数据的核对、原始构思的核定(权利人)等方面有着重要的作用。
文献信息检索或情报检索,是指将文献信息按一定的方式组织和储存起来,并能根据用户的需要取出所需特定信息的整个过程。
它的全名为信息存储与检索。
通常所说的信息查询或检索只是名称的后一半,或是"狭义"的信息检索。
文献检索分为数据检索:以文献中的数据为对象的一种检索。
如某公式、某化学分子式等。
事实检索:以文献中的事实为对象,检索某一事物发生的时间、地点或过程文献检索:以文献为对象,查找某个课题的有关文献的一种检索。
文献检索有许多途径,第一著者途径,许多检索系统备有著者索引、机构(机构著者或著者所在机构)索引,专利文献检索系统有专利权人索引,利用这些索引从著者、编者、译者、专利权人的姓名或机关团体名称字顺进行检索的途径统称为著者途径。
第二题名途径,一些检索系统中提供按题名字顺检索的途径,如书名目录和刊名目录。
第三分类途径,按学科分类体系来检索文献。
这一途径是以知识体系为中心分类排检的,因此,比较能体现学科系统性,反映学科与事物的隶属、派生与平行的关系,便于我们从学科所属范围来查找文献资料,并且可以起到"触类旁通"的作用。
从分类途经检索文献资料,主要是利用分类目录和分类索引。
第四主题途径,通过反映文献资料内容的主题词来检索文献。
由于主题法能集中反映一个主题的各方面文献资料,因而便于读者对某一问题、某一事物和对象作全面系统的专题性研究。
我们通过主题目录或索引,即可查到同一主题的各方面文献资料。
第五引文途径,文献所附参考文献或引用文献,是文献的外表特征之一。
利用这种引文而编制的索引系统,称为引文索引系统,它提供从被引论文去检索引用论文的一种途径,称为引文途径。
第六序号途径,有些文献有特定的序号,如专利号、报告号、合同号、标准号、国际标准书号和刊号等。
文献序号对于识别一定的文献,具有明确、简短、唯一性特点。
依此编成的各种序号索引可以提供按序号自身顺序检索文献信息的途径。
第七代码途径,利用事物的某种代码编成的索引,如分子式索引、环系索引等,可以从特定代码顺序进行检索。
第八专门项目途径,从文献信息所包含的或有关的名词术语、地名、人名、机构名、商品名、生物属名、年代等的特定顺序进行检索,可以解决某些特别的问题。
文献检索也有许多的检索方法,有直接法,又称常用法,是指直接利用检索系统(工具)检索文献信息的方法。
它又分为顺查法、倒查法和抽查法。
顺查法,顺查法是指按照时间的顺序,由远及近地利用检索系统进行文献信息检索的方法。
这种方法能收集到某一课题的系统文献,它适用于较大课题的文献检索。
例如,已知某课题的起始年代,现在需要了解其发展的全过程,就可以用顺查法从最初的年代开始,逐渐向近期查找。
倒查法,倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进行文献检索的方法。
此法的重点是放在近期文献上。
使用这种方法可以最快地获得最新资料。
抽查法,抽查法是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。
追溯法,是指不利用一般的检索系统,而是利用文献后面所列的参考文献,逐一追查原文(被引用文献),然后再从这些原文后所列的参
考文献目录逐一扩大文献信息范围,一环扣一环地追查下去的方法。
它可以像滚雪球一样,依据文献间的引用关系,获得更好的检索结果。
循环法,又称分段法或综合法。
它是分期分交替使用直接法和追溯法,以期取长补短,相互配合,获得更好的检索结果。
文献检索是一项实践性很强的活动,它要求我们善于思考,并通过经常性的实践,逐步掌握文献检索的规律,从而迅速、准确地获得所需文献。
一般来说,文献检索可分为以下步骤:
(1)明确查找目的与要求;
(2)选择检索工具;
(3)确定检索途径和方法;
(4)根据文献线索,查阅原始文献。
按照检索结果内容划分为以下三种:
(1)数据检索:以文献中的数据为对象的一种检索。
如查找某种材料的电阻,某种金属的熔点;
(2)事实检索:以文献中的事实为对象,检索某一事件发生的时间,地点,或过程;
(3)文献检索:以文献原文为检索对象的一种检索。
2.按照文献检索的手段划分为以下两种:
(1)手工检索;
(2)计算机检索。
文献数据检索数据库,数据库,它的结构由部分组成,按照国际标准组织标准ISO/DIS5127规定,数据库是指至少由一种文档(file)组成,能满足特定目的或特定功能数据处理系统需要的数据集合。
从使用者观点观察, 数据库主要由“文档——记录——字段”三个层次构成。
中国期刊网专题全文数据库中,中国期刊网的检索方法包括13个检索字段,它们是篇名字段、作者字段、关键词字段、主题词字段、机构字段、中文刊名字段、中文摘要字段、引文字段、基金字段、全文字段、年份字段、期数字段和ISSN 字段。
在13个检索字段中,篇名、文摘、关键词、主题词和全文字段属于基本字段,可用于从主题角度查找相关文献。
中国期刊网专题全文数据库有三种检索方法,它们是:1)分类导航。
利用系统提供的专辑栏目及其展开的分类导航树查找相关文献,适用于对一个学科的文献做全面调查的场合。
2)初级检索。
是利用检索项对某个指定字段进行的检索。
3)高级检索。
是指设置多个检索条件和逻辑组合关系,查找同时满足这些条件和逻辑关系的文献。
中国期刊网专题全文数据库的二次检索是在前次检索结果的范围内再次进行查找,以达到缩小检索范围,使检索结果逐步接近课题要求的目的。
其作用相当于在前后两次检索之间做逻辑与(AND)运算。
不管是初级还是高级检索界面,只要检索结果的篇数允许,二次检索可以反复做,直到满足课题要求为止。
中国期刊网专题全文数据库的初级检索和高级检索的区别在二个方面:1)检索的字段数量不同。
初级检索的字段数量只有一个,因此,它每次只能检索对一个检索字段的检索词进行检索。
高级检索的字段有两个,它可以同时对两个不同的检索字段的检索词进行检索。
2)检索的布尔逻辑算符不同。
初级检索的字段数量只有一个,即利用二次检索对前一次检索结果的"与"检索。
在高级检索中除了可以利用的字段有两个,利用二次检索对前一次检索结果的"与"检索之外,它可以同时对两个不同的检索字段的检索词进行"或"和检索。
文献检索原理从信息利用的角度考察,互联网信息资源由连接在网上的计算机中的无数信息、网上的各种信息工具以及网络通信渠道三方面构成。
网络信息资源的特点是数量庞大、增长迅速;更新频繁、变化无常、分布散乱;良莠混杂。
按照内容是否具有原创性,网络信息资源有一次资源和二次资源的区分。
一次资源是指首次发表的原创性信息,二次资源是转载已有的信息。
按照是否属于搜索引擎检索范围,网络信息资源可分为可见资源和不可见资源两类。
网络可见信息的两个条件。
可见资源是搜索引擎可搜索到的资源。
网络学术信息不能唾手可得原因主要有三:一是查找主页信息通常要通过查找搜索引擎之类的中介数据库才能进行。
而使用这些工具需要一些专门的技术,希望高效率地查找网络信息时尤其如此。
二是一般情况下只使用一两种搜索引擎所得的结果往往是沧海一粟。
三是互联网上学术类与非学术类信息的比例是1﹕10。
再则,网上学术信息很多是以不可见资源形式存在着。
因此查找网上信息的难度更大一些。
9.按工作方式区分的搜索引擎有哪三类搜索引擎?按照工作方式的不同,搜索引擎可以分为主题引擎、目录引擎和多元引擎。
主题引擎由三个主要部分构成:Robot、Index和搜索软件。
国外主题引擎的代表是Google,国内代表为百度。
主题搜索引擎提供的分类途径或者为自动分类的结果,或是借用其他目录引擎的分类数据(例如Google利用网景公司的Open Directory分类),因而分类检索效果不如由人工仔细分类的目录指南型搜索引擎。
按照交流渠道的不同,人文社科文献信息收集的方法可以分为正式渠道和非正式渠道两种。
通过非正式渠道(即从以非记录形式存在的信息源中)收集信息。
就是通过同行个人间的信函或谈话交流、参加各类学术会议、参观展览会、实地考察访问某单位、开展调查研究等方式有针对性地获取与课题相关的口头信息、实物信息和调研数据。
通过正式渠道收集信息的方法利用文献信息检索的方法,通过正式渠道收集文献信息的一般方法是:首先通过三次文献,即百科全书、年鉴、有关的数据手册、设计手册、学术机构指南、名人录等来收集相关的信息。
其次根据拟定的查询线索和主题,通过手工检索工具或者计算机检索系统查找相关的文献信息。
如果使用的是全文文献信息数据库,收集的步骤可以到此结束,如果使用的是书目信息类型的检索工具,则需要再次直接查找各种类型的原始文献,诸如专业核心期刊、学位论文、会议文献和报纸等文献收集信息。
计算机信息检索的优点在于速度快,耗时少,查阅范围广,甚至可以查到国外刚刚出版的期刊论文的信息。
计算机信息检索的优点还在于检索内容的专指性强,可以从文献型数据库中以文献的发表年份、文献中提及的人名等查找相关文献。
计算机信息检索的缺点是追溯时间受到一定限制,检索费用比较昂贵,检索的时间也有一定的限制。
计算机信息检索主要适用于已经数字化的近期文献信息
和动态性信息的查找。
手工检索的优缺点差不多正好与计算机信息检索的相反。
手工检索的优点是时间检索和检索范围都不受限制。
但是手工检索耗时多,效率低,检索入口少,因此查找效果往往不如计算机信息检索的好。
文献检索信息的意义重大,文献信息检索是获取知识的捷径。
掌握文献信息检索方法与技能,可以帮助人们快、准、全地获取所需知识,最大限度地节省查找时间,使文献信息得以充分的利用。
文献信息检索是科学研究的向导。
要进行有价值的科学研究,必须依赖文献检索,全面获取相关文献信息,及时了解各学科领域出现的新问题、新观点、以确定自己的研究起点和研究目标。
文献信息检索是终身教育的基础。
科技的迅速发展使知识的总量呈指数增长,而知识的陈旧速度也明显加快,这就要求人们具有终身教育的能力,这种能力在很大程度上就是获取新知识的能力,就是对新知识的敏感力和接受力,因而必须掌握文献信息检索的方法。
终身学习的需要,是知识创新的需要.。
参考文献:
《科技信息检索与网络应用》田红梅气象出版社
《信息检索》张厚生东南大学出版社
《网络应用与信息检索》郭爱章清华大学出版社
文献数据检索
学院:管理学院
专业:信息管理与信息系统班级: 1108
姓名:段沛欣
学号:1130130442。