文献检索 资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§第1章数字资源的检索原理与检索检索策略
1.数字文献及其检索的基本概况
文献定义:记录有知识的一切载体
数字文献检索:是指通过检索系统,采用一定的技术手段,根据一定的原则,在数
据库或其他形式的数字文献中自动找出用户所需相关信息的过程。
广义的检索包括:信息的存储和检索两个过程
狭义的检索仅包括:用户的信息检索过程。
文献构成:由知识、载体和记录方式3个要素构成
2.数字文献的检索技术
(1)布尔逻辑检索技术
通过标准的布尔逻辑关系符来表达检索词与检索词间逻辑关系的检索方法。
主要的布尔逻辑关系符有三种:逻辑与、逻辑或、逻辑非。
在数据库检索式中,可以对检索字段进行逻辑组配,也可以对检索词进行逻辑组配。
但在不同的数据库和搜索引擎中,所使用的逻辑符号可能有所不同,中文数据库一般使用“*”、“+”、“-”,外文数据库和搜索引擎一般使用“and”、“or ”、“not”,中文搜索引擎一般使用“”(空格)、“+”、“-”。
(2)截词检索技术
是指在检索式中用专门的符号(截词符号)表示检索词的某一部分允许有一定的词形变化。
在检索中,常会遇到一些词干相同、词义相近的检索词或有英、美不同拼写法的词,为了减少检索词输入量,节省机时,同时又扩大检索范围,保证查全率,可使用截词检索。
截词符一般用“?”或“*”表示,一般应用在外文数据库和外文搜索引擎中的检索中。
不同系统,不同数据库,其代表的含义可能有所不同。
按截词位置可分前截词(左截词、后方一致)、后截词(右截词、前方一致)、前后截词和中间截词。
(3)邻近检索技术(位置检索技术)
邻近检索又称位置检索,指通过检索式中的专门符号来规定检索词在结果中的相对位置。
广泛使用的主要有相邻位置算符(W)、(nW)、(N),(nN)等。
①(W)与(nW)算符
(W)算符:表示此算符两侧的检索词必须按此前后顺序相邻排列,词序不可变,且两词之间不许有其他的词或字母,但允许有一空格或标点符号。
如biological (W) control相当于检索biological control,CD (W) ROM相当于检索CD ROM或CD-ROM。
(nW) 算符:表示此算符两侧的检索词之间允许插入最多n个词,且词序不可变。
如wear (1W) material相当于检索wear materials、wear of materials等词。
②(N)和(nN)算符
(N)是near的缩写,表示此算符两侧的检索词必须紧密相连,词序可变,词间不允许插入其他词或字母,但允许有一空格或标点符号。
(nN)表示两词间可插入最多n个词,词序可变,如检索式environment (2N) protection 就可检索出包含“environment protection”、“environment of the protection ”、“environment of water protection”、“protection of forest environment”
等内容的结果。
邻近检索对提高检索的查准率和查全率有重要作用,但网络检索中基本上只支持(W)和(N)检索式,主要应用于外文数据库和外文搜索引擎中。
(4)字段检索技术
字段检索是限定检索词在记录中出现的字段范围,检索时,计算机只对限定字段进行查找。
检索字段主要有:如题名、主题词、关键词、文摘、著者、语种、刊名、来源、时间、号码等。
常用字段代码:题名(Ti)、著者(Au)、文摘(Ab)、关键词(Kw、Ky)、刊名(So、Jn)
常用“=、:、/、in”等连接检索字段与检索词。
注意:不同的数据库其字段代码可能不同
3.检索效果评价的指标?
选择数据库可借鉴国外称之为“4C”的原则:
①内容(Content)。
②范围(Coverago)。
③时效(Currency)。
④费用(Cost),了解所选数据库的收费标准。
在前一次检索结果的基础上的再次检索,在初级检索、高级检索和专业检索中都可以进行二次检索。
只需“在结果中检索”框中点击,并且选择不同的逻辑关系(并且、或者、不包含),然后重新选择检索项,输入相关检索词或直接输入检索式,点击“检索”按钮,便可得到新的检索结果。
二次检索可以多次使用,从而实现复杂的检索。
二次检索功能:在上一次检索的基础上,可进行重新检索或二次检索。
(①在结果中检索,相当于使用逻辑与;②在结果中添加,相当于使用逻辑或;③在结果中去除,相当于使用逻辑非。
)
文献具有外部特征和内容特征。
外部特征有题名(书名、篇名和刊名)、著者(个人、团体)、号码(专利号、标准号、国际标准书号ISBN和国际标准刊号ISSN等)、机构名(责任者所属机构、出版发表机构)以及时间等;内容特征指文献内容所属的学科和文献内容的研究对象。
注意著者与机构名的区别。
中文:三大数据库厂商
同方知网(CNKI):期刊论文、学位论文、报纸全文重庆维普:期刊论文
万方数据:期刊论文、学位论文、会议论文、科技信息、商务信息、法律法规
人大书报资料中心:人大报刊复印资料数据库
§第2章中文文献数据库
1. 《中国期刊全文数据库》概况:CNKI产品
中国期刊全文数据库(以前称《中国期刊网》)(1994--)中国期刊全文数据库(世纪期刊)(1979--1993)中国优秀博硕士学位论文数据库(1999-- )中国博士学位论文全文数据库
中国优秀硕士学位论文全文数据库中国重要报纸全文数据库(2000-- )
中国重要会议论文全文数据库(2000-- )中国引文数据库
厂商:中国知网
数据库名称:中国期刊全文数据库
数据库起始年代:1978 -- 1993 ; 1994 –
文献类型:国内期刊论文
学科范围:包括社会科学、自然科学各学科的综合性数据库
数据库类型:全文数据库
检索方式(途径):初级检索简单检索多项单词逻辑组合检索:多项是指可选择多个检索项,通过点击“逻辑”下方的“+”增加一逻辑检索行;单词是指每个检索项中只可输入一个词;逻辑是指每一检索项之间可使用逻辑与、逻辑或和逻辑非进行项间组合。
、高级检索、(运用逻辑组配关系,对检索条件进行组配。
提供两种方式:向导式检索、直接输入检索式检索。
)专业检索通过检索式进行检索,编制检索式时要注意以下几点: 1)字段名称。
必须用正规名称,不要用括号内的名称。
2)多个字段:用and、or、not组配,并用“()”改变运算顺序。
3)所有符号和英文字母(包括所示操作符),都必须使用英文半角字符。
4)逻辑关系符(and、or、not)及运算符(#、%)前后要空一个字节,运算符($、/SUB、/NEAR、/PREV、/SEN)必须大写。
使用“同句”、“同段”、“词频”时,请注意:用一组西文单引号将多个检索词及其运算符括起,如‘流体 # 力学’。
、分类检索检索导航体系将各学科、各门类的知识分成十大专辑。
展开某专辑,类目名称有“√”图标,表示有下位类,没有这个“√”图标表示类目已是最后一级。
进行分类检索时,点击最后一级类目名称,将检索出此类目的所有文献。
而点击某类目后的“”图标则能检索任意一级类目所属的文献。
、刊名导航提供:刊名首字母导航、专辑、数据库刊源、刊期、出版地、主办单位、发行系统、期刊荣誉榜、世纪期刊以及核心期刊等导航。
检索:按刊名、ISSN和CN等
浏览或检索到相应的期刊后,再逐渐点击某一刊物名称、选择刊期,即可获得该刊物该年度该期所发表文献的文献记录。
检索字段:篇名、作者、关键词、机构、中文摘要、引文、基金、全文、中文刊名、ISSN、主题词、第一作者等
文件格式:CAJ、PDF
浏览器:Cajviewer、Adobe reader
CNKI知识搜索:
特别要求:熟练掌握初级检索、高级检索方式,会实际检索。
2.《中文科技期刊数据库》
厂商:重庆维普
数据库名称:中文科技期刊数据库
数据库起始年代:1989年以来
文献类型:国内期刊论文
学科范围:包括社会科学、自然科学各学科的综合性数据库
数据库类型:全文数据库
检索方式(途径):快速检索1)选择检索字段:题名、关键词、题名或关键词、作者、第一作者、刊名、作者机构、文摘、分类号、任意字段、作者简介、基金资助及栏目信息等。
默认字段:“题名或关键词”
2)检索框中直接输入:检索词或检索式
3)检索结果页面上:提供更多的条件限制功能
4)检索范围选择(在检索结果页面中):期刊范围的选择(全部期刊、重要期刊或核心期刊);出版年限的选择。
5)二次检索功能:在上一次检索的基础上,可进行重新检索或二次检索。
(①在结果中检索,相当于使用逻辑与;②在结果中添加,相当于使用逻辑或;③在结果中去除,相当于使用逻辑非。
)
、传统检索1)选择检索字段:题名、关键词、文摘、刊名、作者、机构等
2)限定检索范围:专辑导航、分类导航、出版年限、期刊范围
、高级检索、运用逻辑组配关系,对检索条件进行组配。
提供两种方式:向导式检索、直接输入检索式检索。
(1)向导式检索
提供分栏式检索词输入方法。
可选择逻辑运算、检索项、匹配度外,还可以进行相应字段扩展信息的限定,最大程度地提高了查准率。
1)扩展功能
选择某检索字段,系统提供对应的扩展功能,可对检索字段进行限制。
①查看同义词,可以挑选同义词以提高查全率。
②查看同名/合著作者,以列表形式显示不同单位同名作者,用户可以选择作者单位来限制同名作者范围,最多能勾选5个单位。
③查看分类表,用户可以直接点击按钮,会弹出分类表页,操作方法同分类检索。
④查看相关机构,譬如用户可以输入“中华医学会”,点击查看相关机构,即可显示以中华医学会为主办(管)机构的所属期刊社列表,最多能勾选数据5个。
⑤期刊导航:直接进入期刊导航检索界面
2)扩展检索条件
根据需要对时间条件、专业限制和期刊范围作进一步的限制,以减小检索范围。
3)检索顺序
向导式检索的检索操作严格按照由上到下的顺序进行,先检索第一行并把检索结果跟第二行检索结果进行逻辑组配,逻辑组配得到的结果再跟第三行检索结果进行逻辑组配,这样一直组配下去,直至完成所有检索条件。
(2)直接输入检索式检索
在检索条件框中直接输入:由逻辑运算符、字段代码、检索词等组成的检索式。
点击“扩展检索条件”并对相关检索条件进行限制
检索式的撰写
1)逻辑运算符:只用“*”、“+”和“-”这三个符号。
2)字段代码:U(任意字段)、M(题名或关键词)、K(关键词)、J(刊名)、A(作者)、F(第一作者)、S(机构)、T(题名)、R(文摘)、C(分类号)、Z(作者简介)、I(基金资助)和L(栏目信息)。
3)关于检索优先级:无括号时逻辑与“*”优先,有括号时先括号内后括号外。
直接输入检索式检索举例
例:要求检索姓张的作者在清华大学期间发表的题名或关键词都包含“物理”的论文。
检索式:A=张*S=清华大学*M=物理
例:要求检索钱伟长在非清华大学期间发表的论文。
检索式:A=钱伟长-S=清华大学
例:要求检索北京大学的作者撰写的,关键词包含“教学改革”并且题名中包含“高等数学”的论文。
检索式:S=北京大学*K=教学改革*T=高等数学
、分类检索、期刊导航
检索字段及代码:M=题名或关键词、K=关键词、J=刊名、A=作者、F=第一作者、
S=机构、T=题名、R=文摘、C=分类号
逻辑符号:* + -
文件格式:PDF
浏览器:Adobe Reader
特点:同义词库、同名作者库
重点掌握:高级检索,会实际检索。
特别要求:会撰写检索式,会实际检索。
3.综合性知识
浏览器功能:(1)浏览文件、(2)文本识别、(3)图像剪切等
分类检索功能:(1)限制学科范围、(2)学科途径检索
期刊导航功能:可从刊名、刊名首字母、期刊所属学科等途径查找指定期刊进行浏览
二次检索:在上一次检索结果的基础上的再次检索
§第3章国外期刊论文全文数据库
1.Springer出版社的电子期刊
(1)德国施普林格(Springer-Verlag)是世界上著名的科技出版社,以出版图书、期刊、工具书等学术性出版物而著名。
该社通过SpringerLink系统发行电子图书并提供学术期刊检索服务。
目前共出版有二千多种期刊,其检索系统名称为Link。
(2)Springer电子期刊除了提供浏览和检索服务外,还提供了个性化服务功能,包括最新期刊目次报道服务,Email 提示功能,并支持CrossRef引文链接。
SpringerLink服务系统实现了与重要的二次文献检索数据库的全文链接,目前已经与SCI、EI、INSPEC建立了从二次文献直接到
SpringerLink全文的链接。
(3)能进行检索。
2.World Scientific Publishing的电子期刊
世界科学出版社(World Scientific Publishing)世界科学出版社成立于1981年,总部设于新加坡,是亚太地区最大的专门出版理工专业书籍期刊之集团,每年出版约4百种不同主题之丛书,60多种专业期刊。
1995年与伦敦皇家学院共同成立皇家学院出版社(Imperial College Press),以工程、医学、信息科技、环境科技和管理科学类书籍见长,其检索系统名称为WorldSciNet。
能进行检索。
3.EBSCOhost系统全文数据库没有前截断
厂商:EBSCO全球最大的多学科学术期刊全文数据库之一
数据库名称:ASP、BSP
文献类型:国外期刊论文为主、也收录图书等文献
ASP学科范围:包括社会科学、自然科学各学科的综合性数据库
BSP学科范围:经济类文献为主
数据库类型:大部分是全文,也包括文摘、索引,还是属于全文数据库
特点:收录的期刊档次很高,但在时间上有滞后性。
检索方式(途径):基本检索、高级检索
布尔逻辑检索:and、or、not
截词检索:*、?
邻近(位置)检索:Wn、Nn
字段检索:Ti=题名、Au=作者、Ab=文摘、Kw=关键词、So=刊名
浏览器:Adobe Reader
能熟练运用检索技术构成检索式,如(ti:teach* w3 translat*) and so:ELT Journal
§第4章文摘、题录数据库与综合检索平台
1. SCI科学引文索引SCI引文检索的体系更是独一无二,不仅可以从文献引证的角度评估文章的学术价值;可以迅速方便地组建研究课题的参考文献网络。
发表的学术论文被SCI收录或引用的数量,已被世界上许多大学作为评价学术水平的一个重要标准。
、EI美国工程索引、CA美国化学文摘
SCOPUS Scopus 是由全球著名学术出版商Elsevier公司与全球21家研究机构的300多名科研人员设计而成的文摘索引数据库,是一个新的导航工具,它涵盖了世界上最广泛的科技和医学文献的文摘、参考文献及索引。
Scopus的核心是全世界最大的摘要和引文数据库,收录了来自4000多个出版商的15000余种期刊。
、DIALOG国际联机检索系统、CSSCI中文社会科学引文索引
等数据库一般了解。
2. 能对CASHL、NSTL数据库进行检索。
§第5章电子图书和电子报纸
掌握超星电子图书和读秀检索平台,能熟练使用。
超星电子图书阅读器的下载和安装:PDG格式、超星阅读器(SSreader)
§第6章特种文献数据库
1.特种文献
专利文献、会议文献、学位论文、科技报告、标准文献等非书非刊文献类型的总称。
2.专利文献及其检索
(1)专利的三层含义:从法律的角度:一种受法律保护的权利;从技术的角度:一种发明创造、一种技术;从文献的角度:记载专利内容的专利说明书。
(2)专利的特点:排他性(独占性)、时间性和地域性
(3)专利的三种基本类型:①发明专利,我国对发明专利的保护期为20年。
②实用新型专利(又称小发明、小专利),我国对实用新型专利的保护期为10年。
③外观设计专利,我国对外观设计专利的保护期为10年。
(4)专利文献的类型:申请说明书、公开说明书、审定说明书、公告说明书
(5)申请专利必须满足三个条件:①新颖性,所谓新颖性是指发明创造必须是新的、前所未有的技术。
②创造性,与以前已有的技术相比,该发明有突出的实质性特点和显著的进步。
③实用性,是指能够制造或者使用并能产生积极效果。
(6)专利分类:国际专利分类法(IPC)
(7)专利检索途径:专利文献中我们常说“几个人”、“几个号”、“几个日”。
①“几个人”是指申请人(对专利权提出申请的单位或个人)、发明人(或设计人,实际开展工作的人)、专利权人(对专利具有独占、使用、处置权的人)、代理人(代为办理专利权申请的人)。
②“几个号”是指申请号(发明专利申请号)、公开号(发明专利公布编号)、公告号(三种专利授权公告号)、专利号(三种专利原申请号)。
③“几个日”是指申请日(专利机关受到申请说明书之日)、公开日(发明专利申请公开之日)、公告日(三种专利授权公告之日)、优先权日(是指专利申请人就同一项发明在一个缔约国提出申请之后,在规定的期限内又向其他缔约国提出申请,申请人有权要求以第一次申请日期作为后来提出申请的日期,这一申请日就是优先权日。
)
(8)中国专利检索:中国国家知识产权局专利检索系统、万方数据、NSTL等。
(9)国外专利检索:德温特创新索引(Derwent Innovation Index,简称DII)是德温特公司与ISI(Institute for Scientific Information)公司合作开发的基于ISI统一检索平台的网络版专利数据库。
DII将“世界专利索引(WPI)”和“专利引文索引(PCI)”的内容有机整合在一起,利用ISI统一检索平台,在ISI的Web of Knowledge网站上提供网络检索服务,为研究人员提供了世界范围内的、综合全面的专利信息。
DII覆盖了全世界1963年以后的专利。
每周增加来自全球40多个专利机构授权的、经过德温特专利专家深度加工的20,000篇专利文献。
同时,每周还要增加来自6个主要的专利授权机构的被引和施引专利文献。
这6个专利授权机构是:世界专利组织(WO)、美国专利局(US)、欧洲专利局(EP)、德国专利局(DE)、英国专利局(GB)和日本专利局(JP)。
2.会议文献及其检索
(1)是指各种学术会议上宣读的论文、报告和会前、会后编印的文献资料。
大多数会议文献具有独到的学术见解和新颖的学术观点,学术质量较高。
同时,许多会议文献还公布科研人员取得的新进展与新成果,并提出新的研究课题和新的研究设想。
因此,会议文献往往具有专业性强、学术水平高、内容新颖、信息量大、可靠性强、出版速度快及发行方式灵活等特点。
(2)国内会议文献数据库主要有万方数据的《中国学术会议论文文摘数据库》和《中国学术会议论文全文数据库》、NSTL的中外文会议论文数据库、同方知网的《中国重要会议论文全文数据库》等。
(3)国外的会议文献数据库最著名的是ISI的Proceedings,它包括ISTP和ISSHP,该系统汇集成了世界上最新出版的会议录资料,包括专著、丛书、预印本以及来源于期刊的会议论文,并与Web of Science之间建立了双向链接。
3.学位论文及其检索
(1)按照多数国家的学位制度,学位论文包括学士学位论文、硕士学位论文、博士学位论文三种类型。
学位论文一般不公开出版,以打印或磁盘形式存贮在学位授予单位。
(2)国内查找学位论文的数据库主要有万方数据的《中国学位论文文摘数据库》和《中国学位论文全文数据库》、同方知网的《中国优秀博硕士学位论文全文数据库》
4.标准文献及其检索
(1)标准是对重复性事物和概念所做的统一规定,它以科学、技术和实践经验的综合成果为基础,经有关方面协商一致,由主管机构批准,以特定形式发布,作为共同遵守的准则和依据。
标准不仅是从事生产、建设工作的共同依据,而且是国际贸易合作,商品质量检验的依据。
(2)按照标准的性质,标准文献可分为:①基本标准。
② 产品标准。
③方法标准。
④经济管理标准。
⑤组织管理标准。
(3)按照标准的使用范围,标准文献可分为:①国际标准。
②区域标准。
③国家标准。
④专业标准。
⑤ 企业标准。
(4)我国国家标准代号一律用两个汉语拼音大写字母GB表示,编号由标准代号(顺序号)和批准年代组合而成,国家推荐的标准用GB/T表示,企业标准一般用Q/企业名称缩写-顺序号组合而成,如蓝带啤酒采用GB4927-2001、雕牌洗洁精采用GB9985-2000、GB/T10000-1998是中国成年人人体尺寸标准,如Q/MZ1-2005是企业标准。
§第7章事实和数值型数据库
1. 中文参考数据库:一般了解
2. 其他类型参考数据库:一般了解
§第8章网络资源的搜索
1.综合搜索引擎
包括:搜索引擎的概念、8.1.1 搜索引擎概述
1.搜索引擎的概念
搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序搜集互联网上的网站网页及其他信息,并对收集到的信息进行相关组织和处理,建立相应的数据库和索引文档,为用户提供搜索服务的系统。
组成、搜索引擎一般由搜索器、索引器、检索器和用户接口4个部分组成。
工作原理、其工作原理具体可概括为以下几个过程:
1)网页信息的采集。
每个独立的搜索引擎都有自己的网页抓取程序(Spider)。
Spider定期对一定IP地址范围内的网站顺着网页中的超链接,连续地抓取网页。
由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。
2)索引系统的建立。
搜索引擎抓到网页后,对采集到的网页信息进行信息语词切分、词法分析、词性标注、去除重复网页、分析超链接以及计算网页的重要度等相关的自然语言处理,建立索引文件系统。
3)提供检索服务。
通过人机交互的理论和方法,搜索引擎检索界面接受检索者提交的查询请求(可对查询内容、逻辑运算、相近关系及出现位置等进行限制),在索引数据库中进行检索,找到匹配该查询请求的网页信息,显示相应的检索结果。
为了用户便于判断,除了提供网页标题和URL 外,还会提供一段来自网页的摘要以及其他信息。
4.搜索引擎的分类
1
它们从互联网提取多个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。
2
3)元搜索引擎。
元搜索引擎(
Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。
分类根据搜索结果来源的不同,全文搜索引擎可分为两类:
一类拥有自己的搜索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类。
另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。
4)其他非主流搜索引擎形式有如下几个:
①集合式搜索引擎。
该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot搜索引擎。
②门户搜索引擎。
AOL Search、MSN Search等虽然提供搜索服务,但自身既没有分类目录,也没有网页数据库,其搜索结果完全来自其他搜索引擎。
、语法规则、
(1)逻辑检索
非”
等逻辑符号。
用双引号
(2)截词检索
国外的大多数搜索引擎用“*”、“?”作为截词符(或称通配符),可进行词干一致或前方一致或后方一致检索词的检索,一般用“*”指代单词的某个字符串,如“com*”代表computer、communication等,用“?”指代单词的某个字符。
中文搜索引擎不使用截词检索。
1“Microsoft ADJ Internet”表示Microsoft必须在
2“NEAR/n”,n是两个词之间的单
NEAR/5 game”表示在computet和game这两个关键词之间的单词数目不得超过5个。
(4)字段检索字段检索
1)filetype:查找特定格式的文件。
网上存在大量非网页格式的文件,如office文件、pdf文件等。
如输入“狼牙山五壮士filetype:ppt”表示搜索“狼牙山五壮士”的幻灯片文件;输入“2009时事政治filetype:doc”表示搜索“2009年时事政治”的DOC格式文件信息。
注意:filetype前必须空一格。
2)intitle:限定标题,只在网页标题内进行搜索。
例如检索清华大学主页,排除仅仅在网页中含有“清华大学”这个词组的其他网页,只需输入“intitle:清华大学”即可;如查找霍金的《时间简史》只需“intitle:时间简史”,如果输入“intitle:时间简史filetype:pdf”则能查找到《时间简史》的PDF格式。
3)inurl:限定域名,只在指定的URL中进行搜索。
网页编制者往往把网页主题的拼音首字母作为URL中的路径名,如关于“校务公开”的网页用“xwgk”作路径。
请注意路径名与网址的区别,路径名仅是网址中的一个词,是一个目录名。
所以搜索“校务公开”可用“校务公开inurl:xwgk”,我们也常用inurl来查找网址,如查找netlibrary的网址只需在Google输入“inurl:netlibrary”,查找ebrary的网址只需在Google输入“inurl:ebrary”。
4)site:限定在某类网域或某个网站中进行搜索。
“site:”后跟具体的网域或网站地址,网址前的“http://”必须删去。
如在中国教科网上搜索校园文化,只需输入“校园文化site:
5)link:检索含有某个具体链接的网页。
如在Google中,“link:”搜索到的每个网页中都含有这个网页的链接。
术语6.全文搜索引擎的常用术语
1)域名。
1)域名。
域名是计算机主机在Internet上的地址。
域名在整个Internet必须是唯一的,字母大小写在域名中没有区别。
常见的域名后缀包括:代表商业组织的“.com”,代表教育机构或大学的“.edu”,代表非营利组织的“.org”,代表网络的“.net”,代表非军事性政府组织的“.gov”,代表军事性政府组织的“.mil”,代表中国的“.cn”,代表日本的“.jp”等
2)模糊检索。
2)模糊检索。
匹配方式为模糊匹配的检索,搜索引擎对输入的关键词在数据库中对每个字进行匹配比较,只要相关记录中含有这些字即满足检索条件。
模糊检索相当于对每个字进行逻辑与组配,显然这种检索反馈的信息量大,但准确性欠佳。
3)精确检索。
匹配方式为精确匹配的检索,搜索引擎对输入的关键词在数据库中对整个词进行匹配比较,只有相关记录中含有整个词才满足检索条件。
相对于模糊检索,准确性要高一些。
要使用精确检索,在输入关键词时一般要用双引号,或直接在高级检索的“包含以下完整字词(或关键词)”输入框中输入关键词。