网络信息检索第三章

合集下载

第三章 信息检索基本知识

第三章 信息检索基本知识


信息论的奠基人 申农在《通信的数学 理论》中把信息定义 为:“信息是用来消 除不确定的东西。”
控制论创始人
维纳在《信息控制论》 一书中指出:“信息是 人与外界相互作用过程 中相互交换的内容和名 称。”
―信息”的定义之所以呈现多样化,主要有三方 面的原因 : 第一,信息本身的复杂性。它是一个多元化、 多层次、多功能的综合物; 第二,信息科学是一门新兴学科,是一门“大” 学科,它有许多分支学科,它的内涵与外延 不很确切,而且随着社会、经济和科学技术 的发展处于不断发展之中; 第三,人们出于不同的研究目的或使用目的, 从不同的角度或层次出发,对“信息”必然 作出不同的理解与解释。
4.从信息观的角度理解,知识是人类通过信息 对自然界、生物界、人类社会运动规律的认识 和概括,是一种特定的人类信息,它是对信息 进行提炼、深化、抽象化、系统化的结果,是 信息中最有价值的部分。知识是信息的一部分。 知识必须要有充分、可靠的经验性证据, 并且要经过理性的合理加工。
(二)知识的特性 1.实践性 社会实践是一切知识产生的基础和检验知 识的标准,科学知识对实践有重大指导作用。 2.规律性 人们对事物的认识是一个无限的过程,人 们获得的知识在一定层面上揭示了事物及运动 过程的规律性。 3.渗透性 随着知识门类增多,各种知识可以相互渗透, 形成许多新的知识门类,形成科学知识的网状 结构体系。
四、文献 (一)文献的定义 1.国际标准化组织《文献情报术语国际标准》: 文献是存储、检索、利用或传递记录信息的过 程中,可作为一个单元处理的、在载体内、载 体上或依附载体而存储有信息或数据的载体。 2.国家标准《文献著录总则》:文献是记录有知 识的一切载体。 北大教授王子舟《图书馆学是什么》:是指专门 记录、传播有知识的一切载体。 南大教授沈固朝《信息检索(多媒体)教程》: 记录有人类精神信息的、且便于存贮或传递的 人工固态附载物

第三章 信息检索的基本知识

第三章 信息检索的基本知识

1、逻辑“或”(和) 、逻辑“
————————————————— A
B
用符号“ 或 表示, 用符号“or”或“+”表示,其逻辑表达式为: 表示 其逻辑表达式为: A or B 或 A+B 其意义为检索记录中凡含有检索词A或检索词 , 其意义为检索记录中凡含有检索词 或检索词B, 或检索词 或同时含有检索词A和 的 均为命中文献。 或同时含有检索词 和B的,均为命中文献。
分 析 课 题
检索词: 检索词: : :
富营养化(水华), ),处理 富营养化(水华),处理 治理,修复), ),湖泊 (治理,修复),湖泊
ቤተ መጻሕፍቲ ባይዱ
, ,

检索工具: 检索工具:
1. 2. 3. 4. 5. 6. 7. 8. 中文科技期刊全文数据库(维普) 1989中文科技期刊全文数据库(维普) 1989-现在 中国科技成果数据库(万方) 1986中国科技成果数据库(万方) 1986-现在 中国期刊全文数据库(同方) 1979中国期刊全文数据库(同方) 1979-现在 中国优秀博硕士学位论文全文数据库(同方)1999中国优秀博硕士学位论文全文数据库(同方)1999-现在 中国学位论文文摘数据库(万方) 1989中国学位论文文摘数据库(万方) 1989-现在 中国学术会议论文全文数据库(万方) 1995中国学术会议论文全文数据库(万方) 1995-现在 中国重要会议论文全文数据库(同方) 2000中国重要会议论文全文数据库(同方) 2000-现在 中国重大科技成果数据库(万方) 1990中国重大科技成果数据库(万方) 1990-现在
中图分类法
中图法》 个基本部类, 《中图法》分 5个基本部类,将知识门类分为 哲学” 社会科学” 自然科学” “哲学”、“社会科学”、“自然科学”三大部 马克思主义、列宁主义、 类。马克思主义、列宁主义、毛泽东思想是指导 我们思想的理论基础,作为一个基本部类, 我们思想的理论基础,作为一个基本部类,列于 首位。此外,考虑到图书本身的特点, 首位。此外,考虑到图书本身的特点,对于一些 内容庞杂,类无专属, 内容庞杂,类无专属,无法按某一学科内容性质 分类的图书,概括为“综合性图书” 分类的图书,概括为“综合性图书”,作为一个 基本部类,置于最后。 22个大 基本部类,置于最后。在此基础上扩展为 22个大 类。 标记符号采用拉丁字母与阿拉伯数字相结合的混 合号码制。 合号码制。

信息检索 第3章 中文主要信息资源检索系统

信息检索 第3章 中文主要信息资源检索系统

轻工 纺织
建筑 建材
环境 《环境科学文摘》
《馆目:环境污染与保护》
《汽车文摘》 《公路运输文摘》 《水陆运输文摘》 《造船文摘》 《中目:船舶工程》 《外目:造船工程》 交通 《中目:公路、水陆运输》 《铁道文摘》 运输 《中目:铁路》 《专利文献通报:汽车 》 《专利文献通报:包装、搬运、储存》 《外目:航空与航天》 《航空发动机文摘》 航天 《馆目:交通运输、航空航天》
WEB版(网上包库)、镜像站版、光盘版、流量计费。
四川农业大学图馆网站简介

点击
各种类型的电子文献资源: 中外文期刊、图书及特种文献
读者查询 点击:
四、中国期刊全文数据库信息检索
1. 登录检索系统
鼠标接触
点击: 外网或本地镜像
CNKI中国知识资源总库
点击
选择单一数据库 或选择多个数据库进行跨 库检索
《电工文摘》 《中目:电力电工、原子能》 水利 《外目:电力》 《中目:水利水电》 电力 《外目:水利水电》 《中文电子科学文摘》 《电子科技文摘》 电子 《中国无线电电子科技文摘》 《计算机应用文摘》 学 《国外电子科学文摘》 《专科文献通报:电子技术》 《馆目:无线电电子学与自动化技术》
计算 《专利文献通报:计算机和信息存储》 机 《计算机应用文摘》 《中国纺织文摘》 《纺织文摘》 《皮革文摘》 《造纸文摘》 《中目:轻工、纺织》 《外目:轻工业》 《外目:粮油食品》 《外目:制糖工业》 《馆目:轻工、纺织》 《专利文献通报:纺织》 《专利文献通报:生活日用》 《专利文献通报:造纸、印刷、装帧》 《建筑机械文摘》 《中目:建筑工程》 《中目:建筑材料》 《外目:建筑材料》 《外目:建筑水利工程》 《馆目:建筑水利工程》 《城市文献通报》

第3章-搜索引擎及网络信息检索

第3章-搜索引擎及网络信息检索

3.2 典型的搜索引擎
• • • • 1. Google 2)Google的搜索语法 Google的基本检索算符是:空格、减号和大写英文“OR”。 逻辑“与”(and)用空格表示。用减号“-”表示逻辑 “非”。注意:这里的“+”和“-”号,是英文字符,而不 是中文字符的“+”和“-”。此外,操作符与关键字之 间,不能有空格。 • Google不支持通配符,如“*”、“?”等,关键字后面的 “*”或者“?”会被忽略掉。Google对英文字符大小写不 敏感,“GOD”和“god”搜索的结果是一样的。Google的 关键字可以是词组(中间没有空格),也可以是句子,但 是,用句子做关键字,必须加英文引号。
• • • • • le检索题目含有“清华大学”、“研究生”的doc格式的文件,应该 输入___: A. intitle:清华大学 研究生 site: filetype:doc B. ti=清华大学 研究生 site: filetype:doc C. intitle=清华大学* 研究生*site=*filetype=doc D. intitle:(清华大学 研究生) site: filetype:doc 8.同样检索式(例如输入:玉米 提取 乙醇)分别用本章介绍的科技信境外中国古典诗词的网上英文资料。提示:参考和比较下列方法的查 询结果: (1)在Yahoo中选择分类目录Arts & Humanities(艺术与人文科学)〉 Literature(文学),输入关键词classical Chinese Poetry检索。 (2)在Google输入:中国古典诗词的网上英文资料 (3)在Google输入:(中国 古 诗词 英文)or classical.3 搜索引擎的检索技巧
• • • • 3.3.1常规的检索技巧 1.分类查询 2.关键词查询 一般来说,首次检索时不要把条件限制得 过于严格,最好是检索出一些结果后再使 用其

第三章 信息检索教程

第三章 信息检索教程
22
举例:期刊2
23
期刊著录格式
24
期刊的著录
写出下面期刊文献著录:
25
小节练习1
1. 什么是文献著录? 2.文献著录的结果是—— 3. 既著录主要项目,还著录全部选择项目的著录级次称为—— 4. 既著录主要项目,还著录部分选择项目的著录级次称为——
26
3.2 机读目录与元数据
3.2.1 机读目录
43
3.2.3 都柏林核心元数据和机读目录的比较
1. 著录的对象不同
DC与 MARC的 3. 著录的主体不同 比较 4. 著录的详简程度不同
5. 标识的方法不同
2. 数据的形式不同
44
小节练习2
1、什么是机读目录,一条CNMARC机读目 录的组成? 2、头标区数据元素: 00123cbm1#2200277###52## 其中c、b、m、1分别表示什么? 3、什么是元数据?
12
图书的著录(参考文献著录规则)
13
14
图书著录中的文献类型标志
常用文献类型用单字母标识,具体如下: (1)期刊[J](journal) (2)专著[M](monograph) (3)论文集[C](collected papers) (4)学位论文[D](dissertation) (5)专利[P](patent) (6)技术标准[S](standardization) (7)报纸[N](newspaper article) (8)科技报告[R](report)
CNMARC记录
记录头标区
地址目次区
数据字段区
记录分隔符
注:各字段数据元素及其标准详细情况参见教材P83-87
33
ISO-2709的机读目录标准

信息检索课件第3章

信息检索课件第3章

文本信息检索的应用场景
01
02
03
搜索引擎
搜索引擎是文本信息检通过分析用 户历史行为和兴趣,为用 户推荐相关内容,如新闻 推荐、电商推荐等。
学术领域
学术领域中,研究人员可 以通过文本信息检索快速 查找相关论文、研究成果 等。
查询条件最相似的图像。
图像信息检索的关键技术
1 2
特征提取算法
特征提取算法是图像信息检索的核心技术之一, 常用的算法包括颜色直方图、SIFT、SURF等。
特征匹配算法
特征匹配算法用于比较不同图像之间的相似度, 常用的算法包括欧氏距离、余弦相似度等。
3
索引技术
索引技术可以提高图像信息检索的效率,常用的 索引技术包括哈希索引、B树索引等。
特征提取是视频信息检 索中的核心技术之中提取出关键帧和 图像特征,以便后续的 相似度计算和检索排序。
相似度计算是另一个关 检索排序是根据相似度 视频摘要技术则是对整
键技术,它通过比较不 计算结果,按照相关度 个视频内容进行概括和
同视频之间的特征信息, 对视频进行排序,以便 总结,以便用户快速了
图像信息检索的应用场景
搜索引擎
搜索引擎是图像信息检索 的重要应用场景之一,用 户可以通过搜索引擎查找 符合特定条件的图片。
电子商务
电子商务网站可以利用图 像信息检索技术为用户提 供更加精准的商品推荐服 务。
文化创意产业
在文化创意产业中,图像 信息检索技术可以帮助用 户快速查找相关艺术作品、 文物等。
THANKS.
智能化发展
利用人工智能技术提升信息检索的智 能化水平,如自然语言处理、深度学 习等。
个性化服务强化
通过更精细化的用户画像和个性化推 荐算法,提高信息检索的个性化服务 能力。

网络信息检索课件_网上期刊数据库

网络信息检索课件_网上期刊数据库

1、科技图书(Sci-Tech book)
一般分为两大类:阅读类图书
(reading book)和参考类图书(reference
book),前者有教科书(text book)、专著
(monograph)和论文集(anthology)等,后者
是参考工具书(reference book),它们是百
科全书(encyclopedia)、手册(handbook)、
四次文献 五大多媒体技术 十大文献信息资源
网络信息检索第5章 张胜光制作
4
一个原则
两大类搜索引擎
三大系列中文网站:
三大中文门户网站—新浪、搜狐、网易 三大中文期刊数据库—清华库、维普库、万方库 三大中文数字图书馆—超星、方正、书生之家
网络信息检索第5章 张胜光制作
5
第一节 四次文献和 十大信息源
年鉴(yearbook)等。
网络信息检索第5章 张胜光制作 43
科技图书内容比较成熟、全面、
可靠、系统,它是对已有研究成果、
生产技术和经验或某一知识体系的论 述或概括。科技图书的基本素材来自 期刊论文、会议论文、研究报告、学 位论文等一次文献,其中包括作者本
人的研究、见地。
网络信息检索第5章 张胜光制作 44
网络信息检索第5章 张胜光制作
29
什么是文摘?
文摘(abstract),又分为报道性文摘、 指示性文摘、报道-指示性文摘、评述性文 摘、模块式文摘、专用文摘等几种,它是指 对一份文献(或称一个文献单元)的内容所 做的简略、准确的描述。这种二次文献意义 上的文摘,是索引形式的发展。
网络信息检索第5章 张胜光制作
对应于网上信息资源,属于一次文献范畴的
网络信息检索第5章 张胜光制作

第三章 网络信息检索

第三章   网络信息检索

第三章网络信息检索第一节网络信息检索的基本方法1、布尔逻辑检索逻辑检索是一种比较成熟、较为流行的检索技术。

逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符,主要的运算符有:(1)逻辑―与‖逻辑―与‖用AND(或﹡)表示。

检索词A、B若用逻辑―与‖相连,即A AND B(A*B),则表示同时含有这两个检索词才能被命中。

例如,要检索儿童教育的文献,检索逻辑式可表示为:child AND education(2)逻辑―或‖逻辑―或‖用OR(或+)表示。

检索词A、B若用逻辑―或‖相连,即A OR B(A+B),则表示只要含有其中一个检索词或同时含有这两个检索词的文献都将被命中。

例如,要检索―计算机‖或―机器人‖方面的文献,检索逻辑式可表示为:computer OR robot. (3)逻辑―非‖逻辑―非‖用NOT(AND NOT,BUT NOT)(或-)表示。

检索词A、B若用―非‖相连,即A NOT B(A-B),则表示被检索文献在含有检索词A而不含有检索词B时才能被命中。

例如,要检索有关―能源‖方面的文献,但涉及―核能‖方面的文献不要,检索逻辑式可表示为:energy NOT nuclear(energy –nuclear)。

1、搜索引擎的定义搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具,简言之,搜索引擎就是一种在因特网上查找信息的工具。

用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果反馈给用户。

搜索引擎一般都有固定的显示格式,内容详简程度不一,常常带有URL、题名、标题、关键词、摘要(文本描述摘录)、超链接文件大小、检索结果总数、相关度估计、评论等。

搜索引擎的检索结果一般按查询的相关程度进行排列,最相关的通常排在最前面。

2、搜索引擎的常用检索方法(1)简单搜索(simple search)指输入一个单词(关键词),提交搜索引擎检索后反馈结果。

它也叫单词搜索。

第3章_搜索引擎及网络信息检索

第3章_搜索引擎及网络信息检索
:输入“西南大学”。 优点:信息覆盖面大。 2、按关键词进行精确查询 此类搜索引擎有新浪、搜狐、网易、找到啦、中华
网和常青藤等。
优点:准确性高。
23
3.1.4 主题搜索引擎的关键词语法规则 3、检索式的运算符号
1) 使用逻辑运算算符
第3章 搜索引擎及网络信息检索
3.1 基本知识
3.2 典型的搜索引擎 3.3 搜索引擎的检索技巧 3.4 免费学术资源检索与利用
1
3.1 基本知识
3.1.1 基本概念
3.1.2 搜索引擎的优点和缺点 3.1.3 搜索引擎的类型
2
3.1.1 基本概念 1.搜索引擎

搜索引擎是Internet上的一种网站,它的主要任务
2) 使用位臵算符 3) 使用字段限定
24
3.1.4 主题搜索引擎的关键词语法规则
1) 使用逻辑运算算符 搜索引擎基本上都支持“与”、“或”、“非”、 括号或引号等逻辑运算符号,不同的搜索引擎使用的 逻辑符不完全相同。 • “AND” 在中文搜索引擎都可以用空格代替; • “NOT” 有时可以用减号代替,格式如: “关键词A - 关键词B”,减号前面要有空格。B”。Google直接用 “OR”表示,格式是“关键词A OR 关键词B”。
38
3.4 免费学术资源检索与利用
DOAJ开放获取期刊目录 DOAJ (Directory of Open Access Journals)是由瑞 典隆德大学图书馆 2003 年 5 月推出的开放获取期刊的 检索系统。DOAJ 按期刊的学科主题分为 17 类,包括 Ag riculture and Food Sciences , Arts and Architect ure , Biology and Life Sciences , Business and Economics , Chemistry , Earth and Environmental Sciences , General Works , Health Sciences , H istory and Archaeology , Languages and Literatur es , Law and Political Science , Mathematics an d Statistics , Philosophy and Religion , Physic s and Astronomy , Science General , Social Scie nces , Technology and Engineering 。 / 39

文献检索-第三章网络检索1

文献检索-第三章网络检索1
确匹配 (2)intitle——关键词在网页标题中 注意:intitle:和后面的关键词之间不要有空格。 (3)inurl——限定在URL链接中搜索,使用的方式是用
“inurl:”, 后跟需要在url中出现的关键词。
(4)filetype——对搜索对象做格式限制 使用方法是在“Filetype:”后跟文件格式。“Filetype:”
(7)inurl:搜索的关键字包含在URL链接中
(8) intile或allintile:搜索的关键词包含在网页标题中
(9)link:搜索所有链接到某个URL地址的网页
(10) Google不使用“词干法”,也不支持“通配符”(*) 搜索。也就是说,Google只搜索与输入的关键词完全一样 的字词。
获取途径:免费浏览所有检索到的互联网主页的信息。Scirus 提供的期刊资源可以免费查看题录和文摘。但是,获取非免 费期刊全文需要预先注册并支付费用。
六. 常用中文搜索引擎
(1)搜索客() (2)尤里卡() (3)北极星() (4)常青藤() (5)若比邻() (6)21世纪搜索引擎() (7)悠游() (8)新浪() (13)万纬搜索: /
3.1.2 类型
从文献信息检索角度分 1、网上图书信息 因特网上提供的图书信息主要包括书目信息和电子图书,
这些信息可从以下途径来获取: (1)出版商提供的书目信息 (2)图书馆、文献情报中心提供的联机图书馆馆藏目录 (3)数字图书馆提供的电子图书 (4)网上书店
2.网上电子期刊信息
电子期刊是非常重要的网络资源。网上电子期刊时效 性强、内容丰富、检索途径多样,已成为利用率非常高的 网络信息源,特别是免费的电子期刊。网上电子期刊包括 与印刷版同时发行和仅在网上发行的两种,其主要来源渠 道有:

信息检索第三章EI

信息检索第三章EI

印刷版EI 编排结构与著录
正文:即文摘部分,是EI的主体。由一些文摘 条目组成,并以规范主题词为标目。主题词取 自规范词表。1992年以前使用《工程标题词 表》,1993年起使用《EI叙词表》
印刷版EI (月刊、年刊) 索引
月刊索引:著者索引、主题索引
年刊索引:著者索引、主题索引、 工程出版物索引
附录
EI文摘正文著录格式
叙词
COMPUTER AIDED INSTRUCTION
文…摘…号…
文献篇名
文摘内容
009057 Current situations and future directions of
intelligent CAI research/development . This pa-per
• PL以连续出版物的缩写题名字母为序编排。
• 著录内容包括:连续出版物的缩写题名、连续出 版物的全称、计算机识别代码与ISSN号。 • PL的主要作用:通过EI文摘正文给出的刊名缩 写查找连续出版物(期刊)的全称,从而通过查 找馆藏目录,获取原文。
J Inf Image Manage① Journal of Information and image Management② JIIMDW③
第三章 外文检索工具
常用外文检索工具
美国《工程索引》 英国《科学文摘》 美国《科学引文索引》 美国《科技会议录索引》
3.1 美国《工程索引》EI
1 概述 2 印刷版EI编排结构与著录 3 EI标题词表与叙词表 4 EI检索方法及检索示例
EI 概 述
• 美国《工程索引》 (The Engineering Index),简称EI • 1884年创刊,由美国工程信息公司编辑

(网络资源与信息检索)第三章 期刊信息检索与获取

(网络资源与信息检索)第三章 期刊信息检索与获取
期刊信息的检索与获取
期刊图书信信息息的的检检索索与与获取获取
内容要点
❖一、期刊的基础知识 ❖二、期刊的检索与获取 ❖三、期刊论文的检索与获取
▪ (一)文献检索的程序 ▪ (二)手工检索工具 ▪ (三)期刊论文数据库 ▪ (四)文献检索效果评价
三、期刊论文信息的检索
要查找有关“搜索引擎个性化信息服务技 术”的文章或“民营企业人力资源管理”的资料 ,我们更多的是需要查找期刊论文信息。
样本 若课题属尖端技术:科技报告
分析检索课题
确定检索的时间范围 分析已知信息
比如知道某国在该领域处于领先,可以该国为 重点。
某科学家在该领域成就显著,可以以此人为检 索线索。
2.选择检索方法
常用法
- 顺查法 - 倒查法 - 抽查法
追溯法 综合法(也称分段法)
2.选择检索方法
常用法
✓ 顺查法 从远及近查,用于了解某一事物发展的全过程
般也很多。因此,只要针对发展高峰进行抽查,就能查 获较多的文献资料。
2.选择检索方法
要求查全----则用顺查法; 要求快、新----则用倒查法; 掌握了课题的发展阶段特点----则用抽查法。
2.选择检索方法
追溯法(引文法)
以文献后面附着的参考文献为线索而查找相关文献的一 种方法。在没有检索工具或检索工具不完整时可借助此获 得相关文献。
缺点:查全率、查准率较低,易误检漏检
2.选择检索方法
综合法(也称分段法)
又称循环法或分段法,是交替使用“追溯法”和“常用法 ”来进行检索的综合方法。即首先利用检索工具查出一批 文献资料,再利用这些文献资料所附的参考文献追溯查找 相关文献。如此交替、循环使用常用法和追溯法,不断扩 检,直到满足检索要求为止。 优点在于:当检索工具缺期、缺卷时,也能连续获得所需 年限以内的文献资料。

第三章信息检索的基本理论

第三章信息检索的基本理论

第三章信息检索的基本理论目的要求了解信息检索系统的概念;了解手工信息检索系统的类型;熟悉手工信息检索系统的结构;掌握手工信息检索系统的著录格式和常用的手工信息检索系统的信息检索方法。

掌握计算机信息检索系统的构成和类型;掌握信息检索语言的基本类型;掌握信息检索原理。

第一节信息检索系统一、信息检索系统的概述信息检索系统是指由一定的设备和信息集合构成,具有一定存储、检索与传送技术设备,提供一定的存贮与检索方法及检索服务功能的工作系统。

简单地说,信息检索系统即信息的存贮和检索的系统。

广义:信息检索系统是包括了从信息采集到检索全过程的服务体系。

狭义:信息技术系统就是用户检索信息时所使用的检索工具。

信息检索系统具有输入功能、存贮功能、处理功能、输出功能及控制功能。

根据信息存贮和检索所设备和手段的不同,信息检索系统可分为两大类型,即:手工信息检索系统和计算机信息检索系统。

目前,信息检索系统已从传统的手工检索系统发展到计算机网络信息检索系统。

二、手工信息检索系统1、手工信息检索系统的类型书本式检索工具(期刊式检索工具、单卷式检索工具、附录式检索工具)和卡片式检索工具。

期刊式检索工具:指在一个题名之下,定期连续发行的一种检索工具。

它具有及时性、连续性和稳定性的特点。

例如各种文摘杂志、索引刊物、连续的馆藏目录等。

这种形式的检索工具,及时反映新出版、新发表、新入藏的文献信息,它随着新文献的不断出现而不断连续出版,保持与文献的平行发展关系。

因此科研工作者为了掌握和了解本学科的科研动态,定期查阅期刊式检索工具是一种非常有效的方法。

同时由于期刊式检索工具的连续性的特点,不少期刊式检索工具,每到一定时间累积后,对于回溯检索极为方便。

单卷式检索工具:这种检索工具多数是以一定的专题内容而编印的,选题一般具有独立的意义。

它专业性强,收集的文献比较集中,往往积累反映一个相当长时间的文献,并以特定范围的读者作为对象。

单卷式检索工具收录文献一般比较全面系统,排列组织比较切合专业研究的需要,因此,对于专题文献检索比较方便,使用价值较高。

信息检索第三章信息著录和标引

信息检索第三章信息著录和标引

第三章信息著录和标引信息著录的含义和标准一、信息著录的含义信息著录:简称著录,指在组织检索系统时对文献内容和形式特征进行选择和记录的过程。

著录对象是信息,著录结果是款目或记录。

款目:指依据一定的标准方法,对一种文献或信息源的内容价值物质形态进行描述而形成的一条记录。

款目由一条条著录项目组成。

著录项目:用于揭示文献内容和形式特征的记录事项。

信息著录的基本要求:①准确性。

要求著录结果准确全面客观的揭示文献或其它信息源的内容特征或形式特征②规范化。

要求信息著录坚持标准化原则,按照统一的著录项目,著录格式,标识符号进行著录。

二、信息著录的作用1、揭示功能:信息著录主要反映的是文献本身的特征,通过对文献全面系统的分析,揭示出其内容特征和形式特征,将其浓缩于只言片语中,从而表达文献的基本信息。

2、组织功能:信息著录后形成的款目或记录,是编制目录的基础,也是组织数据库数据的基本单元。

文献编目包括信息著录和目录组织两步。

信息著录是对文献内容特征形式特征进行选择记录后形成款目或记录。

目录组织是将这些款目或记录按照一定组织规则编排在一起最终形成检索工具或数据库。

3、检索功能:存储是检索的第一个阶段,即将表达文献特征的有检索意义的标识通过记录组织成手工检索工具或计算机数据库,而表达文献特征的标识需要通过著录和标引来完成。

作为信息著录结果的款目或记录,记载了表达文献特征的各种标识。

三、信息著录的标准《文献著录总则》旨在根据各种类型文献的共同特点,确定文献著录原则、内容、标识符号、格式等的统一规定。

具有指导作用为信息著录提供原则性框架,并不作为文献著录的直接依据。

1、著录项目:①题名与责任者项②版本项③文献特殊细节项④出版发行项⑤载体形态项⑥丛编项⑦附注项⑧文献标准编号及有关记载项⑨提要项2、著录级次:著录文献的详简程度,分为三级:①简要级次,款目仅著录主要项目②基本级次,著录主要项目同时还著录部分选择项目③详细级次,著录全部主要项目和全部选择项目。

第三章_信息检索步骤

第三章_信息检索步骤

在文章的发表过程中,可能存在着“二八定理”。对 该“领军人物”或课题组进行全方位检索,收获将很大。 因此在实际操作过程中我们除用关键词途径检索外,也可 根据自己已找到或导师推荐阅读的某相关文章的作者(研 究机构)进行搜索,通常同一作者(研究机构)研究的方 向都围绕一个中心,先看所著的一篇论文,然后再搜其他 的,得到的很可能就是所研究问题的延续或另外一种解决 办法。
第四步:评价信息
——在对不同信息源进行检索之后,取得的文献信 息数量可能相当庞大,内容也有相互重复甚至冲
突的地方。这就需要有一定的评价方法对信息进
行筛选,找到那些来源可靠,内容相关且详尽的
文献,剔除错误、过时、不相关的信息。

信息检索五步走
第五步:分析、利用信息
筛选后的检索结果来源广泛,内容涉及方方面面。如 何有效组织整理,以提炼出一个综合性的信息内容, 完成报告的编撰是这一步骤的主要工作。 此时选用相关的工具将检索结果有效组织,将极大减 少工作量。同时进一步通过阅读确定:哪些信息是切 合需要的?哪些信息表述内容之间存在冲突,需要进 一步考察?并依据相关规范正确引用文献资源,最终 形成文字性的研究成果。
信息获取的思路
如果需要查找中文文献则更为方便 中国知网、维普、万方都提供文摘检 索,收录量都比较大,为稳妥起见有条件 的也要每个库都检索一遍

信息获取的思路
对于没有条件检索以上文摘库的读者,一 个比较好的办法是在Google Scholar里查, 有线索了再去查全文 也可根据自己课题学科选择相应的几个全 文数据库进行检索

需要一 般性、数 据库无法 获取全文
网页
数据库
印刷型资源
但无论选择哪种方式 都是首先获取题录信息,然后获取全文这样一个过程

网络信息检索

网络信息检索
信息资源检索与利用
第三章 网络信息检索
随着科学技术的飞速发展,计算机软 硬件系统不断更新换代,特别是20世纪中后 期,计算机技术和通信技术相结合而产生 的计算机网络,使得以计算机为平台的计 算机信息检索迅猛发展。利用计算机进行 信息检索已成为人们获取信息的重要方式, 对人们的学习和生活产生了极其深远的影 响。
随着互联网的迅速发展,使得检索所有 新出现的网页变得越来越困难,因此,在 Matthew Gray的Wanderer基础上,一些编程 者将传统的“蜘蛛”程序工作原理作了些 改进。其设想是,既然所有网页都可能有 连向其他网站的链接,那么从跟踪一个网 站的链接开始,就有可能检索整个互联网。 到1993年底,一些基于此原理的搜索引擎开 始纷纷涌现,其中以JumpStation、 The World
3.1 网络信息检索的基础知识
3.1.1 网络信息资源 1、网络信息资源的内涵 Internet是一组全球信息资源的总汇,将以往 相互孤立的、散落在各地的单台计算机或是相对 独立的计算机局域网,借助信息网络,通过一定 的通信协议来实现更高层得互联。 所谓网络信息资源是指以数字化形式记录且 以多种媒体形式表达的,分别存储在因特网不同 主机上并通过计算机网络通信方式进行的信息资 源的集合。
1965年至1990年代,由于集成电路技 术 、硬盘技术、数字通讯技术、分组交换 网络技术的发展,开始有了数据库联机检 索系统。1975年提供使用的联机数据库已有 300个左右,其生产和运作模式也由原来的 政府行为转向商业行为,用户群业由政府 机构 扩展到更多的图书馆和科研机构。 到20世纪80年代末,数据库的数量已达 到3600多个,数据库容量增加,出现了光盘 介质 ;全文数据库迅速增加,出现了数值 数据库和事实数据库。

网络信息检索(董守斌)章 (3)

网络信息检索(董守斌)章 (3)

第3章 网络信息的自动搜集 HTML是简单的标识语言,用来创建万维网上使用的超媒体
文档。 HTML使用标签来标识HTML元素,例如标题、段落、列表、 粗体或斜体文本,及其他类似的特性。 标签通常成对出现,前 面的标签为〈tag〉,后面的标签是〈/tag〉。 Web浏览器分析 原始HTML语言,并创建为一个用户可读的文档版本。
第3章 网络信息的自动搜集
第3章 网络信息的自动搜集
3.1 网络信息的特点 3.2 网络信息搜集的原理 3.3 网络信息搜集的礼貌原则 3.4 高性能信息搜集 3.5 专题信息搜集 3.6 小结 思考题
第3章 网络信息的自动搜集
3.1 网络信息的特点
网络信息有各种各样的表现形式,这些信息都在WWW(World Wide Web,万维网,简称Web)上产生、流转和消亡,其中Web页面(网页)已 经成为网络信息最重要的载体。 随着网络的普及,网页的数量也成 倍增加。 据Cyveillance公司2000年关于网页大小的调研报告称[1], Web上总网页数高达21亿,每天约增加730万个网页,如果每个网页按 照平均15 KB来计算,约需要109 GB的存储空间;到2005年1月为止, 可见的网页(surface web)在115亿左右[2],还不包括估计约500倍于 可见网页的深度网页(deep web)[3],如动态网页或搜索引擎无法到 达的网页。 网页之间或者具有链接的关系,或者毫无关系、或者短 期内消失。 因此,要全面地搜集和管理网络信息,并不是一件容易 的事情。 要有效地搜集信息,需要对万维网信息的组织结构进行深 入的学习和了解。 掌握了网络信息的组织结构和特点,就可以采用 相应的对策和方法尽可能全面地来搜集这些信息了。
序等。 目前Web最主要的信息资源组织方式是HTML文档。 HTML(HyperText Markup Language)是超文本标记语言,它由一 系列的标签(tag)组成,说明网络信息的具体内容及网络信息的 表现形式。 HTML文档的名字后缀一般是htm或html。 HTML文档 包含的信息内容可以通过Web浏览器(Browser)来显示。 Web浏 览器可以对HTML文档进行解析,并将内容按照标签指示,在浏 览器中一页页地显示出来。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

访问方式

限校园网用户 通过访问我校图书馆主页,然后点击电子资源, 找到超星数字图书馆
超星电子图书镜像网站首页
下载之前必须下载相应的浏览器
如何找书(图书全文数据库)
分类浏览 图书检索
超星数字图书馆-分类浏览



在超星主页的图书馆分类下选择书籍对应的分 类 依次进入二级分类、三级分类等,直至显示书 目 在本分类下的书目中选择自己需要的书籍


访问超星数字图书馆,查找计算机网络安全方 面的图书一本;摘录其中第11页的第一段文字, 存放在word文档中。另外,进行如下试验: 在该图书的某一页,使用红色试验相关的多种 标注方法(批注、铅笔、直线、圈、高亮)。 在超星数字图书馆中,查询并下载一本自己喜 欢的电子图书。
1. 2.
3.
OPAC的种类: 按收录文献的类型,OPAC可分为图书联合目 录,期刊联合目录,会议文献联合目录等; 按收录文献的语种,OPAC可分为中文图书查 询系统,西文图书查询系统,中文期刊查询系 统,西文期刊查询系统等; 按反映文献入藏单位的多少,OPAC又可分为 馆藏目录查询系统和联合目录查询系统
电子图书的特点 a. 亲切的感受能力 b. 强大的检索功能 c. 真正的资源共享 d. 便捷的资源利用 e. 稳定性

电子图书系统 图书高速扫描系统(BHSSS) 纸介质出版物数字化处理系统(PPDPS) 网络图书阅读、评估与信息交换系统 (NBREIES)
a. b. c.
国内著名的电子书商

读秀的学术搜索功能

读秀的图书搜索 读秀的全文搜索 读秀的多面搜索
读秀文献传递
读秀文献传递
读秀的全文搜索


传统的检索阅读方式:先找到图书—阅读图 书—找到知识 读秀全文检索方式:先找到知识—通过显示 知识来源—获得图书。 读秀是把所有图书打碎,以章节为基础重新 整合在一起的海量数据库
图书的分类

分类,是信息资源组织的重要方式,是浏览信 息集合内容的重要方式之一。
几种主要的文献信息(图书)分类法


国内 《中国图书馆分类法》[中图法] 《中国科学院图书馆图书分类法》[科图法] 《中国人民大学图书馆图书分类法》 [人大法] 《中国图书分类法》台湾赖永祥编订 国外 《杜威十进分类法》[DDC] 《国会图书馆分类法》[LCC]
超星数字图书馆-图书检索
初级检索 高级检索
初级检索页面
高级检索页面
如何管理图书
下载图书 阅览图书
图书下载方式

1.匿名下载 匿名下载的图书只能在本机上阅览 2. 非匿名下载 注册用户名,用该名登录后,下载的图书可以 带到任何一台机器上阅览

匿名下载
阅览图书
课后思考与练习



在超星数字图书馆中查找有关鲁迅的书,要求 下载到本地桌面。 利用互联网络或超星数字图书馆,查找池莉的 作品——《你是一条河》的电子文本,将其下 载到个人的手机中进行阅读。 如何将在本地机上下载的超星数字图书馆中某 本书传给非本地用户或读者使用?如何对方接 收的是乱码,该如何解决这个问题?

读秀的全文搜索


很多知识都是沉淀在书中,以图书为单元的 文献检索是做不到对具体知识的挖掘。任何一 句诗词、任何一句古文、任何一句名言乃至任 何一个知识点,都可以在读秀找到出处、前后 语。 读秀将所有的图书打碎,以章节为基础,把 所有的图书变成了一本书,一部最大的百科全 书,一部6亿页的图书
《中图法》结构示意图
等级分类体系
二、书刊目录检索系统OPAC
OPAC,全称为Online Public Access Catalogue System,公共联机书目查询系统。 它反映各种文献入藏情况的书目数据库,是目 前国内外文献信息服务机构的书目网上查询的 通用模式。它利用计算机终端来查询基于图书 馆局域网内的馆藏数据资源的一种现代化检系统
三、电子图书检索

电子图书概述 电子图书是继纸质印刷出版物之后出现的 一种全新的图书类型,它以二进制数字化形式 对图书文献进行处理,以光磁等介质为记录载 体,以信息的生产、传播和再现的形式代替传 统印刷型图书的制作发行和阅读,是一种新型 的的媒体工具。读者可以利用计算机进行检索 和阅读。

阅览器的功能
1. 2. 3. 4. 5.
打开图书 摘录引用(文字识别、图片截取) 标 注 书 签 目次检索
打开已下载到分类目录下的图书
打开已拷贝到磁盘上的图书
摘录引用(文字识别、图片截取)
书签
目次检索
超星读秀

什么是读秀?
从超星到读秀 超星即超星数字图书馆是目前国内最大的全文
超星数字图书馆 书生之家 方正apabi
超星数字图书馆

数据库介绍 2000年6月8日,超星数字图书馆入选国家863计划 中国数字图书馆示范工程, 参与了国家数字图书馆战 略。 到今日超星图书馆超星成为全球最大的中文数字化 图书馆,是国内数字图书馆第一品牌。 它加工能力最快,使用用户最多,技术最为成熟, 专业资源最为权威,市场占有率也最大。
数字图书馆系统,读秀(知识库)是其开发的一个新产品。读秀 知识库是海量中文学术资源组成的庞大知识库系统。其以6亿页 中文资料为基础,为读者提供深入图书内容的章节和全文、部分 文献试读、文献传递等多种功能。 读秀致力于为用户提供全面特色的数字图书馆整体解决方案 和资源功能整合服务,为广大读者打造一个获取知识资源的捷径。
读秀的多面搜索

读秀基于元数据整合的多面搜索,将零散的知 识整合在一起,突破了图书的界限,可以在期 刊、报纸、网页、工具书、视频等中找到相同、 相关内容。
读秀学术搜索小结


读秀学术搜索不是以检索单体文献为根本目标, 而是以检索文献所包涵的知识为根本目标,是 将各类文献中所包涵的同一内容知识检索出来。 读秀围绕关键词进行全面、发散式的搜索, 其检索结果显示本关键词以及与关键词相关的 所有知识点。免除了读者反复查找、确认的过 程,为研究型读者提供最便捷的知识获取途径。
为什么要用读秀?
理想的图书馆系统


读秀提供了260万种图书,并且每年以十几万 种新书增加。 读秀学术搜索能将检索结果与馆藏各种资源库 对接,读者检索任何一个知识点,都可以直获 取图书馆内与其相关的纸质图书、电子图书全 文等。



读秀具有强大的搜索引擎功能,可深入到章节 中进行知识、内容的深度搜索。 读秀能提供封面页、版权页、前言页、目录页 及试读页,清楚地判断所需图书。 读秀通过文献传递,直接将相关学术资料发送 到读者邮箱,使读者零距离获取珍稀学术资源。
第三章中文图书检索
一、基础知识 ---图书与ISBN号

图书:一般不少于49页并构成一个书目单元的文献(情 报与文献工作词汇.传统文献GB13143-91) ISBN号: – 7-301-10446-4,由10位数字组成(2007年), 分为四段,分别代表地区或语种-出版社(北京大 学)-书号-校验码 – 978-7-03-016251-X由13位数字组成,分别代表 GS1前导-地区或语种-出版社(北京大学)-书号-校验 码 GS1--国际物品编码协会 , 978-979 ISBN书码
相关文档
最新文档