文献检索-互联网信息检索
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
检索 文本框
Suggest Google
• Suggest Google beta (www.google.com/webhp?complete=1&hl=en)
资源:网络时代信息资源
局域网内使用
纸质印刷期刊 的书目信息
任何上网终端上使用
可见信息
有使用权的 网络数据库
馆藏书刊Biblioteka Baidu
不可见 资源 互联网上的 免费信息资源
馆内纸质印刷期刊的书目信息
馆内的电子资源
馆内的电子资源
• 中文电子期刊: 维普中文科技期刊 VipBrowser 浏览 下载 万方数据库— 数字化期刊 Acrobat Reader 浏览 下载 • 电子图书: 超星电子图书21万册 需事先注册 以后用户名 密码 登陆 浏览图书
• •
1基本概念
• 统一资源定位器件(URL): URL代表了互联网上一切资源,包括上网计算机及 其各种文件的地址。 格式为:Protocol://host.[:port]/path/filename 例如: http://www.shu.edu.cn/Get/school_notice/index.htm
p.116
1 基本概念——网上信息资源的类型
• 按照是否属于搜索引擎检索范围
搜索引擎
可 见 信 息 不 可 见 信 息
1 基本概念——网上信息资源的类型
可见信息(静态网页)
1 基本概念——网上信息资源的类型
不可见信息
1 基本概念——网上信息资源的类型
不可见信息
1基本概念
• 超文本标识语言(HTML):为WWW建立超文本文件的 语言。 • 超文本文件:文本中的某些内容通过被称为链接项 (由高亮度,下划线或编号来标识)的一些词和其它 文本或文件连接起来,也就是说,超文本文件是指 含有多个指向其它文本、图像、声音或动画文件的 指针,使它们连接在一起的文件。普通文本文件和 印刷性文献的内容以线性排列,知识点之间固有的 网状联系无法予以体现。
p.118
1基本概念
• 网站和网页 网页是HTML或DHTML,XML等语言写成的文本文件 网站是有独立的域名,由若干相关网页组成的一 个站点。 互联网协议(IP)地址:互联网信息定位,每台 上网计算机都有一个惟一的IP地址,它的作用类 似于上网计算机在信息高速公路上的门牌号码。 域名(DN): 只有作为服务器的计算机才需要。 域名的作用类似于服务器在信息高速公路上的门 牌号码。如:www.shu.edu.cn p.117-118
本章要点
互联网信息资源组成 信息检索工具:搜索引擎
虚拟图书馆
学术网站的定义和类型
互联网实习要求
1 基本概念——信息资源的组成
• 计算机中的无数信息:数据库(一次、
二次、三次)、电子出版物、主页信息 、软件以及各种格式的文件。
• 网上的信息工具:E-mail、www 浏览器和搜索引擎等。 • 网络通信渠道
http:通信协议名称 www.shu.edu.cn主机地址;edu为教育机构 含义是浏览器采用http协议,从shu.edu.cn的www服务器 的80端口上(缺省)、路径为Gets/school_notice下的 index.htm文件。 p.118
2 网络信息检索工具
• 搜索引擎 工作方式区分 • 工作语种区分 • 检索内容区分 • 虚拟图书馆
1 基本概念——网上信息资源的类型
一次网络信息
1 基本概念——网上信息资源的类型
二次网络信息
新浪新闻中心
中国新闻网
1 基本概念——网上信息资源的类型
• 是否属于搜索引擎检索范围区分: 可见资源、不可见资源 可见资源:搜索引擎直接可搜索到的资源 含有HTML超链接
同时满足 三个条件: 没有设置口令或者IP限制 不属于动态产生的网页
工作方式—主题引擎
优点: 信息量大、更新及时、无需人工干预。
•
p.120
工作方式—主题引擎举例
• 国外代表: Google:http://www.google.com Excite:http://www.excite.com 国内代表: 百度:http://www.baidu.com
百度:http://www.baidu.com
互联网上数据库—三次文献 主题词表
• HASSET叙词表(www.data-archive.ac.uk/search/hassetSearch.asp)
互联网上数据库—三次文献 化学专业主题词
• Chemfinder(www.chemfinder.com)
1 基本概念——网上信息资源的特点
• 数量庞大、增长迅速 • 更新频繁、变化无常、分布散乱 • 良莠混杂
p.115
互联网上数据库—一次文献
• 中国专利数据库(全文) http://www.sipo.gov.cn • 美国专利数据库(全文) http://www.uspto.gov • 世界专利数据库(全文) http://gb.espacenet.com
互联网上数据库—二次文献
• 中国标准咨询网(题录) http://www.chinastandard.com.cn • 国际电工委员会网站(题录) http://www.iec.ch • 国际标准组织网站(题录) http://www.iso.ch
p.117
1 基本概念——网上信息资源的类型
• 出版类型区分:和印刷型出版物类似的对 应关系如:网络期刊,网络图书等。 • 原创性区分:一次资源、二次资源。 一次资源:首次发表的原创性信息。 二次资源:转载已有的信息。 • 有否经过审核区分:正式出版物(ISSN、 ISBN)、非正式出版物。 p.116
2 网络信息检索工具——搜索引擎
定义: 网上信息搜索工具的通称。 类型: 工作方式的不同:主题引擎、目录引擎和多元 工作语种:中文搜索引擎和外文搜索引擎 检索内容区分:门户网站搜索引擎 、垂直搜索 引擎 。 p.119
工作方式—主题引擎
又称基于Robot的搜索引擎
Robot → Index→ 搜索软件 Robot:自动访问Web站点 ,提取站点 上的网页 Index :Robot提取的网页被放入到Index 中以便建立索引(提取标题、说明语、网址) 搜索:网页与关键词之间的符合程度(关键词 在网页中出现的位置和频率)高低把 搜索结果(网页)送回到用户的浏览器中 p.119-121