电子教案与课件:化学信息学 第三课
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
—Internet上的资源(一)
1
信息搜索引擎
通常来说,搜索引擎是指以 web 站 点存在,提供网址、网页、文章搜索 及综合服务的 Search Tools。
2
搜索引擎的原理
图3-1 搜索引擎基本结构
3
搜索引擎的历史
1990年加拿大麦吉尔大学(University of McGill)计算机学院的师生开发了一个 软件,Archie。该软件通过定期搜集并 分析FTP系统中存在的文件名信息,提 供查找分布在各个FTP主机中文件的服 务。
28
图3-7 BASE主页
SciTech Connect
SciTech Connect是由美国能源部(DOE)下属的科学与 技术信息办公室(OSTI)开发维护的搜索工具
图3-9 SciTech Connect 主页
29
CiteSeerX
CiteseerX 是CiteSeer的换代产品。1997年,CiteSeer引 文搜索引擎由美国普林斯顿大学NEC研究院研制开发。
13
搜索引擎分类
缺点: 目录库相对较小,更新较慢。
14
元搜索引擎
元搜索引擎在接受用户查询请求的同 时从其他多个引擎上进行搜索,并将 结果返回给用户。著名的元搜索引擎 有InfoSpace、Dogpile、Vivisimo等, 中文元搜索引擎中具有代表性的有搜 星搜索引擎。
15
垂直搜索引擎
垂直搜索引擎是针对某一个行业的专 业搜索引擎,是搜索引擎的细分和延 伸,是对网页库中的某类专门的信息 进行一次整合,定向分字段抽取出需 要的数据进行处理后再以某种形式返 回给用户。
逻辑 “ 或 ” ——“,”,OR,空格 Chemistry OR Computer OR Software
逻辑 “ 非 ” —— - ,NOT Chemistry - Computer
23
关键字索引查询
4. 查询范围限制 范围限制功能,可以使我们在某一范 围内查询和搜索指定的关键词。
24
关键字索引查询
16
搜索引擎查询方法
搜索引擎一般提供两种查询方式。 1. 关键字索引查询。 2. 分类细化逐步接近查询。
17
关键字索引查询
1. 模糊查询。 模糊查询又称智能查询。查询的结果 一般按查询语句和查询结果的相关度 排列。
18
关键字索引查询
19
关键字索引查询
2. 精确查询。 如果想精确的只查某个关键词则可使用 精确查询功能。精确查询一般是在文字 框中输入关键词时,在词组和/ /
26
常用的学术搜索引擎
BASE SciTech Connect CiteSeerX
27
BASE
BASE是德国比勒费尔德(Bielefeld)大学图书馆在200 2年开发的一个多学科的学术搜索引擎,对全球提供异 构学术资源的集成检索服务。
4
搜索引擎的发展趋势
专业化 智能化 个性化 多媒体化
5
搜索引擎的定义及分类
搜索引擎(Search Engine)是一个对互 联网资源进行搜索整理和分类,并储 存在网络数据库中供用户查询的系统, 包括信息搜索、信息分类、用户查询 三部分。
6
搜索引擎的定义及分类
按其工作方式主要可分为四种: 全文搜索引擎(Full Text Search Engine) 目录索引类搜索引擎(Search Index/Dire ctory) 元搜索引擎(Meta Search Engine) 垂直搜索引擎(Vertical Search Engine)
边加双引号。
20
关键字索引查询
21
关键字索引查询
3. 逻辑查询。 模糊查询会将符合一个查询语句中的 每一个查询词的信息资源都列出来, 而精确查询将引号内的词作为一个词 组来处理。
22
关键字索引查询
3. 逻辑查询。 查询符号:
逻辑 “ 与 ” —— +,AND,& Chemistry + Computer + Software
32
图3-12 Excite主页
常用的元搜索引擎---Ixquick
Ixquick是一个跨资料库的搜索引擎
图3-13 Ixquick主页
33
专业搜索引擎
优点:针对性强,准确度高,信息 质量高,检索时间短等优点。
34
著名的专业搜索引擎
CollectionBuildingProgram(CBP) Google scholar Scirus Focused Project 化工引擎(chemYQ) ChemIndusty
10
搜索引擎分类
分类目录式搜索引擎 提供一份按类别编排的国际 Internet 网站 目录,类别下边,排列属于这一类别的网 站的站名和网址链接。
11
搜索引擎分类
12
搜索引擎分类
优点: 信息系统的分门归类,用户可以方便的找 到某一大类的信息。由于主题检索得到的 信息已精心的组织过,主题较准确的描述 了所检索的内容。
30
图3-10 CiteseerX 主页
常用的元搜索引擎---Dogpile
Dogpile是1996年1月创建的一个并、串行相结合的元搜索 引擎
31
图3-11 Dogpile主页
常用的元搜索引擎---Excite
Excite 是1993年2月由斯坦福大学创建的Architext扩 展而成的万维网搜索引擎,其最主要的特点是能够对 检索词进行“智能概念提取”来提高它的查全率。
7
搜索引擎分类
全文搜索引擎 是一个通过大型的信息数据库来收集和组 织 Internet 资源的 web 站点,提供的索引 方式包括确定的单词和词组来选择文本。
8
搜索引擎分类
9
搜索引擎分类
特点:
大小不一。 用户需要限制检索的范围。 更新及时。 检索结果不一致。 检索结果缺乏准目的地删除某些 无关网页,但减号之前必须留一空格, 语法是"A -B"。例如:要搜寻关于“化 学”,但不含“国外”的资料,可使用如 下查B”来搜索“包含 关键词A,或者包含关键词B”的网页, 例如:使用“化学|物理精品课程”, 搜索化学或物理方面的精品课程。
1
信息搜索引擎
通常来说,搜索引擎是指以 web 站 点存在,提供网址、网页、文章搜索 及综合服务的 Search Tools。
2
搜索引擎的原理
图3-1 搜索引擎基本结构
3
搜索引擎的历史
1990年加拿大麦吉尔大学(University of McGill)计算机学院的师生开发了一个 软件,Archie。该软件通过定期搜集并 分析FTP系统中存在的文件名信息,提 供查找分布在各个FTP主机中文件的服 务。
28
图3-7 BASE主页
SciTech Connect
SciTech Connect是由美国能源部(DOE)下属的科学与 技术信息办公室(OSTI)开发维护的搜索工具
图3-9 SciTech Connect 主页
29
CiteSeerX
CiteseerX 是CiteSeer的换代产品。1997年,CiteSeer引 文搜索引擎由美国普林斯顿大学NEC研究院研制开发。
13
搜索引擎分类
缺点: 目录库相对较小,更新较慢。
14
元搜索引擎
元搜索引擎在接受用户查询请求的同 时从其他多个引擎上进行搜索,并将 结果返回给用户。著名的元搜索引擎 有InfoSpace、Dogpile、Vivisimo等, 中文元搜索引擎中具有代表性的有搜 星搜索引擎。
15
垂直搜索引擎
垂直搜索引擎是针对某一个行业的专 业搜索引擎,是搜索引擎的细分和延 伸,是对网页库中的某类专门的信息 进行一次整合,定向分字段抽取出需 要的数据进行处理后再以某种形式返 回给用户。
逻辑 “ 或 ” ——“,”,OR,空格 Chemistry OR Computer OR Software
逻辑 “ 非 ” —— - ,NOT Chemistry - Computer
23
关键字索引查询
4. 查询范围限制 范围限制功能,可以使我们在某一范 围内查询和搜索指定的关键词。
24
关键字索引查询
16
搜索引擎查询方法
搜索引擎一般提供两种查询方式。 1. 关键字索引查询。 2. 分类细化逐步接近查询。
17
关键字索引查询
1. 模糊查询。 模糊查询又称智能查询。查询的结果 一般按查询语句和查询结果的相关度 排列。
18
关键字索引查询
19
关键字索引查询
2. 精确查询。 如果想精确的只查某个关键词则可使用 精确查询功能。精确查询一般是在文字 框中输入关键词时,在词组和/ /
26
常用的学术搜索引擎
BASE SciTech Connect CiteSeerX
27
BASE
BASE是德国比勒费尔德(Bielefeld)大学图书馆在200 2年开发的一个多学科的学术搜索引擎,对全球提供异 构学术资源的集成检索服务。
4
搜索引擎的发展趋势
专业化 智能化 个性化 多媒体化
5
搜索引擎的定义及分类
搜索引擎(Search Engine)是一个对互 联网资源进行搜索整理和分类,并储 存在网络数据库中供用户查询的系统, 包括信息搜索、信息分类、用户查询 三部分。
6
搜索引擎的定义及分类
按其工作方式主要可分为四种: 全文搜索引擎(Full Text Search Engine) 目录索引类搜索引擎(Search Index/Dire ctory) 元搜索引擎(Meta Search Engine) 垂直搜索引擎(Vertical Search Engine)
边加双引号。
20
关键字索引查询
21
关键字索引查询
3. 逻辑查询。 模糊查询会将符合一个查询语句中的 每一个查询词的信息资源都列出来, 而精确查询将引号内的词作为一个词 组来处理。
22
关键字索引查询
3. 逻辑查询。 查询符号:
逻辑 “ 与 ” —— +,AND,& Chemistry + Computer + Software
32
图3-12 Excite主页
常用的元搜索引擎---Ixquick
Ixquick是一个跨资料库的搜索引擎
图3-13 Ixquick主页
33
专业搜索引擎
优点:针对性强,准确度高,信息 质量高,检索时间短等优点。
34
著名的专业搜索引擎
CollectionBuildingProgram(CBP) Google scholar Scirus Focused Project 化工引擎(chemYQ) ChemIndusty
10
搜索引擎分类
分类目录式搜索引擎 提供一份按类别编排的国际 Internet 网站 目录,类别下边,排列属于这一类别的网 站的站名和网址链接。
11
搜索引擎分类
12
搜索引擎分类
优点: 信息系统的分门归类,用户可以方便的找 到某一大类的信息。由于主题检索得到的 信息已精心的组织过,主题较准确的描述 了所检索的内容。
30
图3-10 CiteseerX 主页
常用的元搜索引擎---Dogpile
Dogpile是1996年1月创建的一个并、串行相结合的元搜索 引擎
31
图3-11 Dogpile主页
常用的元搜索引擎---Excite
Excite 是1993年2月由斯坦福大学创建的Architext扩 展而成的万维网搜索引擎,其最主要的特点是能够对 检索词进行“智能概念提取”来提高它的查全率。
7
搜索引擎分类
全文搜索引擎 是一个通过大型的信息数据库来收集和组 织 Internet 资源的 web 站点,提供的索引 方式包括确定的单词和词组来选择文本。
8
搜索引擎分类
9
搜索引擎分类
特点:
大小不一。 用户需要限制检索的范围。 更新及时。 检索结果不一致。 检索结果缺乏准目的地删除某些 无关网页,但减号之前必须留一空格, 语法是"A -B"。例如:要搜寻关于“化 学”,但不含“国外”的资料,可使用如 下查B”来搜索“包含 关键词A,或者包含关键词B”的网页, 例如:使用“化学|物理精品课程”, 搜索化学或物理方面的精品课程。