化学信息学

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.什么是化学信息学?

化学信息学是信息科学与化学的交叉学科

利用数学、统计学与计算机科学的理论、方法和网络技术作为手段,研究化学信息的获取、表示、管理、传播、分析、加工和应用,在此基础上进行知识创新,促进化学学科的发展。

2.通用信息检索引擎功能:

(1)有简单易用,功能强大的前端界面,使得查询方式容易设定

(2)检索方式比较完备,可以按用户所需的方式进行查询

(3)检索结果具有较好的准确性和可读性,且检索速度较快。

通用信息检索引擎检索结果:题目,内容简介,URL地址等,由此可进行进一步检索,获得更详细内容。

通用信息检索引擎与化学化工专业网站的比较:

(1)通用信息检索引擎

优点:完全免费、使用简便、信息量大、范围广。

缺点:信息混乱度大,专业信息量不够。

(2)化学化工专业网站

优点:专业信息量大,针对性强,检索路径多。

缺点:多数是收费服务,信息面相对较窄。

三个常用通用信息检索引擎:

(1) Google (http://www. google .com)

(2) Yahoo()

(3)百度搜索()

3.查全率(R):利用检索系统进行某一课题检索时,检索出的相关信息量(w)与该系统信息库中存储的相关信息量(x)的比率。R = w / x * 100%

查全率是指检索出的相关信息资源与信息资源系统中相关信息资源总量之比,它反映该系统信息库中实有的相关信息量在多大程度上被检索出来。

查准率(P):利用信息检索系统进行某一课题检索时,检出的相关信息量(w)与检出信息总量(m)的比率。P = w / m *100%

查准率是指检索出的相关信息资源量和检索出的信息资源的总量之比。它反映每次从该系统信息库中实际检出的全部文献中有多少是相关的。

影响查全率的主要因素:

检索策略过于简单

选词和进行逻辑组配不当

检索途径和方法太少

检索人员对检索工具不熟悉

检索系统不具备反馈功能

检索时不能全面描述检索要求

影响查准率的因素:

索引词不能准确描述信息主题和检索要求,专指度不够

组配规则不严密

选词与词间关系不正确

检索面宽于检索要求等

4.信息检索的主要方法可归纳为:

普查法 — 一种常规信息检索方法

选择适当的工具(数据库)进行检索,正确地选择检索词,使用合适的逻辑算符组合关键词,构建一个合理的检索表达式由近及远进行检索

追溯法—包括引用追溯法:以某文献为出发点,根据文献原文上所列出的参考文献的信息,查找参考文献的原文;被引用追溯法:它是根据某一文献被其他文献引用来扩大检索范围的方法。

相关法—某些数据库带有相关检索功能,(如Web of Knowledge )对检索结果的某一个文献记录提供了Relative Records 的检索,得到引用相同的参考文献的其他文献记录。并根据参考文献的相同数目多少排列检索结果的文献记录,充分利用相关法,可大大地减少漏检率。

跟踪法—经过一定检索实践后,用户可获得相当有用的检索结果,可以收集到该研究领域中发表论文数量多且质量高的作者姓名,再使用作者姓名继续检索该专家的所有文献,从中挑选需要的部分,并定期跟踪该专家的最新研究成果

5.进行数据库检索时采用的相关技术,包括以下四种方法:

(1)逻辑算符检索

(2)位置检索

(3)截词检索

(4)限制检索

用逻辑算符编写检索表达式:

表示符号 检索表达式 检索结果 意义

逻辑与 “*”或“AND ” A AND B 检索词A 和B 要同时出现 逻辑与的使用缩小了检索

结果的数量,增强了检索的

专指性。

逻辑或 “+”或“OR ” A OR B 任意一个检索词出现即可 逻辑或的使用扩大了检索

结果的数量,可以提高检索

的查全率。

逻辑非 “-”或“NOT ” A NOT B A 出现且B 不能出现 使用逻辑非可以排除不需

要的概念,缩小了检索结

果,提高检索查准率。

使用复杂检索表达式时,要依照一定的优先顺序进行。

基本顺序:从左到右,有括号时,先执行最内层括号中的运算,再逐层向外进行。 不同数据库中NOT 、OR 、AND 的运算次序有不同的规定,但多数据库使用优先次序为NOT>AND>OR 。

例如:检索表达式: A AND B OR C NOT D = (A AND B) OR (C NOT D)

A OR

B AND

C NOT

D = A OR (B AND (C NOT D) )

用截词算符编写检索表达式:

截词检索也称词干检索或字符屏蔽检索,它是使用给定的词干做检索词,查找含

有该词干的全部检索词的文献记录。

截词检索隐含着逻辑或的关系,常用的截词符有“*”、“?”和“$”等,美国一般用“$”。

截词的类型有多种,按截断的字符数量可分为有限截断和无限截断。有限截断的截词符号用“?”表示,该符号只能代表一个任意字符。无限截断的截词符号用“*”表示,该符号可以代表多个任意字符。截词按截断部位可分为:左截断(前截断)是指检索词与被检索词之间的后部相同(后方一致);中截断(前后截断)是指检索词与被检索词之间只需中间部分相同(词头、词尾都可变化):右截断(后截断)指检索词与被检索词间的前部相同(前方一致)。

(1)后截断,前方一致。如:comput*表示computer,computers,computing等。(2)前截断,后方一致。如:*computer表示minicomputer,microcomputers等。(3)中截断,中间一致。如*comput*表示minicomputer,microcomputers等。(4)有限截断,CH2??O2 ,命中CH2BrO2 ,CH2ClO2

6.用Yahoo检索时,点Search返回三种信息:

(1)满足检索条件的Yahoo的目录(用户可以利用这些目录进行交叉引用)(2)满足检索条件的WWW网站

(3)含有网页索引的Yahoo目录

高级检索时,检索框各自代表的意思为:

all of these words 包含全部字词(包含以下全部的关键词AND

the exact phrase 包含完整字句(包含以下的完整关键词)AND

any of these words 包含至少一个字词(包含以下任意一个关键词)OR

none of these words 不包括字词(不包括以下关键词NOT

7.重要的化学化工综合网站:

(1)美国化学学会全文数据库网址:/

(2)中国期刊网网址:/

(3)万方数据库网址:/

(4)重庆维普网址:/

ChIN是国内主要的化学化工信息资源综合网站

功能:ChIN是一个关于Internet化学化工综合性资源的导航系统。 ChIN以对Internet化学化工资源进行系统研究为基础,注重对资源的评价和精选,并采用积累信息源知识的方法为资源建立了反映资源概貌和特征的简介页,并建立相关资源简介页之间的链接。除了导航系统通用的浏览模式外,可通过ChIN站点的快速检索和高级检索功能来定位自己感兴趣的内容。ChIN还提供基于数据库检索的最新内容查询功能,可随时了解ChIN中最新增加/更新的内容。ChIN还提供用户对某个资源进行打分和进行评论的接口等。

资源简介页:化学门户ChIN中每一条被索引的化学化工资源都有一个“资源简介”。它一方面对资源特点和概貌进行了概述,使您在访问远方的资源前做到心中有数;更重要的是每一个“资源简介”象一个小小的信息枢纽,它其中的分类、主题/关键词、相关链接,都是活的链接,点击这些链接可以快速地浏览更多与它相关的资源。这是化学门户ChIN独有的功能。

化学门户ChIN动态网页版的资源简介提供了完整的元数据及其自动检索功能,其中包括该资源所属的资源类型分类和学科领域分类、主题/关键词、相关链接。静态网页版的资源简介提供了主要的元数据及其自动检索功能,其中包括该资源

相关文档
最新文档