分子生物学数据库
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
陈成
一、国内的一些有针对性的数据库
BIOSINO
我国的核酸序列公共数据库
更像是一个论坛,有一些提问,互动等功能,信息的筛选也不是特别的严格。但是规模较小
0条记录可以看出网站的维护和使用都不怎么频繁。
其他许多网站也没有明显的巨大差距。
二、国内的一些大型数据库
中国知网
大部分高校已经购买了它的资源,是国内较权威、全面的数据库。主要是文献下载,不针对我们实验过程中对数据遇到问题时的解答。
冀鼎觉SciFinder
SciFinder使用简介
SciFinder Scholar是美国化学学会(ACS)旗下的化学文摘服务社CAS (Chemical Abstract Service)所出版的《Chemical Abstract》化学文摘的在线版数据库学术版。其内容涵盖应用化学、化学工程、普通化学、物理、生物学、生命科学、医学、聚合体学、材料学、地质学、食品科学和农学等诸多领域。
/products/scifinder/
SciFinder是可以与交大图书馆相连的,在找到文献时,可以直接连接到交大图书馆进行检索帮助。
下面以检索Molecular Dynamics为例简单解释其使用。
在登进SciFinder之后会进入检索界面。上图即为SciFinder的文献检索界面,可以对文件类型,语言,作者等信息作初步筛选。除此之外也可以看到左面可以选择对作者,公司,杂志,专利进行直接检索。
在搜索之后会出现题目和内容相关两种文献分类,如我们选择内容相关Molecular dynamics,点进Get Reference。
这是检索完成的结果。我们可以看到,在Reference字样之后又Getsubstances等字样,我们可以通过这些选项获取选定文献中相关的物质、反应、相关的引用及被引用等。在右侧可以看到Analysis以及Refine选项。现在显示的是Analysis中的Journal Name选项,可以看到对于MD来说,JCP, JPC, Biochemistry, JACS等杂志具有较多的信息。除此之外,还有对作者,公司的分析,为我们对相关内容的行业情况的了解提供了方便。
Refine即对相关文献进行提炼,即对标题,语言等选项进行选择。如图为对选中的文献进行refine,选择出是中文的文献。
Explore Reference模块大致就是如此。除此之外的对物质及反应的搜索模块Explore Substances和Explore Reactions的界面类似,同样十分友好,大家可以自行探索。
刘士毅UCSC Genome Bioinformatics
UCSC Genome Bioinformatics /
5100809083 刘士毅
这是一个非常常用的基因搜索工具,包含了许许多多实验室最新的测序结果。
这是基因搜索界面,可以定位想要搜索的基因的位置
进到如上界面时我们可以通过界面看到所有不同结果(左列)在基因区域的分布
子项供选择
彭思杰IntAct
链接:/intact/
介绍:EBI下的一个蛋白质互作信息数据库,里面包含了模式生物以及常见生物的蛋白质互作信息。除了通过搜索查找蛋白质互作的信息,IntAct还提供了一些tools:Proviz和Validator,前者用于图形可视化,后者未使用过,所以不是很清楚。这两个软件以及数据库的资料都可以免费在ftp中进行下载。
如上图就是IntAct的一个搜索结果界面。里面包括了参与反应的两个分子以及反应类型等信息,左上角也提供了各种格式的结果下载,可以进行批量下载。
沈方舟InterPro
InterPro:/interpro/
简介:
InterPro
是大型综合生物信息学数据库EMBL-EBI 下属的一个数据库,该
数据库的功能是蛋白质序列分析与分类,该数据库通过多种特征将蛋白质按家族分类并且预测域(domain)和功能性位点。InterPro 可以提供域、蛋白质家族
及位点的相关信息。
数据库使用:
1. 网页搜索:
如下图所示,直接搜索ID 可以得到ID 的相关信息,包括综述、相关蛋白质、域组织、通路与相互作用、物种、结构、文献和交叉引用。InterPro 支持搜索的ID 除了其自身数据库的ID,还可以用pfam(蛋白质域数据库)或GO(基因注释)的ID 进行搜索。
除此之外,InterPro 还支持关键字搜索,如下图所示,搜索关键字的结果一
般会有许多结果。从图中左侧可以看出InterPro 所包含的信息有四种,包括蛋白质家族、域、蛋白质重复和位点。另外右上的show
more
data 可以链接到EMBL
-EBI 以获取更多的相关信息。
最后,作为作为蛋白质序列分析的数据库,InterPro 也支持直接分析蛋白质序列,下图是序列搜索结果的页面。
2. 数据下载
除了在网页上搜索外,要获得更多的数据可以登陆其FTP 进行下载。
石逸飞Manet数据库
Manet数据库的介绍
Manet数据库很小,它的的特点是提供定性和定量的生物系统中分子相互作用的网络。而且,这个数据库对蛋白结构的进化非常感兴趣,事实上,这正是这个数据库一开始建立的目的,那就是查找某个代谢的酶的祖先和代谢本身的进化途径。而现在,这个网站和多个知名的生物代谢网络网站都有合作,比如KEGG和SCOP,对于文献中每一个蛋白或者酶,都提供KEGG的具体说明。
目前它的引用文献只有九篇。
其网址是。
张少博CAZY数据库
全称:Carbohydrate-Active enZYmes databases
链接:/
是一个专门用来收集,研究碳水化合物活性酶的基因组,结构生化信息的数据库。是一个专门领域研究的人比较常用的数据库。目前,有5个大的家族在数据库中。使用比较简单。
对每一个大家族的信息很详细,而且分类做的很好。
每一个大的家族下的一个小的家族为例,对这些分类也很做的很详细,分为了细菌,真菌,有结构的酶。而且每个酶都提供了基因,结构的链接(到genbank,uniprot,pdb等数据库)