药物基因组学相关数据库
生物信息学数据库分类整理汇总
生物信息学数据库分类整理汇总生物信息学数据库是存储和管理生物学领域的大量数据的重要工具和资源,对于生物信息学研究、基因组学、蛋白质组学、转录组学等领域的研究具有重要的意义。
本文将对生物信息学数据库进行分类整理和汇总,方便生物信息学研究者更好地使用和了解这些数据库。
1.基因组数据库:- GenBank:美国国家生物技术信息中心(NCBI)维护的基因序列数据库,包含已知基因的核酸序列。
- Ensembl:英国恩格斯尔基因组项目维护的一个综合性基因组数据库,包含多种物种的基因组数据。
- UCSC Genome Browser:加利福尼亚大学圣克鲁兹分校开发的一个基因组浏览器,提供多种物种的基因组序列和注释信息。
2.蛋白质数据库:- UniProt:一个综合性的蛋白质数据库,集成了多个蛋白质序列和注释信息资源。
- Protein Data Bank (PDB):存储大量已解析的蛋白质结构数据的数据库,提供原子级别的结构信息。
- Protein Information Resource (PIR):收集和整理蛋白质序列、结构和功能信息的数据库。
3.转录组数据库:- NCBI Gene Expression Omnibus (GEO):存储和共享大量的高通量基因表达数据的数据库。
- ArrayExpress:欧洲生物信息学研究所(EBI)开发的一个基因表达数据库,包含多种生物组织和疾病的表达数据。
4.疾病数据库:- Online Mendelian Inheritance in Man (OMIM):记录人类遗传疾病和相关基因的数据库。
- Orphanet:收集和整理罕见疾病和相关基因的数据库。
5.代谢组数据库:- Human Metabolome Database (HMDB):一个综合性的人类代谢物数据库,包括代谢产物的结构和功能信息。
- Kyoto Encyclopedia of Genes and Genomes (KEGG):包含多种生物体代谢途径的数据库。
PharmGKB数据库使用方法及常见问题
PharmGKB数据库使用方法及常见问题数据库简介:PharmGKB是一个综合资源,可为临床医生和研究人员提供有关遗传变异对药物反应影响的知识。
也是一个免费使用的资源。
官网首页可输入关键字进行检索第一种:以“药物通用名”为关键字进行检索——最常用(往往对药物更熟悉)第二种:以“基因名”或“基因变体”或“rs号”为关键词进行检索——在已知基因名、基因变体或rs 号的前提下输入关键字后点击搜索点击临床注释按照证据等级由高到低,依次分析即可常用的2种检索方法查询步骤以查询阿司匹林药物相关基因为例演示第一种检索方法1、进入pharmgkb官网,输入“aspirin”,然后点击右侧搜索图标。
2、找到药物“aspirin”,然后点击下面的“临床注释”以查询阿司匹林药物相关基因为例3、该列表显示了PharmGKB收录的与阿司匹林药物效应相关的所有基因及基因变体,并按照“证据等级”由高到低顺序。
接下来点击“现在阅读”进入详情页,对每个基因变体进行具体分析。
证据等级变体基因分子(大多是药物)4、在详情页可见,该基因的G变体影响阿司匹林的疗效。
演示以“三原则”分析PTGS1(rs10306114)变体详情页下拉即可看到PharmGKB引用的证据文献,对此可进行更详细全面的解读,以进一步确定“临床意义的一致性”第二种检索方法演示以rs号为关键字检索时,会在列表页显示与该变体相关的所有药物的信息,见红框。
你可能关心的问题1、PharmGKB是否具有PubMed的所有药物基因组学文章?•不会。
PharmGKB管理者会定期从主要药物基因组学期刊以及在整理VIP和途径的文献综述过程中发现的个别文章中手动整理文章。
证据文献列表中的文章集并不代表PubMed中的全部药物基因组学文献。
2、手动整理哪些数据?•临床注释,基于基因型的临床指南,药物标签注释,变体注释,单倍型,VIP摘要,药物途径,文献注释和药物遗传学摘要等。
3、如果我看到数据错误该怎么办?•请使用页面上的“反馈(信封图像)”按钮与我们联系,说明显示错误的信息,并描述问题。
disgenet筛选标准
Disgenet是一个基于网络的药物基因组学数据库,旨在提供一个集中的、综合性的工具,以研究基因在疾病发展中的作用。
在Disgenet中,疾病靶点筛选需要依据一系列标准,这些标准主要包括以下几个方面:
1.基因功能研究:通过基因敲除、转基因、基因编辑等实验方法研究基因在生
物体内的功能以及在疾病发展中的可能角色。
2.基因变异与疾病关联:研究基因变异与疾病的关联,包括变异类型、频率、
分布等,以确定与特定疾病相关的基因变异。
3.药物靶点研究:通过研究药物与基因的相互作用,确定药物的作用机制和靶
点,为药物研发提供参考。
4.基因组学和表观遗传学研究:综合利用基因组学和表观遗传学的研究方法,
全面了解基因在疾病发展中的调控机制。
总之,Disgenet的疾病靶点筛选标准综合考虑了基因功能、变异、药物靶点以及基因组学和表观遗传学等多方面的研究结果,为药物研发提供了重要的参考依据。
phyzome植物比较基因组数据库原理
phyzome植物比较基因组数据库原理
Phytozome是一个高质量的植物比较基因组数据库,用于存储
和比较各种植物基因组数据。
它的主要原理是通过整合各种来源的植物基因组序列数据,进行注释和比较分析,以便理解基因组的结构和功能。
具体来说,Phytozome通过收集不同植物物种的基因组数据,
包括DNA序列、基因预测和注释信息,进行综合分析。
该数
据库使用现代的基因组学和生物信息学技术,支持多种比较和数据挖掘工具,以便深入研究植物基因组的结构、功能和演化。
Phytozome数据库的主要目的是方便对植物基因组数据的访问
和分析,以推进植物生物学领域的研究和应用。
它提供了许多分析工具和资源,包括基因家族分析、表达谱分析、基因组可视化等,支持用户进行个性化基因组分析和研究。
总之,Phytozome植物比较基因组数据库的原理是通过整合多
种植物基因组数据,进行注释和比较分析,以便理解基因组的结构和功能,进而推进植物生物学领域的研究和应用。
药物基因组学相关大数据库
药物基因组学数据库1、Drugbank.drugbank.ca/2、dgidb/3、pharmGKBhttps:///4、cancercommoncancercommon./5、ChEMBLhttps:///chembldb/6、mycancergenome/7、TTD.sg/group/cjttd/8、guidetopharmcology/9、clearityfoundation/10、CIViChttps:///#/home11、DoCM/1 Drugbank药物和药物靶标资源库。
DrugBank是一个独特的生物信息学/化学信息学资源,它结合了详细的药物(例如化学制品)数据和综合的药物靶点(即:蛋白质)信息。
该数据库包含了超过4100个药物条目,包括超过800个FDA认可的小分子和生物技术药物,以及超过3200个试验性药物。
此外,超过1.4万条蛋白质或药物靶序列被到这些药物条目。
每个DrugCard条目包含超过80个数据域,其中一半信息致力于药物/化学制品数据,另一半致力于药物靶点和蛋白质数据。
许多数据域超到其他数据库(KEGG、PubChem、ChEBI、Swiss-Prot和GenBank)和各种结构查看小应用程序。
该数据库是完全可搜索的,支持大量的文本、序列、化学结构和关系查询搜索。
DrugBank的潜在应用包括模拟药物靶点发现、药物设计、药物对接或筛选、药物代谢预测、药物相互作用预测和普通药学教育。
DrugBank可以在www.drugbank.ca使用。
广泛应用于计算机辅助的药物靶标的发现、药物设计、药物分子对接或筛选、药物活性和作用预测等。
在查询中,每一种药物对应1个DrugCard,即我们所得到的检索结果。
每一个DrugCard都包含的数据信息分为药物、靶标和酶三部分。
药物信息包括了该药物的CAS号、商品名、分子式、分子量、SMILES、2D和3D结构、logP、logS、pKa、熔点、吸收性、Caco-2细胞穿透性、药物类别和临床使用、性质描述、剂型与给药途径、半衰期、体的生物转化、毒性、作用于哪些生物体、食物对服用的影响、与其它药物的相互作用、作用机理、代谢途径、药理学特征、与蛋白质的结合情况、溶解度、物质形态、同义词、关于合成的相关文献等,还与ChEBI、GenBank、PubChem等外部数据库有。
常用的生物数据库(一)
常用的生物数据库(一)引言概述:本文将介绍一些常用的生物数据库,这些数据库在生命科学研究中起到了重要的作用。
生物数据库是存储和管理生物学数据的平台,为科学家们提供了丰富的数据资源,便于他们进行进一步的研究和分析。
在本文中,我们将介绍五个常用的生物数据库,分别是A数据库、B数据库、C数据库、D数据库和E数据库。
正文:一、A数据库1. A数据库是一个广泛应用于基因组学研究的生物数据库。
2. A数据库提供了大量的基因序列和蛋白质序列,以及与这些序列相关的注释信息。
3. A数据库还提供了丰富的基因组数据和表达数据,可以帮助研究人员了解基因的功能和调控机制。
4. A数据库还提供了工具和资源,用于基因组比较和功能注释分析。
5. A数据库不仅仅适用于基础研究,也为生物技术和药物开发提供了重要的数据支持。
二、B数据库1. B数据库是一个专门用于蛋白质相关研究的生物数据库。
2. B数据库提供了大量的蛋白质序列和结构信息,以及与这些蛋白质相关的功能和互作信息。
3. B数据库还提供了工具和资源,用于预测蛋白质结构和功能,并对蛋白质相互作用网络进行分析。
4. B数据库不仅仅适用于基础研究,也为药物设计和生物工程提供了重要的数据支持。
5. B数据库的数据来源于多个实验室的研究成果,经过严格的质量控制和标准化处理。
三、C数据库1. C数据库是一个应用于植物研究的生物数据库。
2. C数据库提供了大量的植物基因组数据和表达数据,以及与这些数据相关的注释信息和功能注释分析结果。
3. C数据库还提供了工具和资源,用于植物基因功能分析和代谢途径研究。
4. C数据库不仅仅适用于基础研究,还为农业和生物能源领域的研究提供了重要的数据支持。
5. C数据库的数据来源于多个研究机构和实验室的合作项目,经过严格的数据收集和整理。
四、D数据库1. D数据库是一个广泛应用于微生物研究的生物数据库。
2. D数据库提供了大量的微生物基因组数据和表达数据,以及与这些数据相关的功能注释信息和分类信息。
kegg 解读
kegg 解读Kegg(Kyoto Encyclopedia of Genes and Genomes)是一个广泛被应用于生物信息学领域的数据库。
它的主要目标是将基因组、化学物质和其他生物大分子有机地整合在一起,为生物学家、生物信息学家和医学研究人员提供有关代谢途径、生物网络和相关信息的详细数据。
本文将对Kegg数据库进行解读,介绍其功能和应用。
一、Kegg数据库简介Kegg数据库是由日本京都大学生物信息中心创建和维护的一个综合性数据库。
它通过整合基因组、代谢物和附加信息,提供了生物学大分子的全面知识库。
Kegg数据库的内容包括基因功能、生物化学途径、代谢物结构和化学反应等。
目前,Kegg数据库涵盖了大量的物种,包括人类、动物、植物、微生物等。
二、Kegg数据库的功能1. 基因功能注释Kegg数据库提供了基因功能注释的工具和资源,帮助研究人员从大量的基因序列中识别和注释功能。
可以通过Kegg的基因分类方式,将基因按照功能进行分类,并提供详细的注释信息和功能预测。
2. 代谢途径分析Kegg数据库中包含了大量的代谢途径信息,可以帮助研究人员理解生物体代谢的整体框架。
通过Kegg的图谱展示和路径分析工具,可以可视化地展示代谢途径,并分析其中的关键代谢步骤和相互作用。
3. 疾病相关信息Kegg数据库还提供了与疾病相关的信息,包括疾病的发病机制、相关基因和蛋白质等。
对于研究人员来说,这意味着可以通过Kegg数据库寻找潜在的药物靶点和疾病相关的代谢通路,以及潜在的治疗策略。
4. 生物网络分析Kegg数据库中的生物网络信息可用于研究基因、蛋白质和代谢物之间的相互作用。
通过分析这些生物网络,可以揭示基因调控网络、蛋白质相互作用和信号转导途径等重要生物学过程。
三、Kegg数据库的应用1. 基因组学研究Kegg数据库为基因组学研究提供了宝贵的资源和工具。
研究人员可以利用Kegg的代谢途径信息,推断基因在代谢网络中的功能和相互作用,帮助揭示生物的生理和代谢特征。
NCBI功能详介
NCBI功能详介NCBI(National Center for Biotechnology Information)是美国国家生物技术信息中心,是全球最大的生物信息学数据库之一,也是生物医学研究领域最重要的资源之一、NCBI提供了广泛的生物学和医学数据库和工具,以帮助科学家们进行基因组学、蛋白质学、遗传学、药物研发等方面的研究。
NCBI的主要功能包括:1. PubMed:NCBI的PubMed是最大的生物医学文献数据库。
它收录了全球范围内的生物医学文献,并提供了非常强大的功能,以帮助科学家们找到自己感兴趣的论文。
3. BLAST:BLAST(Basic Local Alignment Search Tool)是NCBI 提供的一种重要的生物信息学工具。
它可以用来比对生物序列(如DNA、RNA或蛋白质序列),以找到相似的序列或已知的序列。
BLAST对生物学研究非常重要,可以用于序列比对、功能注释、物种分类等各种应用。
4. Entrez数据库:Entrez是NCBI提供的一种综合性数据库工具,可以用来访问和多个数据库,如PubMed、GenBank、Protein、Nucleotide等。
用户可以使用Entrez来查找和获取各种类型的生物学数据,如文献、序列、蛋白质结构等。
5. PubChem:PubChem是一个提供生物化学信息的数据库,包含大量的有关化合物的实验数据、化学结构、药物作用等信息。
它可以帮助研究人员进行药物发现、化合物筛选和毒性评估等方面的研究。
6. dbSNP:DBSNP(Single Nucleotide Polymorphism Database)是一个用于存储和查询单核苷酸多态性数据的数据库。
它收集了全球范围内各种不同物种的单核苷酸变异信息,包括单核苷酸变异的位点、变异类型、频率等。
7. GEO:GEO(Gene Expression Omnibus)是一个用于存储和共享基因表达数据的数据库。
生物学基因组学数据库的发展及其应用前景
生物学基因组学数据库的发展及其应用前景近年来,随着生物技术的快速发展,生物学基因组学数据库在生物学研究中起着越来越重要的作用。
基因组学数据库是存储和共享生物学基因组学数据的重要平台,通过整合、组织和分析大量的基因组数据,为研究者提供了研究基因功能和遗传变异的重要资源。
在本文中,我们将探讨生物学基因组学数据库的发展历程以及它们在生物学研究中的应用前景。
生物学基因组学数据库的发展可以追溯到上世纪80年代,当时人类基因组计划的启动为这一领域的快速发展奠定了基础。
自那时以来,越来越多的基因组学数据库相继建立起来。
其中最著名的数据库包括GenBank、EMBL和DDBJ等。
这些数据库收集了全球各地研究者提交的大量基因组数据,为研究人员提供了查找和共享基因组数据的重要工具。
此外,还有一些专门致力于特定物种的数据库,如Ensembl和NCBI的基因数据库,它们提供了特定物种的详细基因组信息,帮助研究者更深入地了解不同物种的基因功能和结构。
随着高通量测序技术的广泛应用,大量的基因组序列数据不断产生,这给基因组学数据库带来了巨大的挑战,即如何有效存储和处理这些大规模的数据。
为了应对这一问题,不断涌现出新的生物学基因组学数据库,包括GEO、ArrayExpress和SRA等。
这些数据库主要存储和管理生物学实验中获得的基因组数据,如基因表达数据、甲基化数据和复杂疾病的基因变异数据。
同时,还有一些数据库专门用于存储和共享人类疾病相关的基因组数据,如ClinVar和GWAS Catalog等。
这些数据库提供了研究人员进行生物学实验数据的挖掘和分析的重要资源,进一步促进了生物学研究的发展。
生物学基因组学数据库的发展不仅在基础生物学研究中发挥着重要作用,还在医学研究和临床实践中得到广泛应用。
基因组学数据库为研究人员提供了参考标准,帮助他们理解基因组中的变异,并研究它们与疾病之间的关联。
通过比较患者和正常人基因组数据的差异,研究人员可以发现特定基因变异与疾病之间的关系,从而推动精准医学的发展。
基于整合的TCGA数据库探索基因组学与临床数据关系
基于整合的TCGA数据库探索基因组学与临床数据关系一、本文概述随着生物信息学和临床研究的不断深入,基因组学与临床数据之间的关联日益成为生物医学领域的研究热点。
本文旨在通过整合和分析公开的The Cancer Genome Atlas(TCGA)数据库,探索基因组学与临床数据之间的关系。
我们将系统介绍如何利用TCGA数据库的资源,运用生物信息学方法,挖掘基因组学数据中的潜在信息,并与临床数据进行整合分析,以期揭示癌症发生、发展过程中的关键基因和分子机制,为癌症的诊断、治疗和预后评估提供新的思路和方法。
本文将首先介绍TCGA数据库的概况和数据特点,阐述选择TCGA 数据库作为研究基础的原因。
随后,我们将详细介绍基因组学数据的处理方法,包括数据清洗、基因表达分析、基因变异检测等,并阐述如何将这些方法与临床数据进行有效整合。
在结果展示部分,我们将通过图表和统计分析,展示基因组学与临床数据之间的关联,并解释这些关联在癌症研究中的意义。
我们将讨论本文的局限性,并对未来的研究方向进行展望。
通过本文的研究,我们期望能够为深入理解癌症的基因组学特征和临床表型提供新的视角和工具,为癌症的精准医疗提供科学支持。
我们也希望本文的研究方法和结果能够为其他领域的生物医学研究提供借鉴和参考。
二、TCGA数据库概述The Cancer Genome Atlas (TCGA) 是一个由美国国家癌症研究所(NCI)和国家人类基因组研究所(NHGRI)共同发起的项目,旨在通过应用高通量的基因组测序技术,对多种类型的人类癌症进行深入的基因组学研究。
自2006年启动以来,TCGA已经产生了海量的多维度数据,包括基因组、转录组、表观组、蛋白质组以及临床数据等,涵盖了超过33种不同类型的癌症,总计数千个患者的样本。
TCGA数据库不仅提供了丰富的原始测序数据,还通过严格的数据处理和分析流程,生成了大量的二级和三级数据,如基因变异注释、基因表达量统计、生存分析等。
ncbi使用指导
ncbi使用指导NCBI是美国国家生物技术信息中心(National Center for Biotechnology Information)的缩写,是一个提供生物医学和遗传学相关数据和信息的数据库。
NCBI提供了许多工具和资源,以帮助研究人员在基因组学、蛋白质学、遗传学和生物信息学等领域进行研究。
以下是使用NCBI的一些基本指南:1. 访问NCBI网站:使用任何现代网络浏览器,打开NCBI的主页(https://)即可开始使用。
2. 搜索文献:在NCBI主页上的搜索框中,输入你要搜索的关键词,如基因名、疾病名或其他相关的信息。
点击“搜索”按钮,即可看到与你的搜索关键词相关的论文和研究。
3. 搜索序列:如果你希望搜索某个特定基因或蛋白质的序列,可以使用“基因”或“蛋白质”选项卡下的搜索工具。
在搜索框中输入你要搜索的序列信息,点击“搜索”按钮,即可找到与该序列相关的信息和研究。
4. 访问数据库:NCBI提供了许多数据库,如GenBank(基因组数据库)、PubMed(文献数据库)和BLAST(序列比对工具)。
你可以使用NCBI的导航菜单,选择你感兴趣的数据库进行浏览和搜索。
5. 下载数据:在NCBI的数据库中,你可以找到大量的基因组序列、蛋白质序列和其他相关数据。
你可以通过点击数据记录的链接,进入详情页,然后选择下载你需要的数据文件或信息。
6. 利用NCBI工具:NCBI还提供了一些生物信息学工具,如BLAST(序列比对工具)、Primer-BLAST(引物设计工具)和Gene Expression Omnibus(基因表达数据库)。
你可以使用这些工具进行基因序列比对、引物设计和基因表达分析等。
7. 阅读文献:NCBI的PubMed数据库是一个广泛的生物医学文献数据库,你可以使用关键词搜索文献,并阅读或下载全文。
你还可以使用PubMed Central(PMC)访问免费的全文文章。
总之,NCBI是一个丰富的生物医学信息资源,提供了许多工具和数据库,以帮助研究人员进行基因组学和生物信息学研究。
KEGG使用教程
KEGG使用教程KEGG(Kyoto Encyclopedia of Genes and Genomes,京都基因组和基因组百科全书)是一个涉及基因组、基因和生物化合物的综合数据库,为研究生物学、生物信息学和系统生物学提供重要的资源和工具。
本教程将介绍KEGG数据库的基本用法,帮助用户更好地利用该数据库进行研究。
一、KEGG数据库概述KEGG数据库包含了大量的关于基因组、代谢途径、疾病和药物等方面的信息。
其主要包含了以下三个数据库:1.KEGGPATHWAY:代谢途径数据库,包含了多种生物途径的详细信息,如糖代谢途径、氨基酸代谢途径等。
2.KEGGGENES:基因数据库,提供了大量的基因序列、功能注释和基因组定位等信息。
3.KEGGDRUG:药物数据库,包含了多种药物的结构信息、药物靶点和作用机制等。
二、KEGG数据库的使用方法2.基因:在栏中输入基因名或ID,然后点击按钮。
系统将返回与输入相关的基因信息,包括基因描述、序列、功能注释等。
3.代谢途径:在栏中输入感兴趣的代谢途径名或ID,然后点击按钮。
系统将返回与输入相关的代谢途径信息,包括途径图、相关基因和代谢产物等。
4.药物:在栏中输入感兴趣的药物名或ID,然后点击按钮。
系统将返回与输入相关的药物信息,包括药物结构、作用靶点和相关的疾病等。
5. 序列比对:在KEGG网站的工具栏中,选择“Sequencesimilarity search”选项,可以进入基因序列比对的页面。
用户可以将自己的序列与KEGG数据库中的序列进行比对,以查找相关基因或代谢途径。
7. 可视化分析:KEGG数据库还提供了一些用于代谢途径之间相互作用和基因表达等数据分析的工具和资源。
用户可以在KEGG网站的工具栏中选择“Analysis”选项,进入相应的页面进行数据可视化和分析。
三、使用案例以糖代谢途径为例,介绍KEGG数据库的使用方法。
1. 在KEGG网站的栏中输入“Glycolysis”(糖酵解),点击按钮。
DataBase肿瘤药物敏感性基因组学数据库GDSC
DataBase肿瘤药物敏感性基因组学数据库GDSChttps:///Genomics of Drug Sensitivity in Cancer (GDSC),提供免费公开的肿瘤治疗基因组数据,致⼒于发现潜在的肿瘤治疗靶点以改善肿瘤治疗,是全球最⼤的同类型公共数据库。
⾸页可见,GDSC数据库⽀持化合物(药物)、细胞系和癌基因三种检索⽅式。
化合物的相关信息由⾏业、学术合作伙伴或供应商处获取;癌基因组突变信息来⾃COSMIC数据库。
GDSC数据库基本上每年会有⼀个⼤版本的更新,年中会有不定期的⼩版本更新。
截⾄本稿,最新版本是Release 8.1 (Oct 2019) ,数据统计可见,共收录453种药物,988个细胞系,以及38万+组检测IC50值:注:数据量并⾮持续增加的,与TCGA⼀样,对于新的质控标准下,不满⾜QC阈值的数据将被移除。
GDSC⽬前提供两个数据集:GDSC1是该⽹站上可⽤的原始数据集(2009-2015年间收集)的扩展。
⽽GDSC2则基于改进的技术、设备和程序等所得的最新的数据(2015-⾄今)。
例如:GDSC1使⽤DNA染料(Syto60),⽽GDSC2使⽤代谢测定法(Resazurin / CellTiter-Glo)来确定细胞活⼒。
GDSC2中已经重复了许多来⾃GDSC1的实验,官⽅建议使⽤GDSC2!【但实际选哪个⽤,由你⾃⼰决定,实际上有些基因的数据在GDSC1中有,在GDSC2中则不存在...】注:类似于现⾏TCGA的GDC Legacy 和 GDC Portal!GDSC数据库提供在线的数据分析和可视化。
其中,⽕⼭图(Volcano Plot)⽤于展⽰基因特征和药物敏感性之间的联系(ANOVA分析):Gene specific volcano plots represent the effect of a mutated gene (e.g. BRAF) on the responses to all drugs analysed. A drug-specificvolcano plot represents how genomic changes influence response to a specific drug (e.g. BRAF inhibitor PLX4720).IC50,半抑制浓度,即凋亡细胞与全部细胞数之⽐等于50%时所对应的药物浓度。
生物数据库介绍——NCBI
⽣物数据库介绍——NCBINCBI(National Center for Biotechnology Information,美国国家⽣物技术信息中⼼)除了维护GenBank核酸序列数据库外,还提供数据分析和检索资源。
NCBI资源包括Entrez、Entrez编程组件、MyNCBI、PubMed、PudMed Central、PubReader、Gene、the NCBI Taxonomy Browser、BLAST、Pimer-Blast、COBALT、RefSeq、UniGene、HomoloGene、ProtEST、dbMHC、dbSNP、dbVar、Epigenomics、the Genetic Testing Registry、Genome和相关⼯具、⽐对查看器、跟踪存档、Sequence Read Archive、BioProject、BioSample、ClinVar、MedGen、HIV-1/⼈类蛋⽩质相互作⽤数据库、Gene Expression Omnibus、Probe、Online Mendelian Inheritance in Animals、the Molecular Modeling Database、the Conserved Domain Database、the Conserved Domain Architecture Retrieval Tool、Biosystem、Protein Clusters and thePubChem suite of small molecule databases,所有这些资源可以在NCBI主页找到。
Databases⼀个提供有关基因组组装结构,装配名称和其他元数据,统计报告以及基因组序列数据链接等信息的数据库。
⼀个有关培养物、动植物样本和其他⾃然样本的精选元数据集。
记录显⽰样本状态,有关馆藏的机构的信息,以及NCBI中相关数据链接。
药物基因组学
.
10
导致了一门新学科——药物基因组学的产 生
.
11
早在20世纪50年代,人们就发现不同 的遗传背景会导致药物反应的差异,如一 些遗传性葡萄糖-6-磷酸脱氢酶缺陷患者在 接受抗疟药伯氨喹治疗后,引发严重的溶 血。
.
12
药物基因组学P165
概念: 通过DNA序列差异分析,从基因组水
平上深入认识疾病和药物作用的个体差异 机制,指导和优化药物设计和临床用药。
Epidauros Biotechnologie
目的基因多态性分析
Janssen Pharmaceutica
线粒体基因多样性分析
Nova Mollecular
中枢神经系统疾病图
.
16
药物基因组学就是一般的基因学 吗?
.
17
药物基因组学和一般意义上基因学 区别
1
药物基因组学 不是以发现人 体基因组基因 为主要目的
TSER*2(2R)、 TSER*3(3R) 、 TSER*4(4R) 、 TSER*5(5R) 、 TSER*9(9R)。研究显示2R和3R是
最重要的等位基因型。在中国和日本人中3R/3R基因型的 发生率(67%)明显高于白种人和西亚人(38%)。许 多实验研究认为增加重复序列的数量导致TS mRNA水平 及蛋白质表达的升高。
重不良反应, 甚至死亡。
.
37
抗凝血药物华法林
在标准剂量下
CYP2C9变异的个体,
通常表现为华法林抗
凝作用的显著增强,
增加患者发生出血的
风险。
.
38
(4)突变型CYPAC9
突变型CYPAC9,它的144位Arg变为 Cys,导致药物与氧化还原酶的亲合力降 低
用GDSC数据库的结肠癌细胞系数据来计算基因与IC50的相关性
用GDSC数据库的结肠癌细胞系数据来计算基因与IC50的相关性结肠癌是一种常见的恶性肿瘤,其中细胞系是研究癌症发病机制和药物治疗的重要工具。
GDSC数据库(Genomics of Drug Sensitivity in Cancer)提供了包含基因组学和药物敏感性信息的大量癌症细胞系数据。
在这个数据库中,我们可以利用这些数据来计算基因与药物IC50(对50%细胞生长抑制的药物浓度)之间的相关性。
接下来,我们可以使用线性回归模型来计算基因与IC50之间的相关性。
线性回归模型可以帮助我们了解基因对药物敏感性的影响程度。
我们可以选择一个基因作为预测变量,将其与IC50作为响应变量,然后通过拟合线性回归模型来计算二者之间的相关性。
除了线性回归模型,我们还可以利用其他计算相关性的方法,例如皮尔逊相关系数、斯皮尔曼相关系数和Kendall相关系数等。
这些方法可以帮助我们确定基因与IC50之间的线性或非线性关系。
在计算相关性之后,我们可以进行统计显著性检验,以确定计算结果的可靠性。
常用的显著性检验方法包括t检验和F检验,可以帮助我们判断基因与IC50之间的相关性是否显著。
此外,为了获得更准确的结果,我们可以考虑使用多个细胞系的数据进行分析,并进行交叉验证来评估模型的性能。
这样可以减少单个细胞系的特异性,从而提高结果的稳定性和可靠性。
最后,我们还可以使用机器学习算法来进一步挖掘基因与IC50之间的复杂关系。
例如,我们可以使用支持向量回归、随机森林或神经网络等模型来构建基于基因组学数据和IC50的预测模型。
这样可以更好地理解基因对药物敏感性的贡献,并预测新的治疗策略。
在总结中,利用GDSC数据库的结肠癌细胞系数据可以帮助我们计算基因与IC50之间的相关性。
通过选择合适的数据处理和统计分析方法,我们可以获得基因与药物敏感性之间的相关程度,并进一步研究基因对药物敏感性的作用机制。
这些研究结果对于个体化药物治疗和癌症治疗策略的制定具有重要意义。
KEGG使用经验分享
KEGG使用经验分享KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个用于分析生物信息学和基因组学的数据库,它提供了广泛的基因组,路径,药物和疾病信息。
KEGG可用于研究和识别基因和蛋白质之间的关系,帮助理解疾病的发展机制以及开发新的药物靶点。
我使用KEGG已经有一段时间了,我想分享一些我在使用过程中学到的经验和技巧。
首先,KEGG提供了一个简单直观的界面,可以通过浏览器轻松访问。
在KEGG主页上,你可以通过条目或者浏览分类来找到你感兴趣的基因、代谢途径或者疾病。
你可以特定的基因名、蛋白质名或者疾病名来获取相关信息。
浏览途径时,KEGG提供了一个非常直观且易于理解的图形界面,展示了途径中的分子和它们之间的相互作用。
你可以点击每个分子,获取更多关于它的详细信息,包括基因的注释、结构和相关文献。
KEGG还提供了一些实用的工具和资源。
比如,它提供了一个代谢物数据库,可以用来查询和特定的化合物。
你可以查找一个化合物的结构、性质和它们在生物学系统中的作用。
此外,KEGG还有一些有用的分析工具。
比如,它提供了一个基因集富集分析工具,可以根据基因表达数据和KEGG数据库,帮助你找到与一些生物过程或疾病相关的基因集。
这个工具可以帮助你理解基因与疾病之间的关系,找到可能的生物标志物或者潜在的治疗靶点。
当你使用KEGG进行研究时,有几点是需要注意的。
首先,KEGG数据库中的信息可能不是最新的。
在使用KEGG中的结果时,最好通过查阅最新的文献和数据库来确认结果的准确性。
其次,KEGG虽然提供了一个非常丰富的基因和代谢途径数据库,但并不是所有的基因和途径都被完全注释。
在进行研究时,我们需要对结果进行进一步的验证和分析。
另外,KEGG提供的工具和资源可能需要一些基础的生物信息学知识来使用。
如果你对生物信息学和基因组学没有很好的了解,你可能需要事先学习一些基础知识,以便更好地使用KEGG。
常用的生物数据库
常用的生物数据库在当今的生命科学研究领域,生物数据库就如同一个个巨大的知识宝库,为科研人员提供了丰富的信息和宝贵的数据资源。
这些数据库涵盖了从基因序列到蛋白质结构,从疾病信息到生物进化等各个方面,对于推动生物科学的发展发挥着至关重要的作用。
接下来,让我们一起了解一些常用的生物数据库。
首先要提到的是 GenBank 数据库。
它是由美国国家生物技术信息中心(NCBI)建立和维护的,是全球最全面的核酸序列数据库之一。
GenBank 收录了来自各种生物的 DNA 和 RNA 序列,包括细菌、病毒、真菌、植物和动物等。
科研人员可以通过该数据库查询特定基因的序列信息,了解其结构和功能,为基因研究和基因工程提供了重要的基础。
另一个重要的数据库是 UniProt 。
它是整合了蛋白质序列、功能、分类和相互作用等信息的综合性蛋白质数据库。
UniProt 包含了大量经过人工注释和审核的数据,具有很高的准确性和可靠性。
对于研究蛋白质的结构与功能关系、蛋白质组学以及药物研发等领域来说,UniProt 是不可或缺的工具。
在疾病研究方面,OMIM(Online Mendelian Inheritance in Man)数据库是一个非常有价值的资源。
它主要聚焦于人类遗传疾病,提供了有关疾病的临床表现、遗传方式、基因定位和分子机制等详细信息。
对于医学研究人员和临床医生来说,OMIM 有助于诊断和治疗遗传疾病,以及深入了解疾病的发病机制。
PDB(Protein Data Bank)则是专门用于存储蛋白质和核酸等生物大分子三维结构的数据库。
通过 PDB ,科研人员可以直观地观察到生物大分子的空间结构,从而更好地理解其功能和作用机制。
这对于药物设计和开发具有重要的指导意义,因为药物的作用往往与靶点蛋白的结构密切相关。
KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个综合性的生物通路数据库。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
药物基因组学相关数据
库
标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]
药物基因组学数据库1、Drugbank
2、dgidb
3、pharmGKB
4、cancercommon
5、ChEMBL
6、mycancergenome
7、TTD
8、guidetopharmcology
9、clearityfoundation
10、CIViC
https:///#/home
11、DoCM
/
1 Drugbank
药物和药物靶标资源库。
DrugBank是一个独特的生物信息学/化学信息学资源,它结合了详细的药物(例如化学制品)数据和综合的药物靶点(即:蛋白质)信息。
该数据库包含了超过4100个药物条目,包括超过800个FDA认可的小分子和生物技术药物,以及超过3200个试验性药物。
此外,超过1.4万条蛋白质或药物靶序列被链接到这些药物条目。
每个DrugCard条目包含超过80个数据域,其中一半信息致力于药物/化学制品数据,另一半致力于药物靶点和蛋白质数据。
许多数据域超链接到其他数据库(KEGG、PubChem、ChEBI、Swiss-Prot和GenBank)和各种结构查看小应用程序。
该数据库是完全可搜索的,支持大量的文本、序列、化学结构和关系查询搜索。
DrugBank的潜在应用包括模拟药物靶点发现、药物设计、药物对接或筛选、药物代谢预测、药物相互作用预测和普通药学教育。
DrugBank可以在http://www.drugbank.ca使用。
广泛应用于计算机辅助的药物靶标的发现、药物设计、药物分子对接或筛选、药物活性和作用预测等。
在查询中,每一种药物对应1个DrugCard,即我们所得到的检索结果。
每一个DrugCard都包含的数据信息分为药物、靶标和酶三部分。
药物信息包括了该药物的CAS号、商品名、分子式、分子量、SMILES、2D和3D结构、logP、logS、pKa、熔点、吸收性、Caco-2细胞穿透性、药物类别和临床使用、性质描述、剂型与给药途径、半衰期、体内的生物转化、毒性、作用于哪些生物体、食物对服用的影响、与其它药物的相互作用、作用机理、代谢途径、药理学特征、与蛋白质的结合情况、溶解度、物质形态、同义词、关于合成的相关文献等,还与ChEBI、GenBank、PubChem等外部数据库有链接。
靶标的信息包括ID、名称、靶标基因的名称、蛋白质序列、残基数目、分子量、等电点、功能和活性、参与的代谢途径和反应、体内分布、靶标信号、跨膜区域、靶标基因序列及其在GenBank、HGNC等外部数据库中的ID和链接、参考文献,以及在GenBank和Swiss-Prot中的链接。
酶的信息包括名称、蛋白质序列、基因名称、在Swiss-Prot?等数据库中的链接。
在DrugBank的主界面上,在Browse菜单下可以浏览数据库的内容,其中PharmaBrowse为用户提供了分类浏览的功能。
这为药剂师、医生以及寻找潜在药物的研究人员提供了方便。
在Search下拉菜单下,就是Drug?Bank的4类检索方式。
ChemQuery 允许用户通过绘制结构图或书写SMILES、分子式进行结构搜索。
在检索过程中还可以对搜索药物类型、分子量范围、搜索结果相似度、结果数量最大值等进行设置。
TextQuery 则为文本检索功能。
文本检索支持逻辑运算符连接及在特定领域内搜索。
例如,在“dextromethorphan”中检索混合物,可以键入“mixtures:dextromethorphan”,即用分号在后面输入领域,同时可以加入逻辑运算符,例如,在“dextrome?thorphan”和“doxylamine”2个领域进行检索,可以键入
“mixtures:dextromethorphan?AND?mixtures:doxylamine”。
SeqSearch为用户提供了通过序列检索蛋白质的功能。
Data?Extractor是1个组合检索工具。
用户可以对DrugCard所包含的信息进行选择性的组合检索
(1)???Browse按钮:Drug Browse、Category Browse、Geno Browse、Reaction Browse、Pathway Browse、Class Browse、Target Browse;
(2)???Search按钮:ChemQuery Structure Search、Interax Interaction Search、Sequence Search、Advanced Search、MS Search、MS/MS Search、GC/MS Search、1D NMR Search、2D NMR Search;
(3)???其他Tool按钮:HMDB、T3DB、SMPDB、FooDB、PPT-DB、CSF、Serum Metabolome、CCDB、YMDB、BMDB、ECMDB、MarkerDB、BacMap、Ref-DB。
Drug Browse:小分子药物、生物技术药物、显示药物在DrugBank中的ID、药物名称、分子量、化学式、化学结构、药物类型、治疗症状。
Drugs:显示ID、药物名称、治疗疾病
Drugs and Targets:显示ID、药物名称、作用位点(靶标)、靶标类型
总结:可以查找药物名称、分子量、化学式、分子结构、药物所属类型、靶标、靶标类型、治疗疾病、代谢途径等,还可链接到相关网站。
(较实用)
Drug Browse:药名、分子量、化学式、化学结构、药物分类、药效
Geno Browse:药物名称,相互作用的基因/酶,SNP位点、等位基因名称、碱基变化、副作用
Pathway Browse:可查看代谢通路
Classification Browse:药物分类
Target Browse:查靶标及靶标分类和详细细节(药物分类、药理学等)
2ChEMBL
生物活性药物类小分子数据库。
总结:输入分子结构或已知靶标描述或靶标蛋白,每条记录都包括分子的分类、名称、ChEMBI?ID、功能、毒性、亚细胞定位、结构、序列、参考文献等。
(偏向于化学)
3 clearityfoundation
关于卵巢癌的公益网站。
治疗卵巢癌复发、有关肿瘤分子信息、临床试验、卵巢癌诊断和治疗分析、新型靶向制剂的临床开发、治疗结果。
(基本无用)
4 DoCM
位点突变数据库,
总结:查找染色体、基因、疾病、突变类型、氨基酸、起始位置、参考文献(稍微简单了点)
5 CIViC
Search:查找描述、疾病名称、疾病DOID、药物PubChem ID、药物名称、证据水平、基因名、PubChem ID、突变位点等查找相关信息。
总结:evidence ID、基因、氨基酸变化、描述、病名、药物、evidence level(A:经过验证的;B:临床;C:临床前;D:个体研究;E:推理的)、evidence type (predictive、diagnostic、prognostic)、evidence direction(supports、dose not
support)、clinical significance(sensitivice/resistance or non-response/better outcome/poor outcome/positive/negative)、variant origin(somatic/germline)、trust rating(1/2/3/4/5 stars),可链接到代谢途径及下载。
(比较实用)
Search:可按不同类型搜索
输入要搜索的单词,如“breast cancer”
点击一个基因/疾病
单击“View Full Detials from MyGene info”,查基因介绍、蛋白结构域、通路。