利用KEGG数据库进行ID转换
KEGG数据库的使用说明
KEGG数据库的使用方法与介绍http://www.genome.jp/KEGG的数据KEGG中的pathway是根据相关知识手绘的,这里的手绘的意思可能是指人工以特定的语言格式来确定通路各组件的联系;基因组信息主要是从NCBI等数据库中得到的,除了有完整的基因序列外,还有没完成的草图;另外KEGG中有一个“专有名词”KO(KEGG Orthology),它是蛋白质(酶)的一个分类体系,序列高度相似,并且在同一条通路上有相似功能的蛋白质被归为一组,然后打上KO(或K)标签。
下面就首先来讲一下KEGG orthology。
任找一个代谢通路图,在上方有pathway meue | payhway entry | Show(Hide) description | 这3个选项,点击pathway entry, 出现了一个页面,这个随时被连接出来的页面相信大家一定再熟悉不过了。
在这个页面中的pathway map项中点击按钮状的链接Ortholog table 。
就进入了Ortholog table如下的页面:在这个表中,行与物种对应,3个字母都是相应物中的英文单词缩写,比如has表示Homo sapiens,mcc表示Macaca mulatta;列就表示相应的Ortholog分类,比如K00844就表示生物体内的己糖激酶hexokinase这一类序列和功能相似的蛋白质类(酶类)。
如上图has后有3101,3098,3099这3个条目,它表示在人类细胞中中存在3中不同的己糖激酶,它们分别由以上这3组数字代表的基因所编码,这3组数字应该是这3个基因的登录号。
空白则表示在该物种中不存在这种酶。
点击K00844则这一KO分类信息及成员列表都可显示出来;点击has则链接到物种(人类)基因组去了;点击P,则显示相应的代谢通路。
下面我们点击3101,如下:如上图,就是我们常见的一个页面,3101是KEGG中的基因ID(登录号), H.sapiens表示物种,然后是基因的名称,表达的酶,属于哪个KO分类以及参与哪些代谢途径;下面还有结构、序列信息等等。
KEGG的使用方法
KEGG的使用方法KEGG (Kyoto Encyclopedia of Genes and Genomes) 是一个重要的生物信息学数据库,提供了基因、基因组、代谢通路和化合物等生物信息的综合性资源。
它为研究人员提供了一个系统性地探索生物学的工具和平台。
以下是KEGG的一些主要功能和使用方法的详细介绍。
1.数据库结构:KEGG数据库由四个主要模块组成:-通路数据库:包含了多种生物学过程的代谢通路、信号转导通路以及生物化学途径等信息。
-基因数据库:提供了多种物种的基因组、基因的序列、注释和分类信息。
-组数据库:提供了基于基因和化合物之间关系的信息,例如基因座与化合物之间的关联。
-化合物数据库:提供了化合物的结构、属性以及相关的代谢途径和药物作用信息。
2.基因和基因组数据:KEGG基因数据库包含了多个物种的基因组序列以及相关的注释信息。
通过KEGG的基因功能,可以输入基因的名称、ID或者序列来与之相关的信息。
结果将提供基因的位置、功能注释、代谢途径及相关通路等信息。
3.代谢通路和生物化学途径:KEGG通路数据库提供了多种生物学过程的代谢通路、信号传导通路和生物化学途径等信息。
通过KEGG的通路功能,可以输入通路的名称或者基因的名称来与之相关的信息。
结果将提供通路的组成成分、相关基因、代谢产物等详细信息。
4.同源基因比较和功能注释:KEGG基因数据库提供了基因的同源比较和功能注释工具,如BLAST和Motif等。
通过这些工具,研究人员可以比较不同物种中的基因,并预测它们的功能。
5.化合物数据和药物发现:KEGG的化合物数据库提供了大量的化合物结构、属性以及与生物过程相关的代谢通路和药物作用等信息。
研究人员可以使用KEGG的化合物功能,输入化合物的名称、结构或者KCF格式的化学表达式来与之相关的信息。
6.KEGG图谱和数据可视化:KEGG提供了多种图谱和数据可视化工具,包括通路图谱、基因组图谱和基因表达图谱等。
利用KEGG数据库进行ID转换
利用KEGG数据库进行ID转换clusterProfiler can convert biological IDs using OrgDb object via the bitr function. Now I implemented another function, bitr_kegg for converting IDs through KEGG API.library(clusterProfiler)data(gcSample)hghead(hg)## [1] '4597' '7111' '5266' '2175' '755''23046'eg2np ## Warning in bitr_kegg(hg, fromType = 'kegg', toType = 'ncbi-proteinid',## organism = 'hsa'): 3.7% of input gene IDs are fail to map...head(eg2np)## kegg ncbi-proteinid## 1 8326 NP_003499## 2 58487 NP_001034707## 3 139081 NP_619647## 4 59272 NP_068576## 5 993 NP_001780## 6 2676 NP_001487np2uphead(np2up)## ncbi-proteinid uniprot## 1 NP_005457 O75586## 2 NP_005792 P41567## 3 NP_005792 Q6IAV3## 4 NP_037536 Q13421## 5 NP_006054 O60662## 6 NP_001092002 O95398The ID type (both fromType & toType) should be one of'kegg', 'ncbi-geneid', 'ncbi-proteinid' or 'uniprot'. The 'kegg' is the primary ID used in KEGG database. The data source of KEGG was from NCBI. A rule of thumb for the 'kegg' ID is entrezgene ID for eukaryote species and Locus ID for prokaryotes.Many prokaryote species don't have entrezgene ID available. For example we can check the gene information of ece:Z5100 inhttp://www.genome.jp/dbget-bin/www_bget?ece:Z5100, which have NCBI-ProteinID and UnitProt links in the Other DBs Entry, but not NCBI-GeneID.If we try to convert Z5100 to ncbi-geneid, bitr_kegg will throw error of ncbi-geneid is not supported.bitr_kegg('Z5100', fromType='kegg',toType='ncbi-geneid', organism='ece')## Error in KEGG_convert(fromType, toType, organism) :## ncbi-geneid is not supported for ece ...We can of course convert it to ncbi-proteinid and uniprot:bitr_kegg('Z5100', fromType='kegg',toType='ncbi-proteinid', organism='ece')## kegg ncbi-proteinid## 1 Z5100 AAG58814bitr_kegg('Z5100', fromType='kegg', toType='uniprot', organism='ece')## kegg uniprot## 1 Z5100 Q7DB85search_kegg_organismclusterProfiler supports more than 4k species listed inhttp://www.genome.jp/kegg/catalog/org_list.html for hypergeometric test (enrichKEGG & enrichMKEGG) and GSEA (gseKEGG & gseMKEGG). We can use bitr_kegg to convert ID for all these 4k species. To facilitate searching scientific name abbreviate used in the organism parameter of these functions, I implemented thesearch_kegg_organism function. We can search bykegg_code, scientific_name or common_name (which is not available for prokaryotes).search_kegg_organism('ece', by='kegg_code')## kegg_codescientific_name common_name## 334 ece Escherichia coli O157:H7 EDL933 (EHEC)ecolidim(ecoli)## [1] 64 3head(ecoli)## kegg_codescientific_name common_name## 329 eco Escherichia coli K-12MG1655## 330 ecj Escherichia coli K-12W3110## 331 ecd Escherichia coli K-12DH10B## 332 ebw Escherichia coliBW2952## 333 ecok Escherichia coli K-12 MDS42## 334 ece Escherichia coli O157:H7 EDL933 (EHEC)keyType parameterWith the ID conversion utilities built in clusterProfiler, I add a parameter keyType in enrichKEGG, enrichMKEGG, gseKEGG and gseMKEGG. Now we canuse ID type that is not the primary ID in KEGG database.x head(summary(x))## IDDescription GeneRatio## hsa04072 hsa04072 Phospholipase D signaling pathway 11/133## hsa04060 hsa04060 Cytokine-cytokine receptor interaction 14/133## hsa04390 hsa04390 Hippo signaling pathway 10/133## hsa04975 hsa04975 Fat digestion and absorption 5/133## hsa05221 hsa05221 Acute myeloid leukemia 6/133## BgRatio pvalue p.adjustqvalue## hsa04072 216/9275 0.0002654190 0.039016590.03240905## hsa04060 354/9275 0.0005349245 0.039316950.03265855## hsa04390 213/9275 0.0009536247 0.041994040.03488227## hsa04975 58/9275 0.0014014886 0.041994040.03488227## hsa05221 86/9275 0.0014283687 0.041994040.03488227##geneID## hsa04072O95398/Q99777/P49619/Q6FGP0/Q8WVM9/O14807/P41 594/A8K5P7/P10145/A0A024RDA5/P16234## hsa04060A0N0N3/O00574/P19876/P01589/P10145/A0A024RDA5/ B4DGA4/Q99665/P16234/P78556/Q6I9S7/P42830/P2793 0/Q9UBN6## hsa04390Q8WW10/A8K141/Q9UI47/P35240/A0A024R1J8/Q659G9 /Q9UJU2/P22003/M9VUD0/O00144## hsa04975Q9UNK4/A0A087WZT4/A0A0C4DFX6/Q9UHC9/P04054 ## hsa05221Q659G9/Q9UJU2/Q03181/A0A024RCW6/Q06455/B2R6I 9## Count## hsa04072 11## hsa04060 14## hsa04390 10## hsa04975 5## hsa05221 6setReadableFor GO analysis, we have a readable parameter to control whether traslating the IDs to human readable gene name. This parameter is not available for KEGG analysis. But we still have the ability to translate input gene IDs to gene name using setReadable function if and only if corresponding OrgDb object is available.y head(summary(y))## IDDescription GeneRatio## hsa04072 hsa04072 Phospholipase D signaling pathway 11/133## hsa04060 hsa04060 Cytokine-cytokine receptor interaction 14/133## hsa04390 hsa04390 Hippo signaling pathway 10/133## hsa04975 hsa04975 Fat digestion and absorption 5/133## hsa05221 hsa05221 Acute myeloid leukemia 6/133## BgRatio pvalue p.adjustqvalue## hsa04072 216/9275 0.0002654190 0.039016590.03240905## hsa04060 354/9275 0.0005349245 0.039316950.03265855## hsa04390 213/9275 0.0009536247 0.041994040.03488227## hsa04975 58/9275 0.0014014886 0.041994040.03488227## hsa05221 86/9275 0.0014283687 0.041994040.03488227##geneID## hsa04072RAPGEF3/RAPGEF3/DGKG/MRAS/MRAS/MRAS/GRM5/ GRM5/CXCL8/CXCL8/PDGFRA## hsa04060CXCR6/CXCR6/CXCL3/IL2RA/CXCL8/CXCL8/IL12RB2/IL 12RB2/PDGFRA/CCL20/CXCL5/CXCL5/IL1R2/TNFRSF1 0D## hsa04390CTNNA3/CTNNA3/CTNNA3/NF2/NF2/LEF1/LEF1/BMP5/ BMP5/FZD9## hsa04975PLA2G2D/PLA2G2D/NPC1L1/NPC1L1/PLA2G1B## hsa05221LEF1/LEF1/PPARD/PPARD/RUNX1T1/RUNX1T1## Count## hsa04072 11## hsa04060 14## hsa04390 10## hsa04975 5## hsa05221 6经常有人问我用enricher或GSEA分析的话,没有readable参数,要知道这两函数是通用的富集分析工具,对于你要做什么(包括知识库,物种,ID类型)是没有任何假设的,请问我该如何来为你自动转ID,答案是不可能,但你自己做什么,心里应该有点B数,那么我为你提供了setReadable函数,可以帮忙解决部分的ID转换问题,当然肯定不是全部。
kegg数据库的使用方法与介绍
kegg数据库的使用方法与介绍KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库是一个全面的基因组、基因、路径和药物信息的数据库资源。
它由日本京都大学生物信息学中心维护和更新。
KEGG提供了对各种生物学系统的综合信息,包括基因组、化学物质、代谢网络、信号传递、细胞过程和疾病等。
KEGG数据库具有以下几个主要的组成部分:基因组、基因、通路、化合物和药物、疾病、反应、酶和互动。
基因组部分提供了大量物种的基因组图谱和序列信息。
用户可以通过浏览物种树、搜索特定物种或基因来访问所需的基因组数据。
基因部分包含了基因的注释信息和相互作用网络。
用户可以查询特定基因或搜索具有特定功能或特征的基因。
通路部分提供了详细的代谢网络和信号传递通路图。
这些图谱显示了生物进程中的相互作用和调控。
化合物和药物部分包括了化学物质和药物的信息。
用户可以通过搜索特定的化学物质或药物来访问它们的结构、性质和作用机制等相关信息。
疾病部分提供了与疾病相关的基因和通路等信息。
用户可以浏览特定的疾病,并了解与该疾病相关的基因和通路。
反应部分提供了生物化学反应的详细信息。
它包括反应方程式、酶和底物等相关信息。
酶部分提供了酶的功能、结构和催化机制等信息。
用户可以查询特定的酶或搜索具有特定功能的酶。
互动部分展示了基因、化学物质和药物之间的相互作用。
用户可以查询特定的基因或化学物质,并了解它们之间的相互作用。
在使用KEGG数据库时,用户可以使用多种不同的方式来访问和获取所需的信息。
以下是一些常见的使用方法:1. 浏览:用户可以通过浏览不同的数据库部分来获取特定领域的信息。
他们可以浏览基因组图谱、代谢通路和与疾病相关的信息等。
2. 搜索:用户可以使用KEGG数据库的搜索功能来查找特定的基因、化合物、通路或疾病等。
他们可以输入关键词,然后得到与之相关的结果。
3. ID转换:用户可以使用KEGG数据库的ID转换工具来将不同的标识符转换为KEGG ID。
KEGG数据库使用方法详解
以下内容转载自ybzhao的博客,特此感谢!KEGG中的pathway是根据相关知识手绘的,这里的手绘的意思可能是指人工以特定的语言格式来确定通路各组件的联系;基因组信息主要是从NCBI等数据库中得到的,除了有完整的基因序列外,还有没完成的草图;另外 KEGG中有一个“专有名词”KO(KEGG Orthology),它是蛋白质(酶)的一个分类体系,序列高度相似,并且在同一条通路上有相似功能的蛋白质被归为一组,然后打上KO(或K)标签。
下面就首先来讲一下KEGG orthology。
任找一个代谢通路图,在上方有pathway meue | payhway entry | Show(Hide) description | 这3个选项,点击pathway entry, 出现了一个页面,这个随时被连接出来的页面相信大家一定再熟悉不过了。
在这个页面中的pathway map项中点击按钮状的链接Ortholog table 。
就进入了Ortholog table如下的页面:在这个表中,行与物种对应,3个字母都是相应物中的英文单词缩写,比如has表示Homo sapiens,mcc表示Macaca mulatta;列就表示相应的Ortholog分类,比如K00844就表示生物体内的己糖激酶hexokinase 这一类序列和功能相似的蛋白质类(酶类)。
如上图has后有3101,3098,3099这3个条目,它表示在人类细胞中中存在3中不同的己糖激酶,它们分别由以上这3组数字代表的基因所编码,这3组数字应该是这3个基因的登录号。
空白则表示在该物种中不存在这种酶。
点击K00844则这一KO分类信息及成员列表都可显示出来;点击has则链接到物种(人类)基因组去了;点击P,则显示相应的代谢通路。
下面我们点击3101,如下:如上图,就是我们常见的一个页面,3101是KEGG中的基因ID(登录号),H.sapiens表示物种,然后是基因的名称,表达的酶,属于哪个KO分类以及参与哪些代谢途径;下面还有结构、序列信息等等。
KEGG使用介绍
KEGG使用介绍KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个全球使用最广泛的生物信息学资源,旨在帮助研究人员深入了解基因和代谢途径在生物体中的功能和调控机制。
下面将对KEGG的使用介绍进行详细阐述。
KEGG数据库提供了综合的生物信息学工具和资源,包括基因组、代谢途径、疾病、药物等方面的数据。
它具有以下几个主要特点。
首先,KEGG提供了大量的基因组学和转录组学数据,包括多个物种的遗传组织定位、基因组序列、蛋白质注释和表达数据等。
用户可以通过KEGG数据库查询感兴趣基因的信息,如基因位点、转录本、编码蛋白、关键功能等。
这些信息可帮助研究人员了解基因的组织表达模式、功能注释和代谢调控。
其次,KEGG提供了详细的代谢途径图和物质代谢网络。
用户可以通过KEGG Pathway浏览和研究特定代谢途径的调控机制和关键分子。
KEGG Pathway中的每个分子都链接到详细的注释信息,包括物质结构、酶和基因的注释、相互作用等。
通过对代谢途径的研究,研究人员可以深入了解一种生物过程中基因和代谢产物之间的相互关系和调控机制。
此外,KEGG提供了疾病和药物信息,包括疾病的遗传学和发病机制、药物的作用和靶点等。
用户可以通过KEGG Disease查询具体疾病的病因、发病机制等信息,帮助研究人员了解疾病的分子基础和可研究的靶点。
同时,KEGG Drug提供了药物的分类、化学结构和作用机制等信息,用户可以通过查询具体的药物名或药物类别来获得相关数据。
最后,KEGG还提供了一系列实用的生物信息学工具。
例如,KEGG Mapper工具可以将基因、蛋白质或化合物ID映射到KEGG数据库中的相应数据,帮助研究人员获得更详细的注释信息。
此外,KEGG提供了基因表达和代谢组学的分析工具,用户可以通过这些工具对自己的实验数据进行分析和解释。
在使用KEGG时,主要有以下几个步骤:2.在KEGG的主页上,可以通过关键词或点击数据库上的链接来查找感兴趣的基因、代谢途径、疾病、药物等。
KEGG使用教程
KEGG使用教程KEGG(Kyoto Encyclopedia of Genes and Genomes,京都基因组和基因组百科全书)是一个涉及基因组、基因和生物化合物的综合数据库,为研究生物学、生物信息学和系统生物学提供重要的资源和工具。
本教程将介绍KEGG数据库的基本用法,帮助用户更好地利用该数据库进行研究。
一、KEGG数据库概述KEGG数据库包含了大量的关于基因组、代谢途径、疾病和药物等方面的信息。
其主要包含了以下三个数据库:1.KEGGPATHWAY:代谢途径数据库,包含了多种生物途径的详细信息,如糖代谢途径、氨基酸代谢途径等。
2.KEGGGENES:基因数据库,提供了大量的基因序列、功能注释和基因组定位等信息。
3.KEGGDRUG:药物数据库,包含了多种药物的结构信息、药物靶点和作用机制等。
二、KEGG数据库的使用方法2.基因:在栏中输入基因名或ID,然后点击按钮。
系统将返回与输入相关的基因信息,包括基因描述、序列、功能注释等。
3.代谢途径:在栏中输入感兴趣的代谢途径名或ID,然后点击按钮。
系统将返回与输入相关的代谢途径信息,包括途径图、相关基因和代谢产物等。
4.药物:在栏中输入感兴趣的药物名或ID,然后点击按钮。
系统将返回与输入相关的药物信息,包括药物结构、作用靶点和相关的疾病等。
5. 序列比对:在KEGG网站的工具栏中,选择“Sequencesimilarity search”选项,可以进入基因序列比对的页面。
用户可以将自己的序列与KEGG数据库中的序列进行比对,以查找相关基因或代谢途径。
7. 可视化分析:KEGG数据库还提供了一些用于代谢途径之间相互作用和基因表达等数据分析的工具和资源。
用户可以在KEGG网站的工具栏中选择“Analysis”选项,进入相应的页面进行数据可视化和分析。
三、使用案例以糖代谢途径为例,介绍KEGG数据库的使用方法。
1. 在KEGG网站的栏中输入“Glycolysis”(糖酵解),点击按钮。
KEGG数据库的使用方法与介绍 (转)
KEGG数据库的使用方法与介绍(转)KEGG的数据KEGG中的pathway是根据相关知识手绘的,这里的手绘的意思可能是指人工以特定的语言格式来确定通路各组件的联系;基因组信息主要是从NCBI 等数据库中得到的,除了有完整的基因序列外,还有没完成的草图;另外KEGG中有一个“专有名词”KO(KEGG Orthology),它是蛋白质(酶)的一个分类体系,序列高度相似,并且在同一条通路上有相似功能的蛋白质被归为一组,然后打上KO(或K)标签。
下面就首先来讲一下KEGG orthology。
任找一个代谢通路图,在上方有pathway meue | payhway entry | Show(Hide) description | 这3个选项,点击pathwayentry, 出现了一个页面,这个随时被连接出来的页面相信大家一定再熟悉不过了。
在这个页面中的pathway map项中点击按钮状的链接Ortholog table 。
就进入了Ortholog table如下的页面:在这个表中,行与物种对应,3个字母都是相应物中的英文单词缩写,比如has 表示Homo sapiens,mcc表示Macaca mulatta;列就表示相应的Ortholog分类,比如K00844就表示生物体内的己糖激酶hexokinase 这一类序列和功能相似的蛋白质类(酶类)。
如上图has后有3101,3098,3099这3个条目,它表示在人类细胞中中存在3中不同的己糖激酶,它们分别由以上这3组数字代表的基因所编码,这3组数字应该是这3个基因的登录号。
空白则表示在该物种中不存在这种酶。
点击K00844则这一KO分类信息及成员列表都可显示出来;点击has则链接到物种(人类)基因组去了;点击P,则显示相应的代谢通路。
下面我们点击3101,如下:如上图,就是我们常见的一个页面,3101是KEGG中的基因ID(登录号),H.sapiens表示物种,然后是基因的名称,表达的酶,属于哪个KO分类以及参与哪些代谢途径;下面还有结构、序列信息等等。
代谢数据如何做KEGG富集分析
代谢数据如何做KEGG富集分析KEGG(Kyoto Encyclopedia of Genes and Genomes)作为一个系统生物学数据库,提供了与基因和代谢通路相关的丰富信息。
KEGG富集分析是一种常用的方法,可以揭示代谢数据集中特定代谢通路的富集情况,从而揭示生物学过程的重要变化。
下面将介绍基于KEGG数据库的代谢数据的富集分析方法。
步骤1:准备数据首先需要从实验或数据库中获取代谢数据。
这些数据可以来自各种高通量测序技术,如转录组学、代谢组学或蛋白质组学。
通常,这些数据是基因ID与其表达水平或差异表达的定量值之间的关系。
步骤2:注释基因ID将代谢数据中的基因ID与KEGG数据库中的基因ID进行注释。
这可以通过使用KEGG数据库提供的序列注释查询(KAAS,KEGG Automatic Annotation Server)或其他基因ID注释工具来完成。
步骤3:进行富集分析在进行KEGG富集分析之前,需要确定一个阈值来筛选差异表达的基因。
可以使用各种统计学方法来确定显著性阈值,如差异表达分析中广泛使用的FDR(false discovery rate)或p-value。
1.寻找差异表达基因的KEGGID将显著差异表达的基因与KEGG数据库中的基因进行比较,找到其对应的KEGGID。
2.寻找代谢通路将找到的KEGGID与KEGG数据库中的代谢通路进行比较,找出与这些基因相关的代谢通路。
3.计算富集分数计算每个代谢通路的富集分数,通常使用超几何分布或Fisher精确检验等统计学方法来评估基因集在特定通路中的富集程度。
富集分数越高,表示在该代谢通路中差异表达基因的富集程度越高。
4.多重检验校正对富集分数进行多重检验校正,以控制误差率。
常见的校正方法包括Bonferroni、Benjamini-Hochberg(FDR)等。
步骤4:结果解读富集分析的结果是一系列表达富集通路的基因组学术语。
可以将这些通路进行分类和排序,以帮助用户更好地理解重要的生物学过程和通路。
skr!GEO芯片数据的探针ID转换
skr!GEO芯片数据的探针ID转换今天这个帖子,对我来说很有意义,我在最后要介绍一位心中的男神。
我每天努力学习就是为了消除心中的疑惑。
几年前,当我跟着别人的代码跑了个流程后,突破不了的是两个事情•1.如何不借助 excel 的拖拽,对芯片进行分组,•2.如何方便优雅全能地进行探针转换。
那个时候,R语言基础很差,处理不了数据,很有挫败感,所以就停止了R语言的学习。
直到我碰到了那个男人。
现在我解决了这个问题,分享给大家。
第一种,我们可以直接用平台的数据进入官网 /geo/知道平台是GPL6244这时候我们进入R语言,用GEOquery中的getGEO可以获得探针和基因名的信息网络不好的可以直接略过1.library(GEOquery)2.GPL6244 <>'GPL6244',destdir ='.')转换成数据框形式,有3万行,12列1.GPL6244_anno ->T able(GPL6244)查看内容,我们发现基因名称藏在了gene_assignment这一列的中间所以我们要把他和第一列id提取出来1.library(dplyr)2.library(tidyr)3.probe2symbol_df % ->4.select(ID,gene_assignment) %>%5.filter(gene_assignment != '---') %>%6.separate(gene_assignment,c('drop','symbol'),sep='//') %>%7.select(-drop)看一下,数据已经被提取出来了。
假如getGEO这一步网络不好呢1.library(GEOquery)2.GPL6244 <>'GPL6244',destdir ='.')我们在这个一开始的这个页面下载平台的soft文件点击soft文件下载解压然后用data.table这个包中的fread即可阅读进来,注意,skip这个参数十分重要!!1.GPL6244_anno<>'./GSE42872_family.soft/GSE42872_family.soft',skip ='ID') 得到了GPL6244_anno,我们又可以运行下面的代码提出探针和基因名称对应的关系了。
KEGG数据库使用方法详解
KEGG数据库使用方法详解KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个整合了基因组、生物信息、代谢途径和疾病等多种数据的数据库。
它提供了一种系统的方法来理解生物分子行为和生物系统的功能。
本文将详细介绍KEGG数据库的使用方法。
首先,KEGG数据库提供了基因组和基因信息的查询功能。
用户可以通过基因ID、基因名或其他基因标识符来特定的基因,并获得与该基因相关的信息,如基因的序列、结构和功能注释等。
此外,用户还可以查询特定物种的基因组信息,如基因组大小、基因组组成和染色体标记等。
第二,KEGG数据库提供了生物信息学工具来预测和分析基因的功能和相互作用。
例如,KEGG可以根据基因或蛋白质的序列信息,通过基因注释和蛋白质相似性等方法,预测基因的功能和相互作用。
此外,KEGG 还提供了一系列的生物信息学工具,用于分析基因的表达模式、基因家族和进化关系等。
这些工具可以帮助研究人员更好地理解基因在细胞、组织和器官水平上的功能。
第三,KEGG数据库还提供了代谢途径和信号传导网络的详细信息。
用户可以查询特定物种的代谢途径和信号传导网络的图表,并查看其中包含的基因、蛋白质和化合物等分子的详细信息。
此外,用户还可以通过KEGG数据库来预测和分析代谢途径的调控机制、信号传导通路的调控网络等。
这些功能可以帮助研究人员更好地理解代谢途径和信号传导网络在生物系统中的作用和调控机制。
第四,KEGG数据库提供了疾病和药物的相关信息。
用户可以查询特定疾病或药物的相关信息,并了解其与基因、代谢途径和信号传导网络的关联。
此外,KEGG还提供了一些工具来预测和分析疾病和药物的相互作用,如药物的靶点和作用机制等。
这些功能可以帮助研究人员更好地理解疾病的发生和药物的治疗机制。
最后,KEGG数据库还提供了一些工具和资源来帮助研究人员进行数据分析和可视化。
例如,KEGG提供了一些图形化工具来展示基因、代谢途径和信号传导网络的关系。
KEGG使用经验精品总结
KEGG使用经验精品总结KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个基因组学的数据库,提供了大量的基因、蛋白质、代谢通路等信息,并且可以进行生物信息学和系统生物学的分析。
下面是我在使用KEGG时的经验总结。
首先,在使用KEGG之前,我们需要了解数据库的结构和内容。
KEGG由不同的数据库组成,包括基因、蛋白质、代谢通路、疾病等。
每个数据库都有自己独特的标识符,比如基因有Gene ID,代谢通路有Pathway ID等等。
了解这些标识符可以使我们在使用KEGG时更加高效。
其次,在进行基因或蛋白质的注释时,我们可以使用KEGG的基因注释(KAAS)工具。
KAAS可以将我们感兴趣的基因或蛋白质与KEGG数据库中的基因进行比对,并给出注释结果。
这个工具非常方便,可以快速获得感兴趣基因的功能信息。
在分析代谢通路时,我们可以使用KEGG的代谢通路工具。
这个工具可以根据我们输入的基因或蛋白质列表,自动生成其所参与的代谢通路。
通过这个工具,我们可以了解基因或蛋白质在生物体内的代谢过程,并且可以发现一些潜在的生物学机制。
此外,KEGG还提供了一些工具用于对基因或蛋白质的序列进行分析。
比如,通过使用KEGG的BLAST工具,我们可以将我们的序列与KEGG数据库的序列进行比对,并得到比对结果。
这对于从大规模的序列中发现新的基因或蛋白质非常有帮助。
在使用KEGG的过程中,我发现有几点需要注意和改进的地方。
首先,KEGG的界面比较复杂,有很多功能和选项。
如果我们对KEGG不熟悉,可能会迷失在各种选项中,导致操作不当。
因此,在使用KEGG之前,我们需要先了解其功能和用途,并学会如何使用。
其次,KEGG的数据量非常庞大,有时候结果会非常多。
为了提高的准确性和效率,我们可以使用一些筛选条件,比如限定物种、基因或蛋白质的特定功能等等。
这样可以减少无关的结果,提高的效果。
最后,KEGG的一些功能可能需要付费或需要注册才能使用。
KEGG数据库中文教程
KEGG数据库中文教程快速导航1. 这篇教程介绍了什么?2. KEGG数据库里面有什么?3. 我如何查询某一特定的代谢途径(pathway)的信息,例如Glycolysis / Gluconeogenesis?4. 我如何查询某一化合物的信息,例如Pyruvate?5. 我如何查询Pyruvate涉及了哪些生化反应?6. 我如何查询某一基因的信息,例如gltA ?7. 我如何知道Bacillus subtilis是否有gltA?8. 我如何查询gltA在其他物种中的同源基因?9. 我如何列出某一代谢途径中涉及的所有的酶?例如cytrate cycle pathway(TCA循环)10. 我如何知道人类的cytrate cycle中pyruvate carboxylase这种酶有多少化合物与其发生相互作用?11. 我如何查询人类由Citrate生成Acetyl-CoA的可能步骤?12. 我有一条未知的序列,如何查询KEGG数据库中是否有基因或酶与其对应?一. 简介代谢(Metabolism)是指细胞内发生的各种化学反应的总称。
一个代谢途径(Metabolic pathway)包括一系列互相联系的反应(reaction),反应中的酶( enzyme)以及反应中的前体或者产物(substrate) 。
随着现代生物信息学的进展,我们可以通过计算机来展示,以至预测细胞内的代谢途径。
现在常用的查询代谢途径的数据库主要包括:KEGG(http://www.genome.jp/kegg/), GenMAPP(/), BioRag(/) 等。
本教程主要介绍KEGG 数据库的使用方法。
KEGG(Kyoto Encyclopedia of Genes and Genomes)是由日本京都大学和东京大学联合开发的数据库,可以用来查询代谢途径,酶(或编码酶的基因),产物等,也可以通过BLA ST比对查询未知序列的代谢途径信息。
KEGG使用教程
最近要学KEGG,先粘2个有用的内容存档。
/?wz457.html以下是我归纳出的使用KEGG方法敲门,供给大家参考使用KEGG数据库一个主要用途就是查询分析pathway,然而直接通过网页打开的是一个图片形式的数据。
如下介绍如何利用下载的数据,以及使用软件VisANT(首先需要安装java虚拟机,太大了请自己去网上下载)来分析KEGG数据。
以人类MAPK通路(编号hsa04010)为例:一、如何确定一组基因(蛋白)是否在MAPK通路中?通过ftp下载人类hsa04010相关的所有数据。
找到hsa04010.gene这个文件,其中包含的就是geneid,gene name,gene的描述,通过这个表就能确定哪个基因是在这个通路中了。
二、如何确定一组基因(蛋白)互作是否在MAPK通路中?1、首先通过http://www.genome.jp/kegg/xml/KEGG regulatory pathways linked to KO ,http://www.genome.jp/kegg/KGML/KGML_v0.6.1/ko/ko04010.xml下载MAPK通路的xml格式的数据,并保存为xml文件,hsa04010.xml2、使用VisANT软件(/)进行分析,步骤如下:(1)打开后,点击左边按钮Clear,清除以前的文件(2)点File—open:打开hsa04010.xml文件,这时出现MAPK调控网络。
(3)点File—Export as Tab-Delimited File—All:之后将在网页上出现如下格式的数据:K04463 K04464 1 M9999 0.0K02308 K04426 1 M9999 0.0K04371 K04376 1 M9999 0.0K04375 K04379 1 M9999 0.0将此数据copy下来,命名为KO2KOppi这里的K0……编号意思是:KO(KEGG Orthology) ID(4)打开表:hsa04010.orth,将其中的分号;全部替换为Tab符号,将全部的逗号替换为Tab符号,之后用xls打开。
KEGG数据库的使用方法与介绍 (转)
KEGG数据库的使用方法与介绍(转)KEGG的数据KEGG中的pathway是根据相关知识手绘的,这里的手绘的意思可能是指人工以特定的语言格式来确定通路各组件的联系;基因组信息主要是从NCBI 等数据库中得到的,除了有完整的基因序列外,还有没完成的草图;另外KEGG中有一个“专有名词”KO(KEGG Orthology),它是蛋白质(酶)的一个分类体系,序列高度相似,并且在同一条通路上有相似功能的蛋白质被归为一组,然后打上KO(或K)标签。
下面就首先来讲一下KEGG orthology。
任找一个代谢通路图,在上方有pathway meue | payhway entry | Show(Hide) description | 这3个选项,点击pathwayentry, 出现了一个页面,这个随时被连接出来的页面相信大家一定再熟悉不过了。
在这个页面中的pathway map项中点击按钮状的链接Ortholog table 。
就进入了Ortholog table如下的页面:在这个表中,行与物种对应,3个字母都是相应物中的英文单词缩写,比如has 表示Homo sapiens,mcc表示Macaca mulatta;列就表示相应的Ortholog分类,比如K00844就表示生物体内的己糖激酶hexokinase 这一类序列和功能相似的蛋白质类(酶类)。
如上图has后有3101,3098,3099这3个条目,它表示在人类细胞中中存在3中不同的己糖激酶,它们分别由以上这3组数字代表的基因所编码,这3组数字应该是这3个基因的登录号。
空白则表示在该物种中不存在这种酶。
点击K00844则这一KO分类信息及成员列表都可显示出来;点击has则链接到物种(人类)基因组去了;点击P,则显示相应的代谢通路。
下面我们点击3101,如下:如上图,就是我们常见的一个页面,3101是KEGG中的基因ID(登录号),H.sapiens表示物种,然后是基因的名称,表达的酶,属于哪个KO分类以及参与哪些代谢途径;下面还有结构、序列信息等等。
kegg使用方法
kegg使用方法【原创版2篇】目录(篇1)1.KEGG 简介2.KEGG 的使用方法3.KEGG 的优点与局限性正文(篇1)1.KEGG 简介KEGG(Kyoto Encyclopedia of Genes and Genomes) 是一个综合性的基因组学数据库,它提供了关于基因、化合物、药物等信息的广泛而详尽的数据。
KEGG 的数据库涵盖了基因组、代谢通路、化合物以及药物等多个方面,为科研人员和学生提供了方便、快捷的基因组学信息查询工具。
2.KEGG 的使用方法(1) 基因查询在 KEGG 数据库中,可以通过输入基因名称或者基因 ID 来查询相关信息。
例如,输入“APC”或者“APC ID: 7”来查询与该基因相关的信息。
查询结果会显示基因的基本信息、转录本、蛋白质结构、功能注释等内容。
(2) 代谢通路查询KEGG 数据库中包含了众多代谢通路,可以通过输入代谢通路名称或者代谢通路 ID 来查询相关信息。
例如,输入“糖酵解”或者“糖酵解 ID: map001”来查询与该代谢通路相关的信息。
查询结果会显示代谢通路的概述、反应、酶等信息。
(3) 化合物查询KEGG 数据库中包含了众多化合物,可以通过输入化合物名称或者化合物 ID 来查询相关信息。
例如,输入“葡萄糖”或者“葡萄糖 ID: C00011”来查询与该化合物相关的信息。
查询结果会显示化合物的结构、代谢通路、作用等信息。
(4) 药物查询KEGG 数据库中包含了众多药物,可以通过输入药物名称或者药物 ID 来查询相关信息。
例如,输入“阿司匹林”或者“阿司匹林 ID: D000002”来查询与该药物相关的信息。
查询结果会显示药物的作用、代谢、不良反应等信息。
3.KEGG 的优点与局限性(1) 优点KEGG 数据库是一个全面、系统的基因组学数据库,它提供了丰富的基因、代谢通路、化合物以及药物等信息,为科研人员和学生提供了方便、快捷的查询工具。
KEGG 数据库的更新速度快,数据准确性高,是生物学研究中不可或缺的工具之一。
kegg使用方法
kegg使用方法KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个由日本的京都大学建立的数据库,提供了大量的生物信息资源和工具。
KEGG数据库包括基因组、基因、蛋白质、化合物、酶、代谢途径、药物和疾病等各个方面的数据和信息。
本文将介绍KEGG数据库的使用方法。
1.访问KEGG数据库2.数据KEGG数据库提供了基因、蛋白质、化合物、酶、代谢途径、药物和疾病等各个方面的数据功能。
用户可以输入关键词感兴趣的数据。
3.基因和蛋白质用户可以通过输入基因或蛋白质的名称或ID来相关信息。
例如,输入基因的KEGG ID(例如hsa:1234)可以获得该基因的详细信息、序列和相关文献等。
4.代谢途径5.功能和注释KEGG数据库提供了各种功能和注释信息,包括KO(KEGG Orthology)注释、GO(Gene Ontology)注释、PFAM注释、KEGG BRITE注释等。
这些注释信息可以帮助用户理解基因、蛋白质和化合物的功能和特性。
6.序列比对和功能注释KEGG数据库提供了序列比对和功能注释的工具,如BLAST、KASS、KOBAS等。
用户可以输入序列数据进行比对,并获得比对结果和相关的功能注释。
7.代谢通路KEGG数据库的核心特色之一是提供了详细的代谢途径信息。
用户可以通过浏览代谢途径的分类来了解不同的代谢途径,或者通过输入化合物或基因的名称或ID来查找相关的代谢途径信息。
8.KEGG地图KEGG地图是KEGG数据库中非常重要的功能之一,可以帮助用户直观地了解基因、蛋白质和化合物在代谢途径中的位置和相互关系。
用户可以在KEGG地图中点击不同的节点来获取相关的详细信息和注释。
10.API接口KEGG数据库还提供了API接口,可以方便地将KEGG数据集成到自己的脚本或程序中。
用户可以通过API接口来获取和处理KEGG数据库的数据。
总结:KEGG数据库是一个功能强大的生物信息资源和工具,提供了丰富的数据和功能。
KEGG使用说明
KEGG使用说明KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个基因组学、基因组信息资源的综合数据库。
它提供了基于基因组的多样化信息,包括基因与蛋白质序列、基因组组装与注释、代谢途径与通路、药物与化合物等。
KEGG数据库的使用非常重要,对于基因组学和生物信息学研究具有重要的指导意义。
本文将详细介绍KEGG数据库的使用方法。
KEGG数据库的主要功能包括基因数据的和浏览、代谢通路的分析、化学物质的和浏览、蛋白质序列的比对和注释、基因组的比较分析等。
首先,我们介绍KEGG数据库中基因数据的和浏览功能。
用户可以通过基因名、基因ID或基因功能关键词来感兴趣的基因。
结果将显示基因的相关信息,包括基因名、基因ID、功能描述、序列等。
用户还可以通过点击基因名来进一步浏览基因的详细信息,如基因家族、调控关系、突变位点等。
其次,我们介绍KEGG数据库中代谢通路的分析功能。
用户可以通过进入“Pathway”页面来浏览KEGG数据库中的各种代谢通路。
用户可以选择对代谢通路的感兴趣的部分进行深入分析。
点击代谢通路即可进入通路的详细页面,包括通路图、参与的基因和蛋白质等信息。
用户可以通过点击基因和蛋白质来进一步浏览它们的详细信息。
然后,我们介绍KEGG数据库中化学物质的和浏览功能。
用户可以通过输入化学物质的名称、化学式或CAS号来感兴趣的化合物。
结果将显示化合物的相关信息,如名称、化学式、分子量、生物活性等。
用户还可以通过点击化合物名称来进一步浏览化合物的详细信息,如结构、代谢途径、药物相互作用等。
此外,KEGG数据库还提供了蛋白质序列的比对和注释功能。
用户可以通过进入“BLAST”页面来进行蛋白质序列的比对。
用户可以输入待比对的蛋白质序列,选择比对参数,然后点击“Submit”按钮进行比对。
比对结果将显示在页面上,用户可以进一步分析和解释比对结果。
综上所述,KEGG是一个重要的基因组学与生物信息学的综合数据库。
ID转换不用怕(二),R大神Y叔clusterProfiler包帮你忙
ID转换不⽤怕(⼆),R⼤神Y叔clusterProfiler包帮你忙之前Leopard⽼师介绍了关于⽤biomart包进⾏ID转换的⽅式,Byron现在给⼤家介绍另外⼀种⽅式,使⽤Y叔的clusterProfiler包进⾏ID转换。
简单介绍⼀下⼏种常⽤的IDEnsemble id:由欧洲⽣物信息数据库提供,⼀般以ENSG开头,后边跟11位数字。
如TP53基因:ENSG00000141510Entrez id:由美国NCBI提供,通常为纯数字。
如TP53基因:7157Symbol id:为我们常在⽂献中报道的基因名称。
如TP53基因的symbol id为TP53Refseq id:NCBI提供的参考序列数据库:可以是NG、NM、NP开头,代表基因,转录本和蛋⽩质。
如TP53基因的某个转录本信息可为NM_000546简单介绍⼀下clusterProfiler包clusterProfiler包是有Y叔开发的包之⼀,可以进⾏基因及基因簇的分析和基因谱功能可视化,功能强⼤且更新很频繁。
我们今天在clusterProfiler包中⽤到的是其中的叫做bitr()和bitr_kegg()的函数,⽀持许多物种的ID转换。
⼀ clusterProfiler包的安装与简介与其他的在bioconductor包中安装的⽅式相同查看关于clusterProfiler包的使⽤⽂档之后会有⽹页弹出,可以看到⽹页版说明、R代码等⼆载⼊包library(clusterProfiler)三载⼊注释包如⼈类的基因组注释包library(org.Hs.eg.db)安装⽅式和别的bioconductor包中的⽅式相同简单地说明⼀下注释包:四查看注释包中⽀持的ID转换类型clusterProfiler包⽅便地提供了keytypes()函数查看注释包中的可以进⾏ID转换的项⽬。
我们查看⼀下⼈类的注释包中⽀持的ID转换类型。
keytypes(org.Hs.eg.db)发现我们常⽤的⼏种,如:ENSEMBL、ENTREZID、SYMBOL、REFSEQ都在其中。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
利用KEGG 数据库进行ID 转换clusterProfiler can convert biological IDs using OrgDb object via the bitr function. Now I implemented another function, bitr_kegg for converting IDs through KEGG API.library(clusterProfiler) data(gcSample) hg head(hg)## [1] '4597' '7111' '5266' '2175' '755' '23046' eg2np ## Warning in bitr_kegg(hg, fromType = 'kegg', toType = 'ncbi-proteinid', ## organism = 'hsa'): 3.7% of input gene IDs are fail to map...head(eg2np)## kegg ncbi-proteinid## 1 8326 NP_003499## 2 58487 NP_001034707## 3 139081 NP_619647## 4 59272 NP_068576## 5 993 NP_001780## 6 2676 NP_001487np2uphead(np2up)## ncbi-proteinid uniprot## 1 NP_005457 O75586## 2 NP_005792 P41567## 3 NP_005792 Q6IAV3## 4 NP_037536 Q13421## 5 NP_006054 O60662## 6 NP_001092002 O95398The ID type (both fromType & toType) should be one of'kegg', 'ncbi-geneid', 'ncbi-proteinid' or 'uniprot'. The 'kegg' is the primary ID used in KEGG database. The data source of KEGG was from NCBI. A rule of thumb for the 'kegg' ID is entrezgene ID for eukaryote species and Locus ID for prokaryotes.Many prokaryote species don't have entrezgene ID available. For example we can check the gene information of ece:Z5100 inhttp://www.genome.jp/dbget-bin/www_bget?ece:Z5100, which have NCBI-ProteinID and UnitProt links in the Other DBs Entry, but not NCBI-GeneID.If we try to convert Z5100 to ncbi-geneid, bitr_kegg will throw error of ncbi-geneid is not supported.bitr_kegg('Z5100', fromType='kegg',toType='ncbi-geneid', organism='ece')## Error in KEGG_convert(fromType, toType, organism) : ## ncbi-geneid is not supported for ece ...We can of course convert it to ncbi-proteinid and uniprot:bitr_kegg('Z5100', fromType='kegg', toType='ncbi-proteinid', organism='ece') ## kegg ncbi-proteinid ## 1Z5100 AAG58814 bitr_kegg('Z5100', fromType='kegg', toType='uniprot', organism='ece') ## kegg uniprot ## 1Z5100 Q7DB85 search_kegg_organismclusterProfiler supports more than 4k species listed inhttp://www.genome.jp/kegg/catalog/org_list.html for hypergeometric test (enrichKEGG & enrichMKEGG) and GSEA (gseKEGG & gseMKEGG). We can use bitr_kegg to convert ID for all these 4k species. To facilitate searching scientific name abbreviate used in the organism parameter of these functions, I implemented thesearch_kegg_organism function. We can search bykegg_code, scientific_name or common_name (which is not available for prokaryotes).search_kegg_organism('ece', by='kegg_code')## kegg_codescientific_name common_name## 334 ece Escherichia coli O157:H7 EDL933 (EHEC) ecolidim(ecoli)## [1] 643head(ecoli)## kegg_code scientific_name common_name## 334 ece Escherichia coli O157:H7 EDL933 (EHEC) keyType parameterWith the ID conversion utilities built in clusterProfiler, I add a parameter keyType in enrichKEGG, enrichMKEGG, gseKEGG and gseMKEGG. Now we can## 329 eco MG1655 ## 330 ecjW3110 ## 331 ecdDH10B ## 332 ebwBW2952 ## 333 ecokMDS42Escherichia coli K-12Escherichia coli K-12Escherichia coli K-12Escherichia coliEscherichia coli K-12use ID type that is not the primary ID in KEGG database.x## hsa04072 216/9275 0.0002654190 0.03901659 0.03240905## hsa04060 354/9275 0.0005349245 0.03931695 0.03265855## hsa04390 213/9275 0.0009536247 0.04199404 0.03488227## hsa04975 58/9275 0.0014014886 0.04199404head(summary(x))## Description GeneRatio ## hsa04072 hsa04072 pathway 11/133 ## hsa04060 hsa04060 interaction 14/133 ## hsa04390 hsa04390 pathway 10/133 ## hsa04975 hsa04975 absorption 5/133 ## hsa05221 hsa05221 leukemia 6/133 ## BgRatioqvalueIDPhospholipase D signalingCytokine-cytokine receptorHippo signalingFat digestion andAcute myeloidpvalue p.adjust0.03488227## hsa05221 86/9275 0.0014283687 0.041994040.03488227##geneID## hsa04072O95398/Q99777/P49619/Q6FGP0/Q8WVM9/O14807/P41 594/A8K5P7/P10145/A0A024RDA5/P16234## hsa04060A0N0N3/O00574/P19876/P01589/P10145/A0A024RDA5/ B4DGA4/Q99665/P16234/P78556/Q6I9S7/P42830/P2793 0/Q9UBN6## hsa04390Q8WW10/A8K141/Q9UI47/P35240/A0A024R1J8/Q659G9 /Q9UJU2/P22003/M9VUD0/O00144## hsa04975Q9UNK4/A0A087WZT4/A0A0C4DFX6/Q9UHC9/P04054 ## hsa05221Q659G9/Q9UJU2/Q03181/A0A024RCW6/Q06455/B2R6I 9## Count## hsa04072 11interaction 14/133 ## hsa04390 hsa04390 pathway 10/133 ## hsa04975 hsa04975 absorption 5/133 ## hsa05221 hsa05221 Hippo signalingFat digestion andAcute myeloidleukemia6/133## hsa04060 14 ## hsa04390 10 ## hsa049755## hsa052216 setReadableFor GO analysis, we have a readable parameter to control whether traslating the IDs to human readable gene name. This parameter is not available for KEGG analysis. But we still have the ability to translate input gene IDs to gene name using setReadable function if and only if corresponding OrgDb object is available.y head(summary(y))## ID Description GeneRatio ## hsa04072 hsa04072 Phospholipase D signaling pathway 11/133## hsa04060 hsa04060 Cytokine-cytokine receptor## BgRatio pvalue p.adjustqvalue## hsa04072 216/9275 0.0002654190 0.039016590.03240905## hsa04060 354/9275 0.0005349245 0.039316950.03265855## hsa04390 213/9275 0.0009536247 0.041994040.03488227## hsa04975 58/9275 0.0014014886 0.041994040.03488227## hsa05221 86/9275 0.0014283687 0.041994040.03488227##geneID## hsa04072RAPGEF3/RAPGEF3/DGKG/MRAS/MRAS/MRAS/GRM5/ GRM5/CXCL8/CXCL8/PDGFRA## hsa04060CXCR6/CXCR6/CXCL3/IL2RA/CXCL8/CXCL8/IL12RB2/IL 12RB2/PDGFRA/CCL20/CXCL5/CXCL5/IL1R2/TNFRSF1 0D## hsa04390CTNNA3/CTNNA3/CTNNA3/NF2/NF2/LEF1/LEF1/BMP5/ BMP5/FZD9## hsa04975PLA2G2D/PLA2G2D/NPC1L1/NPC1L1/PLA2G1B ## hsa05221 LEF1/LEF1/PPARD/PPARD/RUNX1T1/RUNX1T1## Count## hsa04072 11## hsa04060 14## hsa04390 10## hsa04975 5## hsa05221 6 经常有人问我用enricher 或GSEA 分析的话,没有readable 参数,要知道这两函数是通用的富集分析工具,对于你要做什么(包括知识库,物种,ID 类型)是没有任何假设的,请问我该如何来为你自动转ID ,答案是不可能,但你自己做什么,心里应该有点 B 数,那么我为你提供了setReadable 函数,可以帮忙解决部分的ID 转换问题,当然肯定不是全部。