生物信息学中常用的数据类型和数据库类型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

生物信息学中常用的数据类型和数据库类型

在生物信息学中,常用的数据类型包括:

1. 基因组序列数据:包括DNA和RNA序列的原始数据,如FASTA格式或FASTQ格式。

2. 转录组数据:包括基因表达谱、剪接变异等,如RNA-seq数据。

3. 蛋白质序列数据:包括蛋白质的氨基酸序列,如UniProt数据库。

4. 基因组结构数据:包括基因位置、外显子、内含子等信息。

5. 遗传变异数据:包括SNP、INDEL、CNV等遗传变异信息。

6. 蛋白质结构数据:包括蛋白质的三维空间结构,如PDB数据库。

在生物信息学中,常用的数据库类型包括:

1. 基因组数据库:如NCBI GenBank、ENSEMBL等,存储基因组序列和注释信息。

2. 转录组数据库:如NCBI SRA、ENA等,存储RNA-seq和其他转录组数据。

3. 蛋白质数据库:如UniProt、Swiss-Prot等,存储蛋白质序列和注释信息。

4. 遗传变异数据库:如dbSNP、ClinVar等,存储遗传变异信息。

5. 蛋白质结构数据库:如PDB、CATH等,存储蛋白质的三维结构信息。

6. 功能注释数据库:如GO数据库、KEGG数据库等,存储基因和蛋白质的功能注释信息。

7. 互作数据库:如STRING数据库、BioGRID数据库等,存储基因和蛋白质之

间的相互作用信息。

相关文档
最新文档