生物信息学(李霞)第1章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章 DNA、RNA和 蛋白质序列信息资源
DNA、RNA And Protein Sequence Information Resources
中国医科大学 赵雨杰
人民卫生出版社8年制及7年制临床精医品学课件等专业用《生物信息学》
生物信息学(bioinformatics)
• 在生命科学研究中发展起来的一门由分子
精品课件
人类基因突变及疾病相关数据库:
• 人类基因变异数据库(HMGD)、人类遗传双等位基因序列
数据库(HGBASE)、人类孟德尔遗传在线(OMIM)、国际 单体型计划(HapMap)、人类单核苷酸多态性数据库 (dbSNP)、肿瘤基因数据库(TGDB)、疾病关联数据库 (GAD)、癌症基因数据库(CGAP)、人类表观遗传数据 库(HEP)、人类DNA甲基化与癌症数据库(MethylCancer) 等。
精品课件
• 在NCBI(http://www.ncbi.nlm.nih.gov/)的主
页上提供了进入GenBank的路径、相关检索和分析 服务。
• 通过NCBI的检索系统(Entrez)可以进入GenBank。
Entrez检索程序整合了主要的DNA和蛋白序列数据 的分类学、基因组、图谱、蛋白结构和结构(功 能)域信息,还包括相关的PubMed的生物医学文 献信息。
• 2.3 高通量基因组(HTG)和高通量cDNA(HTC)序列 • 2.4 全基因组鸟枪测序序列(WGS) • 2.5 转录组鸟枪组合序列
精品课件
(一)GenBank数据库结构
• 3. 特殊记录类型
• 3.1 第三方注释(TPA) • 3.2 GenBank CON记录 较小记录组合记录
精品课件
精品课件
生物信息学研究重点
• 主要体现在基因组学(genomics)和蛋白
质组学(proteomics)两方面。它从核酸 和蛋白质序列出发,分析序列中与结构、 功能相关的生物信息的表达。
精品课件
生物信息学数据库
• 生物信息学中的各类数据库几乎覆盖了生
命科学的各个领域,如核酸序列数据库, 蛋白质序列数据库,蛋白质、核酸、多糖 的三维结构数据库,基因组数据库,文献 数据库和其他种类数据库。
• BLAST程序提供GenBank和其他序列数据库中序列
相似性搜索服务。
精品课件
(一)GenBank数据库结构
• 1. 依据序列的物种来源分类 • 2. Genbank记录和分类
• 2.1 表达序列标签(EST) • 2.2 序列标签位点(STS)、基因组勘测序列(GSS)和
环境样品序列(ENV)
精品课件
生物信息学数据库分类
生物信息数据库种类繁多,就目前来看, 大体
可以分为四个大类:
一
1.基因组数据库;
次
2.核酸和蛋白质一级结构序列数据库;
数 据
3.生物大分子(主要是蛋白质)三维空间 结构数据库;
库
4.根据以上三类数据库和文献资料为基 础构建的二次数据库。也称专门数据库、
专业数据库或专用数据库。
精品课件
一、GenBank数据库
• GenBபைடு நூலகம்nk
(http://www.ncbi.nlm.nih.gov/genbank /)是一个综合数据库,该数据库中包含了 已经公开的30万余种不同物种生物的核酸 序列,这些数据主要来源于全世界不同实 验室和大规模测序计划项目。
精品课件
• GenBank是具有目录和生物学注释的核酸序列综合
精品课件
三大核酸序列数据库
• GenBank • EMBL • DDBJ
精品课件
特殊类型核酸序列数据库:
• 非编码RNA数据库(ncRNA); • 表达序列标签数据库(dbEST); • 序列标签位点数据库(dbSTS); • miRBase ; • tRNAdb等。
精品课件
基因组相关数据库:
精品课件
• GenBank数据库每天与欧洲分子生物学实验
室的核酸序列数据库(European Molecular Biology Laboratory Nucleotide Sequence Database,EMBL) 和日本的DNA数据库(DNA Data Bank of Japan DDBJ)进行数据交换,以保证数据 库内容在全世界范围的同步性。
数据库,由美国国家医学图书馆的国家生物技术信 息中心构建、维护和管理。该中心位于美国马里兰 国家健康研究所(NIH)。GenBank数据库的序列数 据来源于序列发现者提交的序列、批量提交的表达 序列标签(expressed sequence tag, EST)、基 因组测序序列(genome survey sequence, GSS) 和其他测序中心提供的高通量数据,还包括美国专 利商标局提供的已发表专利的序列数据。
(二)构建数据库
• 1.直接电子提交
• 1.1 使用BankIt提交 • 1.2 使用Sequin和tbl2asn提交 • 1.3 条形码序列提交
生物学与计算机信息处理技术相结合,以 计算机为研究工具对生物信息进行获取、 处理、储存、传播、分析、模拟和解释的 交叉学科。
精品课件
生物信息学研究内容
• 它利用数据库技术和软件技术对大量积累
的生物大分子序列数据进行比较和分析, 揭示出生物大分子的分子结构、功能和进 化关系以及基因组构成与基因表达等生物 学事件对生命活动的影响。
精品课件
第二节 核酸序列数据库
Section 2 Nucleic Acid sequence Databases
• 自20世纪80年代第一个核酸数据库建立以来,核
酸数据库迅速发展。在互联网上不仅有核酸序列 数据库,还出现了基因组相关数据库、核酸三维 结构数据库、基因表达数据库、人类基因突变及 疾病相关数据库、进化相关数据库及其他与核酸 有关的数据库。
• 人类基因组数据库(HGD); • 基因组序列数据库(GSDB); • 基因组在线数据库(GOLD)等。
精品课件
核酸三维结构数据库:
• 核苷酸三维结构数据库(NDB); • 普纳大学核酸结构数据库(BNASDB)等。
精品课件
基因表达数据库:
• 基因表达库(GEO); • 斯坦福微阵列数据库(SMD); • ArrayExpress; • CGED; • GXD; • BodyMap 等。
DNA、RNA And Protein Sequence Information Resources
中国医科大学 赵雨杰
人民卫生出版社8年制及7年制临床精医品学课件等专业用《生物信息学》
生物信息学(bioinformatics)
• 在生命科学研究中发展起来的一门由分子
精品课件
人类基因突变及疾病相关数据库:
• 人类基因变异数据库(HMGD)、人类遗传双等位基因序列
数据库(HGBASE)、人类孟德尔遗传在线(OMIM)、国际 单体型计划(HapMap)、人类单核苷酸多态性数据库 (dbSNP)、肿瘤基因数据库(TGDB)、疾病关联数据库 (GAD)、癌症基因数据库(CGAP)、人类表观遗传数据 库(HEP)、人类DNA甲基化与癌症数据库(MethylCancer) 等。
精品课件
• 在NCBI(http://www.ncbi.nlm.nih.gov/)的主
页上提供了进入GenBank的路径、相关检索和分析 服务。
• 通过NCBI的检索系统(Entrez)可以进入GenBank。
Entrez检索程序整合了主要的DNA和蛋白序列数据 的分类学、基因组、图谱、蛋白结构和结构(功 能)域信息,还包括相关的PubMed的生物医学文 献信息。
• 2.3 高通量基因组(HTG)和高通量cDNA(HTC)序列 • 2.4 全基因组鸟枪测序序列(WGS) • 2.5 转录组鸟枪组合序列
精品课件
(一)GenBank数据库结构
• 3. 特殊记录类型
• 3.1 第三方注释(TPA) • 3.2 GenBank CON记录 较小记录组合记录
精品课件
精品课件
生物信息学研究重点
• 主要体现在基因组学(genomics)和蛋白
质组学(proteomics)两方面。它从核酸 和蛋白质序列出发,分析序列中与结构、 功能相关的生物信息的表达。
精品课件
生物信息学数据库
• 生物信息学中的各类数据库几乎覆盖了生
命科学的各个领域,如核酸序列数据库, 蛋白质序列数据库,蛋白质、核酸、多糖 的三维结构数据库,基因组数据库,文献 数据库和其他种类数据库。
• BLAST程序提供GenBank和其他序列数据库中序列
相似性搜索服务。
精品课件
(一)GenBank数据库结构
• 1. 依据序列的物种来源分类 • 2. Genbank记录和分类
• 2.1 表达序列标签(EST) • 2.2 序列标签位点(STS)、基因组勘测序列(GSS)和
环境样品序列(ENV)
精品课件
生物信息学数据库分类
生物信息数据库种类繁多,就目前来看, 大体
可以分为四个大类:
一
1.基因组数据库;
次
2.核酸和蛋白质一级结构序列数据库;
数 据
3.生物大分子(主要是蛋白质)三维空间 结构数据库;
库
4.根据以上三类数据库和文献资料为基 础构建的二次数据库。也称专门数据库、
专业数据库或专用数据库。
精品课件
一、GenBank数据库
• GenBபைடு நூலகம்nk
(http://www.ncbi.nlm.nih.gov/genbank /)是一个综合数据库,该数据库中包含了 已经公开的30万余种不同物种生物的核酸 序列,这些数据主要来源于全世界不同实 验室和大规模测序计划项目。
精品课件
• GenBank是具有目录和生物学注释的核酸序列综合
精品课件
三大核酸序列数据库
• GenBank • EMBL • DDBJ
精品课件
特殊类型核酸序列数据库:
• 非编码RNA数据库(ncRNA); • 表达序列标签数据库(dbEST); • 序列标签位点数据库(dbSTS); • miRBase ; • tRNAdb等。
精品课件
基因组相关数据库:
精品课件
• GenBank数据库每天与欧洲分子生物学实验
室的核酸序列数据库(European Molecular Biology Laboratory Nucleotide Sequence Database,EMBL) 和日本的DNA数据库(DNA Data Bank of Japan DDBJ)进行数据交换,以保证数据 库内容在全世界范围的同步性。
数据库,由美国国家医学图书馆的国家生物技术信 息中心构建、维护和管理。该中心位于美国马里兰 国家健康研究所(NIH)。GenBank数据库的序列数 据来源于序列发现者提交的序列、批量提交的表达 序列标签(expressed sequence tag, EST)、基 因组测序序列(genome survey sequence, GSS) 和其他测序中心提供的高通量数据,还包括美国专 利商标局提供的已发表专利的序列数据。
(二)构建数据库
• 1.直接电子提交
• 1.1 使用BankIt提交 • 1.2 使用Sequin和tbl2asn提交 • 1.3 条形码序列提交
生物学与计算机信息处理技术相结合,以 计算机为研究工具对生物信息进行获取、 处理、储存、传播、分析、模拟和解释的 交叉学科。
精品课件
生物信息学研究内容
• 它利用数据库技术和软件技术对大量积累
的生物大分子序列数据进行比较和分析, 揭示出生物大分子的分子结构、功能和进 化关系以及基因组构成与基因表达等生物 学事件对生命活动的影响。
精品课件
第二节 核酸序列数据库
Section 2 Nucleic Acid sequence Databases
• 自20世纪80年代第一个核酸数据库建立以来,核
酸数据库迅速发展。在互联网上不仅有核酸序列 数据库,还出现了基因组相关数据库、核酸三维 结构数据库、基因表达数据库、人类基因突变及 疾病相关数据库、进化相关数据库及其他与核酸 有关的数据库。
• 人类基因组数据库(HGD); • 基因组序列数据库(GSDB); • 基因组在线数据库(GOLD)等。
精品课件
核酸三维结构数据库:
• 核苷酸三维结构数据库(NDB); • 普纳大学核酸结构数据库(BNASDB)等。
精品课件
基因表达数据库:
• 基因表达库(GEO); • 斯坦福微阵列数据库(SMD); • ArrayExpress; • CGED; • GXD; • BodyMap 等。