生物测序技术概述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
研究深度多样化
从大规模功能转录本发掘到特定基因的可变剪接的不同功能 分析,都可以定位研究。
二、基因注释和注释库简介
基因功能注释简介
同源序列比对探寻基因功能
比对工具blast
基因功能注释数据库
nr、nt、Uniprot COG、interproscan、Kegg、GO
BLAST
Sequence archive, used to keep track of sequences and their identifiers.
UniProtKB/Swiss-Prot
BLAST简介
命令及参数简介
建库命令(formatdb) 比对类型,5种不同的比对程序
程序名 查询序列类型 查询数据库类型
应用
blastp 蛋白质
蛋白质
使用取代矩阵寻找较远 关系
blastn 核酸
核酸
寻找较高分值的匹配, 对较远关系不太适用
blastx 核酸(翻译) 蛋白质
用于分析新的cDNA序列 或EST
UNIPROT简介
Uniprot数据库的最重要组成部分
UniprotKB(Uniprot knowledgebase)
UniProtKB
Protein knowledgebase, consists of two sections:
Swiss-Prot, which is manually annotated and reviewed.
转录组测序是针对特定样品特定时期的转录mRNA的测序技术, 重点在对翻译蛋白的mRNA的测序研究。
DNA-seq
RNA-seq
The Central Dogma of Molecular Biology
• The genome is only a source of information. In order to function, it must be expressed. The transcription of genes to produce RNA is the first stage of gene 7 expression . The transcriptome is the complete set of RNA transcripts produced by the genome at any one time.
转录组测序兴起的背景
生物信息学的大发展
自从人类基因组测序完成,宣布后基因组时代的研究到 来,基于测序的生物信息学发展空前爆发。
转录组测序的特点
应用对象灵活广泛
针对不同物种,不同个体,不同时期,都可以在mRNA水平 准确的分析性状或功能差异,结构变异等信息。
研究范围多样化
从未知基因组物种,到研究成熟的人体病变组织,小鼠组织 等特异组织,均可通过转录组分析进行研究。
UniProt是一个集中收录蛋白质资源并能与其它资源相互 联系的数据库,也是目前为止收录蛋白质序列目录最广 泛、功能注释最全面的一个数据库。
整合三大数据库:Swissprot、TrEMBL、PIR(Protein Information Resource)。
数据库组成:UniprotKB(知识库)、Uniprotarc(归档) 、Uniref(参考资料库)。
第十一讲 生物测序技术概述 转录组测序
转录本
All transcr源自文库pts
All mRNAs
一、转录组测序简介
转录组
转录组概念由Velculescu等在1995年首次提出。 转录组:广义上指一个细胞内基因组DNA转录得到的
所有转录产物以及转录物在细胞特定发育时期或特定 生理条件下的表达水平,包括编码RNA(mRNA)和非 编码RNA(如tRNA、rRNA、snRNA、miRNA等),狭义 上指所有mRNA的集合。 转录组研究是基因功能及结构研究的基础和出发点 ,是解读基因组功能原件和揭示细胞及组织分子组 成所必需的。
TrEMBL, which is automatically annotated and is not reviewed.
Includes complete and reference proteome sets.
UniRef UniParc
Sequence clusters, used to speed up sequence similarity searches.
Basic Local Alignment Search Tool (BLAST)
结合了动态规划算法和间接的启发式算法的优点,同时 把数据库检索建立在严格的统计学基础之上,是目前最 常用的同源检索工具。
局部比对软件
比对比较精确细致 用来做同源序列比对,进行基因功能注释 耗时较长
nt(Nucleotide collection)
包含GenBank和PDB中(不包含EST,STS,GSS)的所有 核苷酸序列信息,存在冗余的数据库,数据库完整度高 。
NR&NT比对结果
nr&nt注释结果
UNIPROT
Uniprot(Universal Protein Resource)
什么是转录组测序
RNA测序又称转录组测序,就是把 mRNA,smallRNA和 non-coding RNA (ncRNA)全部或者其中一些用高通量 测序技术进行测序分析的技术。
什么是转录组测序
RNA_Seq的重要分支
RNA_Seq是指针对转录产物RNA的测序技术,主要有以下分支:
转录组分析 表达谱分析 小RNA分析 降解组测序 针对mRNA的测序
tblastn 蛋白质
核酸(翻译)
用于寻找数据库中没有 标注的编码区
tblastx 核酸(翻译) 核酸(翻译)
用于更进一步的分析EST
BLAST结果简介
BLAST比对结果详解
14
NR&NT
nr(Non-redundant protein sequences)
包含GenBank所有编码序列,以及PDB,swissprot,PIR, PRF数据库的所有编码序列的一个非冗余数据库,数据库 完整度高,氨基酸序列数据库。
从大规模功能转录本发掘到特定基因的可变剪接的不同功能 分析,都可以定位研究。
二、基因注释和注释库简介
基因功能注释简介
同源序列比对探寻基因功能
比对工具blast
基因功能注释数据库
nr、nt、Uniprot COG、interproscan、Kegg、GO
BLAST
Sequence archive, used to keep track of sequences and their identifiers.
UniProtKB/Swiss-Prot
BLAST简介
命令及参数简介
建库命令(formatdb) 比对类型,5种不同的比对程序
程序名 查询序列类型 查询数据库类型
应用
blastp 蛋白质
蛋白质
使用取代矩阵寻找较远 关系
blastn 核酸
核酸
寻找较高分值的匹配, 对较远关系不太适用
blastx 核酸(翻译) 蛋白质
用于分析新的cDNA序列 或EST
UNIPROT简介
Uniprot数据库的最重要组成部分
UniprotKB(Uniprot knowledgebase)
UniProtKB
Protein knowledgebase, consists of two sections:
Swiss-Prot, which is manually annotated and reviewed.
转录组测序是针对特定样品特定时期的转录mRNA的测序技术, 重点在对翻译蛋白的mRNA的测序研究。
DNA-seq
RNA-seq
The Central Dogma of Molecular Biology
• The genome is only a source of information. In order to function, it must be expressed. The transcription of genes to produce RNA is the first stage of gene 7 expression . The transcriptome is the complete set of RNA transcripts produced by the genome at any one time.
转录组测序兴起的背景
生物信息学的大发展
自从人类基因组测序完成,宣布后基因组时代的研究到 来,基于测序的生物信息学发展空前爆发。
转录组测序的特点
应用对象灵活广泛
针对不同物种,不同个体,不同时期,都可以在mRNA水平 准确的分析性状或功能差异,结构变异等信息。
研究范围多样化
从未知基因组物种,到研究成熟的人体病变组织,小鼠组织 等特异组织,均可通过转录组分析进行研究。
UniProt是一个集中收录蛋白质资源并能与其它资源相互 联系的数据库,也是目前为止收录蛋白质序列目录最广 泛、功能注释最全面的一个数据库。
整合三大数据库:Swissprot、TrEMBL、PIR(Protein Information Resource)。
数据库组成:UniprotKB(知识库)、Uniprotarc(归档) 、Uniref(参考资料库)。
第十一讲 生物测序技术概述 转录组测序
转录本
All transcr源自文库pts
All mRNAs
一、转录组测序简介
转录组
转录组概念由Velculescu等在1995年首次提出。 转录组:广义上指一个细胞内基因组DNA转录得到的
所有转录产物以及转录物在细胞特定发育时期或特定 生理条件下的表达水平,包括编码RNA(mRNA)和非 编码RNA(如tRNA、rRNA、snRNA、miRNA等),狭义 上指所有mRNA的集合。 转录组研究是基因功能及结构研究的基础和出发点 ,是解读基因组功能原件和揭示细胞及组织分子组 成所必需的。
TrEMBL, which is automatically annotated and is not reviewed.
Includes complete and reference proteome sets.
UniRef UniParc
Sequence clusters, used to speed up sequence similarity searches.
Basic Local Alignment Search Tool (BLAST)
结合了动态规划算法和间接的启发式算法的优点,同时 把数据库检索建立在严格的统计学基础之上,是目前最 常用的同源检索工具。
局部比对软件
比对比较精确细致 用来做同源序列比对,进行基因功能注释 耗时较长
nt(Nucleotide collection)
包含GenBank和PDB中(不包含EST,STS,GSS)的所有 核苷酸序列信息,存在冗余的数据库,数据库完整度高 。
NR&NT比对结果
nr&nt注释结果
UNIPROT
Uniprot(Universal Protein Resource)
什么是转录组测序
RNA测序又称转录组测序,就是把 mRNA,smallRNA和 non-coding RNA (ncRNA)全部或者其中一些用高通量 测序技术进行测序分析的技术。
什么是转录组测序
RNA_Seq的重要分支
RNA_Seq是指针对转录产物RNA的测序技术,主要有以下分支:
转录组分析 表达谱分析 小RNA分析 降解组测序 针对mRNA的测序
tblastn 蛋白质
核酸(翻译)
用于寻找数据库中没有 标注的编码区
tblastx 核酸(翻译) 核酸(翻译)
用于更进一步的分析EST
BLAST结果简介
BLAST比对结果详解
14
NR&NT
nr(Non-redundant protein sequences)
包含GenBank所有编码序列,以及PDB,swissprot,PIR, PRF数据库的所有编码序列的一个非冗余数据库,数据库 完整度高,氨基酸序列数据库。