生物信息学基因组分析文稿演示

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

tRNA & rRNA
snoRNAs
snoRNAs: Small nucleolar RNAs; 介导 其他RNA分子的化学修饰,例如甲基化
microRNA/miRNA
1. 长度21-23bp 2. 调控基因的表达 3. pre-miRNA: ~70bp
Transposon
转座子:在基因组中能够移动位置的DNA 序列
a. SUMO化位点存在ψ-K-X-E模体 b. 核定位信号 (NLS) c. 人和小鼠中,SUMO化位点应当保守 d. 功能分析:Gene Ontology
(3) 分析结果:
a. 2,683个人-小鼠保守的SUMO化底物 b. SUMO化的功能:参与转录调控、信号转导等
Gene Ontology:基因本体论
mRNA Splicing isoform 1 isoform 2 isoform 3
蛋白质层面:翻译后修饰
Phosphorylation
Sumoylation Palmitoylation
Ubiquitination
Acetylation
(4) 相互作用网络
蛋白质-蛋白 质相互作用 网络
细胞信号通路
2. 基因组注释
(1) 基因组序列的拼装 (2) 基因预测 (3) 可变剪切的预测 (4) 非编码的功能元件的预测
(1) 基因组测序:鸟枪法
基因组的拼装
重复序列带来干扰
(2) 基因预测
直接的,序列高度匹配
同一或近缘物种中,与EST,cDNA, 蛋白质 等序列完美或近似完美的匹配
间接的,基于统计学的
生物信息学基因组分析文稿演示
基因组、转录组和蛋白质组
基因组 转录组 蛋白质组
化学生物学
本章内容提要
1. 基因组的结构与内容 2. 基因组注释 3. 比较基因组学 4. 基因/蛋白质的功能预测
1. 基因组的结构与内容
(1) 基因的结构 (2) mRNA:可变剪切 (3) 蛋白质:翻译后修饰 (4) 相互作用网络:基因、蛋白质、小分子之间
转录因子
In human proteome:
DNA binding (GO:0003677): 2, 255 Transcription factor activity (GO:0003700): 1, 102 regulation of transcription, DNA-dependent (GO:0006355): 2,
2. Codon Usage: CAI …
HMM model for Gene Prediction (Genie)
Kulp, D., PhD Thesis, UCSC 2003
(3) 可变剪切的预测
将EST, cDNA序列比对到基因组上
部分有向图算法
3. 比较基因组学
(1) 有功能的通常保守 (2) 例:SUMO底物的预测:
… 3’ … 5’
promoter (~103 bp) enhancers (~101-102 bp)
Polyadenylation site
other regulatory sequences (~ 101-102 bp)
基因的其他特征
1. ORF (Open Reading Frame): 从 AUG开始,至stop codon终止
Non-coding RNA
1. 不翻译成蛋白质,具有重要的调控功能 2. 分类:
a. transfer RNA (tRNA) b. ribosomal RNA (rRNA) c. snoRNAs, d. microRNAs, e. siRNAs f. piRNAs: 与piwi相互作用的RNA g. long ncRNAs: Xist …
G1/S检验点: 有调控方向
(5) 非编码区
a. 功能元件: 转录因子结合位点;启动 子…
b. Non-coding RNA: MicroRNA c. 转座子 d. 重复片段 e. 伪基因 (Pseudogene)
Functional elements: Promotor
Transcription Factor Binding Site
a.序列比对 (Homology) b.从头预测(ab initio) c.以上两种方法的结合
真核生物的基因结构
5’
~ 1-100 Mbp
3’
3’
5’
5’ … 3’ …
~ 1-1000 kbp
exons (cds & utr) / introns
(~ 102-103 bp)
(~ 102-105 bp)
1. 描述基因/蛋白质的功能 2. 三类术语(Term):
a. Cellular component: 在哪里? b. Biological process: 干什么? c. Molecular function:我是谁?
Gene Ontology:基因本体论
功能显著性分析:超几何分布
2. 当前解释:蛋白质组的多样性和复杂性 -> 物种的 多样性和复杂性;~10,000,000种蛋白质分子
3. 两种观点:
a. 转录后层面,mRNA剪切,产生拼接异构体 b. 蛋白质层面,蛋白质序列上一个或多个位点上发生的
翻译后修饰
Genotype to Phenotype
转录后层面:mRNA Splicing
CRM: cisregulatory modules
Gal4p and Kruppel
Gal4p
Kruppel
其他功能元件
Exon splicing enhancer (ESE) and silencer (ESS) Intron splicing enhancer (ISE) and silencer (ISS)
的相互作用 (5) 非编码区
a. 功能元件: 转录因子结合位点;启动子… b. Non-coding RNA: MicroRNA c. 转座子 d. 重复片段 eห้องสมุดไป่ตู้ 伪基因 (Pseudogene)
(1) 基因的结构
基因组大小 & 基因数
基因数量 -> 生物复杂性?
1. 基因数量的变化,无法解释生物学功能、调控机 理以及物种多样性和复杂性的巨大变化
相关文档
最新文档