chapter7-转录调控与基因功能注释

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
exes
Add proteinspecific antibody
Amplify DNA and Label ChIP- chip
Hybridize to arrays

Reverse crosslinks and purify DNA PCR
Input DNA IgG Sp1 c-Jun
No DNA
logo→
frequency matrix →
(一)共有序列(consensus sequence)
将能与同一个转录因子结合的所有DNA 片段按照对应位
置进行排列,在每个位置上选择最可能出现的碱基,就
组成了该转录因子结合位点的共有序列。
共有序列中用A、C、G、T 之外的字母来表示结合位点
中各个位置上可能出现的碱基组合,这些字母称为 IUPAC 简并码。
针对某一特定候选转录因子,是否特异性结合于所调节的
靶基因某一预定区域内,如启动子区,进行检测。
对同一DNA底物, 可以运用多种不同的抗体 , 分别进行免疫
共沉淀,以确定多种结合蛋白在同一染色质片段上的结合。
基本实验过程

甲醛交联,稳定 蛋 白 质 -DNA 复 合 物

裂解细胞,分离 蛋 白 质 -DNA 复 合 物
结果分析的标准化尚待完善 分辨率较低,大于200 bp
基因芯片是 “封闭系统”, 只能检测已知序列
ChIP(染色质免疫沉淀)技术与芯片技术相结合后,产生了 染色质免疫共沉淀-芯片技术(Chromatin Immunoprecipitationchip, ChIP-chip)。免疫共沉淀结合微阵列技术可以在基因组范围 内筛选蛋白结合靶点,成为深入分析癌症、心血管疾病以及中央 神经系统紊乱等疾病的主要代谢通路的一种非常有效的工具。 一般来说,ChIP-chip分3步完成: ChIP:是在生理状态下把胞内蛋白质和DNA甲醛作用下交联在一起,用超
共有序列的表示方法简明易懂,却不能够反映每个位置
上不同碱基出现的概率。
IUPAC简并码
IUPAC code
W
Nucleotide
A or T
IUPAC code
B
Nucleotide
C, G or T
R
K S Y
A or G
G or T C or G C or T
D
H V N
A, G or T
二、 基因转录调节机制的研究方法
实验方法:
荧光素酶报告基因(luciferase report gene) 凝胶迁移(electrophoreticmobility shift assays) 染色质免疫沉淀(chromosome immunopreciation,
ChIP)
DNase 足迹法(DNase footprinting)
BIOINFORMATIC ANALYSIS OF TRANSCRIPTIONAL REGULATION
Wednesday, December 03, 2014
第 一 节


一 、基因转录调节的基本模式
transcription factor
cis-regulatory element
转录调控可以控制转录何时发生以及产生多少RNA。
c-Fos Target gene Negative control
ChIP- PCR
二、ChIP-chip技术
创立者: 2000年,Richard A. Young等人 特点:

ChIP和芯片技术的联合运用


全基因组范围内的定位分析
靶基因群的高通量分析
不足之处:

成本较高
A , C or T A, C or G A, C, G or T
M
A or C
(二)位置频率矩阵

位置频率矩阵可以反映出每个位置上不同碱基出现的概率。 该模型的一个前提假设是各个位置上碱基出现的概率相互独立。 矩阵每一列表示模体相应位置上四种碱基出现的概率。 对于长度为n的模体,碱基i(i={A, C, G, T})在模体第j 个位置上出现 的频率为q i,j,则整个模体用矩阵M表示如下:
Motif discovery
这种表示方法直观地给出模体各个位置上碱基出现的倾向
性和整个模体的序列的一致性。
二、转录因子结合位点的识别
基本概念:
通过收集可能被同一转录因子调控的基因启动子序列,在其中寻找
具有统计显著性的短片段,作为转录因子可能的结合位点,称之为转 录因子结合位点的识别
基本流程 :

收集可能被同一转录因子调控的多基因序列 通过多种计算方法从不同角度或不同层面去进行计算、评估和分析, 尽可能地屏蔽掉冗余序列和噪音序列,寻找出具有统计显著性的短 片段,作为转录因子可能的结合位点
信息学分析
第 二 节 转录调控的高通量实验测定
一、ChIP(染色质免疫沉淀)技术
创立者:上世纪八十年代末,Alexander Varshavsky等人
ChIP是研究体内蛋白质与DNA相互作用的一种技术。它 利用抗原抗体反应的特异性,可以真实地反映体内蛋白因子与 基因组DNA结合的状况。
特点:
实验设计的关键
抗体质量:一个灵敏度高和特异性高的抗体可以得到富集的DNA片段,这有利于 探测结合位点。
样本量:Illumina,10-50ng DNA,需要用PCR进行扩增的轮数也比较少,因而由 PCR导致的偏差比较小
空白对照:空白对照是必要的,存在很多假阳性情况,举例:1. 开放的染色体区 域更容易被打断成片段,这样导致tag数在基因组上的分布是不均匀的;2.很多重复 序列会使做map的时候得到结果难以解释。空白对照的用途:可以判断由ChIP-Seq 得到的peak时候具有统计上的显著性。 三种类型的空白对照:1.部分进行免疫共沉淀前的DNA(input DNA),这是最常 用的;2.由免疫共沉淀得到而不含有抗体的DNA(mock IP DNA),使用这个的一个 问题是收集到的量可能不够;3.使用非特异免疫共沉淀方法得到的DNA. 测序深度:在发表的ChIP-Seq实验中,一般使用Illumina Genome Analyzer上一个 lane产生的数据作为一个基本单位,目前一个lane大概是8-15million reads(2009 数据)。判断足够的测序深度的标准是:当增加测序,得到更多的reads的时候不 能发现更多的东西。应该这一准则到结合位点的数量上就是:进行测序,增加 reads数而无法得到更多的结合位点。
新的序列。
把细胞内的DNA与蛋白质交联 (Crosslink)后裂解细胞,分离
染色体
通过超声或酶处理将染色质随 机切割,利用抗原抗体的特异性 识别反应,将与目的蛋白相结合 的DNA片段沉淀下来
再通过反交联(Reverse
crosslink)释放结合蛋白的DNA 片段,
最后测序获得DNA片段的序列。
声波打碎为0.2-2 kb的染色体小片段,然后通过目的蛋白质特异性抗体沉淀此 复合物,获得特异地作用于目的蛋白结合的DNA片段;
DNA处理:通过对目的片段的纯化与检测,从而获得蛋白质与DNA相互作
用的信息。其中共沉淀的 DNA和合适的对照用荧光标记,加在载玻片上,用 于芯片分析;
芯片分析:使用外源性DNA作为背景,免疫沉淀DNA与作为背景的对照进
被RNA聚合酶转录的基因可被至少五种机制所调控:
特异性因子会改变RNA聚合酶对于特定启动子或一套启动子识别的特异性,使得 RNA聚合酶更多或更少地结合到这些启动子上。
阻遏因子会结合到DNA链上的靠近或覆盖启动子区域的那些非编码序列上,阻碍
RNA聚合酶顺利进入此链,故阻碍了基因的表达。 通用转录因子:这些转录因子将RNA聚合酶安放至编码蛋白序列的起始位置,继而 释放聚合酶以转录mRNA。 激活因子增强RNA聚合酶与特定启动子的相互作用,促进基因的表达。激活因子通 过增强RNA聚合酶对启动子的吸引而达到此作用,这一机制是通过与RNA聚合酶亚基的 相互作用或间接通过改变DNA结构而实现的。 增强子是位于DNA螺旋结构上的一些位点,它们通过与激活因子相结合以将DNA弯 曲使特定启动子朝向起始复合物。
q A,1 q A,2 ∙∙∙ q A,n
M= q
q C,1 q C,2 ∙∙∙ q C,n
G,1
q G,2 ∙∙∙ q G,n
q T,1 q T,2 ∙∙∙ q T,n
(三)序列标识图
序列标识图依次绘出模体中各个位置上出现的碱基,每个
位置上所有碱基的高度和反映了该位置上碱基的一致性,
每个碱基字母的大小与碱基在该位置上出现的频率成正比。
Cross-link whole cells with formaldehyde Isolate genomic Sonicate DNA DNA to produce sheared, soluble chromtin
sequencing
Region sequenced
ChIP- seq

加入特异性抗体, Immunoprecip 沉淀蛋白质 - DNA itate and purify 复合物 imminocompl 去交联,纯化 DNA 应 用 PCR 技 术 , 特异性扩增目的 DNA片段

查询相关转录因子数据库,以确定转录因子
基本流程
cDNA chip ChIP-chip ChIP-seq 2-D PAGE-MS
>seq-1 TTAACCTCTTATCTCTCCCCAAGATCCCTGAAGCCAGGTACGAGCAAGATGAGAGTGGGTTATCTCTGGA >seq-2 TCCTGTAGTGGGCATTCCAGGAGCAGAATGGCGTCATAATTCATTTACTCTATAAGTCAGAGAGAAAAAT ∙∙∙∙ >seq-n TATGTGGTTATTAAATGTTAAGGAGATGCAGAGTAGGGTAAATTGTTTATCTGAGAGGCTGGGCTTAGGA
三 种 主 要 数 据 分 布 类 型
第三节 转录因子结合位点的信息学预测方法
一、转录因子结合位点的的表示方法
(一)共有序列(consensus sequence) (二)位置频率矩阵(position frequency matrix) (三)序列标识图(sequence logo)
源自文库consensus→
行比较,可以找到特异性蛋白在基因组中的结合位点。
1、样本交联和片段化,将DNA结合蛋白与DNA进 行固定,形成蛋白:DNA复合物,然后超声片段化, 一部分片段化后的染色质样品预留为对照Input样 品,另一部分进行免疫共沉淀(称为IP样品); 2、免疫共沉淀,用特异抗体与蛋白:DNA复合物进 行免疫共沉淀; 3、磁珠富集抗体:蛋白:DNA复合物,再洗脱; 4、用蛋白酶K消化抗体:蛋白:DNA复合物(IP)以及蛋 白:DNA复合物(Input),解交联后分离dna片段,并 进行纯化; 5、取等量IP和Input样品进行WGA扩增,并对扩增 产物进行纯化; 6、用Klenow酶进行标记(IP标记cy5+Input标记cy3), 并纯化定量; 7、芯片杂交,将标记好的IP样品和Input样品杂交 到同一个点阵上; 8、芯片清洗及扫描; 9、图像采集及数据分析,利用IP/Input计算并确定 peak,有显著意义的peak即为目标蛋白结合区域; 10、提交结果报告,常规内容包括芯片原始数据、 目标蛋白结合位置以及基因注释。
三、ChIP-seq技术
创立者: 2007年,Steven J.M. Jones等人率先提出的 特点:

染色质免疫沉淀后的DNA,直接进行高通量测序。 是一个“开放系统”。它可以检测更小的结合区段、未知的结 合位点、结合位点内的突变情况和蛋白亲合力较低的区段。

成本低,周期短,省去了标记和杂交等步骤,并且勿需多次重 复实验,极大提高了工作效率。
分辨率可提高到30-50bp。

ChIP-Seq的优势 1. 具有碱基层面的分辨率;
2. 不会有ChIP-chip中由DNA片段杂交导致的噪音,GC
含量、片段长度、片段浓度以及耳机结构都会对杂
交造成影响;
3. ChIP-chip中的微阵列信号不是线性增长的,其所测 量的范围有限。 4. 由于在设计array时,探针的数量、种类有限,当 coverage比较高的时候无法准确测量,也无法发现
相关文档
最新文档