第11章转录调控的信息学分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
consensus→
consensus→
logo→
logo→
frequency matrix →
➢ 将能与同一个转录因子结合的所有DNA 片段 按照对应位置进行排列,在每个位置上选择 最可能出现的碱基,就组成了该转录因子结 合位点的共有序列。
➢ 共性序列中用A、C、G、T 之外的字母来表 示结合位点中各个位置上可能出现的碱基组 合,这些字母称为IUPAC 简并码。
➢ 荧光素酶报告基因(luciferase report gene) ➢ 凝胶迁移(electrophoreticmobility shift assays) ➢ 染色质免疫沉淀(ChIP) ➢ DNase 足迹法(DNase footprinting)
信息学分析
第二节 转录调控的高通量实验测定
学习提纲 ➢ 难点:
✓ 转录因子结合位点识别的操作步骤和相关 算法的使用
➢ 熟悉:
✓ 转录调控相关数据库
Leabharlann Baidu
第一节 引 言
Introduction
一 、基因转录调节的基本模式
transcription factor
cis-regulatory element
二、 基因转录调节机制的研究方法
实验方法:
Y
C or T
N
A,C,G or T
M
A or C
(二)位置频率矩阵(position frequency matrix) ➢ 位置频率矩阵可以反映出每个位置上不同 碱基出现con的sens概us→ 率。
logo→
consensus→
frequency matrix →
logo→
frequency matrix →
High-throughput Techniques in Transcriptional Regulation Analysis
一、ChIP技术
创立者: 20世纪80年代末 Alexander Varshavsky等人 (Cell. 1988,53(6): 937-947 )
基本实验过程:
➢ 甲醛交联,稳定蛋白质-DNA复合物 ➢ 裂解细胞,分离蛋白质-DNA复合物 ➢ 加入特异性抗体,沉淀蛋白质-DNA复合物 ➢ 去交联,纯化DNA ➢ 应用PCR技术,特异性扩增目的DNA片段
第十一章 转录调控的信息学分析
Bioinformatic Analysis of Transcriptional Regulation
学习提纲
➢ 重点:
✓ 转录因子结合位点的识别及其定位的基本 概念和表示方法
✓ 转录因子结合位点识别的操作步骤和相关 算法的使用
✓ 转录因子结合位点定位预测软件的使用
➢ 成本低,周期短,省去了标记和杂交等步骤,并且 无需多次重复实验,极大提高了工作效率
➢ 分辨率可提高到30~50bp
第 三 节 转录因子结合位点的 信息学预测方法
Prediction of Transcriptional Factor Binding sites
一、转录因子结合位点的的表示方法
(一)共性序列(consensus sequence)
(Science. 2000, 290(5500): 2306-2309 )
特点: ➢ ChIP和芯片技术的联合运用 ➢ 全基因组范围内的定位分析 ➢ 靶基因群的高通量分析
不足之处: ➢ 成本较高 ➢ 结果分析的标准化尚待完善 ➢ 分辨率较低,大于200 bp ➢ 基因芯片是 “封闭系统”, 只能检测已知序 列
三、ChIP-seq技术
创立者: 特点:
2007年,Steven J.M. Jones等人
(Science. 2000, 290(5500): 2306-2309 )
➢ 染色质免疫沉淀后的DNA,直接进行高通量测序
➢ 是一个“开放系统”。它可以检测更小的结合区段、 未知的结合位点、结合位点内的突变情况和蛋白亲 合力较低的区段
➢ 共性序列的表示方法简明易懂,却不能够反 映每个位置上不同碱基出现的概率。
IUPAC简并码
IUPAC code Nucleotide IUPAC code Nucleotide
W
A or T
B
C,G or T
R
A or G
D
A,G or T
K
G or T
H
A,C or T
S
C or G
V
A,C or G
M= q G,1 q G,2 ∙∙∙ q G,n
q T,1 q T,2 ∙∙∙ q T,n
(三)序列标识图(sequence logo)
➢ 序列标识图依次绘出模体中各个位置上出现的 碱基,每个位置上所有碱基的高度和反映了该 位置上碱基的一致性,每个碱基字母的大小与 碱基在该位置上出现的频率成正比。
特点:
➢ 针对某一特定候选转录因子,是否特异性 结合于所调节的靶基因某一预定区域内, 如启动子区,进行检测。
➢ 对同一DNA底物, 可以运用多种不同的抗体, 分别进行免疫共沉淀,以确定多种结合蛋白 在同一染色质片段上的结合。
二、ChIP-chip技术
创立者: 2000年,Richard A. Young等人
➢ 该模型的一个前提假设是各个位置上碱基 出现的概率相互独立。
➢ 矩阵每一列表示模体相应位置上四种碱基 出现的概率。
➢ 对于长度为n的模体,碱基i(i={A, C, G, T})在模体第j 个位置上出现的频率为q i,j,则整个模体用矩阵M表示如下:
q A,1 q A,2 ∙∙∙ q A,n q C,1 q C,2 ∙∙∙ q C,n
基本流程 :
➢ 收集可能被同一转录因子调控的多基因序列
➢ 通过多种计算方法从不同角度或不同层面去 进行计算、评估和分析,尽可能地屏蔽掉冗 余序列和噪音序列,寻找出具有统计显著性 的短片段,作为转录因子可能的结合位点
➢ 查询相关转录因子数据库,以确定转录因子
基本流程
cDNA chip
ChIP-chip ChIP-seq 2-D PAGE-MS
➢ 这种表示方法直观地给出模体各个位置上碱基 出现的倾向性和整个模体的序列的一致性。
consensus→ logo→
frequency matrix →
二、转录因子结合位点的识别
基本概念: ➢ 通过收集可能被同一转录因子调控的基因启
动子序列,在其中寻找具有统计显著性的短 片段,作为转录因子可能的结合位点,称之 为转录因子结合位点的识别
相关文档
最新文档