第十章 计算表观遗传学

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

NimbleGen
微阵列
全基因组甲
基化测定
长寡核苷酸探针产生
更纯净的数据,双通 道杂交,定制芯片不
较Affymetrix芯
片的探针密度小
昂贵,价格合理
DNA甲基化大规模分析可用平台一览表
技术 Agilent微阵 列 应用 大规模甲 基化测定 优势 长寡核苷酸探针产 生更纯净的数据, 双通道杂交 Solexa测序 局限 较Affymetrix和 NimbleGen芯 片的探针密度小 得多 全基因组 定量化,无需杂交, 下一代技术,需 甲基化测 并行的基因型信息 要购买昂贵的仪
meet the CpG island criteria
Then slide the window back toward the island.
Keep sliding until the window meets CpG island criteria.
If it doesn’t meet the criteria, try trimming a base pair off each end and analyzing again.
第二节 基因组的DNA甲基化
Section 2
Genome-wide DNA Methylation
一、CpG岛的DNA甲基化调控基因表达
(一) DNA甲基化与CpG岛

DNA甲基化是一种发生在DNA序列上的化学修饰, 可以在转录及细胞分裂前后被稳定地遗传。DNA甲 基化是重要的表观遗传代码。
DNA甲基化的发生机制
And analyze again.
And again.
Until it meets the criteria
Then jump ahead and check the window adjacent to the island on the 3’ side.
Repeat as needed, until the new window does not
定,分析
印记位点
器或服务
四、异常DNA甲基化特征识别
(一)癌症基因组整体低甲基化 (二)癌基因的印记丢失 (三)基因超甲基化是癌症的标志
不同癌症之间存在差异

MeInfoText和PubMeth数据库汇总了癌症特异的异 常甲基化信息。使用生物信息学方法有助于进一步 扩充已知的异常甲基化基因列表的信息。
DNA甲基化与基因的组织特异表达
二、基因组CpG岛识别方法
(一)CpG岛识别准则
1. 最初的CpG岛定义

Gardiner-Garden和Frommer
• • •
长度最短200bp GC含量至少50% CpG O/E最小0.6

许多启动子缺乏严格定义的CpG岛,但是有组织
特异的甲基化模式和转录活性有密切联系。
三、计算表观遗传学研究方向
预测的角度研究表观遗传现象。 应用生物信息学工具建立遗传与表观遗传调控
网络。
表观遗传数据库。 建立在表观遗传机制基础的功能基因组及比较
基因组研究。
四、计算表观遗传学研究内容
(一)数据层面
分子水平的表观遗传修饰
(二)数据分类
(三)算法层面
开发新 方法 和工具
(三)计算表观遗传学与进化
DNA甲基化的进化分析
DNA甲基化的进化分析
DNA甲基化的进化分析
DNA甲基化和组蛋白修饰有潜在的临床用途 附加的诊断工具 用于普遍临床实践
抑癌基因高甲基化和DNA 预后因子 高甲基化谱可用于癌症病 人预后指示器 特定基因的高甲基化可对 治疗反应进行预测
治疗反应预测
CpGcluster 无限 制 CpG_MI ≥50
差异取决于以下因素
(1)任意阈值的应用; (2)没有考虑到CpG岛的异质性; (3)基于DNA序列的预测方法忽略了DNA甲基化状态。
举例:窗口法 Analyze a window.
Does it meet CpG island criteria? If not, slide to the right one nucleotide
DNA甲基化大规模分析可用平台一览表
技术 阵列 应用 性发现和分 析 Affymetrix 芯片 全基因组甲 基化测定 优势 定量,多达96个样品 的同时快速分析 局限 需要设计引物文 库,同时只能分 析1536个位点 探针密度大,支持物 短寡核苷酸噪声 种多,可定制,价格 大,单通道杂交, 合理 定制芯片昂贵 Illumina磁珠 甲基化多态
因组DNA中提取CpG岛。他们从人类血液中提取了 超过17000个CpG岛。
实验方法确定的基因组范围CpG岛图谱
(三)CpG岛定位有助于发现新基因
CpG岛是重要的调控元件,可用于新基因的发现。
CpG岛通常是不被甲基化的,作为管家基因的重
要标志之一。
UCSC数据库的截图展示了三个CpG岛
三、实验检测技术测定DNA甲基化状态
癌症相关的子网
五、计算表观遗传学的应用
(一)计算表观遗传学与疾病
肿瘤 代谢性 疾病 神经退行 性疾病
精神性
疾病
心血管 疾病
肿瘤抑制基因表达
内源性逆转录表达
染色质结构异常
肿瘤表观遗传的特征
精神性疾病DNA甲基化的特征
(二)计算表观遗传学与发育
发育中DNA甲基化的特征
早期胚胎DNA甲基化的特征
削减
削减
Once it meets CpG island criteria, move on to the
next adjacent window and analyze that.
削减
(二)实验方法寻找CpG岛
Illingworth等人最近开发了一项CXXC亲和纯化技
术(CAP,CXXC affinity purification)以富集非
组蛋白的氨基酸残基可以接受许多种化学修饰,包
括甲基化和乙酰化等修饰。质谱分析检测到组蛋白 H2A有13个可以接受修饰的位点,H2B、H3和H4 则分别有12个,21个和14个可以接受修饰的位点。 每个氨基酸残基位点可以发生至少一种化学修饰。
2. 细胞分化过程中的组蛋白密码 组蛋白修饰的调控在许多生理过程中起到重要作用,
泛地使用。
(二)激活性和抑制性的组蛋白修饰
根据对基因起到激活还是抑制作用,组蛋白修饰可 以大致分为两类:激活性的组蛋白修饰和抑制性的 组蛋白修饰。 激活性的组蛋白修饰中最常见的是H3K4me。 抑制性的组蛋白修饰中最常见的是H3K27me。
(三)组蛋白密码
1. 动态而又稳定的组蛋白密码
第三节 组蛋白修饰的表观基因组
Section 3
Epigenome of Histone Modifications
一、组蛋白密码是重要表观遗传标记之一
(一)核小体与组蛋白修饰
1. 核小体与组蛋白
组蛋白修饰位点
2. 组蛋白修饰与转录 关于组蛋白修饰在转录中的作用,已经有许多模型 如电中性模型、组蛋白密码以及信号通路模型被提 出来。 不同的组蛋白修饰类型的作用不尽相同。
甲基化的CpG富集的DNA片段(CpG岛)。 该技术使用了半胱氨酸富集的对非甲基化的CpG位 点有高亲和性的CXXC3结构域。CXXC结构域对只 包含甲基化的CpG位点或缺乏CpG位点的DNA片段 几乎没有亲和性。
从小鼠Mbd1中得到的重组的CXXC结构域对非甲基
化的CpG位点有高的结合特异性,并被用于从全基
生物信息学
生物信息学
第十章
计算表观遗传学
哈尔滨医科大学 张岩
长颈鹿的来源
第一节
引言
Section 1 Introduction
一、表观遗传学(epigenetics)
表观遗传学是研究不涉及DNA序列改变的情况下, DNA甲基化谱、染色质结构状态和基因表达谱在细 胞代间传递的遗传现象的一门科学。
举例:利用DNA甲基化数据预测新的癌症相关基因 Prioritizing cancer-related genes with aberrant methyl源自文库tion based on a weighted protein-protein interaction network.
人类蛋白质互作网络
常见的CpG岛预测算法
预测方法 EMBOSS CpGProD 长度 (bp) 指定 >500 GC含量 ( %) 指定 >50% 无限制 无限制 CpG O/E 指定 >0.6 无限制 无限制 重复元 件屏蔽 否 是 否 否 备注 参数可调 总CpG岛数目 76793 总CpG岛数目 197727 总CpG岛数目 40926
组蛋白乙酰化主要促使基因表达和DNA复制,使
组蛋白乙酰化定位的基因得到动态的调控。组蛋
白去乙酰化则使基因沉默。 组蛋白的磷酸化可以改变组蛋白的电荷,对基因 转录、DNA修复和染色质凝聚等过程起调控作用。 组蛋白的泛素化可以降解组蛋白的泛素标记,启
动基因表达。
3. 组蛋白修饰的命名法 一个组蛋白修饰的精确表示由三部分组成:组蛋白
名称+组蛋白尾巴上的位点+修饰类型和个数。
• 例如基因转录起始位点富集普遍存在H3K4me3 修饰,它是组蛋白H3上,具体的位置为第四个 位置即赖氨酸(lysine, K),该位置存在三个甲 基基团。
• 又如H3K9me,则表示组蛋白H3上的第九位置上 的甲基化修饰,但并没有指定甲基集团的数目,
则泛指组蛋白甲基化修饰,这些模糊记法已被广
遗传现象:生物界普遍存在的现象
表观遗传现象:生物界普遍存在的另一现象
二、计算表观遗传学
• 应用及开发生物信息学方法(统计分析,模式识
别等)解决生物医学相关的表观遗传学问题。
计 算 表 观 遗 传 学
生物信息学构架了基因组学与表观基因组学的桥梁
表观遗传学领域全球发表的论文
计算表观遗传学的发展
(二)基因组范围高通量的DNA甲基化检测方法

高通量测序是最新发展起来的但却是最有前途的
全基因组DNA甲基化分析方法。高通量测序技术
的出现,使得产生大量序列信息的时间和成本均 要低于桑格法。

目前,两种高通量的测序平台最为流行:一种是 454生命科学公司开发的焦磷酸测序方法,另外一 种是Illumina前身的Solexa开发的基于荧光核苷酸 的系统。
(一)DNA甲基化的检测方法
目前常用的DNA甲基化检测方法是将待检序列中 甲基化的胞嘧啶转化为其他碱基组成的变化。最新 的检测方法还用到了基因微阵列(microarray)。 1.限制性内切酶法
2.亲和纯化
3.重亚硫酸钠法
1.限制性内切酶法
使用甲基化敏感的酶检测DNA甲基化
2.亲和纯化
3.重亚硫酸钠法
处理及分析表
观遗传数据
挖掘表观 遗传现象
常用的算法 统计学方法 回归分析 模式识别方法
支持向量机
决策树
相关分析及判别分析
聚类分析
贝叶斯网络
最小二乘法 最近邻算法
主成分分析
因子分析
(四)功能层面
目的 有效利用当前已有的高通量表观基因组数据
单核苷酸多态、DNA甲基化与基因表达之间的关 系,挖掘调控基因表达的关键因子。
(二)DNA甲基化对转录的调控
1. DNA甲基化阻碍转录因子的结合 2. DNA甲基化识别染色质标记 3. DNA甲基化募集其他蛋白引起染色质沉默
4. DNA甲基化影响核小体定位
CpG岛甲基化和转录的关系
(三)DNA甲基化的意义
CpG二核苷酸的甲基化与重复元件沉默 CpG二核苷酸的甲基化与染色体的选择性沉默
2. 改进的CpG岛定义

Takai和Jones


增加最短长度、CpG O/E值
GC含量分别到500 bp,0.65% 和 55%对预测精度 的影响。 通过使阈值更加严格,Alu重复元件得到最大程 度的排除,但此时却排除了原来数量10%的CpG

岛,这表明一些真正的CpG岛可能也被排除。
常见的CpG岛预测算法
预测方法 长度 (bp) GC含量 ( %) ≥50% CpG O/E ≥0.6 重复元 件屏蔽 否 备注 严格的参数限制
ENSEMBL ≥400
NCBI宽松
NCBI严格 UCSC
≥200
≥500 >200
≥50%
≥50% ≥50%
≥0.6
≥0.6 >0.6

否 是
总CpG岛数目 307193
总CpG岛数目 24163 总CpG岛数目 28226
这其中就包括细胞分化。研究发现组蛋白乙酰化对
维持细胞的未分化和多能状态十分重要。使用组蛋 白去乙酰酶抑制剂有助于维持干细胞的多能性 (pluripotency)。
相关文档
最新文档