计算表观遗传学中的多因素分析方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表观遗传相关的数据资源
常用表观遗传数据库
Epigenomics
DiseaseMeth
http://www.ncbi.nlm.nih.gov/epigenomics/ http://bioinfo.hrbmu.edu.cn/diseasemeth
MethDB MethyCancer PubMeth TCGA Data Portal
第一节 引言
表观遗传学的研究内容
引自PLoS Med. 2010 Oct 26;7(10):e1000356. Epigenetic epidemiology of common complex disease: prospects for prediction, prevention, and treatment.Relton CL, Davey Smith G.
模型应用及评估
第三节 实验测定多样本DNA甲基化
DNA甲基化图谱绘制
Epigenomics
表观基因组学数据库
Epigenomics 表观基因组学数据库
http://www.ncbi.nlm.nih.gov/epigenomics
Epigenomics简介
NIH Roadmap Epigenomics
Epigenomics数据搜索
Browse Experiments(搜索实验) Browse Samples(搜索样本) Advanced Search(高级搜索)
Browse Experiments(搜索实验
当前数据库所有实验数
)
实验关键词(如Cancer等)
物种
生物学来源
特征类型
实验 ID
符合条 件的样 本列表
Advanced Search(高级搜索)
Epigenomics数据可视化
视图工具
Epigenomics数据下载
Epigenomics数据比较分析
输入要比较的数据ID
也可参考例子
Epigenomics的帮助文档
DNA甲基化数据的检测技术
引自Peter W. Laird(2010)
Epigenomics的使用
Epigenomics访问方式 Epigenomics数据搜索 Epigenomics数据可视化 Epigenomics数据下载 Epigenomics数据比较分析
Epigenomics访问方式
1、通过NCBI首页
htt2p、://w通w过w.地ncb址i.n直lm接.nih访.g问ov/epigenomics
符合条件的实验数目
特征 类型
分析 物种 类型
细胞 类型
组织 类型
细胞 系
细胞 群
分化 阶段
符合条
件的实 验列表
Browse Samples(搜索样本)
当前数据库所有实验数
实验关键词(如Cancer等)
物种
生物学来源
特征类型
符合条件的实验数目
样本 ID
物种
细胞 类型
组织 类型
细胞 系
细胞 群
分化 阶段
计算表观遗传学
第二节 支持向量机预测DNA甲基化
DNA甲基化发生
甲基化对转录的调控
DNA甲基化影响转录的机制
1. DNA甲基化阻碍转录因子的结合 2.DNA甲基化识别染色质标记 3. DNA甲基化募集其他蛋白引起染色质沉默 4. DNA甲基化影响核小体定位
支持向量机预测DNA甲基化
全基因组的甲基化检测
第四节 基于信息熵的甲基化数据分析
组 织 间 的 差 异 甲 基 化
癌 症 差 异 甲 基 化
非 肿 瘤 疾 病 的 甲 基 化 差 异
表观遗传标记
引பைடு நூலகம்Manel Esteller(2011)
DNA甲基化的改变
DNA甲基化
差异甲基化区域
差异甲基化特征筛选方法
常用的方法 两样本 (T检验 、Z值、卡方检验) 多样本统计方法 (ANOVA 、Kruskall-Wallis) 多样本非统计方法 (Fan’s,Rakyan’s)
支持向量机实现是通过某种事先选择的非线性 映射(核函数)将输入向量映射到一个高维特 征空间,在这个空间中构造最优分类超平面。 使用SVM进行数据集分类工作的过程首先是通 过预先选定的一些非线性映射将输入空间映射 到高维特征空间(如下图)
基于酶切获得训练数据
甲基化 区域 VS 非甲基化区域
CpG岛 VS 非CpG岛
Epigenomics是NIH Roadmap Epigenomics的重要组成部分,有 利于不同表观基因组研究机构之间的信息共享,促进了当前各 方面的表观遗传研究。
Epigenomics是当前较为全面的表观基因组数据库。该数据库提 供了DNA甲基化、组蛋白修饰等各种全基因组尺度的表观基因 组数据的存储、下载、可视化等功能。
新方法-----香农信息熵 香农信息熵是一种度量差异和不确定性的定量化指标。 开发定量筛选差异甲基化区域的方法(QDMR)。
方法
优化信息熵定量甲基化差异
方法
QDMR软件
QDMR的安装与使用
Human histone modificationdatabase
http://www.methdb.de http://methycancer.psych.ac.cn http://www.pubmeth.org http://cancergenome.nih.gov/dataportal http://bioinfo.hrbmu.edu.cn/hhmd
医用 多因素分析
哈尔滨医科大学生物信息科学与技术学院 统计遗传学教研室 &系统生物学教研室
课程内容
计算表观遗传学的多因素分析 多因素分析软件及绘图
专题1
计算表观遗传学的 多因素分析
哈尔滨医科大学生物信息科学与技术学院 系统生物学教研室 刘洪波
本专题的主要内容
第一节 引言 第二节 支持向量机预测DNA甲基化 第三节 实验测定多样本DNA甲基化 第四节 基于熵的差异甲基化区域筛选 第五节 甲基化数据实例分析
ChromatinDB SysPTM GEO HEP
www.bioinformatics2.wsu.edu/ChromatinDB/ http://www.biosino.org.cn/SysPTM/ http://www.ncbi.nlm.nih.gov/geo http://www.epigenome.org/