【生物信息学第二版】复杂疾病的分子特征与计算分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
500000-599999 线粒体位点或表型
600000-
染色体位点或表型(于1994年5月15号创建)
OMIM号前特殊符号的含义
“*”:代表已知致病基因的序列信息,没有加“*” 表示其遗传模式虽然已有推测,但没有被证 实或该基因与其他记录所包含的基因位点的 分离情况尚不清楚;
“#”:表示这种表型可以由两个或者多个基因中的一 个发生突变而引起;
➢ 非同义SNP(non-synonymous SNP):能够改变 基因产物结构或影响基因表达量的SNP。
➢ 连锁块(linkage block):指位于染色体上某一区 域的一组相互关联的SNP。
人类基因组中的其他变异
➢ 插入/删除多态(in/del) ➢ 微卫星(microsatellite, MS) ➢ 拷贝数变异(copy number variants, CNV)
申请访问控制数据
数据下载()
关联结果浏览器
➢ 关联结果浏览器可查询某基因与哪些表型性状相关。 这里以LRP5为例,经搜索发现LRP5中的4个SNP在 GWAS研究中分别与骨密度和心肌梗死显著相关。
➢ 基因型和表型数据库(genotype and phenotype database, dbGAP)
➢ NIH开发和维护 ➢ 包含大量高通量复杂疾病遗传学研究的基因型和表
型数据 ➢ 访问网址:
dbGAP数据类型
➢ 数据根据开放程度分为公开数据(public data)和控 制访问数据(controlled access data)。
生物信息学
生物信息学
第十一章 复杂疾病的分子 特征与计算分析
中南大学
陈小平、李曦
哈尔滨医科大学 徐良德
学习提纲
重点 ➢ 复杂疾病的分子特征 ➢ 复杂疾病遗传学研究策略 ➢ 复杂疾病遗传学研究相关统计分析方法 ➢ 常用遗传学统计分析集成软件的使用
难点
➢ 复杂疾病遗传学研究中计算分析的算法选择 及分析要点
二、人类孟德尔遗传疾病数据库(OMIM)
➢ MIM (Mendelian Inheritance in Man)与OMIM ➢ OMIM由由美国国立卫生研究院(National
Institutes of Health,NIH)、约翰霍普金斯大学 ( Johns Hopkins University )共同开发和维护 ➢ OMIM 数据库网址:
➢ 复杂疾病涉及多种基因和蛋白:众多基因通过蛋白 质复合物,调控网络以及互作通路来控制的。
➢ 复杂疾病受环境因素影响。同一个体在不同条件下 对环境的响应不同。基因组的个体差异使不同人对 环境的响应也不同。
(二)遗传变异是复杂疾病的决定因素
➢ 遗传因素在大多数复杂疾病中起决定作用;
➢ 人群中任意两个不相关个体DNA序列99.8%一致, 0.2%存在差异;
➢ OMIM还提供genemap和morbidmap的网络查询形式, 在主页点击Getting start可进入查询选择页面
OMIM查询选择页面
genemap查询页面
Clinical Synopsis查询页面
OMIM数据库的使用(以Alzheimer’s Disease为例)
三、基因型和表型数据库(dbGAP)
➢ 基因型(genotype): 同源染色体上一对SNP等位 的组合
➢ 单体型(haplotype): 特定染色体区域相邻近的 SNP的组合
SNP等位、基因型、单倍型与TagSNP
Βιβλιοθήκη Baidu
➢ 最小等位频率(minor allele frequency, MAF): 群体中,一对SNP等位中出现较少的等位基因的 频率。常见SNP的MAF应>5%,而罕见SNP的 MAF <1%。
“+”:表示这个记录包含基因的序列信息和表型; “%”:表示记录中描述了一个已知的孟德尔表型,
但对其潜在的分子机制尚不清楚;
“^”:表示该记录已不存在或已被其他记录所代替。
OMIM数据的下载
➢ OMIM数据可在页面注册下载,可下载的文件包含全 部的OMIM文件(omim.txt.Z),OMIM中的基因文 件(genemap)及其解释文件(genemap.key),以 及疾病信息(morbidmap)
➢ 公开数据可以在dbGAP的服务器中免费下载,控制 访问数据的获取和使用则有一系列的限制。首先,要 获取这类数据须向dbGAP管理机构提交申请,获批 后才能获得下载所申请数据的权限。其次,必须严格 遵循数据使用规定。dbGAP中所有的数据均有一个 禁止日期(embargo day)。
OMIM 主页()
熟悉
➢ 复杂疾病相关数据库 ➢ 基因分型的方法
第一节 引言
(Introduction)
➢ 人类常见病,包括恶性肿瘤、心脑血管病、代谢系 统疾病、神经系统疾病、精神和行为异常等绝大多 数都是复杂性疾病。复杂疾病不符合孟德尔定律, 疾病的发生发展涉及复杂的生物学过程,是21世纪 生物医学重大的挑战之一。
第二节 复杂疾病的分子特征
与数据资源
(Molecular Characters and Data of Complex Disease)
一、复杂疾病的分子特征
(一)复杂疾病的定义
➢ 复杂疾病(complex disease),又称多基因病 (ploygenic disorder),是指由多种遗传和环境因 素共同决定的一类疾病。与单基因病相比,复杂疾 病具有遗传异质性、基因微效性、表型复杂性、种 族差异性以及环境相关性等特点。
➢ 基因组的不同导致生理表型、罹患疾病的风险及药 物反应表型的差异,在人类多样性形成中具有重要 意义。
单核苷酸多态(single nucleotide polymorphism, SNP)
➢ 单核苷酸多态:人类染色体上的单个核苷酸的差异, 是人类基因组变异的主要类型。
SNP相关的基本概念
➢ 等位(allele): SNP是一种双等位多态(即SNP的 二态性)
OMIM 主页()
OMIM编号代表的遗传方式
MIM编号范围
遗传方式
100000-199999 常染色体显性遗传或表型(于1994年5月15号创建)
200000-299999 常染色体隐性遗传或表型(于1994年5月15号创建)
300000-399999 X连锁位点或表型
400000-499999 Y连锁位点或表型