医学专业 生物信息学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、SNP相关的基本概念
1. 等位(allele) SNP是一种双等位 多态(即SNP的二态性)
2. 基因型(genotype) 同源染色体上 一对SNP等位的组合
3. 单体型(haplotype) 特定染色体 区域相邻近的SNP的组合
SNP等位、基因型、单体型与TagSNP
4. 最小等位频率(minor Allele Frequency, MAF) 群体中,一对SNP等 位中出现较少的等位的频率,以5%为界将 SNP分为常见SNP和罕见SNP
5. 利用SNP位点向两边延伸的长度差异情况,我 们可以观察到一些基因组上近期正在进行的选择事 件。
6. 高密度的SNP位点,为进一步加强和完善基因 组范围的表型和遗传相关性分析(关联研究或数量 性状定位)提供了可能 。
(四)利用HapMart进行科学研究
为了便于科研工作者快速提取感兴趣的SNP 数据,BioMart开发了方便、友好的SNP获取网络 平台HapMart。
5. 非同义SNP(non-synonymous SNP) 能够改变基因产物结构或影响基因 表达量的SNP
第二节 SNP分型技术与数据资源
SNP Genotyping Technologies and Resources
一、SNP检测和分型技术
SNP分型(genotyping)是对SNP基因 型的检测过程
常用的连锁不平衡量度方法主要有D’、r2 和LOD值
1.r2值量度LD r2代表两位点在统计学 上的关系,其表达式为:
r2 PAB PAPB 2 / PAPaPBP
r2的数值表示一个位点可反映另一位点信 息量的程度, r2 =1称为完全连锁不平衡,这 时两位点等位基因频率相同,只观察一个标 记即可提供另一个标记的全部信息。
(二) HapMap数据特点
1. 在多个个体的DNA样品中鉴定单核苷酸多态 (SNP)。
2. 将群体中频率大于1%的那些共同遗传的相邻 SNP组合成单体型。
3. 在单体型中找出用于识别这些单体型的标签 SNP。这样,HapMap提供的每个研究个体的数据包 括SNP等位、基因型、基因型频率、200kb范围内 SNP之间的LD量度。
(二) HapMap数据的拓展应用
1. 基于大群体、多种群的人类单核苷酸多态数据 的重组率推算提供了我们一张基因组进化痕迹图。
2. 连锁不平衡的计算给了我们一张基因组块状连 锁结构图。
3. 种群差异研究让我们看到一张种群间基因组结 构差异图。
4. SNP的杂合情况告诉我们人类基因组上受到选 择的区域或区域内的基因。
2. 单链构象多态性(single strand conformation polymorphism, SSCP)
Baidu Nhomakorabea三)基于酶切的方法
限制性片段长度多态性(restriction fragment length polymorphism,RFLP)
(四)测序方法
1. 直接测序方法
2. SNP-shot-Gene-Scan技术
(一)国际人类单体型图计划概况
国际人类基因组单体型图计划(The International HapMap Project,HapMap)是 继国际人类基因组计划之后,人类基因组研究 领域的又一个重大国际合作项目。
1. HapMap计划起始于2002年,由美、加、中、 日、英、尼日利亚等国研究机构发起、参与及完成, 中国科学家承担总计划的10%。
直接测序技术获得的SNP分型数据
二、连锁不平衡、单体型与Tag SNP
(一)连锁不平衡
连锁不平衡(linkage disequilibrium, LD)是指相邻基因座上等位基因的非随机相 关。
导致连锁不平衡的主要因素有遗传漂变、 人口增长与群体结构改变、重组率变化、突变 率变化和基因转换。
(二)连锁不平衡的量度
2. 项目共取样270个正常个体:欧裔美国人和尼 日利亚雅鲁巴人(非洲)各30个核心家系,中国北京汉 族人及日本东京人各45个个体。
3. 一期已于2005年完成,成功分型100多万个常 见SNP位点的识别,达到平均每3kb一个SNP的测定。
4. 二期计划在一期基础上完成300多万个SNP位 点的分型,构建起一张精度更高、信息更完整的多 人种遗传多态图谱。
5. 三期计划已经开展,在进一步测定原有群体基 因型基础上,加入另外7个不同历史遗传背景的人群, 部分分型数据已经发布。
6. HapMap计划期望在全部完成时能够提供一个 包括全部人类遗传差异的多态组图谱,同时带动其 他人类遗传变异的发现和研究。
HapMap中SNP的分布密度(截至2005年10月)
2.D’值量度LD D’值又称为连锁不平衡 系数,其表达式为 :
D' D / Dmax D PAB PA PB
当D’=1时,说明两个位点间没有发生重组, 与r2相比较,当D’于1时两位点等位基因频率 并不需要相同,它只是反映最近一次突变发生 后突变位点与临近多态性位点的关系。
三、国际人类单体型图计划及其应用
HapMart建立在HapMap数据基础上。
支持研究者输入SNP、基因、染色体区段等 信息进行限定条件下的SNP查询及相关信息输出。
SNP分型包括两方面内容:对未知SNP 的进行分析和对已知SNP进行分析
(一)基于分子杂交的SNP分型技术
1. 等位基因特异寡核苷酸片段分析(allelespecific oligonucleotide, ASO)
2. 基因芯片方法
(二)以SNP影响核酸构象为基础的方法
1. 变性梯度凝胶电泳(denaturing gradient gel electrophoresis, DGGE)和 温度梯度凝胶电泳(temperature gradient gel electrophoresis, TGGE)法
第十五章 单核苷酸多态与 人类疾病
SNPs In Human Diseases
同济大学 李亦学 哈尔滨医科大学 徐良德
第一节 引 言
Introduction
一、什么是单核苷酸多态
单核苷酸多态(Single Nucleotide Polymorphisms, SNPs)是人类染色体上 的单个核苷酸的差异。