2 遗传图绘制
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.2.2 DNA标记
基因之外的作图工具统称为DNA标记。与基 因标记一样,DNA标记必须有至少两个等位 基因才是有用的。有三种类型的DNA序列特 征可以满足这一要求:
1. 限制性片段长度多态性(restriction fragment
length polymorphisms, RFLP)
2. 简单序列长度多态性(simple sequence length
这是由于基因组DNA某一位点上的变异有可能 引起该位点特异性的限制性内切酶识别位点的改 变,包括原有位点的消失或出现新的酶切位点, 致使酶切片段长度随之发生变化而产生。
最早发现的DNA分子标记—RFLP:由于同源
染色体同一区段DNA序列的差异,当用限制酶处理 时,可产生长度不同的限制性片段
RFLP:restriction fragment length polymorphism, 限制性片段长度多态性
ABO 血型基因座上具有编码不同半乳糖转移酶复等位基因
其特异性决定了血型的差别
2.2.1 基因标记
基因是非常有用的标记,但并不是理想的。原因: 1. 可用作标记的基因十分有限,许多性状都涉及 多基因。 2. 高等生物基因组中存在大量的基因间隔区,遗 传图中留下大片的无标记区段。 3. 只有部分基因其等位基因成员可以通过常规实 验予以区分,因而产生的遗传图是不完整的。
微卫星序列(SSR)
共显性
如何检测SSR
根据简单重复顺序两侧的序列设计引物, PCR,经聚丙烯胺凝胶 电泳分辨.
SSR技术的优点是: (1)在基因组中随机分布,检测的多态性频率高; (2)PCR特异引物,重复性好; (3)共显性,操作相对简单。 问题是: (1)SSR需要测序和设计引物,因而需要大量 的人力、物力和时间; (2)另外其种属特异性强,开发所需的费用高 昂,因此一些实验室进行了合作,共同开 发微卫星引物。
利用SSR标记的关键是引物的设计
对于已经进行基因组全序列测定的生物或遗传 学研究比较经典的生物,可以直接从其基因组 进行查找和利用有关程序进行引物的设计或利 用别人已经发表的引物来进行实验; 而对于没有基因组序列信息的生物,就需要进 行有关引物的设计工作。
3. SNP(单核苷酸多态性)
SNP是指同一物种不同个体基因组DNA的等位序列上单个核 苷酸存在差异的现象。
•数目多,覆盖密度大,被称为第三代分子标记
根据SNP在基因中的位置,SNP可分为:
基因编码区SNP(coding SNP, cSNP)
基因周边SNP(peripheral SNP, pSNP)
基因间SNP (intronicSNP, iSNP)
从对生物的遗传性状的影响,基因编码区SNP cSNP又可分为两种: 1.同义cSNP(synonymous cSNP):SNP引起的编码 序列的改变并不影响其翻译的蛋白质的氨基酸序 列; 2. 非同义cSNP(non-synonymous cSNP):指碱 基序列的改变可使以其为蓝本翻译的蛋白质序列 发生改变,从而影响了蛋白质的功能,这种改变 常是导致生物性状改变的直接原因。
全基因组鸟枪法测序和克隆重叠群法测序最后 都必须将DNA序列回归到基因组图上,因此 基因组图的绘制是基因组测序和组装的核心内容 之一,是基因组全面测序的必要前提。
传统上将基因组作图方法分为两类。
1. 遗传作图 2. 物理作图
2.1 遗传图谱与物理图谱
• 1 )遗传作图 ( Genetic mapping ) :采用遗传学 分析方法将基因或其它 DNA 序列标定在染色体 上构建连锁图。这一方法包括杂交实验,家系分 析。遗传图距单位为厘摩(cM), 每单位厘摩定义 为1%交换率。
第2章 遗传图的绘制
结构基因组的研究策略
为何要绘制遗传图与物理图
1)基因组太大,必需分散测序,然后将分散的顺 序按原来位置组装,需要图谱进行指导。 2)基因组存在大量重复顺序,会干扰排序,因此 要高密度基因组图。 3)遗传图和物理图各有优缺点,必须相互整合校正
DNA测序有一个极大的局限性:即使是最精确 的技术,在一个反应中也很难测出大于750bp的 序列。这就需要将大分子分解为片段。
–ABO血型 –HLA(人类白细胞抗原)
• 复等位基因(multiple alleles):人类白细胞
抗原(HLA)是最复杂最具多态性的体系,位于6 号染色体
–HLA-DRBI(human leukocyte antigens-DRBI)基因位点 至少有59个等位基因 –HLA-B抗原编码位点有60多个等位基因
2.2.1 基因标记
• 表型(phenotype) :一个遗传性状必须以两种替换形式 或表型存在才能用于遗传学分析
• 等位基因(allele):每种表型是由不同的等位基因控制 • 肉眼分辨的表型:颜色、形状等。如用于果蝇遗传图的 构建 • 生化表型:微生物遗传学研究
2.2.1 基因标记
• 人类的生化性状
问题:分析基因组的重复区域时会发生错误。
因此,必须首先建立一个基因组的图谱,通过 标明基因和其他显著特征的位置,为测序提供指导。 一旦得到了基因组的图谱,测序阶段可以采用以下 方法进行: 1. 全基因组鸟枪法(whole-genome shotgun method) 全基因组鸟枪法是一种快速获得真核基因组的方法。 2. 克隆重叠群法(clone contig method):(作图法测 序,限制测序)。 这种逐步测序的方法花时间多,但精确。
• microsatellite marker又称简单串连重复(short tandem repeat,STR),最重要的优点是高度多态 性,提供的信息量相对很大;另外可用PCR技术 使操作实现自动化,遗传图与物理图研究中非常 有用的工具
• 20世纪80年代后期,人们开始应用微卫星序列 (microsatellite,MS)绘制图谱。1994年底,美、法完 成了以RFLP及微卫星DNA为标志的遗传图谱. 图谱包含了5826位点,覆盖4000cM,分辨率高达 0.7cM.1996年法国报道了完全以微卫星DNA标 志构建的遗传连锁图,包含2335位点,分辩率为 1.6cM
共显性: (两 个亲本的性 状在一个个 体中同时出 现,没有显 隐关系)
问题:
1. 克隆可表现基因组DNA多态性的探针较为困难
2. DNA需要量大,实验操作较繁锁,检测周期长 成本费用也很高。 3. RFLP分子标记分布密度过于稀疏。 现已逐步被其他类型分子标记所取代。
ຫໍສະໝຸດ Baidu
RFLP是最早发现的分子标记,也被称为第一代分
• 2 )物理作图 ( Physical mapping) :采用分子生 物学技术直接将 DNA 分子标记、基因或克隆标 定在基因组实际位置。物理图的距离依作图方法 而异,如辐射杂种作图的计算单位为厘镭 (cR), 限制性片段作图与克隆作图的图距为 DNA 的分 子长度,即碱基对(bp, kb)。
2.1 基因组作图的方法
2.2 遗传作图标记
任何一类图谱都有可识别的标记。遗传图谱 的标记是什么呢? 染色体上的基因和DNA序列 均可作为路标, 路标具有 标记1 物理属性,他们由特定的 标记2 DNA顺序组成. 路标位于染 色体上的位置是固定的,不 会更改的,因而提供了作图 标记3 的依据
2.2.1 基因标记
在经典遗传学中,研究一种性状的遗传必须要求同 一性状至少2种不同的存在形式或称表型。 起初只有那些能通过视觉区分的基因表型用于研究。 最初的遗传图谱是在20世纪初针对果蝇等生物使用 基因作为标记构建的。
• 克隆重叠群法:contig,指相互间存在重叠顺序 的一组克隆。根据重叠顺序的相对位置将各个克 隆首尾连接,覆盖的物理长度可达百万级碱基对。 在单个的重叠群中,采用鸟枪法测序,然后在重 叠群内进行组装。由上至下。 • 直接鸟枪法:首先进行全基因组鸟枪法测序,再 以基因组图的分子标记为起点,将鸟枪法DNA片 段进行组装。根据高密度的基因组图分子标记, 检测组装片段是否处在正确的位置,校正因重复 顺序的干扰产生的序列误排。由下至上
•SNP只涉及单个碱基的变异,这种变异可以由单个碱基的转 换(包括C与T互换,G与A互换),或颠换(包括C与A、G与 T、C与G、A与T互换)引起。
•点突变,位于密码子的摇摆位置,表现为沉默突变而被大 量保留下来。大多数不能被限制酶识别,必须采取测序或寡 聚核苷酸杂交检测 •在人类基因组中可达到300万个,平均每1000个碱基对就 有一个
对RFLP的检测主要是用Southern杂交的方法进行
基本流程:
组织或细胞→基因组DNA→限制性内切酶消化→
琼脂糖凝胶电泳→印迹转移至滤膜→加入探针→
杂交→洗膜→放射自显影→获得反映个体特异性 的RFLP图谱。
RFLP标记的主要特点是: (1)遍布于整个基因组; (2)无表型效应,不受发育阶段及器官特异性限制 (3)共显性,可区分纯合子和杂合子; (4)结果稳定、可靠; 用途:RFLP主要用于群体水平和系统发育研究上. 进行个体识别;绘制遗传图谱;目的基因定位;检 测群体内或群体间序列差异程度;辅助育种等。 自RFLP问世以来,已经在基因定位及分型、遗传 连锁图谱的构建、疾病的基因诊断等研究中得到了 广泛的应用。
SNP标记可用DNA芯片技术检测:将不同的寡
核苷酸固定在芯片上,标记待测DNA,一次就
可检测很多SNP标记。 尽管单一的SNP所提供的信息量远小于现在常 用的分子标记,但SNP的数量极其丰富,并且 可以自动化检验,因此其具有广泛的应用前景。 SNP数量比微卫星标记数要高出几个数量级。
例如:3-4个SNP这种相邻的界标构成的 单倍型(haplotype)就可以有8-16种:
子标记。
2. 简单序列长度多态性(SSLP)
1) 可变排列的简单重复序列, 即重复次数不一, 在染色体的同一座位重复序列拷贝数不同; 2) SSLP的类型: 小卫星序列(minisatellite), 有时又称可变串联 重复(VNTR),重复单位较长。重复序列为16100个核苷酸,主要分布在染色体端粒及着丝粒 微卫星序列(micrisatellite), 或称简单串联重 复(STR),重复单位较短。重复序列只有2-6个 核苷酸,分布在整个基因组。
polymorphisms, SSLP)
3. 单核苷酸多态性(single nucleotide polymorphisms,
SNP)
• 遗传标记的发展:
• 第一代标记 – 经典的遗传标记(蛋白质和免疫学的标记) – 70年代中后期,限制酶片段长度多态性(RFLP) • 第二代标记 – 85年,“小卫星序列"(minisatellite) – 89年,“微卫星序列"(microsatellite) • 第三代标记 – 单核苷酸多态性标记(single nucleotide polymorphism , SNP)
• 现代遗传图谱的概念由Botstein D等(1980)首先提出,
在此基础上,限制性片段长度多态性(RFLP)作为遗 传图谱的第一代崭新标记得以问世 。 • 限制性位点能够用作基因标记。广泛应用到基因组研究 中。基因或基因组可以用重叠的限制性片段来作图。最 终扩展到整个序列,构建连锁图谱
同一物种的亚种、品系或个体间基因组DNA 受 到同一种限制性内切酶作用而形成不同的酶切图 谱的现象,称为限制性片段长度多态性(RFLP)。
• 70年代发展起来的DNA重组技术、DNA克隆技术和 DNA探针技术
– 为拓展遗传图谱的构建途径创造了技术条件
– 使人类基因定位的方法从细胞及染色体水平过渡到分子水平 – DNA水平的多态性标记位点作为绘制现代遗传图谱的主要界标, 提高图谱的 精确度、准确性。遗传图谱的绘制进入了一个崭新 的时代
• 通过遗传图谱,我们可以大致了解各个基因或DNA片断 之间的相对距离与方向,如哪个基因更靠近着丝粒,那个 更靠近端粒等 • 遗传距离是通过遗传连锁分析获得的,使用的DNA厘摩 标志越多,越密集,所得到的遗传连锁图的分辨率就越高 • 遗传图谱不仅是现阶段定位基因的重要手段,即使在人类 基因组全物理图谱建立起来之后,它依然是研究人类基因 组遗传与变异的重要手段