人类短串联重复序列
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人类短串联重复序列(STR)的研究进展
短串联重复序列( Short tandem repeat ,STR)又称微卫星DNA,STR 是一种可遗传的不稳定的并且具有高度多态性的短的核苷酸重复序列. STR 多态性具有种类多,分布广,高度多态性等特点,并按孟德尔遗传规律[ 1 ]在人群中世代相传. 通过对STR 多态性的认识,极大地推动了人类基因组的研究. 这种多态性标志已广泛用于构建人类遗传连锁图谱、基因定位、遗传病诊断、肿瘤细胞染色体分离与重组以及亲子鉴定等法医学检查.
DNA遗传标记的多态性研究发展按时间顺序可分为三代[4 ]。
第1代遗传标记:限制性片段长度多态性( restriction fragment length polymorphism, RFLP)是Wyman 和White 于1980年偶然发现的,人类14号染色体上存在DNA片段长度有变化的区域,这些区域的结构特点是DNA由一段序列串联重复、首尾相接而成。
重复次数可在几次至数百上千次之间变化。
DNA 重复单位长度在数bp至数十bp之间,组成串联重复的DNA是小卫星DNA。
第2代遗传标记:短串联重复序列是由Holly等发现的重复单位的长度只有2~6 bp、重复次数一般在数次至几十次之间的串联重复DNA序列,即微卫星DNA。
微卫星DNA的等位基因片段的长度一般在400 bp以下,故又称为短串联重复序列( STR)。
第3代遗传标记:单核甘酸多态性( single nucleotide polymorphism, SNP)是单个碱基的置换、插入或缺失而形成的,是美国MIT提出的新一代多态性标记系统[5],近年来成为多种研究的焦点。
虽然SNP的多态性位点是最多的,能比STR提供更全面的基因信息,但是STR还是以其独特的优点保存下来,仍被广泛的研究。
1.1 STR 的构成STR 的核心序列为2~7bp ,呈串联重复排列.重复次数10~60 次左右,其总长度常小于400 bp.常见的有一、二、三、四核苷酸重复序列,约占真核生物基因组的5 %. 人类基因组的STR 单核苷酸重复以polyA ,polyT 多见,双核苷酸重复以(CA) n ,( GT) n , (AA) n , ( GG) n 常见, ( GC/ CG) 少见,其原因是由于3′端为G的C(即CPG) 易于甲基化. 三核苷酸重复以(CXG) n 类型常见,由于三核苷酸具有高度多态性,常用作DNA 的标记物.
每个特定位点的STR 均由两部分构成:中间的核心区和外围的侧翼区. 核心区含有一个以上称为“重复”的短序列,一般该重复单位的碱基对数目不变,而串联在一起的重复单位数目是随机改变的,如果用一种不切重复单位的限制性内切酶把DNA 分子切割成限制性片段,该限制性片段中位于核心区的外围即是侧翼区. 人群中不同个体可表现为侧翼区相同而串联重复单位的数目不同;也可为相同数目的重复单位,但侧翼区大小不同,或者两者均不同. 通过对那些非STR 位点的DNA 限制性片段长度多态性( Rest riction f ragment lengthpolymorphism ,RFL P) 研究表明,每个位点的RFL P仅能检测到1 个或数个等位基因. 因此可以推论,STR 位点的侧翼区变异数也仅有少数几个. 这样,人群中该特定STR 位点的等位基因差异,主要应来自不同数目的串联重复[2,3]。
1.2 STR的分布据GeneBank等数据库资料统计,人类23 对染色体上至少分布着7901个STR位点,每对染色体的STR位点分别超过100个,其中1、2号染色体的位点均超过600个,性染色体上的已知位点数在264 个以上,现有的STR 位点覆盖长度达4000cM,平均间距0. 7 cM。
随着人们对STR的进一步研究,其数目还会不断增加。
1.3 STR的种属特异性与多种基因座的指纹图不同,大多数STR具有人的种属特异性,至少是具有灵长类的种属特异性。
1995年有学者[ 6 ]调查了9个STR的人种属特异性,结果在被调查的23种动物中, FES/FPS基因座没有扩增产物,而CSF1PO、TOX、TH01、HPRTB、vWA、F13A01等基因座则在灵长类有扩增产物,但是这些扩增产物的长度均位于这些基因座的STR的等位基因Ladder范围之外。
此后对更多STR基因座的调查也得到了相似的结论。
1.4 STR产生的可能机制目前认为链滑动错配是短串联重复序列突变的主要机制。
在DNA 合成过程中,一条单链DNA可以发生一过性的脱位,生成一个中间性的结构后,再与另一DNA
单链错配,形成链滑动错配,继续DNA的复制和修复。
滑动错配可以造成缺失、插入或碱基替换。
在STR中,一条DNA单链可以向后折叠后再与另一条单链复性,在复性的位置形成环状突出,DNA修复酶可以将环状突出全部或部分切除,造成缺失。
另一方面,也可以在无突出链相对突出的位置形成一个缺口,再由聚合酶填补此缺口,DNA重复的数目增加,造成插入突变。
STR长度上的差异一般是重复单位的整数。
复制滑动、姐妹染色体不等交换和遗传重组都是可导致重复单位数目发生改变的机制,但目前的研究证明复制滑动时导致STR重复数目改变是主要机制。
链滑动错配还可以发生在一段单链的DNA片段,多见于回文序列或回文样序列。
如CTGCAG和GCCNNNNNGGC。
回文序列自身互补形成发夹结构,也能造成缺失或插入。
不过,仅滑动链复制错配不能解释一些重复序列的特征,如为什么两性种系的三体重复稳定性有差异? 为什么CAG重复总在有意义链上等等? 所以,对STR产生和拷贝数的变异的遗传机制解释还有滚环扩增、不等交换( unequalcrossover)和碱基置换突变
等。
2 基于STR的应用研究
单个基因座的STR的遗传信息是很有限的,复合扩增可以增加遗传多态性信息,提高工作效率。
在复合扩增中,多对引物在同一反应管中进行。
引物之间的互相作用,可导致非特异性的扩增产物出现,影响STR的分型。
经大量的研究证明,只要复合扩增的条件是适当的,在绝大多数的情况下,复合扩增从双基因座扩增、三基因座扩增、四基因座扩增、七基因座扩增,直至15个STR基因座和一个性别基因同时复合扩增,检测方法从银染方法到用荧光标记引物在自动测序仪中自动分型,单基因座扩增与复合扩增的STR分型具有相同的结果。
目前STRs- PCR 技术已形成多位点检测方法, 即在同一分析反应中同时扩增来自两个或更多的位点的等位基因,扩增的重复序列由于重复次数的差异导致STR 基因座的等位基因分型不同, 在电泳分离后, 用放射性同位素、银染或荧光检测可区别不同的基因型。
STRs- PCR 产物具有不连续的可分离的长度, 可以用每个基因座的几个或所有等位基因的片段构建成等位基因阶梯( allelic ladder) , 肉眼观察或利用仪器比对同一基因座的等位基因阶梯和扩增样品, 从而快速和准确地确定等位基因座。
2.1 STR应用于制作人类基因组遗传图谱遗传图谱( geneticmap)是指人类基因组内基因和专一的多态性DNA标记相对位置的图谱。
STR在基因组内分布广泛、多态性程度高、可自动化检测、成为制作基因组遗传图谱的首选遗传标记。
STR作为遗传标记使人类基因组的遗传制图和连锁分析发生了革命性的变化。
1996年,法国Gene-thon实验室与美国国家卫生研究院几个中心合作,建立了以6000多个STR为主体遗传标记、分辨率达194 kb的高精密度图谱[ 7 ]。
STR的出现使遗传图的精度得到进一步提高,同时也成为物理图上的标记,从而促进了遗传图与物理图的融合。
利用STR作为遗传标记,人类基因组计划中的物理图于2000年也顺利完成[ 8 ]。
2.2 STR用于法医学个体识别和亲权鉴定法医检案中,经常会遇到极少量和较大降解的生物检材,最好的方法是用PCR扩增STR。
人体血液、精液、精斑、毛发、指甲、骨和牙齿均可作为分析STR 的DNA 来源[ 9 ]。
正是因为STR广泛存在于人类基因组中,具有高度多态性、杂合性和稳定性。
当把几个STR位点联合分析后,可以得到相当高的累积个体识别率和父权排除率。
据统计,两个无亲缘关系的个体基因型完全一致的概率< 10 - 12 ,因而STR用于法医学领域有着广阔的前景。
国内学者对粤、桂、琼地区14个人群STR基因座频率调查显示15个STR基因座在14个人群中累积个体识别能力在1.05 ×10 - 16 ~
3. 18 ×10 - 18 ,累积非父排除率均在0. 9999[ 10 ]以上。
泰国学者对泰国人的15个STR位电的分析得出累积个体识别能力为7. 01×10 - 18 ,累积非父排除率为0. 999999545[ 11 ] 。
从这些数据充分显示, STR在法医学个体识别和亲权鉴定中,为司法审判、侦案、破案提供有利的科学依据[ 12 ]。
在由国际刑警组织注册的对性侵犯定罪的立法提案程序中, 所有参与的实验室都必
须检测4 个重要位点, 即: THO1、VWA、FGA 和D21S11, 他们的个体识别能力强而有效, 已成为欧洲众所周知的核心位点, 1999年后又扩展了另外的3 个位点。
最近在北美已经引入以STRs为基础的DNA 索引数据库, 建立了13 个STRs 位点的复合扩增: THO1、VW A、FGA、TPOX、CSF1PO、D3S1358、D5S181、D3S820、D8S1179、D13S317、D16S539、D18S51 和D21S11。
2.3 STR用于遗传学多态性研究
STR标记多位于非编码区,变异一般不影响人体的结构与功能,突变在进化过程中受自然选择压力较小,以近乎稳定的速率传递且不断积累,形成多样性。
通过研究STR多态性,变异速率以及比较序列间差异、人群间差异,分析不同人群间的遗传距离,就可从分子生物学角度揭示人类的起源、迁徙、进化等历史进程[ 13 ]。
目前,根据mtDNA、STR标记、Y染色体DNA 以及多态性Alu I序列的研究,大多数分子遗传学家支持现代人类单起源学说,认为现代人类起源于20万年前的非洲原始部落,然后向世界各地迁徙。
但也有学者支持现代人类多起源,认为除非洲外,亚洲、欧洲也可能是人类发源地。
Karafet[ 14 ]等通过Y - DNA创立者单体型的分析揭示存在1个以上的父系创立者单体型,美洲土著具有亚洲起源。
2.4 STR在疾病诊断和治疗中的应用DNA多态遗传标记的建立为基因染色体定位奠定了基础,家系连锁分析是目前最常用的基因定位方法。
目前连锁分析定位基因所用的遗传标记主要是STR。
STR等位基因数目较多,可提供的信息量大,因而在进行连锁分析时所需的样品数比采用双等位基因标记( SNP)时要少,适用于致病基因的初步定位[ 15 ]。
2.4.1 STR与遗传病的诊断近年来,发现基因内外的一些STR 与遗传病的发病有关. 目前报道较多的疾病有7 种遗传病与三核苷酸重复片段扩增突变有关:脆性X 综合征、脊髓延髓肌肉萎缩、强直性肌营养不良、Huntington舞蹈征、脊髓小脑共济失调Ⅰ型、FRAXE 轻度智力低下和齿状核苍白球丘脑下部萎缩. 在脆性X 综合征中,FMR1gene 中的(CGG) 顺序在正常人中的重复次数少于60 次,携带者60~100 次,而发病者则多于100 次. 也有人用STR 来研究单基因病,如苯丙酮尿症等[ 15 ]. 现在,STR 越来越多用于研究多基因病,如采用STR 对Ⅰ型糖尿病进行全基因组扫描,发现12 个位点与该疾病高度相关,其中包括HLA22 抗原位点. 更多的人开始用STR 方法对高血压、哮喘和Ⅱ型糖尿病进行了研究。
2.4.2 STR与肿瘤的诊断微卫星DNA 由于复制错误引起简单重复序列改变, 常产生微卫星不稳定性( Microsatelliteinstability ,MSI) ,表现为肿瘤组织与其相应非肿瘤组织DNA 结构性等位基因的大小发生改变. 它在胃肠道肿瘤的发生、发展过程中扮演重要角色,可能是肿瘤发生的一种新机制. MSI 首先在结直肠癌中观察到,1993 年,有的学者在研究遗传性非息肉大肠癌中观察到多条染色体均有短的核苷酸重复序列(CA) n 的增加或丢失,提示MSI 散布于整个基因组中. 后来陆续在子宫内膜癌、肺癌、乳腺癌、食管癌以及慢性髓细胞性白血病中都出现MSI ,人们认为MSI 可能在肿瘤基因调控中起重要作用,参与肿瘤的发生和发展. 这种基因水平的改变常先于表型的改变,通过MSI 的检测有助于早期发现某些肿瘤及对高危人群进行早期防治.
2.4.3 STR用于器官移植目前,各种器官移植技术在国内外已有一定发展,利用基因诊断技术进行术前组织配型,提高了器官移植的成功率;而对器官移植后植入状态的检测,对了解受者治疗疗效、指导医生用药、预后估测等更是有重要意义。
朱平[16 ]等认为STR作为骨髓移植后供者细胞植活的证据是很客观的:供者细胞植活后,受者外周血出现供者的STR类型,而受者口腔黏膜细胞仍为原来类型。
因此,可以长期观察供者细胞在受者体内存活情况。
2.4.4 STR适合于降解、微量检材的检测STR的扩增片段大多在400 bp 以下, PCR扩增容易成功,适用于降解检材的检验。
灵敏度也高于VNTR,达到ng级。
实验已经证明,实验室条件下,或模拟的各种环境条件下,各种斑痕,如血痕、精斑、阴道液斑,甚至是自然条件下的骨头,在数十年后仍能检出正确的STR基因型。
STR的等位基因长度相差不大,不易发生优势扩增
或杂合子等位基因丢失的现象。
此外, STR还应用于古生物学、民族学、考古学等领域的研究。
3 STR的研究前景
一个良好的遗传标记应高度稳定,具丰富的多态性,且在全基因组的分布较均匀,从简单高效的使用要求出发,又希望尽可能少的遗传标记基因座, STR基本符合上述要求,STR绝大多数位于非编码区, 不转录, 不编码蛋白质和RNA,不受选择压力的影响。
而且STR还具有容易扩增,具有高杂合性,片断小,序列简单等特点[17]。
因此, STR是很有发展前途的一种作为应用于筛选候选目的基因和研究人类进化史的遗传标记。
目前,对于STR的产生机制和用途还不是很清楚, 对于STR 的产生进化机制和作用还了解很少,还有许多重要的问题有待阐明,如导致三核苷酸重复序列不稳定性和扩展的分子机理尚不十分清楚. 虽然目前有众多学说,如染色体不对等交换、DNA 聚合酶在DNA 复制时的滑动,具有前突变的始祖染色体DNA 序列的不稳定增加,重复序列上游DNA 片段的插入等,但都不能认为是突变的最好解释;动态突变的致病机理尚未完全阐明.随着STR检测分型技术的不断更新和进步以及人类因组后基因时代的到来, STR的作用会日渐清楚,也将发现更多的基因座及基因型。
STR将会应用于更多方面的研究,而且在人类学、法医学等领域将体现出难以限量的价值。