人类短串联重复序列

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

人类短串联重复序列(STR)的研究进展

短串联重复序列( Short tandem repeat ,STR)又称微卫星DNA, STR 是一种可遗传的不稳定的并且具有高度多态性的短的核苷酸重复序列. STR 多态性具有种类多,分布广,高度多态性等特点,并按孟德尔遗传规律[ 1 ]在人群中世代相传. 通过对STR 多态性的认识,极大地推动了人类基因组的研究. 这种多态性标志已广泛用于构建人类遗传连锁图谱、基因定位、遗传病诊断、肿瘤细胞染色体分离与重组以及亲子鉴定等法医学检查.

DNA遗传标记的多态性研究发展按时间顺序可分为三代[4 ]。第1代遗传标记:限制性片段长度多态性( restriction fragment length polymorphism, RFLP)是Wyman 和White 于1980年偶然发现的,人类14号染色体上存在DNA片段长度有变化的区域,这些区域的结构特点是DNA由一段序列串联重复、首尾相接而成。重复次数可在几次至数百上千次之间变化。DNA重复单位长度在数bp至数十bp之间,组成串联重复的DNA是小卫星DNA。第2代遗传标记:短串联重复序列是由Holly等发现的重复单位的长度只有2~6 bp、重复次数一般在数次至几十次之间的串联重复DNA 序列,即微卫星DNA。微卫星DNA的等位基因片段的长度一般在400 bp 以下,故又称为短串联重复序列( STR)。第3代遗传标记:单核甘酸多态性( single nucleotide polymorphism, SNP)是单个碱基的置换、插入或缺失而形成的,是美国MIT提出的新一代多态性标记系统[5],近年来成为多种研究的焦点。虽然SNP的多态性位点是最多的,能比STR提供更全面的基因信息,但是STR还是以其独特的优点保存下来,仍被广泛的研究。

1.1 STR 的构成 STR 的核心序列为2~7bp ,呈串联重复排列.重复次数10~60 次左右,其总长度常小于400 bp.常见的有一、二、三、四核苷酸重复序列,约占真核生物基因组的5 %. 人类基因组的STR 单核苷酸重复以polyA ,polyT 多见,双核苷酸重复以(CA) n ,( GT) n , (AA) n , ( GG) n 常见, ( GC/ CG) 少见,其原因是由于3′端为G的C(即CPG) 易于甲基化. 三核苷酸重复以(CXG) n 类型常见,由于三核苷酸具有高度多态性,常用作DNA 的标记物.

每个特定位点的STR 均由两部分构成:中间的核心区和外围的侧翼区. 核心区含有一个以上称为“重复”的短序列,一般该重复单位的碱基对数目不变,而串联在一起的重复单位数目是随机改变的,如果用一种不切重复单位的限制性内切酶把DNA 分子切割成限制性片段,该限制性片段中位于核心区的外围即是侧翼区. 人群中不同个体可表现为侧翼区相同而串联重复单位的数目不同;也可为相同数目的重复单位,但侧翼区大小不同,或

者两者均不同. 通过对那些非STR 位点的DNA 限制性片段长度多态性( Rest riction f ragment lengthpolymorphism ,RFL P) 研究表明,每个位点的RFL P仅能检测到1 个或数个等位基因. 因此可以推论,STR 位点的侧翼区变异数也仅有少数几个. 这样,人群中该特定STR 位点的等位基因差异,主要应来自不同数目的串联重复[2,3]。

1.2 STR的分布据GeneBank等数据库资料统计,人类23 对染色体上至少分布着7901个STR位点,每对染色体的STR位点分别超过100个,其中1、2号染色体的位点均超过600个,性染色体上的已知位点数在264 个以上,现有的STR 位点覆盖长度达4000cM,平均间距0. 7 cM。随着人们对STR的进一步研究,其数目还会不断增加。

1.3 STR的种属特异性与多种基因座的指纹图不同,大多数STR具有人的种属特异性,至少是具有灵长类的种属特异性。1995年有学者[ 6 ]调查了9个STR的人种属特异性,结果在被调查的23种动物中, FES/FPS基因座没有扩增产物,而CSF1PO、TOX、TH01、HPRTB、vWA、F13A01等基因座则在灵长类有扩增产物,但是这些扩增产物的长度均位于这些基因座的STR的等位基因Ladder范围之外。此后对更多STR基因座的调查也得到了相似的结论。

1.4 STR产生的可能机制目前认为链滑动错配是短串联重复序列突变的主要机制。在DNA合成过程中,一条单链DNA可以发生一过性的脱位,生成一个中间性的结构后,再与另一DNA单链错配,形成链滑动错配,继续DNA的复制和修复。滑动错配可以造成缺失、插入或碱基替换。在STR 中,一条DNA单链可以向后折叠后再与另一条单链复性,在复性的位置形成环状突出,DNA修复酶可以将环状突出全部或部分切除,造成缺失。另一方面,也可以在无突出链相对突出的位置形成一个缺口,再由聚合酶填补此缺口,DNA重复的数目增加,造成插入突变。STR长度上的差异一般是重复单位的整数。复制滑动、姐妹染色体不等交换和遗传重组都是可导致重复单位数目发生改变的机制,但目前的研究证明复制滑动时导致STR重复数目改变是主要机制。链滑动错配还可以发生在一段单链的DNA片段,多见于回文序列或回文样序列。如CTGCAG和GCCNNNNNGGC。回文序列自身互补形成发夹结构,也能造成缺失或插入。不过,仅滑动链复制错配不能解释一些重复序列的特征,如为什么两性种系的三体重复稳定性有差异? 为什么CAG重复总在有意义链上等等? 所以,对STR产生和拷贝数的变异的遗传机制解释还有滚环扩增、不等交换( unequalcrossover)和碱基置换突变

等。

2 基于STR的应用研究

单个基因座的STR的遗传信息是很有限的,复合扩增可以增加遗传多态性

信息,提高工作效率。在复合扩增中,多对引物在同一反应管中进行。引物之间的互相作用,可导致非特异性的扩增产物出现,影响STR的分型。经大量的研究证明,只要复合扩增的条件是适当的,在绝大多数的情况下,复合扩增从双基因座扩增、三基因座扩增、四基因座扩增、七基因座扩增,直至15个STR基因座和一个性别基因同时复合扩增,检测方法从银染方法到用荧光标记引物在自动测序仪中自动分型,单基因座扩增与复合扩增的STR分型具有相同的结果。

目前STRs- PCR 技术已形成多位点检测方法, 即在同一分析反应中同时扩增来自两个或更多的位点的等位基因,扩增的重复序列由于重复次数的差异导致STR 基因座的等位基因分型不同, 在电泳分离后, 用放射性同位素、银染或荧光检测可区别不同的基因型。STRs- PCR 产物具有不连续的可分离的长度, 可以用每个基因座的几个或所有等位基因的片段构建成等位基因阶梯( allelic ladder) , 肉眼观察或利用仪器比对同一基因座的等位基因阶梯和扩增样品, 从而快速和准确地确定等位基因座。

2.1 STR应用于制作人类基因组遗传图谱遗传图谱( geneticmap)是指人类基因组内基因和专一的多态性DNA标记相对位置的图谱。STR在基因组内分布广泛、多态性程度高、可自动化检测、成为制作基因组遗传图谱的首选遗传标记。STR作为遗传标记使人类基因组的遗传制图和连锁分析发生了革命性的变化。1996年,法国Gene-thon实验室与美国国家卫生研究院几个中心合作,建立了以6000多个STR为主体遗传标记、分辨率达194 kb的高精密度图谱[ 7 ]。STR的出现使遗传图的精度得到进一步提高,同时也成为物理图上的标记,从而促进了遗传图与物理图的融合。利用STR作为遗传标记,人类基因组计划中的物理图于2000年也顺利完成[ 8 ]。

2.2 STR用于法医学个体识别和亲权鉴定法医检案中,经常会遇到极少量和较大降解的生物检材,最好的方法是用PCR扩增STR。人体血液、精液、精斑、毛发、指甲、骨和牙齿均可作为分析STR 的DNA 来源[ 9 ]。正是因为STR广泛存在于人类基因组中,具有高度多态性、杂合性和稳定性。当把几个STR位点联合分析后,可以得到相当高的累积个体识别率和父权排除率。据统计,两个无亲缘关系的个体基因型完全一致的概率< 10 - 12 ,因而STR用于法医学领域有着广阔的前景。国内学者对粤、桂、琼地区14个人群STR基因座频率调查显示15个STR基因座在14个人群中累积个体识别能力在1.05 ×10 - 16 ~

3. 18 ×10 - 18 ,累积非父排除率均在0. 9999[ 10 ]以上。泰国学者对泰国人的15个STR位电的分析得出累积个体识别能力为7. 01×10 - 18 ,累积非父排除率为0. 999999545[ 11 ] 。从这些数据充分显示, STR在法医学个体识别和亲权鉴定中,为司法审判、侦案、破案提供有利的科学依据[ 12 ]。。在由国际刑警组织注册的对性侵

相关文档
最新文档