类Tc1转座子研究进展

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中国科学: 生命科学

2011年 第41卷 第2期: 87 ~ 96 SCIENTIA SINICA Vitae

英文引用格式: Liu D, Tang W Q, Yang J Q, et al. Recent advancements in Tc1-like transposons. SCIENTIA SINICA Vitae, 2011, 41: 87–96, doi:

10.1360/052010-449

《中国科学》杂志社

SCIENCE CHINA PRESS

评 述

类Tc1转座子研究进展

刘东①

, 唐文乔①

*, 杨金权①

, 刘少军②

① 上海海洋大学水产与生命学院, 省部共建种质资源发掘与利用教育部重点实验室, 上海 201306; ② 湖南师范大学生命科学学院, 教育部蛋白质化学及鱼类发育生物学重点实验室, 长沙 410081 ∗ 联系人, E-mail: wqtang@

收稿日期: 2010-07-07; 接受日期: 2010-12-24

国家自然科学基金(批准号: 30630051, 30771650)、教育部博士点基金(批准号: 20070264001)、上海市重点学科(批准号: S30701)和上海市教委E-研究院(批准号: E03009)资助项目 DOI: 10.1360/052010-449

摘要 转座子广泛存在于各种生物基因组中, 能在染色体不同位点间转座, 并在基因组中大量扩增. 转座子的活动能引起生物基因组或基因的重组和变异, 加速生物多样性及其进化速率, 被视为生物基因组进化的内在驱动. 转座子分2类: 反转座子和DNA 转座子. 类Tc1转座子是DNA 转座子超级家族中种类最多、分布最广的一类. 本文简要概述了类Tc1转座子的结构特征, 及其扩增、转座和迸发的机制, 并展望了其应用和研究方向.

关键词 基因组 转座子 转座酶 类Tc1 进化

真核生物基因组中, 除编码蛋白序列和调控序列外, 还有许多功能未知的散布重复序列和串联重复序列. 转座子(transposable element; transposon)是一种能够迁移的散布重复序列, 广泛存在于各种生物的基因组中, 其转座酶基因是自然界中最普遍、最丰富的一种基因[1]. 20世纪20~40年代, McClintock [2]在研究玉米自交后代的染色体结构变化时, 发现9号染色体上具有一个可转座的断裂位点(dissociation, Ds), Ds 从原位点解裂后转入种子生色等位基因的邻近位点, 改变了种子生色基因的表达, 当Ds 从邻近位点转出后, 种子生色基因恢复正常表达, 由此提出Ds 是转座元件的概念. 在染色体间, “跳跃”的转座元件以一种精准的方式调控基因的表达, 因此被称为控制因子(controlling elements)或转座子[3]. 转座子具有两个主要特征: 一是能够从细胞染色体的一个位点迁移(转座)到另一个位点, 引起生物基因组或基因的重组和变异, 加速生物多样性和进化速率[4]; 二是能够在生物基因组中大量扩增拷贝, 是一类“自私基

因(selfish gene)”[5]. McClintock [3]创立的转座子理论, 改变了以往人们认为遗传物质是固定排列在染色体上的观念. 转座子被视为生物基因组进化的内在驱动[6]. 自1950年首次被报道以来, 转座子理论历经30余年才被遗传学界所接受[3], 现已成为生命科学研究的一个热点, 在PubMed 文献数据库, 以“transposable element”可检索出文献>19900篇.

根据转座机理, 转座子分为2类: 由RNA 介导的依靠反转座酶实现转座的Ⅰ类转座子, 或称反转座子(retransposon); 以DNA 形式的转座酶催化转座的Ⅱ类转座子, 又称DNA 转座子[7]. 自然界最普遍的DNA 转座子可能是在线虫(Caenorhabditis elegans )中发现的Tc1和果蝇(Drosophila )中发现的Mariner , 类似于Tc1和Mariner 的转座子在真菌、植物、原生动物、鱼类、蛙类和哺乳类基因组中均有发现[8]. 比较分析线虫、昆虫、涡虫(Planaria )和鱼类的类Tc1和类Mariner, 发现它们具有共同特征, 起源于同一祖先, 可构成1个Tc1-Mariner 超家族[9]. 基于转座子

刘东等: 类Tc1转座子研究进展

88

序列和结构的相似性, 真核生物的DNA 转座子至少可分为12个超家族[10,11]. 细菌DNA 转座子(称为插入序列, IS)IS630与Tc1-Mariner 具有相似的转座酶催化中心, 插入位点均为“TA”双核苷酸, 由此组成了1个IS630-Tc1-mariner(ITm)超家族[12]. 最近, 按照一种基于转座酶催化中心结构特点的新命名, ITm 超家族可分为包括Tc1, mariner 和maT 在内的7个家族[13], 其中Tc1家族种类最多、分布最广[14]. 本文将重点阐述真核生物类Tc1转座子的结构特征, 以及扩增、转座和迸发的机制, 并展望了其应用和研究方向.

1 结构特征

Tc1最初是作为引起线虫多态性的一个重复序列而被发现, 也是线虫基因组中首次被鉴定的DNA 转座子[14]. “Tc1”表示第1个来自于线虫的转座子, 与Tc1具有相似结构的转座子统称类Tc1转座子(TLEs)[15]. TLEs 具有一个编码转座酶基因, 两侧翼为末端反向重复序列(ITRs). 通常情况下, 由于ITRs 的大小或编码转座酶基因长短差异, 造成了LTEs 序列长度变化, 一般为1200~2400 bp. 每个ITRs 内, 一般有1~2个转座酶结合位点, 位于外侧的结合位点称为外侧正向重复(ODR), 位于内侧的结合位点称为内侧正向重复(IDR). 根据ITRs 长短和结构特征, TLEs 至少可分为3群[13]. 第一群, ITRs 长度<100 bp, 如线虫的Tc1为54 bp [16], 果蝇的Mos1为28 bp [17], 每个ITR 仅有1个转座酶结合位点; 第二群, ITRs 长度为200~ 250 bp, 每个ITR 有2个转座酶结合位点: ODR 和IDR, 因此也称为IR-DR 型. 鲑科鱼类分子重组的Sleeping beatuty (SB )就是典型代表[18], 也包括果蝇的Minos [19]和白端按蚊(Anopheles albimanus )的Quetzal [20]. 两个DR 序列长度较短, 一般为20~40 bp, 间隔序列约为200 bp, 这种结构为该群的一个保守特征. 虽然两个DR 能与转座酶发生连接反应, 但仅ODR 参与转座酶的剪切反应[18]. IR-DR 的重复可能是协同进化的结果[21]. 第三群, ITRs 长度>300 bp, 每个ITR 包含2个DR, 两者的间隔序列约为170 bp. 该群的主要代表为线虫的Tc3[22]和Tc7[23]. 然而, 也有例外, 如冈比亚按蚊(Ano - pheles gambiae )中的TsesebeI 的5’-ITRs 和3’-ITRs 长度为181和183 bp [24]. 以团头鲂(Megalobrama amblyce - phala )()×♂红鲫(Carassius auratus red var)()♀杂交, 从其F 1代的四倍体中鉴定的Tte1转座子, 其5’-ITRs

和3’-ITRs 长为137和127 bp, 不同于以上类群, 可能为另一个类群[25].

在无脊椎动物中, LTEs 编码转座酶基因, 一般表现为两种类型, 一种具完整的可读框, 编码活性的、约340个氨基酸(aa)的转座酶; 一种为可读框缺失, 或可读框移位, 编码非功能性的转座酶. 转座子相应地被称为自主转座子(autonomous transposons)和非自主转座子(non-autonomous transposons)[26], 线虫的Tc1, Tc3及Tc7等都具这两种类型[14]. 在脊椎动物中, LTEs 转座酶基因普遍具有不同程度的核苷酸插入或缺失, 造成可读框移位, 或基因序列内包含终止子, 从而丧失了编码转座酶的功能, 如斑马鱼(Danio rerio )的Tdr1[27]、

泥鳅(Misgurnus mizolepis )的MMTS [28]和蚯蚓(Eisenia Andrei )的EamaT1[29]等具有不同元件. 根据转座子元件间序列比对, 可推测出LTEs 的一致性序列. Ivics 等人[18]从鲑科鱼类中分离出失活的LTEs, 利用分子重组技术消除一致性序列的终止子, 构建出脊椎动物中第一个具活性的、能在哺乳动物细胞中转座的SB . Miskey 等人[30]重组了蛙(Rana pipiens )的一个转座子Frog Prince (FP ), FP 能转座到各种脊椎动物细胞中. 最近, 从鲽(pleuronectes platessa )基因组中鉴定的PPTN [31], 也称为Passport , 被发现具有自然编码完整转座酶的功能, 在哺乳动物细胞中表现出转座活性, 成为脊椎动物中第1个有自然活性的

LTEs [32].

比对分析转座酶Tc1A(343 aa), SB(340 aa), FP(337 aa), PPTN(340 aa)和转录因子Prd 、重组酶RAG1和Hin 的序列发现, 它们具有相似的结构, 包括N 端的一个DNA 结合中心, C 端的一个催化中心, N 和C 端之间的一个二分核定位信号(NLS). N 端的DNA 结合中心具有2个“螺旋-转角-螺旋”结构(HTH)[8]. 第1个HTH 与二分转录因子PAIRED(PAI 和RED)的PAI 相似, PAIRED 通过PAI 与DNA 特异性结合; 第2个HTH 与PAIRED 的RED 相似, RED 是PAIRED 与DNA 结合的核心区; 2个HTH 间隔一个调节PAIRED 与DNA 结合反应的类GRPR 结构[13]. C 端保守位点具有2个天冬氨酸(D)和1个谷氨酸(E), 组成了一个“DD34E”催化中心, 第2个D 和E 间隔了34 aa [8]. 转座酶具有与转录因子相似的DNA 结合域, 表明转座酶通过NLS 被运转到细胞核后, 直接识别并结合转座子的靶位点, 调控转座反应.

相关文档
最新文档