植物LTR类反转录转座子序列分析识别方法_侯小改

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Abstract: LTR retrotransposons are an important class of eukaryotic transposable elements, which are ubiquitous and highly heterogeneous in plant and play a major role in genome evolution of eukaryote. They are now extensively employed in gene function and genetic diversity analyses. Identification of LTR retrotransposons is the precondition for its application.
1. 河南科技大学农学院 , 洛阳 471003; 2. 河南科技大学林学院 , 洛阳 471003
摘要: LTR 类反转录转座子 (Long terminal repeat retrotransponson)是真核生物中的一类重要转座元件 , 具有分
布广泛、异质性高等特点 , 在真核生物基因组进化中起着重要作用 , 现广泛应用于植物的基因功能分析和遗传 多样性研究等方面。 LTR 类反转录转座子的序列识别是其应用的前提条件 , 因此对 LTR 类反转录转座子的序 列鉴定和分析方法的研究具有重要的理论意义和实际应用价值。 LTR 类反转录转座子序列的生物信息学分析软 件按原理可大致分为序列比对分析和相关序列保守区域识别鉴定两类。比对软件如 BLAST、DNAstar 等 , 是一 种序列相似性搜索程序 , 通过与已知的反转录转座子序列比对后的序列相似性来判断未知序列是否是反转录 转座子序列 , 但这类软件不能直接获得具体的 LTR 等特征序列的相关信息 , 不能对反转录转座子序列的全长进 行识别。 识别鉴定软件按原理可分为从头算起法、 比较基因组法、 同源搜索法和结构基础法 4 种 , 如 LTR-Finder 等基于从头算起法的识别鉴定软件 , 可对 LTR 类反转录转座子全序列进行较准确地预测和注释 , RepeatMasker 等基于同源搜索法的软件 , 通过与数据库中的序列的相似性比对后发现可能存在的 LTR 类反转录转座子。 文章 对不同的 LTR 类反转录转座子预测方法进行了比较和分析 , 在此基础上归纳总结出一套分析 LTR 类反转录转 座子序列的操作流程 , 旨在为 LTR 类反转录转座子序列的分析提供参考。
收稿日期 : 20120724; 修回日期 : 20120902 基金项目 : 国家自然科学基金项目 ( 编号: 31070620), 河南省高校科技创新人才支持计划项目 ( 编号: 2010HASTTT002)和河南省高等学校青年 骨干教师计划 ( 编号: 2010GGJS-072)资助 作者简介 : 侯小改 , 教授 , 博士 , 研究方向:牡丹分子生物学。 E-mail: hkdhxg@126.com 通讯作者 : 侯小改 , 教授 , 博士 , 研究方向:牡丹分子生物学。 E-mail: hkdhxg@126.com 郭大龙 , 博士 , 副教授 , 研究方向:种质资源和生物技术。 E-mail: guodalong@mail.haust.edu.cn 网络出版时间 : 2012-9-25 03:18:38 URL: http://www.cnki.net/kcms/detail/11.1913.R.20120925.1518.002.html
HEREDITAS (Beijing) 2012 年 11 月 , 34(11): 1491― 1500 ISSN 0253-9772 www.chinagene.cn
技术与方法
DOI: 10.3724/SP.J.1005.2012.01491
植物 LTR 类反转录转座子序列分析识别方法
侯小改 1, 张曦 1, 郭大龙 2
关键词:
ቤተ መጻሕፍቲ ባይዱ
植物 LTR 类反转录转座子 ; 序列比对 ; 软件分析 ; 遗传多样性
Identification and analysis methods of plant LTR retrotransposon sequences
HOU Xiao-Gai1, ZHANG Xi1, GUO Da-Long2
1492
HEREDITAS (Beijing)
2012
第 34 卷
Therefore, it has important theoretical significance and practical application value in studying identification and analysis methods LTR retrotransposon sequences. Bioinformatic software of the sequence analysis, according to the work principle, can be classified roughly into two types: sequence alignment and sequence identification of conserved domains. Alignment software, such as BLAST and DNAstar, produce the corresponding sequence information through comparison of sequence similarity; however, this kind of software cannot be applied for full length sequences. According to the principle, LTR retrotransposon sequence identification software can be roughly sorted into four types: de novo repeat discovery method, comparative genomic method, homology-based method, and structure-based method. For example, LTR_Finder based on de novo repeat discovery method can accurately predict and annotate LTR retrotransposons for full length sequences; RepeatMasker, which is based on homology-based method, can discover LTR retrotransposons by comparing the similarity with known sequences in the database. In this article, different methods of identification and analysis of retrotransposon sequences were compared and analyzed, and a set of flow of LTR retrotransposons sequence analysis was summarized in order to provide the reference for LTR retrotransposons sequence analysis.
[6] [5] [4] [3] [1]
但包含有对转座起作用的启动子和终止子以及调控 序列。 LTR 类反转录转座子编码一些蛋白 , 其中主 要包含 3 个基因 , 种属特异抗原基因 (gag)、聚合酶 基因 (pol)、整合酶基因 (int)。gag 基因编码的蛋白质 与反转录转座子 RNA 的成熟及包装成适当的形状 以便整合到基因组中有关 , pol 基因编码反向复制或 转座所需的反转录酶 (RT : reverse transcriptase 和 RNase H: ribonuclease H), int 基因编码以 DNA 形式 的反转录转座子插入到新的染色体位置的整合酶[7]。 非 LTR 反转录转座子两端没有 LTR, 而在其 3′末端 具有 poly(A)尾巴 , 根据其结构 , 又分为长散布重复 元件 (Long interspersed repetitive element, LINE) 和 短散布重复元件(Short interspersed repetitive element, SINE), 其自身也没有转座酶或整合酶的编码能力 , 需要在细胞内已有的酶系统作用下进行转座 [8] 。不 同类型的反转录转座子其结构如图 1 所示。 LTR 类反转录转座子序列结构较复杂 , 在实际 中用不同方法获得的新序列必须先明确其相关结构 特征后 , 才能进一步在基因功能和遗传多样性分析 中应用。利用生物信息学软件对新获得的 LTR 类反 转录转座子序列进行比对分析 , 通过数据库搜索和 相关软件分析 , 找出序列之间相同或相似的区域 , 辨别序列之间的差异 , 同时结合 LTR 类反转录转座 子序列的结构特点 , 鉴定出保守序列及其相关结构 , 从而预测 LTR 类反转录转座子中 LTR 序列或其它 目的序列。然而对 LTR 类反转录转座子序列进行生
Keywords: plant LTR retrotransposons; sequence alignment; software analysis; genetic diversity
转 座 子 (Transposon), 又 名 转 位 子 、 跳 跃 基 因 (Jumping gene), 是指存在于染色体 DNA 上可以自 主复制和位移的一段 DNA 序列 , 它们能够在基因组 中通过转录和逆转录 , 或在内切酶 (Nuclease)的作用 下 , 在其他基因座上出现 。转座元件可分为 DNA 转座子和反转录转座子两类 , DNA 转座子是以 DNA 为中介 , 在基因组中以 “剪切 -粘贴” 的方式移动 , 这 种转座方式并不增加基因组的大小 ; 反转录转座子 则以 RNA 为中介 , 在基因组中以 “复制 -粘贴” 的方 反 式移动 , 该转座方式可导致宿主基因组的扩增 [2]。 转录转座子是真核生物中最为广泛的转座子 , 尤其 在 植 物 基 因 组 中 占 有 极 大 的 比 例 , 1984 年 被 Shepherd 等 首次发现后 , 大部分植物中都已经发 现有反转录转座子的分布 , 因其独特的性质已成 为基因功能分析和遗传多样性分析的有效工具。 反转录转座子又分为 LTR 类反转录转座子和非 LTR 类反转录转座子 。 LTR 类反转录转座子是自 然界中分布最广泛的一类反转录转座子 , 由于每经 过一次“复制 粘贴”模式的转座 , 都会造成基因组 序列的增加 , 因此 LTR 类反转录转座子往往是基因 组重复区域的主要成分。其根据序列相似性程度和 基 因 编 码 产 物 的 排 列 又 分 为 Ty1-copia 组 和 Ty3-gypsy 组 , 在植物基因组中都呈高拷贝存在 , 是 植物基因组的重要组成部分
1. College of Agriculture, Henan University of Science & Technology, Luoyang 471003, China; 2. College of Forestry, Henan University of Science & Technology, Luoyang 471003, China
相关文档
最新文档