麻竹EST序列中GDC-P蛋白基因的预测及其翻译多肽的分析

合集下载

麻竹磷酸乙醇胺N-甲基转移酶基因的结构预测及分析

麻竹磷酸乙醇胺N-甲基转移酶基因的结构预测及分析

麻竹磷酸乙醇胺N-甲基转移酶基因的结构预测及分析摘要:为探讨麻竹磷酸乙醇胺N-甲基转移酶蛋白的结构,通过对麻竹EST序列分析,运用生物信息学所学知识,研究麻竹磷酸乙醇胺N-甲基转移酶基因的性质。

其结果显示,该蛋白质的CDs长度为993bp,等电点(PI)为6.35,相对分子质量为38033.3,利用DNAMAN 等软件,对其二级结构、三级结构进行了预测和分析。

除此,还利用CLC对麻竹及其它物种的磷酸乙醇胺N-甲基转移酶对应的蛋白序列进行对比分析,并利用CLC构建系统发育树。

关键词:磷酸乙醇胺N-甲基转移酶麻竹结构分析Abstract:To describe the secondary structure and the tertiary structure of tiflorus Munro Phosphoric acid amine N-ethanol phenol-o-methyl shift enzyme. Through the use of the knowledge of bioinformatics,the properties of this protein such as isoelectric point and relative molecular mass have been explored. In addition, the phylogenetic tree based on Phosphoric acid amine N-ethanol phenol-o-methyl shift enzyme has been built.Key word: Phosphoric acid amine N-ethanol phenol-o-methyl shift enzyme tiflorus Munro structural analysis磷酸乙醇胺N-甲基转移酶(phosphoethanolamine N-methyltransferase,phosphoethanolamine methyltransferase, PEAMT, EC 2.1.1.103)系统名为S 一腺普甲硫氨酸:磷酸乙醇胺甲基转移酶(S-adenosyl-L-methionine: ethanolamine-phosphate N-methyltransferase),是一种甲基转移酶,其主要功能是催化磷酸乙醇胺(P-EA)甲基化,最终合成磷酸胆碱(P-Cho),是合成磷酸胆碱的关键酶[1-7]磷酸胆碱在动物体内参与合成磷脂,具有保肝强肝、促进脂质代谢和抗脂肪肝的作用;还能加速甲基转移,供给活性甲基,促进肝细胞再生。

竹子基因组序列研究及应用

竹子基因组序列研究及应用
能结构, 以抽样的方式对某一物种的基因组随 机测序获得的序列。桂毅杰等采用鸟枪法随机 测定毛竹基因组序列, 获得了 996 条 GSS, 登录
序列 号 E D01 7875 -E D 018 870。其中 最长 的序 列 1 480 bp, 最短的序列 223 bp, 85% 的序列都在 900 bp 以上, 序 列 平 均长 926. 2 bp, 总 长 为 92 2456 bp( 0. 92 Mb) 。同时以玉米( B73) 和水 稻( 日本晴) 基因组作为内参, 用流式细胞仪 ( FCM ) 估计了毛竹基因组大小约2 034 M b, 测 得的毛竹 G SS 序列覆盖全基因组的 0. 45% [ 2] 。
表 1 NCBI 上登录的竹 亚科基因组序列分布情况 T ab. 1 Th e dist ribut ion of genomic sequences f rom N CBI in Bamb usoideae s equences
属种分布 G enus or Species
序列总数 N u mber of s equences
类型 T ype
主要竹种 Spe cie s
数目 N um ber
M A D S-b ox
麻竹( D . l atif l oru s)
18
纤维素合成酶( Cellul ose syn th as e)
绿竹
7
成熟酶( M at urase)
库页赤竹( C. coronalis)
6
蔗糖合成酶( Sucrose s ynt hase)
208
茶秆竹( P . am abil is)
208
竹属( B ambusa) ( 30)
93
牡竹属( D end rocal amus) ( 11)

麻竹EST—SSR标记开发及其对慈竹变异类型的分析研究

麻竹EST—SSR标记开发及其对慈竹变异类型的分析研究
热带亚热带植物学报
2 , 05 : 6 - 6 0 2 () 4 2 4 8 1 2
J un lf rpcl n u t pc l o n o ra o ia a d br i t y oT S o aB a
麻 竹 ES S 记 开 发 及 其 对 慈 竹 变 异 类 型 的 T— R标 S 分 析 研 究
Ba e n t e ES e u n e o t i i g S R i , o t a r fE T S R r e r e i n d f r d tc i g s d o T s q e c sc n an n S s e f ry p iso S - S p i r we e d sg e o e e t h t m n a l c t n e ce c , o y o p i a d t n f r b l y i u t ae a it n t p s f e in i. h s l mp i a i f i n y p l m r h s i f o i m n a s e a i t c l v t d v ra i e B. me e ss T er u t r i n i o y o e s
Ty sf o Ba pe r m mb s me e ss u a e i n i
G h- n Y NGL, I a-, I Qig AO Z i , A iL iiLU n mi C l
( train l e t f r a o n atn K yL b rtr nteSin e n eh oo yo a b oa dR t n Be ig10 0 , hn) I en t a ne o mb oa dR t , e a oaoyo cec dT cn lg n o C r B a h a fB m o n at , in 0 12 C ia a j

14_高等植物中的多肽激素lic

14_高等植物中的多肽激素lic

植物学通报 2006, 23 (5): 584 ̄594基金项目: 中国科学院植物研究所“百人计划”项目* Author for correspondence. E-mail: cmliu@高等植物中的多肽激素李琛,宋秀芬,刘春明*中国科学院植物研究所植物信号转导与代谢组学研究中心, 北京 100093摘要 高等植物的第一个多肽激素(系统素)发现已经有10多年的历史。

到目前为止, 被普遍认可的植物多肽激素有4种: 系统素、PSK 、CLV3和SCR, 分别参与了植物的防御反应、细胞的分裂、茎端生长点干细胞数目维持和花粉-柱头的识别过程。

这些小分子多肽化合物以配基的形式与细胞膜表面的受体激酶相互作用, 从而实现细胞之间的信号交流。

本文对这4种多肽激素及其相应受体的研究进展做了简要评述, 并着重介绍当前研究比较热门的CLV3多肽, 最后对相关领域的发展前景进行探讨。

关键词 多肽激素, 受体激酶, 信号转导Peptide Hormones in Higher PlantsChen Li, Xiufen Song, Chunming Liu *Center for Signal Transduction & Metabolomics , Institute of Botany , Chinese Academy of Sciences , Beijing100093, ChinaAbstract Although the first peptide hormone (systemin) in plants has been discovered for more than ten years, till now only four peptides have been accepted as peptide hormones. They are systemin, PSK, CLV3 and SCR, involved in wounding response, cell division, stem cell maintenance in the shoot apical meristem, and the interaction between pollen and stigma, respectively. These small peptides act as ligands to interact with receptor kinases located on the surface of the cytoplasma membrane, triggering downstream signal transductions.In this paper we outline the progresses made in this area, with emphasis on CLV3 peptides. We also provide our prospective vision in this field.Key words peptide hormones, receptor kinases, signal transduction1 植物中的多肽信号分子胰岛素作为动物中第一个被发现的多肽激素在动物的生理调节过程中起重要的作用, 随后的研究发现动物中存在众多的多肽激素, 这些多肽类激素在信号转导方面起着非常重要的作用。

竹子功能基因组和生物技术研究-概述说明以及解释

竹子功能基因组和生物技术研究-概述说明以及解释

竹子功能基因组和生物技术研究-概述说明以及解释1.引言1.1 概述竹子是一种重要的经济植物,具有广泛的应用价值和生态保护作用。

竹子功能基因组和生物技术研究是对竹子基因组组成、基因功能解析以及生物技术应用和发展趋势进行深入探索和研究的工作。

竹子功能基因组研究旨在揭示竹子基因组的组成成分和特点,并进一步分析其基因的功能和表达调控机制。

竹子生物技术研究则关注竹子的生物技术应用领域和发展潜力。

这些研究对于提高竹子的经济价值、推动竹子产业的持续发展、促进生态环境的保护和恢复等都具有重要的意义和影响。

本文将重点介绍竹子功能基因组和生物技术研究的相关内容,以期通过对竹子的深入研究,进一步发掘和利用竹子的潜力,促进竹子产业的可持续发展。

1.2 文章结构文章结构部分的内容可以写为:本文将按照以下结构进行叙述。

首先,引言部分将对竹子功能基因组和生物技术研究进行概述,介绍竹子的重要性和研究的意义。

接着,文章将分为正文和结论两部分。

正文部分将包括两个主要章节:竹子功能基因组研究和竹子生物技术研究。

首先,我们将深入探讨竹子功能基因组研究的相关内容,包括竹子基因组的组成和竹子基因的功能解析。

通过对竹子基因组的研究,我们可以更好地了解竹子的生物学特点、生长发育和抗逆性等方面的信息。

在竹子生物技术研究章节中,我们将讨论竹子在生物技术领域的应用。

竹子具有许多独特的特性,如快速生长、高耐旱性和丰富的纤维素等,这使得竹子成为生物技术的理想研究对象。

我们将介绍竹子在纤维素生产、生物能源开发、医药和食品等方面的生物技术应用,并探讨竹子生物技术研究的发展趋势,展望竹子在未来的应用前景。

最后,结论部分将对竹子功能基因组和生物技术研究进行总结,并展望其在未来的发展前景。

通过对竹子功能基因组和生物技术的深入研究,我们可以更好地利用竹子的优势特性,促进竹子产业的发展,推动可持续发展的实现。

整篇文章将系统地介绍竹子功能基因组和生物技术研究的最新进展和应用领域,以期为相关领域的科研人员和读者提供全面的了解和参考。

绿竹、麻竹、孟宗竹的线粒体基因组测序及比较分析

绿竹、麻竹、孟宗竹的线粒体基因组测序及比较分析

通过突变率公式,我们计算出绿竹的分化时间最早,这与进化树 显示的结果是吻合的。系统发生进化树的结果支持了竹子在分 类上的位置,即处于单子叶植物和双子叶植物分化的位置。
通过比较绿竹与高粱、小麦、玉米和水稻的蛋白编码基因,·我 们发现绿竹与,这可 能与竹子生长速度更快有关。
绿竹、麻竹、孟宗竹的线粒体基因组 测序及比较分析
竹子是最古老的禾本科植物之一,也是生长最快的植物之一。我 们利用3730和454测序平台对绿竹(Bambusa Oldhamii)、麻竹 (Dendrocalamus latiflorous)和孟宗竹(Phyllostachus pubescens)进行了线粒体基因组测序,经过拼接我们得到绿竹线 粒体基因组总长489540bp,其中蛋白质编码基因22个,核糖体RNA 基因2个,转运RNA基因17个,GC含量为44.1%。
麻竹草图全长为572370bp,其中蛋白质编码基因22个,核糖体RNA 基因5个,转运RNA基因18个,GC含量为43.1%。孟宗竹为569022bp, 其中蛋白质编码基因22个,核糖体RNA基因3个,转运RNA基因20 个,GC含量42.8%。
通过对三株竹子蛋白编码基因进行比较,发现绿竹和麻竹的蛋白 编码基因差别不大,只在nad1和nad2中出现了两个多态性位点; 在绿竹和孟宗竹的编码基因中发现了25个多态性位点,麻竹和孟 宗竹中发现了20个多态性位点,这些多态性位点或许与孟宗竹独 特的生长方式有关。另外我们在竹子线粒体DNA中发现了叶绿体 DNA的迁移,其中大部分为非编码序列,其余的包括蛋白编码序列 和tRNA基因。

龙竹和麻竹FT同源序列的扩增与序列分析

龙竹和麻竹FT同源序列的扩增与序列分析
异性 引物进 行 P R扩增 、 C 将扩增 产物转化并测序 , 并对 其核苷 酸和预 测编 码蛋 白的 氨基 酸序 列进行 分析 , 为
今后 竹子开 花机制 的研究提供重要 基础.
1 材 料 与方 法
1 1 实验 材 料 .
龙竹鲜 叶取 自泉州 师 范学 院校 园 内 , 竹 鲜 叶取 自永 春县 五 里街 镇. 肠杆 菌 ( shr hacl) 株 麻 大 E cei i i 菌 c o DH5 a由本实验室保存. 12 实验方法 .
第 3 卷 第 2期 O 21 年 3 02 月
泉州 师 范学 院学 报
J u n l fQu n h u No ma ie st o r a a z o r lUn v r i o y
V 0 0 No 2 L3 .
M a. 2 2 r 01
龙 竹 和 麻 竹 F丁 同源 序 列 的扩 增 与 序 列 分 析
通过 P R扩增 的方法分别从 麻竹和龙竹基 因组 D C NA 中各得到长 为 3 4b 3 p的 DNA片段. B AS 经 L T检 索、 基 因结 构分析和编码蛋 白功 能域预测 等分析 , 步确 定所 得 D 初 NA片段可 能是 麻竹 和龙 竹中的 FT同源基 因的部 分序列. 关键 词 : 麻竹 ; 龙竹 ; FT同源基 因 ; C P R扩增 ; 序列分 析 中图分类号 : 2 ; 7 8 4 Q5 3 ¥ 1 . 6 文献标识 码 : A 文章编 号 :0 98 2 ( 0 2 0—0 7 5 10 —2 4 2 1) 20 6- 0
收稿 日期 :0 1 92 2 1- — 7 0
作者简介 : 桑庆亮 (9 6 ) 男 , 1 7一 , 山东莱芜人 , 讲师 , 士 , 博 从事植物分子 生物学研究. 基金项 目: 建省科技厅青 年人才项 目(0 7 38 ) 泉州 市科技 局计划项 目(0 8 1 ) 福 20F 07 ; 2 0 Z 5

麻竹试管诱导开花及开花相关基因DlEMF2的克隆和功能分析的开题报告

麻竹试管诱导开花及开花相关基因DlEMF2的克隆和功能分析的开题报告

麻竹试管诱导开花及开花相关基因DlEMF2的克隆
和功能分析的开题报告
一、研究背景和意义
随着日益严重的环境问题以及人口增长的压力,自然界中许多植物仍然面临生存困境。

麻竹 (Bambusa emeiensis) 属于竹科植物中的一种重要资源,广泛应用于建筑、纸浆生产以及生态修复等领域。

然而,麻竹生长周期长,生育繁殖困难,影响了其资源性能的开发和利用。

为了提高麻竹资源利用效率和生态修复能力,研究麻竹的生长发育、开花和花器官发育等关键基因,具有重要的理论和实际意义。

二、研究内容和思路
本研究重点关注麻竹试管诱导开花及开花相关基因DlEMF2的克隆和功能分析。

应用常规PCR和RT-PCR技术克隆DlEMF2基因,对其进行序列分析和功能预测。

通过对麻竹试管诱导开花样本的采集与处理,观测外部条件对麻竹开花过程的影响,收集相关数据并进行数据分析。

利用RNAi技术对DlEMF2基因进行功能验证试验,评估该基因在麻竹开花过程中的作用。

三、研究预期结果
通过对DlEMF2基因的克隆和功能验证试验,建立麻竹开花相关基因座模型,提供基于分子水平的麻竹开花细胞生理、分子生物学等重要方向的研究基础,为麻竹生长发育的研究及开花时间控制的研究提供理论支持和实践应用价值。

毛竹ABCG基因鉴定及其表达模式研究

毛竹ABCG基因鉴定及其表达模式研究

核农学报2023,37(5):0917~0926Journal of Nuclear Agricultural Sciences毛竹ABCG基因鉴定及其表达模式研究李紫阳杨克彬朱成磊刘燕郭栋肖晓燕高志民 *(国际竹藤中心竹藤资源基因科学与基因产业化研究所,国家林业和草原局/北京市共建竹藤科学与技术重点实验室,北京100102)摘要:ATP结合盒转运蛋白G亚家族(ABCG)在植物体内的物质运输过程中发挥着重要作用。

为探究毛竹(Phyllostachys edulis)中ABCG s的分子特征、表达模式及转录因子对PeABCG15的调控关系,本研究利用生物信息学方法鉴定毛竹ABCG基因家族成员,对其基因结构、编码蛋白的理化性质和系统进化等进行系统分析,通过实时荧光定量PCR(qRT-PCR)技术对毛竹ABCG基因表达模式进行研究,借助酵母单杂交验证转录因子与ABCG基因的调控关系。

结果表明,在毛竹基因组中共鉴定到77个ABCG基因(PeABCG1~PeABCG77),其启动子中含有多种激素和非生物胁迫响应元件,其中脱落酸响应元件ABRE 最多,出现在74个基因的启动子中。

系统进化分析发现,PeABCGs分为白棕色复合体(WBC)和多效性耐药复合体(PDR)两个亚组,与水稻的亲缘关系较近。

qRT-PCR结果显示,在脱落酸(ABA)处理后,7个与ABA运输相关的PeABCG s中有6个呈上调表达趋势,而未检测到PeABCG34表达;在低温处理条件下,7个PeABCG s均受到诱导表达;在干旱处理条件下,有2个PeABCG s的表达受到抑制,其余基因的表达均受到不同程度的诱导。

另外,随着竹笋木质化程度增加,PeABCG15呈持续上调表达趋势,并与木质素合成调控转录因子基因PeKNAT3和PeMYB42的表达趋势一致。

酵母单杂交试验证实,PeKNAT3和PeMYB42均能与PeABCG15的启动子结合。

由此表明,PeABCG s参与毛竹抗逆可能存在ABA介导和非介导两种方式,其中PeABCG15受ABA诱导,且可能通过促进木质素合成参与毛竹抗逆。

4个丛生杂种竹的SSR分子鉴定

4个丛生杂种竹的SSR分子鉴定

4个丛生杂种竹的SSR分子鉴定
吴妙丹;董文娟;汤定钦
【期刊名称】《分子植物育种》
【年(卷),期】2009(7)5
【摘要】本研究以撑麻7号、版麻1号、青麻11号和撑麻青1号共4个丛生杂种竹及亲本为试验材料,利用从绿竹cDNA文库中开发的15个EST-SSR分子标记,鉴别4个丛生杂种竹的真实性。

4个杂交竹种在DOM03、DOM05、DOM09和DOM12的4个SSR座位上扩增产物的电泳条带分别为其父母本条带的组合,显示了这些标记的共显性特征。

进一步的测序结果验证了4个座位上的扩增产物均含有SSR序列,且杂种和亲本之间的序列具有同源性,初步验证了杂种的真实性。

【总页数】7页(P959-965)
【关键词】杂交竹种;SSR;分子鉴定
【作者】吴妙丹;董文娟;汤定钦
【作者单位】浙江林学院浙江省现代森林培育技术重点实验室,临安311300【正文语种】中文
【中图分类】S513;S795.04
【相关文献】
1.紫薇属种间杂种SSR分子鉴定与遗传分析 [J], 彭婵;李振芳;马林江;黄国伟;徐红梅;杨彦伶
2.应用SSR分子标记鉴定新台糖25号×云蔗89-7F1代大规模遗传群体的杂种真
实性 [J], 赖小群;黄帝媛;姚潇;陈悦佳;姚姿婷;邹承武;陈保善
3.SSR分子标记鉴定橡胶树F1真伪杂种 [J], 李文秀;贺军军;张华林;罗萍
4.基于SSR分子标记的多年生黑麦草杂交F1代杂种鉴定 [J], 汪阳;易莉美;班晚婷;闫三博;何洁;张新全;聂刚
5.基于SSR分子标记的多年生黑麦草杂交F_(1)代杂种鉴定 [J], 汪阳;易莉美;班晚婷;闫三博;何洁;张新全;聂刚
因版权原因,仅展示原文概要,查看原文内容请购买。

多肽组学技术

多肽组学技术

多肽组学技术多肽组学技术是一种研究蛋白质组成和功能的技术手段,通过分析和解读蛋白质组中的多肽序列,可以揭示生物体内蛋白质的结构、功能和相互作用等信息。

多肽组学技术的发展为生命科学研究提供了新的视角和方法,对于疾病诊断、药物研发和生物工程等领域具有重要意义。

多肽组学技术的核心是通过质谱分析和生物信息学方法对蛋白质组中的多肽进行鉴定和定量。

质谱分析是一种基于质量-电荷比的分析技术,可以快速准确地确定多肽的分子量和序列。

生物信息学方法则利用计算机和统计学方法对质谱数据进行处理和解读,从而获得多肽的鉴定结果和定量信息。

多肽组学技术在疾病诊断中具有重要应用。

通过分析人体液中的多肽组成,可以发现与疾病相关的蛋白质标志物。

例如,乳腺癌患者血浆中的一种特定多肽序列在质谱分析中被发现,并被证实与乳腺癌的发生和发展密切相关。

这种多肽序列可以作为乳腺癌的生物标志物,用于早期诊断和疾病监测。

多肽组学技术在药物研发中也发挥着重要作用。

药物的研发过程中,需要对药物和靶标之间的相互作用进行深入研究。

多肽组学技术可以通过分析蛋白质组中的多肽序列和修饰信息,揭示药物与靶标之间的相互作用机制。

这为药物的设计和优化提供了重要的理论依据。

多肽组学技术在生物工程领域也具有广泛应用。

通过分析和解读蛋白质组中的多肽序列,可以揭示蛋白质的结构和功能信息,为蛋白质的工程改造和合成提供指导。

例如,通过分析一种具有特定功能的多肽序列,可以设计出具有类似功能的人工多肽,并用于生物材料的制备和生物工艺的改良。

总结起来,多肽组学技术是一种研究蛋白质组成和功能的重要手段。

通过分析和解读蛋白质组中的多肽序列,可以揭示生物体内蛋白质的结构、功能和相互作用等信息。

多肽组学技术在疾病诊断、药物研发和生物工程等领域具有广泛应用前景,对推动生命科学研究和促进人类健康具有重要意义。

麻疯树磷酸烯酮式丙酮酸羧化酶pepc基因全长cDNA克隆及序列分析

麻疯树磷酸烯酮式丙酮酸羧化酶pepc基因全长cDNA克隆及序列分析
F N h n q ,L i 1 ,T A Mi ,L n li A Z e g. i IJ— . y1  ̄n I N n IXi—e ,CHEN n l n ,LU n —h Do g—i g a Me g z u
( .R sac stt o u t pclFrs y hn s cdm oet , u ag 3 0 Z ea g hn ; 1 eerhI tue f br i oet ,C ieeA a e yFrs y F yn 1 0, hj n ,C i ni S o a r r 14 i a 2 eerhIstt o o t ,C ieeA a e yFrs y,B in 10 9 ,C ia .R sac ntue f  ̄s y hn s cdm oet i F r r e ig 0 0 1 hn ) j
中 图 分 类 号 :7 84 ¥ 1 .6 文献标识码 : A
Cl n ng a q n eAnay i fFul-e t DNA f o i nd Se ue c lsso llng h c o

p p n r m a rph u c s e c Ge e f o J to a c r a
s q n e a ay i h we h tt e pe c g n n l dig a pe e dig fa s2 8 n ln t e ue c n l ss s o st a h p e e i cu n n o n r a n me i 98 bp i e g h,a d e c d sa l n n o e p oen o 6 a n c d Is a n cd s q e c h r s 9 9 r ti f9 5 mi o a i . t mi o a i e u n e s a e 4. 4% ,9 4 2. 6% ,9 6 0. 0% ,9 5 0. 0% ,9 50% , 0. 8 3 8. 3% ,8 4.61 ,8 % 2.4 4% sn n i,Glcn , i e ss y ie i e tt t t o e f p pc fo d n iy wi h h s o e r m Rii u c mmu s, Gospi m h ru u , Cir s cn s o ni sy u is t m tu

马氏珠母贝TLRP基因克隆及其功能研究

马氏珠母贝TLRP基因克隆及其功能研究

马氏珠母贝TLRP基因克隆及其功能研究作者:张美珍,王志新,吴羽媛,梁海鹰来源:《南方农业学报》2022年第08期摘要:【目的】明确马氏珠母贝TLRP基因(PmTLRP)的组织表达特征及哈维氏弧菌(Vibrio harveyi)刺激、植核及脂多糖(LPS)刺激后的时序表达特点,为进一步研究TLRs 在马氏珠母贝中的免疫机制打下基础。

【方法】采用RACE克隆PmTLRP基因cDNA序列,通过ProtParam、ProtScale、SignalP 4.0、TMHMM v.2.0、SMART、SoftBerry Psite和SOPMA 等在线软件进行生物信息学分析,并以实时荧光定量PCR检测PmTLRP基因在马氏珠母贝各组织中及经哈维氏弧菌、植核及LPS刺激后的表达情况。

【结果】PmTLRP基因cDNA序列全长2214 bp,包含33 bp的5'非编码区(5'-UTR)、135 bp的3'非编码区(3'-UTR)及2043 bp的开放阅读框(ORF),共编码681个氨基酸残基;其编码蛋白含有信号肽、富含亮氨酸重复序列(LRRs)、跨膜结构域和TIR结构域,符合TLRs家族所具有的特征;PmTLRP氨基酸序列与其他物种的TLRs氨基酸序列存在一定相似性,其中与美洲牡蛎TLP氨基酸序列的相似度较高。

PmTLRP基因在马氏珠母贝外套膜、血淋巴、肝胰腺、鳃、性腺和闭壳肌中均有表达,以在肝胰腺中的相对表达量最高,显著高于在其他组织中的相对表达量(P<0.05)。

在哈维氏弧菌刺激下,PmTLRP基因在血淋巴中的相对表达量于注射刺激后12 h开始上调,至注射刺激后16 h达最大值,约是注射刺激前(0 h)的19.0倍。

经植核刺激后,PmTLRP基因相对表达量在植核后5~20 d呈逐渐上升趋势,于植核后30 d达最大值,约是植核前(0 h)的6.4倍。

在LPS刺激下,PmTLRP基因在血淋巴中的相对表达量先上升后下降,至注射刺激后3 h达最大值,约是对照组的5.0倍;PmTLRP基因在肝胰腺中的相对表达量呈升高→降低→升高→降低→升高的波动变化趋势,至注射刺激后24 h相对表达量上调到最大值,约是对照组的6.0倍。

茅苍术的全长转录组分析

茅苍术的全长转录组分析

第 42 卷第 3 期2023年 5 月Vol.42 No.3May 2023中南民族大学学报(自然科学版)Journal of South-Central Minzu University(Natural Science Edition)茅苍术的全长转录组分析周竹青1,林敏1,梅之南1, 2,熊慧1 *(1 中南民族大学药学院,武汉430074;2 华中农业大学植物科学技术学院,武汉430070)摘要为探究茅苍术Atractylodes lancea(Thunb.) DC.中药用活性成分生物合成的遗传基础,对茅苍术进行三代全长转录组测序,通过生物学信息学分析,构建了茅苍术全长转录本数据库.共获得26238条平均长度为1360 bp的全长转录本,其中25413条(96.86%)在NR、KEGG、GO、KOG和Swiss-Prot 5个数据库中得到注释.根据NR比对结果,茅苍术与菊科菜蓟属刺苞菜蓟(Cynara cardunculus)最为相似;根据GO注释分析,8371条转录本注释到生物学过程、分子功能和细胞组成的三大类共48条GO条目;有15848条转录本注释到KOG数据库,参与基本功能预测序列数目最多,为2598条;在KEGG注释分析中,共有12137条转录本被注释到130条代谢通路;基因结构分析中,得到325条LncRNA、24723条CDS序列,检测到SSR位点8027个;根据转录因子分析,共预测到81个TF家族,包括1830个转录因子.该研究获得了茅苍术的全长转录组数据库,并为后续开展苍术的育种、活性成分的生物合成机制以及遗传多样性等分子研究提供宝贵的遗传资源.关键词茅苍术;全长转录组;功能注释中图分类号S567.239 文献标志码 A 文章编号1672-4321(2023)03-0319-08doi:10.20056/ki.ZNMDZK.20230305Full-length transcriptome analysis of Atractylodes lancea (Thunb.) DC.ZHOU Zhuqing1,LIN Min1,MEI Zhinan1, 2,XIONG Hui1 *(1 School of Pharmaceutical Sciences, South-Central Minzu University, Wuhan 430074, China; 2 College of Plant Science and Technology, Huazhong Agricultural University, Wuhan 430070, China)Abstract In order to explore the genetic basis of the biosynthesis of active components in Atractylodes lancea(Thunb.)DC.(A. lancea), full-length transcriptome sequencing was performed. The full-length transcript database of A. lancea was constructed by bioinformatics analyzing. A total of 26238 full-length transcripts with an average length of 1360 bp were obtained, of which 25413 (96.86%) transcripts were annotated in five databases: NR, KEGG, GO, KOG, and Swiss-Prot. According to the NR comparison results,A. lancea is mostly similar to Cynara cardunculus,a plant belonging to family Compositae, Cynara. On the basis of GO annotation analysis, 8371 transcripts were annotated into three categoriesof biological process,cell composition and molecular function,and 48 GO terms. In KOG database,there were 15848 transcripts that could be annotated to the KOG database,among them the transcripts involved in General function prediction were the most, which was 2598. A total of 12137 transcripts were annotated to 130 metabolic pathways based on the KEGG annotation analysis. In the gene structure analysis, 325 LncRNA and 24723 CDS sequences were obtained, and 8027 SSR sites were detected. According to the transcription factor analysis,a total of 81 TF families were predicted,including 1830 transcription factors. In this study, the full-length transcriptome database of A. lancea was obtained, and which provided valuable genetic resources for subsequent molecular studies such as the breeding of A. lancea,the biosynthesis mechanism of active components, and genetic diversity.Keywords Atractylodes lancea(Thunb.) DC.; full-Length transcriptome; function annotation收稿日期2022-07-21* 通信作者熊慧(1986-),女,副教授,博士,研究方向:中药及民族药的药效物质基础与作用机制研究,E-mail:***********************基金项目国家科技重大专项重大新药创制项目(2017ZX09301060);湖北省科技重大专项(2021ACA004)第 42 卷中南民族大学学报(自然科学版)苍术为菊科植物茅苍术(Atractylodes lancea (Thunb.)DC.)或北苍术(Atractylodes chinensis(DC.)Koidz.)的干燥根茎.茅苍术(A. lancea)主要分布在江苏、湖北、河南等省,江苏茅山为其道地产区,由于开采过度,导致茅苍术野生资源匮乏,市场上的茅苍术多来自湖北产区的栽培品.苍术的传统功效为燥湿健脾,祛风散寒,明目,现代研究表明:苍术具有抗炎、抑菌、保肝、降血糖、抗肿瘤、保护消化系统等药理作用[1].茅苍术在中药复方中应用十分广泛,具有较高的药用价值和经济价值.转录组测序技术在研究生物体表型和基因表达水平方面具有重要作用,转录组测序技术已经从第一代的双脱氧链测序技术发展至第四代固态纳米测序技术,目前以二代和三代测序技术应用较为广泛.二代转录组测序读长短,reads数量大,主要用于基因表达定量.相比于二代测序技术,三代测序技术具有超长读长、高精度、可检测出碱基修饰的优点,可以获取生物体的全长基因、研究其基因结构[2],三代测序技术的原理是单分子荧光测序,从头测序,实现了每一条DNA分子的单独测序,目前主要包括Helicos的SMS技术和Pacific Bioscience的SMRT技术,本研究所使用的是PacBio平台的SMRT 测序技术,三代测序技术在研究无参考基因物种上有很大优势.三代转录组测序技术可在药用植物有效物质的生物合成、基因调控植物生长发育、抗胁迫功能基因的挖掘等方面发挥重要作用,对中药资源的开发和保护有极大意义.苍术含有丰富的挥发油,主要包括榄香醇、苍术酮、苍术醇、β-桉叶醇、芹子二烯酮和苍术素等化学成分,不同地区挥发油成分及含量有较大差异,江苏茅山地区茅苍术的挥发油含有苍术酮和苍术素,含少量苍术醇和β-桉叶醇等其他成分;湖北地区茅苍术的挥发油主要成分是苍术醇和β-桉叶醇,含有少量苍术素,几乎不含苍术酮和芹子二烯酮[3].这种规律受地理环境和品种等因素的影响,而探明在基因水平上如何调控苍术次生代谢物的积累对苍术的栽培育种有重要作用,因此对苍术进行基因组学和转录组学的研究十分必要.目前,苍术的基因组尚未公布,相关基因与转录组学研究已有报道,其中苍术的二代转录组测序研究和茅苍术倍半萜合成关键酶基因序列的克隆与分析报道较多. HUANG等利用二代转录组测序技术对茅苍术的根茎和叶进行测序,通过差异基因表达分析确定了104个候选基因可能与根茎的生长发育相关[4]. 3-羟基-3-甲基戊二酰辅酶A还原酶(HMGR)、1-脱氧木糖-5-磷酸合酶(DXS)和法尼基焦磷酸合酶(FPPS)是萜类化合物生物合成的关键酶[5].赵建华等对北苍术根茎进行转录组测序,发现FPPS、HMGR和DXS基因的相对表达量在不同器官中有显著差异,在叶中表达量较低,在茎、根茎、花、越冬芽中相对较高[6].陈丽娜等克隆了茅苍术两条HMGR基因序列,邓娟等克隆了茅苍术DXS基因的全长cDNA序列[7-9].本研究以茅苍术的根茎、须根和叶片为材料,进行了全长转录组测序工作,并对测序结果进行了分析,以期为茅苍术育种、活性成分的生物合成以及遗传多样性等研究提供遗传学基础,并为苍术的道地性研究奠定理论基础.1 材料与方法1.1 实验材料从湖北省麻城市苍术种植基地采摘茅苍术,经中南民族大学熊慧副教授鉴定为茅苍术(Atractylodes lancea(Thunb.)DC.),以8月下旬开花期茅苍术的须根、根茎、叶片组织为实验材料,液氮迅速冷冻后,-80 ℃保存样品.1.2 总RNA的提取与检测使用RNA提取试剂盒(DP441,北京天根生化)提取样品的总RNA,利用Nanodrop 2000(IMPLEN,德国)检测RNA的浓度和纯度,利用琼脂糖凝胶电泳检测样品RNA纯度、完整性、是否污染,利用Agilent 2100(安捷伦,美国)测定RIN值.1.3 文库构建及测序使用Clonetech SMARTerTM PCR cDNA Synthesis Kit合成mRNA的全长cDNA,cDNA经过纯化后,进行片段筛选、末端修复、连接SMRT哑铃型接头和核酸外切酶消化,获得测序文库.利用Qubit 3.0进行准确定量,并用Agilent 2100对文库大小进行检测,库检合格后,使用PacBio测序仪进行全长转录组测序,本研究的测序工作委托武汉迈特维尔生物科技有限公司完成.1.4 数据处理使用SMRTlink软件对原始测序数据进行处理,去掉接头和低质量reads,得到Subreads.经过CCS算法得到环形一致性序列(circular consensus sequence,CCS),通过检测嵌合体序列(concatemer)、5'和3'端测序引物,将CCS序列分为全长非嵌合序列(full-length320第 3 期周竹青,等:茅苍术的全长转录组分析non-concatemer,FLNC)和非全长非嵌合序列(non-full-length,nFL),通过FLNC聚类校正,得到consensus序列,用nFL对consensus序列进行校正,得到高质量的polished consensus序列.利用cd-hit软件进行聚类去冗余,得到的最终全长转录本序列用于后续分析. 1.5 转录本序列的功能注释基于NR(nonredundant protein database)、GO(gene ontology)、KEGG(kyoto encyclopedia of genes and genomes)、KOG(eukaryotic orthologous groups)、Swiss-Prot(swiss prot protein database)数据库对全长转录本进行功能注释.1.6 转录本序列的LncRNA、CDS、SSR、TF分析使用CNCI、CPC2、PLEK和CPAT 4个软件对5个数据库都没有注释到的转录本序列进行编码潜能预测,并对4个软件预测的结果取交集,统计LncRNA (long non-coding RNA)预测情况;利用transdecoder 软件进行CDS(coding sequence)预测分析;使用MISA 软件,对转录本进行SSR(simple sequence repeat)检测;使用iTAK软件进行TF(transcription factor)预测. 2 结果与分析2.1 数据产出统计及全长转录本分析本研究基于PacBio平台的单分子实时测序技术(SMRT)对茅苍术的根茎、须根、叶片混合RNA进行全长转录组测序,共获得35910731条Subreads (49.3 Gb),通过多次测序结果相互校正测序错误之后,对CCS序列的数量等进行统计,获得425649条CCS reads,通过FLNC鉴定得到325819条具有poly A的FLNC.利用SMRTlink软件对FLNC序列进行聚类去冗余,得到非冗余的transcript序列集合.进一步对上述得到transcript序列进行校正,得到32030条polished consensus序列.利用cd-hit进行聚类去冗余,最终得到26238条平均长度为1360 bp,N50为1522 bp的全长转录本序列,Reads长度主要分布在1000~2000 bp之间(图1),说明本次测序所得序列质量较好,可用于后续分析.本研究所得全长转录本序列已上传至NCBI SRA数据库中(https://submit. /subs/sra/,SRA accession: SRR20280197,Bioproject accession: PRJNA858930).2.2 全长转录本序列功能注释及分析2.2.1 数据产出分析通过比对,共有25413(96.86%)全长转录本在NR、GO、KEGG、KOG、SwissProt五大数据库中成功注释,如图2,其中NR数据库注释到25378(96.72%)条,GO数据库注释到8371(31.90%),KEGG数据库注释到12137(46.26%),KOG数据库注释到15848(60.40%)条,SwissProt数据库注释到21951(83.66%)条,825(3.14%)条全长转录本未被注释(图2).2.2.2 NR物种相似度统计将各转录本在NR数据库中比对结果最好的一条序列为对应同源序列,确定其所属物种,统计比对到各个物种的同源序列数量如图3,比对上转录本数量较多的物种包括刺苞菜蓟(Cynara cardunculus)17056条,莴苣(Lactuca sativa)3719条,向日葵(Helianthus annuus)1890条,黄花蒿(Artemisia annua)1145条.茅苍术和全长转录本比对到的最相似物种刺苞菜蓟均为菊科管状花亚科菜蓟族植物(图3).图2 全长转录本在五大数据库中的注释统计Fig.2 Annotation statistics of full-length transcripts in fivemajor databases图1 全长转录本长度分布Fig.1 Full-length transcripts length distribution321第 42 卷中南民族大学学报(自然科学版)2.2.3 GO 功能分类在GO 功能注释中,有8371条转录本注释成功,分为生物学过程(红色)、分子功能(绿色)和细胞组分(蓝色)三大类及48条GO 条目.其中细胞组分基因数量分布最多,为19881;生物过程为14718;分子功能为9184. 48条GO 条目中,基因数量分布较多的生物过程包括:细胞过程(3880)、代谢过程(3350)及单生物进程(2234);基因数量分布较多的细胞组分包括:细胞(4303)、细胞部分(4210)和细胞器(3131);基因数量分布较多的分子功能包括:结合活性(4088)和催化活性(3728)(图4).2.2.4 KOG 功能注释茅苍术全长转录本在KOG 中有15848条序列被注释,各功能注释情况如图5.参与基本功能预测、翻译后修饰,蛋白质折叠和伴侣蛋白及信号图3 全长转录本的相似物种分布统计Fig.3 Similar species distribution statistics for full -length transcripts图4 全长转录本的GO 功能注释Fig.4 GO functional annotation of full -length transcripts322第 3 期周竹青,等:茅苍术的全长转录组分析转导机制的序列数目分别为2598条、2312条、1655条.2.2.5 KEGG 代谢通路注释在KEGG 注释分析中,茅苍术全长转录本共有12137条序列被注释到130条代谢通路,分为5个分支:细胞过程,环境信息处理,遗传信息处理,代谢,有机系统.其中代谢的通路数目最多,有99条,注释到碳代谢和氨基酸合成的基因数目较多,分别为708和660个(表1).苍术的活性成分主要是倍半萜类和聚乙炔类化合物,倍半萜类化合物是先通过甲羟戊酸(MVA )途径和2-C -甲基-D -赤藓醇-4-磷酸(MEP )途径合成异戊二烯焦磷酸(IPP ),后经过牻牛儿基焦磷酸合成酶、法呢基焦磷酸合成酶和倍半萜烯环化酶的催化形成倍半萜;而聚乙炔类化合物的合成途径尚不明确,但可能与不饱和脂肪酸的合成与代谢密切相关.KEGG 中注释到与苍术的活性成分生物合成相关的通路包括脂肪酸合成、不饱和脂肪酸的生物合成、alpha -亚麻酸代谢、萜类骨架的生物合成及倍半萜和三萜类生物合成等.2.3 茅苍术全长转录组的LncRNA 、CDS 、SSR 、TF分析LncRNA 是一类转录本长度超过200 nt ,不编码蛋白质的RNA 分子,统计4个软件预测为非编码的转录本序列条数,最终获得325条共有LncRNA ,各个方法预测出的LncRNA 共有和特有的数目如图6.CDS 是编码一段蛋白产物的序列,与蛋白质的密码子完全对应,对茅苍术全长转录本进行CDS 预测,获得24723条CDS 序列,序列长度分布结果如图7,CDS 序列长度分布在500~3000 nt ,主要集中在500~1500 nt 之间.SSR 是由几个核苷酸(通常为1~6个)为重复单位组成的长达几十个核苷酸的重复序列,SSR 分析结果如表2,在茅苍术全长转录组中,检测到有SSR 位点8027个,SSR 位点最多的为双核苷酸重复,有2655个;其次为三核苷酸重复,有2113个;此外,单核苷酸重复的有2004个;四核苷酸重复的有809个;五核苷酸重复的有80个;六核苷酸重复的有366个.TF 是一种结合在特定基因上游特异核苷酸序列并调控其基因转录的蛋白质.利用iTAK 软件进行植物转录因子预测共鉴定到81个TF 家族,包括1830个转录因子,各家族转录因子数量如图8.其中鉴定到AP2/ERF 家族的转录因子最多,达232个.图5 全长转录本的KOG 分类Fig.5 KOG classification of full -length transcripts323第 42 卷中南民族大学学报(自然科学版)表1 KEGG 注释中部分代谢通路Tab.1 Some metabolic pathways in KEGG annotations类别Cellular processesEnvironmental information processing Genetic information processingMetabolismOrganismal systemsKEGG 通路Endocytosis Peroxisome Phagosome Plant hormone signal transduction MAPK signaling pathway -plantRibosomeProtein processing in endoplasmic reticulumSpliceosomeCarbon metabolismBiosynthesis of amino acids Glycolysis/Gluconeogenesis Fatty acid metabolism Biosynthesis of unsaturated fatty acids alpha -Linolenic acid metabolism Fatty acid degradationCitrate cycle (TCA cycle )Flavonoid biosynthesis Fatty acid biosynthesis Stilbenoid , diarylheptanoid and gingerol biosynthesis Terpenoid backbone biosynthesisSesquiterpenoid and triterpenoid biosynthesisPlant -pathogen interaction Circadian rhythm -plant 通路IDko04144ko04146ko04145ko04075ko04016ko03010ko04141ko03040ko01200ko01230ko00010ko01212ko01040ko00592ko00071ko00020ko00941ko00061ko00945ko00900ko00909ko04626ko04712基因数目358204181336278641521365708660386374273247163130928972752234345图6 LncRNA 预测Fig.6 LncRNA prediction表2 SSR 不同重复基序分布Tab.2 Distribution of the different repeat motifs for SSR 重复基元长度单核苷酸双核苷酸三核苷酸四核苷酸五核苷酸六核苷酸总SSR 数量重复次数≥10≥6≥5≥5≥5≥5SSR 数量200426552113809803668027百分比/%24.9733.0726.3210.081.004.56100图8 TF 家族转录因子数量统计Fig.8 The numbers of transcription factors in different TF family图7 CDS 序列长度分布Fig.7 Length distribution of CDS sequences324第 3 期周竹青,等:茅苍术的全长转录组分析3 讨论随着高通量测序技术的发展,转录组测序已经成为研究基因表达调控的重要手段,但是由于二代测序读长的限制,不能得到生物体完整的转录本,PacBio平台利用单分子实时(SMRT)测序技术,借助其超长读长优势,无需组装即可获得从5'端到poly A尾的完整转录本,更准确的表达生物体的转录组信息,能够准确鉴定序列,并对可变剪接、融合基因、等位基因表达等进行精确分析[10-12].近年来,苍术的基因和转录组研究逐渐增多,但大多是研究倍半萜合成关键酶基因的克隆分析及利用二代转录组测序研究苍术不同部位的差异基因表达. 本次研究以茅苍术的根茎、须根、叶片为材料,进行全长转录组测序,获得26238条平均长度为1360 bp的高质量全长转录本序列,其中有25413(96.86%)全长转录本在NR、GO、KEGG、KOG、SwissProt五大数据库中成功注释.根据NR物种相似度比较结果,基于目前的物种基因组信息,发现茅苍术与菊科菜蓟属刺苞菜蓟(Cynara cardunculus)的序列同源性最高.在GO分析中,有8371条转录本得到注释,其中细胞组分基因数量分布最多,为19881.在KEGG代谢通路注释中,有12137条序列被注释到130条代谢通路,注释到碳代谢的基因数目最多,达708个;苍术的药效成分以倍半萜类和聚乙炔类化合物为主,目前,聚乙炔类化合物的生物合成机制尚不明确,但已有研究表明其合成与不饱和脂肪酸的合成与代谢密切相关[13],本研究注释到与倍半萜和聚乙炔类化合物相关的代谢通路主要包括萜类骨架生物合成、倍半萜和三萜生物合成、不饱和脂肪酸生物合成和alpha-亚麻酸代谢等,为探究苍术药效物质的生物合成提供一定参考.简单重复序列标记(SSR),可作为一种分子标记技术,具有共显性、高重复率、成本低等优点,在研究DNA指纹、品种鉴定、系谱分析和标记辅助育种等方面具有重要意义[14-16],在茅苍术全长转录本中,检测到有SSR位点8027个,最多的为双核苷酸重复,有2655个,与SHAN对茅苍术SSR的研究有所不同,其检测到数目最多的SSR为单核苷酸重复[17].可能是因为SHAN以茅苍术叶片为材料,本研究是对茅苍术的根茎、须根、叶片的混合RNA进行测序.本研究在植物转录因子预测中,共鉴定到81个TF家族,包括1830个转录因子,其中鉴定到AP2/ERF家族的转录因子最多,AP2/ERF家族转录因子与植物的生长发育及逆境胁迫响应密切相关[18],有研究表明该家族转录因子还参与调控长春花萜类吲哚生物碱和青蒿素等萜类化合物的生物合成[19-21].本研究利用 PacBio 测序技术获取的茅苍术全长转录组测序数据质量可靠,研究结果为苍术属植物的转录组研究提供了一定参考,同时也为茅苍术倍半萜类和聚乙炔类化合物合成途径的探究、育种、茅苍术分子标记技术的开发和其生长发育及抗逆境胁迫研究提供了可靠的数据支撑.参考文献[1]邓爱平,李颖,吴志涛,等. 苍术化学成分和药理的研究进展[J]. 中国中药杂志, 2016, 41(21): 3904-3913.[2]ROBERTS R J,CARNEIRO M O,SCHATZ M C. The advantages of SMRT sequencing[J]. Genome Biol,2013, 14(7): 405.[3]ZHANG W J, ZHAO Z Y, CHANG L K, et al. Atractylodis Rhizoma:A review of its traditional uses,phytochemistry,pharmacology,toxicology and quality control[J]. JEithnopharmacol, 2021, 266: 113415.[4]HUANG Q Q,HUANG X,DENG J,et al. Differential gene expression between leaf and Rhizome in Atractylodeslancea:A comparative transcriptome analysis[J]. FrontPlant Sci, 2016, 7: 348.[5]ZHAO J H,SUN C Z,SHI F Y,et al. Comparative transcriptome analysis reveals sesquiterpenoid biosynthesisamong 1-,2-and 3-year old Atractylodes chinensis[J].BMC Plant Biol, 2021, 21(1): 354.[6]赵建华,赵重阳,孙成振,等. 北苍术转录组分析及倍半萜类生物合成关键基因挖掘[J]. 植物生理学报,2020, 56(7): 1458-1466.[7]陈丽娜,万倩芸,邓娟,等. 茅苍术两个HMGR基因(AlHMGR)的克隆与分析[J]. 基因组学与应用生物学,2020, 39(4): 1732-1740.[8]邓娟,万倩芸,龚玲,等. 茅苍术DXS基因的克隆与分析[J]. 中国实验方剂学杂志, 2017, 23(16): 39-44.[9]陈丽娜,万倩芸,邓娟,等. 茅苍术两个DXR基因(AlDXR)的克隆与分析[J]. 分子植物育种, 2019, 17(13): 4249-4256.[10]RHOADS A,AU K F. PacBio sequencing and its applications[J]. Genom Proteom Bioinf, 2015, 13(5),278-289.[11]夏丽飞,孙云南,宋维希,等. 基于PacBio平台的紫娟茶树全长转录组分析[J]. 基因组学与应用生物学,2020, 39(6): 2646-2658.[12]宋发军,杨瑞霜,吕昕芮,等.基于PacBio平台的七叶325第 42 卷中南民族大学学报(自然科学版)一枝花全长转录组测序[J].中南民族大学学报(自然科学版),2022,41(2):153-160.[13]MINTO R E,BRENDA J B. Biosynthesis and function of polyacetylenes and allied natural products[J]. ProgLipid Res, 2008, 47(4): 233-306.[14]韩凤,刘春雷,罗川,等. 基于EST-SSR标记的茅苍术种质资源遗传多样性分析[J]. 中国野生植物资源,2019, 38(4): 30-34.[15]兰进茂,覃瑞,夏婧.华蟹甲的简化基因组测序及SSR 引物开发[J].中南民族大学学报(自然科学版),2021,40(3):258-263.[16]覃瑞,赖娟娟,李作洲,等.适用于野生软枣猕猴桃遗传多样性分析的SSR引物筛选[J].中南民族大学学报(自然科学版),2013,32(4):28-32.[17]SHAN T Y,WU J X,YU D Q,et al. Genome survey sequencing of Atractylodes lancea and identification ofits SSR markers[J]. Bioscience Rep,2020,40(10):BSR20202709.[18]RITONGA F N, NGATIA J N, WANG Y R, et al. AP2/ERF,an important cold stress-related transcriptionfactor family in plants: A review. Physiol Mol Biol Pla,2021, 27(9), 1953-1968.[19]TAN H X,XIAO L,GAO S H,et al. Trichome and artemisinin regulator 1 is required for trichomedevelopment and artemisinin biosynthesis in Artemisiaannua[J]. Mol Plant, 2015, 8(9):1396-1411.[20]YU Z X,LI J X,YANG C Q,et,al. The jasmonate-responsive AP2/ERF transcription factors AaERF1 andAaERF2 positively regulate artemisinin biosynthesis inArtemisia annua L[J]. Mol Plant,2012,5(2):353-365.[21]YPAUL P,SINGH S K,PATRA B,et,al. A differentially regulated AP2/ERF transcription factorgene cluster acts downstream of a MAP kinase cascadeto modulate terpenoid indole alkaloid biosynthesis inCatharanthus roseus[J]. New Phytol,2017,213(3):1107-1123.(责编&校对 姚春娜)326。

EST-SSR标记在竹类植物系统分类中的研究和应用的开题报告

EST-SSR标记在竹类植物系统分类中的研究和应用的开题报告

EST-SSR标记在竹类植物系统分类中的研究和应用的开题报告题目:EST-SSR标记在竹类植物系统分类中的研究和应用背景介绍:竹类植物是一种重要的经济作物和生态资源,具有重要的生态、环境和经济价值。

竹类植物的分类研究是竹类植物系统性研究的重要内容之一。

竹类植物的分类依据主要是形态学和遗传学特征。

近年来,随着基因组学、生物信息学和分子生物学等技术的发展,基于分子标记的分类研究已成为竹类植物分类学中的重要内容。

其中,EST-SSR标记是一种用于分子标记的引物,可用于识别DNA 序列的遗传多态性,具有种间差异性高、重复性好、分辨率高等优点。

因此,EST-SSR标记已被广泛用于植物种质资源鉴定、亲缘关系分析、遗传多样性评价等领域。

但在竹类植物系统分类中的应用还比较少,有待进一步研究。

研究内容:本文的研究将阐述EST-SSR标记在竹类植物系统分类中的研究和应用的现状和发展趋势,具体内容包括:1. EST-SSR标记在竹类植物基因组中的发现和筛选方法;2. EST-SSR标记在竹类植物系统分类中的应用研究现状和进展;3. EST-SSR标记在竹类植物遗传多样性评价和亲缘关系分析中的应用;4. EST-SSR标记在竹类植物品种鉴定和种质资源保护中的作用;5. EST-SSR标记在竹类植物外来种的鉴定和检测中的应用;6. EST-SSR标记在竹类植物种子来源及生态学研究中的应用;7. EST-SSR标记在竹类植物繁殖系统和进化研究中的应用。

研究意义:本文的研究,具有以下意义:1. 推动竹类植物分类研究和种质资源保护的发展;2. 丰富竹类植物遗传多样性评价和亲缘关系分析的研究方法;3. 提高竹类植物外来种控制和生态调查的准确性和可靠性;4. 推动竹类植物进化和繁殖系统研究的发展。

拟定方法:1. 收集和整理EST-SSR标记在竹类植物分类研究中的文献资料;2. 分析和比较不同方法筛选出的EST-SSR标记的多态性和稳定性;3. 运用最新的分子生物学和生物信息学技术,对竹类植物进行EST-SSR标记的筛选和检测;4. 运用实验和统计方法对EST-SSR标记的多态性和遗传多样性进行评价;5. 运用系统发育分析等方法,对竹类植物的亲缘关系进行研究。

毛竹β-1,3-葡聚糖酶基因的克隆及序列分析(英文)

毛竹β-1,3-葡聚糖酶基因的克隆及序列分析(英文)

毛竹β-1,3-葡聚糖酶基因的克隆及序列分析(英文)张艳;高健;徐有明【期刊名称】《分子植物育种》【年(卷),期】2010(8)3【摘要】β-1,3-葡聚糖酶是一种植物病程相关蛋白,在植物抵御病害中有重要作用。

本研究以毛竹为实验材料,利用RACE技术,克隆毛竹β-1,3-葡聚糖酶基因的外显子序列,并在β-1,3-葡聚糖酶基因的编码区两端设计引物,以毛竹基因组DNA为模版扩增该基因的内含子序列。

序列结果表明,该基因全长1693bp,包含两个外显子和一个内含子,命名为PheGLU(GenBank登录号GU238236)。

该基因包含1个996bp的开放阅读框,编码332个氨基酸,相对分子质量为3.541×104Da,其等电点pI为6.389,是一个酸性蛋白且分泌到胞外;其中,该蛋白的二级结构中包含35.15%的α-螺旋,21.82%的β-转角,43.03%的延伸链和无规则卷曲等;三级结构同源建模预测显示,它与大麦β-1,3-葡聚糖酶(PDB number:1ghsA)具有80.4%的同源性;聚类分析显示,该基因序列与已报道的其它植物具有较的高氨基酸序列同源性。

本研究为进一步鉴定毛竹β-1,3-葡聚糖酶基因的抗真菌病害能力奠定了基础。

【总页数】9页(P533-541)【关键词】毛竹;β-1,3-葡聚糖酶基因;基因克隆;序列分析;表达载体【作者】张艳;高健;徐有明【作者单位】国际竹藤网络中心,国家林业局竹藤科学与技术重点开放实验室;华中农业大学园艺与林学院【正文语种】中文【中图分类】S565.4【相关文献】1.葡萄β-1,3-葡聚糖酶基因的克隆、序列分析及表达 [J], 王西成;吴伟民;巫建华;赵密珍;王壮伟;钱亚明;解振强2.β1,3-1,4-葡聚糖酶基因的克隆与序列分析 [J], 孙军涛;王洪新;吕文平;马朝阳;戴易兴;姚红3.指天蕉β-1,3-葡聚糖酶基因全长cDNA的克隆及序列分析 [J], 翟国会;阮小蕾;吴丽婷;谭小勇;李华平4.紫花苜蓿β-1,3-葡聚糖酶基因同源克隆与序列变异分析 [J], 高建明;桂枝;卢树昌5.地衣芽孢杆菌β-1,3-1,4葡聚糖酶基因的克隆及序列分析 [J], 山其木格;王炜;杨红兰;胡爽;包慧芳;朱静因版权原因,仅展示原文概要,查看原文内容请购买。

毛竹NIP基因的分子特征及应答胁迫的表达模式

毛竹NIP基因的分子特征及应答胁迫的表达模式

第57卷第1期林业科学Vol.57,No.1 2021年1月SCIENTIA SILVAE SINICAE Jan.,2021doi:10.11707/j.1001-7488.20210107毛竹NIP基因的分子特征及应答胁迫的表达模式*朱成磊1杨克彬1徐秀荣1马霜・2李晓佩1高志民1(1.国际竹藤中心竹藤资源基因科学与基因产业化研究所国家林业和草原局/北京市共建竹藤科学与技术重点实验室北京100102; 2.西南科技大学绵阳621010)摘要:[目的】膜内在水通道蛋白(NIPs)是细胞膜上运输水分子和一些小分子物质的膜蛋白,在植物生长以及抵御逆境胁迫等方面发挥着重要作用。

温度和水分是影响竹子生长发育的重要环境因子,研究温度和干旱胁迫条件下毛竹NIP家族成员的表达模式,以揭示其在毛竹应答胁迫中的功能。

[方法】利用生物信息学软件对毛竹基因组中NIP家族成员基因及其启动子序列进行系统分析,基于转录组数据分析基因在毛竹不同组织中的表达模式,并用实时荧光定量PCR(qPCR)技术检测基因在温度和干旱胁迫条件下的表达特征,构建2个NIP基因的酵母表达载体,分析它们的表达对酵母抗干旱和盐胁迫能力的影响。

【结果】在毛竹基因组中共获得14个编码完整NIP蛋白的基因(PeNIP1-1—PeNIP1-6、PeNIP2-1—PeNIP2-4和PeNIP3-1—PeNIP3-4),含有3~5个内含子;在PeNIP s启动子区域中含有多种与胁迫、激素相关的调控元件;PeNIP s编码蛋白的氨基酸长度为235~297aa,相对分子量为24.03-31.84kDa;亚细胞定位预测显示所有PeNIPs均定位于细胞质膜上。

共线性分析表明,有12个PeNIP s与水稻8个NIP基因存在27对片段重复,它们的非同义对同义取代比(K a/K,)均小于1,表明毛竹PeNIP s 经复制后主要经历了较强的纯化选择。

系统进化分析表明,来自毛竹和其他5个物种的NIP蛋白可分为3类(I、口、皿),毛竹在各类中的成员依次为6、4和4个。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

麻竹EST序列中GDC-P蛋白基因的预测及其翻译多肽的分析丁伟航(生技091,林业与生物技术学院 200901180226)摘要:甘氨酸脱羧酶复合体(GDC)是在光呼吸中起着重要作用的酶体,存在于所有光合作用植物中。

通过对麻竹的EST序列进行拼接,得到了726条contig片段,然后对这726条片段进行blast。

结果发现,其中有一条长为966bp的片段与粳稻中的甘氨酸脱羧酶P蛋白亚基的mRNA序列有93%的相似性。

其ORF的翻译产物与麦类作物的GDC-P亚基有93%的相似性。

通过对这段多肽序列进行分析发现:这段序列是P蛋白靠近3' 端的一段序列,无跨膜结构域,含有GDC-PD的结构域。

关键词:EST;GDC;麻竹Abstract. Glycine decarboxylase complex(GDC)is one of the important enzyme during the photorespiratory cycle, which found in plants processing photosynthesis. De novo assembly of short reads (EST) of Ma bamboo shows, 726 contigs finally formed. And then run BLAST for these contigs in NCBI, the result is that the DNA sequence, which contain 966 base pairs, is similar to the gene of P protein of Glycine decarboxylase complex from Oryza sativa Indica Group (with the identity of 93 percent ). And the protein translated by its ORF is similar to GDC-P protein of x Tritordeum sp. (with the identity of 93 percent). Analyzing the putative protein by means of the method of bioinformatics, we found that protein sequence show high identity with the region of GDC-P near the C-terminal, no transmembrane domain be found, but contain the domain of GDC-P.Key word. EST, GDC, Dendroalamus latiftorus甘氨酸脱羧酶是复合体(GDC)存在于线粒体基质,与SHMT(丝氨酸羟甲基转移酶)通过四氢叶酸盐相联系[1],是植物光呼吸的C2循环的重要酶体。

GDC包含P、H、T、L四个蛋白亚基,其中P蛋白脱去甘氨酸上的羧基后,将其转移给H蛋白[1]。

研究这个蛋白除了对研究植物的生长有重要意义,还对植物病害的防治也有一定意义,如燕麦的枯萎病是真菌(Cochliobolus victoriae)引起的[2],而这种真菌所产生的毒素(victorin),正是结合在燕麦的GDC-P蛋白上,影响P蛋白的活性从而导致植株的枯萎[3]。

由于麻竹的基因组还未被测序,因此我们对现有的9574条麻竹序列进行生物信息学分析,一方面希望能注释这些序列,找到我们感兴趣的基因,为将来的研究提供思路,另一方面也希望发现能发现一些未知的基因,丰富对基因功能的研究。

1.材料与方法1.1 contig的获得因为EST序列存在冗余量大的缺点,所以必须先通过聚类拼接的方法来去除冗余,得到若干条conitg,这样可以减轻BLAST工作的负担。

在NCBI上以“Dendrocalamus latiflorus Munro”为关键词检索麻竹的EST序列,并打包下载。

然后用CLC软件对上传至NCBI 的全部麻竹EST序列进行拼接。

1.2 基因功能及其ORF的预测然后对长度在500bp以上的contig序列进行在线BLAST,寻找template基因,并根据template基因的功能注释来预测该基因片段的功能,并从中找到所需的感兴趣的基因。

然后用CLC预测该contig的ORF,并按所有预测出的ORF翻译出蛋白,进行blastp,辅以blastx,以验证这些ORF的可靠性,选择其中最可靠的一条ORF。

1.3 蛋白质的一级结构分析及跨膜结构分析以最可靠的ORF翻译出的多肽作为研究对象,利用PortParam (/tools/protparam.html)在线工具,对其氨基酸序列残基数目、组成、相对分子质量、理论等电点及稳定性等理化性质进行分析;利用PortScale (/tools/protscale.html)在线工具,对其疏水性进行分析;利用TMHMM (http://www.cbs.dtu.dk/services/TMHMM/)Server 2.0,对其进行跨膜区分析。

1.4 蛋白质的二级结构与三级结构预测利用SSPro4.0(/sspro4.html)对其二级结构进行在线预测;利用swiss-model(/)进行同源建模,以预测其三级结构。

1.5 信号肽分析及亚细胞定位利用SignalP 3.0 server(http://www.cbs.dtu.dk/services/SignalP/)预测该多肽的信号肽。

利用TargetP(http://www.cbs.dtu.dk/services/TargetP)对其亚细胞定位进行预测。

1.6 蛋白质的结构域分析及motif搜索利用SMART服务器(http://smart.embl-heidelberg.de/)分析该多肽的结构功能域。

利用PROSITE数据库(/prosite)检索motif。

1.7 建立进化树用template基因所编码的蛋白的名称在NCBI上搜索该蛋白质。

在尽量大的物种范围内选取同科、同属以及其它科属的物种的相应的蛋白质序列,并将其下载到本地。

先用CLC 对其进行多序列比对,再用MEGA软件重建进化树。

2 结果与分析2.1 麻竹contig片段及GDC-P基因序列在NCBI上通过对麻竹EST序列的搜索,得到了9574条麻竹序列,然后全部下载到本地。

利用CLC对其进行批量聚类拼接后,得到了726条contig片段,其长度在221bp-2063bp 不等。

最高丰度的contig包含280条EST序列,最低丰度的contig只含2条EST序列。

一般丰度越高的contig多为持家基因、线粒体或叶绿体的序列,丰度越低的contig多为调控基因等一些非维持细胞生命活动所必需的基因。

然后通过对长度在400以上,且丰度较高的contig的Blast分析,找到一条contig 序列(contig 687)与其它物种已知的GDC-P基因相似度最高(详见图1)。

其与粳稻“日本晴”中的甘氨酸脱羧酶P蛋白亚基的mRNA(全长CDS)序列有93%的相似性,该基因在NCBI 上的登录号为AY346327;此外还跟燕麦的victorin结合蛋白(即一种P蛋白)mRNA(全长CDS)序列有93%的相似性。

Contig 687长度为966bp,由8条EST序列拼接而成,它们在NCBI上的登录号依次为JK008426.1、JK016935.1、JK012035.1、JK017274.1、JK014557.1、JK008289.1、JK013195.1和JK012568.1。

图1 contig 687的blast部分结果注:用CLC软件自带的NCBI BLAST工具按nr条件进行Blast的结果(已按E值大小排序)2.2 ORF预测结果图3 ORF翻译结果通过CLC自带的ORF预测工具的预测,只预测到一条ORF(见图2)。

该ORF的范围为3-965号碱基,5′至3′方向为965至3号碱基,长度为963bp,起始碱基为CCT。

这说明这条contig可能是完整基因中的一个片段,并不包含其实密码子。

然后通过blastp验证,结果发现由该ORF翻译的多肽与其它物种已知的GDC-P蛋白有很高的相似性,且比对结果中,相似区域都在这些蛋白质序列的中间或靠近3′端部位。

最后再辅以contig 687的blastX,结果也表明,按-2阅读框翻译的蛋白能比对出结果,即与该ORF的阅读框架一致,且与GDC-P蛋白相似性最高。

综上分析,这条ORF可靠性较高。

其翻译结果见图3。

2.3 一级结构分析及跨膜域预测结果由PortParam分析结果可知,该多肽的分子质量约为34kDa、理论等电点pI为6.20,总共包括4766,分子式为C1521H2365N415O445S20;在组成该多肽的20种氨基酸中,甘氨酸(Gly)所占的比例最高,达到11.2%,而色氨酸(Trp)所占的比例最低,为0.3%;该多肽的不稳定指数为41.09,脂肪指数为82.74,根据Guruprasad方法表明该多肽不稳定。

这是由于该多肽不是完整的蛋白,只是部分蛋白序列。

TMHMM2.0预测结果显示,该多肽的1~321位碱基位于细胞膜外,即无跨膜结构域(如图4所示),这与GDC-P为非跨膜蛋白的性质相吻合。

图2 ORF预测结果注:用CLC自带的ORF预测工具按AUG起始,可允许为完整序列的片段的条件预测图4 使用TMHMM软件对该多肽的跨膜区分析结果2.4 二级结构分析和三级结构预测结果根据SSpro 4.0 预测结果可知,该多肽的二级结构组分中,α-螺旋(H)占40.5%,β-折叠(E)占15.0%,属于α/β型蛋白,其中较长的α-螺旋有5个,较长的β-折叠有7个。

用SWISS-MODEL对该多肽进行同源建模,该三维结构与PDB数据库中的1WYU蛋白(GDC-P)的结构一致,其结果如图5-1、5-2、5-3所示:图5-1 预测多肽的三级结构图图5-2 1WYU三级结构图红色为α-螺旋,蓝色为β-折叠,绿色为无规则卷曲从图5-1可以看出9条β-折叠,4条较长的α-螺旋,与预测出的二级结构中这两者的数量相符。

且该序列与template蛋白的相似性为38.32%,建模的综合得分为0.57,该三级结构亦较为可信。

2.5 信号肽分析和亚细胞定位预测结果经SignalP 3.0预测结果可知,该多肽无信号肽,这与之前预测它属于一个完整蛋白的片段相符,且该片段至少不包含完整的5′端,因此无信号肽被发现。

相关文档
最新文档